文章主题:自然语言处理, GPT, 文本生成, 机器翻译

666AI工具大全,助力做AI时代先行者!

来源:火讯财经

文章转载来源:元宇宙与碳中和研究院

自然语言处理(NLP)技术的飞速发展,催生了像GPT系列这样的大语言模型,它们正在各个领域中展现出深远的影响。这些模型在诸如文本生成、机器翻译以及代码合成等多元化应用场景中,均取得了卓越的表现。OpenAI的ChatGPT就是一个典型的生成式文本模型,它经历了预训练以及通过人类反馈的不断优化,从而具备了优秀的交互能力。ChatGPT不仅可以进行文本创作,还可以撰写代码。目前,微软正在积极思考如何将ChatGPT运用到机器人的驱动上,以期在未来的发展中实现更多突破。

图片来源:由无界 AI 生成

微软的探索

作为一家科技巨头,微软对于现代机器人技术的理解是,其必须依赖一个闭合的系统。在这个系统中,首先会对任务进行相应的编程,同时在执行过程中不断监测机器人的行为,并根据这些数据进行必要的调整。根据微软的构想,他们的ChatGPT技术能够将人类语言的工作描述转化为机器人可以理解和执行的代码。这就意味着,非专业技术人员也能像专业人士一样,利用自己熟悉的人类语言描述任务,观察并分析机器人的行为,然后通过语言向机器人提供反馈,ChatGPT再将这些信息转化为具体的行动步骤,以此优化机器人的行为表现。

通过实验手段,微软的技术团队精心构建了一系列应用场景,涵盖了多种应用场景,包括但不限于引导无人机对超市货架进行盘点、库存管理、机械臂的操作,同时,他们还利用API(应用程序接口)技术实现了物体的识别与远程操控,包括搜索等功能。

具体应用

为了使ChatGPT能够广泛应用于机器人领域,微软提出了三个关键研究方向,它们共同构成了采用ChatGPT的核心策略,以推动机器人技术的进步。

1、用户指定ChatGPT应采用的一系列API或功能编码库。

2、根据可访问的API或功能编码,用户描述对工作的预期结果。

3、最后,用户在用模拟器评估ChatGPT撰写的代码后,提供反馈意见。

如果用户对行动结果感到满意,那么相应的代码就可以引导机器人采取更加合适的行动。从某种程度上讲,这种方法与“机器学习理论”中监督型机器学习的概念相似。这并不令人意外,因为机器人和人工智能在很多方面都有相似之处,包括通用的理论基础。因此,将这两种思想相结合是十分合理的。

为了进一步推动人工智能技术的发展,微软团队致力于研究各种问题及其解决方案,并探索各种交互模式。这些研究成果都可以在微软所公开的一个全新的开源协作平台上找到,从而为公众提供丰富的学习资源。为了确保ChatGPT生成的算法能够通过考验,微软团队自然希望将其机器人模拟和API纳入评估范围,以便持续优化和改进算法性能。

ChatGPT与机器人

与ChatGPT的纯文本应用不同,机器人作为复杂系统,需要有能力理解现实世界的物理学、解读周围的环境,并采取对应的行动。在与用户互动时,要以符合物理学的方式理解和执行命令,就需要兼顾一个具备丰富知识的生成式机器人模型和一个复杂的世界模型。这意味着模型必须能破译文字,并将其转化为实际行动指令,这无疑都已经超出了语言模型最初设想的范围。

ChatGPT有能力适应各种物理表现形式,通过对话进行闭环推理,并解决机器人技术中的各类“零点翻译问题”(Zero-shot,指不借助中间语的直接翻译。如谷歌曾经的翻译系统都依赖英语做中间语,先将源语言翻译为英语,再将英语翻译为目标语)。由于机器人的很多相关技术的成熟度相对更高,有多个开源或闭源的编程库存在,可帮助设计机器人在认知和行动领域的基本行动,如物体检测和分割、映射、运动规划、控制和抓取等。

至于机器人的推理和执行能力,大语言模型在获得适当提示词的情况下,可以采用预置的机器人编程路径,不过API的名称必须准确地反映机器人功能的整体目的和操作。这些术语要尽可能清晰,以便模型解释API之间在机器人功能上的联系,并提供预期的结果。

自2010年,智能手机和移动网络流行以来,曾经风头无两的机器人或多或少的也受到了冲击,毕竟手机比机器人可便宜多了,用起来也更方便。现在机器人的应用正日益精细化,如医用和工业等领域都有相关应用,家用扫地机器人也已走进千家万户,这些都可以视为先进生产力和科技水平的体现。这几年AI正以前所未有的速度进化,时常做出一些引发世人惊呼的行为,虽然对它们而言那不过是本能。当年的“阿尔法狗”(AlphaGo)面对全球一众围棋高手,一路过关斩将,克敌制胜,“人类智慧最后的堡垒”被攻克时的景象,相信很多人至今仍记忆犹新。

然而很多人在惊呼时都有意无意的忽略了两个事实。其一,围棋之所以被称为“人类智慧最后的堡垒”,很大程度上是因为其内在逻辑、推理走法、棋谱规律等都很复杂,且都可能影响到最终结果,对常人而言就是“入门难精通更难”,这与象棋(不论中国象棋或国际象棋)、军棋、将棋等其他棋类运动普遍存在的“入门容易精通难”不同。因此上世纪90年代IBM的“深蓝”就能在国际象棋上战胜顶级高手卡斯帕罗夫,比“阿尔法狗”早二十多年就战胜了人类。这期间还经历过摩尔定律的加持,AI的性能和计算速度突飞猛进,“阿尔法狗”的出现在某种意义上来说更像是科技发展的必然结果。

其二,不论“深蓝”还是“阿尔法狗”,它们都是专家特化型AI,换句话说它们都只会下国际象棋或围棋。从运行逻辑的角度来说,它们要学会新技能就必须换新的数据库,类似手机刷机或电脑重装系统。但即使成功换装,还是没有改变它们只会一种技能的本质。当前的ChatGPT也有差不多的情况,这与预期中的人工智能还差得远。

用ChatGPT驱动机器人是前所未有的大胆设想,或许微软是看中了ChatGPT强大的知识和推理能力,期待用在机器人上能实现1+1>2的效果。微软做得好肯定能引起新的欢呼,做不好无非是给外人来点茶余饭后的谈资。对旁观者而言倒也不失为好消息,毕竟谁不喜欢吃瓜看戏呢?

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *