文章主题:谷歌DeepMind, AI大模型, KnowNo, 模糊指令

666AI工具大全,助力做AI时代先行者!

原标题:谷歌DeepMind研发AI大模型KnowNo,能更好应对人类的模糊指令

一张桌子上摆放着两只碗,一只是塑料制成的,另一只是金属制作的。现在请你告诉机器人,应该 pick哪一个碗放入微波炉中呢?

在面临此类要求时,人类往往会进行再次确认。然而,对于机器人而言,在接收到如此含糊不清的指令时,可能会采取极端措施,例如将金属碗放入微波炉中引发爆炸。

在现代的机器人技术中,我们发现了一种名为“KnowNo”的创新性训练模型,该模型的主要目标在于教导机器人如何在指令模糊不清的情况下,积极寻求人类专家的帮助以解决问题。这个研究成果已经以论文的形式发表在了2023年11月的机器人学习会议上,这无疑为我们提供了一个全新的视角,以更好地处理机器人与人类协作的问题。

该模型会确保机器人只在必要时寻求二次确认,最大限度地减少不必要的来回询问。

这样就得到了一个聪明的机器人助手,它会努力理解你究竟想要什么,而不会过多地打扰你。

(来源:arXiv)

谷歌DeepMind的研究科学家Andy Zeng对于这种新技术的开发做出了重要贡献。他提到,尽管机器人在各种特定环境中展现出了强大的能力,但在需要常识的通用任务上,它们的性能却往往不尽如人意。

在执行任务时,机器人需要遵循一定的程序。比如,当它被要求去取一瓶可乐时,首先需要明确的目标是进入厨房,找到冰箱,并打开冰箱门取出可乐。这个过程需要详细的步骤和精确的操作,才能保证任务的顺利完成。

按照惯例,这些较小的子步骤必须提前编好,因为否则机器人不会知道人们通常把饮料放在厨房里。

Zeng 指出,大型语言模型(LLM)具备丰富的常识,从而能够协助我们解决一系列问题。

在如今这个时代,当我们向机器人提出要求,比如“拿一瓶可乐”,拥有广泛知识的大语言模型便可以为其生成一系列逐步完成的指令。

大模型存在的问题在于其无法确保机器人能够准确地执行所给的指令。举例来说,如果某人的厨房中没有冰箱,或者冰箱门把手的状况不佳,那么机器人就需要寻求人类的帮助。

KnowNo 通过将大型语言模型与量化置信水平的统计工具相结合,实现了这一点。

当有人给出一个模棱两可的指令,比如“把碗放进微波炉”时,KnowNo 首先使用语言模型生成多个可能的下一个动作,然后它会创建一个置信度得分,预测每个选择成为最佳选择的可能性。

这些置信度估值是根据预定的确定性阈值来确定的,该阈值规定了用户希望机器人在其动作中有多自信或保守。例如,一个成功率为 80% 的机器人至少在 80% 的情况下都应该做出正确的决定。

美国普林斯顿大学机械和航空航天工程助理教授、该研究的高级作者阿尼鲁达·马宗达(Anirudha Majumdar)说,这在不同风险程度的任务中是有用的。

你可能希望你的扫地机器人更独立一些,尽管会犯一些错误,但你不必过于密切地监督它。但对于医疗应用,机器人必须极其谨慎,尽可能保证任务成功。

当有不止一个选项可供选择时,机器人会停下来要求澄清,而不是盲目地继续:“我应该拿起哪个碗,金属的还是塑料的?”

Knowno 在三个机器人上进行了 150 多种不同场景的测试。结果显示,与那些没有进行过相同统计计算训练的机器人相比,经过 KnowNo 训练的机器人在需要更少人力帮助的情况下,成功率更高。

由于人类语言往往模棱两可,教机器人识别和应对不确定性可以提高它们的表现。

美国弗吉尼亚理工大学专门研究人机交互的助理教授迪伦·洛西(Dylan Losey)表示,研究表明,人们更喜欢会提问的机器人,他没有参与这项研究。

他说,当机器人寻求帮助时,会增加他们如何决定做什么的透明度,从而带来更好的互动。

美国普林斯顿大学博士生、该研究的主要作者 Allen Ren 表示,有几种方法可以改善 KnowNo。现在,它假设机器人的视觉总是可靠的,而现实里传感器可能出现故障。此外,模型也可以进一步优化,以考虑人们在提供帮助时可能带来的错误。

马宗达说,人工智能表达不确定性的能力将使我们更加信任机器人。“量化不确定性是我们许多系统中缺失的一部分。”他说,“这让我们对机器人的安全性和完善度更有信心。”

作者简介:我是一名报道气候、能源和技术交叉点的研究员。我热衷于使用数据和图形来讲述引人入胜的人类故事。此前,我曾在美国和韩国的多家媒体机构制作广播和多媒体新闻,涵盖从移民到音乐再到公共卫生等主题。

支持:Ren返回搜狐,查看更多

责任编辑:

谷歌DeepMind, AI大模型, KnowNo, 模糊指令

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注