会说话的机器狗:ChatGPT与物理机器人结合创新之作
全球顶级机器人开发商波士顿动力(Boston Dynamics)成功地将ChatGPT、Spot等AI模型与物理机器人结合起来,开发出一只会说话的导游机器狗。这种机器狗能够根据文字、语音提示与人类进行交谈,并具备视觉问答功能,提高了物理机器人的拟人化能力。研究人员使用了Spot EAP 2、扬声器和蓝牙音箱等技术,让机器狗具备了初步的对话功能。接下来,他们采用了GPT-3.5和GPT-4与Spot SDK相结合,并进行了简单的指令微调,使机器狗具备了初级导游判断和对话功能。最后,为了使机器狗具备“听”的功能,研究人员还将麦克风数据输入到OpenAI的语音模型Whisper中转换为英文文本。总体而言,这款会说话的导游机器狗展示了机器人技术的发展潜力,未来有望在导游、娱乐、物流、陪伴等领域得到广泛应用。