AI与物理
谷歌和柏林工业大学的团队近日推出了史上最大的视觉语言模型——PaLM-E,集成语言和视觉功能,用于机器人控制。相比传统的大语言模型,PaLM-E被称为视觉语言模型。VLM具有感知物理世界的特点。谷歌在自然语言处理、机器学习、计算机视觉、自主驾驶、量子计算等领域均有长远技术投资,并已取得重要科技成果和商业应用。然而,OpenAI推出的ChatGPT爆火,让谷歌感到了压力,因此谷歌加速度推出了一系列新模型和引擎以迎头赶上,其中包括PaLM-E模型。谷歌这些新模型和引擎在自然语言处理领域取得了优异性能,但也面临着模型复杂度高、计算资源需求大、数据隐私等问题。