史上最强大脑来了!谷歌PaLM-E挑战ChatGPT,视觉语言模型开启机器人新纪元?
谷歌和柏林工业大学合作推出PaLM-E,史上最大视觉语言模型,参数量5620亿,集语言与视觉控制,不同于LLM的VLM对物理世界有感知。谷歌长期以来在多个科技领域进行投资,面对ChatGPT的成功压力,加快了“生成式人工智能”技术集成,并推出Switch Transformer、多语言MLM和NLG等新模型以应对潜在挑战,显示出其在自然语言处理领域的研发实力。然而,这些新模型也面临复杂度高和隐私问题,谷歌的PaLM-E模型基于Transformer架构,虽与ChatGPT共享基础,但在某些改进上有所优势。


