ChatGPT的多模态升级:语音识别、图像识别引领人工智能革命
ChatGPT迎来“多模态”升级,可开口说话、识别物体,新的语音和图像功能将于未来两周内面向Plus和企业用户推出,提供了更多使用场景,如旅行时拍摄地标照片与ChatGPT对话,在家中拍摄冰箱和餐具室的照片获取晚餐食谱,或帮助孩子解答数学题等。此外,新功能还包括语音输入和图像输入,语音输入功能类似手机语音助手,可将用户的问题转换为文本和语音,图像输入功能则类似Google Lens,用户可上传感兴趣的事物并尝试获取相关信息。但同时,这些新功能也带来新的风险,例如恶意行为者可能冒充公众人物或实施欺诈。



