AI与数学 《内测码对比:通义千问与文心一言各有千秋》 《科创板日报》记者通过内测码测试了通义千问和文心一言两款AI语言模型,发现它们各有优势和不足。通义千问在代码写作能力和文学创作能力方面表现较好,而文心一言在信息搜索和营销文案创作方面更具优势。但在某些问题上,通义千问和文心一言的回答相差较大,存在一定的误判情况。
AI与数学 《文心一言:挑战GPT-4,人工智能助手的新高度》 本文介绍了百度全新一代聊天机器人“文心一言”,其具备文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五大能力。在发布会上,李彦宏展示了文心一言对19个问题的回答,并与ChatGPT和微软必应进行了对比。然而,尽管文心一言在某些方面表现优异,但仍有很多提升空间。同时,百度股价在发布会当天下跌近10%。
AI与数学 《AI对话机器人性能大比拼:安兔兔的针对性测试结果揭晓》 安兔兔的AI专家进行了针对AI对话引擎的性能测试,覆盖了语言理解、任务完成、常识问题、逻辑数学、代码能力和专业领域等六大模块。由于测试对象包括了百度ERNIE 3.0、OpenAI的GPT-3.5 turbo和GPT-4,但其底层逻辑和调优方式仍未开源,因此无法保证答案完全客观。测试结果显示,ChatGPT 4.0在大多数项目上表现优秀,但文心一言在摘要生成和信息提取环节表现不佳,主要体现在对古文摘要生成和长篇文章翻译的准确性和完整性上。