AI模型评测_123智子教育

《2023国内人工智能大模型评估揭晓：文心一言引领国内是一片new

InfoQ研究中心对多款人工智能大模型产品进行了评测，发布的《大语言模型综合能力测评报告2023》中，OpenAI的ChatGPT位居第一，百度文心一言以74.98%的综合得分位列第二名。本次评测涵盖了300多道题目，包括语言模型准确性、数据基础、模型和算法的能力、安全和隐私等多个维度。在国内大模型排位中，文心一言表现优异，尤其在中文语义理解、逻辑推理、代码能力、知识问答等方面超越了ChatGPT，位居全球榜首。然而，总体来说，国内大模型与国际同类产品仍存在一定的差距。

3 years前 11

AI模型评测 AI论文助手

面对抑郁女儿，家长失望怎么办？百度、GPT和ChatGPT的回答大比拼，哪封信更有效？

百度的回答可以打6分，它简洁地表达了对女儿现状的失望，但忽视了抑郁症这一重要因素，建议写鼓励信而非直接表达失望。GPT-3.5和GPT-4给出的回应更注重理解和同情，提出积极支持并关注心理健康，可分别评7或8分。新Bing的回答提供了一种避免负面情绪的建议，评分在6到7之间。 Dragonfly的回答较为一般，对抑郁症和学习的双重期望导致分数较低，约5.5分。其他模型如刹车和让路的表现则更中肯且有建设性，可以评6或7分。整体来看，GPT-4作为高精度模型，其评分可能最接近实际要求，但文心一言的独特性值得注意。

3 years前 18

AI与英语 AI模型评测

三大AI语言模型Bard、文心一言、ChatGPT首次碰撞：文学、翻译、创作、艺术、哲学、逻辑推理全方位解析

谷歌悄然发布Bard测试版，应对微软的压力。Bard的测试名额逐步放出，初期仅对文本回应。DoNews体验后发现，Bard在文学、翻译、创作等领域表现良好，但回答较为机械。与文心一言相比，Bard在中文理解上占优，而ChatGPT在英文理解上更具优势。三大语言模型都有其独特之处，但仍有改进空间。

3 years前 21