《2023国内人工智能大模型评估揭晓:文心一言引领国内是一片new
AI与英语AI模型评测

《2023国内人工智能大模型评估揭晓:文心一言引领国内是一片new

InfoQ研究中心对多款人工智能大模型产品进行了评测,发布的《大语言模型综合能力测评报告2023》中,OpenAI的ChatGPT位居第一,百度文心一言以74.98%的综合得分位列第二名。本次评测涵盖了300多道题目,包括语言模型准确性、数据基础、模型和算法的能力、安全和隐私等多个维度。在国内大模型排位中,文心一言表现优异,尤其在中文语义理解、逻辑推理、代码能力、知识问答等方面超越了ChatGPT,位居全球榜首。然而,总体来说,国内大模型与国际同类产品仍存在一定的差距。
面对抑郁女儿,家长失望怎么办?百度、GPT和ChatGPT的回答大比拼,哪封信更有效?
AI模型评测AI论文助手

面对抑郁女儿,家长失望怎么办?百度、GPT和ChatGPT的回答大比拼,哪封信更有效?

百度的回答可以打6分,它简洁地表达了对女儿现状的失望,但忽视了抑郁症这一重要因素,建议写鼓励信而非直接表达失望。GPT-3.5和GPT-4给出的回应更注重理解和同情,提出积极支持并关注心理健康,可分别评7或8分。新Bing的回答提供了一种避免负面情绪的建议,评分在6到7之间。 Dragonfly的回答较为一般,对抑郁症和学习的双重期望导致分数较低,约5.5分。其他模型如刹车和让路的表现则更中肯且有建设性,可以评6或7分。整体来看,GPT-4作为高精度模型,其评分可能最接近实际要求,但文心一言的独特性值得注意。
三大AI语言模型Bard、文心一言、ChatGPT首次碰撞:文学、翻译、创作、艺术、哲学、逻辑推理全方位解析
AI与英语AI模型评测

三大AI语言模型Bard、文心一言、ChatGPT首次碰撞:文学、翻译、创作、艺术、哲学、逻辑推理全方位解析

谷歌悄然发布Bard测试版,应对微软的压力。Bard的测试名额逐步放出,初期仅对文本回应。DoNews体验后发现,Bard在文学、翻译、创作等领域表现良好,但回答较为机械。与文心一言相比,Bard在中文理解上占优,而ChatGPT在英文理解上更具优势。三大语言模型都有其独特之处,但仍有改进空间。