AI与数学_Page 77_123智子教育

AI与数学

“讯飞星火大模型：改变人类口语学习的方式”

科大讯飞宣布开放讯飞星火开发接口，与开发者共建星火生态；发布星火大模型最新成果，拥有完全自主研发的技术平台和信心；AI口语助手升级为星火语伴APP，为大学生、商务人士提供AI口语老师和视频对话练习服务。

3 years前 18

AI与数学

AI同学的高考数学之旅：探索大模型在数学题目中的表现

文章主要报道了几个大型语言模型在解决高考数学题目中的表现。测试结果显示，这些模型在某些问题上表现不佳，尤其是在涉及到复杂推理的情况下。然而，在另一道难度更高的问题上，它们的表现有所改善。总的来说，这些模型的表现引发了对它们的疑虑，并呼吁对它们进行更深入的研究。

3 years前 26

AI与数学

ChatGPT、文心一言等大模型做高考数学题看谁的表现更好？

作者｜杨文袁博编辑｜六耳来源｜AI先锋官高考已经接近尾声，小编先预祝各位考生金榜题名，前程似锦。此次高考不仅是各位考生们的大考，也是各家AI大模型之间的暗中较量。之前小编也让文心一言、讯飞星火、GPT-4秀了一把作文能力。同时，我们也非常好奇它们的数学能力到底如何？我们在今年的高考数学I卷中共挑选了13道题（其中选择题8道、填空题2道、解答题3道），共计84分。我们分别测试了GPT-4、通义千问、文心一言、讯飞星火四个大模型，其中GPT-4得分最高为36分，讯飞星火得分最低为19分。按百分制分别为43、35、26、23分。一、选择题测试题目：单选题5道、多选题3道。选择题得分：GPT-4：19分；文心一言：22分；通义千问：29分；讯飞星火：9分。答题过程描述：在解答选择题的时候，四个大模型表现都较其它题型要好。其中，通义千问答对了全部5个单选题，不过每道题都回答了4到5遍左右。这不禁让小编怀疑它答题也是靠“蒙”？文心一言在解答前两道选择题时，都是一遍对。然而，讯飞星火表现的表现就有点掉链子。即便小编把答案告诉它，它依旧坚持选择错误答案，一副死犟死犟的范儿。二、填空题测试题目：2道填空题得分：GPT-4：5分；文心一言：0分；通义千问：0分；讯飞星火：5分。答题过程描述：在填空题方面，四个大模型表现都比较一般。GPT-4、讯飞星火得分相对较高。文心一言、通义千问得了一个零蛋。在通义千问答题过程中，小编发现它还很固执。比如，在解答第13题时，我们让它做了不下10遍，无一次正确。甚至，通义千问还表示：“并不想考虑每类至少选修1门的限制”，这种“犟”劲儿有点让人哭笑不得。三、解答题测试题目：3道得分：GPT-4：12分、文心一言：0分、通义千问：0分、讯飞星火：5分。答题过程描述：在解答题方面，四个大模型的表现都很一般，出现胡编乱造的情况，甚至一度让自己陷入死循环。相对而言，GPT-4更胜一筹，基本上能答一道大题中的一个小题。讯飞星火次之。文心一言、通义千问则全军覆没，全部答错。

3 years前 47

AI与数学

人工智能颠覆教育市场：Chegg能否应对ChatGPT挑战？

本文介绍了美国在线教育平台Chegg在面临ChatGPT等人工智能技术冲击的情况下，对其业务和股价的影响。尽管有人认为这是杞人忧天，但Chegg公司已做好准备迎接新一代教育模式。作为最早整合OpenAI最新模型的教育科技公司，Chegg将继续结合系统力量和教育内容，为学生提供更好的在线教育服务。然而，ChatGPT模仿人类语言的优势，使其在各类场景中得到应用，但也存在不精准和潜在危险的问题，这使得Chegg等在线教育公司需重新审视自己的竞争优势和发展策略。

3 years前 13