AI与数学_Page 219_123智子教育

AI与数学

那些国内互联网巨头许下的诺言集体兑现，类ChatGPT产品扎堆亮相，下一步该拼啥？

过去两天，国内生成式人工智能服务领域热闹极了：阿里云推出“通义千问”大模型；商汤科技“日日新”、昆仑万维“天工”大模型、有赞“加我智能”在同一天发布；360基于大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景……再加上百度已发布的“文心一言”，国内互联网巨头们在3月许下的诺言正在一一兑现。这些类ChatGPT产品相继浮出水面，是否意味着国内人工智能（AI）的“高阶”竞赛已开始？面对这些眼花缭乱的产品，“大厂”之间又究竟该拼什么？不能错过AI的决定性时刻回顾过去10年，人类与人工智能有两次技惊四座的切磋。第一次是在2016年，DeepMind开发的AlphaGo（“初级围棋”）以4∶1击败韩国围棋大师李世石，让人看到了人工智能在解决封闭问题时的奇点来临。只是人们并未想到，仅仅7年之后，OpenAI发布的ChatGPT一夜走红，展现出通用人工智能的巨大潜力。这一次，国内互联网巨头们并没有掉队太久。“不能错过AI的决定性时刻。”一位业内人士这样形容抢抓奇点的重要性。尽管每一个项目都显得有些仓促，但至少在ChatGPT亮相后的两个月内，百度、阿里、360、商汤等一批国内企业都拿出了可公开测试的同类产品。 4月7日，阿里云官宣大模型“通义千问”邀请测试，并于昨天正式发布。从记者内测使用情况看，它在回答相对封闭的历史问题以及一些开放性的论述题时，表现得相当成熟，但在回答诸如鸡兔同笼、青蛙爬井等数学应用题上，依然有所失误。它听不懂人们常说的“谐音梗”，对有时效性的新闻也一头雾水。当然，如何去全面评测一个大语言模型本身就是很有挑战性的，“通义千问”与“文心一言”一样，都很讲究提问技巧，这本身就是模型在理解方面的主观表现。此外，华为、腾讯、京东等互联网巨头均公布了各家类ChatGPT产品的最新进度，接下来也将排队入场。互联网分析师易方寒认为，今年或将成为AI大模型元年，围绕着模型进行开发的范式正逐渐展开。看到可塑性，正视局限性当3月许下的诺言纷纷兑现后，问题接着就来了：ChatGPT让人惊艳的是它的聊天技能，如何把这种技能落地形成应用？显然，比赛才刚刚开始。 “面向AI时代，所有产品都值得用大模型重新升级。”阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在昨天的云峰会上表示，阿里巴巴所有产品未来都将接入“通义千问”大模型。记者从内测的二级界面看到，“通义千问”还包含了更加细分的写提纲、写诗、菜谱、小学生作文等选项。同一时间，阿里系生态则放出了很多“畅想”，比如：办公应用钉钉就“暗示”，未来当你被拉入一个新的群聊后，可基于聊天内容，自动生成聊天摘要、待办事项，在会议中生成实时字幕、生成图片，等等。除了巨头自上而下的规划外，民间的高手也通过ChatGPT尝试了意想不到的创意。前几天，上海一位00后小伙就在B站（哔哩哔哩）展示了用ChatGPT等AI技术“复活”奶奶的过程。他首先用AI绘画软件Midjourney绘出人像，将电话录音及录像视频打包放入语音合成系统，通过D-ID生成数字虚拟人，最后告诉ChatGPT“模仿奶奶的口吻来交谈”，这段视频的点击量已接近70万，让人工智能透出浓浓的人情味。就像工业革命一样，大模型未来或许会被各行各业广泛应用，但CIC灼识咨询经理陈一心提醒，既要看到应用的可塑性，也要看到目前的局限性，“大语言模型的底层通常为生成式模型，其主要适用场景为基于历史海量数据和信息进行归纳并生成回复，在B端应用中可以充当一个知识广博的助理角色，但内容是否完全可信，仍需使用者进行人为判别。同时，该底层技术决定了大语言模型现阶段在预测、推断方面的性能存在局限，难以满足B端在业务决策方面的需求。” 踩油门与踏刹车都要重视当业界都在为AI的进化“猛踩油门”时，一封由超过1000名科技领袖和研究人员签名的公开信则表达了另一种声音。信中表示，“广泛的研究表明，具有与人类竞争智能的人工智能系统可能会对社会和人类构成深远的风险”。对安全性的质疑首当其冲。陈一心解释称，现阶段大语言模型都跑在公有云上，必然会引发部分B端用户对数据安全的顾虑。此前，三星引入ChatGPT不到20天，就发生了3次机密泄露事件，目前，部分对数据安全要求较高的B端用户要求AI模型私有化部署、不调用外部模型、保证所有数据与知识库不出本地，但“通用的大语言模型目前还无法满足这类要求”。监管的及时跟进，被普遍认为是一种“踏刹车”方式。就在昨天，国家网信办就《生成式人工智能服务管理办法（征求意见稿）》公开征求意见，对一些“红线”和“边界”问题作出规定。比如：提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责；又比如：利用生成式人工智能产品向公众提供服务前，应当向国家网信部门申报安全评估，并按照相关规定履行算法备案和变更、注销备案手续。该意见稿发布的前一日，中国支付清算协会也发布了《关于支付行业从业人员谨慎使用Chat GPT等工具的倡议》，指出要“正确认识ChatGPT等工具的机遇和风险，全面评估使用ChatGPT等工具处理工作内容的风险”。目前，国内外多家投行已限制员工使用ChatGPT。但无论如何，新一轮科技革命的车轮已开始转动。正如阿里云CTO周靖人所说，“通义千问”的发布，不是起点，也不是终点，而是既定路线上的一个节点，它最终通往的是趋近人类智慧体的一种存在。把好油门与刹车，是为了更好掌控AI的前行方向，而不是让ChatGPT成为潘多拉魔盒。作者：徐晶卉编辑：张天弛责任编辑：戎兵 *文汇独家稿件，转载请注明出处。举报/反馈

3 years前 11

AI与数学

ChatGPT官宣可做对小学数学题！小编亲测：能讲出孪生素数，但…

编辑：好困 Aeneas 【新智元导读】昨天，OpenAI官宣称ChatGPT的准确性和数学能力，小编亲测显示: 进步了，但不多。 ChatGPT迎来重大更新！昨日，OpenAI官宣，ChatGPT经过重大更新，已经提升了准确性和真实性，以及数学能力。哦？就是那个满嘴跑火车，解数学题时一本正经地胡说八道的ChatGPT？虽然不知道具体做了哪些升级，不过从简单的测试来看，确实有一些进步。摆脱数学傻子人设？对于之前的ChatGPT，-1*-1*-1是一个老大难问题，对于这个问题，它给出的答案是1。（离谱）而现在，更新后的ChatGPT果然有了进步，可以答对这个问题了！（鼓掌）在以前，ChatGPT的基础数学奇差无比，是公认的。它连一个简单的除法都算不对，还大放厥词。网友忍无可忍，骂它太蠢。而ChatGPT被劈头盖脸痛骂一顿后，终于开动脑筋，算出了正确答案。虽然但是，更新后的ChatGPT，依然还是不太聪明的样子…… 同一个问题连续问了3遍，ChatGPT都斩钉截铁地给出了几乎相同的答案。然而，你确定「孪生素数」是相差3，而不是2吗？然而，本来打算继续追问的小编却惨遭闭门羹。由于测试的次数太多，免费的ChatGPT表示暂不「接客」，下个小时再来。顺便，在这里科普一下，两者相差为3的素数对只有 (2, 5)。有意思的是，数学奇差的ChatGPT，写起代码来倒是有一手。这位叫Matt Neary的网友大开脑洞：既然ChatGPT会写代码，那能不能让它通过代码做数学题，实现「曲线救国」？可以看到，1000和1062谁更大这个问题，ChatGTP一如既往地犯了蠢。而在Neary使用一个基于GPT的函数mathnerd后，它倒是得出了正确答案。看来，诀窍就是要利用GPT擅长编码但不擅长算术的事实。下面是 mathnerd 的完整实现：每20来天，就更新一次其实，这已经不是ChatGPT第一次更新了。在1月9日，OpenAI就发布过一次ChatGPT更新的消息。「我们对ChatGPT模型进行了一些改进！在广泛的主题上，它的表现会更好，并且在真实性上也得到了提高。」另外，现在在ChatGPT生成响应的过程中，你可以让它马上停止。不得不说，这个升级还挺重要的。这是今年ChatGPT的第一次更新，也是自去年11月ChatGPT推出以来的第二次更新。那段时间里，ChatGPT已经经历了数次长时间的宕机，而推出更新后，ChatGPT就开始以新模型启动并运行。因为这个更新说明中的信息有限，因此有记者亲自上手测试了一下，看更新后的ChatGPT究竟有何重大改进。首先，他让ChatGPT自己说说，自己究竟更新了啥。 ChatGPT是OpenAI开发的一种大型语言模型，它在对话文本数据集上进行训练。由于它是一个OpenAI模型，它会定期更新以提供新功能和改进。但是，由于我的知识中断是在2021年，我没有最新的更新，我无法向您提供有关在最近的更新中向模型添加了哪些新功能或改进的具体信息。看来，它很明白自己的知识体系建构于2021年前的「旧时代」，因而说不清楚自己的更新。这个理由很有说服力。这位记者又换了一种问法，于是ChatGPT解释了AI模型是如何提高准确性的。一般来说，对像ChatGPT这样的AI模型进行更新时，要提高它在一个或多个方面的性能。例如，它可以使用更大的数据集进行训练，或者改进其架构，使其能够生成更流畅和准确的响应。而且这种更新也使它在事实性方面变得更好，即它能够根据事实信息理解和生成响应。...

3 years前 11

AI与数学

ChatGPT挑战者：付费版Claude能否超越？

这篇文章讨论了ChatGPT在中文聊天方面的表现，作者金磊认为它是最舒适的体验之一，但仍指出自己的中文水平与微软的Claude付费版和百度相差。作者暗示Claude可能是ChatGPT的强敌，并引用了Anthropic公司在其Slack中的应用和Twitter上相关的讨论作为参考。总的来说，文章围绕ChatGPT中文聊天功能与其潜在对手进行简要分析。

3 years前 1

AI与数学

ChatGPT来袭，教育的未来在何方？

上海科技馆馆长倪闽景以《从学习进化角度看ChatGPT对教育的影响》为主题，重启“云间教育讲坛”，探讨技术对教育的未来影响。活动吸引了众多教育工作者参与，包括松江区干部、教师代表以及对口帮扶地区的教育者通过直播同步观摩。讲座中，倪闽景深入分析数字化与信息化的区别，并强调语言能力、人文科学等基础知识的重要性，同时指出ChatGPT带来的挑战和教育应对的价值判断。云间教育讲坛自2018年起举办，已成为松江教育品牌项目，助力教师跨界融合，面对未来教育挑战。

3 years前 4