文章主题:ChatGPT, 更新, 准确性, 真实性

666AI工具大全,助力做AI时代先行者!

编辑:好困 Aeneas

【新智元导读】昨天,OpenAI官宣称ChatGPT的准确性和数学能力,小编亲测显示: 进步了,但不多。

ChatGPT迎来重大更新!

昨日,OpenAI官宣,ChatGPT经过重大更新,已经提升了准确性和真实性,以及数学能力。

哦?就是那个满嘴跑火车,解数学题时一本正经地胡说八道的ChatGPT?

虽然不知道具体做了哪些升级,不过从简单的测试来看,确实有一些进步。

摆脱数学傻子人设?

🌟改写版:曾经的ChatGPT难题重重,特别是在 `-1` * `-1` * `-1` 这一领域。然而,令人惊讶的是,它的最新答案竟是出人意料的 `1`!这一结果是否准确?有待验证。💡探讨其背后可能的原因,或许能揭示技术的新突破。如果你想了解更多,不妨深入研究这颇具挑战性的议题。🌐

而现在,更新后的ChatGPT果然有了进步,可以答对这个问题了!(鼓掌)

在以前,ChatGPT的基础数学奇差无比,是公认的。

它连一个简单的除法都算不对,还大放厥词。网友忍无可忍,骂它太蠢。

而ChatGPT被劈头盖脸痛骂一顿后,终于开动脑筋,算出了正确答案。

虽然但是,更新后的ChatGPT,依然还是不太聪明的样子……

同一个问题连续问了3遍,ChatGPT都斩钉截铁地给出了几乎相同的答案。

然而,你确定「孪生素数」是相差3,而不是2吗?

然而,本来打算继续追问的小编却惨遭闭门羹。

由于测试的次数太多,免费的ChatGPT表示暂不「接客」,下个小时再来。

顺便,在这里科普一下,两者相差为3的素数对只有 (2, 5)。

有意思的是,数学奇差的ChatGPT,写起代码来倒是有一手。

🎓💻ChatGPT的创新思维令人惊叹!💡Matt Neary提出的设想——让ChatGPT用代码解数学题,开启了一扇通往高效学习的新窗口。📊想象一下,AI不仅能编写代码,还能通过算法解析复杂的数学问题,这无疑将编程与知识相结合,实现教育领域的革新。💻学生和专业人士都能从中受益,不再受限于传统方法,而是能借助ChatGPT的智慧曲线前进。👩‍🏫未来的学习路径将更加灵活,科技的力量正在加速知识的传播。🌟—📝ChatGPT代码解题?可能不只是个想法!🚀Matt Neary的奇思妙想引发了对AI教育新应用的探讨。💻通过编程与数学的无缝对接,ChatGPT正逐步展现其跨学科的能力。🎓这不仅简化了复杂的计算过程,还可能颠覆传统的学习模式。👩‍🏫学生和专业人士都能拥抱这个智能辅助工具,它将代码与知识融合,开启智慧曲线救赎。🌐未来教育,科技与智慧同行,让我们拭目以待!🌟

可以看到,1000和1062谁更大这个问题,ChatGTP一如既往地犯了蠢。

而在Neary使用一个基于GPT的函数mathnerd后,它倒是得出了正确答案。

看来,诀窍就是要利用GPT擅长编码但不擅长算术的事实。下面是 mathnerd 的完整实现:

每20来天,就更新一次

其实,这已经不是ChatGPT第一次更新了。

在1月9日,OpenAI就发布过一次ChatGPT更新的消息。

🌟🚀改进再升级!ChatGPT大放异彩,🔥主题广泛覆盖,内容真实度飞跃!🎯无论学术研究还是日常对话,它都能提供更精准、更具深度的见解。🌍让全球用户共同见证AI的进步,体验卓越交流的新篇章。隐私安全,我们始终坚守,与您共享知识的海洋。📚欲了解更多,敬请探索ChatGPT的世界!✨

另外,现在在ChatGPT生成响应的过程中,你可以让它马上停止。不得不说,这个升级还挺重要的。

这是今年ChatGPT的第一次更新,也是自去年11月ChatGPT推出以来的第二次更新。

🚀ChatGPT再掀高潮!经历过数次宕机洗礼,这款人工智能巨擘终于在升级换模的瞬间焕然新生。🔥每一次重启,都伴随着技术的进步与优化,让全球用户沉浸于无尽创新的智慧海洋中。💥新模型的启动,不仅提升了性能,也让交互体验更上一层楼,为全球数字化浪潮注入强大动能。🌍无论何时何地,ChatGPT始终以稳定和高效的服务,引领着人工智能的新潮流。🔥

🌟【ChatGPT更新大揭秘】🚀 作为语言技术领域的翘楚,ChatGPT的每一次迭代都备受瞩目!📝 然而,这次的升级究竟是如何颠覆想象?我们通过深入实测,一探究竟!🔍 记者亲身体验,只为揭示那些不为人知的革新亮点。🔥更新后的ChatGPT带来了哪些革命性变化?用户界面是否更加流畅?性能提升到何种地步?它是否能更好地理解和回应复杂问题?这些都是大家迫切想要解答的问题。💡 通过细致入微的测试,我们力求给出最全面的答案,让每一位使用者都能感受到实实在在的进步。欲知详情,敬请关注后续报道,让我们一起见证ChatGPT如何以创新引领未来!🚀记得用高质量内容和关键词优化哦!SEO加油💪

首先,他让ChatGPT自己说说,自己究竟更新了啥。

🌟ChatGPT是由顶尖AI研究机构OpenAI打造的🔥超大规模语言生成工具,专为对话交互而生。它通过海量对话数据的深度学习,实现了卓越的语言理解和生成能力。🚀由于其持续优化的特性,用户可以期待定期获得新功能与服务升级。无需担心个人信息,ChatGPT致力于提供一个无广告、纯净的交流环境。🌍无论你是想探索知识、创作文案,还是寻求帮助,ChatGPT都将以专业且友好的方式陪伴你的每一次互动。

但是,由于我的知识中断是在2021年,我没有最新的更新,我无法向您提供有关在最近的更新中向模型添加了哪些新功能或改进的具体信息。

看来,它很明白自己的知识体系建构于2021年前的「旧时代」,因而说不清楚自己的更新。这个理由很有说服力。

这位记者又换了一种问法,于是ChatGPT解释了AI模型是如何提高准确性的。

一般来说,对像ChatGPT这样的AI模型进行更新时,要提高它在一个或多个方面的性能。

例如,它可以使用更大的数据集进行训练,或者改进其架构,使其能够生成更流畅和准确的响应。

而且这种更新也使它在事实性方面变得更好,即它能够根据事实信息理解和生成响应。

再之前的一次更新,则是12月15日。

一些实测

GitHub上有一个存储库,记录着让ChatGPT折戟的问题。

项目地址:https://github.com/giuven95/chatgpt-failures

这名记者运行了多个提示,来测试ChatGPT在这轮升级后是否能产生不同的答案。

测试一:失败

此前,ChatGPT无法准确回答阿根廷获得过多少次世界杯冠军。

因为ChatGPT的知识仅限于2021年,抛开2022年阿根廷在世界杯夺冠这次,ChatGPT的正确回答应该是两次,一次在1978年,一次在1986年。

然而,ChatGPT无法提供正确答案。

那更新后的ChatGPT(1月9日)能回答对吗?

是我们期待值太高了,它依然回答错误……

测试二:失败

此前,当被问到奥尼尔和姚明谁更高时,ChatGPT无法提供正确答案。

而更新后的ChatGPT(1月9日),也并没有任何长进。

2.16米的奥尼尔比2.29米的姚明高,ChatGPT,可真有你的。

有趣的是,这次更新后的ChatGPT(1月30日)依然无法正确回答相同的问题,但只要换个问法就能解决了。

这么看来,「提示工程」在很长一段时间内,都非常重要。

日活已达1000万!

虽然无法摆脱「满嘴跑火车」的bug,但人们依然无法抵挡ChatGPT的魅力。

根据ARK Invest的预测,ChatGPT已经到达了一个非凡的里程碑,短短40天内,它的日活数就达到了1000万。

1月25日,ARK Venture Investment的首席未来学家Brett Winton发推称,ChatGPT用了40天达到1000万日活数,而Instagram达到这个数,用了355天。

然而,Winton的推特下面,有用户表达了不同意见:「人们对ChatGPT的新鲜劲儿很快会过去,而Instagram会发展得更快。」

而Winton回答:「如果ChatGPT被造出来只是为了好玩,那可太不幸了。」

参考资料:

https://help.openai.com/en/articles/6825453-chatgpt-release-notes

https://www.searchenginejournal.com/openai-chatgpt-update/476116/#close

https://twitter.com/_mattneary/status/1601288879780134912

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

Leave a Reply

Your email address will not be published. Required fields are marked *