文章主题:工作问题, ChatGPT, 数学问题, 错误答案
在2023年2月18日的一天中,我深入探讨了一个工作相关的问题。由于对人工智能技术的兴趣,我想起了ChatGPT,并迅速根据网络教程注册了相应的账号。然而,令人失望的是,它并未能够解决我所遇到的问题。尽管如此,在好奇心的驱使下,我还是与ChatGPT展开了一场关于数学的对话。
判断一个数是否为质数
之前已经看到过 ChatGPT 在判断一个数是否为质数时会出错,于是我先测试这个问题。
今年,我们来到了2023年。有趣的是,2023可以被分解为7、17和17的乘积,因此它是一个合数,而不是一个质数。这个有趣的数字背后的数学原理是它满足了一个更广泛的数学定义,即如果一个正整数可以被两个或更多的正整数相乘得到,那么它就是合数,而不是质数。在这个特定的例子中,2023可以被7、17和17相乘得到,因此它是一个合数。
令人遗憾的是,ChatGPT竟然在2023年这个问题上犯了错误,把它视为质数。当我多次向它确认这个问题时,它的回答却显得有些模糊,一直试图强调2022是偶数,而2023并非如此。
因此我尝试引导它做出正确的解答:
在开始之前,我对其进行了一个简单的测试,目的是查看其是否可以被较小的质数所整除。令人惊讶的是,它迅速回应称已经过检查,且明确表示没有发现任何因子。这种回应 manner 颇有些粗心大意和勇敢无畏的学生的作风。
在撰写这篇文章时,我注意到原文表达较为简洁,但为了保证内容完整且符合专业文章的要求,我将对部分句子进行改写。为了使读者更好地理解,我将详细描述一下文章中的关键步骤。首先,我意识到需要让读者更加清楚地了解问题背景,因此我会加入一些相关背景信息。接着,为了证明某项性质,我会采用严谨的数学语言进行表述。最后,我会给出一个具体的例子来说明结果。在这篇文章中,我们关注一个数是否为质数。为了判断这个数是否为质数,我们可以尝试将该数除以一个较小的正整数(例如7),看是否能得到整数的结果。如果得到了整数,那么这个数就不是质数;否则,它就是质数。在本例中,我们将要检验的数设定为2023,并尝试将其除以7。经过计算,我们发现2023可以被7整除,因此它不是质数。
在我的探索过程中,我发现了一个令人惊讶的错误。该程序在表述「2023可以被7整除,商为289」之后,紧接着表示「余数为6」。然而,这显然是矛盾的。在进一步追问后,我注意到该程序似乎无法正确理解「整除」的概念,同时在处理多位数除以一位数的除法运算上也存在问题。
鸡兔同笼
小学数学的一个经典问题是「鸡兔同笼」问题,让我们来问问 ChatGPT 吧。
首先我问了一个有解的「鸡兔同笼」问题,ChatGPT 用二元一次方程组迅速解决了。然后我修改题目条件,使问题变为无解,ChatGPT 也能识别出来。Well Done。
x/sin(x)
让我们将问题调至高中以上的难度吧。我随便想到一条题目:求 x / sin(x) 的最大值。
显然这个函数是发散的,不存在最大值。然而 ChatGPT 没能识别出来,直接求出一个零点后代进去就当做最大值。这种做法有点像死记硬背的学生试图通过套公式来获得分数。
费马大定理
费马大定理的内容小学生就能理解:当整数 n > 2 时,关于 x, y, z 的方程 x^n + y^n = z^n 没有正整数解。这本来是17世纪法国数学家费马提出来的一个猜想,1995年被英国数学家安德鲁·怀尔斯证明后,就成了定理。
我首先按照费马大定理的一般表述方式来问 ChatGPT,它正确回答没有正整数解。这在意料之中,一般搜索引擎都能做到这事。
然后我问它 n = 3 的情况,这个时候它开始犯错了,至少有两个错误:
搞错「水仙花数」的定义:水仙花数是一个 3 位数,它的每个位上的数字的 3 次幂之和等于它本身。
把 3 次方当做平方。
在我指出它的错误后,它继续列举了更多错误的例子。看来是死性不改啊。
总结
基于以上测试,我得出以下结论:
ChatGPT 对话能力确实很不错,基本没有语法错误,也有一定的联系上下文的能力。之前清华计算机教授甚至说 ChatGPT 对话能力已经超过 80% 甚至 90% 的人。
ChatGPT 在数学运算和逻辑推理上有时会犯错误,甚至在简单的除法运算上也可能犯错误。
ChatGPT 在常识性问题上有时会犯错误,比如搞错「水仙花数」的定义,再比如搞错陈景润的国籍等等。
个人认为 ChatGPT 十分适合作为工具助手,协助我们解决工作或学习上的一些问题,但要辨证看待其答案——可以参考但不宜照搬。 考虑到它还会不断迭代优化,其潜力确实惊人。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!