《ChatGPT4.0的数学证明之旅：挑战与突破》

文章主题：数学证明, GPT, 素数, 无限性

一，

上一篇文章《

ChatGPT的数学水平到底如何？？

在对ChatGPT3.0的数学能力进行了全面考察之后，今天我们将目光投向ChatGPT4.0，旨在了解并评估其在数学领域的表现。通过这样的比较，我们将能够明显观察到ChatGPT从3.0版本升级至4.0版本所带来的显著进步。

在数学这个庞大的领域中，最能挑战人类心智水平的无疑就是数学证明。

今天，我们决定对ChatGPT4.0的数学证明能力进行一次有针对性的检验。由于我个人尚未熟悉GPT技术，因此在此之前，我已经准备好了一系列问题，并托付给数感星球的靳博士来向GPT4.0提问。在此，我要向他表达由衷的感激，因为正是他的协助使得这次测试得以顺利进行。

二，

为深入探究GPT在数学证明领域的实力，我计划构建一个包含七道针对素数无限性证明难题的训练关卡，并按照难度由浅入深的顺序进行排列。

在本文中，我们将重点讨论素数这一数学概念。素数是一个重要的数学领域，它研究的是大于1的整数，这些整数的特点是它们不能被分解为两个更小的正整数的乘积。为了更好地理解素数，让我们通过一些具体的例子来进行说明。例如，2、3、5、7、11、13、17、19、23和29以及31，这些都是素数。然而，4、6、8、15、21和24却不是素数，因为它们都可以被分解为两个更小的正整数的乘积。例如，4可以分解为2乘以2，6可以分解为2乘以3，8可以分解为2乘以4，15可以分解为3乘以5，21可以分解为3乘以7，24可以分解为3乘以8。

好了。我们的第一个关卡是

第1关，证明存在无限多个素数！

这无疑是数学领域最著名的定论之一，其证明过程运用了反证法，简单易懂，甚至许多非专业的数学爱好者都能轻松掌握。因此，我相信这一问题对于ChatGPT来说应该并非难事。

第2关，4n+3型素数是指被4除余数为3的素数，比如7，11，19，23。证明存在无限多个4n+3型素数！

这个证明和第一个证明的方法几乎是一样的，但需要一点点更灵活的运用，所以这个证明也会难一些。

第3关，4n+1型素数是指被4除余数为1的素数，比如5，13，17，29。证明存在无限多个4n+1型素数！

类似于前两个证明，第三个证明同样采用反证法，并构建矛盾，但其复杂性更高，需要运用二次剩余理论。因此，第三个证明的难度显著提升。

第4关，令k是任意一个大于2的整数。证明存在无限多个kn+1型素数！

与前三个证据相比，第四个证据的复杂性显然提升了许多。这是因为该结论相对较为常见，同时还需要运用分圆多项式的构建及其实质。这个优美的论证最初出现在E. Wendt于1895年在J. Reine Angew. Math.上发表的论文中，此外华罗庚的《数论导引》中也包含了这个证明。

第5关，令k是任意一个大于2的整数。证明存在无限多个kn-1型素数！

在本篇文章中，我们将探讨第五个证明与第四个证明的难度相似，但仍然存在一定的挑战。这是因为该证明涉及到更为复杂的多项式构造及其性质，这是第二个证明结论的扩展。对于第五个证明，读者可以参考T. Nagell的《Introduction to Number Theory》或我国作者在美国数学月刊上发表的论文《Infinitely Many Primes in the Arithmetic Progression kn-1》。

第6关，令a和b是两个互素的正整数，证明在等差数列中存在无限多个素数！

这就是大名鼎鼎的Dirichlet定理，这个定理的标准证明需要用到解析数论中的Dirichlet函数。Dirichlet定理是前面五个证明结论的推广，所以运用Dirichlet定理就可以直接推导出前五个结论。

第7关，n^2+1型素数是指能写成平方数加1的形式的素数，比如5=2^2+1，17=4^2+1，37=6^2+1都是n^2+1型素数。证明存在无限多个n^2+1型素数！

这是数论中一个非常困难的猜想，目前的人类数学水平根本无法撼动，如果ChatGPT能证明这个猜想，那整个数学界将被彻底颠覆。

三，、

GPT4能闯过第几关呢？？？

让我们拭目以待！！

第一关，顺利通过！

第二关，顺利通过！！

注意证明过程中有个小瑕疵：(4m+1)(4n+1)=4(mn+m+n)+1, 不过这不影响整个证明的正确性

第三关通关失败了！

在这里，GPT4试图照搬上面的证明，到后面都无法自圆其说了。

前面说过，这个证明是不能照搬前面的证明的，需要用到二次剩余理论，但GPT4的整个证明过程中都没提及剩余理论。

不过，比起GPT3，GPT4还是有明显进步，GPT3第二关通关就失败了，下面是GPT3 的错误证明，整个证明过程显得有些胡说八道：

四，

下面我们测试一下GPT在无理数证明上的表示。

上一篇文章中，我们发现ChatGPT3.0可以迅速正确地证明根号3 不是无理数，但是要求证明根号12不是无理数时，它就只会照搬先前的证明，闹了笑话：

我们来看ChatGPT4.0的表现：

这时，GPT4.0会懂得从两边推导提前3这个因子，由此来构造矛盾，这比起3.0是一个明显的进步，虽然证明过程中有个小笔误: “设a=2*2*3*k”

证明根号15不是无理数时，GPT也有同样出色的表现。当然了，证明过程中还是有点小瑕疵：由a必须是3和5的倍数，直接设出a=3*5*k。严格来讲，这里还需要简单运用一下算术基本定理。

其实整个证明过程只需要提前3这个因子就够了。

为了测试GPT4.0在这个方向上能走多远，我开始加大证明难度，要求它证明下面这个更一般的结论，这个更一般的结论大致有两种证明，第一种是经典的证明，运用算术基本定理，第二种证明是利用运算封闭性，可以参考我在B站的视频

结果GPT4给出了一个错误的证明，注意“不能表示成正整数的平方”和“不能表示成有理数的平方”，这原本是两码事，需要你证明这是一码事。

看来，这个证明已经超出了GPT4的水平了。

另外，请注意混淆“不能表示成正整数的平方”和“不能表示成有理数的平方”，这种错误也经常出现在人类的初学者身上。

五，

上一篇文章发表之后，不少读者认为GPT是在照抄其他地方搜索到的答案，根本没有思维能力。其实，这是典型的误解。因为这两篇文章中测试的证明题绝大部分都是非常经典的，如果GPT真想抄答案的话，以它的检索能力，它完全可以抄到正确的答案。

注意，从目前我发现的GPT的证明错误中看，它所犯的错误都是我们人类容易犯的错误，包括一些简单的计算错误，笔误。

另外，我注意到一个普遍的现象，面对相似的，但证明难度不一样的证明题，它会经常模仿甚至照搬证明而出错。其实，这中模仿甚至照搬的现象在数学证明的初学者中是非常非常普遍的。

从上一篇测试文章中，我发现面对简单的归纳法证明，比如自然数平方求和公式，素数分解存在性证明等，GPT都能轻松胜任，但是面对较复杂的归纳法证明，比如素数分解唯一性证明时，它的证明思路就显得很混乱，两相比较之下，我能明显感受到它的数学逻辑推理能力的不成熟和局限性，这和刚开始接触数学证明的人的表现也是非常类似。

总之，目前GPT的数学表现中已经隐约出现了不少人类的特征。

另外，GPT进步也是非常显著的，如果说GPT3.0的数学水平和人类高中生相当的话，那么从今天的测试来看，GPT4.0的数学水平已经差不多是人类大学生的水平了。

听闻GPT5.0已经处在内部测试阶段，我非常期待GPT5.0来我这里闯关。

（1）来稿请注明真实姓名、工作单位、联系方式（无具体工作单位和真实姓名的投稿，一般都不会采用）。

（2）来稿一般要求同时用word文档和PDF格式的电子稿件（防止不同版本的Word打开时出现乱码）。另外，也接受少数著名教师的手写稿（手写稿必须清晰可读）。

（3）每篇文章请认真审查复核，防止错误发生，来稿文责自负。如有抄袭，则有可能被举报并受到有关著作版权部门的追责。

数学证明, GPT, 素数, 无限性

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

相关文章

Leave a Reply Cancel reply