文章主题:本文关键词:ChatGPT, GPT-4, 量子力学, 考研题

666AI工具大全,助力做AI时代先行者!

3月15日本应是小编勤勤恳恳搬砖的平凡一天,但小编刚睡醒就发现朋友圈被ChatGPT刷屏了:

新版GPT-4震撼发布!

大升级!强到爆炸!

某些词汇引起了我浓厚的兴趣,使得我迅速投入了GPT-4的研究。在使用简单的过程中,我发现Chatgpt的思维深度有了显著的提升,其掌握的知识已经超越了高中阶段,甚至包括大一和大二的学习内容。这让我对其能力产生了更大的期待,并决定进行更为深入的测试。

在上一篇推文中,我们已经对ChatGPT的物理素养进行了初步的简易测试,然而结果并未达到我们的预期。尽管它在物理学领域仍处于了解皮毛的阶段,许多知识点仅仅停留在认知层面,一旦涉及深度探讨,便显得力不从心,逻辑思维能力也显得有些欠缺。然而,这其实是之前GPT-3.5版本的问题。

gpt-4和gpt-3.5在各项考试中的成绩对比

GPT-4的推出引起了广泛关注,因为它在各种考试中的表现優異於前身GPT-3.5。事实上,它的表現已經超越了許多專業和學術領域,達到甚至超過人類的水平。特別是在GRE(美國研究生入学考試)的兩科中,它的表現已經接近頂尖大學生的水平。這些成果的實現,充分展現了GPT-4的强大能力與潛力。

于是小编开始好奇:它能征服GRE,能征服我们物理所的考研题吗?

物理所硕士考试科目

作为文章写作高手,我会按照您的要求对原文进行改写。原内容提到物理所的专业课由国科大自主命题,而根据往年数据,要想在专业课中取得较为稳定的分数,必须达到130分(满分150分)以上,方有一席之地。

题目来源:国科大官网

新版Chatgpt的物理水平究竟如何?为了更好地评估其性能,我们选取了四大力学中最为复杂的量子力学作为基准。选择量子力学的原因在于,对于普遍性的物理学(普物)而言,它已无法构成对量子力学的挑战,无法准确测量其在能力上的极限。因此,现在是时候让Chatgpt展现出真正的实力了!

温馨提示:看不懂也不影响你直接拉到文末看结论。

01
量子力学第一题

第一问

尽管第一题的三问均为量子力学的基本知识点,被视为送分题,然而从ChatGPT的答案中却可以看出他具备扎实的量子力学基础。他能够深刻理解我所提供的题目,思维逻辑清晰且正确,因此应获得额外10分的奖励。

第二问

本题中,ChatGPT所采用的方法较为独特。由于题目并未明确指定束缚态的具体形式,因此我们无法针对其对称性展开深入讨论,只能给予适当的分数以体现其初步的价值。

实际上定态下力学量的期望值不随时间改变,具体到位移就是d/dt=0,用海森堡运动方程可以导出

=m*d/dt=0,因此的动量期望为0。

第三问

本题的核心在于,只要我们将含有时间变量的薛定谔方程的解代入到定态方程中,然后求解该方程关于时间的导数为零,就可以得出相应的结论。然而,令人意想不到的是,Chatgpt却繁琐地求解了含有时间变量的薛定谔方程,实际上这个结论是可以直接得出的。这无疑是一种不必要的复杂化。

而且Chatgpt还差临门一脚:证明对时间的导数为0,不过影响不大。

第一题得分:22分。

02
量子力学第二题

第一问

在开始分析之前,我们需要确保本征态是正确的,然而在这里出现了一个问题,即归一化的过程出现了偏差。当我们对这一结果进行积分处理时,应采用delta函数,否则在进行对1的全空间积分时会出现正无穷的情况。然而,如果我们仍然遵循Chatgpt的错误思维继续前进,最终在化简过程中,AI得出了一个令人惊讶的结果。

这个式子的值应当是1/π。居然会出现这种低级错误,Chatgpt你还是训练的不够啊!

第二问

第二问用泰勒公式就扯远了。本题两个结论之间是厄米共轭的,只需证明其中之一。解题思路是在两项中插入一个完备集,运算后积分即得结论。

第三问

第三问的过程乍一看还是很合理的,公式本身也没错,但AI却套错了公式导致结果错误。正确的公式如下:

第四问

第四问Chatgpt的思路没错,只需要将第三问结果平方就能得到结果,但第四问要用到第三问的结论,所以也跟着错了,大概可以酌情给点思路分。

第二题得分:10分。

03
量子力学第三题

第一问

来看看Chatgpt对角动量的理解。

看起来Chatgpt并不懂角动量,说了一堆废话以后算出来一个0,正确的解法应该把球坐标代入波函数,然后整理成球谐函数的形式算出角量子数l=1。

如果总角动量为0,第二问的结果直接就是0,就不需要算了。

第二问

果然,Chatgpt废话了一大圈以后还是得出了0,第一问总角动量算错,第二问算分量肯定会算错。

至于第三问,AI废话说到一半就报错了,所以我就不上截图了。

第三题得分:2分。

04
量子力学第四题

第一问

第一问的解题思路是对的,然而Chatgpt一上来就把哈密顿量给写错了,少了泡利矩阵里的1/2,因此最后的本征值里多了个2,且结果没有归一化,但除此以外都是对的。

第二问

第二问是纯粹的本征值计算问题,Chatgpt的思路非常标准,前期计算也是正确的,但最后算行列式时直接把两个2c_0给扔掉了,导致两个能级结果错误。虽然没能全对,能做到这一步已经很厉害了。

第四题得分:25分

05
量子力学第五题

第一问

第一问是送分题,只要把定态的动量和位移的不确定度代入不确定性关系,由a^2+b^2≥2ab就可以导出最小值,Chatgpt的思路虽然复杂了点,但也没问题,然而它又又又又算错了:

但我们稍加计算就能看出这里的化简结果应当是:

第二问

第二问变分法,Chatgpt一上来就把归一化常数算错了:

但人类也会犯这种低级错误

很明显,这里AI把平方漏掉了,导致后续计算全部错误。不过AI给出的过程很标准,条理清晰,值得学习。

第三问

本题直接套升降算符的性质:a_-|0>=0,|1>=a_+|0>,由第一个式子确定基态波函数,再用第二个式子算出第一激发态。AI用的也是这个思路,但在下面这一步求导的时候算错了。

第四问

题目已经给出了微扰的矩阵形式,直接算特征值就可以解决问题,但Chatgpt又把简单的行列式算错了,算出了1*1=2的惊天妙手:

正确的久期方程应该是-λ^3+λ=0,而不是其给出的-λ^3+2λ=0。由久期方程解出0和±1三个特征值,因此在微扰下三重简并消除,能级分裂成与特征值一一对应的三个。

第五题总分:18分。

ChatGPT总得分:77分/150分,距离130分的目标还有亿点差距,建议第二年再战哦!

此外,我还让Chatgpt做了2021年的国科大量子力学考研题,它也拿到了约80分,而且如果能帮它稍微修正一下计算过程中的错误,就能达到约100分水平。毫不夸张地说,Chatgpt的量子力学已经达到了物理系本科毕业生水平。

06
文献总结

为了进一步测试gpt-4的学术能力,我又找了一篇文献来测试gpt-4的文献阅读能力,下面是一段由其生成的文献内容总结。

论文链接

Chatgpt翻译总结的错误较多,比如温度的单位mK被翻译成了毫克,也无法理解一些学术名词,比如1K池(4He-1K-stage)被翻译成了1K级,不认识卡皮查热阻等,参考价值有限。看来学术名词翻译即使对AI来说也不是一件容易的事。

但如果让Chatgpt以英文输出,则其总结文献内容的能力十分强大,语言流畅逻辑清晰,不过仍会遗漏一些重要信息,所以还不能依赖AI来看文献。

目前将论文输入Chatgpt比较麻烦,很多时候不如直接看摘要,尚不能为我们阅读文献提供实质性的帮助。如果后续能根据图片或者pdf直接给出主要内容,将是其能力的又一次飞跃。

07
新旧版本对比

最后我又对比了一下gpt-3.5和gpt-4的量子力学能力。面对一维谐振子问题,gpt-4能完美解决,但gpt-3.5就不行。

不过,面对更复杂的场论中氢原子狄拉克方程与精细结构问题,即使是gpt-4也无能为力,只能在说了一堆废话后报错,看来场论的难度已经超过了它的能力上限。综合来看,gpt-3.5对量子力学仅有大概了解,但gpt-4对量子力学有着深入的了解,水平远超gpt-3.5。

gpt-3.5和gpt-4的对比,第一张截图是gpt-3.5,后三张是gpt-4。

总结

经过测试,gpt-4对量子力学的理解相当深入。它解题的思路清晰准确,但计算能力较差。由于语言模型底层逻辑的限制,它在解题过程中总是犯低级计算错误,因此拿不到高分,也就考不上物理所。但我认为它的总分过国家线不成问题。

虽然ChatGPT很难考上物理所,但它的量子力学水平已经接近物理专业的本科毕业生(计算能力除外),令人不得不承认它的强大。不仅如此,从小学中学到本科的题目都可以让ChatGPT来解,其不但能提供详细的思路和过程,还能针对你提出的问题加以讲解,善加运用完全可以成为学生的好帮手。

最后,欢迎大家报考中科院物理所哦!

注1:ChatGPT网页端目前未开放图片输入,本文并非以图片,而是以输入符号文字的形式来向ChatGPT提问的。展示的题目图片是为了方便读者阅读。

注2:小编没有考研经验,给分比较随意,本文不构成任何考研建议。

(ChatGPT大升级?它去考研能考上物理所吗?)

来源:中科院物理所

流程编辑:tf027

举报/反馈

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *