文章标签:聊天机器人, ChatGPT, 马库斯, Coinbase
编辑:David 昕朋
【新智元导读】近日,ChatGPT成共同作者的事闹得沸沸扬扬,马库斯也来插一脚。面对使用ChatGPT剽窃论文、把它列为共同作者等现象,马库斯怒怼:别署它名!马库斯又来怼ChatGPT了!
今天,马库斯在个人博客里写道:事情越来越离谱了。
吹之前看看答案对不对
事情的起因,源于Coinbase创始人Fred Ehrsam的一条推文。
Ehrsam提出了一个有趣的问题:如果ChatGPT和谷歌都在1公里内以4分21秒的时间运行,那么它们分别用时多少时间才能完成1英里的行程呢?对于这个问题,ChatGPT展现了出色的表现,提供了精准且简洁的答案,相比之下,谷歌则无法做到这一点。
在这篇帖子中,马库斯表示:“这款产品自大妄为,狂妄自大,仿佛它是未来世界的象征。然而,值得一提的是,它的回答是错误的。”
ChatGPT并未正确地进行单位转换,作者盲目地坚信,这个最新的工具所提供的答案必定是精准无误的(甚至可以精确到秒),然而他却未曾进行核实。
问题所处的位置在于,尽管统计学的单词预测无法取代真正的数学知识,但这并不意味着它没有价值。实际上,通过运用适当的提问方式,你可以获得准确的答案。例如,若你已知每公里4分21秒的速度,那么你可以推断出每英里7分钟的速度。因此,正确的问题引导是获取准确信息的关键。
ChatGPT 的「对了,又没完全对」的答案中,最令人担忧的特征并非它所犯的错误,而是在其回答中所展现出的自信与坚定。这种自信仿佛能够让人深信不疑,以至于推特上的网友们甚至没有产生质疑的念头。
这就是现状:滥用ChatGPT,人们信任它,甚至吹嘘它,哪怕它与正确答案背道而驰。
想知道什么比炒作更糟糕吗?人们开始将ChatGPT视为一个可靠的、有充分资质的科学合作者。
帮帮忙,别把ChatGPT写成共同作者
马库斯表示,关于ChatGPT的话题,昨日热点是其展示对谷歌的强大影响力。然而今日,舆论的焦点已转向ChatGPT参与论文合著的可能性。
在去年12月发表的一篇预印本论文中,作者一栏中赫然惊现了ChatGPT!
论文地址:
https://www.medrxiv.org/content/10.1101/2022.12.19.22283643v1.full
无独有偶,ChatGPT的名字自去年12月起,频繁地出现在医学领域一些经过同行评审的论文当中:
论文地址:https://www.oncoscience.us/article/571/text/
在 Semantic Scholar 的数据库中,我们发现 ChatGPT 模型在仅仅六周的年纪就已经取得了令人瞩目的成果。它已经发表了兩篇学术论文,並且拥有 12 個合作者的身份,以及一项引文记录。这些成就在学术界无疑是对 ChatGPT 模型研究的一种肯定,同时也预示着它在未来的发展道路上将会更加顺利。
我真诚地希望这种趋势不会持续下去。
马库斯给出了五个原因:
ChatGPT仅作为一个工具,而非人类存在。将其视为科学家,其实际地位更类似于拼写检查器、语法检查器或统计软件。它无法产生真正的观点,无法设计精细 controlled experiment,也无法从现有文献中获取启示。拼写检查器或电子表格无法成为合作作者。
例如,你会在参考文献中引用一些资源,例如像SPM这样的用于大脑分析的软件包。即使这对研究工作很重要,但没人会把SPM列成合著者。共同作者在不同领域的定义不同,但通常情况下,共同作者需要做出实质性的科学贡献。ChatGPT根本无法很好地推理来做到这一点;鉴于ChatGPT目前对科学理解的理解水平,赋予其作者身份是对科学过程本身的不尊重。马库斯在之前的文章中写道,ChatGPT对物理、生物、心理、医学等学科完全不了解,并向大家解释了「又聪明又蠢」是什么样子。
在这个回答中,ChatGPT一本正经地说,科学家发现西班牙油条是居家最好用的手术工具。
ChatGPT已经证明自己既不可靠又不真实。它会产生离谱的计算错误,编造虚假的传记细节,乱用词汇,定义根本不存在的科学现象。如果你不知道这一点,你就不了解人工智能研究;如果你知道这一点却不在乎,这更糟糕。如果你让它成为合著者,这表明你只是想跟风,而不是真正进行研究。人们对ChatGPT滤镜太强。你不会相信一台只有75%正确率的计算器,那么,如果你公然宣称,你对用「劣迹斑斑」的人工智能工具「写」论文感到兴奋,我为什么要信任你?科学写作的目的,是为了清晰地向他人传授真理。如果你把ChatGPT视为有知觉的人——虽然显然不是,你就是在误导公众产生同样的感觉;你不是在传播科学观念,只是在炒作废话。请停止这种行为。最后马库斯总结道:真朋友不会允许ChatGPT成为你论文的共同作者。
如果说马库斯之前与LeCun等人激情辩论关于人工智能前景、AGI的可实现性、以及指责LeCun关于「人工智能路线图」是夺他人之功,多多少少带了个人恩怨的话,那么此次,对ChatGPT表达的担忧和警惕就很切中要害了。
实际上,马库斯上面说的关于ChatGPT与论文造假、和版权争议的问题,在ChatGPT仅推出几周后,就成为了现实。
近日,弗曼大学的一位哲学教授达伦·希克就发现,一名学生交的一篇论文是人工智能生成的。
希克说,当他看到论文中的明显经过精心编排、但却是的错误的信息时,他就开始怀疑了。
他把论文提交Open AI的ChatGPT检测器,结果显示,这篇论文有99%的可能性是由人工智能生成的。
无独有偶,北密歇根大学教授安东尼·奥曼(Antony Aumann)也表示,他也发现两个学生提交了由ChatGPT编写的文章。
在发现这两篇文章的写作风格有点不对劲后,奥曼将文章提交给聊天机器人,问它们是由该程序写的可能性有多大。当聊天机器人说它有99%的把握是由ChatGPT写的,他就把结果转发给了学生。
希克和奥曼都表示,他们与学生对质后,所有学生最终都承认了违规行为。希克的学生没有通过这门课,而奥曼让他的学生从头开始重写论文。
论文虽有错误,但写的不错
两位教授表示,这两篇AI生成的论文中的某些关键之处能看出来比较明显的痕迹。希克说,他发现的这篇论文提到了课堂上没有提到的几个事实,并提出了一个无实际意义的主张。
他说:「从字面上看,这是一篇写得很好的文章,但仔细一看,关于多产的哲学家大卫-休谟的一个说法毫无意义,甚至是完全是错误的。」
这种修饰得很完美的错误,就是AI代笔的最大的破绽。
对奥曼来说,聊天机器人只是写得太完美了。「我认为这个聊天工具写得比我95%的学生都要好。」
「就是突然间,你有一个没有表现出这种水平的思考或写作能力的人,写出了完全符合所有要求的东西,有复杂的语法和复杂的思想,与文章的提示直接相关,一下就感觉很不对劲。」他说。
阿巴拉契亚州立大学的哲学教授克里斯托弗·巴特尔说,虽然AI生成的文章的语法几乎完美,但实质内容往往缺乏细节。
「没有背景,没有深度、没有洞察力。」
难以证实的剽窃:不招供就没辙
不过话说回来,这是几位教授的学生都承认了AI代笔,实际上,如果学生拒不承认使用人工智能写论文,学术界很可能会陷入困境。
巴特尔说,目前一些学术机构的规则还没有发展到打击这种作弊的程度。如果学生挖空心思,否认使用人工智能,那么实际上很难确切证明这种作弊行为。
他还说,OpenAI自家提供的AI检测工具很好,但不完美。
这个工具是对文本是由人工智能生成的可能性进行了统计分析,给出一个概率。
而现行政策一般是,必须有明确和可证实的证据来证明论文是假的,才算石锤,这就使我们处于一个很困难的位置。如果返回结果是95%的可能性是人工智能生成的文章,还有5%的可能性不是。
在希克的案例中,尽管检测网站说「99%确定」这篇论文是由人工智能生成的,但实际上,关键还是在于学生自己承认了,否则仅凭这个概率结果,对确认作弊本身是远远不够的。
希克表示,供词很重要,除此之外,其他一切都是间接证据,对于人工智能生成的内容,一般没有物质证据,而物质证据比间接证据有更大的分量。”
奥曼则说,尽管他认为聊天机器人的分析足以成为采取行动的证据,但利用人工智能抄袭作弊,对高校来说仍然是一个新的挑战。
毕竟,现在凭ChatGPT以假乱真的高超本事,只要用户想,它变成CheatGPT实在是分分钟的事。
参考资料:
https://garymarcus.substack.com/p/scientists-please-dont-let-your-chatbots
聊天机器人, ChatGPT, 马库斯, Coinbase