文章主题:堪萨斯大学, 科学家, 算法, ChatGPT
近期,堪萨斯大学的科研团队发布了一篇论文,深入探讨了一种创新性的算法。此算法能够有效地识别并区分ChatGPT参与撰写的学术论文,其准确性高达99%以上。在人工智能助手逐渐普及的当下,人们对于如何可靠地区分人机生成的文本内容以及真实人类所创作的文本产生了极大的关注。为了应对这一挑战,堪萨斯大学的科学家们研发出了这种先进的算法,旨在帮助人们更准确地判断文本作者是人还是机器。
在人工智能领域,ChatGPT检测器的研发正成为一种热点。许多公司纷纷投入巨资,试图开发出一种能够有效检测该技术的方案。尽管已有部分人尝试构建相应的检测器,且有数十家公司参与其中,但迄今为止,尚未出现一个真正有效的解决方案,即便是由 OpenAI 这个领域的领军企业所推出的方案也未能完全解决问题。目前市场上的检测工具效果并不理想,几乎没有什么实际应用价值。
在本文中,作者阐述了ChatGPT的发现者所创建的系统是为了在特定场景下运行而设计的,然而其展示的成功潜力却令人充满期待。在构建过程中,研究人员声称他们已经捕捉到了人工智能创作的一些端倪。
一篇在《细胞报告-物理科学》上发表并被同行评议的论文,揭示了一种能够识别由人工智能编写的学术论文的技术。该研究选择了由人类作者撰写的64篇涉及不同学科(如生物学至物理学)的研究文章。研究者将这些数据输入ChatGPT,进而利用其生成了一个包含128篇文章的人工智能文章数据集,其中包含了1276段由聊天机器人生成的具有高度价值的语句。基于这些人工生成的段落,科学家们构建了他们的ChatGPT检测算法。接下来,他们将一个新的数据集组合起来,包括30篇真实文章和60篇由ChatGPT编写的文章,以测试他们的算法。在这个测试过程中,总共使用了1210段数据。
研究者们声称,他们的算法成功识别出了ChatGPT所撰写的整篇文章,准确率达到了100%。然而,在详细到段落的层面上,该算法的精确度相对较低,尽管如此,其表现仍让人印象深刻。具体而言,该算法成功地辨别出了92%的人工智能生成的段落。
在这篇由研究人员撰写的论文中,他们提出了一种创新的想法,那就是让其他人可以根据自身的需求和目标,利用他们所研发的检测软件来定制化应用。论文作者、来自堪萨斯大学的化学教授Heather Desaire在接受EurekAlert采访时分享了这个想法。她强调,他们的目标是创建一个易于操作且效果显著的方法,使得即使是没有计算机科学学位的人,也能够为各种类型的写作建立出一个人工智能检测器。她认为,解决人工智能在写作领域的应用问题至关重要,因为这将使得更多人能够参与到这个领域中来,而无需具备专业的计算机科学背景。
该论文说,ChatGPT的工作有一些明显的迹象。首先,人类作家写的段落更长,使用的词汇量更大,包括更多的标点符号,并倾向于用”然而”、”但是”和”虽然”等词来限定他们的陈述。ChatGPT在引用数字和提及其他科学家等方面也不太具体。
对于希望惩罚作弊的高中老师来说,堪萨斯大学研究人员建立的模型并不能马上拿来用。该算法是为学术写作而建立的,特别是在科学杂志上看到的那种学术写作。这对导师和管理人员来说是个耻辱,他们在过去六个月里对ChatGPT促成的抄袭行为感到恐慌。然而,理论上可以使用同样的技术来建立一个检测其他类型写作的模型。
当你考虑到一个事实,即作者可以很容易地对一段聊天机器人的写作进行一些小调整,使其更难被发现,整个方案的有效性就会崩溃。尽管如此,研究人员仍将这项工作描述为”概念证明”,并表示他们可以通过更大的数据集开发出更强大、也许更准确的工具。
尽管这些结果可能很有希望,但科技公司和人工智能推动者表示,像ChatGPT这样的工具还处于起步阶段。如果人工智能继续以我们在过去几年中看到的迅猛速度发展,像这样的检测方法是否会站得住脚,现在还无法说。大型语言模型越是接近于复制有血有肉的人类写作的杂音,就越难识别出机器人语言的痕迹。
阅读文献:
https://www.cell.com/cell-reports-physical-science/fulltext/S2666-3864(23)00200-X
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!