“自己写的毕业论文,被确诊AI”
澎湃新闻记者 袁璐 实习生 陈诗艺 李夏妍编辑 黄霁洁 看到AI检测系统里,毕业论文成片的红色和黄色时,舒然感到“欲哭无泪”。她在心里反问自己:难道我长得这么像AI吗? 在舒然两万三千字的论文中,有几十段文字被检测出“中风险”和“高风险”。舒然解释,这意味着自己的毕业论文虽是原创的,却因为“AI率较高”无法达到学校论文过审的要求。 随着AI的流行,不乏学生会在论文写作时借助AI生成。根据一些高校的官网消息,针对2024届毕业生,这些学校首次发布了有关AIGC(生成式人工智能)检测的通知,明确学生在进行毕业设计(论文)时,应严格遵守学术规范和学术道德,避免过度依赖智能生成内容,确保毕业设计(论文)的独立性和原创性。 接受采访的学生们都认为,AI检测某种程度上的确可以防止学生用AI代写论文,但是目前的AI检测功能尚不成熟。“很难理解它是怎么判断为AI写作的,因为就算是人工写作,或者经过修改,也会再次检测成AI代写。”舒然说,用科技制裁科技的结果,会导致跟论文的要求相反。 对于那些被误判为AI写作毕业论文的学生,机器反馈给他们一个数字,他们没有申诉途径,只能按照机器的运行逻辑修改。一个明显的悖论是,当人工智能越来越像人类时,人类自己写的句子也越来越像人工智能。此时,用AI检测是否使用AI代写,他们的论文被误判为AI代写的可能性就越高。 从“中风险”改到“高风险” 今年4月底,即将大学毕业的舒然和导师讨论后,定下了自己毕业论文的题目。 一个月后,舒然开始写论文初稿。撰写论文期间,她已经进入一家公司实习。每天下班后,她趴在电脑前绞尽脑汁,写到半夜才休息。周末两天,她把所有时间都投入到论文写作中。 因为提前和导师商量好了论文的结构框架,写作过程中,舒然的思路较为清晰和顺畅。除此之外,导师对她的论文格式,包括目录、字体、表格的线条等都提出了更细致的要求。 大概过了半个月,她写完论文初稿。按照学校的要求,她的毕业论文字数要在两万以上。一遍遍修改后,舒然的论文字数停留在两万三千字。 学校的另一个要求是,除了一般的查重外,学生需使用一款叫“格子达”的AI工具作为论文引用检测系统,检测的结果必须是“低风险”。 舒然通过上网查询得知,这款软件能够提供论文查重、格式检测、格式校正、论文管理等功能。论文查重主要通过与期刊数据库比对,找出论文中内容的重复率。 不同的查重系统算法和数据库大小不一样,比如知网查重的规则是13个字符,即6.5个字连续重复就会被标红。而AI检测的目的在于识别出哪些内容是由AI生成,通过分析语言风格、检测重复内容、语法和逻辑进行判断。 写完论文初稿一个星期后,舒然发给导师。导师提出修改意见后,她从标题到框架全部“人工”修改了一遍,直到对自己满意为止。在答辩前两周,她将论文提交到AI工具里检测。 在舒然提交之前,她的一个室友先进行了AI检测。结果是查重率13%,AI检测“中风险”。室友对此结果并不意外,她告诉舒然,自己的论文有一部分是AI代写的。 当时舒然觉得“还挺新奇”,但她心想,这样的论文肯定重率高,自己的论文都是一个字一个字写的。当舒然把论文提交后,出现在她眼前的查重率只有1%,但AI报告也是“中风险”。 这意味着,她必须降AI率,从“中风险”降到“低风险”。 和舒然一样,四川大学生林天乐的毕业论文也被判定为AI代写。今年毕业前两个月,林天乐突然接到学校要求查AI率的通知。交论文截止日期的前一天,他才知道学校要求学生使用维普论文检测系统,系统显示,可以用AI语言模型检测AIGC实现快速、准确识别学术文本中的AI生成内容,可有效识别文本是否部分或全部由AI模型生成,检测结果与论文质量无关,仅表示论文中内容片段存在AI生成可能性的概率。 林天乐学校要求,AI率要低于30%。超过这个比例,论文盲审不能通过,就无法毕业。他上传论文后,查出来的结果是37%。林天乐表示,标成AI的那些内容,都是他自己写的。 在这之前,他已经在知网上查过一遍,查出来的重复率是百分之零,所以他对自己的论文比较放心。直到要交初稿的当天,老师建议他再加新的内容进去,他又继续修改,到下午才定稿。“感觉自己这么努力,到交之前还手忙脚乱, AI率却被判为37%,内心挺气愤的。” 林天乐在社交平台上吐槽检测结果。本文图片均为 受访者供图 因为已经保送了研究生,林天乐对自己的论文要求较高。每天早上9点,他就跑到实验室打卡写论文,一直写到晚上八九点,有时候熬夜写到十一二点。持续了一个学期,论文写了近四万字。 原本信心十足,读博士的师兄也夸赞他论文内容丰富,图表画得好看,查重率从来没超过3%,却被检测出AI代写,林天乐心情跌落谷底。 你的AI率降下来了吗? 刚开始改论文,舒然根据软件里标红和标黄的提示,自己琢磨修改。对于那些跟其他内容相似的句子,“看着它有点像AI”,便逐字逐句地改。 她念的是国际经济与贸易专业,论文中涉及不少专业术语的概念解释。但令她苦恼的是,这些固定的解释最容易被AI系统标红,而她又无法“创造出一个新的概念”。 她的具体修改方式是,用同义词替换,或者调整一下句子的顺序,或者用一些更“高级”的词汇,以此对抗“AI给出的机械和低级的词句”。但她没想到,再次检测的结果竟变成了“高风险”。 舒然内心彻底“破防”。她并不知道其中的算法和规则,只知道软件会标出不同的风险段数,标红的是高风险,标黄的是中风险,标绿的是低风险。第一次检测结果中,她论文中的“中风险”有35段,改完之后变成了五十几段。 舒然修改论文后变成“高风险”。 论文被判成“高风险”之后,舒然先冷静了一个晚上。第二天,她开始上网到处搜索降低风险的方法。刚开始,她尝试了几款可以降AI率的AI工具,“但都没啥用。” 之后,她又搜到一些大学毕业生降AI率的经验分享帖,说要去掉论文中“首先”、“其次”、“和”等字词,以及调换语句和语序等等。她用这种方法再次修改了一遍论文,论文又变回到“中风险”。 改了一天后,又回到起点。舒然觉得这样的修改方法太慢,于是继续上网搜寻。这次,她通过提炼其他人降AI率的经验,总结出一句她背得“滚瓜烂熟的法则”,即“复杂变简单,正话反说,主动变被动,简单变复杂”。 距离交论文定稿的时间只剩下两天,舒然和室友们的论文都被判为“高风险”或者“中风险”。“她们有的是用AI代写的,有的是从别人论文里面抄的,也有自己写的”。舒然说,她们检测结果相似,都是查重率不算很高,但是AI率很高。 熬到凌晨三点,那个晚上,宿舍里彼此间说得最多的话是:“你的AI率降下来了吗?” 学校虽然提供了一次免费的检测机会,但舒然想用在最终稿上,因为检测报告一出来,系统会直接提交给老师。她先后自己花了200多块钱,购买了四次检测机会。 她感觉论文像做了一次次体检,“检查出来都是病。”报告很详细,“甚至可能就几个字重了,也会标红。” 降AI率的过程中,舒然脑中盘旋的一直是导师的话:论文过不了,会影响毕业。答辩之后还会抽查,抽检不过关的,后果很严重。 天快亮的时候,舒然不记得是第几次改完整篇论文。再次检查,虽然报告上仍有几段显示是“中风险”和“低风险”,但整体结果是她无比期待的“零风险”三个字。...