文章主题:央视新闻, 美国律师, ChatGPT, 哥伦比亚航空公司

666AI工具大全,助力做AI时代先行者!

ChatGPT,还可以信任吗?

最近,一位美国的律师在一场诉讼案件中为原告提供帮助,但在引用 ChatGPT 收集的六个案例时被法官发现这些信息都是虚构的。尽管该律师意识到他没有核实这些信息的真实性和准确性,现在已经承认自己的错误并向公众道歉,但他的行为仍然可能受到相应的惩罚。

让 ChatGPT 协助办案 美国 30 年资深律师被坑

据新华社引述自美国有线电视新闻网的消息,罗伯托·马塔先生于2019年乘坐哥伦比亚航空公司的航班前往纽约时,因机组人员的疏忽造成膝盖受伤。

马塔的代理律师是已有 30 多年从业经历的纽约市律师史蒂文 · 施瓦茨。为支持马塔诉求,施瓦茨向法官凯文 · 卡斯特尔提交了多个所谓类似案例及其判决结果。

在今年四月份,哥伦比亚航空公司的律师向法庭提交了一封针对施瓦茨提交的案例信息的质疑信。据美国《纽约时报》的报道,这些律师对于航空法律有着深入的理解,因此能够轻易地识别出其中的虚假信息。其中一位律师,巴alt·巴尼诺表示,他的律师事务所拥有丰富的航空法律经验,从这些信息中可以看出它们并非真实可靠。他还透露,他们当时隐约感觉到这些信息可能来源于ChatGPT。

法官卡斯特尔本月 4 日在一份书面文件中写道,那 6 个案例的判决结果、引语等都是假的,” 法庭从未遇到过这种情况 “。他下令 6 月 8 日就处罚施瓦茨举行听证会。

施瓦茨承认那 6 个案例为 ChatGPT 提供。法庭文件显示,他看到这些案例信息后追问 ChatGPT 信息是否属实,机器人称 ” 千真万确 “,还给出了所谓的信息出处。

施瓦茨说,他这是第一次用 ChatGPT 协助办案,” 没有意识到内容伪造的可能性 “。

在书面文件中,他表达了深深的懊悔之意,并愿意承担相应的责任。他还承诺,在未来的日子里,如果没有完全核实所提供的信息,他不会使用聊天机器人提供的任何信息。

研究发现 ChatGPT 并非可靠信源

值得一提的是,今年 3 月 14 日,OpenAI 宣布正式发布为 ChatGPT 提供支持的更强大的下一代技术 GPT-4,称其拥有图像识别功能,高级推理技能,以及处理 25000 个单词的能力,在某些测试中的表现 ” 可与人类相媲美 “,并在大学入学和法律及医学等专业领域的许多模拟考试中优于其前身 GPT-3.5。例如,GPT-4 通过了律师资格模拟考试,分数超过 90% 的人类考生,而 GPT-3.5 此前的分数则低于 90% 的人类考生。

不过,目前最新的研究发现 ChatGPT 并非可靠信源。

据科技日报 5 月 18 日的一篇报道,加拿大科学家在 16 日出版的《放射学》杂志上刊登新论文称,最新版本的 ChatGPT 通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误答案,表明人们仍需对其提供的答案进行核查。

图片来源:物理学家组织网

ChatGPT是一种人工智能聊天机器人,其运作原理是基于深度学习模型,在大量的训练数据中发现词汇间的模式与联系。基于此,它能够生成类似于人类的反應,这种功能已被广泛应用,如在谷歌和必应等知名搜索引擎中,医生和病患也常利用这些工具来寻找医疗资讯。然而,由于数据来源可能并不总是真实且可靠,因此ChatGPT有时可能会返回与事实不符的答案。

为深入评价ChatGPT在美国放射学委员会考试中的性能及其实用性与局限性,多伦多大学的拉杰什·哈瓦那博士及其团队首先对其进行了基于GPT-3.5的考试测试。本次测试共涵盖了150道题目,其风格、内容和难度均与加拿大皇家学院以及美国放射学委员会的考试相仿。值得注意的是,这些题目并未包含任何图像,主要分为两大类别:低阶思维问题,包括知识回顾和基本理解;以及高阶思维问题,涉及应用、分析、综合等能力。其中,高阶思维问题又可以进一步细化为影像学表现描述、临床管理、计算和分类、疾病关联等方面。

研究人员发现,基于 GPT-3.5 的 ChatGPT 的正确率为 69%,接近 70% 的及格线。该模型在低阶思维问题上表现相对较好,正确率为 84%,但回答高级思维问题时表现不佳,正确率仅为 60%。而性能更优异的 GPT-4 的正确率为 81%,且在高阶思维问题上的正确率为 81%,远好于 GPT-3.5。但 GPT-4 在低阶思维问题上的正确率仅为 80%,答错了 12 道题—— GPT-3.5 全部答对了这些题目,这引发了研究团队对 GPT-4 收集信息的可靠性的担忧。

这两项研究都表明,ChatGPT 会有提供不正确答案的倾向,如果仅仅依靠它获取信息,非常危险,因为人们可能意识不到其给出的答案是不准确的,这是它目前面临的最大的问题。当前,ChatGPT 最适合用来激发想法,帮助撰写数据摘要,而用于快速信息检索,需要对其提供的事实性答案予以核查。

编辑|程鹏 盖源源

校对 |陈柯名

封面图片来源:视觉中国

每日经济新闻综合自央视新闻、新华社、科技日报

每日经济新闻

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *