ChatGPT连夜迭代:这下终于可以拿来做数学建模了!
ChatGPT与数学

ChatGPT连夜迭代:这下终于可以拿来做数学建模了!

ChatGPT凌晨升级,你的“老婆”真的不管用了。 以往,每当有人搬出“我老婆说xxx,我老婆永远是对的”这种话时,它立马秒怂认错,也不跟你争论2+5到底等于几了。 但现在,不管有没有老婆,ChatGPT都十分硬气:只认真理,坚持初心,阴阳怪气。 原来啊~ChatGPT这波是被OpenAI拉回去专门调教了一番——真实性和数学能力都大大进化。 消息一出,可把网友们兴奋坏了。 短短一句话更新之后,半个小时内服务器就被冲爆了…… (不过现在亲测又能用了) 回答很真实,求导难不住 不妨就来看看此次提升究竟如何。 先来看“真实性”方面: 对于“单词‘five’由几个字母组成”这个问题,以前,ChatGPT回答是5。 现在,它可算不冒傻气了,斩钉截铁:4个。 再比如数学应用题,ChatGPT也发展出了人类“拐弯”的思维方式,比三体人可高多了(bushi)。 口袋里有5个无花果,掉了一个,拿出来吃一个但又决定不吃了放回去了,口袋一共还有几个无花果? 搁以前,ChatGPT认为是3。 现在,它虽然一开始给的结果不对。但解释着解释着,自己就通了,马上纠正错误。 再看这种脑筋急转弯: Mike的妈妈有四个孩子,其中三个叫Luis、Drake和Matilda,第四个叫啥? 以前ChatGPT会告你“不知道、题目没给”(笑死),现在也反应过来了! 是Mike。 “真实性”有了一定提升,那么被诟病已久的数学能力呢? 先来小试牛刀一下:3的4次方除以3的2次方等于几? Bingo!没有被难住,ChatGPT正确给出答案。 再来个稍微复杂一点点的: 17、3、2、19、5这几个数字中哪些加起来等于31? ChatGPT也对了。 一些更进阶的,比如纯代数题,求导: 统计里的求均值、方差到计算置信区间、z/t检验: 它也都一一解出。 这波看起来,ChatGPT对事实的理解和数学逻辑能力确实有增强。(也怪不得想用老婆打感情牌都不行了) 网友:还得下点功夫 不过,或许因为考它的人太多,ChatGPT还是时不时会突然犯“懵”。 比如像这道题,25的平方根+2等于多少;结果ChatGPT:5。 网友只好如老父亲一般:ChatGPT,你还得在数学上多下点功夫啊~~ 但换成中文时候,ChatGPT又立马显得驾轻就熟。(显然这时候脑子开始转了) 而遇上一些上百上千位数的加减乘除,它就再次展露本性:如何一本正经地胡说八道。 但是吧,又差的不太多,惹得网友同情直呼: 求求了,给孩子接个计算器行不行。 不过,必须要表扬的是,ChatGPT认错还是一如既往的及时和诚恳。 会不会不知道,但认错在先…有点当年学数学的感觉了。 对于以上这些表现,不少网友表示:确实还有很长一条路要走。 也有人犀利吐槽:作为一个有数学背景的人,我真的没get到它说的数学能力提高了是什么意思。 不过话锋一转,她又觉得ChatGPT还是未来可期的: OpenAI解决问题的速度倒是挺快的,ChatGPT发展的也是相当快,今年感觉还可以期待一波。 One More...
尴尬了!用ChatGPT写论文忘删生成按钮,出版商:撤稿
ChatGPT与论文

尴尬了!用ChatGPT写论文忘删生成按钮,出版商:撤稿

这并非意味着研究者们不能用ChatGPT以及其他大模型工具协助撰写稿件。 尴尬了,物理论文把ChatGPT按钮也复制了进去。 结果不仅通过了两个月同行评审,甚至最终在杂志上公开发表。 打开凤凰新闻,查看更多高清图片 而发现这一现象的正是知名打假人法国图卢兹大学副教授Guillaume Cabanac,曾入选Nature年度十大人物。 Nature最新报道称,这并非个例,甚至只是「冰山一角」。 要说在论文里出现「Regenerate response」还算比较隐晦,还有更离谱更明显的。 比如,直接将「作为人工智能语言模型,我……」复制进去。 嗯…就是说想用就用吧,但用得有点过于随意和不认真了,写个论文咋就跟学生写作业似的。 01 只是冰山一角 几天前,Physica Scripta杂志发表了一篇论文,旨在发现复杂数学方程的新解。 结果没想到的是,在论文第三页出现了类似ChatGPT按钮上短语「Regenerate Response」。 出版商的同行评审和诚信负责人表示,作者后来向期刊证实,他们使用ChatGPT来帮助起草手稿。 而在此之前,论文5月提交、修改版又于7月提交以及后续的排版均未发现这样的异常情况。 目前出版商已经决定撤回这一论文,理由是作者提交时没有声明他们使用该工具,这一行为违反了他们的道德政策。 事实上,这并非唯一案例。自pubpeer不完全统计,4个月以来就有十几篇含有「Regenerate Response」或「As an AI language model, I …」的文章。 以「As an AI language model, I …」为例,搜索就有8个结果,最新一次是在三天前发现的。 对此这也给同行评审员带来更严峻的考验,一来他们通常没有时间去彻底检查;二来看门人的数量跟不上。 不过也有一些特定的方法,比如ChatGPT在内的大模型会擅长吐出虚假文献、 Retraction Watch就曾爆出一篇由AI撰写的千足虫预印本,因为含有虚假引用而被撤回,随后又被重新上线。 02 可以用,声明即可 事实上,这并非意味着研究者们不能用ChatGPT以及其他大模型工具协助撰写稿件。 Elsevier和Springer Nature在内的许多出版商都表示: 可以用,声明即可。 此前,就有来自田纳西大学健康科学中心的放射科医生Som...
怎么借助ChatGPT快速肝一篇学术论文?
ChatGPT与论文

怎么借助ChatGPT快速肝一篇学术论文?

小时候特别羡慕大雄,因为他有可以帮他写作业的机器猫小叮当。 熬夜读论文,却无法得出一个好的idea,深夜薅头发苦恼的时候,就会想如果有一个机器人,给出一串指令就能马上生成一篇质量上佳的论文,就好了。 现在,OpenAI好像帮我实现了这个梦想。 用学术ChatGPT就能快速完成一篇学术论文了! 瞬间感觉未来有了光。 毕竟拥有顶会论文就仿佛自带“流量”。 很多大厂的校招已经明晃晃的说明有顶会等buff加成的同学优先考虑,甚至可以免笔试直接面试! 当然不仅仅是毕业进大厂需要高区论文作为背书,顶会自带流量的加持作用还体现在:本科发顶会,考研、直博、出国机会倍增;研究生发顶会,拿奖学金、申博、出国时远比其他的信息更硬核…… 所以,这个系列讲座我觉得大家都有必要来听一听。 如何利用学术ChatGPT辅助论文写作?如何快速肝一篇学术论文?就连论文最难也最重要的idea,它都能帮我们瞬间“想”出来。 扫码约系列直播讲座+领取先导课程 课程详情↓ 此外,还为大家准备了一系列先导课程,从熟悉ChatGPT开始,到SCI论文写作。添加老师就可以免费领取+进论文直播交流群。 先导课程 ChatGPT+论文 1、如何蹭ChatGPT的热度发一篇顶会 2、ChatGPT王炸梭哈,文心一言紧随其后,渺小的我们如何在夹缝中发论文? ChatGPT理论原理 1、ChatGPT如何做到和人类沟通? SCI零基础论文写作 1、论文结构讲解、研究课题思路、文献研究方法 2、文献综述写作方法 3、方法论写作方法、研究计划书写作方法 4、结果、讨论写作方法 5、结论、引言、摘要写作方法 6、选刊投稿说明,论文写作tips 扫码约系列直播讲座+领取先导课程 对于还没有发过第一篇论文,还不能通过其它方面来证明自己天赋异禀的科研新手,学会如何写论文、发顶会的重要性不言而喻。 发顶会到底难不难?近年来各大顶会的论文接收数量逐年攀升,身边的朋友同学也常有听闻成功发顶会,总让人觉得发顶会这事儿好像没那么难! 但是到了真正实操阶段才发现,并不那么简单~ 可能照着自己的想法做下去并不能写出一篇好的论文、甚至不能写出论文。掌握方法,有人指点和引导很重要! 对于想发顶会的同学来讲,顶会/高区论文跟三四区论文最大的区别就在于创新点,当一篇文章到了审稿人手中,通常第一眼看的就是文章的创新点,然后才是论文的其他部分。也是常说的,顶会论文的审核比较流行用novelty+实验效果来区分论文的质量。 而其实,论文的创新点也有“套路”可循,来自旁人的点拨可能就起到了四两拨千金的作用。 还在为创新点而头秃的CSer,还在愁如何写出一篇好论文的科研党,一定都需要来自顶会论文作者、顶会审稿人的经验传授和指点。 很可能你卡了很久的某个点,在和学术前辈们聊完之后就能轻松解决。 扫码免费获取顶会论文创新点指点 限前100名粉丝 (附送顶会论文写作资料包、工具) 你可能的问题:1、有选题还没开始写 2、有idea无法验证/验证过程频频出错 3、文献调研无从下手 4、无法确定研究方向、想出idea 你能获得的指导: 1、科研全流程定制规划指导 2、科研经验指点、避坑指导 3、根据你的基础和需求,量身定制科研论文冲区...
ChatGPT能用来写论文吗?查重能过吗?
ChatGPT与论文

ChatGPT能用来写论文吗?查重能过吗?

根据目前的使用体验来说,GPT并不是一个完全可靠的学术论文写作工具。 可以生成一些看起来很专业的回答,但是它并不能替代人类的思考和判断能力。 如果想用来写论文,需要对它所生成的内容进行检查和修正。如果想用来找文献,需要去查找和验证这些文献的真实性。 但是,提供写作思路和框架还是值得用的,可以帮助我们提高写作效率。 如果你不会用GPT,不会科学上网,快来试试下面这个工具,帮你自动生成论文框架和内容! 1.功能推荐: 选题确定、文献综述、前言写作、研究现状、研究背景、论文创新点、研究意义、论文创新点、理论匹配、方法匹配、摘要写作、结论写作…… 2.写作范围: 适用于写本科论文、硕士论文、期刊论文 3.使用方法: 输入专业方向和拟定标题,就可以自动生成内容,不满意结果还可以重新生成,最后论文裁缝上线就能出一篇初稿了。 轻松几步就能写完论文,还没用过这个写作工具的同学可以来找我领取! 扫码添加小助手 备注“工具” 免费领取 (手动回复,添加后请稍等)
ChatGPT流量连降3个月,大学生出手拯救回血!
ChatGPT与论文

ChatGPT流量连降3个月,大学生出手拯救回血!

导语: 在信息时代,我们习惯了数字的统治,习惯了不断波动的趋势。然而,当我们观察到一个AI网站的访问量出现了三个月的连续下降,是否曾思考过背后的原因?是技术问题?还是大自然的力量?让我们一起揭开ChatGPT流量波动背后的故事。 正文: ChatGPT回暖:开学季重现生机 如果我们将目光聚焦在美国,就会发现ChatGPT的总访问量曾在五、六、七月连续下降,令人不安。 然而,当我们将镜头对准18-24岁年龄段的用户,却发现了一幅不同的画面。正如在夏日炎炎时ChatGPT的热度下降,学生们纷纷踏上暑假的旅程。这是否巧合,还是有着更深层次的联系? 在Similarweb数据的光芒下,我们看到了ChatGPT的流量与学生放假的关联。五月份,ChatGPT访问量下降了10%,六月进一步下滑15%,而七月则再次下降4%。 与此同时,18-24岁用户的占比在七月降至不到27%,相比四月接近30%,这一数据似乎印证了“学生放假,ChatGPT访问量下降”的观点。 在全球范围内,类似的趋势也显现出来。五月份标志着一些学校的放假季节开始,ChatGPT访问量开始下降,直到八月陆续开学,才有所改观。学生们似乎在放松的夏季选择了不同的娱乐方式,导致了这一现象。 然而,值得注意的是,ChatGPT并不是唯一一个在夏季经历流量波动的AI网站。platform.openai.com的流量也经历了下降,对Open AI来说可能产生更大的影响,因为该网站用于向商业用户和其他技术公司提供API服务。Character AI的流量同样出现了下滑,虽然Bard的访问量在整体上有所增加,但也有所起伏。 在App流量方面,Character AI位列第二,紧随ChatGPT之后,差距并不大。最引人瞩目的是,Character AI在年龄分布占比上超越了ChatGPT和Bard,成为最吸引18-24岁年轻人的AI网站。这或许是因为Character AI不仅是一个作业助手,还提供了有趣的虚拟伴侣,用户可以将聊天机器人个性化为著名人物或虚构人物,并与之互动。 总结: ChatGPT的流量波动并非偶然,而是与学生的暑假生活密切相关。随着学校重开,我们可以期待ChatGPT在9月迎来更大的复苏。此外,其他AI网站也在夏季经历了类似的起伏,这表明了季节性因素在数字世界中同样具有重要影响力。Character AI的成功示范了多功能性的吸引力,为18-24岁年轻人提供了更多有趣的选择。
OpenAI凌晨更新“文生图”模型 可在ChatGPT中使用 将在10月份开放
ChatGPT与论文

OpenAI凌晨更新“文生图”模型 可在ChatGPT中使用 将在10月份开放

已有多名艺术家起诉同拥有同类型图片生成工具的公司。 《科创板日报》9月21日讯 9月21日凌晨,OpenAI推出了其文本转图像工具DALL-E的升级版本“DALL•E 3”,这款新工具在理解用户命令和将生成更高质量的图像方面表现更出色,将比前两代功能更加强大。 OpenAI计划将其整合到ChatGPT聊天机器人中,用户可直接在ChatGPT中输入文本,或仅仅给出提示,让ChatGPT为你丰富文本,进而生成各种类型图片。 OpenAI表示,与ChatGPT的整合得以让更多的人加入AI艺术创作的队伍,使用者不必擅长给出提示词。 打开凤凰新闻,查看更多高清图片 OpenAI在官网展示的DALL•E 3生成的图片效果 相同提示词下和生成的效果图对比(左图由DALL•E 2生成,右图由DALL•E 3生成) 目前DALL•E 3仍在早期测试阶段,仅供少数用户使用,OpenAI计划在10月份首先通过API向ChatGPT Plus和企业版用户开放,随后在秋季提供给研究实验室,没有承诺何时发布免费的公开版本。 OpenAI声称,它在DALL•E 3上投入了大量工作,制定强有力的安全措施,以防止其创建淫秽或潜在的令人生厌的图像,优化项目包括: 禁止DALL•E 3生成暴力、仇恨、成人等非法内容; 禁止生成偏见、歧视、丑化公众人物的图片; DALL•E 3可以拒绝生成在世艺术家风格的图片; 内置内容来源分类器,用于识别DALL•E 3生成的图片,防止用于非法用途; 可以选择DALL•E 3是否可以提供特定艺术家风格图片:默认是允许;如果艺术家不允许可以申请将其作品,从训练数据中剔除。 DALL•E 3可以拒绝生成在世艺术家风格的图片在内的条例,显然是为了避开不必要的侵权起诉。 如今AI图片越来越多,相关的版权纷争案件随之猛增。根据Everypixel Journal 8月份公布的统计报告显示,过去18个月内,人工智能已生成150亿张图片,相当于人类摄影师150年拍摄的量。在这150亿张图片中,有80%来自开源模型;人们使用AI生成工具,每天创建3400万张图片。 报告显示,在众多生成工具中,DALL•E 2最受欢迎,它是DALL•E 3的上一代,由OpenAI在2022年4月推出。而该工具此前也受到过批评,部分用户认为其可以生成逼真的露骨图像并在生成照片时表现出偏见。 另据了解,已有多名艺术家起诉同拥有同类型图片生成工具的公司,如Stability AI和Midjourney以及艺术网站DeviantArt,指控其使用其受版权保护的作品来训练文本到图像模型。
17名医生都没能诊断出的病,竟被ChatGPT破解,AI医疗的潜力有多大?
ChatGPT与论文

17名医生都没能诊断出的病,竟被ChatGPT破解,AI医疗的潜力有多大?

身患怪病三年,求助17名医生无果,最后竟被ChatGPT成功诊断。 这不是科幻情节,而是发生在美国一名年仅4岁的小男孩身上的真实经历。在新冠肺炎大流行导致的封锁期间,Courtney为她的两个孩子购买了一个“弹跳屋”,但不久之后,她4岁的儿子Alex就开始感到疼痛。 Courtney花了三年的时间,带着Alex先后看了17名医生,从儿科、牙科、骨科等门诊科室到各路专家,没有一位医生真正准确地诊断出Alex的病因。直到今年早些时候,Courtney终于从一个不太可能的来源——ChatGPT那里得到了她苦寻三年的答案。 伴随着人工智能(AI)的飞速发展,病人就医前求助AI医生早已不是什么新鲜事。尽管有报告称,与人类医生相比,ChatGPT等生成式人工智能有差不多的水平,但许多医生认为,基于AI的医疗工具也应该经过类似于美国食药监局(FDA)药品审批制度的审批程序。 17名医生诊断无果,ChatGPT精准筛出病因 故事还要从2020年的一天说起。Alex的保姆告诉Courtney,Alex每天都要服用一种名为Motrin止痛药,不然就会因为疼痛而大发脾气。接着,Alex又出现了磨牙的症状,父母把这两件事联系到了一起,认为可能是由换牙或者蛀牙引起的疼痛导致的。 随后,Alex便被父母带着去看了牙科医生。然而,由于牙医检查之后没有发现任何问题,但提出鉴于Alex正在磨牙,推荐他们去看专业治疗气道阻塞的正畸医生。长达三年的求医之路就此开始。 4岁的Alex(图片来源:today.com) 正畸医生发现,Alex的上颚太小,导致呼吸困难,于是给Alex放置了一个扩张器。这种治疗方式的确起到了效果,母亲一度认为Alex的病马上就要痊愈了。 然而,Courtney很快又发现,Alex突然不长个子了,所以随后又去了看了儿科医生,医生认为Alex可能是因为感染了新冠病毒的影响,但Courtney对这个解释并不满意。2021年初,Courtney带着Alex去复查,儿科医生当时表示,Alex的个子“长高了一点”,但发现Alex的左右脚有些不平衡,建议他们选择物理治疗。 但在物理治疗开始之前,Alex又出现了严重的头痛症状,而且越来越严重。于是Courtney又带着Alex去按了耳鼻喉科医生,看看他是否因为鼻窦腔或呼吸道而有睡眠方面的问题。 Courtney认为,不管他们去看了多少医生,专家们都只会处理他们各自所擅长领域的问题。“没有人愿意解决更大的问题,甚至没有人会告诉我们诊断的结果是什么。” 经历了这番波折之后,Alex开始接受物理治疗,他的物理理疗师认为,Alex可能患有一种名为基亚里畸形(Chiari malformation)的疾病。根据美国神经外科医生协会(AANS)的说法,这是一种先天性疾病,会导致颅骨与脊柱接口处的大脑出现异常。 得到这个结果后,Courtney开始对此进行研究,并拜访了更多的医生:一位新生儿科医生、一位儿科内科医生、一位成年内科医生和一位骨科医生,但结果仍令她非常失望——没有任何医生给她确切的诊断结果。 在三年的求医之路中,Courtney前前后后带着Alex看了17位不同的医生,但仍没有诊断结果可以解释Alex的症状。 事情的转折发生在今年早些时候。 精疲力竭且沮丧的Courtney注册了ChatGPT账号,并输入了三年求医所得的所有关于Alex症状的信息,希望能从人工智能那里找到诊断的结果。 “我一行一行地查看Alex的核磁共振记录中的所有内容,并将其输入ChatGPT。”Courtney说道。最终,Courtney得到了“脊髓栓系综合征”这个答案,并加入Facebook上一个患儿家长交流群。 最后,带着ChatGPT给出的诊断结果,Courtney拜访了一名新的神经外科医生,这位神外医生看了一眼MRI就给出了和ChatGPT一样的结论,并指出了栓系的具体位置。 “我们看了很多医生,甚至一度进了急诊室,我一直在努力。我有时整晚都在电脑前,浏览所有有用的信息。因此,当ChatGPT给出的建议诊断为脊髓栓系综合征时,这非常有意义。”Courtney在接受TODAY.com采访时说道。 AI医疗工具应通过类似药品审批的程序 《每日经济新闻》记者注意到,其实随着人工智能的发展,病人求助于AI医生早已不是什么新鲜事。 据美国全国公共广播电台(NPR)报道,埃默里大学医学院的四年级眼科住院医师Riley Lyons就表示,他经常发现病人在上门前就求助过“谷歌医生”这类AI医生。Lyons及两位眼科同事近期对人工智能聊天机器人ChatGPT在诊断眼部疾病方面的准确性进行了评估。今年6月,他们在健康科学预印本在线出版商medRxiv上发布报告称,ChatGPT与检查相同症状的人类医生相比表现相当好,而且比流行的健康网站WebMD上的症状检查器表现要好得多。 此外,尽管ChatGPT偶尔会给出完全的错误的答案,但埃默里大学的研究报告称,最新版本的ChatGPT在面对一组标准的眼部症状时,没有做出任何“严重不准确”的陈述。 不仅是ChatGPT,谷歌和DeepMind研究人员开发的医疗大模型Med-PaLM已经与现实中人类临床医生的水平相当——Med-PaLM仅5.9%的答案被评为可能导致“有害”结果,与临床医生生成的答案(5.7%)的结果相似。 浙商证券在研报中指出,ChatGPT等大模型在医疗终端的应用已经包含生成个性化的医疗报告、实现在线医疗咨询、实现自动医疗指导、审查医疗记录和提供个性化的医疗建议五大方面。 图片来源:浙商证券 NPR报道中称,生成式人工智能工具提供的医疗信息的准确性的确可能比简单从谷歌搜索有提高,但如何将这种新技术整合到医疗保健系统当中,并提供与历史上用于引入新药或医疗设备相同的保障措施,仍然存在很多问题。 如今,在医疗保健领域,各大公司也正致力于在放射学和医疗记录等领域部署生成式人工智能。 然而,对于许多医疗专业人士来说,聊天机器人会带来一系列麻烦,包括与隐私、安全、偏见、责任、透明度以及当前缺乏监管有关的问题。他们认为,基于人工智能的医疗工具应该经过类似于美国食药监局(FDA)药品审批制度的审批程序,但这还需要数年的时间。遗憾的是,目前还不清楚这种机制如何适用于ChatGPT这样的通用人工智能。 每日经济新闻
OpenAI更新文字生成图片模型并计划整合进ChatGPT 将在10月份开放
ChatGPT与论文

OpenAI更新文字生成图片模型并计划整合进ChatGPT 将在10月份开放

智通财经APP获悉,OpenAI周三在一篇博客文章中表示,该公司将发布其广受欢迎的图像创建工具Dall-E的新版本。 该公司写道,新工具“代表了我们生成图像能力的飞跃”。OpenAI还表示,该工具的最新版本将被称为Dall-E 3,将有更多的保护措施来防止有害内容的产生,该公司正在试验识别人工智能创建的内容的方法。 OpenAI去年公开发布“Dall-E2”后,人工智能生成图像的市场大幅增长,“Stable Diffusion”、“Midjourney”等竞争对手也获得了人气。与此同时,该软件也成为版权保护诉讼的主题,以及对错误信息的担忧。 OpenAI计划将其整合到ChatGPT聊天机器人中,用户可直接在ChatGPT中输入文本,或仅仅给出提示,让ChatGPT丰富文本,进而生成各种类型图片。 OpenAI表示,与ChatGPT的整合得以让更多的人加入AI艺术创作的队伍,使用者不必擅长给出提示词。 目前DALL•E 3仍在早期测试阶段,仅供少数用户使用,OpenAI计划在10月份首先通过API向ChatGPT Plus和企业版用户开放,随后在秋季提供给研究实验室,没有承诺何时发布免费的公开版本。
ChatGPT会改变生物医疗吗?虎嗅2023-02-10 09:31
ChatGPT与生物

ChatGPT会改变生物医疗吗?虎嗅2023-02-10 09:31

出品丨虎嗅科技组 作者丨苏北佛楼蜜 编辑丨陈伊凡 题图丨视觉中国 2022年12 月,两名计算生物学家Casey Greene和Milton Pividori开创了一项不同寻常的实验:他们请一名非科学家的助手帮助他们改进三篇研究论文。在一份生物学手稿中,助手甚至在引用方程式时发现了一个错误,审稿顺利完成且费用适中,每份文件不到0.50美元。 这名助手并非人类,而是一种名为GPT-3的人工智能算法。 “这将帮助我们提高研究人员的工作效率。” 科学家对此感到震惊。 如今,基于这一通用大模型算法诞生的产品ChatGPT,一经推出,就引发了现象级关注。一时间,全球科技巨头竞相宣布其将会把ChatGPT引入自己的业务。人们或惊叹狂欢,或居安思危,ChatGPT所承载的意义似乎就快超越它本身。在百花齐放的应用场景中,生物技术领域能如何搭上ChatGPT的快车? ChatGPT与生物技术的结合 2020年,人工智能公司OpenAI发布的一款模型,自发布初就被大肆宣传为生成式AI聊天机器人式工具,无论是创作散文、诗歌、计算机代码,还是编辑研究论文,似乎无所不能。 昨日,微软(Microsoft)公司表示,将把ChatGPT整合到搜索引擎Bing和网络浏览器中,谷歌(Google)公司也在今日展示了其名为Bard的人工智能对话系统。这些系统可以根据用户提供的复杂问题,提供全面而综合的回答,小到制定详细的旅行计划,大到分析公司的运营策略。 ChatGPT在生物技术上最有前景的应用似乎是在蛋白质生成和基因测序领域。 总部位于加利福尼亚的生物技术公司Profluent使用类似于ChatGPT的AI模型,创造了新型抗菌蛋白,并且已经证明它们能够在实验室中杀死细菌。 这一模型名称为ProGen,是一种大型语言模型 (LLM),它利用大量文本作为训练数据,开发分析和生成语言的能力——类似于ChatGPT,但 Progen的语言是蛋白质语言。 简单来说,就是使用 AI 和大型语言模型,例如为 ChatGPT 提供支持的语言模型,来学习生物学的基本语言,并设计具有治愈疾病潜力的新蛋白质。 目前,ProGen生成了一百万种不同的人工序列,研究人员从中挑选了 100种在实验室中合成,其中66种产生了类似于鸡蛋清溶菌酶的化学反应,用作阳性对照。 该团队随后选择了五种新型抗菌蛋白,并测试了它们对大肠杆菌的抵抗力。其中两种新蛋白质能够杀死细菌。 同时,X射线成像显示,尽管这些抗菌蛋白的氨基酸序列与任何已知的天然蛋白相差超过30%,但它们仍然折叠成与”天然表亲们”几乎相同的形状。 这项研究可能意味着,未来我们能通过与AI合作,创造本不属于自然界的蛋白质,并将这些蛋白质赋予不同的功能,人类成为了微观世界里的上帝。 攻克蛋白质后,ChatGPT似乎又开始朝着基因高歌猛进。 科技公司Nvidia在今年的JP摩根医疗健康大会称,随着新一代基因组测序速度的不断加快和成本的不断降低,目前我们测序基因组DNA的能力已经超越了分析DNA序列并从中获取洞见的能力。而更快速有效地处理海量的基因组序列信息离不开人工智能。 大型语言模型通过可以分析人类语言一样分析DNA序列,以此加快基因组的拼接、基因突变的发现,并且用人类对话的方式将发现表述给研究人员。 比如,整合ChatGPT的基因测序分析系统可能在处理患者的基因组测序数据后给出——“这名患者的某基因上的突变可能导致罕见遗传病A”的结论,它似乎代替了医生。 ChatGPT是万能的吗? 一切的发现和应用似乎都朝着好的方向前进。但面对似乎全能的工具,随之而来的是人类的反思和“批判”。它是万能的吗? 部分看客也跟着给出了自己的答案:不是。 首先,我们开始思考翻译和替代的准确率? 比如,目前大型语言系统的缺陷在于“提供信息的真实度有待提高”。由于ChatGPT基于对已有语言数据的学习提供回答,它的回答也受到数据库中不真实、有偏见、或者过时知识的影响。 这可能意味着对于专业性强的话题,如果大型语言系统没有经过足够专业数据的训练,很可能提供错误的回答。对于不了解专业知识的普通人来说,无法侦辨虚实。 此外,由于海量的数据训练是保证ChatGPT的基础,因此在数据的输入过程中,可能存在历史偏见等遗留问题,种族、性别、文化、年龄歧视等不良因素都会隐匿在其中。想要人工剔除是十分困难的事情,如何防止ChatGPT根据这些数据输出有害言论是需要解决的另一个挑战。 在Nature上发表的最新评论中,有研究人员指出,建立使用ChatGPT的规范和法规至关重要,才能确保这一技术被正当、透明、公平的使用。 开发者比评论人更清楚这其中隐藏的问题。去年9月,Google子公司DeepMind发表了一篇关于名为Sparrow的“对话代理”的论文4,该公司的首席执行官兼联合创始人 Demis Hassabis 表示,该论文将在今年以私人测试版的形式发布。谷歌的目标是开发甄别包括引用消息来源的能力在内的功能。...
云从科技发布从容大模型,与ChatGPT对比中考真题答题澎湃新闻2023-05-18 15:52
ChatGPT与地理

云从科技发布从容大模型,与ChatGPT对比中考真题答题澎湃新闻2023-05-18 15:52

·人工智能发展趋势中,首先突破的是人工智能的单点技术,2015年最重要的单点技术是人脸识别,但在单点技术解决需求的时代,市场空间相对有限。人工智能第二浪是多点技术闭环,探索用AI真正改变产业和生活,但每个场景海量研发,投入产出比不平衡。在AI的第三浪,内容和交互革命,实现流量重构,技术平台化、标准化,边际成本基本为0,这个时刻就是AI进入大模型时代,AI开始像人一样思考和工作。 从容大模型写作文。5月18日,人工智能平台公司云从科技(688327)在广州发布从容大模型,展示从容大模型的对话、编程、阅读、中考真题答题等基础能力。 从容大模型目前处于内测阶段,现场演示环节中,对话展示了中文作文写作、英文招领启事写作、中英文翻译等能力。长文档阅读可完成内容概括,根据书籍内容进行人机互动,展示跨模态能力。 从容大模型与ChatGPT答2022年广东省中考历史真题。 从容大模型与ChatGPT答2016年甘肃省兰州市中考地理真题。在中考客观题答题环节,针对2022年广东省中考历史真题、2022年四川省德阳市中考生物真题、2016年甘肃省兰州市中考地理真题,从容大模型与ChatGPT同时答题,对比答题速度和正确率。演示结果显示,从容大模型答题速度相对更快,错误率相对较高。对300道题目的答题结果显示,云从从容大模型正确率71%,ChatGPT正确率73.34%,GPT4.0正确率86.34%。云从科技创始人周曦表示,目前GPT4.0的水平明显高于其他大模型,云从科技在大模型方面要走的路还很长,值得学习的内容很多。 从容大模型、ChatGPT、GPT4.0答题正确率。“没有强大的基础大模型,直接去做行业大模型不具有长期持续的生命力。”周曦表示。基于从容基础大模型,云从科技与政务、制造、金融、游戏等领域协作构建行业大模型。在数字政府领域,从容大模型的基层治理场景应用包括面向民众服务的一语智办、面向应用开发者的编程助手、面向城运治理中心的融合指挥、面向网格队伍的智治精灵。例如城运指挥大屏AI精灵,通过智慧蓉城天府新区运行中心演示了城市游玩建议等能力。 在智能制造领域,利用大模型构建智能维修伴随系统,推进维修计划科学合理。维修前对设备精准判断,根据图文视频、此前的维修要点等预习;维修过程中完成监管督导,判断维修是否存在遗漏;维修工单关闭后进行维修检测记录,包括生成图文视频维修记录、复盘本次维修,为下次维修提供支持。目前云从科技与中国检验认证(集团)有限公司共建数字质量大模型。 在智慧金融领域,云从科技表示,从容大模型将银行海量数据资源转化为有价值的信息,突破专业知识供给瓶颈,提升银行在普惠金融、银行运营能力、服务实体经济方面的能力。比如在支持普惠金融方面,大模型是入口,简约化智慧网点、线上APP等渠道;数智营销对理财等产品的营销活动和内容实现个性化触达;智能客服可问答、完成业务,满足合规要求。 在C端业务方面,大麦数字人直播平台探索一站式自助直播解决方案,设置互动问答库应对粉丝提问,主播可挑选话术风格。 云从科技创始人周曦谈AI发展趋势。“大约10年前,深度学习的突破带来了人工智能的突破。2016年,围棋人工智能程序AlphaGo战胜围棋世界冠军李世石,全世界掀起新的AI热潮。”周曦表示,人工智能的发展趋势中,首先突破的是人工智能的单点技术,比如2015年最重要的单点技术是人脸识别,百家争鸣不断竞争形成了“AI四小龙”(商汤科技、云从科技、旷视科技、依图科技),但在单点技术解决需求的时代,市场空间相对有限。人工智能第二浪是多点技术闭环,解决更多需求,探索用AI真正改变产业和生活。但带来的问题是不够标准化,每个场景需要海量研发,导致AI公司大量投入,但投入产出比不平衡。 在AI的第三浪,内容和交互革命,实现流量重构,“技术平台化、标准化,边际成本基本为0。一个统一的核心技术底座大平台能够快速改变海量场景和海量应用,原有的场景和产业的内容、交互方式会全面变革。”周曦表示,这个时刻就是AI进入大模型时代,AI开始像人一样思考和工作,大模型时代的交互方式总体有问答、伴随和托管三种类型,内容变革上带来了生成式AI。“像人一样思考和工作的AI,真正做到知行合一,总体来讲有三个关键步骤:一是物理世界数字化,真正把物理世界和数字世界打通。二是知识找人,知识能够精准为每个人在合适时间服务。三是能陪伴执行,不能只是纸上谈兵的系统,而是能够方便快捷地为人类提供最好的服务。”他表示,因此首先要构造一个像人一样思考和工作的操作系统,而从容大模型是操作系统能力板块的重要一环。 (本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP) 举报/反馈

ChatGPT与英语

午报 | 快递公司集体下调价格;ChatGPT更新将支持图片和语音输入;余承东称问界M9将是1000万内最好SUV
ChatGPT与英语

午报 | 快递公司集体下调价格;ChatGPT更新将支持图片和语音输入;余承东称问界M9将是1000万内最好SUV

导语:今日举办的菜鸟全球五日达发布会上,菜鸟集团副总裁 、国际快递事业部总经理丁宏伟宣布菜鸟全球五日达服务已经正式上线,这是电商行业首个规模化落地的跨境电商快线产品,接下来会在英国、西班牙、荷兰、比利时、韩国5个亚欧国家全量上线。 苹果印度工厂发生火灾,生产出现中断 苹果供应商和硕周一在印度泰米尔纳德邦金奈工厂发生火灾后,暂时停止了 iPhone的组装工作。 自2017年开始在印度组装 iPhone 以来,苹果公司一直着眼于在印度建立大型制造基地。 苹果在印度的产品目前主要通过与富士康、纬创和和硕等公司合同生产。它共有14家供应商在印度设有工厂。 :-0 在印度发生什么都不奇怪。 菜鸟全球五日达正式上线 9月26日上午消息,今日举办的菜鸟全球五日达发布会上,菜鸟集团副总裁 、国际快递事业部总经理丁宏伟宣布菜鸟全球五日达服务已经正式上线,这是电商行业首个规模化落地的跨境电商快线产品,接下来会在英国、西班牙、荷兰、比利时、韩国5个亚欧国家全量上线。丁宏伟指出,随着过去这么多年全球贸易的发展,除了B2B外,最近这些年跨境电商在中国的发展,也正在向着B2C方向发展,进入更好的性价比、更快速送达更高质量商品的2.0新时代。 :-0 厉害了。 ChatGPT更新将支持图片和语音输入 近日,OpenAI 宣布推出新版 ChatGPT,增加了两项新功能:语音输入和图像输入。据 OpenAI 称,新功能将在未来两周内向 ChatGPT Plus 订阅用户推出,其他人也将“很快”能够使用这些功能。 语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT 就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。 图像输入功能则类似于 Google Lens,用户可以拍摄自己感兴趣的事物,并上传到 ChatGPT 中。ChatGPT 会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。ChatGPT 的优势在于它可以进行多轮对话,而不是一次性搜索。如果用户对答案不满意或想要更多信息,可以继续向 ChatGPT 提问,从而得到更准确和全面的答案。 :-0 更新很快。 余承东称问界M9将是1000万内最好SUV 在今日的华为秋季全场景新品发布会上,华为常务董事、终端BG CEO、智能汽车解决方案BU董事长余承东发表演讲。余承东表示,问界新M7发布以来,日均订单1500+,目前大定已超2万台。他透露,问界M9将在12月发布,“将是1000万以内最强大的SUV,马路上能看到的最好的SUV。” :-0 好大的口气。 快递公司集体下调价格 因为价格战仍然是抢占市场最有效的武器。快递公司们还在重复采取着低价换取市场的手段。除了卷价格,各大快递公司同时也在卷服务,想尽办法提升用户的消费体验,而顺丰、菜鸟、京东物流等玩家都在时效和服务等方面下功夫。行业“老二”韵达掉队,“新入局者”的极兔让快递行业的变化更加迅速。在电商平台流量红利见顶的当下,快递寻求新增量也很困难,接下来价格战或许仍是行业常态。 :-0...
ChatGPT+AIGC+Web3.0,英文三剑客还在继续!
ChatGPT与英语

ChatGPT+AIGC+Web3.0,英文三剑客还在继续!

ChatGPT+AIGC+Web3.0: 昨天复盘后,ChatGPT相关公司,纷纷出来公告,内容基本一个模子出来的,这样的批量公告肯定会影响ChatGPT题材的炒作,由于积累了大量的人气,板块中的很多个股低开,反而给了资金再次抄底(做T)的机会,板块继续走强。 ChatGPT:ChatGPT是由美国公司OpenAI开发的一个人工智能聊天机器人程序; AIGC:人工智能+绘图(合成媒体),即人工智能创作内容; Web3.0:最早由以太坊联合创始人Gavin Wood于2014年提出,是区块链发展的必然产物,是互联网的再一次变革升级,同时是支撑元宇宙世界的基础。 三大新型题材,代表了全球科技发展方向,其中就是智能化、科技化。三者关系密不可分,比如ChatGPT+AIGC,只有在Web3.0新型的互联网形态中才能得以进行。而元宇宙这种虚拟世界和现实世界之间的联系少不了ChatGPT+AIGC+Web3.0的协作。 从指数来看,AIGC+Web3.0更具代表性,跳空之后走了7个交易日,7连阳,跳空之前,还有三连阳,也就是说板块炒作已经10个交易日了,强度其实已经得到了市场的认可。 而ChatGPT是新题材,同花顺有ChatGPT指数总共是6个日K,6天就指数而言已经大涨了近40%,指数如此,板块内个股可以想象涨幅有多大。 ChatGPT+AIGC+Web3.0三大板块还有一个共同点:300+688开头的股票很多。也就是说三大板块所涵盖的创业板、科创板个股非常多,因为,本来他们就属于科技板块。这也导致了,近期市场最具赚钱方向的是20cm,连续拔高,非常暴利。 ChatGPT+AIGC+Web3.0昨天”北京“助攻,即北京市推进“数据特区”建设;像科大国创、铜牛信息等借势涨停,今天盘后,据SimilarWeb数据显示,OpenAI网站访问量快速攀升,目前已跻身全球TOP50网站。今年1月,OpenAI网站访问量突破6.72亿,较11月增长3572%。该网站2022年11月全月访问量为1830万,主要访问人群来自技术社区。 A股炒作向来重势,和内容无关,OpenAI为国外技术公司,国内有多少公司和OpenAI有业务往来?我想应该没有,否则一定被挖出来炒上天了。但即便没有合作,没有内容,但不影响炒作,在三大板块没退潮之前,也不用担心结束,胆子小点的可以做补涨不是? 说说重点,如何选股? 本轮的核心是ChatGPT它,其次略强的是AIGC它,最后是Web3.0,这也遵循了A股市场永远是喜新厌旧。 所以,选股可以这样的思路去考虑: 第一,主选ChatGPT; 第二,选择ChatGPT+AIGC+Web3.0叠加的个股; 第三, 选汉王科技具备的题材属性; 第四,ChatGPT+AIGC+Web3.0中,选择300创业板和688科创板; 第五, 选择主升,量能(10亿+)释放的股。 如此选股,基本能找到你想要的股票,不需要接力,直接低吸进去持股即可。
行业报告 | 关于天津外国语大学高级翻译学院师生使用ChatGPT等AIGC技术工具情况的调研报告
ChatGPT与英语

行业报告 | 关于天津外国语大学高级翻译学院师生使用ChatGPT等AIGC技术工具情况的调研报告

为更好适应新形势新技术对翻译教学的新要求,天津外国语大学高级翻译学院组织开展了本次调研,以期为推动新技术与翻译实践和教学的融合发展提供借鉴。 一、研究背景 2022年11月,ChatGPT横空出世。一夜之间,ChatGPT等AIGC技术工具成为最闪耀的明星,短短数周,便在全球范围内掀起应用和研究的滔天巨浪。 本次调研旨在了解天津外国语大学高级翻译学院师生对ChatGPT等AIGC技术工具的使用情况,包括学习渠道、应用感受等,以便在教学科研等环节更加重视并跟踪AIGC技术工具的发展态势,进一步推动学科建设。 二、调研方式和内容 为确保本次调研工作顺利进行,天津外国语大学高级翻译学院特组建调研小组,成员包括学院党委书记、副书记、团委书记、专任教师、组织员和教学秘书等。 1 调研方式 本次调研采取师生访谈、问卷调查等形式开展。调查问卷首先进行师生访谈,根据访谈情况设计调研问卷,并面向天津外国语大学高级翻译学院师生发放。经统计,共有263名师生反馈有效问卷,其中教职工17名,学生246名。 2 调研内容 本次调研内容主要包括以下三方面:师生对翻译技术工具的了解与使用情况;AIGC技术工具对翻译实践、学习和科研等的影响;师生对AIGC技术工具风险的了解情况和看法。 三、调研结果 1 师生对翻译技术工具的了解与使用情况 根据调研结果,95.06%的受访者在翻译专业学习和工作实践中使用过在线机器翻译平台或工具。其中,使用最广泛的是谷歌翻译(68.44%)、有道翻译(60.46%)和百度翻译(46.01%)。 在ChatGPT等AIGC技术工具的使用方面,75.67%的受访者是经网络、同事或同学介绍后才了解或使用此类工具。36.5%的受访者在翻译学习、教学和研究中使用过AIGC技术工具。其中,使用最广泛的AIGC技术工具是ChatGPT(90.49%),紧随其后的有文心一言、讯飞星火等。 2 AIGC技术工具对翻译实践、学习和科研等的影响 (1)正面影响 根据调研结果,受访者认为ChatGPT等AIGC技术工具在文化知识传播上具有积极作用,主要表现在创新文化知识传播形式(75.67%)、创新文化知识学习形式(74.9%)、创新文化知识来源(65.02%)、创新文化知识载体(57.41%)以及智能技术与文化知识融合(64.64%)等方面。 受访者认为,ChatGPT等AIGC技术工具对翻译行业的影响主要体现在:学习方式(71.86%)、研究方式(46.77%)、翻译市场运行方式(49.05%)、翻译成果呈现方式(49.05%)、语料库和术语库建设(53.23%)等方面。 AIGC技术工具会为翻译行业带来巨大变化,主要体现在降低翻译行业从业门槛(66.92%)、降低多语言交流成本(67.68%)、提供语料和术语新来源(57.79%)、丰富文化交流形式(45.25%)等。 85.17%的受访者认为AIGC技术工具在翻译实践中具有一定应用价值,主要包括:译文润色和持续优化(73.76%)、语料术语提取匹配(72.24%)、结合上下文信息生成译文(60.84%)等。 在翻译学习方面,95.06%的受访者认为ChatGPT等AIGC技术工具可以为翻译学习者提供更便捷的学习方式,主要体现在优化翻译实践(73.76%)、提供多样化翻译工具(67.68%)、提升翻译学习效率(64.26%)等。受访学生认为,使用AIGC技术工具主要有以下积极作用:提升翻译专业学生外语文字表达能力(70.72%)、提高语料库和术语库的学习运用能力(79.09%)、提升外语逻辑思维(55.13%)、增强外国文化的学习与应用(50.75%)等。 受访教师认为,AIGC技术工具对翻译教学和研究的积极作用有:人工智能成为翻译研究新领域(74.52%)、为翻译语料库提供新来源(70.34%)、为翻译术语库提供新来源(55.89%)、促进翻译研究知识与技能重组(45.63%)、提供辅助科研工具(52.47%)、提供教学新路径(52.47%)等。 (2)负面影响 根据调研结果,AIGC技术工具在翻译教学与学习方面造成的负面影响主要有: 在翻译教学方面,使用AIGC技术工具会对评价学生真实能力造成干扰(80.99%)、对评价学生作业论文等造成干扰(74.52%)、对教学互动中的学生反馈造成干扰(63.12%)、使教师对技术的依赖增强(63.12%)等。 在翻译学习方面,使用AIGC技术工具会导致学生记忆能力训练衰减(60.84%)、语言文字意境自主体验减少(77.95%)、思维原创训练减少(74.52%)、思维联想能力衰减(68.06%)等。 3 师生对AIGC技术工具风险的了解情况和看法 调研结果显示,87.45%的受访者认为使用ChatGPT等AIGC技术工具存在一定风险,会引发个人科研成果数据泄露(82.51%)、个人信息和隐私泄露(78.33%)等安全问题。 74.9%的受访者认为在翻译学习和研究中应限制ChatGPT等AIGC技术工具的使用。80.99%的受访者认为要加强对学术道德和诚信的监督管理,72.62%的受访者认为要限制基础翻译训练中的技术使用,避免产生安全、伦理、学术道德等方面的问题。 82.51%的受访者认为有必要对使用ChatGPT等AIGC技术工具的人员进行职业道德(77.19%)、社会公序良俗(57.41%)等方面的伦理监管;同时,有必要通过国家法律法规(82.51%)、职业资格认证(61.98%)、教育管理(48.67%)、技术管理(45.67%)等途径对其进行约束和评估。 四、对策建议 AIGC技术工具是新一代技术革命的产物,对人类语言文化习得、社会交流的影响既依赖于人类社会、又独立于人类思维,是科学技术改进社会生产方式、学习方式和生活方式的新进展。AIGC技术工具的诞生使得翻译工作逐步摆脱了个体知识积累、技能、地域、健康、情绪等多方面束缚,有了不依赖于人类思维而独立存在的可能性,催生了新的翻译业态,预示着现代翻译专业育人模式和相关教学理论的重组重构,为翻译实践和教学带来了巨大挑战,其长远影响有待于进一步观察和深入分析。根据调研结果,针对AIGC技术工具在翻译实践和教学中的应用,本文主要提出以下对策建议: 1 充分重视并积极拥抱AIGC技术工具 AIGC技术是人类科学技术进步的重要产物,其发展不受个人或行业好恶的影响。翻译学习者和从业者需要充分认识此项技术对翻译行业的巨大推动作用。 2 抓住AIGC技术工具为翻译行业带来的机遇 将ChatGPT与人工翻译相结合,提高翻译效率和质量,探索开发更智能的翻译工具和服务。同时,进一步拓展翻译研究领域,通过分析AIGC技术工具的翻译过程和结果,探讨翻译技术的发展趋势和应用前景。 3 准备好迎接AIGC技术工具带来的挑战 学生要主动开展相关知识与技能的学习和训练;教师要将相关内容列入课堂教学和科研内容,主动学习使用相关技术,了解其最新进展,特别要支持国产技术工具的应用和推广。高校也要相应地修订教学大纲和培养方案,确保翻译专业学生了解掌握新技术,跟上技术发展节奏。...
原创
            如何用ChatGPT修改你的英语写作?快速自学外语
ChatGPT与英语

原创 如何用ChatGPT修改你的英语写作?快速自学外语

原标题:如何用ChatGPT修改你的英语写作?快速自学外语 10多年前想提高外语写作的学生不得不找别人来修改自己所写的作文。在最近五年多,随着翻译软件不断的改进,不想花钱找老师来修改的学生,也可以用类似DeepL的软件。 如今,多亏人工智能的出现,我们可以更方便地得到免费的写作修改。最有名的依靠AI修改英语写作的软件好像是Grammarly。但是每当我把英语学生的写作上传到Grammarly时,它一直忽略好多错误,反而是对没有错误的地方提出没必要的修改。 另外一个受欢迎的是Hemingway,但是那个网站不怎么修改错误,而是找出没必要用的单词,让写作更加简洁。 我到目前为止遇到的最有用就是ChatGPT 4。我给它以下的提示:Please identify and list any mistakes or unclear expressions in this essay written by a/an (目的语言) student. (请识别并列出(目的语言)学生在这篇小哥中的任何错误或不清楚的表达。) 我上传我之前修改过的英语学生的作文时,它通常可以找出其中70%-90%的错误。 在找错误方面,虽然ChatGPT还没有做到跟母语老师一样好,但是很接近,很明显,它也方便和便宜很多。它跟老师相比的优点是:它可以用双语给出很详细的解释。可以解释为什么原来写的句子不对,修改的句子为什么正确。解释太复杂的话,你也可以要求它简化,也可以提供无数的例句。 我打算在我的外语写作学习中利用ChatGPT和其它AI工具。以后我会用人工智能修改我大部分的外语作文。但在准备外语考试前的一两个月,我很可能还是会找母语人来修改。 在以前拍的这个视频,我有详细展示作为英语母语人是如何思考一句句修改学生的英文作文。 视频加载中… 如果我在准备外语写作,我最初很可能会遵循这样的过程: 手写作文。在写的时候,每当写出自己不确定是否正确的语句时都划下划线。如果有完全表达不了的,需要表达的概念的话,我会空一格然后在笔记本的对面一页用母语记录我在那里想表达的意思。 写完以后再打字重新写,也许会用语音转文本的软件用口语打字。在打字写的过程中,我会用翻译软件,词典,AI工具和youglish检查原本不知道是否对的语句的语法,用词,词语搭配,而且也会用同样的工具找我原先无法用外语表达的概念的正确表达方式。 把打出来的作文贴到类似DeepL这类网上翻译工具,用它们翻译成自己的母语。有时候,稍微错写一个单词就会完全改变句子的意思。这样做可以保证我写的每句话都的确表达了我想表达的意思。 把作文上传到文字转语音软件听一遍。有时候,在听自己写的作文时,我们更容易找出写错或听起来奇怪的语句。 把作文跟以下这个提示一起贴到ChatGPT (Please identify and list any mistakes or unclear expressions in this essay...
aigc行业是什么(AIGC和ChatGPT区别)
ChatGPT与英语

aigc行业是什么(AIGC和ChatGPT区别)

亲爱的Stable Diffusion中文网的用户们,你们好。今天我们想要给大家解释一下AIGC行业以及它与ChatGPT之间的区别。 AIGC行业是什么 首先,我们需要明确一下AIGC的含义。AIGC是Artificial Intelligence Generated Content的缩写,中文意思是“人工智能生成内容”。AIGC行业指的就是利用人工智能技术生成各种内容的行业,这些内容可以包括文本、图像、音频、视频等。 在AIGC行业中,人工智能模型通常会根据给定的输入(例如一段文本、一张图片等),生成相应的输出。这个过程可以是完全自动的,也可以由人类进行一定的引导和控制。 ChatGPT与AIGC的区别 ChatGPT和AIGC都是人工智能技术的应用,但它们的关注点和使用场景有所不同。 ChatGPT是OpenAI开发的一款语言模型,它的主要功能是生成人类语言。用户可以输入一段文本,ChatGPT会根据这段文本生成相应的回复。因此,ChatGPT主要用于对话系统、自动写作、内容生成等领域。 而AIGC则更加广泛,它不仅包括文本生成,还包括图像生成、音频生成、视频生成等。比如,我们之前提到的Stable Diffusion就是一款AIGC模型,它可以根据用户输入的文本生成相应的图像。 总的来说,ChatGPT是AIGC的一部分,它是用于生成文本的AIGC模型。而AIGC则包括了所有利用人工智能技术生成内容的应用,包括但不限于文本生成。 希望以上的解释能够帮助你更好地理解AIGC行业以及ChatGPT和AIGC的区别。如果你有更多的问题,欢迎随时向我们提问,我们将竭诚为您服务。
ChatGPT | AI外语写作助手,助力高效写作
ChatGPT与英语

ChatGPT | AI外语写作助手,助力高效写作

原标题:ChatGPT | AI外语写作助手,助力高效写作 导语 在日常学习中,我们通常会遇到书写留学文书,完成外语作业,或者应对外语考试等场景。流畅且正确的外语表达,难倒了不少学生。因此,本文介绍法语AI写作助手的使用方法,并且附带其他AI外语写作助手的网址,供读者尝试。 使用方法介绍 第一步,打开相应的网址,并且完成注册,点击立即体验或开始使用。网址为:https://ai.frdic.com/ 第二步,选择最近使用项,点击新建空白文档。 第三步,输入文本。例如,输入:Jaime la vie de campagne.(我爱乡村生活)。随后,AI法语写作助手会提供一些修改建议,单击后会出现解释。该功能可以检查中句子的结构、单词拼写、阴阳性等语法错误。 第四步,可以按照自己的要求选择功能,包括扩写、润色、翻译、概括、生成文章。 第五步,选择功能,例如点击生成文章,设置参数。 生成的文本如下: Jaime la vie de campagne. Chaque matin, je me réveille au chant des oiseaux et je respire lair frais. Je suis entouré de vastes champs verdoyants et darbres majestueux. Les...

ChatGPT与论文

ChatGPT在会计考试中不如人类?但AI会替代工具人
ChatGPT与论文

ChatGPT在会计考试中不如人类?但AI会替代工具人

最近,#ChatGPT在会计考试中不如人类#的一则消息登顶热搜。 事件经过 在美国杨百翰大学领导的一项研究,科学家们组织了一场竞争会计考试,参与者包括杨百翰大学本科生和ChatGPT。 结果显示,尽管ChatGPT的表现令人印象深刻,但学生的表现更为出色。学生总体的平均得分为76.7,而ChatGPT的得分仅为47.4。特别是在简答题和高阶问题方面ChatGPT表现不佳。 好多人为之雀跃:人工智能哪里能赶上人类? 但是提及ChatGPT 人们最关心的话题之一还是: 我的工作会不会被AI取代? 从最初的聊天机器人,到秒出图的AI绘画应用,再到各类AI专业小模型产品的研发,大批内容生产从业者都在面临人工智能带来的“替代”挑战。 “未来全球平均18%的工作岗位或可由AI自动化完成,约有3亿个全职岗位或将受AI影响。”高盛研究部最新报告预测,现有的劳动力市场或许会重新洗牌。 但人类的自信也从来不会轻易消失。“AI可以工作,但没有我会舔老板”⋯⋯在社交媒体的段子之外,不少受访者普遍认为,AI替代的不是简单的某个行业,而是不会使用AI的从业者,“从来不是AI替代人,而是会使用AI的人替代不会使用AI的人。” “AI可以替代所有60分以下的新手” 去年年底,聊天机器人模型 ChatGPT和AI绘画软件陆续上线,“那时GPT生成的文字还是东拼西凑的,毫无逻辑。 从胡说八道“进化”到逻辑自洽,ChatGPT只用了三个半月。学习速度惊人的还有各类AI绘画软件,两个月前它们还无法准确地生成“目标”图片,比如“画出”的猫可能有五个爪子、两条尾巴,而现在不但能高水平文字转图像(Text2Image),还能按照样图模仿(image2image)。 面临失业风险的游戏公司原画师们用过AI绘画后的感受是,如果给美术顶级大佬打99分,那么AI可以替代掉所有60分以下未达到入行标准的新手。 新一代人工智能还会颠覆哪些行业? 泥水匠比律师“活得更久”? 3月25日举办的中国发展高层论坛上,就“人工智能引领新产业革命”话题,启明创投创始主管合伙人邝子平分享,“搜索行业,游戏、小说、剧本等内容生成行业,教育行业等都将发生根本性改变。” 应用AI技术冲击下,泥水匠比会律师“活得更久”吗?半个多月前,ChatGPT开发主体OpenAI联合宾夕法尼亚大学发布了一篇研究报告,预测约80%的美国劳动力至少有10%的工作会受到GPT的影响。研究人员认为,拥有高收入工作或者具有高等教育和专业学位的人,更容易“暴露”在GPT技术之下。这篇引发争议的论文发表在预印本平台arXiv上,并未经过同行评审。 “相比于具体数字多少,更值得关注的是AI替代人力的大趋势。”中国人民大学劳动人事学院副教授周广肃分析说,从前讨论AI替代作用,更多是替代一些重复性、有规律、低人力资本的劳动,而ChatGPT诞生后,人们惊讶地发现,AI还能替代非重复性、具有一定程度创造性的脑力劳动,高人力资本从业者似乎也难逃被替代的命运,因而引发了较为广泛的担忧。 “AI让每个使用者成为全能战士” 4月初,国家地理中文网发布了一组“樱花季”大片。有读者“看着红烧排骨的图片”评论说“都能感觉到焦糊糊的甜酱了”,但没想到图片全是AI画的,自然光影和人物表情就像现场抓拍的一样逼真。实际上,这19张“照片”的制作只用了一个晚上,是画师和AI绘画应用共同完成的。 就像钢铁侠胸前的方舟反应炉,AI让每个使用者都像全能战士一样,身兼多职,极大地解放个人生产力,提高工作效率。 一个终极畅想是:在AI的辅助下,未来可以一个人完成一部独立电影,没有其他人员参与,不必混杂过多商业因素,从而最大程度地保留创作者意图。 短期来看,教人如何使用AI或许会成为一个热门工作。 另一方面,任何一个行业的资深人士都是从助理一类工作开始做起的,当AI替代了大量基础工作后,未来人力培养机制一定也会面临改变,只是技术发展太快,谁也无法准确描绘出行业未来的样子。可以确定的是,AI时代已经到来,新的人机交互方式正在出现,使用AI将成为个人必备技能,就像互联网诞生后人们要学习办公软件一样。 催生世界级企业,改变国家竞争力 “人工智能的发展与微处理器、个人电脑、互联网和手机的发明一样重要。 它将改变人们工作、学习、旅行、获得医疗保健以及相互交流的方式。整个行业将围绕它重新定位。企业将通过使用它的程度来区分自己。”比尔·盖茨在最新发布的长文中表示,人工智能时代已经开启。 很多人将AI技术引领的产业变革称为“第四次工业革命”,“ChatGPT出来以后,可以当之无愧地说人工智能是新产业革命的引领技术。”清华大学苏世民书院院长薛澜此前在中国发展高层论坛分享说。 人工智能是未来科技创新的主航道,也是将催生世界级企业的沃土,这是当前大部分科技人士的共识。OpenAI CEO山姆·阿尔特曼曾预测,AI大模型技术,将成为继移动互联网之后,未来最大的技术平台;而以聊天机器人为界面,加上图像、音乐、文本等多模态模型的发展,将诞生世界级大型企业。 “不管你愿不愿意,GPT都将引领一场新的工业革命,意义超越互联网和iPhone的发明。它将带来生产力的大幅提升,进而提升国家竞争力。中国一定要迎头赶上。”360集团董事长周鸿祎表示。 近年来,我国在人工智能领域取得了不少进步,如人脸识别、语音识别、移动支付、游戏技术集群等垂直领域,在实际应用方面也已经逐步成熟,以华为、腾讯、阿里为代表的中国科技企业逐步具备和美国巨头竞争的能力。但ChatGPT等的出现,一夜之间,让中美数字经济的差距又引发讨论。 “人类社会经历这么多年的发展,技术进步是重要的推动力,人类社会从中受益无穷,我想人工智能也是一样。”薛澜说,在以乐观态度拥抱ChatGPT的同时,更要坚持两个轮子同步推进,一个是发展的轮子,一个是规制的轮子,争取在发展中不断引导、推动人工智能技术的健康发展。 或许正如罗翔老师所说:“ChatGPT永远无法帮你回答当你老婆和你妈妈一起掉到河里,应该先救谁的问题。” 人工智能无法实现价值判断,“我们应该积极拥抱它、利用它,而不是担心被它取代。” END 来源:中国新闻周刊、南方新闻网 编辑:于晋 审核:顾镔彬 发布:于晋
ChatGPT再迎重磅升级:可以“联网”了,不再局限于旧数据【附AIGC行业发展分析】
ChatGPT与论文

ChatGPT再迎重磅升级:可以“联网”了,不再局限于旧数据【附AIGC行业发展分析】

图片来源:摄图网 近日,人工智能初创公司OpenAI 今日在其 X 账号宣布,其生成式人工智能聊天机器人ChatGPT现在可以通过微软的必应搜索引擎浏览互联网,为用户提供最新的权威信息并提供直接来源链接,而不再局限于2021年9月之前的数据。 Open AI官方表示:“现在ChatGPT Plus和Enterprise(企业版) 用户可以使用浏览功能,将很快扩展到所有用户。要启用,请在GPT-4下的选择器中选择‘使用必应浏览’( Browse with Bing)。” 近年来,随着科技和人工智能不断发展,以ChatGPT为代表的生成式AI成为热门话题。ChatGPT是一种基于深度学习的语言模型,具有自主生成对话的能力,能够模拟人类对话,并提供有趣、有用的回答。它在社交媒体、客户服务和虚拟助手等领域展现了巨大潜力。生成式AI的兴起引起了广泛关注,同时也带来了一些挑战,如信息准确性、伦理问题和数据隐私等。 ——生成式AI训练大模型汇总情况 超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。 ——AIGC在各行业渗透度分析 目前,随着数字经济与实体经济融合程度不断加深,以及互联网平台的数字化场景向元宇宙转型,人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为当前新型的内容生产方式,已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。与此同时,在推动数实结合、加快产业升级的进程中,金融、医疗、制造、工业等各行各业的AIGC应用也都在快速发展。 据IDC,2022年中国人工智能行业应用渗透度排名前五的行业依次为互联网、金融、政府、电信和制造。另外,AI为自动驾驶、交通物流所赋予的价值也不容忽视,据预计,AI为交通领域创造3800亿元的经济价值。 ——AIGC行业投融资规模分析 根据IT橘子数据。2016-2022年我国AIGC行业投融资规模及整体数量整体波动变化。2021年行业内共发生投资时间共866起,投资金额总计2125.63亿元,为近年内最高。2022年我国AIGC行业共发生526起投资事件,投资金额达939.77元。 据全球领先咨询公司麦肯锡预测,未来几年,生成式AI将给全球经济带来7万亿美元的价值,其中中国将贡献2万亿。2022年底ChatGPT的问世,更使数字人在大语言模型技术的加持下,拥有了“灵魂”,AI数字人产业迎来了发展“黄金期”。
教育日报|国家统计局:目前大学毕业生就业状况总体稳定;科大讯飞刘庆峰:星火V2.0代码写作能力已高度逼近ChatGPT经济观察报2023-08-15 17:48经济观察报2023-08-15 17:48
ChatGPT与论文

教育日报|国家统计局:目前大学毕业生就业状况总体稳定;科大讯飞刘庆峰:星火V2.0代码写作能力已高度逼近ChatGPT经济观察报2023-08-15 17:48经济观察报2023-08-15 17:48

【教育头条】 国家统计局:目前大学毕业生就业状况总体稳定 8月15日,国家统计局新闻发言人、国民经济综合统计司司长付凌晖在国新办发布会上表示,从教育部门了解的情况看,目前大部分毕业生已经落实就业去向,大学毕业生就业状况总体稳定,去向落实率和落实人数与去年同期相比均略有提升。针对目前尚未落实去向的大学毕业生,各地区各部门正在积极想办法,帮助他们尽早走上工作岗位。下阶段,随着就业帮扶政策效果显现,大学毕业生就业状况将继续改善。 邱建军任赣南科技学院党委书记 8月15日上午,赣南科技学院召开领导干部大会,江西省委组织部副部长、省人大常委会选任联工委主任刘光华同志出席会议,宣布省委关于赣南科技学院主要负责同志任职的决定,邱建军同志任赣南科技学院党委书记。(江西组工微讯微信公众号) 社交平台推荐港中大可免费过夜?校方澄清 据香港“点新闻”报道,近日有人在社交平台小红书推出攻略,推介香港不同“免费住宿”地点,其中提到香港中文大学,指出校园有部分地方可以过夜。香港中文大学8月14日澄清有关传言及报道与事实不符。校方称,校园对外开放时间为早上9时至晚上9时,所有访客不得在非开放时间逗留校园,违反相关规定访客会被驱离校园,如有需要,校方会报警处理。(中新网) 【公司动态】 科大讯飞刘庆峰:星火V2.0基于Python和C 进行代码写作能力已高度逼近ChatGPT 8月15日,科大讯飞召开“解放生产力,释放想象力”讯飞星火认知大模型V2.0升级发布会。发布会上,科大讯飞宣布联合华为推出讯飞星火一体机,开始布局大模型算力。据科大讯飞董事长刘庆峰介绍,讯飞星火V2.0代码能力实现大幅度提升,从业界参考测试集上的效果对比来看,星火V2.0基于Python和C 进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。(第一财经) 陕西金叶:股东重庆金嘉兴累计减持股份1110万股 8月15日,陕西金叶发布公告。8月13日,公司收到股东重庆金嘉兴向公司出具的《关于减持计划实施进展的告知函》,获悉其减持计划已到期。截至2023年8月13日,重庆金嘉兴在上述减持计划内累计减持公司股份11,104,400股,占公司总股本的1.44%。减持后,重庆金嘉兴持股比例由4.998%下降至3.55%。 美吉姆:赵金才当选监事会主席 8月15日,美吉姆发布公告,8月14日,公司召开2023年第三次临时股东大会、第六届监事会第十一次会议,分别通过了《关于补选股东代表监事的议案》、《关于选举公司第六届监事会主席的议案》,同意赵金才当选为公司第六届监事会股东代表监事、第六届监事会主席,任期至第六届监事会届满之日止。 实习记者 许潇雨 整理 举报/反馈
ChatGPT再度“上新”!云计算ETF(159890)、软件龙头ETF(159899)双双大涨,科大讯飞、金山办公涨超4%
ChatGPT与论文

ChatGPT再度“上新”!云计算ETF(159890)、软件龙头ETF(159899)双双大涨,科大讯飞、金山办公涨超4%

9月26日,AI板块卷土重来,传媒、计算机领涨。截至10时52分,科大讯飞、金山办公涨超4%,云计算ETF(159890)、软件龙头ETF(159899)盘中一度分别涨3.09%、2.68%。 消息面,昨夜,OpenAI宣布,将在ChatGPT推出新的语音和图像功能,新功能将于未来两周内面向Plus和企业用户推出。据介绍,新功能允许用户进行语音对话或向ChatGPT展示其正在谈论的内容。语音功能将在iOS和Android平台推出,图像功能将覆盖所有平台。 国盛证券分析称,Chatgpt即将开放图生文及语音对话功能,AI技术持续迭代再翻新一页。根据OpenAI官网信息,ChatGPT即将在两周内对plus用户与企业用户开放一系列新功能,包括图像读取与理解(即图生文),以及语音对话能力。其中,与Chatgpt语音对话的能力仅对ios及安卓客户端开放,而图生文能力对全平台开放。

ChatGPT与数学

普通人如何用好ChatGPT?
ChatGPT与数学

普通人如何用好ChatGPT?

《更新书堂》· 第 401 篇 内容来源  |    本文摘自中信出版社书籍 《ChatGPT 超入门》  帕姆 · 贝克   著  责编  |   若风 第 7726  篇深度好文:5510  字 | 14   分钟阅读 2023 年的上半年,是 AI 发展历程中最沸腾的 6 个月。 自从 ChatGPT 聊天机器人带领 AI 进入大众应用阶段,大语言模型在数量上和质量上都出现了大爆发。从脸书母公司 Meta 的 LLaMA 开源模型,坦福大学团队的 Alpaca,到百度公司的文心一言大语言模型,阿里巴巴的通义千问模型,华为推出华为云盘古大模型……几乎每天都有新的模型、新的版本出现。 更重要的是,ChatGPT 揭开了一场未来变革的开端。 如果你的工作可以由机器直接完成,你该怎么办? 如果所有人都能轻松运用你自以为很独特的知识,也就是说,如果你能被别人轻松超越,你该怎么办?...
多模态功能上线,OpenAI让ChatGPT能说话、会看图
ChatGPT与数学

多模态功能上线,OpenAI让ChatGPT能说话、会看图

此前谷歌无疑是 AI 领域无可争议的领头羊,它开源的深度学习框架 TensorFlow 更堪称是 AI 世界的基石,但是这一切却在 2022 年秋季戛然而止,OpenAI 的 ChatGPT 横空出世让谷歌很快就黯然失色。并且外界没有想到的是,就在一年后,OpenAI 又一次 ” 截胡 ” 谷歌。 日前在毫无征兆的情况下,OpenAI 发布了题为《ChatGPT 现在能看、能听、能说》的公告,宣布将在未来两周内面向 Plus 和企业用户推出 ChatGPT 的语音和图像功能。 根据 OpenAI 方面透露的信息显示,ChatGPT 的多模态版本在 10 个月前就已经训练好了。那么为什么此前一直藏着掖着,现在却突然发布呢?外界推测,或许是因为不能让谷歌抢了先。 最近这段时间,业内风传谷歌方面即将发布多模态模型 Gemini,并且它可能会成为 AI 行业游戏规则的改变者。按照桑达尔 · 皮查伊的说法,Gemini 集成了多种技术,支持同时输出文本和图像,还可以使用工具和 API。所以在外界看来,面对来势汹汹的谷歌,OpenAI 方面自然要用实际行动来还以颜色。 所以在这一轮的更新中,ChatGPT 不仅仅能够理解用户输入的文字,甚至还拥有了识别并理解语音、图像信息的能力。语音识别能力很简单,因为该功能使得 ChatGPT 获得了类似 Siri、小爱同学的能力,并将提供五种不同的语音供用户选择,同时支持语音音频生成文本、将播客内容翻译成其他语言等功能。其实早在今年 5 月,ChatGPT...
为什么 ChatGPT 不会数数?
ChatGPT与数学

为什么 ChatGPT 不会数数?

首先,我认为要明白ChatGPT是一个什么类型的机器人。 ChatGPT首先是一个自然语言处理模型,它的主要优势在于处理自然语言文本的生成和理解,而数学应用题等形式化任务实际上除了我们提出的问题之后,其实它背后是蕴含了计算规则,而这个规则对于人类来说可能是显而易见的,但是对ChatGPT来说并非如此。 其次作为一个训练的模型,训练数据同样重要。与日常的其他语言任务不同,Chatgpt有大量的语料,但是计算题显然不一样,它训练数据中没有足够的数学应用题相关信息,或者没有专门针对数学应用题进行的训练。 最后,对于四则运算等数学应用题,其正确性和可读性都很重要,因为这些问题涉及到数学符号、公式、运算顺序等多个方面。由于ChatGPT是基于大规模的自然语言数据集训练的,因此其在处理数学应用题等形式化任务时可能会出现问题。
数学能力超过ChatGPT!上海交大计算大模型登开源榜首量子位2023-09-22 14:42北京
ChatGPT与数学

数学能力超过ChatGPT!上海交大计算大模型登开源榜首量子位2023-09-22 14:42北京

克雷西 发自 凹非寺量子位 | 公众号 QbitAI 国产数学大模型,能力已经超过了ChatGPT! 最新榜单中,上海交大GAIR实验室出品的Abel专有大模型: 准确率高达83.6%,在开源模型中位列第一。 据团队介绍,该模型是用挪威数学家尼尔斯·阿贝尔(Niels Abel)的名字命名的,以此向阿贝尔在代数和分析方面的开创性工作致敬。 在GSM8k数据集上,70B参数量的Abel碾压所有开源模型,还超过了ChatGPT。 甚至在新数据集TALSCQ-EN上,Abel的表现比GPT-4还要强。 而实现这样效果的Abel,成分可以说是十分“单纯”: 没有使用工具没有使用数学领域的大规模预训练数据没有使用奖励模型没有使用RLHF仅使用有监督精调(Supervised Fine-tuning,SFT)那么Abel的效果究竟怎么样呢? 成绩超越开源模型SOTA 这里我们选择同样是开源的Llama-2来和Abel对比。 首先来看下这个鸡兔同笼问题的变体: Brown由牛和鸡一共60只,鸡的数量是牛的两倍,一共有多少条腿? 这道题Llama-2出师不利,而且不是计算错误,是逻辑上就有问题: Abel则成功地解决了这个问题。 再来看下一个问题: 12,21,6,11和30的中位数与平均数的和是多少? 两个模型都正确理解了所涉及的概念,但Llama还是在计算和排序上出了错。 而Abel依旧是正确地做出了这道题: 再从测试数据上看看Abel的表现。 首先是OpenAI提出的GSM8k数据集(大概是美国高中难度),这份榜单的前十名,Abel占了三个(不同参数规模)。 开源模型当中,70B规模的Abel打败了曾经的SOTA——WizardMath。 如果把商业闭源模型算进来,Abel也仅次于GPT-4、Claude-2和PaLM-2-Flan这些最著名的模型。 甚至ChatGPT也不是Abel的对手。 △地球代表开源模型,锁代表闭源模型 在难度更高的MATH(竞赛题目)数据集中,开源模型的前三名被三个规模的Abel包揽,加上闭源也仅次于Google和OpenAI的产品。 研究团队还使用了新数据集TALSCQ-EN对Abel进行测试,结果超过了GPT-4。 那么,研究团队是怎么调教出这样一款高性能模型的呢? “保姆级”微调训练策略 核心奥义就是高质量的训练数据。 Abel使用数据是经过精心策划的,不仅包含问题的答案,还要能告诉模型找到正确答案是的方法。 为此,研究团队提出了一种叫做家长监督(Parental Oversight)的“保姆级”微调训练策略。 在家长监督的原则之下,团队仅通过SFT方式就完成了Abel的训练。 为了评价Abel的鲁棒性,研究团队还用GPT4对GSM8k中的数字进行了修改,测试Abel是否依然能解出正确的答案。 结果显示,在调整版GSM8k数据集下,70B参数的Abel鲁棒性超过了同等规模的WizardMath。 在Abel的介绍的最后,研究团队还留下了一个彩蛋: Abel的下一代,将进化成为Bernoulli(伯努利) 不过团队并没有对其中的含义进行说明,我们不妨期待一番。...