国内首个高分子材料基因平台诞生,被称“高分子版的ChatGPT”文汇报2023-03-10 11:33
AI与化学

国内首个高分子材料基因平台诞生,被称“高分子版的ChatGPT”文汇报2023-03-10 11:33

满足高强度、耐高温、轻质化兼具的先进树脂复合新材料是制约先进装备发展的关键瓶颈。当下,这样的难题可望得到解决。记者从华东理工大学获悉,由林嘉平教授团队开发的国内首个高分子材料基因组研发平台(AI plus高分子软件平台)日前在沪问世。 该软件被称为“高分子版的ChatGPT”,包含国内首个树脂结构性能数据库和基团间化学反应数据库。使用者只需输入树脂结构,即可快速获得其力学、热学和介电等性能,还可以通过该软件进行性能预测和高通量筛选,以更快效率、更低成本研制出高性能聚合物及其复合材料。 “新材料的研发从科学家的经验试错时代跨入智能制造时代。”林嘉平介绍,过去一个新材料从设计、实验再到产品化往往需要2-3年甚至更长时间,如今,依托这个“高分子虚拟实验室”,研发人员只需通过2-3次的迭代即可找到结构设计和配方优化的最优解,实验时间大大缩减。团队将和产业界携手,推动AI plus高分子研究范式向产业全链条发展。 强大数据库和预测系统同行领先 AI plus高分子软件平台有何亮点?林嘉平介绍,作为AI和数字化技术同高分子材料交叉领域的重要成果,强大的数据库是平台重要的支撑,可谓材料基因工程的基石。团队所建立的国内首个树脂结构性能数据库和基团间化学反应数据库,包含3万4千多种聚合物的将近15万条性能数据、58516种基元反应模板的近140万条化学反应数据。 值得一提的是,这些数据主要依靠过去三年尤其是疫情期间团队数十名研究生和本科生逐条规范整理、录入、存储。基于数据库,团队创建了面向高分子十余种性能的机器学习预测模型,并构建了高分子材料基因组研发平台,具备数据检索、性能预测、配方优化等多个功能。 记者在团队的现场演示上看到,用户在使用AI plus高分子软件平台进行高分子材料性能预测功能时,只需先点击“绘制结构”,分别将所绘制的环氧树脂和固化剂转化的字符串输入到对应的输入框中,再点击“开始预测”,短短几秒后页面就会返回后台计算出来的环氧树脂性能预测数据。 那么,这款软件和国外同行比较水平如何?团队成员之一、华东理工大学特聘研究员高梁举例,目前美国及日本均有类似软件。但在数据库的丰富程度、预测精确度、功能多样性等方面,AI plus高分子软件平台更胜一筹。“我们的目标,是努力抓住当前数字化和人工智能对新材料产业的变革契机,以更快效率、更低成本研制出高性能高分子及其复合材料,实现高分子材料的原始创新和智能制造。”高梁说。 新材料研发从经验“试错”时代跨入“智能制造”时代 AI plus高分子软件平台的开发可谓十年磨一剑。据悉,从2011年开始,林嘉平团队就抓住材料研究最前沿领域——材料基因工程着手相关工作。 在基因组合筛选和AI工具的通力合作下,团队研制了系列先进复合材料基体树脂。如固化温度小于300 ℃、5%热分解温度大于650 ℃、玻璃化转变温度大于600 ℃的新型耐高温、易加工硅萘炔和硅芴炔树脂。再如,耐高温、高韧性的新型聚硅炔酰亚胺树脂,其加工性能、耐热和界面性能优于聚酰亚胺,力学性能与聚酰亚胺相当。相关新型树脂已由多家航空航天院所开展复合材料及构件性能评价。 “AI plus高分子软件平台就像一个高分子虚拟实验室,平台的虚拟设计、高通量预测的方法将大大提高研发效率。”林嘉平介绍,目前该平台已在上海华谊集团树脂厂、上海航天八院、晋飞碳纤科技和金山石化院等十余家企业试用,将择机向社会公开使用。 作者:吴金娇 编辑:储舒婷 责任编辑:樊丽萍 图片:华东理工大学 *文汇独家稿件,转载请注明出处。 举报/反馈
聚焦2023上海车展|ChatGPT“上车”,引发“第三空间”化学反应?文汇报2023-04-20 06:17
AI与化学

聚焦2023上海车展|ChatGPT“上车”,引发“第三空间”化学反应?文汇报2023-04-20 06:17

▲在本届车展上,商汤绝影的智能展示舱将数字人与大模型结合起来。 本报记者 张伊辰摄 新一代科技革命呼啸而至,ChatGPT等技术与正在电动化、共享化、网联化、智能化的汽车相遇了。在第20届上海国际汽车工业展览会上,ChatGPT成了热词:4月上旬才相继问世的一些类ChatGPT产品,几天后就纷纷“上车”,探索汽车这一工作、居住之外的“第三空间”里的奇妙化学反应。 “新能源汽车将是大模型最大的交互应用场景。”斑马智行CEO张春晖对ChatGPT与汽车的结合作出了大胆判断。他说的是智能汽车的新飞跃:从钻研汽车“心脏”到探索汽车“大脑”,从专注汽车本身到汽车的“万物互联”,ChatGPT奇点的到来为这一切打开了想象空间。 现场直击:打开“第三空间”百宝箱 上海车展与ChatGPT的交集,主要来自于造车新势力。相对于传统造车企业,这些新势力的“新四化”渗透率更高,背后往往有科技企业的技术加持。 在5.1号馆,商汤绝影的展位在角落里,但丝毫不影响它成为关注的焦点——4月10日商汤刚刚发布的“日日新”大模型体系,已成功嵌入座舱。考虑到车展的策划执行还要提前一个月,可以推断,“日日新”在研发过程中已同步考虑到车载应用落地。 走入绝影未来展示舱内体验,最大的感受是数字人与大模型的结合。记者首先提出,请为我规划一个“五一”小长假上海5天游的行程。在停顿了约30秒之后,屏幕上给出了一份近300字的超长攻略。记者再提要求:请总结一下。大模型随后给出了50字左右的简短行程。随后记者再度“挑刺”:我不想去上海野生动物园。几秒之后,多个可替代景点的方案呈现在屏幕上。从体验看,基于千亿参数的大模型,让车舱内的多轮对话变成现实,仿佛打开了“第三空间”的百宝箱,并且可以执行。据悉,商汤绝影已与30家车企合作,智能驾驶和智能座舱产品累计前装定点数量超3100万台。 来到百度Apollo展台,一辆搭载文心大模型的现代帕里斯帝体验车已就位。“打开车窗、开启空调”,记者下达指令后,车内“可见即可说”。乘客人多怎么办?记者体验发现,车辆具备8路连续对话功能,即使是多位乘客一起和车辆交流,也不会“串台”。从百度发布的文心大模型的落地应用演示视频来看,汽车还能帮你拍照并发朋友圈、自检电池性能、解答相关问题等。 此外,百度和华为还在提前布局“无图商用”的升维打法。华为在车展期间发布了问界M5系列华为高阶智能驾驶版,到今年二季度,最新的智驾系统ADS 2.0将在15城实现不依赖高精地图的智能驾驶落地。百度则推出了“轻HD地图”,通过加强算法来减少车辆对于道路要素的依赖,同时可实现快速更新。 让汽车“长脑子”,重塑操作系统 “ChatGPT正在搅动汽车这个过去有点封闭的产业。”说这句话的,是奇瑞雄狮科技总经理邬学斌。他认为,汽车智能化才刚开始,智能化的底层逻辑是人工智能,人工智能的底层逻辑则是数据、算力和算法,他用“为汽车装上脑子”来形容ChatGPT将带来的深远变化,“今天的汽车,有心脏、四肢、骨骼,就是没有脑子,所以一直没有重大突破”。 “用脑袋改变汽车”的提法,在上海车展上被很多专家所认可。本次车展开幕当天,智己汽车发布了AI4M战略,公司联席CEO刘涛也作了类似比喻,“AI+软硬件”架构,简单来说,就是拥有像人一样的大脑、眼睛、四肢,但它也需要“更像人”的思维逻辑去控制,让智能汽车真正像人一样去思考。 这个“大脑”,用科技行业的专业术语来说,更确切地指向了底层操作系统。中国工程院院士、清华大学智能产业研究院院长张亚勤认为,以“文心一言”为代表的平台化通用式强人工智能,会给整个汽车行业带来极大冲击,“当通用大语言模型走向多模态模型,我们一定要有这样的认知,它不是一个对话机器人,而是我们在智能化时代、人工智能时代新的操作系统”。 阿里云在4月11日发布“通义千问”大模型后,也快步闯荡上海车展。张春晖认为,在智能汽车上,AliOS接入“通义千问”大模型后,“在基础系统层,大模型自动生成代码可以极大提升编程效率;在平台框架层,基于大模型的SOA可以让车企和操作系统企业更快捷地联合共建;在用户交互层,则是用户自定义,大模型负责生成。”总之,将推动汽车操作系统全新的共建理念与发展战略,在技术引领下催生“杀手级”应用出现。 据悉,智己汽车已成为首个采用“通义千问”大模型算法赋能整车的品牌,并与多家国内顶尖大模型算法机构探讨深层次合作,将利用ChatGPT在更多智能场景应用上实现突破。 从汽车本身到“车联万物” 就在几天前,OpenAI首席执行官山姆·奥特曼表示,巨型AI模型发展模式已结束,GPT-4可能是OpenAI“使模型更大并为其提供更多数据”战略中的最后一个重大进展,新的进步不会来自于让模型变得更大。在不少专家的解读中,ChatGPT已转向拼应用的阶段。 而汽车一直是AI落地的重要场景。据IHS Markit数据统计,目前中国市场座舱智能配置的新车渗透率约为48.8%,到2025年预计可超过75%。张春晖认为,新汽车具有交互主体多、交互方式多、交互黏性强、计算零件多、数据规模大、空间属性和社会属性等特征,这决定了新能源汽车一定是大模型最大的交互应用场景之一。 但要实现这种跨越也并非易事。有人就提出质疑:ChatGPT牵涉的算力太“烧脑”,汽车会不会变成一个移动大机房?以智能汽车计算零件数为例,一部手机的传感器只有13个,但当下一辆智能汽车却具有340个传感器和66项控制权,是手机的26倍多。埃森哲大中华区董事总经理陈明就此认为,随着汽车数据种类不断增多,体量愈发庞大,迭代速度持续加快,实现数据变现的挑战也会越发复杂,且成本高昂。 当然,所有的挑战与难题一旦被突破,就能成为“弯道超车”的撒手锏。陈明认为,当下数据的交互和使用,还处于线上线下打通的起点,即将消费者、4S店、主机厂、系统提供商等做整合,以更好数字化转型,而放眼未来,ChatGPT大潮将推动智能网联及自动驾驶往前疾驰,企业要有效整合价值链上各环节的数据,优化效率,提供服务,这将带来一个巨大的想象空间。 如果从“车联万物”角度看,汽车的“大脑”必将成为枢纽般的存在,而本届上海车展上亮相的多轮语言交互、无图商用等应用都只是小荷才露尖尖角。ChatGPT“上车”,看起来还有很长的路要走。 作者:徐晶卉 周渊 编辑:施薇 *文汇独家稿件,转载请注明出处。 举报/反馈
清华AIR开源轻量版BioMedGPT!聂再清:要做生物医药版ChatGPT量子位2023-04-20 17:19北京
AI与化学

清华AIR开源轻量版BioMedGPT!聂再清:要做生物医药版ChatGPT量子位2023-04-20 17:19北京

衡宇 萧箫 发自 凹非寺量子位 | 公众号 QbitAI 生物医药研发领域,一个名为BioMedGPT-1.6B的轻量级科研版基础模型刚刚开源。 参数16亿,最大特点是跨模态与知识融合。 训练数据中,包含分子、文献、专利、知识库等多尺度跨模态的生物医药大数据,并融合分子结构、知识图谱和文献文本中的知识,用于增强模型的泛化能力和可解释性。 应用任务上,BioMedGPT-1.6B则展现出了通用能“打”的效果,可以处理药物性质预测、自然语言类、跨模态等多种任务。 打造这个BioMedGPT-1.6B生物医药基础模型的团队,来自清华智能产业研究院(AIR)。 项目负责人聂再清,清华大学国强教授、AIR首席研究员,主要研究领域是大数据与AI的前沿创新,以及在健康医疗领域的产业应用,更早之前则以阿里达摩院大牛、天猫精灵首席科学家为人熟知。 △聂再清 此次开源的BioMedGPT-1.6B,其实是他和团队正在做的BioMedGPT的单机轻量版,后者是一个适用于生物医药领域研发的通用大模型。 1.6B版本先行开源,目的是小试牛刀,同时让行业相关科研人员有东西可用。 所以,这个BioMedGPT究竟是做什么的,团队目前进展如何?在业界已有不少生物医药专业大模型的情况下,做通用大模型的考量是什么,又要如何去做? 聂再清教授向我们解答了背后的思考。 生物医药版GPT,也应具备“涌现”潜力 先来看看BioMedGPT究竟是个什么项目,进展到了哪一阶段。 聂再清教授认为,就像ChatGPT成为了NLP领域的基础大模型一样,BioMedGPT也会成为生物医药领域的基础大模型。 但在这里,“像ChatGPT”并不仅仅意味着BioMedGPT=生物医学大模型+对话能力,而是和ChatGPT一样,会出现智力涌现的情况。 只不过,这里的“智力”,指的是生物医学领域方面知识的理解、规律的发现与灵感的启迪。 这个基础模型的底座能够给药物发现、分子/蛋白质设计等应用提供底层能力,同时能够成为生物医药研究者的助手(Copilot)辅助研究者更高效的开展研究探索。 所以,能实现这种效果的BioMedGPT,架构上究竟长啥样? 整体来看,它是一个具备多个输入Encoder的模型,这些Encoder会先分别处理不同模态的输入,如分子、蛋白质和文献等。 然后,将这些不同模态的输入,进行统一表示处理,这样就能学习到不同模态之间的关联知识。 这给了模型“融会贯通”的能力,既可以读文献、查专利,又可以读分子序列、蛋白结构、实验数据。 不仅如此,BioMedGPT也是首个将多模态知识引入模型构建的项目,通过知识图谱的方式将生物医药领域的知识注入到模型中,以增强模型的泛化能力和可解释性,同时能够应对科研领域知识的快速更迭,让模型持续学习,变得更“聪明”。 基于这种融会贯通与知识增强的能力,BioMedGPT在下游的多项任务中表现出了整体的效果提升。 目前团队已经完成了实验验证阶段,用一个比较小的端到端模型证明了这种思路的可行性。 那么最终能在生物医药方面表现出“智力涌现”的模型,预计在什么规模? 聂再清教授认为,模型参数量级预计在几百亿左右,而训练这一模型达成“涌现”效果的数据量,几十亿到百亿级应该也就够了。 事实上,在ChatGPT出现之前,也就是一年多以前,聂再清和团队就已经在筹备这一项目,目前清华AIR生命科学相关团队规模已经达到50人左右。 对于BioMedGPT的未来,聂再清教授很有信心: 预计两年内,这个模型应该会在小范围内具备一定影响力,至于像ChatGPT那样成为行业通用大模型,做到那样的影响力可能至少还需要3~5年。 但即便如此,BioMedGPT模型究竟能否成功,目前仍旧是一个未知数。 同时对于大模型训练必不可少的算力和数据等方面,也仍然是业界关注的话题。 对于这些观点和想法,聂再清教授又是如何看待的? “一个理性而大胆的尝试” 大模型的发展和AI技术的更迭组成了ChatGPT为首的一波AI新浪潮。 但早在聂再清教授动念要将生物医药学科知识“塞”进大模型里时,ChatGPT还没打破沉寂。 所以为什么要做?为什么敢做? 时间回到ChatGPT刮大风之前。当时,GPT-2已经可以编故事,下象棋;等到1750亿参数GPT-3出现,已经博得众人瞩目:不仅延续了前代编故事的能力,还能写代码、答问题…… 利用大规模文本数据学习语言知识和规律,加上狂叠参数的暴力美学,GPT-3已经在通用领域任务中出现涌现能力,到GPT-3.5,基本的逻辑推理能力突然出现。 在生物和化学领域,生命的本质可以看做一种精密的编码语言,尤其是生命科学领域中微观世界的分子序列数据。...
研究者用ChatGPT证明数学定理,3年内AI会赶超数学家?澎湃新闻2023-07-03 17:07
AI与数学

研究者用ChatGPT证明数学定理,3年内AI会赶超数学家?澎湃新闻2023-07-03 17:07

·越来越多的数学研究者关注人工智能对该领域的影响,在各种讨论会上辩论,采用不同的AI工具尝试解答数学问题。 ·数学是机器学习能做什么或不能做什么的试金石。推理是数学过程的精髓,也是机器学习中尚未解决的关键问题。神经网络以某种方式直观地辨别出了数学真理,但其逻辑“原因”却远非那么明显。 加州理工学院和麻省理工学院研究者发布用大语言模型证明数学定理的论文。最近一段时间,人工智能似乎在数学领域取得了进展,尽管一开始大语言模型被看作并不是特别适合数学推理。 上周,英伟达数学家Jim Fan转发了加州理工学院和麻省理工学院研究者用ChatGPT证明数学定理的论文,称数学的AI Copilot(副驾驶)时代已经到来,未来人工智能将能够发现数学定理。这篇论文构建了一个基于大语言模型的定理证明器,为解决大语言模型幻觉方面的缺陷开辟了一条新途径。 几天前,数学家、菲尔兹奖得主陶哲轩表示,他最近在解决一个数学难题时“使用了GPT-4”,“它给我提供了最终的解题思路,接下来我只需要继续计算就行。”为了给更多研究者参考,他晒出了自己和GPT-4的聊天记录。 如今,越来越多的数学研究者关注人工智能对该领域的影响,他们在各种讨论会上辩论,采用不同的AI工具尝试解答数学问题。根据《纽约时报》最近对一些数学家的采访,他们正在努力应对人工智能这一最新变革力量。数千年来,数学家们已经适应了逻辑和推理方面的最新进展,他们为人工智能做好准备了吗? 数学家和计算机科学家一起开会 两千多年来,数学家欧几里得的文本一直是数学论证和推理的典范。卡内基梅隆大学逻辑学家杰里米·阿维加德(Jeremy Avigad)在接受采访时说:“众所周知,欧几里得以近乎诗意的‘定义(definitions)’开始。”“然后,他在此基础上建立了当时的数学,使用基本概念、定义和先验定理,以每一个后续步骤‘清楚地遵循’之前的步骤来证明事物。”阿维加德说,有人抱怨欧几里得的一些“明显”步骤并不明显,但该系统仍然有效。 但到了20世纪,数学家不再愿意将数学建立在这种直观的几何基础上。相反,他们开发了正式的系统——精确的符号表示、机械规则。最终,这种形式化使得数学能够转化为计算机代码。1976年,四色定理(该定理指出四种颜色足以填充地图,因此没有两个相邻区域具有相同的颜色)成为第一个借助计算强力证明的主要定理。 现在,人工智能来了。2019年,曾供职于谷歌、现供职于湾区一家初创企业的计算机科学家克里斯蒂安·塞格迪(Christian Szegedy)预测,计算机系统将在10年内赶上或超过人类最优秀数学家解决问题的能力。去年他将目标年份修改为2026年。 普林斯顿高等研究院数学家、2018年菲尔兹奖获得者阿克谢·文卡特什(Akshay Venkatesh)目前对使用人工智能不感兴趣,但他热衷于谈论。“我希望我的学生意识到他们所处的领域将会发生很大的变化。”他在去年的一次采访中说。最近他又补充说:“我并不反对深思熟虑和刻意使用技术来支持我们人类的理解。但我坚信,留心我们使用它的方式至关重要。” 今年2月,阿维加德参加了在加州大学洛杉矶分校纯数学与应用数学研究所举办的“机器辅助证明”研讨会。这次聚会吸引了数学家和计算机科学家这一不寻常的组合。该研讨会的主要组织者是陶哲轩,他曾在一篇博客中称,2026年AI将与搜索和符号数学工具相结合,成为数学研究中值得信赖的合著者。陶指出,直到最近几年,数学家们才开始担心人工智能的潜在威胁,无论是对数学美学还是对他们自己,圈子成员现在正在提出这些问题并探索“打破禁忌”。 帮助解决数学问题的小工具们 如今,在饮食、睡眠、锻炼方面,优化人们生活的小工具十分普遍,威斯康星大学麦迪逊分校数学家乔丹·埃伦伯格(Jordan Ellenberg)在研讨会休息期间接受采访说:“我们喜欢给自己增加一些东西,以便更容易把事情做好。”人工智能小工具可能对数学有同样的作用。 其中一种数学小工具被称为证明助手或交互式定理证明器。数学家一步步将证明转化为代码,然后软件程序检查推理是否正确。验证在一个库中积累,成为其他人可以查阅的动态参考。阿维加德说,这种“形式化”为当今的数学奠定了基础,“就像欧几里得试图编纂和整理数学、为他那个时代的数学奠定了基础一样。” 最近,开源证明辅助系统Lean备受关注。Lean由计算机科学家莱昂纳多·德·莫拉(Leonardo de Moura)开发,当时他在微软,现在是亚马逊的计算机科学家。Lean使用自动推理,由所谓的“老式人工智能(GOFAI)”提供支持,即受逻辑启发的符号人工智能。到目前为止,Lean社区已经验证了一个翻转球体的定理和一个有助于统一数学领域的关键定理等。 但证明助手也有缺点:它经常抱怨不理解数学家输入的定义、公理或推理步骤,因此它被戏称为“证明抱怨者”。所有这些抱怨都会让研究变得很麻烦,但福特汉姆大学(Fordham University)的数学家希瑟·麦克白(Heather Macbeth)表示,提供逐行反馈的功能也使该系统对教学很有用。 今年春天,麦克白设计了一门“双语”课程:她把黑板上提出的每一个问题都翻译成讲义中的Lean代码,学生们用Lean和普通语言提交作业答案。“这给了它们信心。”麦克白说,因为它们收到了关于证明何时完成以及整个过程中的每一步是对还是错的即时反馈。 自从参加洛杉矶研讨会以来,约翰·霍普金斯大学的数学家艾米丽·里尔(Emily Riehl)使用实验性证明辅助程序来形式化她之前与合著者发表的证明。在验证结束时,她说:“我真的非常深入地理解了这个证明,比我以前理解的要深入得多。” 约翰·霍普金斯大学的数学家艾米丽·里尔一直在使用一个实验性证明助理程序。卡内基梅隆大学计算机科学家、亚马逊学者马利恩·海勒(Marijn Heule)使用另一种自动推理工具,被他称为“暴力推理”,或者更专业地说是可满足性问题求解器。他说,只要用精心设计的代码来说明你想要找到哪个“奇异物体”,超级计算机网络就会在搜索空间中进行“翻搅”,并确定该实体是否存在。 还有一组工具使用机器学习,可以合成大量数据并检测模式,但不擅长逻辑、逐步推理。谷歌的DeepMind就设计了机器学习算法来解决蛋白质折叠和国际象棋获胜等问题,在2021年《自然》杂志的一篇论文中,一个团队将他们的成果描述为“通过人工智能指导人类直觉来推进数学发展”。 前谷歌计算机科学家、现在在湾区创业的宇怀·“托尼”·吴(Yuhuai“Tony”Wu)概述了一个更宏伟的机器学习目标。在谷歌,吴探索了支持聊天机器人的大型语言模型如何帮助数学。该团队使用的模型经过互联网数据训练,然后利用数学和科学论文的在线存档等大型数据集进行微调。吴在研讨会上说,当以日常语言来要求解决数学问题时,这个名为Minerva的专门聊天机器人“非常擅长模仿人类”。该模型在高中数学考试中获得的成绩优于16岁学生的平均成绩。吴说,他设想最终会有一位“自动化数学家”,具有“自行解决数学定理的能力”。 计算机科学家宇怀·“托尼”·吴设想了一位“自动化数学家”——具有“自行解决数学定理能力”的通用研究助理。数学是试金石 对于这些颠覆式的创新,数学家们做出了不同程度的关注。 哥伦比亚大学的迈克尔·哈里斯(Michael Harris)表达了疑虑,他对研究数学与国防工业之间潜在的目标和价值观冲突感到困扰。在最近的一份时事通讯中,他指出由美国国家科学院组织的一个研讨班——“AI协助数学推理”中,一名演讲者是博思艾伦咨询公司(Booz Allen Hamilton)的代表,该公司是情报机构和军方的承包商。哈里斯希望,能够有更多关于人工智能影响数学研究的讨论。 DeepMind的合作者、悉尼大学的乔迪·威廉姆森(Geordie Williamson)在美国国家科学院的那场聚会上发表了讲话,鼓励数学家和计算机科学家更多地参与此类对话。在洛杉矶的研讨会上,他以改编自乔治·奥威尔1945年文章《你和原子弹》的一句话开始了自己的演讲。威廉姆森说:“考虑到我们所有人在未来五年内都可能受到深刻影响,深度学习并没有引起像预期那么多的讨论。”他认为,数学是机器学习能做什么或不能做什么的试金石。推理是数学过程的精髓,也是机器学习中尚未解决的关键问题。 威廉姆森在接受采访时表示,在他与DeepMind合作的早期,该团队发现了一个简单的神经网络,可以预测他非常关心的数学量,而且它的预测“准确得可笑”。威廉姆森努力想要理解其中的原因,但是无法理解,DeepMind的其他人也都做不到,而这个原因将成为一个定理的基础。就像欧几里得一样,神经网络以某种方式直观地辨别出了数学真理,但其逻辑“原因”却远非那么明显。 在洛杉矶的研讨会上,一个突出的主题是如何将直觉和逻辑结合起来。但威廉姆森观察到,人们很少有动力去理解机器学习的黑箱。他说:“这是科技界的黑客文化,如果它在大部分时间都有效,那就太好了。”但这种情况让数学家们感到不满意。 他补充说,试图理解神经网络内部发生的事情会引发“令人着迷的数学问题”,而寻找答案为数学家“为世界做出有意义的贡献”提供了机会。 (本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)...