普通人如何用好ChatGPT?
ChatGPT与数学

普通人如何用好ChatGPT?

《更新书堂》· 第 401 篇 内容来源  |    本文摘自中信出版社书籍 《ChatGPT 超入门》  帕姆 · 贝克   著  责编  |   若风 第 7726  篇深度好文:5510  字 | 14   分钟阅读 2023 年的上半年,是 AI 发展历程中最沸腾的 6 个月。 自从 ChatGPT 聊天机器人带领 AI 进入大众应用阶段,大语言模型在数量上和质量上都出现了大爆发。从脸书母公司 Meta 的 LLaMA 开源模型,坦福大学团队的 Alpaca,到百度公司的文心一言大语言模型,阿里巴巴的通义千问模型,华为推出华为云盘古大模型……几乎每天都有新的模型、新的版本出现。 更重要的是,ChatGPT 揭开了一场未来变革的开端。 如果你的工作可以由机器直接完成,你该怎么办? 如果所有人都能轻松运用你自以为很独特的知识,也就是说,如果你能被别人轻松超越,你该怎么办?...
开了眼的ChatGPT,真让人开了眼了
ChatGPT与物理

开了眼的ChatGPT,真让人开了眼了

本文来自微信公众号:GenAI新世界(ID:gh_e06235300f0d),作者:油醋,头图来自:视觉中国 给自己放个假吧ChatGPT,再更新得这么快,网友的脑洞可就跟不上了。 本周,ChatGPT宣布了一次重要更新,然后有了全面的多模态能力。 以后你下班骑共享单车回家路上要是感觉车上有什么故障,可以给零件拍张照直接问它。 然后你回到家了,看到毫无头绪的冰箱藏品后,ChatGPT可以告诉你挑哪几样出来能做个晚饭。 吃完睡觉,还没睡意的话,它还能给你一些ASMR服务,如果视频网站上那几个博主你已经听厌了的话。 1985年9月,写了《看不见的城市》的卡尔维诺因为突然的中风而去世,这年夏天他因为头痛的问题曾去寻求过医生帮助,主刀医生说自己从未见过这么般构造复杂而精致的大脑。 ChatGPT从一开始就像一颗无比精美的大脑——并且是看不见的——但它现在终于有了眼睛、耳朵和嘴。 全球网友:那就来吧,比划比划。 有人试了试,它基本可以替人做软件项目的开发了。 一个软件项目的诞生大概是这样的:先在白板上画线框图,整理出编排逻辑,然后开始写代码,最后生成界面。现在这件事,白板上的活儿归你,离开白板归它。 一位开发者把自己的线框图直接拍照扔给ChatGPT,它直接把软件写出来了。 他还玩了些小把戏,比如把编排用并不规整的箭头表示潦草的替换了位置,ChatGPT不但看出来了,而且照单全收。 我们大概还是低估了多模态会带来什么。 人工智能与人类智力的发展在这里是相反的。人类先有眼睛,看到了世界之后形成了语言和逻辑,反过来又能更好地描述和理解所看到的世界。人类在600万年历史间的智力水平提升,就是一个巨型的机器学习熔炉。 而对于ChatGPT来说,他已经有了最好的智力水平,已经能够理解很多事了,限制它的反而是文字对于信息的压缩,导致它无法接触到更复杂的问题。当给这样一颗大脑一双眼睛会带来什么。也就是让它被允许直接看到图像信息,拆解问题的能力开始爆炸。 有人给ChatGPT喂了一张SaaS软件的界面图,并且要求它将其分解为小的组件并且把所有代码都写出来,它真的做到了。 你甚至可以粗暴地给它一个Unity的编辑界面截图,叫它提供一个添加模型动作的流程。 图源:推特 在开放了多模态能力后,ChatGPT的理解和推理能力也体现得更直观了,甚至有点可怕。 给自己一分钟,看看能否理解这组图的意思: 图源:推特 这是ChatGPT的解读: 图源:推特 “这组漫画看起来在强调团队中沟通、理解和对齐的重要性。”ChatGPT在最后做了如此总结。 这样的理解能力给曾经在Facebook 和Uber工作过的AI工程师Pietro Schirano惊得无话可说。 除了眼睛,还有耳朵和嘴。 此次ChatGPT升级背后,语音识别的能力基于开源的Whisper模型,声音的生成能力则基于额外的TTS(text-to-speech)模型进行,目前语音合成支持五种语音,都是和专业配音演员合作制作而成的。 但眼看着两个手机里的ChatGPT在你面前自顾自地讨论,关于“有没有用户试着和你一起唱卡拉OK啊?”——不是问你,是它在问另一个它——好像还是太超前了一点。 另外,它似乎也有做一个心理医生的潜质。OpenAI安全团队的成员Lilian Weng在语音模式下和ChatGPT做了一次非常情绪化的私人对话,谈论压力、工作与生活的平衡。 “有趣的是,我感到被倾听和温暖”,Lilian Weng在推特上说。她建议如果你原来只是把它当作一个生产力工具,那最好试试它细腻的一面。 图源:推特 而对于ChatGPT本身的进化来说,这次将2022年就训练完成了的多模态能力开放出来,也是在为未来的进化建立一个新的基础。 ChatGPT首席架构师John Schulman一个月前在Pieter Abbeel(John Schulman在加州大学伯克利分校博士期间主攻强化学习时的导师)的一档播客节目中表示,他觉得现有数据和模型规模扩展方法能带来的性能提升可能在一段时间后达到极限,在那之后,算法、数据集、数据集大小以及算力能带来的提升将逐渐递减。 所以添加多模态功能会带来极大的性能提升。这能让模型获得文本中无法获得的知识,并有可能掌握纯语言模型无法完成的任务。 例如,通过观看与物理世界甚至是与电脑屏幕互动的视频,模型能获得巨大收益。所有软件都是为人类设计的,如果模型能够观察像素并理解视频,我们就可以使用各种现有软件或帮助人们使用这些软件。为模型赋予新能力,让模型与新事物互动,将大大增强模型的实际能力。 那么下个月的ChatGPT又能做到什么?太期待了。 本文来自微信公众号:GenAI新世界(ID:gh_e06235300f0d),作者:油醋
ChatGPT爆火背后,再看合成数据与人工智能的未来
ChatGPT与化学

ChatGPT爆火背后,再看合成数据与人工智能的未来

曹建峰腾讯研究院高级研究员陈楚仪腾讯研究院高级研究员导语:随着ChatGPT持续火爆,背后的大型语言模型(LLM)和生成式AI技术(Generative AI)日益备受关注。AI领域的新一轮竞赛已然开始,微软、谷歌等已在搜索引擎领域展开角逐,将ChatGPT能力融入搜索服务。AIGC浪潮下,除了ChatGPT等面向终端用户的应用形态,生成式AI和AIGC技术更广阔的应用空间将是产业互联网领域,基于生成式AI和AIGC技术的合成数据,将成为人工智能技术在各行各业应用普及和能力提升的核心要素,支撑人工智能未来发展。而且,有研究预测,到2026年ChatGPT等大型语言模型的训练就将耗尽互联网上的可用文本数据,届时将没有新的训练数据可供使用。因此,未来也需要借助合成数据解决ChatGPT等AIGC模型的潜在数据瓶颈,推动进一步发展。在过去的2022年,AIGC(AI-Generated Contents,人工智能生成内容)无疑是最引人瞩目的科技关键词,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,人工智能正加速实现从感知、理解世界到生成、创造世界的跃迁。以AIGC这一加速扩张的新疆域为标志,AI领域正在迎来下一个时代。多模态AI模型有望成为继移动互联网之后新的技术平台。而且随着AIGC模型的通用化水平和工业化能力的持续提升,其有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。经过了2022年的预热,2023年AIGC领域将迎来更大发展,AIGC将更趋主流,AIGC内容的类型和质量将不断提升,将有更多的企业主动拥抱AIGC,AIGC领域将诞生全新的职业机会(如提示词工程师)。当然,政府对AIGC的监管也将有所加强。[1] 在数据领域,我国出台的《关于构建数据基础制度更好发挥数据要素作用的意见》提出,顺应经济社会数字化转型发展趋势,推动数据要素供给调整优化,提高数据要素供给数量和质量。在强化数据要素优质供给方面,基于AIGC技术的合成数据将能发挥巨大价值,将以更高效率、更低成本、更高质量为数据要素市场“增量扩容”,助力打造面向人工智能未来发展的数据优势。 因此,产业政策需要着力支持、促进AIGC在产业互联网领域的深入应用,培育、打造合成数据、AIGC等未来产业,持续壮大我国发展人工智能、数字经济、产业互联网等新技术新业态新应用的数据优势。 AIGC技术推动合成数据(synthetic data) 领域迎来重大进展 随着AIGC技术持续创新发展,基于AIGC算法模型创建、生成合成数据(synthetic data)迎来重大进展,有望解决AI发展应用过程中的数据限制,进一步推动AI技术更广泛的应用。因此,业界非常看好合成数据的发展前景及其对人工智能未来发展的巨大价值。Forrester、埃森哲(Accenture)[2]、Gartner、CB Insights[3]等研究咨询公司都将合成数据列为人工智能未来发展的核心要素,认为合成数据对于人工智能的未来而言是“必选项”和“必需品”。例如,Forrester将合成数据和强化学习、Transformer网络、联邦学习、因果推理视为实现人工智能2.0的五项关键技术进展,可以解决人工智能1.0所面临的一些限制和挑战,诸如数据、准确性、速度、安全性、可扩展性等。[4]Gartner预测称,到2030年合成数据将彻底取代真实数据,成为AI模型所使用的数据的主要来源。[5]MIT科技评论将AI合成数据列为2022年十大突破性技术之一,称其有望解决AI领域的数据鸿沟问题。[6]数据是人工智能的燃料和驱动力,合成数据将极大拓展人工智能发展应用的数据基础,可以认为,合成数据关乎人工智能的未来。 在概念上,合成数据是计算机模拟(computer simulation)技术或算法创建、生成的自标注信息,可以在数学上或统计学上反映真实世界数据的属性,因此可以作为真实世界数据的替代品,来训练、测试、验证AI模型。简而言之,合成数据是在数字世界中创造的,而非从现实世界收集或测量而来。[7]合成数据拥有很长的历史,在其发展过程中技术不断创新。 例如,游戏引擎、3D图形等模拟技术(simulation technology)可以创建高保真的仿真物体和仿真环境,而结合了AI技术的3D-AI技术则可以极大提升自动化生产3D内容的效率和保真度(fidelity)。得益于生成对抗网络(GAN)、变分自编码器(VAE)、Transformer模型、扩散模型(Diffusion Model)、神经辐射场模型(NeRF)等不断涌现的AI算法,不仅合成数据的种类得到了扩展,而且其质量也不断得到提升。 就目前而言,合成数据大致可分为三类:表格数据/结构化数据,图像、视频、语音等媒体数据,以及文本数据。[8]这几类合成数据在多个领域都有应用。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。目前主要呈现以下四个方面的发展趋势。‍‍ 合成数据为AI模型训练开发提供 强大助推器,推动实现AI2.0 人工智能的发展应用离不开数据,但真实世界数据面临着难以获取、质量差、标准不统一等诸多问题。为此,计算机模拟技术或算法生成的合成数据,作为真实数据数据的廉价替代品,日益被用于创造精准的AI模型。 合成数据服务商AI.Reverie指出,人工标注一张图片可能需要6美元,但人工合成的话只需要6美分。2019年的一篇论文《合成数据用于深度学习》(synthetic data for deep learning)认为,合成数据是现代深度学习领域冉冉升起的最具前景的通用技术之一,尤其对于依赖于图像、视频等非结构化数据的计算机视觉技术而言;并认为合成数据对于人工智能的未来发展至关重要。[9]而且,研究表明在AI模型的训练开发上,合成数据相比基于真实物体、事件或人物的数据,可以发挥同样好甚至更好的效果。[10] 总之,合成数据技术可以实现更廉价、更高效地批量生产制造AI模型训练开发所需的海量数据(诸如训练数据、测试数据、验证数据等等),作为对真实数据的替代或补充,将推动人工智能迈向2.0阶段,从本质上扩展AI的应用可能性。 可以说,目前人工智能仍处在1.0阶段(AI1.0),数据是最大掣肘,业界利用真实世界数据训练AI模型面临多方面问题:数据采集、标注费时费力、成本高企;数据质量较难保障;数据多样化不足,难以覆盖长尾、边缘案例,或者特定数据在现实世界中难以采集、不方便获取;数据获取与使用、分享等面临隐私保护挑战和法规限制,等等。这些数据方面的限制在很大程度上阻碍了人工智能更广泛的应用和部署。 合成数据有望解决这些问题,推动人工智能迈向2.0阶段(AI2.0),可以在更大程度上拓展人工智能的应用。在AI2.0阶段,人们不仅可以利用合成数据更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,这将极大扩展AI的应用可能性。具体而言,对于人工智能而言,合成数据可以发挥诸多价值: (1)实现数据增强和数据模拟,解决数据匮乏、数据质量等问题,包括通过合成数据来改善基准测试数据(benchmark data)的质量等; (2)避免数据隐私/安全/保密问题,利用合成数据训练AI模型可以避免用户隐私问题,这对于金融、医疗等领域而言尤其具有意义; (3)确保数据多样性,更多反映真实世界,提升AI的公平性,以及纠正历史数据中的偏见,消除算法歧视; (4)应对长尾、边缘案例,提高AI的准确性、可靠性,因为通过合成数据可以自动创建、生成现实世界中难以或者无法采集的数据场景,更好确保AI模型的准确性; (5)提升AI模型训练速度和效果。总之,利用合成数据可以更廉价、更高效、更准确、更安全可靠地训练AI模型,进而极大扩展AI的应用可能性,将人工智能推向新的发展阶段。 合成数据助力破解AI“深水 区”的数据难题,持续拓 展产业互联网应用空间 合成数据早期主要应用于计算机视觉领域,因为计算机视觉被广泛应用于自动驾驶汽车、机器人、安防、制造业等领域,在这些应用场景中打造AI模型都需要大量的被标注的图像、视频数据。但获取现实数据往往并非易事。 以自动驾驶汽车为例,由于实际道路交通场景千变万化,让自动驾驶汽车通过实际道路测试来穷尽其在道路上可能遇到的每一个场景是不现实的,必须借助于合成数据才能更好地训练、开发自动驾驶系统。为此,自动驾驶企业开发了复杂的仿真引擎来“虚拟地合成”自动驾驶系统训练所需的海量数据,并高效地应对驾驶场景中的“长尾”问题和“边缘案例”。 例如,腾讯自动驾驶实验室开发的自动驾驶仿真系统TAD Sim可以自动生成无需标注的各种交通场景数据,助力自动驾驶系统开发。在安全的、合成的仿真环境中,计算机可以模拟任何人类想象得到的驾驶场景,诸如调节天气状况、添加或移除行人、改变其他车辆的位置等等。可以说,合成数据和仿真技术是自动驾驶的核心支撑技术。最早涌现的一批合成数据创业公司就瞄准的是自动驾驶汽车市场,帮助自动驾驶企业解决其在自动驾驶系统开发过程中所面临的数据和测试难题。 目前,合成数据正迅速向金融、医疗、零售、工业等诸多产业领域拓展应用。合成数据在金融服务领域的探索仍处于早期且不断拓展,并且受到咨询公司、金融巨头和监管机构的关注。 合成数据背后的生成式AI被Gartner评为2022年银行和投资服务领域越来越受欢迎的三项技术之一。[11]生成性AI受欢迎的原因是能够通过合成数据以成本更低、易规模化、隐私保护合规的方式提供接近真实世界的数据。而在银行和投资服务领域,生成对抗网络(GAN)和自然语言生成(NLG)的应用可以在大多数欺诈检测、交易预测、合成数据生成和风险因素建模的场景中找到。例如,美国运通(America Express)利用GAN创建合成数据来训练、优化其进行欺诈检测的AI模型。谷歌利用AI生成的医疗记录来帮助预测保险诈骗(insurance fraud)。 摩根大通(J.P.Morgan)2021年9月在其官网发布相关研究,提出通过生成合成数据集加快金融服务领域的AI研究和模型开发,来改善服务体验、解决欺诈检测和反洗钱等重要问题。[12]国外金融服务业所产生的大量真实数据因为法律限制(如欧盟的GDPR和美国的CCPA)和隐私保护要求无法使用或使用存在诸多限制。合成数据创造的新样本具有真实数据的性质,增加真实数据中的罕见样本,以便更有效地训练机器学习算法。一个关键的领域是欺诈检测模型训练。由于欺诈性案件的数量与非欺诈性案件相比较十分稀少,研究人员很难有效地从可用数据中训练模型,导致无法针对欺诈性行为进行建模。然而,合成数据可以生成比实际数据中欺诈案例比例更高的合成数据样本,用于帮助改进模型训练。 图:金融数据合成过程(来源:摩根大通官网) 英国金融行为监管局(Financial Conduct...
ChatGPT在会计考试中不如人类?但AI会替代工具人
ChatGPT与论文

ChatGPT在会计考试中不如人类?但AI会替代工具人

最近,#ChatGPT在会计考试中不如人类#的一则消息登顶热搜。 事件经过 在美国杨百翰大学领导的一项研究,科学家们组织了一场竞争会计考试,参与者包括杨百翰大学本科生和ChatGPT。 结果显示,尽管ChatGPT的表现令人印象深刻,但学生的表现更为出色。学生总体的平均得分为76.7,而ChatGPT的得分仅为47.4。特别是在简答题和高阶问题方面ChatGPT表现不佳。 好多人为之雀跃:人工智能哪里能赶上人类? 但是提及ChatGPT 人们最关心的话题之一还是: 我的工作会不会被AI取代? 从最初的聊天机器人,到秒出图的AI绘画应用,再到各类AI专业小模型产品的研发,大批内容生产从业者都在面临人工智能带来的“替代”挑战。 “未来全球平均18%的工作岗位或可由AI自动化完成,约有3亿个全职岗位或将受AI影响。”高盛研究部最新报告预测,现有的劳动力市场或许会重新洗牌。 但人类的自信也从来不会轻易消失。“AI可以工作,但没有我会舔老板”⋯⋯在社交媒体的段子之外,不少受访者普遍认为,AI替代的不是简单的某个行业,而是不会使用AI的从业者,“从来不是AI替代人,而是会使用AI的人替代不会使用AI的人。” “AI可以替代所有60分以下的新手” 去年年底,聊天机器人模型 ChatGPT和AI绘画软件陆续上线,“那时GPT生成的文字还是东拼西凑的,毫无逻辑。 从胡说八道“进化”到逻辑自洽,ChatGPT只用了三个半月。学习速度惊人的还有各类AI绘画软件,两个月前它们还无法准确地生成“目标”图片,比如“画出”的猫可能有五个爪子、两条尾巴,而现在不但能高水平文字转图像(Text2Image),还能按照样图模仿(image2image)。 面临失业风险的游戏公司原画师们用过AI绘画后的感受是,如果给美术顶级大佬打99分,那么AI可以替代掉所有60分以下未达到入行标准的新手。 新一代人工智能还会颠覆哪些行业? 泥水匠比律师“活得更久”? 3月25日举办的中国发展高层论坛上,就“人工智能引领新产业革命”话题,启明创投创始主管合伙人邝子平分享,“搜索行业,游戏、小说、剧本等内容生成行业,教育行业等都将发生根本性改变。” 应用AI技术冲击下,泥水匠比会律师“活得更久”吗?半个多月前,ChatGPT开发主体OpenAI联合宾夕法尼亚大学发布了一篇研究报告,预测约80%的美国劳动力至少有10%的工作会受到GPT的影响。研究人员认为,拥有高收入工作或者具有高等教育和专业学位的人,更容易“暴露”在GPT技术之下。这篇引发争议的论文发表在预印本平台arXiv上,并未经过同行评审。 “相比于具体数字多少,更值得关注的是AI替代人力的大趋势。”中国人民大学劳动人事学院副教授周广肃分析说,从前讨论AI替代作用,更多是替代一些重复性、有规律、低人力资本的劳动,而ChatGPT诞生后,人们惊讶地发现,AI还能替代非重复性、具有一定程度创造性的脑力劳动,高人力资本从业者似乎也难逃被替代的命运,因而引发了较为广泛的担忧。 “AI让每个使用者成为全能战士” 4月初,国家地理中文网发布了一组“樱花季”大片。有读者“看着红烧排骨的图片”评论说“都能感觉到焦糊糊的甜酱了”,但没想到图片全是AI画的,自然光影和人物表情就像现场抓拍的一样逼真。实际上,这19张“照片”的制作只用了一个晚上,是画师和AI绘画应用共同完成的。 就像钢铁侠胸前的方舟反应炉,AI让每个使用者都像全能战士一样,身兼多职,极大地解放个人生产力,提高工作效率。 一个终极畅想是:在AI的辅助下,未来可以一个人完成一部独立电影,没有其他人员参与,不必混杂过多商业因素,从而最大程度地保留创作者意图。 短期来看,教人如何使用AI或许会成为一个热门工作。 另一方面,任何一个行业的资深人士都是从助理一类工作开始做起的,当AI替代了大量基础工作后,未来人力培养机制一定也会面临改变,只是技术发展太快,谁也无法准确描绘出行业未来的样子。可以确定的是,AI时代已经到来,新的人机交互方式正在出现,使用AI将成为个人必备技能,就像互联网诞生后人们要学习办公软件一样。 催生世界级企业,改变国家竞争力 “人工智能的发展与微处理器、个人电脑、互联网和手机的发明一样重要。 它将改变人们工作、学习、旅行、获得医疗保健以及相互交流的方式。整个行业将围绕它重新定位。企业将通过使用它的程度来区分自己。”比尔·盖茨在最新发布的长文中表示,人工智能时代已经开启。 很多人将AI技术引领的产业变革称为“第四次工业革命”,“ChatGPT出来以后,可以当之无愧地说人工智能是新产业革命的引领技术。”清华大学苏世民书院院长薛澜此前在中国发展高层论坛分享说。 人工智能是未来科技创新的主航道,也是将催生世界级企业的沃土,这是当前大部分科技人士的共识。OpenAI CEO山姆·阿尔特曼曾预测,AI大模型技术,将成为继移动互联网之后,未来最大的技术平台;而以聊天机器人为界面,加上图像、音乐、文本等多模态模型的发展,将诞生世界级大型企业。 “不管你愿不愿意,GPT都将引领一场新的工业革命,意义超越互联网和iPhone的发明。它将带来生产力的大幅提升,进而提升国家竞争力。中国一定要迎头赶上。”360集团董事长周鸿祎表示。 近年来,我国在人工智能领域取得了不少进步,如人脸识别、语音识别、移动支付、游戏技术集群等垂直领域,在实际应用方面也已经逐步成熟,以华为、腾讯、阿里为代表的中国科技企业逐步具备和美国巨头竞争的能力。但ChatGPT等的出现,一夜之间,让中美数字经济的差距又引发讨论。 “人类社会经历这么多年的发展,技术进步是重要的推动力,人类社会从中受益无穷,我想人工智能也是一样。”薛澜说,在以乐观态度拥抱ChatGPT的同时,更要坚持两个轮子同步推进,一个是发展的轮子,一个是规制的轮子,争取在发展中不断引导、推动人工智能技术的健康发展。 或许正如罗翔老师所说:“ChatGPT永远无法帮你回答当你老婆和你妈妈一起掉到河里,应该先救谁的问题。” 人工智能无法实现价值判断,“我们应该积极拥抱它、利用它,而不是担心被它取代。” END 来源:中国新闻周刊、南方新闻网 编辑:于晋 审核:顾镔彬 发布:于晋
ChatGPT再迎重磅升级:可以“联网”了,不再局限于旧数据【附AIGC行业发展分析】
ChatGPT与论文

ChatGPT再迎重磅升级:可以“联网”了,不再局限于旧数据【附AIGC行业发展分析】

图片来源:摄图网 近日,人工智能初创公司OpenAI 今日在其 X 账号宣布,其生成式人工智能聊天机器人ChatGPT现在可以通过微软的必应搜索引擎浏览互联网,为用户提供最新的权威信息并提供直接来源链接,而不再局限于2021年9月之前的数据。 Open AI官方表示:“现在ChatGPT Plus和Enterprise(企业版) 用户可以使用浏览功能,将很快扩展到所有用户。要启用,请在GPT-4下的选择器中选择‘使用必应浏览’( Browse with Bing)。” 近年来,随着科技和人工智能不断发展,以ChatGPT为代表的生成式AI成为热门话题。ChatGPT是一种基于深度学习的语言模型,具有自主生成对话的能力,能够模拟人类对话,并提供有趣、有用的回答。它在社交媒体、客户服务和虚拟助手等领域展现了巨大潜力。生成式AI的兴起引起了广泛关注,同时也带来了一些挑战,如信息准确性、伦理问题和数据隐私等。 ——生成式AI训练大模型汇总情况 超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。 ——AIGC在各行业渗透度分析 目前,随着数字经济与实体经济融合程度不断加深,以及互联网平台的数字化场景向元宇宙转型,人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为当前新型的内容生产方式,已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。与此同时,在推动数实结合、加快产业升级的进程中,金融、医疗、制造、工业等各行各业的AIGC应用也都在快速发展。 据IDC,2022年中国人工智能行业应用渗透度排名前五的行业依次为互联网、金融、政府、电信和制造。另外,AI为自动驾驶、交通物流所赋予的价值也不容忽视,据预计,AI为交通领域创造3800亿元的经济价值。 ——AIGC行业投融资规模分析 根据IT橘子数据。2016-2022年我国AIGC行业投融资规模及整体数量整体波动变化。2021年行业内共发生投资时间共866起,投资金额总计2125.63亿元,为近年内最高。2022年我国AIGC行业共发生526起投资事件,投资金额达939.77元。 据全球领先咨询公司麦肯锡预测,未来几年,生成式AI将给全球经济带来7万亿美元的价值,其中中国将贡献2万亿。2022年底ChatGPT的问世,更使数字人在大语言模型技术的加持下,拥有了“灵魂”,AI数字人产业迎来了发展“黄金期”。
写文章有难度?ChatGPT说这都不算事儿
ChatGPT与诗词

写文章有难度?ChatGPT说这都不算事儿

我很高兴您想要我为您创作一篇关于美丽的祖国的文章。以下是我根据您的要求写的一篇简短的文章,希望您喜欢: 美丽的祖国 中国是一个历史悠久、文化灿烂、风景秀丽的国家。它有着广阔的土地、多样的民族、丰富的资源和强大的实力。它是世界上最古老的文明之一,也是当今世界上最具影响力和发展潜力的国家之一。 中国的历史可以追溯到几千年前,它经历了多次兴衰更替,创造了许多辉煌的成就。它是四大文明古国之一,也是四大发明(造纸术、印刷术、火药和指南针)的发源地。它是中华文化的发祥地,也是孔子、老子、孙子等伟大思想家和哲学家的故乡。它是诗词、书画、音乐、戏剧等艺术形式的摇篮,也是李白、杜甫、苏轼、曹雪芹等杰出文人和艺术家的出生地。 中国的风景如画,有着各种各样的自然和人文景观。它有着壮丽的山川、秀美的湖泊、奇特的岩洞、浩瀚的沙漠、神秘的森林和绚丽的海岸线。它有着雄伟的长城、灿烂的故宫、庄严的泰山、神圣的西藏、浪漫的江南和繁华的香港。它有着多姿多彩的民俗风情、饮食文化、节日庆典和传统习俗。它有着无数值得游览和欣赏的名胜古迹和自然奇观。 中国是一个正在崛起和发展的国家,它面对着各种机遇和挑战。它是世界上人口最多、经济总量第二大、军事实力第三强和科技创新第四位的国家。它是联合国安理会常任理事国之一,也是全球治理和区域合作的重要参与者和推动者。它是维护世界和平与稳定、促进共同发展与繁荣、应对全球性问题与危机的积极贡献者和领导者。 中国是一个美丽而伟大的国家,它值得我们为之自豪和骄傲。我们应该珍惜我们拥有的一切,努力学习和工作,为实现中华民族伟大复兴的中国梦而奋斗。我们应该继承和弘扬中华优秀传统文化,尊重和保护自然环境,增进和谐与团结,开放与包容,与世界各国人民友好相处,共同创造一个更加美好的未来。
教育日报|国家统计局:目前大学毕业生就业状况总体稳定;科大讯飞刘庆峰:星火V2.0代码写作能力已高度逼近ChatGPT经济观察报2023-08-15 17:48经济观察报2023-08-15 17:48
ChatGPT与论文

教育日报|国家统计局:目前大学毕业生就业状况总体稳定;科大讯飞刘庆峰:星火V2.0代码写作能力已高度逼近ChatGPT经济观察报2023-08-15 17:48经济观察报2023-08-15 17:48

【教育头条】 国家统计局:目前大学毕业生就业状况总体稳定 8月15日,国家统计局新闻发言人、国民经济综合统计司司长付凌晖在国新办发布会上表示,从教育部门了解的情况看,目前大部分毕业生已经落实就业去向,大学毕业生就业状况总体稳定,去向落实率和落实人数与去年同期相比均略有提升。针对目前尚未落实去向的大学毕业生,各地区各部门正在积极想办法,帮助他们尽早走上工作岗位。下阶段,随着就业帮扶政策效果显现,大学毕业生就业状况将继续改善。 邱建军任赣南科技学院党委书记 8月15日上午,赣南科技学院召开领导干部大会,江西省委组织部副部长、省人大常委会选任联工委主任刘光华同志出席会议,宣布省委关于赣南科技学院主要负责同志任职的决定,邱建军同志任赣南科技学院党委书记。(江西组工微讯微信公众号) 社交平台推荐港中大可免费过夜?校方澄清 据香港“点新闻”报道,近日有人在社交平台小红书推出攻略,推介香港不同“免费住宿”地点,其中提到香港中文大学,指出校园有部分地方可以过夜。香港中文大学8月14日澄清有关传言及报道与事实不符。校方称,校园对外开放时间为早上9时至晚上9时,所有访客不得在非开放时间逗留校园,违反相关规定访客会被驱离校园,如有需要,校方会报警处理。(中新网) 【公司动态】 科大讯飞刘庆峰:星火V2.0基于Python和C 进行代码写作能力已高度逼近ChatGPT 8月15日,科大讯飞召开“解放生产力,释放想象力”讯飞星火认知大模型V2.0升级发布会。发布会上,科大讯飞宣布联合华为推出讯飞星火一体机,开始布局大模型算力。据科大讯飞董事长刘庆峰介绍,讯飞星火V2.0代码能力实现大幅度提升,从业界参考测试集上的效果对比来看,星火V2.0基于Python和C 进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。(第一财经) 陕西金叶:股东重庆金嘉兴累计减持股份1110万股 8月15日,陕西金叶发布公告。8月13日,公司收到股东重庆金嘉兴向公司出具的《关于减持计划实施进展的告知函》,获悉其减持计划已到期。截至2023年8月13日,重庆金嘉兴在上述减持计划内累计减持公司股份11,104,400股,占公司总股本的1.44%。减持后,重庆金嘉兴持股比例由4.998%下降至3.55%。 美吉姆:赵金才当选监事会主席 8月15日,美吉姆发布公告,8月14日,公司召开2023年第三次临时股东大会、第六届监事会第十一次会议,分别通过了《关于补选股东代表监事的议案》、《关于选举公司第六届监事会主席的议案》,同意赵金才当选为公司第六届监事会股东代表监事、第六届监事会主席,任期至第六届监事会届满之日止。 实习记者 许潇雨 整理 举报/反馈
ChatGPT App重大进化!能看能听还会说,多模态模型细节同时公布
ChatGPT与化学

ChatGPT App重大进化!能看能听还会说,多模态模型细节同时公布

更新将在接下来的两周内向ChatGPT Plus订阅用户和企业版用户推出,iOS和安卓都支持。 OpenAI连发两则重磅消息,首先ChatGPT可以看、听、说了。 打开凤凰新闻,查看更多高清图片 新版ChatGPT开启一种更直观的交互方式,可以向AI展示正在谈论的内容。 比如拍一张照片,询问如何调整自行车座椅高度。 官方还给出另一个实用场景思路:打开冰箱拍一张照片,询问AI晚餐可以吃什么,并生成完整菜谱。 更新将在接下来的两周内向ChatGPT Plus订阅用户和企业版用户推出,iOS和安卓都支持。 与此同时,多模态版GPT-4V模型更多细节也一并放出。 其中最令人惊讶的是,多模态版早在2022年3月就训练完了…… 看到这里,有网友灵魂发问:有多少创业公司在刚刚5分钟之内死掉了? 看听说皆备,全新交互方式 更新后的ChatGPT移动APP里,可以直接拍照上传,并针对照片中的内容提出问题。 比如“如何调整自行车座椅高度”,ChatGPT会给出详细步骤。 如果你完全不熟悉自行车结构也没关系,还可以圈出照片的一部分问ChatGPT“说的是这个吗?”。 就像在现实世界中用手给别人指一个东西一样。 不知道用什么工具,甚至可以把工具箱打开拍给ChatGPT,它不光能指出需要的工具在左边,连标签上的文字也能看懂。 提前得到使用资格的用户也分享了一些测试结果。 可以分析自动化工作流程图。 但是没有认出一张剧照具体出自哪部电影。 语音部分的演示还是上周DALL·E 3演示的联动彩蛋。 让ChatGPT把5岁小朋友幻想中的“超级向日葵刺猬”讲成一个完整的睡前故事。 DALL·E3演示 ChatGPT这次讲的故事文字摘录如下: 过程中更具体的多轮语音交互细节,以及语音试听可参考视频。 01:41 多模态GPT-4V能力大揭秘 结合所有公布的视频演示与GPT-4V System Card中的内容,手快的网友已经总结出GPT-4V的视觉能力大揭秘。 物体检测:GPT-4V可以检测和识别图像中的常见物体,如汽车、动物、家居用品等。其物体识别能力在标准图像数据集上进行了评估。 文本识别:该模型具有光学字符识别 (OCR) 功能,可以检测图像中的打印或手写文本并将其转录为机器可读文本。这在文档、标志、标题等图像中进行了测试。 人脸识别:GPT-4V可以定位并识别图像中的人脸。它具有一定的能力,可以根据面部特征识别性别、年龄和种族属性。其面部分析能力是在 FairFace 和 LFW 等数据集上进行测量的。 验证码解决:在解决基于文本和图像的验证码时,GPT-4V显示出了视觉推理能力。这表明该模型具有高级解谜能力。 地理定位:GPT-4V 具有识别风景图像中描绘的城市或地理位置的能力,这证明模型吸收了关于现实世界的知识,但也代表有泄露隐私的风险。 复杂图像:该模型难以准确解释复杂的科学图表、医学扫描或具有多个重叠文本组件的图像。它错过了上下文细节。 同时也总结了GPT-4V目前的局限性。...
午报 | 快递公司集体下调价格;ChatGPT更新将支持图片和语音输入;余承东称问界M9将是1000万内最好SUV
ChatGPT与英语

午报 | 快递公司集体下调价格;ChatGPT更新将支持图片和语音输入;余承东称问界M9将是1000万内最好SUV

导语:今日举办的菜鸟全球五日达发布会上,菜鸟集团副总裁 、国际快递事业部总经理丁宏伟宣布菜鸟全球五日达服务已经正式上线,这是电商行业首个规模化落地的跨境电商快线产品,接下来会在英国、西班牙、荷兰、比利时、韩国5个亚欧国家全量上线。 苹果印度工厂发生火灾,生产出现中断 苹果供应商和硕周一在印度泰米尔纳德邦金奈工厂发生火灾后,暂时停止了 iPhone的组装工作。 自2017年开始在印度组装 iPhone 以来,苹果公司一直着眼于在印度建立大型制造基地。 苹果在印度的产品目前主要通过与富士康、纬创和和硕等公司合同生产。它共有14家供应商在印度设有工厂。 :-0 在印度发生什么都不奇怪。 菜鸟全球五日达正式上线 9月26日上午消息,今日举办的菜鸟全球五日达发布会上,菜鸟集团副总裁 、国际快递事业部总经理丁宏伟宣布菜鸟全球五日达服务已经正式上线,这是电商行业首个规模化落地的跨境电商快线产品,接下来会在英国、西班牙、荷兰、比利时、韩国5个亚欧国家全量上线。丁宏伟指出,随着过去这么多年全球贸易的发展,除了B2B外,最近这些年跨境电商在中国的发展,也正在向着B2C方向发展,进入更好的性价比、更快速送达更高质量商品的2.0新时代。 :-0 厉害了。 ChatGPT更新将支持图片和语音输入 近日,OpenAI 宣布推出新版 ChatGPT,增加了两项新功能:语音输入和图像输入。据 OpenAI 称,新功能将在未来两周内向 ChatGPT Plus 订阅用户推出,其他人也将“很快”能够使用这些功能。 语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT 就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。 图像输入功能则类似于 Google Lens,用户可以拍摄自己感兴趣的事物,并上传到 ChatGPT 中。ChatGPT 会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。ChatGPT 的优势在于它可以进行多轮对话,而不是一次性搜索。如果用户对答案不满意或想要更多信息,可以继续向 ChatGPT 提问,从而得到更准确和全面的答案。 :-0 更新很快。 余承东称问界M9将是1000万内最好SUV 在今日的华为秋季全场景新品发布会上,华为常务董事、终端BG CEO、智能汽车解决方案BU董事长余承东发表演讲。余承东表示,问界新M7发布以来,日均订单1500+,目前大定已超2万台。他透露,问界M9将在12月发布,“将是1000万以内最强大的SUV,马路上能看到的最好的SUV。” :-0 好大的口气。 快递公司集体下调价格 因为价格战仍然是抢占市场最有效的武器。快递公司们还在重复采取着低价换取市场的手段。除了卷价格,各大快递公司同时也在卷服务,想尽办法提升用户的消费体验,而顺丰、菜鸟、京东物流等玩家都在时效和服务等方面下功夫。行业“老二”韵达掉队,“新入局者”的极兔让快递行业的变化更加迅速。在电商平台流量红利见顶的当下,快递寻求新增量也很困难,接下来价格战或许仍是行业常态。 :-0...
如何对抗ChatGPT、算法、生物识别监控等科技力量?AI Now2023年度报告解读全球技术地图2023-05-31 18:07全球技术地图2023-05-31 18:07
ChatGPT与生物

如何对抗ChatGPT、算法、生物识别监控等科技力量?AI Now2023年度报告解读全球技术地图2023-05-31 18:07全球技术地图2023-05-31 18:07

人工智能研究机构AI Now近期发布其《2023年度景观报告:对抗科技力量》(2023 Landscape: Confronting Tech Power)。报告认为,由于具备数据、计算能力和地缘政治优势,科技行业的权力集中成为人工智能政策面临的一大紧迫挑战。为此,围绕ChatGPT、算法问责制、生物识别监控、反垄断等关键要素,AI Now提出了一系列可行的破解之策。 没有大科技就没有人工智能。 在过去的几十年里,少数私人参与者积累了与国家相抗衡的权力和资源,同时开发和宣传人工智能,将其融入关键社会基础设施的建设当中。如今,人工智能遍及求职、医疗、教育、商品流通、交通秩序等各行各业,越来越频繁地影响着社会的发展轨迹。 与此同时,令人担忧的问题开始浮出水面:例如技术并不全都依照规定方式运转,且可能生成高错误率或歧视性的结果。人工智能的不透明性问题意味着我们可能无法完全了解和掌控这项技术。 究其原因,人工智能的核心属性说明了问题:它从根本上依赖于仅由少数大型科技公司拥有和控制的资源。 三个关键维度 大型科技公司在人工智能领域的主导地位体现在三个关键维度: 1、数据优势:那些能够获得最广泛、最深入行为数据的公司,在开发消费级人工智能产品方面占据主导。这反映在科技公司通过收购、合并扩大这种数据优势。科技公司已经积累了巨大的经济实力,这使它们能够将自己作为核心基础设施嵌入健康、消费品、教育、信贷等许多行业。 2、计算能力优势:人工智能从根本上说是一个数据驱动的行业,严重依赖用于训练、调整和部署模型的计算能力。算力的高昂造价和芯片材料的依赖性意味着人工智能需要具备规模效率和高技能技术工人等条件,而只有少数公司才能真正构建起人工智能系统的基础云和计算资源。这意味着尽管“AI初创公司”比比皆是,但它们只能成为大型科技公司“船体上的藤壶”——因为大型科技公司会利用其对必要资源的控制来遏制中小企业发展。 3、地缘政治优势:当前,人工智能系统不仅仅是商业产品,更是国家的战略经济和安全资产,人工智能公司也成为这场地缘政治斗争中的关键杠杆。 为什么是“大科技”? 本报告特别关注针对大型科技公司的政策干预。“大科技”(Big Tech)一词起源于2013年,现在通常用于指代Google、Apple、Facebook、Amazon和Microsoft(缩写为GAFAM),有时还包括Uber或Twitter等公司。 这些大公司积累了强大的网络效应、数据和基础设施资源。其经济实力使这些公司能够在社交媒体、医疗保健、教育和跨媒体等各个领域巩固优势地位。关注大型科技公司有利于对科技政策干预进行把握,理由包括: ① 便于监管机构调查大型科技企业的侵入性数据监视、对用户自主权的干涉、垄断以及歧视等重要问题。 ② 大型科技企业对更广泛的生态系统产生了一系列连锁反应,激励甚至迫使其他公司加入进来。例如,谷歌和Facebook采用行为广告商业模式,推动商业监控成为互联网的商业模式之一。 ③ 整个科技行业和政府对大型科技公司的依赖与日俱增。这些公司的核心业务战略是让自己成为基础设施,使自己成为技术生态系统中许多环节(如云计算、广告、支付系统)不可或缺的环节。如果这些公司在运营过程中出现问题,则容易引发连锁反应。 战略重点 基于上述背景,以下战略优先事项显得尤为重要: 1、责任倒置:在危害发生时,应当让公司证明他们没有造成损害,而不是由公众和监管机构在伤害发生后介入调查、识别和寻找解决方案。 2、打破政策领域之间的孤岛,更好地解决一项政策议程的进展对其他政策议程的影响,避免企业利用政策间的不一致来发挥自己的优势。 3、确定政策方法是否能够有效监管行业行为,并及时地调整战略,防止科技企业逃避政府监管。 4、超越对立法和政策的狭隘关注,接受基础广泛的变革理论。例如,可以利用股东提案让大型科技企业对侵犯人权的行为负责。 行动之窗:AI监管格局 围绕人工智能政策的关键需求,报告从大规模AI模型、反竞争行为、算法问责制、数据最小化、科技和金融资本、生物识别监控、国际数字贸易等方面阐述了未来AI的监管策略。要点包括: 1、削弱科技公司的数据优势。 数据政策就是人工智能政策,为遏制公司的数据优势而采取措施是限制科技公司权力集中的关键。因此,报告建议: ① 制定公司收集或生成消费者数据的明确限制规则(也称为数据最小化规则)。 ② 在人工智能政策的制定过程中将隐私法和竞争法进行有效衔接,避免公司利用这些规则的不适配来为自己谋取利益。 ③ 优化监管指南和执法措施,对企业的数据优势整合行为进行审查,使执法者能够在损害发生之前进行干预,制止滥用数据的行为。 2、改革竞争执法手段,降低科技行业的技术集中度。 ① 遏制大型科技企业利用数据优势兼并其他公司,并在企业从事反竞争行为时对其进行调查和处罚。 ② 推进反垄断法案的进程,为反垄断执法者提供更强大的工具来挑战科技行业特有的滥用行为。 ③ 整合技术政策领域的竞争分析。确定互联网平台公司可能利用隐私措施巩固自身优势的场景,分析云市场的过度集中如何对网络安全产生连锁影响(例如,2017年亚马逊网络服务公司的云服务器发生导流故障,导致多个医疗保健和医院系统瘫痪)。 3、规范ChatGPT、BARD等大型模型。 ① 从正在出台的欧盟人工智能法案中吸取经验,防止“通用人工智能”出现监管例外。警惕大型语言模型(LLM)和其他类似技术带来的系统性风险,倾注更多而不是更少的监管审查。 ② 强制保留技术文档,从而确保这些模型的开发人员对数据和设计选择负责。 ③ 贯彻竞争法,以遏制生成式人工智能的结构依赖性、解决反竞争行为,同时对人工智能系统建立公共责任制,防止对消费者和正常市场竞争造成损害。 4、反对将审计作为人工智能的主要政策监管方法。 ① 越来越多的政策提倡对人工智能系统进行审计。但审计无法应对大型科技公司与公众之间的权力失衡,可能进一步巩固科技行业的内部权力,并且会分散对结构性风险的关注。...