揭秘!华为大手笔揽‘天才少年’,5倍薪酬的背后究竟有何秘密?百度希壤遭遇离职风暴,元宇宙真的那么遥不可及吗?
AI与化学

揭秘!华为大手笔揽‘天才少年’,5倍薪酬的背后究竟有何秘密?百度希壤遭遇离职风暴,元宇宙真的那么遥不可及吗?

华为发布“天才少年”招募计划,以高额薪酬在全球范围内寻找在数学等多领域有专长的潜在技术领导者;百度副总裁马杰离职导致其元宇宙业务“希壤”面临挑战,团队处境不明,业务模式和盈利能力的问题被认为是该业务边缘化的主要原因。
高中教师养出40亿美元超级独角兽,还参与发布了ChatGPT最大平替37年前,一女婴移植”狒狒心脏”,手术无比成功,后来咋样了?
AI与物理

高中教师养出40亿美元超级独角兽,还参与发布了ChatGPT最大平替37年前,一女婴移植”狒狒心脏”,手术无比成功,后来咋样了?

来源丨量子位(ID:QbitAI)作者丨杨净题图丨摄图网他本是一位普普通通的高中教师,却活生生养出一个估值40亿美元独角兽。而且方法也是非常的独特——打造了世界最大的免费开源数据集,却从未从中收取过一分钱,也婉拒了各类工作的邀请。 他叫舒曼,在德国汉堡市的高中教物理和计算机科学。两年前他创立了LAION(相当于CLIP图文数据集),如今被用于各种生成模型,包括谷歌Imagen、Parti,以及惊艳全球的Stable Diffusion。就连Stable Diffuision背后公司Stability AI的创始人曾亲自来送钱时,他都表现出嗤之以鼻的样子,认定“这个人一定是疯了”。或许他怎么也没想到,只不过两年前灵机一动,就带来了生成式AI的剧变。受DALL-E启发2021年新年之际,OpenAI重磅推出DALL-E,GPT-3首次成功实现跨界: 只需对着它说上一段话,就能生成对应图片。 一时间风光无两,吴恩达在内的科技大佬们都激动了,网友们都称其为甲方克星。但在德国汉堡市郊区的一间房屋内,这位高中教师舒曼(Christoph Schuhmann)却产生了对数据私有化的担忧: 如果这一切都集中在一家、两家或三家公司,那将对社会产生非常糟糕的影响。 当时,OpenAI发表了背后关键模型CLIP的论文。论文中显示,CLIP在4亿个图像-文本对上进行了预训练,在没有精细调整的情况下,最终在各种多模态基准中实现高性能。 由此可见数据集对于CLIP的重要性,但OpenAI并没有进行公开,它只开源了CLIP的代码和模型权重。(看来从那时候就已经变得Close了)于是乎,舒曼就开始在Discord网罗了一群同为AI爱好者的朋友,尝试复制OpenAI同等水平的「文本-图像对」数据集。没想到这一搞就搞了大半年,直到2021年8月他们首次发布了LAION-400M数据集,里面包含了4.13亿图像-文本对。回顾整个创建过程,舒曼对彭博社这样形容: 就像是用数百万张抽认卡来教一个人一门外语。 他们用一个非盈利组织Common Crawl在2014年到2021年期间,抓取的随机HTML代码来定位网络上的图像,并将这些图像与描述性文本联系起来,最后还得根据一定规则来过滤掉不适合的样本。比如,删除了所有文本长度少于五个字符;图像小于5KB的的样本;关键字带有NSFW的……几周之内,他们就拥有了300万对图文对。数据集发布之后就收到了各种反响,被用于诸多论文和实验。其中最具代表性的,就是Google Brain去年(2022)发布的Imagen——文本生成图像的扩散模型。 与此同时,更多机构开始关注到这个非盈利组织并给予资金支持。2021年他们就收到了HuggingFace的一次性捐赠。但印象最深的一次,还要属一个对冲基金经理来到Discord聊天室。当时他二话不说直接送钱,大概意思是:我给你们支付算力费用,没有任何附加条件。舒曼团队对这个行为嗤之以鼻,甚至觉得他是个疯子: 一开始我们非常怀疑,但大概一个月后,我们获得了价值近1万美元的云计算服务。 后来,这个所谓的“疯子”创办了Stability AI,使用LAION数据集推出了Stable Diffusion,引领了生成式AI的浪潮,顺便还拐走了LAION组织的两个研究人员。如今Stability AI正在寻求40亿美元(折合276亿元)估值,这主要归功于LAION提供的数据。据彭博社消息,舒曼却并没有从LAION中获利,原因很简单:不感兴趣,希望保持这份工作的独立性。因此他还婉拒了各类工作邀请,依旧选择在德国汉堡当一名普普通通的高中老师。本人:数据集不应该被监控即便如此,随着LAION知名度打响,他还是避免不了地卷入到各种纷扰之中。目前,LAION已经发布了10项数据集,最具代表性的就是去年3月发布的LAION-5B,由58.5亿个图像文本组成,是当前最大的免费开源数据集。作为LAION-400M的继任者,它收到了来自HuggingFace、Stability AI以及Doodlebot资助。结果一发布就遭到了不小的争议,网友们纷纷质疑其数据未经整理,导致充斥大量的非法内容,对此LAION工程师Romain Beaumont回应: 非标注数据集是自我监督学习的基础,这是机器学习的未来。没有人工标注的图像/文本是一项功能,而非错误。 早在Imagen发布时,也专门针对LAION-400M做出警示:因为依赖于这种未经整理的网络数据, 集成了大模型的社会偏见和限制,因此不适合公开使用。 据彭博社消息,为了打造LAION,舒曼团队从亚马逊网络服务、Shopify等公司获取视觉数据,还有包括YouTube缩略图、各类新闻网站上的内容。对此舒曼表示,任何在网上免费提供的东西都是公平竞争,欧盟也没有人工智能法规。更何况,也没有人知道OpenAI实际上用什么样的数据集训练AI的。目前,LAION被迫卷入两场诉讼之中,一起是Stability AI与Midjourney等集体诉讼,被指使用艺术家的版权图片来训练他们的模型;另一起是Getty Images起诉Stability AI,称其1200万张照片被LAION取走,并用来训练Stable Diffusion。而舒曼将LAION比作大信息技术海啸之上一艘“小型研究船”,采取海下的样本向世界展示。其实早在构建数据库时,他们就在运行一个自动化过滤工具,不过舒曼感兴趣的不是清理,而是从这些资产中学习。 我们本可以从公布的数据中过滤掉暴力,但我们决定不这样做,因为这将加快暴力检测软件的开发。 现在更多关于监管的建议在推动,各个科技大厂也在采取相应的措施,比如英伟达就开源了护栏工具,来防止大模型来胡说八道。但在舒曼看来,数据集不应该被监控。这也正是当时创建LAION时候的初心。他还警告,如果我们试图放慢速度、过度监管,就会有很大的危险,最终只有少数大公司能负担得起所有的正式要求。前段时间,在LAION与全球志愿者的合力之下,他们完成了ChatGPT最大开源平替OpenAssistant的发布。60万余条训练数据全部由人工生成,涵盖了广泛的话题和语言风格,一时间引发众人关注,HuggingFace也直接拿来用来构建它自己的聊天软件HuggingChat。拿着德国铁饭碗不可否认的是,他已经在用开源数据集,加剧了生成式AI的浪潮。但在舒曼的个人网站上,看到的只是一位两个孩子的父亲,在德国当着终身制公务员,游走于中学校之间讲授物理和计算机科学。 舒曼拥有维也纳大学计算机科学与物理学学位。在学习这两个专业之前,他还学了心理学。(大概完成了50%的学士学位然后就转专业了)。除此之外,他还在学习表演,制作了一部关于孩子学习的纪录片「Schools of Trust」。最近,这位高中教师也没闲着,他还将作为2023年智源大会嘉宾参与邀请报告与线上论坛环节。参考链接:[1]https://laion.ai/blog/laion-400-open-dataset/[2]https://www.bloomberg.com/news/features/2023-04-24/a-high-school-teacher-s-free-image-database-powers-ai-unicorns[3]http://christoph-schuhmann.de/[4]https://www.infoq.com/news/2022/05/laion-5b-image-text-dataset/[5]https://laion.ai/projects/ 找靠谱商机,关注创业邦视频号!
华为5倍薪酬再招“天才少年”;格力解散手机核心团队;百度“希壤”陷入边缘化危机;ChatGPT上架苹果美国应用商店丨邦早报时隔60年,梦露的露背钻石裙,如今依旧美丽动人,相比梦露缺少了一些韵味
AI与物理

华为5倍薪酬再招“天才少年”;格力解散手机核心团队;百度“希壤”陷入边缘化危机;ChatGPT上架苹果美国应用商店丨邦早报时隔60年,梦露的露背钻石裙,如今依旧美丽动人,相比梦露缺少了一些韵味

点此收听更多音频版早报 【华为再招“天才少年”,将提供5倍以上薪酬】5月19日,据华为招聘官微消息,华为面向全球招募“天才少年”,招聘要求为不限学历和学校,在数学、物理、化学、材料、计算机、智能制造等相关领域有特别建树并有志成为技术领军人物。华为方面表示,将提供5倍以上薪酬。(澎湃新闻) 【百度副总裁马杰离职,元宇宙业务“希壤”陷入边缘化危机】百度副总裁、百度“希壤”业务负责人马杰已经于近期离职,希壤团队虽并未解散,但前途目前并不明朗,部分人员已经转岗或离职。内部相关人士表示,元宇宙业务短期内难以看到好的商业模式,盈利能力较差,以及百度转向AIGC相关业务、不愿意向元宇宙业务投入更多资源,是希壤被边缘化的主要原因。截至发稿,百度对此消息未有回应。(科创板日报) 【ChatGPT上架苹果美国应用商店】当地时间5月18日,人工智能研究公司OpenAI在其官网宣布,在美国推出了聊天机器人ChatGPT的iPhone应用,并承诺未来也将为安卓手机提供相同的服务。根据苹果App Store的介绍,该应用仅支持英语,年龄分级为“12岁以上”。下载APP是免费的,但会提供内购项目——目前仅有售价19.99美元的“ChatGPT Plus”。值得注意的是,在上架不到12小时后,目前ChatGPT应用已经冲到了美国苹果应用商店免费APP排行第二的位置。(澎湃新闻) 【苹果限制员工使用ChatGPT等外部AI工具】5月18日消息,文件显示,苹果已限制在公司内使用ChatGPT和其他外部AI工具,目前该公司正开发自家的类似技术。文件指出,苹果担心使用外部程序的员工“可能会泄露机密数据”。据悉,该公司还告知员工不要使用微软的GitHub Copilot。(华尔街日报) 【多个渠道的可口可乐出现涨价,3.5元时代或将告别】近日,多个终端的可口可乐都进行了不同程度的涨价,便利店、小超市以及不同商超可乐售价都略有不同。以最常见的500ml塑料瓶装可口可乐为例,红星资本局走访发现,在成都市一家连锁便利店里售卖的该规格可口可乐和百事可乐均为3.8元/瓶,收银员表示涨价从今年开始。在红旗连锁和永辉超市的该规格可口可乐售价均为3.5元/瓶,有收银员表示,也是今年涨到3.5元。在更分散的街边小店和餐饮店,该规格可口可乐的售价在3元至4元/瓶不等,一位餐饮店老板表示去年就涨价到了4元/瓶。(红星新闻)【探访ofo戴威美国咖啡店:咖啡店目前不赚钱】近日ofo创始人戴威赴美创业,开了一家名为About TimeCoffee(咖啡时光)的咖啡店引起热议。有博主实探About Time Coffee咖啡店。博主介绍,该咖啡店目前在纽约有五家店,位置都在繁华地区,除了特色珍珠咖啡,售卖的还有常规咖啡,价格在2-4美元,和网红店营销方式一样,新用户首次下戴app注册,还能免费送五杯。他们也在社交媒体上做了推广,目前咖啡店应该不赚钱。(新浪财经) 【格力解散手机核心团队,或不再出手机新品】5月19日消息,格力电器已解散手机核心团队。一位于去年离职的员工透露,格力手机业务最早在珠海组建,于2019年左右将核心团队搬至深圳。该人士透露,深圳团队包括开发、测试以及行政人资部门,高峰时期有接近100人。但从去年开始,深圳团队逐渐解散,到2022年中期还剩40余人,之后“深圳团队全部解散,后面应该不会再做手机了。”该人士称。(界面新闻) 【Meta旗下Instagram准备在夏季推出与推特竞争的新产品】Instagram正计划推出一款基于文本的应用,将与推特展开竞争。根据知情人士透露,该公司目前正在与知名人士和网红合作,对该项目进行测试。其中一位知情人士表示,该产品几个月来一直秘密地供特定创作者使用。在加州大学洛杉矶分校(UCLA)教授社交和网红营销相关课程的Lia Haberman表示,这款应用程序将独立于Instagram推出,但会允许用户关联相关帐户。她发布了一个有关初期产品描述的屏幕截图。该截图显示,这款产品最终可能会与Mastodon等其他推特竞争者相兼容。(财联社) 【知乎推出全新故事品牌“盐言故事”App】知乎宣布其短故事业务独立分拆,推出全新故事品牌“盐言故事”App,定位原生短故事平台。(和讯网) 【法拉第未来FF 91车型合规认证工作仍在进行】北京时间5月19日,法拉第未来(NASDAQ:FFIE)宣布在5月17日为其主要供应商和战略合作伙伴的全球供应链网络举办了2023年全球供应商在线峰会。本次供应商峰会吸引了超过200家的FF供应商报名参加。据法拉第未来披露,其首款豪华电动汽车产品FF 91的合规认证工作正在按计划进行。大部分的FMVSS测试已经成功完成。难度最高的碰撞科目已经进行并成功通过了所有这些测试科目,其中包括车辆正面、侧向和后面的碰撞测试。(每日经济新闻) 【蓝色起源公司赢得美国航天局建造月球着陆器合同,价值34亿美元】美国航天局周五表示,杰夫·贝佐斯(Jeff Bezos)的蓝色起源公司(Blue Origin)赢得了美国航天局(NASA)34亿美元合同。蓝色起源公司计划与洛克希德马丁公司、波音公司 、软件公司Draper以及机器人公司Astrobotic合作,共同建造月球着陆器。(财联社) 【三星暂停考虑将手机默认搜索引擎从谷歌换成必应】5月19日消息,三星已经暂停了一项考虑将智能手机的默认搜索引擎从谷歌换成必应的内部调查。今年,微软必应增加了ChatGPT的支持功能。鉴于市场担忧这一转变对三星和谷歌的业务关系的影响,三星决定目前不会在内部进一步讨论这一问题。(华尔街日报) 【迪士尼放弃9亿美元美国佛州新园区计划】迪士尼乐园、体验和产品部门负责人Josh DAmaro在给员工的邮件中提到,“鉴于宣布这个项目以来发生的巨大变化,包括新领导层和不断变化的商业条件,我们决定不再继续推进”。据悉,不断变化的商业条件包括裁员以及该公司与佛州议员和该州州长德桑蒂斯之间日益紧张的关系。迪士尼正裁减7000名员工,并从内容和行政预算中削减55亿美元。(澎湃新闻) 【被禁一年后,SHEIN或重返印度市场】 知情人士透露,中国跨境电商SHEIN最快将于本月重返印度市场,与印度最大零售企业之一展开合作,以抓住印度不断增长的消费市场商机。上述知情人士称,印度政府已批准SHEIN与印度企业集团信实工业(Reliance Industries)的零售子公司Reliance Retail合作。Reliance Retail在印度各地经营着超1.5万家门店,销售包括食品杂货和服装在内的各种商品。这些人士称,达成协议后,SHEIN可能从印度小企业采购面料。(DoNews) 【苹果前高管:苹果MR设备或是史上最糟糕科技产品】据报道,美国苹果公司研发的增强现实(MR)头戴设备基本就绪,外界预计未来几个星期之内将向世人解开神秘的面纱。不过,曾经负责苹果市场营销工作的前任高管迈克尔·加滕伯格(Michael Gartenberg)表示,苹果增强现实头显可能成为有史以来最糟糕的科技产品之一。加滕伯格指出,苹果这一头戴设备是一个高风险的“赌博”,最重要的原因是竞争对手推出的类似产品没什么市场。目前,包括Magic Leap以及微软公司均销售增强现实头戴设备,但是销量相当平庸。(新浪财经) 【推特致函微软,称后者可能违反API使用政策】据报道,推特已致函微软,称后者“似乎将Twitter API用在未经授权的用途和目的上”。这封信函由推特写给微软CEO萨提亚·纳德拉,标注日期为当地时间周四,重点是微软在部分产品中使用推特的应用编程接口(API),其中包括与Xbox有关的产品、搜索引擎必应以及广告和其他工具。API让程序开发者可分析推特的部分数据,并利用这些数据构建工具。(财联社) 【英国政府提出5亿英镑补贴计划,捷豹路虎倾向在英建电动汽车电池超级工厂】5月18日消息,英国财政大臣杰里米·亨特向印度塔塔集团旗下捷豹路虎提出5亿英镑政府补贴,希望后者在英国而非西班牙建造电动汽车电池超级工厂。英国政府提出的一揽子支持计划包括现金补助、削减能源成本和支付升级捷豹路虎厂区周边电力网络的费用。据彭博报道,知情人士称,在英国政府提出补贴方案后,捷豹路虎目前倾向于在英国萨默塞特设厂。(界面新闻) 【现代汽车及起亚同意支付2亿美元和解美国汽车盗窃案】现代汽车和起亚同意就其车型在美被盗事件频发的消费者集体诉讼达成2亿美元的和解协议。车主方面律师称,这一和解协议涵盖了约900万美国车主,其中1.45亿美元用于赔偿汽车被盗消费者的自付损失。和解协议涵盖了2011-2022款现代或起亚车型的车主,这些车型配备传统的“插入转动式”钥匙点火系统。(界面新闻) 【韩国三大电池厂商今年末订单积压量将达7490亿美元】据韩国产业通商资源部有关人士表示,到今年年底,韩国三大电池制造商LG新能源、三星SDI、SK On的累计订单积压量预计将达到1000万亿韩元(约合7490亿美元)。截止到2022年末,这3家公司的未完成订单总额为775万亿韩元。业内人士预测,LG新能源的订单积压量最大,其次是SK On和三星SDI。“目前SK On和三星SDI的订单规模分别为300万亿韩元和100万亿韩元左右。”(财联社) 【迪士尼“星球大战”主题酒店宣布关闭】迪士尼官网显示,迪士尼即将在 9 月关闭位于美国佛罗里达州的豪华“星球大战”主题酒店 GalacticStarcruiser(银河星际巡洋舰)。这是一家主打沉浸式体验的“星球大战”主题酒店,拥有细致的装饰、互动活动、主题餐饮和两晚的现场娱乐体验,价格自然也不便宜。两名成年人的两晚住宿费用约为...