两年前接受HuggingFace捐赠,德国高中教师打造4.13亿图像-文本数据集,引发AI界剧变
这篇文章讲述了一位普通高中教师舒曼如何创立了一个估值40亿美元的独角兽公司LAION,该公司提供了世界最大的免费开源数据集,并被用于各种生成模型,包括谷歌Imagen、Parti以及Stable Diffusion。在创建过程中,舒曼和他的团队用了数百万张抽认卡来教一个人一门外语,并在2021年发布了LAION-400M数据集。尽管数据集受到了各方的关注和资金支持,但舒曼仍然保持了工作的独立性,并婉拒了各类工作邀请。

