LAION:从高中教师到生成式AI剧变的推手
这篇文章讲述了高中教师舒曼如何创立了LAION数据集,该数据集成为了各种生成模型,如谷歌Imagen、Parti和Stable Diffusion的基础。舒曼团队通过抓取随机HTML代码和描述性文本来建立数据集,并将这些图像与描述性文本联系起来,最终形成了超过4亿个图像-文本对。LAION data集被广泛应用于诸如Google Brain等论文和实验中,引发了科技大佬们的关注,但也引发了对数据隐私和社会影响的担忧。尽管如此,舒曼仍然保持着对数据的独立性和工作的独立性,继续在德国汉堡市担任普通高中教师。



