AI数据的民主化:一位高中教师如何创造世界最大免费开源数据集
AI与物理

AI数据的民主化:一位高中教师如何创造世界最大免费开源数据集

这篇文章讲述了德国高中教师舒曼如何创立了LAION数据集,该数据集成为了各种生成式AI模型的重要来源,如谷歌Imagen、Parti和Stable Diffusion。两年前,舒曼创立了LAION,如今被用于各种生成模型。他创建了一个包含4.13亿图像-文本对的数据集,这个数据集是通过在网络上抓取随机HTML代码来定位图像,并将这些图像与描述性文本联系起来,最后还需根据一定规则来过滤掉不适合的样本。在OpenAI推出DALL-E之前,舒曼已经开始关注数据私有化的问题,担心将数据集中在少数公司对社会产生不好影响。
中国ChatGPT之路:迈向数字化未来的挑战与机遇
AI与物理

中国ChatGPT之路:迈向数字化未来的挑战与机遇

文章主要介绍了美国OpenAI推出的大语言模型ChatGPT在全球范围内受到关注,我国也有一定进展。文章指出,ChatGPT代表着人工智能发展的新拐点,但其并非终点,中国仍需在底层技术上进行自主创新和发展。文章提出,我国需要依靠科技企业和研究机构的合作,推动人工智能大模型技术创新和发展,并加强基础研究和核心人才培养。此外,还需要优化政策环境,支持新型基础设施建设,加快算力、算法、数据等方面的进步,以实现我国AI技术的快速发展。
中国ChatGPT之路:挑战、机遇与未来发展
AI与物理

中国ChatGPT之路:挑战、机遇与未来发展

文章主要介绍了我国人工智能领域的发展现状和挑战。ChatGPT作为一款能与人类对话的机器人引起了全球关注,而我国的科技企业在底层技术能力和商业模式上的欠缺也成为了制约因素。尽管我国数字经济规模较大,但仍然需要解决底层技术缺失的问题。全国政协委员们纷纷提出建议,认为我国需要加强人工智能基础研究和人才培养,并加快新型基础设施建设,以迎头赶上国际先进水平。