文章主题:周二, Meta, Llama 2, 开源

666AI工具大全,助力做AI时代先行者!

伴随着互联网的快速发展,进了开源软件行业的发展。

周二,Meta 发布了最新一代的开源大语言模型 Llama 2。

打开凤凰新闻,查看更多高清图片

相较于 Meta于2月份推出的第一代大模型Llama 1,Llama 2在多个层面实现了升级。首先,它的训练数据规模扩大了40%,这意味着模型在获取知识时能够接触到更多的信息;其次,用于训练的token数量翻了一番,达到了2万亿,这使得模型在处理信息时更加高效;再者,上下文长度限制也提高了一倍,这有助于模型在理解长篇文本时的表现。综上所述,Llama 2在各方面都展现出了更强的实力。

尽管 Llama 2 的强大程度足以引起整个行业的关注,但这并非最令人惊讶的事情。真正让人感到震撼的是 Meta 公司宣布 Llama 2 将对研究和商用领域完全免费。这一举措无疑将彻底改变整个行业的发展格局。

这表明,许多研究机构和企业可以免费利用开源的Llama 2,无需投入大量资金进行大型模型的开发。这样做不仅可以降低企业的研发成本,还可以帮助Meta吸引更多的合作伙伴,从而进一步促进其在人工智能领域的的发展。

目前与 Llama 2 合作的就包括了微软、亚马逊、IBM、高通、Spotify 等知名企业。

对于Llama 2的介绍,网络上的资源已经非常丰富,因此在这里我们不再重复讨论,转而探讨一个与互联网时代紧密相关的概念——开源。尽管如今开源的概念越来越普遍,但许多人对其仍存在一定的误解和陌生感。因此,在这篇文章中,我将带领大家深入了解一下开源的真正含义和其在现代社会中的重要性。

开源的基本概念

所谓“开源”,即开放源代码,也称源代码公开,是软件的一种散布形式,而开源软件即公开源代码的软件。

在计算机领域中,大部分软件都是基于开源协议发布的,用户可以自由获取并修改源代码。然而,有一类软件的源代码并不公开,只有软件的创建者或著作权所有者能够访问,这些软件被称为闭源软件。一般情况下,闭源软件的二进制可执行版本已经被制作完成,其他人只能通过安装这些可执行文件来使用软件。

原内容为:开源软件的魅力并不仅仅在于源代码的透明度,其核心价值在于允许其他人在遵循开源协议的前提下,对软件进行深入研究、个性化的调整以及自由地再分发。这种设计理念鼓励了全球范围内的程序员和开发者共同参与软件的开发与改进,从而推动了技术的创新和发展。

开放源代码的定义最先由 Bruce Perens 提出,经由 Eric S.Raymond 发展,主要有以下十条:

开源的历史

虽然现在人们用到的软件,闭源居多,但最早期的软件开发,软件都是开源的,因为早期硬件发达,而软件只是附属品。

例如在 1970 年之前,IBM 出售的大规模计算机,采用的部分软件,软件公司会提供源代码,让懂程序的维护人员知道软件是如何运作的,方便修正或添加想要的功能。

*IBM S/360 计算机,于 1964 年推出

后来随着软件行业的发展,软件公司意识到其中的商业利益,开始进入封闭式的开发模式,不再提供软件的源代码,人们称其为“教堂式”。

所谓教堂式,就是将软件开发比作建造一座教堂,应该由高手或专家来设计并建造,等到版本成熟时才开放提供给用户,并利用知识产权制度将开放的软件私有财产化,将其闭源,不被他人模仿,以满足企业的商业利益。

我们熟悉的 Windows 系统便是闭源软件开发模式的代表。

*Windows3.0

但闭源软件开发模式带来了一系列问题,比如软件费用高、安全漏洞多、新旧版支持问题、不符合个人需求等等,一部分软件开发者对其不满意,于是兴起了“开放源代码运动”。

开放源代码运动的支持者认为不阻碍合作、可共享的研究风气才是软件开发应有的路径,反对把软件建立在知识产权与许可证的基础之上,认为这样限制了他人利用源代码修改、调整软件以适应自身的需要,阻碍了软件的进一步完善和发展,导致软件安全性下降、创新减少、不兼容等问题。

随着开放源代码运动的进行,产生了许多实际性成果。

Richard M.Stallman 于 1985 年创立了自由软件基金会,并开启了 GUN 项目,后者是一个自由的操作系统,其内容软件完全以 GPL 的方式发布。

*Richard M.Stallman

加州伯克利大学的计算机研究团队发展并改进了 AT&T 的 Unix 系统,建立许多应用程序,并迅速成为“BSD Unix”,后来“BSD Unix”被苹果的 macOS 采用。

1991 年,Linux 内核被芬兰一名大二学生编写出来。

1999 年,Eric S.Raymond 出版了著作《大教堂与市集》,该书讲述了黑客文化史、Linux的开发过程、以及作者本人主持开发的开放源代码软件 Fetchmail 的经历,并讨论了软件开发的方法论。

*Eric S.Raymond

与“教堂式”对应的,开源软件开发模式被称为“市集式”,就是通过不同的软件开发爱好者,组成一个不同流程和不同方式的市集,共同开发软件。

市集式的代表便是 Linux,最初由芬兰大二学生 Linus Torvalds 于 1991 年首次发布 Linux 的内核,后来无数人加入合作使其可用性增强。现如今,采用 Linux 内核的系统已经运行在很多的设备上,比如大型计算机和超级计算机、服务器、手机(安卓)、路由器、电视等等。

*Linux 创始人 Linus Torvalds

开源的意义

在前面提到了,开放源代码运动旨在追求不阻碍合作、可共享的软件开发路径,并认为开放源代码更有利于提高软件的安全性、创新性和兼容性,这是开放源代码最直接的意义。

*Github 上的开源项目

将软件源代码公之于众,使得所有开发者都成为软件的潜在开发者,其中不乏许多优秀的网络人才,共同开发软件,能够让软件存在的漏洞很快被发现并弥补,同时,每个人的想法也能在软件上实现,促进了软件的发展和迭代,有利于软件的发展。

以上是软件开源在软件层面的意义,而像 Meta 将 Llama 2 开源,更多的是商业层面的考量,因为站在 Meta Llama 前面的是 ChatGPT 这个巨头。

Meta 将 Llama 2 开源,能争取更多的开发者支持,包括那些知名的合作企业,从而促进 Llama 的发展,提高市场占有率。过往不乏类似的案例。

Windows 从 3.0 开始取得了广泛的成功,占据了个人电脑操作系统的大部分市场,对微软不满的科技行业从业者,在 Linux 的基础上开发,将后者变成了网站和互联网应用的运行系统。

2007 年 1 月,苹果发布了初代 iPhone,并展示了强大的 iOS 系统。该年11月,谷歌向外界公布了安卓系统,与 84 家软、硬件企业以及电信运营商组成“开放手持设备联盟”,并以免费开源的方式,发布了 安卓的源代码,以此来与 iOS 竞争。

从互联网发展史来看,行业领先的巨头往往会选择闭源式开发,以保证技术领先,赚取更多的商业利益,而后来者选择开源,争取更多的市场和合作伙伴,以此抗衡行业领先者。

因此,“开源”成为部分企业以小博大的战略选择。

例如谷歌虽然不直接通过安卓系统授权获利,但却可以赚取 GMS 的授权服务费,而 Llama 如果取得成功,Meta 未来也能通过其他方式取得收益。

不过,现在站在 Meta 的 Llama 2 前面的巨头不只是 OpenAI 的 ChatGPT,还有 Google 的大语言模型 Bard——是的,将安卓开源的谷歌,在大语言模型开发上选择将 Bard 闭源。

对企业来说,开发软件选择开源还是闭源不是基于主义,商业利益才是最主要的考量因素。

不过值得一提的是,Meta 的 AI 首席科学家杨立昆是一名开源主义者,当初扎克伯格邀请他出任脸书的 AI 实验室主任一职时,他曾要求研究成果必须开源。

*杨立昆Yann LeCun

开源的缺点

在前面,老狐介绍的都是开源的优点,事实上,开源的缺点某种程度上也是其优点带来的,体现了一个事物的两面性。

首先是开源项目参与人数众多,且自发进行,这必然造成管理困难,需要项目领导者付出更多精力去整合项目,做好决策。

例如 80 年代与比尔·盖茨齐名的技术天才米切尔·卡普尔曾出资几百万美元启动一个名为 Chandler 的开源项目,旨在开发一个个人信息管理软件,但因为项目管理混乱,开发人员更迭,项目最后失败。

*米切尔·卡普尔

其次,开源项目迭代频繁,不断有新版本被开发出来,这需要软件用户不断安装新版本,这给用户带来了更高的使用成本。

最后则是开源软件未来的不确定性,因为其成员来自不同的人,软件的质量和未来发展都没法得到保证,一款软件用户正用着可能就没下文了。

以上开源的三个缺点恰好是闭源的商业软件的优势,以 Windows 为例,微软有专业团队负责开发,后期有稳定的更新和维护,能给用户减少许多的麻烦。

写在最后

读到这里,我想大家对“开源”已经有了大概的了解。

近些年,伴随着互联网的快速发展,尤其是大数据、物联网、AI 等技术的火热,开源软件的开发者逐渐增多,相关的开源项目也越来越多,促进了开源软件行业的发展。

一向封闭的微软,也在纳德拉上任后开始拥抱开源。2014 年,微软在开源社区 Github 上开设了账户,并成为社区的最大贡献者;2018 年,微软花费 75 亿美元收购了 Github,后者当时已是全球最大的开源社区和代码托管平台;如今,微软也将与 Meta 的 Llama 展开合作。

*纳德拉和扎克伯格

开源社区 Hugging Face 伴随着 AI 的兴起,成为了开源社区的顶流,如今 Hugging Face 上有超过 25 万个模型,包括 Meta 的 Llama 2、国内王小川创立的百川智能的大语言模型“百川”。

*Hugging Face上的大模型

现在回到文章开头的话题上来,小伙伴们认为 Llama 能通过开源的方式,击败闭源的 ChatGPT 和 Bard 么?

虽然结果老狐也无法预测,但非常乐意见到这样的竞争,这是一场技术落后者借助群众力量与技术领先者的竞争,也是开源的理想主义者与闭源的现实主义者的竞争,结果会怎样呢?

答案在时间里。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *