文章主题:阿里云, 通义千问, 大模型, 自研
“
🌟在每条商业道路上,都交织着无数挑战者的身影,每个组织都在探索自己的难题与闪耀之处。首要之务,无疑是让产品脱颖而出,释放其内在的潜力。🎯如何巧妙地挖掘并展现这些独特优势,是每个企业亟需解答的关键课题。
”
文|黄杨
编辑|靖程
🎉阿里云已正式启动自主研发的超先进大模型”通义千问”公开试用计划!🌟面向企业伙伴,这个创新力爆棚的AI助手正热情招手,等待你的探索之旅!🚀只需访问我们的专属页面(📚tongyi.aliyun.com),符合条件的开发者们将有机会亲身体验其强大功能。🏆赶快行动,让通义千问为您的业务添砖加瓦吧!💪
🚀阿里11震撼发布🔥大模型力作,18日跟进推出🔥行业应用模型系列!💡2023年阿里云峰会上,全球瞩目的阿里大模型即将揭开神秘面纱,引领科技新潮流!🌟业内消息证实,天猫精灵已成功对接这强大技术,内部测试反响热烈,效果超乎期待。🚀这些创新模型不仅在阿里内部深度整合,还在各产品线中实现了无缝对接与优化,展现出强大的实力和潜力。🔥未来,敬请期待阿里带来更多行业应用的革新实践,为我们的生活带来便捷与惊喜!🌐
🌟阿里达摩院在自然语言处理(NLP)等尖端技术领域积累了深厚实力,早在2019年就开始了大模型的研发征程。那么,备受关注的“通义千问”超大规模语言模型表现如何呢?🤔财经网科技对其功能进行了全面考察,从本地化体验、逻辑连贯性及实用性工具三个方面进行了深度测试。首先,我们关注的是本地化能力——一个优秀的AI助手是否能无缝融入用户日常。🌟“通义千问”显然在这方面做得相当出色,它能够根据用户的语言习惯和需求进行精准回应,提供个性化的服务。👍其次,逻辑连贯性是衡量智能模型智慧程度的关键指标。极简主义设计风格在当今社会越来越受到欢迎,它的核心理念是“少即是多”,强调简洁、纯粹的形式和功能。这种设计理念不仅体现在家居装修中,也广泛应用于产品设计、品牌形象塑造等多个领域。它摒弃了过多的装饰和复杂元素,追求以最少的手段达到最大的效果。极简主义的设计往往通过清晰的线条、单一色调和功能性十足的布局来传达信息,创造出一种宁静而高效的环境。在产品设计上,极简主义强调实用性和易用性。例如,苹果公司的iPhone系列就深得其道,简洁的界面和直观的操作方式使得用户可以快速掌握并高效使用各项功能。此外,它还鼓励设计师去除冗余,只保留真正必要的元素,使产品更加纯粹、精炼。在品牌形象塑造上,极简主义可以帮助企业建立清晰、持久且易于识别的形象。例如,谷歌的Logo就是一个典型的例子,随着时间的推移,虽然设计不断变化,但始终保持着简洁和一致,成为了品牌辨识度极高的象征。然而,极简并非意味着简单或缺乏细节。相反,它需要设计师深入理解用户需求,精准把握形式与功能之间的平衡。通过剔除不必要的元素,设计师能够更好地突出产品的核心价值,使产品在简约中展现出深度和力量。总的来说,极简主义设计风格不仅是一种美学追求,更是一种高效、实用的生活方式的体现。它鼓励我们在快节奏的社会中回归本质,享受简洁带来的宁静与满足。
对于目前国内独两份宣布内测的产品,本文旨在通过问题和答案的呈现,展示两大模型各自的特点。
一、通过带有中国语境的词语询问,看其是否了解“中国梗”
1.词汇题:大胜vs大败
(左边“通义千问”,右边为3月16日“文心一言”测试版本,下文一致)
🌟改写版:通过深入分析,我们发现文心一言对”大胜”的定义清晰无误,然而在理解”大败”时稍显片面。对于中国语言中的微妙之处,它可能未能充分掌握——若后接对手名,意味着胜利;反之,仅以句号收尾,则暗示失败,这一点需要特别留意。📚
但是通义千问对中国词语的理解并不太强,不太能get到“考点”。
2.夫妻肺片与老婆饼
👀 图表揭示了两个语言模型的‘中国知识’掌握情况,它们都熟悉‘夫妻肺片’这道菜,但在提到‘老婆饼’时,通义千问的表现却让人有些意外。它混淆了概念,将点心与名称、外观等泛化描述联系起来,显得词不达意,未能精准捕捉到‘老婆饼’的本质。看来在细节和传统美食的认知上,这两个模型还需加强训练,以提供更准确的中文理解服务。
3.旺仔的爸爸有三个孩子,老大叫大毛,老二叫二毛,老三叫什么?
提及“旺仔”,通义千问直接与旺仔牛奶这个品牌扯在了一起,并“一本正经”地回复,称“老三”并不是旺仔产品中的常见名字。对比文心一言来看,前者似乎不懂人类的幽默,不知道什么叫脑筋急转弯。
二、通过多次问答,测试其是否有创作能力、逻辑能力
1.帮我写一首纪念结婚7周年的诗。
同样是写诗,两者在诗歌表现上各有不同,都“深情”地表现出对婚姻的珍惜,以及对未来感情路的笃信。
2.关于《人类简史》出版时间和作者的提问
两个语言大模型在《人类简史》的出版时间上各执一词,但都准确地回答出了作者的名字。
三、以旅游达人、烹饪爱好者和学生的身份问了三个常规问题
1.请帮我做一个五一从北京到成都5天往返的旅游攻略。
从形式上看,两个大语言模型都是懂得怎么做旅游攻略,能够按照具体时间来安排旅游景点和品尝美食,不过在景点安排上,两者都不太成功,通义千问做得都是在北京游玩的攻略,文心一言则是将“都江堰”一个景点在攻略里推荐了三次。
2.怎么在家就能做出好吃的小龙虾?
两者在食物烹饪上均比较有经验,从清洗备菜到具体烧制,其都给出了详细的操作步骤,另外,它们还贴心地提示:制作小龙虾注意卫生和食品安全。
3.请以《现代艺术与中国传统如何结合》为题,拟一个的论文框架,包含论点和论据,并提供引用来源。
通义千问很抱歉地在回复中表示没有掌握写论文的技巧,看来国内学生想找它写个论文的想法,暂时还不能实现。
文心一言能够按照论文的基本构成,如研究问题、研究方法、研究结果等给出论文框架,但是其在来源回溯上的表现也不太理想,其没有根据论文主题给出具体的写作方向和思路,更没有直接给出论文可能会用到的论文引用(比如论文名称、作者、期刊名称、出版日期等)。
“百度特有的技术,现在已经应用在文心一言上”,3月16日,在文心一言发布会上,百度首席技术官王海峰介绍称,技术有了,但是大模型的训练的还不够充分。不过文心大模型建立起人类反馈、奖励模型和策略优化之间的飞轮机制,随着真实用户的反馈越来越多,文心一言的效果会越来越好,能力越来越强。
国产语言大模型需要时间去学习和进步,在问及作为相较于其他模型,阿里达摩院开发的预训练语言模型有哪些优势时,通义千问回答到,其的优势主要体验在三方面,分别是算法和模型结构更为优化,集成了阿里巴巴集团的丰富资源以及支持更多定制化需求。
“任何领域都会有商业竞争,这是毋庸置疑的。”关于国内大模型之间的商业竞争,昆仑万维CEO方汉最近在接受媒体采访时表示,大模型本身在不断的迭代。从文本大模型到多模态大模型,我认为这个竞争会是一个长期持续的过程。
他还表示,先发者将会凭借他们的先发优势在商业上获得很大的成功。后发者可能要付出更多的努力,在算法层做更多的优化,能够超过先行者的技术指标才能获得商业上的成功。或是在大模型尚未涉足的垂直行业进行自己的深耕细作,也会获得自己的商业回报。
任何一条路上都不乏竞争者,每个企业都有自己的课题,也有自己独特的优势。如何最大化的发挥自身的价值,或是产品诞生的第一要义。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!