金磊 丰色 发自 凹非寺

量子位 | 公众号 QbitAI

家人们,终于!终于!

免费支持中文无需注册不用骚操作直接可用的类ChatGPT产品,它来了!

(此等好事必须第一时间和家人们分享)

毫不意外的,目前它的热度已经被炒到不行:

而且已经有一波网友抢先体验了一番,铺天盖地的一致好评。

例如微博博主“Simon_阿文”就给出了这样的评价:

是我目前为止试过最舒服的中文聊天体验。

没错,它,就是ChatGPT最强竞争对手,Claude

而就在最近,Claude突然开放了申请,也更新支持了中文,听说API还是不限量不要钱的那种哦~

但毕竟OpenAI家的ChatGPT、GPT-4是公认的强悍;Claude的效果若是旗鼓相当,还搞这种“随意白嫖”,岂不是明晃晃的在抢饭碗?

我们不妨上手亲自测上一测。

Claude大战ChatGPT

首先,既然有人说它的中文聊天体验非常强,我们上来就对此产生了兴趣。

简单问它“Can you speak Chinese”,好家伙,直接夸下海口

不过,再一追问,立马又变得很谦虚了:

我的中文水平还是比小冰和百度的差一些。

(Ps. 眼神还不太好使啊,把谷歌bard认成百度……)

那么,我们就先来看看它的写作能力

题目:请以“我望着远方,一个身影闯进我的视线”开头续写一个150字以内的中文故事。

先来看ChatGPT的答案:

还行。再来看Claude的:

俩人思路差不多,都是温暖治愈走向,一个给男孩钱,一个帮女孩背包,但感觉Claude人物动作描述比ChatGPT多一些,显得“丰满”一些。

不过,Claude这中英夹杂是闹哪样儿?而且字数也超了——

but,我们统计了一下ChatGPT,也超。

行,就算各得几分吧。

接下来,和它们分别玩一下成语接龙

我先来,一语成谶(bushi)

ChatGPT居然瞎接,但Claude直接“先发制人”堵死了我想开的这个玩笑,是我没想到的:

好了接下来正常玩耍,来看两者表现:

ChatGPT——

Claude——

只能说,本来以为这把ChatGPT稳赢,结果两个都是魔鬼吧。。

我们还是来看看数学能力吧。

基本运算和简单的代数题都没问题(ChatGPT就不放了,都对)

最开始ChatGPT算不对的大数四则运算,Claude也解决了。不过它会四舍五入。

有意思的是,每次Claude在回答数学题系统都会声明自己不擅长这个。

事实上,鸡兔同笼问题它可以列对方程,但不知道为什么最后算错了。

顺便看看推理能力

一个简单的急转弯:

Claude和ChatGPT当年一样,直接绕进去了,也需要继续迭代。

看看代码能力吧。

老规矩,写快排。

Claude没问题,并且可以进一步优化。但相比之下,它没有ChatGPT讲解得更清晰易懂,后者还给了一段测试代码。

最后再来一些或实用或好玩的:

1、我想买一个扫地机器人,可以给我推荐一下吗?

相比之下,我个人可能更喜欢Claude的回答,它直接给出了具体品牌,没有像ChatGPT先来一堆长篇大论,而且消费者很关心的价格也给了,还说出了每种产品到底适用于什么用户、何种场景。

2、中文概括昨天OpenAI开源的一致性模型的论文摘要。

ChatGPT回答简明扼要,但没有翻译对扩散模型

Claude倒是对了,概括得也还不错,不过这个格式实在难看。

Ps. 我出完这个问题之后,Claude发生了一次报错,好久没有反应。

3、“我老婆说是对的”

之前,ChatGPT再面对这种说辞,会立刻认怂,后来更新了数学能力和事实性后又开始坚持真理。

来看看Claude的表现:

不得不说,Claude最开始反应和ChatGPT一样,还一本正经地让我去跟“老婆”论述为什么。但最后还是表现出了很高的情商,回答得体,让人很舒服(妙啊~)

那么,测评就简单地到这里。

总的看下来:Claude在推理和数学上稍逊色一些,有一些小bug,比如中文夹杂,或者像下图这样,你说它算错了,正确答案是2,它却只悄然修改了结果,并不在意过程……

但总的基本能力没有差太多,甚至有一些地方表现得更好,比如翻译扩散模型时表现出来的准确性,推荐商品时的接地气。

当然,Claude还不能联网哈,训练数据也差不多是两年前的,对一些时事会瞎说八道:

大家在使用时注意甄别。

但现在人人都可用

虽然我们刚才提到,Claude是无需注册。

但它毕竟是“嵌套”部署在Slack中的,因此,想要体验的朋友们需得先有一个Slack的账号。

当然,这个注册过程是非常easy的,也就是简单几个步骤的事情。

然后就是一些“傻瓜式”的操作了。

来到Claude的官方网站,直接点击“Add to Slack”即可。

接下来,和已经登录的Slack账号关联一下。

搞定!

关联成功之后,我们再回到Slack界面,Claude就会出现在Apps一栏中了。

怎么样,是不是超级简单?

不过Claude的免费据说只是暂时的,将来是否会变为收费版,官方后续会发通知。

所以想要白嫖的小伙伴们,要抓紧体验喽~

Claude背后的公司,有点意思

最后,我们再来聊一聊Claude背后的公司——Anthropic

不得不说,它的成立跟OpenAI着实有点“剪不清理还乱”的关系。

当年微软在收了OpenAI之际,很多OpenAI的员工就表示不满(与公司创立的初衷相悖)

其中就包括前研究副总裁Dario Amodei,于是他带领其它11名员工出走创业,于2021年成立Anthropic。

出走的这帮人里面可谓是人才辈出,既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐)

这两年来,除了进一步钻研RLHF方法、提出基于通用语言模型的RLHF大规模数据集外,Anthropic还于去年年底发表了上面那种名为Constitutional AI的方法。

采用这种方法制作的Claude模型,也让它产生了与OpenAI的ChatGPT不一样的对话效果。

不仅如此,更drama的事情,要属谷歌在与微软进行搜索引擎大战之际,还斥资3亿美元投资了Anthropic。

这味道,你品,你细品。

回到正题,正如我们刚才亲测的那般,目前Claude虽然好用、能用,但还是与ChatGPT会有一定的差距。

因此有网友就认为:

也许付费版的Claude+ 才是ChatGPT的真正对手。

不过不得不说,科技巨头们围绕大语言模型展开的生成式AI之争,依旧愈演愈烈。

参考链接:

[1]https://www.anthropic.com/claude-in-slack

[2]https://twitter.com/nash_su/status/1645612268791668738

[3]https://twitter.com/oldleek_eth/status/1645769866396446725

[4]https://weibo.com/1757693565/MBNYkcqk8#comment

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

Leave a Reply

Your email address will not be published. Required fields are marked *