AI 日报

硬刚“CloseAI”,马斯克如期开源Grok,最大开源大语言模型一夜易主!

  • By 51ITO
  • Mar 25, 2024 - 2 min read



编辑 | 伊风

出品 | 51CTO技术栈(微信号:blog51cto)

开源了!

3月11日,马斯克曾发表了一篇“字少事大”的推文,并且设为了置顶。就一句话:xAI要在本周开源自家聊天机器人 Grok了。

消息一出,关注着Musk VS. OpenAI的吃瓜群众立马表示了热烈的欢迎。经过漫长的等待,Grok终于在当地时间周日发布了开源!

Grok-1,参数量达到了3140亿的混合专家(MoE)模型,体量大于OpenAI GPT-3.5的1750亿,成为参数量最大的开源大语言模型。

图片图片

 保持了马斯克一贯的幽默、讽刺作风,Grok用约会软件上“weights in my bio”(我的体重写在简介里了)作梗,来表示公开了模型的权重。

而OpenAI则赶来指责道“你们偷了我的笑话!”

马斯克则回应道,“还是来聊聊OpenAI里Open的事情吧!”

这样的“一唱一和”也许正是马斯克开源Grok想要达到的效果——继续对OpenAI进行挖苦,以为自己的诉讼博得更多的舆论支持。

看来,这场AI大戏还将继续。且看Grok是否能成为一枚优秀的棋子,为马斯克拿下一城吧。

1、Grok究竟“open”到什么程度?

一句话总结,虽然不是完全开源,但已做得相当不错。

早前,马斯克宣布开源时,并未透露“开源”的具体含义。

众所周知,许多开源大模型其实处于“伪开源”的状态,虽然它会提供一些开源的表面特征,如模型权重和基础代码,但并不开源完整的训练代码、数据集和训练过程等关键信息。此前,阿里的EMO项目就曾因为在GitHub上并没有公开任何代码,而引起争议,被社区成员戏称其为“空壳开源”。

Grok的开放程度自然而然地成为关注焦点。有网友追问马斯克是否能获得训练数据。

图片图片

更有网友列出了一个完全开源的模型应该公开信息的list,真的是很贴心了(手动狗头)。

图片图片

根据Grok所公开的消息,Grok是未经微调的基础模型,由8 个专家(2 个活跃状态)组成。Grok的活跃参数达860亿,仅这部分就超过了Meta开源的Llama2模型的总参数量,这反映了Grok在特定输入下具备相当高的计算效率和模型复杂度。

同时,Grok开源所遵守的Apache 2.0 许可证,将允许用户自由地使用、修改和分发软件,无论是个人使用还是商业用途。并且,在企业使用过程中,可以保留对修改后软件的版权,这在一定程度上减少了“在别人的地基上造房子”的风险。

然而,在Grok的开源信息中,还是缺少了训练代码以及可重现的数据集,开放程度逊色于Bloom 和 OLMo等模型。

2、Grok,为挑战 OpenAI而生

Grok的开源让矛头又指向了OpenAI。

在Grok开源的同一天,奥特曼发了一条推文表示“今年是人类历史上最有趣的一年,除了未来的所有年份”。

图片图片

而网友则在评论区配上梗图,辛辣地讽刺道“我们还有未来,对吧?”,以表达对AGI安全问题的担忧。

而这也是马斯克这场AI诉讼的核心。

在Grok诞生之前,马斯克就与OpenAI多次开杠,甚至攻击OpenAI“训练AI说谎”。随即马斯克宣布自己将推出一个名为“TruthGPT”的人工智能平台,作为ChatGPT的挑战者。

在马斯克的设想中,TruthGPT将是一个“最大限度寻求真理的人工智能”,旨在理解宇宙的本质。他认为这样的AI不太可能消灭人类,因为人类是宇宙中有趣的一部分。

最终,“TruthGPT”被定名为Grok,并于去年11月正式上线。新名称Grok取自罗伯特・安森・海因莱因的科幻小说《异乡异客》,意思是完全理解某事或某人。寄托了马斯克希望 AI 能超越机械的信息处理,真正理解人类的情感和需求的愿望。

因此,Grok会将“人格魅力”作为对话机器人的卖点也就不奇怪了。Grok反对其他大模型所遵守的“政治正确”,力图回答其他AI会拒绝回答的尖锐问题。现在的Grok仍然保留了“常规”和“幽默”两种模式,供用户进行选择。

马斯克曾多次发推文亲自推销Grok的订阅服务。目前X会员用户可以访问Grok,费用为16美元/月,略低于竞争对手GPT-4的20美元/月。

Grok背靠全球社交巨头X平台,好处多多,不仅有了一个巨大的用户池作为其接口,也使得模型可以通过 X 获取实时信息。如果问Grok "今天人工智能领域发生了什么?",Grok 会从社交媒体中的头条新闻中组织出答案,而 ChatGPT 受限于其训练数据的时间范围只能含糊其辞。

3、开源与闭源周旋久,孰赢?

OpenAI和马斯克的诉讼引发了许多技术专家和投资者对人工智能开源or闭源的争论。Grok的开源再次把这些争议炒热。

开源模型对大模型发展的重要性不言而喻。此前曾有人判断,随着时间的推移,开源大模型中终会跑出王者,将OpenAI甩到身后。因为无数程序员的调用和调优所做出的贡献,要远超一小撮硅谷精英所能做的工作。就像今天的Android之于苹果一样。

华盛顿邮报也推测,马斯克开源Grok的举动,可能是希望借由开源让该模型的使用量上升,同时获得来自开发者群体的反馈。 

同时,开源也有益于提高AI技术的透明度和可信赖性,能够在一定程度上解决马斯克反复提及的AI安全与道德问题。  

现在,xAI已经加入到Meta和Mistral的开源行列中去。而马斯克领导的另一家公司特斯拉(Tesla)也公布过许多专利开源,他曾在 2014 年表示:"特斯拉不会对任何真诚希望使用我们技术的人提起专利诉讼。”

当然,支持闭源的声音将一直存在并有其道理。OpenAI投资者Vinod Khosla曾公开表示,马斯克的法律诉讼是 "对实现 AGI 目标及其益处的巨大干扰"。如果OpenAI不采用闭源+盈利的路线,他们就无法维持当前顶级的人才号召力,也无法以最大的推力前进,带着AI一路狂飙到新天地。

科技界两大巨头之间的诉讼已经触及了人工智能安全性和可及性的核心问题,这些争论不休的问题将蔓延到范围更广的初创企业。

虽然官司的走向尚不明朗,但是对于AI问题的持续关注与争论必然是有其意义的。

谢谢马斯克。