1. 首页
  2. 新闻

马斯克的 Grok3 还不是“地球最聪明”的,但确实是最有钱的

图片来源:由无界AI生成

马斯克口中的“地球上最聪明的 AI”Grok 3来了。

在一场上百万人观看的直播中,马斯克发布了Grok 3,和他一起参与发布的还有两位华裔研究员,分别是xAI联合创始人Tony Wu、Jimmy Ba。从基准测试来看,Grok 3确实强得惊人,而从资本投入看,背后那20万块GPU的算力集群也令人咋舌。

Grok 3的发布包括一系列的模型:Grok 3, Grok 3 mini,以及推理模式(Think)、DeepSearch、Big Brain等更新。

#01、“最聪明AI”之名来自榜单,实测如何

基准评测方面,Grok 3在数学推理、STEM 与科学领域的基准测试中表现优于 GPT-4o、Gemini-2 Pro、Claude3.5 Sonnet、DeepSeek-V3等其他模型。即便是小版本的 Grok 3 Mini,也处于顶尖水平。

Grok 3 的早期版本在大模型竞技场 Chatbot Arena 中也取得了高分,这是一个众包测试平台,不同 AI 模型相互竞争,用户投票选出最佳答案,Grok-3 是首个突破 1400 分的模型,在所有类别中排名第一。

Grok自2023年发布以来MMILU得分快速提升,尤其在2024年达到Grok 2的显著突破,显示出与GPT系列相比的快速追赶与进步。

“Grok 3 具备非常强大的推理能力,因此在我们迄今为止进行的测试中,Grok 3 的表现超越了我们已知的任何已发布产品,这是一个好迹象,”马斯克上周在迪拜举行的世界政府峰会上通过视频通话表示。

Grok 3 也推出了推理模式(Think),通过Grok 3 Reasoning 和 Grok 3 mini Reasoning,能够像 DeepSeek- R1 等推理模型一样进行思考。Grok 3的模型可以通过考虑所有可能的解决方案、自我批判、验证解决方案、回溯、从第一性原理思考等方式来解决复杂的问题。不过为了防止蒸馏,模糊化了Grok 3的部分推理过程。

Grok 3 Reasoning在多个流行基准测试中超越了 o3-mini 的最佳版本——o3-mini-high,其中包括新的数学基准AIME2025。

团队演示了用Grok 3的Think模式生成一个关于从地球发射到火星再返回地球的动画 3D 绘图,展示下一次发射窗口的轨迹。


本文地址: - 蜂鸟财经

免责声明:本文仅代表作者本人观点,与蜂鸟财经立场无关。本站所有内容不构成投资建议,币市有风险、投资请慎重。

下一篇:没有了
« 上一篇
上一篇:东方加密宝岛:台湾的加密资产税收与监管制度
下一篇 »

相关推荐