马斯克的 Grok3 还不是“地球最聪明”的，但确实是最有钱的

图片来源：由无界AI生成

马斯克口中的“地球上最聪明的 AI”Grok 3来了。

在一场上百万人观看的直播中，马斯克发布了Grok 3，和他一起参与发布的还有两位华裔研究员，分别是xAI联合创始人Tony Wu、Jimmy Ba。从基准测试来看，Grok 3确实强得惊人，而从资本投入看，背后那20万块GPU的算力集群也令人咋舌。

Grok 3的发布包括一系列的模型：Grok 3, Grok 3 mini，以及推理模式（Think）、DeepSearch、Big Brain等更新。

#01、“最聪明AI”之名来自榜单，实测如何

基准评测方面，Grok 3在数学推理、STEM 与科学领域的基准测试中表现优于 GPT-4o、Gemini-2 Pro、Claude3.5 Sonnet、DeepSeek-V3等其他模型。即便是小版本的 Grok 3 Mini，也处于顶尖水平。

Grok 3 的早期版本在大模型竞技场 Chatbot Arena 中也取得了高分，这是一个众包测试平台，不同 AI 模型相互竞争，用户投票选出最佳答案，Grok-3 是首个突破 1400 分的模型，在所有类别中排名第一。

Grok自2023年发布以来MMILU得分快速提升，尤其在2024年达到Grok 2的显著突破，显示出与GPT系列相比的快速追赶与进步。

“Grok 3 具备非常强大的推理能力，因此在我们迄今为止进行的测试中，Grok 3 的表现超越了我们已知的任何已发布产品，这是一个好迹象，”马斯克上周在迪拜举行的世界政府峰会上通过视频通话表示。

Grok 3 也推出了推理模式（Think），通过Grok 3 Reasoning 和 Grok 3 mini Reasoning，能够像 DeepSeek- R1 等推理模型一样进行思考。Grok 3的模型可以通过考虑所有可能的解决方案、自我批判、验证解决方案、回溯、从第一性原理思考等方式来解决复杂的问题。不过为了防止蒸馏，模糊化了Grok 3的部分推理过程。

Grok 3 Reasoning在多个流行基准测试中超越了 o3-mini 的最佳版本——o3-mini-high，其中包括新的数学基准AIME2025。

团队演示了用Grok 3的Think模式生成一个关于从地球发射到火星再返回地球的动画 3D 绘图，展示下一次发射窗口的轨迹。

本文地址： - 蜂鸟财经

免责声明：本文仅代表作者本人观点，与蜂鸟财经立场无关。本站所有内容不构成投资建议，币市有风险、投资请慎重。

马斯克的 Grok3 还不是“地球最聪明”的，但确实是最有钱的

相关推荐