xAI发布Grok-3：20万GPU集群驱动，性能逼近行业顶尖，挑战OpenAI霸权

业界动态 2025-02-19 08:09:39 转载来源: 网易科技报道北京

英文：vivo Enters the Home Robotics Market: Focusing on "Brain" and "Eyes," Three Key Advantages to Foster Industry Prosperity

xAI发布Grok-3：20万GPU集群驱动，性能逼近行业顶尖，挑战OpenAI霸权2月19日，埃隆·马斯克旗下人工智能公司xAI发布了其最新大型语言模型Grok-3，并同时展示了其令人瞩目的算力基础设施——由20万块GPU组成的超级计算集群“巨像”（Colossus）。此次发布会不仅展示了Grok-3在标准AI基准测试中的卓越性能，也预示着xAI在人工智能领域更为宏大的野心

xAI 发布 Grok-3：20万 GPU 集群驱动，性能逼近行业顶尖，挑战OpenAI霸权

2月19日，埃隆·马斯克旗下人工智能公司xAI发布了其最新大型语言模型Grok-3，并同时展示了其令人瞩目的算力基础设施——由20万块GPU组成的超级计算集群“巨像”（Colossus）。此次发布会不仅展示了Grok-3在标准AI基准测试中的卓越性能，也预示着xAI在人工智能领域更为宏大的野心。 Grok-3的发布并非仅仅是一个新模型的亮相，更是一次算力与性能的全面展示。xAI团队将构建“巨像”集群的挑战性置于首位，这20万块GPU的集群并非一蹴而就，而是分两个阶段完成：首先在10万块GPU上进行了122天的同步训练，随后又用了92天逐步扩展到20万块GPU。 xAI的雄心不止于此，他们已经计划构建一个更强大的GPU集群，目标是当前容量的五倍，这将使其成为世界上最强大的GPU集群，进一步巩固其在算力竞争中的优势地位。

xAI发布Grok-3：20万GPU集群驱动，性能逼近行业顶尖，挑战OpenAI霸权

在性能方面，Grok-3在标准AI基准测试中展现出令人印象深刻的结果。其基础模型，即未嵌入思维链与推理模块的标准版，在数学（AIME）、科学（GPOA）和编程（LCB）测试中均位居榜首。更值得关注的是，Grok-3在盲测中也表现出色。xAI证实，此前代号为“Chocolate”的神秘模型正是Grok-3的早期测试版，该版本曾被上传至LLMArena平台，并获得了最高的ELO评分。这一评分并非基于模型在特定基准测试中的表现，而是完全基于数千匿名用户的盲测偏好，这在一定程度上避免了模型通过针对性训练在基准测试中“作弊”的可能性，更能反映模型实际的用户体验。

xAI发布Grok-3：20万GPU集群驱动，性能逼近行业顶尖，挑战OpenAI霸权

Grok-3的“推理测试版”（Reasoning Beta）通过内置思维链处理模块和测试阶段额外的算力投入，将数学成绩提升到了一个新的高度。在AIME2025基准测试中，它获得了93分，而其他表现最佳的模型得分均低于87分。有趣的是，Grok-3 Mini推理测试版，尽管规模较小，但由于更长的训练时长，在某些场景下甚至超越了标准版。这表明，完整版的Grok-3在获得更多训练后仍具有显著的提升空间，考虑到其更大的参数量，这一潜力不容小觑。

xAI发布Grok-3：20万GPU集群驱动，性能逼近行业顶尖，挑战OpenAI霸权

尽管在基准测试和盲测中表现突出，但在现场演示环节，Grok-3的表现却更像是技术追赶而非突破性创新。xAI团队展示了Grok-3解决物理问题和从头编写游戏代码的能力，但类似的功能，ChatGPT、Claude和谷歌的Gemini等竞争对手早在数月前就已经实现了。这似乎暗示着，尽管Grok-3在性能上达到了甚至超越了现有模型的水平，但在功能创新方面，目前仍未能展现出显著的领先优势。

除了Grok-3模型本身，xAI还同步推出了深度搜索（DeepSearch）研究代理系统。该工具与OpenAI及谷歌的服务类似，能够实现全网信息抓取并生成多维度主题分析报告，进一步完善了其人工智能生态系统。目前，X Premium Plus订阅用户已经可以访问Grok-3基础版，但高阶版本和迭代更新将独家部署于独立app或Grok.com平台。未来几周内，xAI还将推出类似于OpenAI“高级语音模式”的语音交互功能。马斯克特别强调，这并非传统的文本转语音（TTS）技术，而是一个真正的AI语音模型，能够实现自然、富有表现力的语音交互。

开发者将在未来几周内获得API访问权限以及音频转录功能，这将使Grok-3成为第三方AI驱动应用程序的强大工具。更令人瞩目的是，xAI还透露了计划成立一个AI游戏工作室，让开发者能够利用Grok-3构建游戏。这不仅扩展了Grok-3的应用场景，也为人工智能在游戏开发领域的应用开辟了新的可能性。 Grok-3的发布正在逐步进行，一些爱好者已经抢先体验并对结果表示满意。计算机科学家莱克斯·弗里德曼（Lex Fridman）对Grok-3的能力给予了高度评价，称其“令人印象深刻”。 OpenAI前联合创始人安德烈·卡帕西（Andrej Karpathy）也对Grok-3的表现给予了肯定，认为其性能接近OpenAI最强模型的顶尖水平。一位名为Penny2x的X用户分享了使用Grok-3从头构建的一个类似于《超级马里奥兄弟》的2D平台游戏，进一步证明了Grok-3在实际应用中的强大能力。

xAI还证实，计划在Grok-3完全成熟并稳定运行后几个月后，将Grok-2开源。这延续了xAI通过发布旧版本激发创新的趋势，尽管Grok-2的性能仍落后于顶级模型。目前，Grok-3似乎已经能够做到顶级人工智能模型所能做到的事情。真正的考验将在未来几周内到来，届时xAI将推出其承诺的语音功能、游戏工具和API访问权限。业界普遍认为，Grok-3的发布给OpenAI带来了新的压力，尤其是在OpenAI即将发布GPT-4.5的背景下，这场人工智能领域的竞争将更加激烈。 xAI的雄心壮志和Grok-3的实际表现，无疑将深刻影响未来人工智能技术的发展方向。 20万GPU集群的强大算力，以及在基准测试和用户体验方面的出色表现，都预示着xAI将成为人工智能领域一股不可忽视的力量。然而，Grok-3是否能够在创新方面带来突破，并最终超越现有竞争对手，还有待时间的检验。

英文：vivo Enters the Home Robotics Market: Focusing on "Brain" and "Eyes," Three Key Advantages to Foster Industry Prosperity

标签: xAI 发布 Grok-3 20万 GPU 集群驱动性能逼近