xAI发布Grok-3:20万GPU集群驱动,性能逼近行业顶尖,挑战OpenAI霸权2月19日,埃隆·马斯克旗下人工智能公司xAI发布了其最新大型语言模型Grok-3,并同时展示了其令人瞩目的算力基础设施——由20万块GPU组成的超级计算集群“巨像”(Colossus)。此次发布会不仅展示了Grok-3在标准AI基准测试中的卓越性能,也预示着xAI在人工智能领域更为宏大的野心
xAI发布Grok-3:20万GPU集群驱动,性能逼近行业顶尖,挑战OpenAI霸权
2月19日,埃隆·马斯克旗下人工智能公司xAI发布了其最新大型语言模型Grok-3,并同时展示了其令人瞩目的算力基础设施——由20万块GPU组成的超级计算集群“巨像”(Colossus)。此次发布会不仅展示了Grok-3在标准AI基准测试中的卓越性能,也预示着xAI在人工智能领域更为宏大的野心。 Grok-3的发布并非仅仅是一个新模型的亮相,更是一次算力与性能的全面展示。xAI团队将构建“巨像”集群的挑战性置于首位,这20万块GPU的集群并非一蹴而就,而是分两个阶段完成:首先在10万块GPU上进行了122天的同步训练,随后又用了92天逐步扩展到20万块GPU。 xAI的雄心不止于此,他们已经计划构建一个更强大的GPU集群,目标是当前容量的五倍,这将使其成为世界上最强大的GPU集群,进一步巩固其在算力竞争中的优势地位。
在性能方面,Grok-3在标准AI基准测试中展现出令人印象深刻的结果。其基础模型,即未嵌入思维链与推理模块的标准版,在数学(AIME)、科学(GPOA)和编程(LCB)测试中均位居榜首。 更值得关注的是,Grok-3在盲测中也表现出色。xAI证实,此前代号为“Chocolate”的神秘模型正是Grok-3的早期测试版,该版本曾被上传至LLMArena平台,并获得了最高的ELO评分。这一评分并非基于模型在特定基准测试中的表现,而是完全基于数千匿名用户的盲测偏好,这在一定程度上避免了模型通过针对性训练在基准测试中“作弊”的可能性,更能反映模型实际的用户体验。
Grok-3的“推理测试版”(Reasoning Beta)通过内置思维链处理模块和测试阶段额外的算力投入,将数学成绩提升到了一个新的高度。在AIME2025基准测试中,它获得了93分,而其他表现最佳的模型得分均低于87分。 有趣的是,Grok-3 Mini推理测试版,尽管规模较小,但由于更长的训练时长,在某些场景下甚至超越了标准版。这表明,完整版的Grok-3在获得更多训练后仍具有显著的提升空间,考虑到其更大的参数量,这一潜力不容小觑。
尽管在基准测试和盲测中表现突出,但在现场演示环节,Grok-3的表现却更像是技术追赶而非突破性创新。xAI团队展示了Grok-3解决物理问题和从头编写游戏代码的能力,但类似的功能,ChatGPT、Claude和谷歌的Gemini等竞争对手早在数月前就已经实现了。 这似乎暗示着,尽管Grok-3在性能上达到了甚至超越了现有模型的水平,但在功能创新方面,目前仍未能展现出显著的领先优势。
除了Grok-3模型本身,xAI还同步推出了深度搜索(DeepSearch)研究代理系统。该工具与OpenAI及谷歌的服务类似,能够实现全网信息抓取并生成多维度主题分析报告,进一步完善了其人工智能生态系统。 目前,X Premium Plus订阅用户已经可以访问Grok-3基础版,但高阶版本和迭代更新将独家部署于独立app或Grok.com平台。未来几周内,xAI还将推出类似于OpenAI“高级语音模式”的语音交互功能。马斯克特别强调,这并非传统的文本转语音(TTS)技术,而是一个真正的AI语音模型,能够实现自然、富有表现力的语音交互。
开发者将在未来几周内获得API访问权限以及音频转录功能,这将使Grok-3成为第三方AI驱动应用程序的强大工具。 更令人瞩目的是,xAI还透露了计划成立一个AI游戏工作室,让开发者能够利用Grok-3构建游戏。这不仅扩展了Grok-3的应用场景,也为人工智能在游戏开发领域的应用开辟了新的可能性。 Grok-3的发布正在逐步进行,一些爱好者已经抢先体验并对结果表示满意。计算机科学家莱克斯·弗里德曼(Lex Fridman)对Grok-3的能力给予了高度评价,称其“令人印象深刻”。 OpenAI前联合创始人安德烈·卡帕西(Andrej Karpathy)也对Grok-3的表现给予了肯定,认为其性能接近OpenAI最强模型的顶尖水平。 一位名为Penny2x的X用户分享了使用Grok-3从头构建的一个类似于《超级马里奥兄弟》的2D平台游戏,进一步证明了Grok-3在实际应用中的强大能力。
xAI还证实,计划在Grok-3完全成熟并稳定运行后几个月后,将Grok-2开源。 这延续了xAI通过发布旧版本激发创新的趋势,尽管Grok-2的性能仍落后于顶级模型。 目前,Grok-3似乎已经能够做到顶级人工智能模型所能做到的事情。 真正的考验将在未来几周内到来,届时xAI将推出其承诺的语音功能、游戏工具和API访问权限。 业界普遍认为,Grok-3的发布给OpenAI带来了新的压力,尤其是在OpenAI即将发布GPT-4.5的背景下,这场人工智能领域的竞争将更加激烈。 xAI的雄心壮志和Grok-3的实际表现,无疑将深刻影响未来人工智能技术的发展方向。 20万GPU集群的强大算力,以及在基准测试和用户体验方面的出色表现,都预示着xAI将成为人工智能领域一股不可忽视的力量。 然而,Grok-3是否能够在创新方面带来突破,并最终超越现有竞争对手,还有待时间的检验。
标签: xAI 发布 Grok-3 20万 GPU 集群 驱动 性能 逼近
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!