马斯克的Grok-3，担得起“地表最强AI”之名？算力堆叠的代价

2025-02-19　来源：pengjian

马斯克的Grok-3，担得起“地表最强AI”之名？北京时间2月18日12点30分左右，马斯克与xAI团队的三位技术负责人发布了公司最新推出的Grok-3基座大模型。在短短30分钟的发布过程中，他们介绍了Grok-3在数学、科学推理性能上的优势，并展示了其代码创作能力，同时公布了后续的开源计划。

马斯克曾称Grok-3是“地球上最聪明的人工智能”。从发布的性能来看，Grok-3确实在某些方面超越了DeepSeek-V3和OpenAI-4o等模型，但这是通过使用20万块英伟达GPU的算力实现的。在全球人工智能行业越来越注重性价比的情况下，Grok-3是否能被称为“地表最强AI”并带来市场变化仍需观察。

马斯克的Grok-3，担得起“地表最强AI”之名？算力堆叠的代价

据马斯克介绍，Grok-3在数学推理、科学逻辑推理和代码写作等方面表现优异，在Math（AIME 24）、Science（GPQA）和 Coding（LCB Oct-Feb）三项基准测试中均超过了Gemini-2 pro、DeepSeek-v3和GPT-4o。在Chatbot Arena（LMSYS）中，Grok-3得分达到1402分，超过了包括ChatGPT-4o和DeepSeek-R1在内的所有其他模型。此外，Grok-3还展示了寻找去火星时间窗口的信息收集和推理能力，以及创作了一款融合《宝石迷阵》和《俄罗斯方块》的游戏，展示了其创意能力。

马斯克的Grok-3，担得起“地表最强AI”之名？算力堆叠的代价

目前，Grok-3已经在xAI内部运行两周，首批用户可以通过X平台预订体验。由于合规要求，最新的Grok-3模型暂时只能在网页上使用。马斯克表示，一周后将上线所有全新性能，并透露通常会在新模型发布时开源上一代模型，几个月后也会对Grok系列进行开源。

军事

马斯克的Grok-3，担得起“地表最强AI”之名？ 算力堆叠的代价

相关推荐：

马斯克的Grok-3，担得起“地表最强AI”之名？算力堆叠的代价