马斯克的Grok-3,担得起“地表最强AI”之名? 算力堆叠的代价
马斯克的Grok-3,担得起“地表最强AI”之名?北京时间2月18日12点30分左右,马斯克与xAI团队的三位技术负责人发布了公司最新推出的Grok-3基座大模型。在短短30分钟的发布过程中,他们介绍了Grok-3在数学、科学推理性能上的优势,并展示了其代码创作能力,同时公布了后续的开源计划。
马斯克曾称Grok-3是“地球上最聪明的人工智能”。从发布的性能来看,Grok-3确实在某些方面超越了DeepSeek-V3和OpenAI-4o等模型,但这是通过使用20万块英伟达GPU的算力实现的。在全球人工智能行业越来越注重性价比的情况下,Grok-3是否能被称为“地表最强AI”并带来市场变化仍需观察。
据马斯克介绍,Grok-3在数学推理、科学逻辑推理和代码写作等方面表现优异,在Math(AIME 24)、Science(GPQA)和 Coding(LCB Oct-Feb)三项基准测试中均超过了Gemini-2 pro、DeepSeek-v3和GPT-4o。在Chatbot Arena(LMSYS)中,Grok-3得分达到1402分,超过了包括ChatGPT-4o和DeepSeek-R1在内的所有其他模型。此外,Grok-3还展示了寻找去火星时间窗口的信息收集和推理能力,以及创作了一款融合《宝石迷阵》和《俄罗斯方块》的游戏,展示了其创意能力。
目前,Grok-3已经在xAI内部运行两周,首批用户可以通过X平台预订体验。由于合规要求,最新的Grok-3模型暂时只能在网页上使用。马斯克表示,一周后将上线所有全新性能,并透露通常会在新模型发布时开源上一代模型,几个月后也会对Grok系列进行开源。
相关推荐:
- 2025-02-22
- 2025-02-21
- 2025-02-21