首页 » 军事 » 海外研究者揭穿围绕DeepSeek的谣言 澄清五大误解

海外研究者揭穿围绕DeepSeek的谣言 澄清五大误解

2025-02-05 来源:pengjian

围绕 DeepSeek 的谣言实在太多了。面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。

海外研究者揭穿围绕DeepSeek的谣言 澄清五大误解

虽然 R1 是开源的,各种夸张猜测还是层出不穷,有人说训练 R1 实际上使用的算力远超论文所说的,有人质疑 R1 的技术创新,甚至还有人说 DeepSeek 实际的目标是做空。近日,知名生成式 AI 创业公司 Stability AI 的前研究主管 Tanishq Abraham 撰文揭穿了围绕 DeepSeek 的一系列谬论。

海外研究者揭穿围绕DeepSeek的谣言 澄清五大误解

今年 1 月 20 日,DeepSeek 开源的强推理模型 R1 震撼了世人,与其他所有开源大语言模型(LLM)相比,该模型的不同之处在于以下几点:性能实际上与 OpenAI 的 o1 一样好,这是一个先进的模型,标志着开源首次真正赶上闭源;与其他先进模型相比,R1 是在相对较低的训练预算下完成的;易于使用的用户界面,加上其网站和应用程序中具有可见思路链的良好用户体验,吸引了数百万新用户。

海外研究者揭穿围绕DeepSeek的谣言 澄清五大误解

鉴于 DeepSeek 是一家中国公司,美国及其一众科技公司纷纷指责新模型存在各种「国家安全问题」。因此,有关该模型的错误信息泛滥成灾。这篇博文旨在反驳自 DeepSeek 发布以来许多与人工智能相关的极其糟糕的评论,并以一名工作在生成式人工智能前沿的 AI 研究人员的身份提供客观的看法。

世界视角 2024-2025版权所有