首页 » 军事 » DeepSeek炸出了特朗普马斯克的焦虑 硅谷与华盛顿的双面围剿

DeepSeek炸出了特朗普马斯克的焦虑 硅谷与华盛顿的双面围剿

2025-02-08 来源:pengjian

2025年1月28日,农历除夕夜,当中国人沉浸在年夜饭的烟火气中时,一家名为DeepSeek的中国AI初创公司发布了一款开源多模态模型Janus-Pro。这款拥有70亿参数的模型在图像生成领域表现出色,超越了OpenAI的DALL-E 3和Stability AI的Stable Diffusion。这次发布不仅在技术上引起轰动,还导致美国纳斯达克指数单日暴跌3.07%,英伟达市值蒸发超过7000亿美元。

DeepSeek的影响力迅速扩大,其产品很快登上全球140多个应用商店榜首。该公司不仅凭借性能优势脱颖而出,更以其独特的算法透明化逻辑赢得了关注。与ChatGPT等强调拟人化交互的模型不同,DeepSeek选择将模型的“思考过程”展示给用户。例如,在回答“strawberry有几个r”的问题时,模型会反复推演50秒,最终给出正确答案。这种透明化的处理方式揭示了AI的本质——它并非真正的智能体,而是基于统计机器学习的数据拟合工具。

透明化具有双重意义。首先,通过展示算法的决策链条,用户可以清楚看到AI的局限性。其次,在医疗、法律等高风险领域,透明化有助于建立信任。此前Gartner调查显示,64%的用户拒绝在客服场景使用AI,而DeepSeek的透明化逻辑或许能改变这一局面。复旦大学张奇教授认为,这场透明化革命撕开了AI幻觉的最后一层面纱,让人们意识到AI的价值在于成为“超级工具”,而非替代人类。

DeepSeek的崛起迅速触动了美国科技与政治精英的敏感神经。马斯克质疑中国公司是否从美国获得了更高端芯片,但DeepSeek通过异构计算架构(CPU+FPGA+ASIC混合部署)和动态负载均衡算法,实现了性能突破。特朗普则表示DeepSeek“给美国产业敲响警钟”,呼吁集中精力赢得竞争。美国参议院外交关系委员会听证会上,智库代表甚至提议“偷走中国最好的工程师”。硅谷巨头也因长期依赖“堆算力、拼参数”的竞赛逻辑而受到冲击,DeepSeek以强化学习为核心的训练架构大幅降低了成本和时间。

世界视角 2024-2025版权所有