技术界有一个普遍的说法:美国擅长创新,从零到一个,而中国擅长商业应用,也就是说,从一个到100。对于人工智能(AI)来说,最尖端的边境模型和研究是由Openai等美国初创公司创建的,据认为距离中国的同行距离中国两到三年。然而,中国公司DeepSeek的两种新车型的迅速发布(本月为12月和R1)正在增强这种根深蒂固的假设,从而引发了美国科技股的历史性溃败。
DeepSeek的R1推理模型在一系列数学,代码和推理任务中匹配了OpenAI的O1,并以后者价格的2%匹配。现在,中国AI模型与领先的美国AI模型一样好,仅使用一小部分GPU资源。
这是出色的,是全球AI军备竞赛的gamechanger。第一,这意味着该游戏不再保留给有芯片库存(如美国和中国)的货运式储备的人。这也是美国的关键优势,曾经被认为是维持美国与中国模型之间能力差距的关键护城河。 DeepSeek表明,算法创新可以克服规模定律。面对有限的筹码,由于美国出口控制,该公司采用了创新的软件优化技术,从稀疏的专家混合物建筑物到量化,这使他们能够达到前所未有的成本效率,同时超过了竞争模型。
正如DeepSeek创始人Liang Wenfeng是一名AI研究人员,接受了培训 面试 去年,“面对破坏性技术,封闭来源创建的护城河是暂时的。即使是Openai的封闭源方法也无法阻止其他人追赶。”
DeepSeek在几个月内赶上Frontier模型的能力表明,没有实验室,封闭或开源的实验室可以保持真实的,持久的技术优势。我们进入了一个AI竞赛时代,在该时代,创新的步伐可能会比我们所有人预期的更加疯狂,在这里,更多的小玩家和 中大国 将使用培训策略进入竞争 共享 由DeepSeek。
第二,中国正在成为开源AI的全球领导者。 DeepSeek不过是许多中国人工智能公司之一,他们都在全部开放式模型 – 允许全球开发人员使用,复制和修改其模型权重和方法。中国的大型科技巨头阿里巴巴(Alibaba)制作了Qwen,它的旗舰AI基金会模型开源。因此,像Minimax这样的较新的AI初创公司也在1月份推出了一系列开源模型(基础和多模式,即能够处理多种类型的媒体)。
竞争性基准测试表明,这些中国开源模型的性能与最佳封闭源西部模型相当。在拥抱面孔时,一个拥有开源工具和数据存储库的美国平台,中国LLM经常是下载最多的LLM。这不仅使更多的全球开发人员进入了他们的生态系统,而且还引起了更多的创新。
将LLM视为一种操作系统 – 类似于Apple的iOS和Google的Android-用户可以在其中开发新的应用程序。保持美国最佳模型封闭源将意味着中国有望在争夺以低成本获得最先进产品的国家 /地区扩大其技术影响力。这些中国人工智能公司还具有讽刺意味的是,使人们对人工智能的访问权限,并保持Openai的原始使命:为人类的利益推进AI。现在,在AI超级大国或成熟的技术枢纽以外的国家 /地区,现在可以使用负担得起的培训方法来解锁创新浪潮。
第三,美国的出口控制不再对AI进步有束缚。像DeepSeek这样的中国公司通过在符合符合进出口的NVIDIA H800的模型(大多数美国公司使用的更先进的AI芯片)上培训其模型来实现重大AI进步的能力,并利用复杂的软件技术。迄今为止,美国的许多“控制点”策略都集中在硬件上,但是算法创新的快速发展景观意味着华盛顿可能需要探索替代技术控制途径。正如许多人指出的那样,必要性确实是发明的母亲。 DeepSeek和其他人因无法依靠最新的筹码而被迫以更少,独创性而不是蛮力做更多的事情。
没有低估的这一里程碑。尽管由于美国出口控制的障碍,许多人早些时候曾在AI比赛中算上中国,但DeepSeek表明中国又回来了,可能是领先的。如果西方为妨碍或障碍中国的人工智能进步而努力的努力可能是徒劳的,那么真正的种族才刚刚开始:精益,创意工程将成为赢得比赛的胜利;不是纯粹的财务状况和出口控制。