首页 >  新闻 >  DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

by Matthew Mar 19,2025

DeepSeek的新聊天机器人拥有令人印象深刻的介绍:“嗨,我被创建了,您可以问任何东西,并得到一个甚至可能让您感到惊讶的答案。”这种AI是中国初创公司DeepSeek的产物,已迅速成为主要市场参与者,甚至导致NVIDIA的股价大幅下降。

DeepSeek测试图片:ensigame.com

DeepSeek的成功源于其创新的建筑和培训方法。关键技术包括:

  • 多语预测(MTP): MTP不是单独预测单词,而是同时预测多个单词,从而提高准确性和效率。
  • 专家的混合物(MOE):该体系结构使用多个神经网络,加速培训并提高性能。 DeepSeek V3使用256个网络,每个令牌都激活了8个网络。
  • 多头潜在注意力(MLA): MLA专注于关键的句子部分,反复提取关键细节以最大程度地减少信息丢失并确保细微的理解。
DeepSeek V3图片:ensigame.com

DeepSeek最初仅使用2048 GPU的DeepSeek V3的培训费用仅为600万美元,这是误导性的。半分析显示出更为广泛的基础设施:大约50,000个NVIDIA HOPPER GPU(包括10,000 H800,10,000 H100和其他H20)分布在多个数据中心。这意味着服务器投资约为16亿美元,运营费用接近9.44亿美元。

DeepSeek是中国对冲基金的High-Flyer的子公司拥有其数据中心,从而促进了控制和创新速度。这种自资助的方法增强了灵活性和决策。该公司吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要是从中国大学招募的。

DeepSeek图片:ensigame.com

尽管DeepSeek的600万美元数字仅反映了培训的GPU成本,而无视研究,改进,数据处理和基础设施,但该公司已在AI开发方面投资了超过5亿美元。与更大的官僚竞争者相比,其精益结构允许有效的创新。

DeepSeek图片:ensigame.com

DeepSeek的成功凸显了资金充足的独立AI公司的竞争潜力。但是,它的成就源于大量投资,技术突破和强大的团队。革命预算效率的主张被夸大了。尽管如此,DeepSeek的成本仍大大低于竞争对手。例如,DeepSeek的R1型号的培训花费了500万美元,而ChatGPT4的售价为1亿美元。

热门游戏 更多 >