>  訊息 >  DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

by Matthew Mar 19,2025

DeepSeek的新聊天機器人擁有令人印象深刻的介紹:“嗨,我被創建了,您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”這種AI是中國初創公司DeepSeek的產物,已迅速成為主要市場參與者,甚至導致NVIDIA的股價大幅下降。

DeepSeek測試圖片:ensigame.com

DeepSeek的成功源於其創新的建築和培訓方法。關鍵技術包括:

  • 多語預測(MTP): MTP不是單獨預測單詞,而是同時預測多個單詞,從而提高準確性和效率。
  • 專家的混合物(MOE):該體系結構使用多個神經網絡,加速培訓並提高性能。 DeepSeek V3使用256個網絡,每個令牌都激活了8個網絡。
  • 多頭潛在註意力(MLA): MLA專注於關鍵的句子部分,反复提取關鍵細節以最大程度地減少信息丟失並確保細微的理解。
DeepSeek V3圖片:ensigame.com

DeepSeek最初僅使用2048 GPU的DeepSeek V3的培訓費用僅為600萬美元,這是誤導性的。半分析顯示出更為廣泛的基礎設施:大約50,000個NVIDIA HOPPER GPU(包括10,000 H800,10,000 H100和其他H20)分佈在多個數據中心。這意味著服務器投資約為16億美元,運營費用接近9.44億美元。

DeepSeek是中國對沖基金的High-Flyer的子公司擁有其數據中心,從而促進了控制和創新速度。這種自資助的方法增強了靈活性和決策。該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要是從中國大學招募的。

DeepSeek圖片:ensigame.com

儘管DeepSeek的600萬美元數字僅反映了培訓的GPU成本,而無視研究,改進,數據處理和基礎設施,但該公司已在AI開發方面投資了超過5億美元。與更大的官僚競爭者相比,其精益結構允許有效的創新。

DeepSeek圖片:ensigame.com

DeepSeek的成功凸顯了資金充足的獨立AI公司的競爭潛力。但是,它的成就源於大量投資,技術突破和強大的團隊。革命預算效率的主張被誇大了。儘管如此,DeepSeek的成本仍大大低於競爭對手。例如,DeepSeek的R1型號的培訓花費了500萬美元,而ChatGPT4的售價為1億美元。

熱門遊戲 更多的 >