by Matthew Mar 19,2025
DeepSeek的新聊天機器人擁有令人印象深刻的介紹:“嗨,我被創建了,您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”這種AI是中國初創公司DeepSeek的產物,已迅速成為主要市場參與者,甚至導致NVIDIA的股價大幅下降。
圖片:ensigame.comDeepSeek的成功源於其創新的建築和培訓方法。關鍵技術包括:
圖片:ensigame.comDeepSeek最初僅使用2048 GPU的DeepSeek V3的培訓費用僅為600萬美元,這是誤導性的。半分析顯示出更為廣泛的基礎設施:大約50,000個NVIDIA HOPPER GPU(包括10,000 H800,10,000 H100和其他H20)分佈在多個數據中心。這意味著服務器投資約為16億美元,運營費用接近9.44億美元。
DeepSeek是中國對沖基金的High-Flyer的子公司擁有其數據中心,從而促進了控制和創新速度。這種自資助的方法增強了靈活性和決策。該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要是從中國大學招募的。
圖片:ensigame.com儘管DeepSeek的600萬美元數字僅反映了培訓的GPU成本,而無視研究,改進,數據處理和基礎設施,但該公司已在AI開發方面投資了超過5億美元。與更大的官僚競爭者相比,其精益結構允許有效的創新。
圖片:ensigame.comDeepSeek的成功凸顯了資金充足的獨立AI公司的競爭潛力。但是,它的成就源於大量投資,技術突破和強大的團隊。革命預算效率的主張被誇大了。儘管如此,DeepSeek的成本仍大大低於競爭對手。例如,DeepSeek的R1型號的培訓花費了500萬美元,而ChatGPT4的售價為1億美元。