- 天下Web only
DeepSeek據稱只花了600萬美元、使用遠少於OpenAI的輝達GPU訓練模型,就繳出能與OpenAI最佳模型匹敵的成果,在AI領域投下震撼彈。輝達市值短短一天蒸發近6000億美元,投資人擔心對GPU晶片的需求不會像先前期待的那麼強勁。
DeepSeek的600萬美元是「DeepSeek-V3」模型的最終訓練成本,並未包含模型架構、演算法、數據採集、GPU購置和測試研發等前期成本,實際上DeepSeek的總成本可能遠高於600萬美元,而使用「蒸餾」等技術則違反了OpenAI的使用規定。
不論如何,假如OpenAI、Anthropic和Meta的大型語言模型採用了開源 DeepSeek 的部分技術,變得更有效率,是否需要的算力就大幅減少?
另一方面,AI技術的採用者,特別是軟體公司股價則聞訊大漲。若AI技術的成本如預期大幅下降,就會帶來更高的獲利率。