自由財經

DeepSeek R1模型驚人成本曝 外媒:「低得可笑」

2025/09/22 21:42

DeepSeek發表的一篇論文中,公佈其R1模型的建構成本僅花費了24.9萬美元(台幣750萬元)。(取自網路)DeepSeek發表的一篇論文中,公佈其R1模型的建構成本僅花費了24.9萬美元(台幣750萬元)。(取自網路)

吳孟峰/核稿編輯

〔財經頻道/綜合報導〕中國AI人工智慧聊天機器人DeepSeek在周三發表的一篇論文中,公佈了其R1模型的建構成本僅花費了24.9萬美元(台幣750萬元),外媒指出,這筆錢「低得荒謬可笑」(ridiculously low)。

DeepSeek在先前的一篇研究論文中提到 ,其V3模型(類似於Claude等標準聊天機器人模型系列)的訓練成本為560 萬美元(台幣1.7億元)。

這個數字一直存在爭議,一些專家質疑它是否包含了所有開發成本(包括基礎設施、研發、資料等等),還是只包含了最終的訓練運作成本。無論如何,這仍然只是OpenAI等公司建立模型所花費的一小部分,OpenAI執行長奧特曼本人估計GPT-4的成本超過1億美元。

建立人工智慧模型需要耗費大量資源,包括資料、GPU、 資料中心的能源和水資源消耗、人員成本等等,這可能是一項成本高昂的任務,尤其是對於擁有更大訓練資料集的更先進或更強大的模型而言。

對於中國實驗室而言, 由於旨在抑制競爭的出口禁令, 取得美國製造的晶片也面臨額外的障礙。據報導,DeepSeek能夠透過策略性地優化舊晶片來創建成功的模型 ,這也使其擁有競爭優勢。

DeepSeek 在論文中指出,它使用512塊輝達H800晶片(一款性能較低、專為中國市場設計的產品)來構建R1版本。