中國新創DeepSeek近期發表AI模型,引發全球關注。(路透)
DeepSeek宣稱成本僅600萬美元
歐祥義/核稿編輯
〔財經頻道/綜合報導〕中國新創DeepSeek(深度求索)近期發表AI模型,引發全球關注,DeepSeek的團隊聲稱,相較於美國競爭對手推出的AI助理使用更少的成本和資料,卻能達到可以媲美美國競爭對手的性能,這款AI模型的表現令美國投資人和企業高層感到震驚,連帶市場出現劇烈波動。
DeepSeek是中國AI新創公司,該公司研發的AI模型R1在今年1月下旬正式發佈,DeepSeek聲稱這款突破性模型的訓練成本不到600萬美元(約新台幣1.96億元),且性能比肩OpenAI、Google和Meta等巨頭推出的模型,考慮到ChatGPT訓練成本超過1億美元(約新台幣32.75億元),DeepSeek的成本低的驚人。
DeepSeek的竄起備受矚目,旗下推出的應用程式1月27日登上蘋果(Apple)App Store的排行榜冠軍,下載量將近200萬,超越ChatGPT,這是Gemini、Claude等其他AI模型所無法達到。
DeepSeek橫空出世,日本、美國股市27日科技股崩盤。(法新社)
橫空出世造成1/27科技股重挫
DeepSeek橫空出世嚇壞全球市場,由於亞洲主要市場中、台、韓股正逢新年假期休市,日本科技股成為亞股重災區27日一片慘綠,包括輝達的半導體測試設備供應商愛德萬測試(Advantest Corporation)重挫8.61%、軟銀(Softbank)跌8.32%、東京威力科創(Tokyo Electron)跌4.9%、迪斯科(Disco)跌3.3%。
美國科技股同(27)日也重挫,包括輝達在內的晶片股一路狂瀉,當天收盤輝達跌近17%、博通(Broadcom)跌17.4%、台積電ADR收盤跌13.33%、超微(AMD)則跌逾6%。輝達單日市值蒸發5926.58億美元(約新台幣19.37兆元),改寫史上最大跌幅,這一數字是2024年9月股災時,市值蒸發2790億美元(約新台幣9.12兆)的兩倍多。
不過對於市場擔心DeepSeek使用更少的晶片,將影響未來AI晶片的需求,輝達認為,中國AI新創的進步表明,輝達晶片確實有用,未來將需要更多晶片來滿足需求;微軟(Microsoft)執行長納德拉(Satya Nadella)則以焦耳斯悖論(Jevons paradox)再度出現為例,強調隨著AI工具更有效率且更易取得,需求反會加速膨脹。
DeepSeek宣稱,旗下的AI模型可以媲美OpenAI、Meta的語言模型。(彭博)
OpenAI的地位及成本遭質疑
DeepSeek表示,旗下的2款AI模型V3和R1性能可以比擬OpenAI和Meta的語言模型,R1的成本比OpenAI o1便宜20到50倍。DeepSeek以低成本完成AI模型,對於在AI資本支出砸重金的美國企業而言,成了一大打擊。
Counterpoint Research的AI分析師孫偉表示,DeepSeek證明,可以透過有限的運算資源來研發尖端AI模型。相較之下,花費1570億美元(約新台幣5.14兆元)的OpenAI,無法證明自己能在在創新過程中保持優勢,同時巨額支出並未帶來可觀的回報。
不過,DeepSeek是否真的花費不到600萬美元的成本就研發出AI模型,這一說法的可性度也令人存疑。投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)認為,600萬美元實際上不包括與架構、運算和資料有關的研究以及消融實驗的成本。並稱,如果一個實驗室已經花費了數億美元進行研究,並可以使用更大的叢集,那當然可以用600萬美元建造出與R1同樣品質的模型。
不少專家指出,DeepSeek的模型可能利用「蒸餾」技術打造自家模型,恐涉及竊取美企資料。(路透)
恐利用「蒸餾」技術打造自家模型
不少技術人員也認為,DeepSeek的模型可能「參考」美國AI模型,利用「蒸餾(distillation)」技術打造自家模型,透過使用更成熟、功能強大的AI模型,來評估新模型給出的答案品質,這也代表新模型可以省下構建初始模型所需的大量時間及運算能力,無需承擔相關成本。
川普政府的AI沙皇薩克斯(David Sacks)近日接受《福斯新聞》訪問時指出,DeepSeek使用了一種名為「蒸餾」的過程,藉由一個新的AI模型向一個現有模型提出數百萬個問題,以便學習其知識並模仿其推理過程,有充分的證據表明,DeepSeek所做的就是從OpenAI的模型中獲取知識。
隨後就有知情人士向《彭博》透露,微軟和OpenAI正在調查DeepSeek是否竊取資料,並稱,微軟的安全研究人員去年秋天就觀察到,他們認為DeepSeek的相關組織可能使用 OpenAI 應用程式介面 (API) 竊取了大量資料。
OpenAI則向《金融時報》證實,已掌握DeepSeek盜用模型證據。根據OpenAI的服務條款,用戶不得「複製」任何OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。
華府智庫專家認為,DeepSeek模型發表的時機點,背後有政治性考量。(路透)
川普恐全面限制輝達晶片輸中
面對DeepSeek帶來的威脅,美國總統川普表示,這將敲響美國產業的「警鐘」,讓產業意識到,美國需要更加專注於競爭並取得勝利。但川普也補充,能夠推出更便宜、更快的AI模型是一件好事,這代表產業將不用花這麼多的成本,也能得到同樣的結果。
華府智庫戰略與國際研究中心(CSIS)瓦德瓦尼AI和先進技術中心主任艾倫(Gregory Allen)指出,技術創新是真的,但發表的時機點在本質上具有政治性考量。艾倫補充,DeepSeek公佈AI模型,試圖證明美國的出口管制「徒勞無功」或只會「適得其反」,這才是中國外交政策的真正目標。
各界開始採取行動應對,白宮聲明表示,美國國家安全會議(NSC)正在檢視該程式對國家安全的影響,也將致力於確保美國在AI領域的主導地位。美國海軍則開出第1槍,以「這款模型起源和使用相關潛在安全和道德問題」為由,要求全體人員避免使用該公司出品的任何模型,義大利、美國會也跟上,封殺DeepSeek。
市場則傳出,川普政府官員目前正在研究收緊輝達對中銷售限制的可能性,可能將管制進一步擴大至輝達專門為中國市場設計的H20晶片。輝達的H20晶片可以用於研發和運行AI軟體、服務,是為了滿足美國的晶片出口限制,專門為中國設計的特供版晶片,運算能力僅約為H100晶片的5分之1。
一手掌握經濟脈動 點我訂閱自由財經Youtube頻道
不用抽 不用搶 現在用APP看新聞 保證天天中獎 點我下載APP 按我看活動辦法