財經 > 國際財經

LTN經濟通》掀起AI驚滔巨浪恐逼川普下重手

2025/02/03 07:10

中國新創DeepSeek近期發表AI模型，引發全球關注。（路透）中國新創DeepSeek近期發表AI模型，引發全球關注。（路透）

DeepSeek宣稱成本僅600萬美元

歐祥義／核稿編輯

〔財經頻道／綜合報導〕中國新創DeepSeek（深度求索）近期發表AI模型，引發全球關注，DeepSeek的團隊聲稱，相較於美國競爭對手推出的AI助理使用更少的成本和資料，卻能達到可以媲美美國競爭對手的性能，這款AI模型的表現令美國投資人和企業高層感到震驚，連帶市場出現劇烈波動。

DeepSeek是中國AI新創公司，該公司研發的AI模型R1在今年1月下旬正式發佈，DeepSeek聲稱這款突破性模型的訓練成本不到600萬美元（約新台幣1.96億元），且性能比肩OpenAI、Google和Meta等巨頭推出的模型，考慮到ChatGPT訓練成本超過1億美元（約新台幣32.75億元），DeepSeek的成本低的驚人。

DeepSeek的竄起備受矚目，旗下推出的應用程式1月27日登上蘋果（Apple）App Store的排行榜冠軍，下載量將近200萬，超越ChatGPT，這是Gemini、Claude等其他AI模型所無法達到。

DeepSeek橫空出世，日本、美國股市27日科技股崩盤。（法新社） DeepSeek橫空出世，日本、美國股市27日科技股崩盤。（法新社）

橫空出世造成1/27科技股重挫

DeepSeek橫空出世嚇壞全球市場，由於亞洲主要市場中、台、韓股正逢新年假期休市，日本科技股成為亞股重災區27日一片慘綠，包括輝達的半導體測試設備供應商愛德萬測試（Advantest Corporation）重挫8.61％、軟銀（Softbank）跌8.32％、東京威力科創（Tokyo Electron）跌4.9％、迪斯科（Disco）跌3.3％。

美國科技股同（27）日也重挫，包括輝達在內的晶片股一路狂瀉，當天收盤輝達跌近17％、博通（Broadcom）跌17.4％、台積電ADR收盤跌13.33％、超微（AMD）則跌逾6％。輝達單日市值蒸發5926.58億美元（約新台幣19.37兆元），改寫史上最大跌幅，這一數字是2024年9月股災時，市值蒸發2790億美元（約新台幣9.12兆）的兩倍多。

不過對於市場擔心DeepSeek使用更少的晶片，將影響未來AI晶片的需求，輝達認為，中國AI新創的進步表明，輝達晶片確實有用，未來將需要更多晶片來滿足需求；微軟（Microsoft）執行長納德拉（Satya Nadella）則以焦耳斯悖論（Jevons paradox）再度出現為例，強調隨著AI工具更有效率且更易取得，需求反會加速膨脹。

DeepSeek宣稱，旗下的AI模型可以媲美OpenAI、Meta的語言模型。（彭博） DeepSeek宣稱，旗下的AI模型可以媲美OpenAI、Meta的語言模型。（彭博）

OpenAI的地位及成本遭質疑

DeepSeek表示，旗下的2款AI模型V3和R1性能可以比擬OpenAI和Meta的語言模型，R1的成本比OpenAI o1便宜20到50倍。DeepSeek以低成本完成AI模型，對於在AI資本支出砸重金的美國企業而言，成了一大打擊。

Counterpoint Research的AI分析師孫偉表示，DeepSeek證明，可以透過有限的運算資源來研發尖端AI模型。相較之下，花費1570億美元（約新台幣5.14兆元）的OpenAI，無法證明自己能在在創新過程中保持優勢，同時巨額支出並未帶來可觀的回報。

不過，DeepSeek是否真的花費不到600萬美元的成本就研發出AI模型，這一說法的可性度也令人存疑。投資公司Atreides Management合夥人兼資訊長貝克（Gavin Baker）認為，600萬美元實際上不包括與架構、運算和資料有關的研究以及消融實驗的成本。並稱，如果一個實驗室已經花費了數億美元進行研究，並可以使用更大的叢集，那當然可以用600萬美元建造出與R1同樣品質的模型。

不少專家指出，DeepSeek的模型可能利用「蒸餾」技術打造自家模型，恐涉及竊取美企資料。（路透）不少專家指出，DeepSeek的模型可能利用「蒸餾」技術打造自家模型，恐涉及竊取美企資料。（路透）

恐利用「蒸餾」技術打造自家模型

不少技術人員也認為，DeepSeek的模型可能「參考」美國AI模型，利用「蒸餾（distillation）」技術打造自家模型，透過使用更成熟、功能強大的AI模型，來評估新模型給出的答案品質，這也代表新模型可以省下構建初始模型所需的大量時間及運算能力，無需承擔相關成本。

川普政府的AI沙皇薩克斯（David Sacks）近日接受《福斯新聞》訪問時指出，DeepSeek使用了一種名為「蒸餾」的過程，藉由一個新的AI模型向一個現有模型提出數百萬個問題，以便學習其知識並模仿其推理過程，有充分的證據表明，DeepSeek所做的就是從OpenAI的模型中獲取知識。

隨後就有知情人士向《彭博》透露，微軟和OpenAI正在調查DeepSeek是否竊取資料，並稱，微軟的安全研究人員去年秋天就觀察到，他們認為DeepSeek的相關組織可能使用 OpenAI 應用程式介面（API）竊取了大量資料。

OpenAI則向《金融時報》證實，已掌握DeepSeek盜用模型證據。根據OpenAI的服務條款，用戶不得「複製」任何OpenAI的服務，或是「利用輸出結果，來開發與OpenAI競爭的模型」。

華府智庫專家認為，DeepSeek模型發表的時機點，背後有政治性考量。（路透）華府智庫專家認為，DeepSeek模型發表的時機點，背後有政治性考量。（路透）

川普恐全面限制輝達晶片輸中

面對DeepSeek帶來的威脅，美國總統川普表示，這將敲響美國產業的「警鐘」，讓產業意識到，美國需要更加專注於競爭並取得勝利。但川普也補充，能夠推出更便宜、更快的AI模型是一件好事，這代表產業將不用花這麼多的成本，也能得到同樣的結果。

華府智庫戰略與國際研究中心（CSIS）瓦德瓦尼AI和先進技術中心主任艾倫（Gregory Allen）指出，技術創新是真的，但發表的時機點在本質上具有政治性考量。艾倫補充，DeepSeek公佈AI模型，試圖證明美國的出口管制「徒勞無功」或只會「適得其反」，這才是中國外交政策的真正目標。

各界開始採取行動應對，白宮聲明表示，美國國家安全會議（NSC）正在檢視該程式對國家安全的影響，也將致力於確保美國在AI領域的主導地位。美國海軍則開出第1槍，以「這款模型起源和使用相關潛在安全和道德問題」為由，要求全體人員避免使用該公司出品的任何模型，義大利、美國會也跟上，封殺DeepSeek。

市場則傳出，川普政府官員目前正在研究收緊輝達對中銷售限制的可能性，可能將管制進一步擴大至輝達專門為中國市場設計的H20晶片。輝達的H20晶片可以用於研發和運行AI軟體、服務，是為了滿足美國的晶片出口限制，專門為中國設計的特供版晶片，運算能力僅約為H100晶片的5分之1。

一手掌握經濟脈動點我訂閱自由財經Youtube頻道

免費訂閱《自由體育》電子報

熱門賽事、球星動態不漏接

不用抽不用搶現在用APP看新聞保證天天中獎　點我下載APP　按我看活動辦法

今日熱門新聞

看更多！請加入自由財經粉絲團

網友回應

LTN經濟通》掀起AI驚滔巨浪 恐逼川普下重手

LTN經濟通》掀起AI驚滔巨浪恐逼川普下重手