英媒報導,中國2大科技巨頭將人工智慧模式訓練轉移到海外,以利用輝達晶片。(路透資料照)
〔財經頻道/綜合報導〕《金融時報》報導,中國科技2巨頭正悄悄將人工智慧模型訓練基地轉移到海外,以獲取輝達(NVIDIA)的先進晶片,並繞過美國阻止其開發這項強大技術的努力。對此,新加坡一名資料中心營運商直言,來這裡是很自然的選擇,你若想打造最強的AI模型,就需要最好的晶片,而這一切都還是合法的。
據知情人士透露,近期阿里巴巴與字節跳動將其大型語言模型(LLMs)搬到東南亞的資料中心進行訓練,這些地方配備了美國科技公司也在用的頂級晶片,目前在法律上仍處於可操作空間。
過去一年,阿里巴巴的Qwen和字節跳動的「豆包」(Doubao)已成為全球表現最佳的LLM(學習管理模式)之一。 Qwen作為一種免費的「開放」模式,也已被中國以外的開發者廣泛採用,這也促使中國企業積極尋找能繼續取得運算資源的途徑。
受中國需求的推動,近年新加坡和馬來西亞的資料中心集群蓬勃發展,這些資料中心由當地或國際業者持有,並與中國企業簽署租賃合約,而非由中資直接控股,讓其在美國拜登政府尚未收緊相關漏洞前,仍能規避晶片出口限制。
知情人士透露,中國企業通常會簽署租賃協議,使用非中國實體擁有和營運的海外資料中心。這符合美國出口管制規定,因為旨在堵住這一漏洞的拜登時代「擴散規則」已在今年稍早被川普廢除。
值得注意的是,有別於多數轉向海外訓練的中國企業,新創公司DeepSeek選擇留在國內進行模型訓練。知情人士透露,主要是該公司在美國出口禁令生效前,已儲備了相當數量的輝達晶片。
此外,DeepSeek並與華為密切合作,投入下一代國產AI晶片的優化與設計。華為更派出工程師常駐於DeepSeek位於杭州的總部,雙方視此合作為中國AI晶片與軟體系統自主化的戰略突破口。
雖然模型訓練需要龐大運算力,因此仍傾向使用輝達高階晶片,但在AI模型部署階段的「推論」用途上,中國企業開始轉用本土晶片處理,這部分在整體AI工作負載中所佔比例正逐漸上升。
除了訓練模型,阿里巴巴與字節跳動等企業也透過這些位於東南亞的資料中心服務海外客戶,希望在全球雲端市場中擴大市占。另有部分中國企業也將資料中心擴展至中東等其他新興市場。
不過,中國科技巨頭不得將私人資料轉移到境外。業內人士表示,這意味著,如果要根據本地客戶提供的特定數據自訂人工智慧模型,訓練過程必須在中國境內進行。
一手掌握經濟脈動 點我訂閱自由財經Youtube頻道
不用抽 不用搶 現在用APP看新聞 保證天天中獎 點我下載APP 按我看活動辦法
