財經 > 國際財經

繞過輝達限制！傳DeepSeek準備適配中國國產GPU晶片

2025/02/04 07:08

DeepSeek研發的大語言模型繞過了美國人工智慧巨頭輝達的CUDA框架。（資料照，路透） DeepSeek研發的大語言模型繞過了美國人工智慧巨頭輝達的CUDA框架。（資料照，路透）

〔財經頻道／綜合報導〕近期中國AI新創公司深度求索（DeepSeek）引發各界關注，然而，外媒指出，其研發的大語言模型繞過美國人工智慧巨頭輝達（NVIDIA）的CUDA框架，DeepSeek正在為其未來適配中國國產GPU晶片做準備。

根據《星島日報》報導，由輝達開發的軟硬體整合技術「統一運算架構」（Compute Unified Device Architecture，CUDA）是一種通用程式框架，能大幅降低研發大模型的難度，獲全球開發商使用，讓輝達在AI發展上擁有壟斷地位。

然而，美國科技網站Tom's Hardware報導，指模型建構的效率比Meta等巨頭高出10倍以上，引述南韓未來資產證券一名分析師談DeepSeek技術的文章形容「他們從頭開始重建了一切」。該分析指出，DeepSeek在使用輝達的H800晶片進行訓練時，使用輝達的底層硬體指令PTX（Parallel Thread Execution）語言，而不是高階程式語言CUDA。

北京航空航太大學副教授黃雷表示，繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發，進而實現更加細微性的操作。

報導指出，DeepSeek擁有一些擅長寫PTX語言的內部開發者，若之後使用中國國產GPU，DeepSeek在硬體適配方面將更得心應手，DeepSeek只要了解這些硬體驅動提供的一些基本函數介面，即可仿照輝達GPU硬體的程式設計介面寫相關代碼，進而讓自家大模型更加容易適配中國國產硬體。