台灣首個AI大型語言模型鴻海4周完成訓練、輝達助攻

2025/03/10 14:06

鴻海研究院人工智慧研究所長栗永徽表示，FoxBrain模型優先考慮優化訓練策略，而不是簡單地投入運算能力來解決問題。。（本報資料照）鴻海研究院人工智慧研究所長栗永徽表示，FoxBrain模型優先考慮優化訓練策略，而不是簡單地投入運算能力來解決問題。。（本報資料照）

吳孟峰／核稿編輯

〔財經頻道／綜合報導〕全球最大的電子產品代工製造商鴻海集團週一（10日）表示，已經建立自己的具有推理能力的大型語言模型，該模型由公司內部開發，僅用四周時間就完成了訓練。

鴻海研究院（Hon Hai Research Institute, HHRI）表示，該人工智慧模型名為FoxBrain，最初設計用於公司內部使用，可實現數據分析、數學、推理和程式碼生成等功能。

鴻海表示，輝達透過其位於台灣的超級電腦和技術諮詢提供支持，從而實現模型訓練的成功。該公司表示，它打算採取開源模型，以便與行業合作夥伴合作。設想FoxBrain將推動製造業和供應鏈管理的進步。

鴻海研究院人工智慧研究所所長栗永徽表示，該模型「優先考慮優化訓練策略，而不是簡單地投入運算能力」來解決問題。公司表示，栗永徽的團隊使用120個輝達（Nvidia H100）圖形處理單元，在大約四周的時間內完成FoxBrain的訓練。

栗永徽表示，「近幾個月，推理能力的深化以及GPU的高效運用逐漸成為AI領域發展主流。我們的FoxBrain模型採用高效訓練策略，專注於訓練過程優化而非盲目堆砌算力。通過精心設計的訓練方法和資源優化，我們成功打造出具備強大推理能力的本土AI模型。」

以組裝蘋果iPhone聞名的富士康公佈FoxBrain的部分參數。公司表示，將於3月中旬在輝達的年度技術盛會上披露更多資訊。

FoxBrain採用 Meta Llama 3.1為基礎架構，擁有70B參數，在TMMLU+ 測試資料集，大多數的領域優於國內相同規模的Llama-3-Taiwan-70B，尤其在數學與邏輯推理方面展現卓越能力。

美國華爾街日報報導，FoxBrain是台灣第一個具有高級推理能力的大型語言模型，專門針對繁體中文進行設計和優化。公司表示，其模型的性能略微落後於中國的DeepSeek的一些模型，但正在接近世界一流水平。

由於行業變化和盈利能力下降，鴻海集團的核心電子製造業務面臨挑戰，因此該公司已開始向人工智慧和電動車等領域進行多元化發展。

不用抽不用搶現在用APP看新聞保證天天中獎　點我下載APP　按我看活動辦法

台灣首個AI大型語言模型 鴻海4周完成訓練、輝達助攻