鴻海研究院人工智慧研究所長栗永徽表示,FoxBrain模型優先考慮優化訓練策略,而不是簡單地投入運算能力來解決問題。。(本報資料照)
吳孟峰/核稿編輯
〔財經頻道/綜合報導〕全球最大的電子產品代工製造商鴻海集團週一(10日)表示,已經建立自己的具有推理能力的大型語言模型,該模型由公司內部開發,僅用四周時間就完成了訓練。
鴻海研究院(Hon Hai Research Institute, HHRI)表示,該人工智慧模型名為FoxBrain,最初設計用於公司內部使用,可實現數據分析、數學、推理和程式碼生成等功能。
鴻海表示,輝達透過其位於台灣的超級電腦和技術諮詢提供支持,從而實現模型訓練的成功。該公司表示,它打算採取開源模型,以便與行業合作夥伴合作。設想FoxBrain將推動製造業和供應鏈管理的進步。
鴻海研究院人工智慧研究所所長栗永徽表示,該模型「優先考慮優化訓練策略,而不是簡單地投入運算能力」來解決問題。公司表示,栗永徽的團隊使用120個輝達(Nvidia H100) 圖形處理單元,在大約四周的時間內完成FoxBrain的訓練。
栗永徽表示,「近幾個月,推理能力的深化以及GPU的高效運用逐漸成為AI領域發展主流。我們的FoxBrain模型採用高效訓練策略,專注於訓練過程優化而非盲目堆砌算力。通過精心設計的訓練方法和資源優化,我們成功打造出具備強大推理能力的本土AI模型。」
以組裝蘋果iPhone聞名的富士康公佈FoxBrain的部分參數。公司表示,將於3月中旬在輝達的年度技術盛會上披露更多資訊。
FoxBrain採用 Meta Llama 3.1為基礎架構,擁有70B參數,在TMMLU+ 測試資料集,大多數的領域優於國內相同規模的Llama-3-Taiwan-70B,尤其在數學與邏輯推理方面展現卓越能力。
美國華爾街日報報導,FoxBrain是台灣第一個具有高級推理能力的大型語言模型,專門針對繁體中文進行設計和優化。公司表示,其模型的性能略微落後於中國的DeepSeek的一些模型,但正在接近世界一流水平。
由於行業變化和盈利能力下降,鴻海集團的核心電子製造業務面臨挑戰,因此該公司已開始向人工智慧和電動車等領域進行多元化發展。
一手掌握經濟脈動 點我訂閱自由財經Youtube頻道
不用抽 不用搶 現在用APP看新聞 保證天天中獎 點我下載APP 按我看活動辦法