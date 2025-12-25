自由電子報
台灣主權AI訓練語料庫 在地模型護城河

2025/12/25 05:30

數位發展部昨舉行記者會，宣布台灣主權AI訓練語料庫上線，數發部次長侯宜秀（左）、數發部資料創新司司長莊明芬（右）出席。（中央社）數位發展部昨舉行記者會，宣布台灣主權AI訓練語料庫上線，數發部次長侯宜秀（左）、數發部資料創新司司長莊明芬（右）出席。（中央社）

〔記者邱巧貞／台北報導〕數位發展部昨正式發布「台灣主權AI訓練語料庫」，廣納高品質正體中文語料，支援AI（人工智慧）模型訓練更貼近台灣的語言、文化與生活情境；次長侯宜秀強調，推動屬於台灣的語料庫至關重要，資料更是發展AI的重要護城河。

目前已超過二〇〇個政府機關參與，累計上架逾二千筆資料集、超過六億個tokens（詞元），內容涵蓋語言、文化、教育、生物、地理環境等領域；這些具備台灣文化特色的高品質資料集，如同AI的「教材」，能協助模型更深入理解台灣社會，學習更自然、貼近在地的語言表達方式。

侯宜秀說，台灣主權AI訓練語料庫是一項「沒有終點的計畫」，只要台灣存在，語料庫就會持續更新；從中央機關逐步推廣至地方政府及民間機構，攜手推動台灣主權AI發展。

數發部並與經濟部智慧財產局合作推出《台灣主權AI訓練語料授權條款》，建立明確的授權依據，降低個別著作權協商所需的行政成本，減少AI訓練資料可能引發的著作權爭議。

