晴時多雲

防AI「統派化」 數發部打造台灣主權AI訓練語料庫

2025/05/09 12:07

數發部長黃彥男今天在台東大學演講,特別說明建構台灣主權AI。(記者黃明堂攝)數發部長黃彥男今天在台東大學演講,特別說明建構台灣主權AI。(記者黃明堂攝)

〔記者黃明堂/台東報導〕在AI時代,中國擁大量資料,將造成AI運算模式大中國化,特別是產生政治上偏見;有鑑於此,數位發展部部長黃彥男今天在台東大學演講時提到,數發部正在打造台灣主權AI訓練語料庫,由機關先行,並鼓勵企業釋出資料,並訂定授權條款,消弭資料用於AI訓練涉及的智慧財產權疑慮。

黃彥男應台東大學之邀,今天在向師生專題演講時,講述AI產業五大政策工具,特別提到,台灣的資料量在世界上相當少,AI的大語言模型很容易搜尋到中國的資料,形成中國觀點,政治上的偏見更是可以想像,所以台灣要有自己的資料模型,把台灣本土資料拿出來,供AI大語言模型訓練。

黃彥男說,為精進台灣生成式AI對話引擎,數發部已著手請各部會開放出超過5萬筆資料,包括語文、歷史、地理、動植物及國家文化記憶庫等各個層面,還有業務資料、政策法規等文本資料逾1600項,已提供國科會打造台灣價值的可信任生成式AI,調整模型來適應台灣的語言文化及社會價值。

數發部也徵集高品質正體中文語料,採用台灣文化特色與觀點,繁體中文塊狀資料具備語意連貫性,內容完整且流暢,非僅由數字圖表或修列式文字構成;由於更多的資料是在民間企業,當務之急也是要訂法法律條款,請企業釋出資料,無償供AI訓練使用。

黃彥男說,打造台灣主權AI訓練語料庫,是由政府機關先行, 持續擴大文本資料開放,偕同智慧財產局與台灣學者共同研擬「台灣主權AI訓練語料授權條款」及相關使用規範,以消弭資料用於AI訓練之疑慮。

一手掌握經濟脈動 點我訂閱自由財經Youtube頻道

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

今日熱門新聞
看更多!請加入自由財經粉絲團
網友回應
載入中