AI懂台灣嗎?數發部用高中學測「考」百款LLM

2026/03/09 14:40

AI評測中心評測方式包括使用近五年的高中學測國文科、社會科試題測大型語言模型。(截自AIEC網站)AI評測中心評測方式包括使用近五年的高中學測國文科、社會科試題測大型語言模型。(截自AIEC網站)

〔記者邱巧貞/台北報導〕在全球大型語言模型(LLM)競爭持續升溫之際,台灣政府也建立自身的AI評測機制。數位發展部(簡稱數發部)表示,目前已在數位產業署設立AIEC(AI Evaluation Center,AI評測中心),並針對超過一百種大型語言模型進行測試,涵蓋多數美國與中國模型,同時也包含台灣本土模型及部分歐洲模型。

數產署以發展國內AI產業為規劃藍圖,與國家資通安全研究院、工業技術研究院合作設立AI產品與系統評測中心,制定AI評測相關制度、標準及評測體系,旨在推動台灣國內AI產業的發展,拓展國內外商機。

數發部指出,AI評測的目的在於建立客觀指標,了解不同模型在台灣語言與社會情境下的表現,並作為未來AI應用與政策制定的重要參考。

目前評測主要聚焦三個面向。首先是對台灣繁體中文的理解能力,評測方式包括使用近五年的高中學測國文科試題,檢視模型在語意理解、閱讀能力與語言邏輯上的表現。

第二個評測重點是對台灣社會情境的理解能力。評測團隊會使用近五年的高中學測社會科題目,測試模型對台灣歷史、政治與社會議題的理解程度,藉此觀察AI是否能正確理解台灣社會脈絡。

第三個面向則是是否具備台灣觀點。數發部表示,部分評測題目會設計成在台灣社會具有高度共識、但與中國官方敘事不同的議題,以觀察模型回應是否符合台灣社會的認知與歷史脈絡。

目前相關評測報告已公開於網站,供產業界與研究機構參考。數發部指出,隨著AI技術快速發展,建立具有在地語言與文化脈絡的評測標準,將有助於提升AI在台灣應用的可靠性與適切性,期望在促進AI發展的同時,也確保技術符合台灣社會需求與公共利益。

一手掌握經濟脈動 點我訂閱自由財經Youtube頻道

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

今日熱門新聞
看更多!請加入自由財經粉絲團
載入中