AI懂台灣嗎？數發部用高中學測「考」百款LLM

2026/03/09 14:40

AI評測中心評測方式包括使用近五年的高中學測國文科、社會科試題測大型語言模型。（截自AIEC網站） AI評測中心評測方式包括使用近五年的高中學測國文科、社會科試題測大型語言模型。（截自AIEC網站）

〔記者邱巧貞／台北報導〕在全球大型語言模型（LLM）競爭持續升溫之際，台灣政府也建立自身的AI評測機制。數位發展部（簡稱數發部）表示，目前已在數位產業署設立AIEC（AI Evaluation Center，AI評測中心），並針對超過一百種大型語言模型進行測試，涵蓋多數美國與中國模型，同時也包含台灣本土模型及部分歐洲模型。

數產署以發展國內AI產業為規劃藍圖，與國家資通安全研究院、工業技術研究院合作設立AI產品與系統評測中心，制定AI評測相關制度、標準及評測體系，旨在推動台灣國內AI產業的發展，拓展國內外商機。

數發部指出，AI評測的目的在於建立客觀指標，了解不同模型在台灣語言與社會情境下的表現，並作為未來AI應用與政策制定的重要參考。

目前評測主要聚焦三個面向。首先是對台灣繁體中文的理解能力，評測方式包括使用近五年的高中學測國文科試題，檢視模型在語意理解、閱讀能力與語言邏輯上的表現。

第二個評測重點是對台灣社會情境的理解能力。評測團隊會使用近五年的高中學測社會科題目，測試模型對台灣歷史、政治與社會議題的理解程度，藉此觀察AI是否能正確理解台灣社會脈絡。

第三個面向則是是否具備台灣觀點。數發部表示，部分評測題目會設計成在台灣社會具有高度共識、但與中國官方敘事不同的議題，以觀察模型回應是否符合台灣社會的認知與歷史脈絡。

目前相關評測報告已公開於網站，供產業界與研究機構參考。數發部指出，隨著AI技術快速發展，建立具有在地語言與文化脈絡的評測標準，將有助於提升AI在台灣應用的可靠性與適切性，期望在促進AI發展的同時，也確保技術符合台灣社會需求與公共利益。

一手掌握經濟脈動點我訂閱自由財經Youtube頻道

不用抽不用搶現在用APP看新聞保證天天中獎　點我下載APP　按我看活動辦法