晴時多雲

閩南語翻英文!Meta AI口譯系統 竟參考自台灣語料庫

2022/10/20 15:33

Meta創辦人祖克柏在臉書發布影片,和一名台灣工程師對話,示範閩南語轉換英語的AI即時語音翻譯。(取自祖克柏臉書)Meta創辦人祖克柏在臉書發布影片,和一名台灣工程師對話,示範閩南語轉換英語的AI即時語音翻譯。(取自祖克柏臉書)

〔記者徐子苓/台北報導〕Meta創辦人祖克柏今天在臉書發布影片宣布,Meta打造一個AI翻譯系統,可以將閩南語(Hokkien)轉換為英語,讓說閩南語的民眾可直接和英語人士對話!該翻譯系統參考自台灣的語音語料庫,藉此建立一個語音翻譯資料集,未來將開放資料集的原始碼,鼓勵更多人進行閩南語翻譯。

一般翻譯工具主要是將文字轉換為文字,而這套翻譯系統特別的是支援語音轉語音,能夠將沒有標準書寫文字系統、通常以口語表達的語言,轉換為另一種語言。

Meta表示,這個翻譯系統是Meta Universal Speech Translator(UST,通用語音翻譯工具)專案的一部分,該專案致力於開發新的AI方法,希望最終能為所有現存語言進行即時語音翻譯。Meta認為口語溝通有助於拉近人們之間的距離,「甚至在元宇宙中也不例外」。

不過,開發這個翻譯系統也面臨重大挑戰。Meta指出,閩南語是所謂的「資源匱乏語言」,沒有足夠的訓練資料。因此Meta利用中文作為中間語言,先將英語(或閩南語)語音翻譯成中文文字,接著再翻譯成閩南語(或英語),然後新增至訓練資料中。此方法利用資源充足的相似語言資料,大幅改善了模型成效。

此外,系統也必須評估語音翻譯的準確度,Meta根據名為Taiwanese Across Taiwan的閩南語語音語料庫,建立第一個閩南語與英語雙向的語音翻譯基準資料集。

Meta還宣布,將開放此基準資料集的原始碼,以鼓勵其他研究人員合作進行閩南語語音翻譯,並一同在該領域中取得進一步進展。

Taiwanese Across Taiwan(TAT)在官網說明,TAT為台語朗讀語料,是以原生台文文本,收集來自台灣各地不同腔調的台語語音,並同時以6隻麥克風進行錄製。錄好的台語語音,經由2次人工校正文本後,整理成可供語音辨認技術研究與開發使用之語音語料庫。

一手掌握經濟脈動 點我訂閱自由財經Youtube頻道

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

今日熱門新聞
看更多!請加入自由財經粉絲團
網友回應
載入中