Meta創辦人祖克柏在臉書發布影片,和一名台灣工程師對話,示範閩南語轉換英語的AI即時語音翻譯。(取自祖克柏臉書)
〔記者徐子苓/台北報導〕Meta創辦人祖克柏今天在臉書發布影片宣布,Meta打造一個AI翻譯系統,可以將閩南語(Hokkien)轉換為英語,讓說閩南語的民眾可直接和英語人士對話!該翻譯系統參考自台灣的語音語料庫,藉此建立一個語音翻譯資料集,未來將開放資料集的原始碼,鼓勵更多人進行閩南語翻譯。
一般翻譯工具主要是將文字轉換為文字,而這套翻譯系統特別的是支援語音轉語音,能夠將沒有標準書寫文字系統、通常以口語表達的語言,轉換為另一種語言。
Meta表示,這個翻譯系統是Meta Universal Speech Translator(UST,通用語音翻譯工具)專案的一部分,該專案致力於開發新的AI方法,希望最終能為所有現存語言進行即時語音翻譯。Meta認為口語溝通有助於拉近人們之間的距離,「甚至在元宇宙中也不例外」。
不過,開發這個翻譯系統也面臨重大挑戰。Meta指出,閩南語是所謂的「資源匱乏語言」,沒有足夠的訓練資料。因此Meta利用中文作為中間語言,先將英語(或閩南語)語音翻譯成中文文字,接著再翻譯成閩南語(或英語),然後新增至訓練資料中。此方法利用資源充足的相似語言資料,大幅改善了模型成效。
此外,系統也必須評估語音翻譯的準確度,Meta根據名為Taiwanese Across Taiwan的閩南語語音語料庫,建立第一個閩南語與英語雙向的語音翻譯基準資料集。
Meta還宣布,將開放此基準資料集的原始碼,以鼓勵其他研究人員合作進行閩南語語音翻譯,並一同在該領域中取得進一步進展。
Taiwanese Across Taiwan(TAT)在官網說明,TAT為台語朗讀語料,是以原生台文文本,收集來自台灣各地不同腔調的台語語音,並同時以6隻麥克風進行錄製。錄好的台語語音,經由2次人工校正文本後,整理成可供語音辨認技術研究與開發使用之語音語料庫。
一手掌握經濟脈動 點我訂閱自由財經Youtube頻道
不用抽 不用搶 現在用APP看新聞 保證天天中獎 點我下載APP 按我看活動辦法