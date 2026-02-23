Gemini可生成長度約30秒的音樂片段，並搭配由Nano Banana製作的封面圖。（AI生成圖）

〔記者邱巧貞／台北報導〕Google持續強化生成式AI在創意內容領域的應用版圖，近日於官方部落格宣布，已將旗下最新音樂生成模型「Lyria 3」以測試版形式導入Gemini應用程式，正式跨足AI音樂創作場域，開放使用者透過簡單提示詞或上傳圖片、影片，快速生成客製化音樂內容。

根據官方內容指出，使用者僅需輸入一段創意描述，例如：「一首關於襪子找到另一半的滑稽R&B慢歌」，系統便能在數秒內生成一段高品質音軌，甚至自動補齊歌詞內容；若上傳照片或影片，Gemini也能從影像中擷取靈感，進一步創作與畫面情境相符的旋律與歌詞。

新版本Lyria 3在音訊生成方面亦迎來三大升級，包括可自動生成歌詞、提供更細緻的風格與節奏控制，以及創作出層次更豐富、音樂性更高的音軌。

目前Gemini可生成長度約30秒的音樂片段，並搭配由「Nano Banana」製作的封面圖，方便使用者下載或透過連結分享。Google指出，該功能的設計初衷並非取代專業音樂製作，而是提供一般使用者一種更直覺、有趣的創意表達方式。

在內容驗證方面，所有透過Gemini生成的音軌皆嵌入Google開發的SynthID浮水印，用以辨識AI生成內容。Gemini同時也擴展驗證能力至音訊、影像與影片檔案，使用者可上傳檔案並詢問其是否為Google AI生成，系統將透過SynthID與模型推理進行判別。

Google表示，自2023年推出Lyria模型以來，已持續與音樂產業合作，並在Lyria 3的訓練過程中嚴格遵循版權與授權規範。系統生成內容將以原創表達為目標，若提示詞涉及特定藝人，模型僅會作為風格靈感參考，而非直接模仿既有作品，並透過過濾機制避免與現有內容產生高度相似。

目前，音樂生成工具支援多語言輸出，並開放18歲以上用戶使用，訂閱用戶則可享有更高的生成次數上限。Google表示，此次導入Lyria 3，旨在降低音樂創作門檻，讓更多使用者能以嶄新方式探索AI輔助的創意表達。

以下為針對「文字轉音樂」與「圖片轉音樂」示範案例：

【文字轉音樂】當你腦中已經有明確的曲風或主題時可使用。

步驟1：開啟Gemini App或造訪gemini.google.com。

步驟2：在對話框中輸入具體的提示詞，例如：「幫我寫一首輕快的嘻哈，曲風要放鬆，主題是關於下雨的午後在咖啡廳讀書，不需要人聲，只要純音樂。」

步驟3：送出指令，稍等約10-20秒，Gemini會生成一段30 秒的音軌以及一張專屬的專輯封面。

【圖片/影片轉音樂】讓 AI 根據視覺內容來「配樂」。

步驟1：點擊對話框旁的「上傳圖片」圖示。

步驟2：上傳一張照片或一段短片，例如：你剛去露營的風景照，或是家裡寵物的滑稽短片。

步驟3：在圖片輸入描述要求。範例：「參考這張海邊日落的照片，創作一段浪漫且充滿電影感的鋼琴曲，並加入海浪的聲音。」

步驟4：Gemini會分析圖片中的視覺元素，如色彩、場景、物體，生成與該畫面意境契合的30秒音軌。

