【Google Cloud Next'25】專為企業打造的 AI 影片製作平台!Vertex AI Media Studio 全面解析

在 Google Cloud Next 25 大會上,Google 隆重推出 Vertex AI Media Studio 一款劃時代的影片創作平台。此平台集合 Imagen 3(圖像生成)、Chirp(聲音生成)、Lyria(音樂生成)以及 Veo 2(影片生成)四大頂尖影音模型,使用者只需輸入簡單文字指令(Prompt),即可快速生成高畫質圖片,或產出有專業旁白和配樂的影片。Vertex AI Media Studio 操作簡便,使用者只需登入 GCP Console,點選 Vertex AI 中的 Media Studio,即可根據 UI 介面指示輕鬆使用各項功能。

下圖便是 Media Studio 的示意圖,紅色方框部分由上到下分別是 Imagen 3(圖片生成)、Chirp(聲音生成)、Lyria(音樂生成)以及 Veo2(影片生成)等功能。使用者可以依據自己的需求,根據網頁上的指示做操作。

注意:因為 Chirp(聲音生成)、Lyria(音樂生成)、以及 Veo2(影片生成)目前還在 Preview 中,如果要使用,需要填寫 Allow List 來作申請(歡迎洽詢 CloudMile 萬里雲來協助申請事宜)。

Vertex AI Media Studio 操作簡便,只需登入 GCP Console,點選 Vertex AI 中的 Media Studio,即可根據指示輕鬆使用各項功能
icon/enlarge

四大模型介紹

Imagen 3 - 高品質靜態圖像生成

Imagen 3 是 Google DeepMind 最新推出的 AI 圖像生成模型,在圖像與 Prompt 的符合度表現上超越同類產品。其生成效率提高約 40%,畫面細節、光影和整體逼真度均達業界領先水準。Imagen 3 還加強了長文本 Prompt 的理解能力,並新增對多語言輸入的支援,滿足全球企業用戶的需求。

Chirp - 自然流暢的語音合成,打造專業影片旁白

Chirp 基於 Google Research 的「通用語音模型」(Universal Speech Model, USM),提供自動語音辨識(ASR)和語音合成(TTS)技術。Chirp 3 提供 8 種不同風格的合成聲線,涵蓋 35 種語言地區的在地化口音。Vertex AI 的 Chirp 5 更支援即時客製語音(Instant Custom Voice)和帶有日誌功能的轉錄(Transcription with Diarization),大幅提升會議摘要、播客分析等應用程式的轉錄清晰度與實用性。

Lyria - 量身打造背景音樂,強化影片情感表達

Lyria 是 DeepMind 與 YouTube 合作開發的 AI 自動生成音樂模型。Lyria 結合 YouTube 音樂影片的聲音資料庫、專業音樂資料集,以及詞曲專家的合作資料,能透過文字輸入生成多樣化的音樂內容,包括樂器伴奏和人聲演唱,使用者可以更細緻地控制音樂的風格和呈現方式。與以往的 AI 音樂模型相比,Lyria 不僅能同時生成歌詞、伴奏以及虛擬歌手的聲音,還能模擬特定藝術家的風格,並內建 SynthID 數位浮水印,以確保生成內容的安全性與可追溯性。

Veo 2 - 透過文字或圖像提示,輕鬆生成高質感影片

Veo 2 是 Google DeepMind 推出的最新一代 AI 影片生成模型,支援文字與影像的多模態輸入。用戶可以單純透過 Text Prompt(文字提示),或結合文字說明和參考圖像,引導模型依據圖像中的主體或風格生成影片。Veo 2 生成的內容內嵌 SynthID 隱形浮水印,並設有提示級別的過濾機制,有效攔截不當的內容請求,確保生成過程的安全性。

各模型的功能特色與應用場景

各模型的功能特色與應用實例
icon/enlarge

Vertex AI Media Studio 的商業價值

Vertex AI Media Studio 整合多項先進 AI 模型,使用者只需輸入簡單文字提示,平台即可自動完成畫面、旁白配音及音樂製作。無需任何編碼或剪輯經驗,企業便能夠快速、高效地製作專業級影片內容,適用於宣傳影片製作、教學素材生成等多種商業情境。相較於其他同類工具,Vertex AI Media Studio 能更方便且快速地將影片製作納入現有的工作流程中,為企業帶來顯著的效率提升。

用 Vertex AI Media Studio 精簡影音製作流程、提升效率

Vertex AI Media Studio 的推出,重新定義企業級影片製作模式。透過整合 Imagen 3、Chirp、Lyria 和 Veo 2 等強大的 AI 模型,企業用戶能夠以更簡便、高效的方式生成高品質的圖像和影片內容。無論是製作宣傳影片、教學素材,還是其他商業用途,Vertex AI Media Studio 都能顯著提升工作效率,降低製作門檻。儘管部分功能目前仍處於 Preview 階段,其潛力與價值已不容忽視。對於希望在數位內容領域取得領先地位的企業,Vertex AI Media Studio 無疑是一個值得重視的強大資源。

參考文件

  1. https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai
  2. https://blog.csdn.net/weixin_57291105/article/details/134664426
  3. https://www.woshipm.com/ai/5945398.html
  4. https://www.freethink.com/robots-ai/ai-music-generator
  5. https://www.ithome.com.tw/news/164516
  6. https://cloud.google.com/use-cases/text-to-image-ai?hl=en
  7. https://www.clarifai.com/blog/evaluate-the-best-speech-to-text-models
  8. https://medium.com/@aitechtoolbox48/how-googles-chirp-3-hd-is-quietly-changing-ai-interaction-f63ca9cd6211
  9. https://www.prnewswire.com/news-releases/gemini-for-the-united-kingdom-google-cloud-announces-ai-products-skills-initiatives-and-startup-credits-for-organisations-across-the-uk-302402375.html
  10. https://techcrunch.com/2024/12/16/google-deepmind-unveils-a-new-video-model-to-rival-sora/
  11. https://blog.google/technology/google-labs/video-image-generation-update-december-2024/
訂閱 CloudMile 電子報

所有 CloudMile 最新消息、產品動態、活動資訊和特別優惠,立即掌握。