Google launches Veo 3, an AI video generator that incorporates audio

谷歌推出了 Veo 3，這是一款能夠生成視頻並結合音頻的人工智能視頻生成器，使其與競爭對手如 OpenAI 的 Sora 有所區別。該工具面向美國的谷歌 249.99 美元每月的 Ultra 計劃訂閲者以及 Vertex AI 的用户。此外，谷歌還推出了用於圖像生成的 Imagen 4 和用於電影視頻創作的 Flow。這些發佈反映了生成式人工智能在圖像和視頻領域日益增長的受歡迎程度，儘管過去在 AI 準確性方面面臨挑戰

谷歌首席執行官桑達爾·皮查伊在谷歌 I/O 開發者大會上發言。

安德烈·索科洛夫 | 圖片聯盟 | Getty Images

谷歌週二宣佈推出 Veo 3，這是一款可以生成視頻並且能夠創建和融入音頻的人工智能視頻生成器。

這款人工智能工具與 OpenAI 的 Sora 視頻生成器競爭，但其能夠將音頻融入所創建視頻的能力是一個關鍵區別。公司表示，Veo 3 可以融入包括角色對話和動物聲音的音頻。

谷歌 DeepMind 產品副總裁伊萊·柯林斯在週二的博客中表示：“Veo 3 在文本和圖像提示、現實物理以及準確的口型同步方面表現出色。”

這款視頻音頻人工智能工具於週二向美國的谷歌新訂閲計劃 Ultra 的 249.99 美元每月用户開放，該計劃面向狂熱的人工智能愛好者。Veo 3 也將向谷歌的 Vertex AI 企業平台用户提供。

谷歌還宣佈了 Imagen 4，這是其最新的圖像生成工具，公司表示該工具通過用户提示生成更高質量的圖像。此外，谷歌推出了 Flow，這是一款新的電影製作工具，允許用户通過描述地點、鏡頭和風格偏好來創建電影視頻。用户可以通過 Gemini、Whisk、Vertex AI 和 Workspace 訪問該工具。

最新的發佈正值圖像和視頻成為生成性人工智能提示的熱門應用場景。OpenAI 首席執行官山姆·奧特曼在三月表示，ChatGPT 的 4o 圖像生成器如此受歡迎，以至於導致公司的計算芯片 “融化”。公司表示不得不暫時限制該功能的使用。

谷歌在其人工智能圖像生成器方面的記錄喜憂參半。去年，該公司不得不重新推出其 Imagen 3 工具，因為它向用户的提示提供了歷史上不準確的結果，導致廣泛的批評。聯合創始人謝爾蓋·布林後來表示，這一失誤是由於缺乏 “徹底的測試”。

位於加利福尼亞州山景城的公司還更新了其 Veo 2 視頻生成器，增加了用户可以通過文本提示添加或移除視頻中對象的能力。此外，谷歌通過其 YouTube Shorts 平台和使用 Vertex AI 的企業向創作者開放了其 Lyria 2 音樂生成模型。

觀看： 谷歌 I/O：人工智能展示的高風險