历史性时刻！Google Veo 3杀疯了，AI视频终于不再是“哑巴”

AI产品阿颖 · 公众号 · AI 科技自媒体 · 2025-05-21 07:36

主要观点总结

谷歌在I/O大会上发布了多个新产品和功能，其中DeepMind带来的Veo 3视频生成模型引人注目。该模型能自动生成画面、配音、音效、环境音，甚至根据提示词自动配出对白。此外，谷歌还推出了新的图像生成模型Imagen 4和应用Flow，用于创作电影级片段和场景。这些新工具主要对美国的Google AI Pro和Ultra订阅用户开放。

关键观点总结

关键观点1: 谷歌在I/O大会上发布了一系列新产品和功能。

包括AI搜索模式、Flow应用、Gemini 2.5 Pro的增强推理模式、智能眼镜等。

关键观点2: DeepMind带来的Veo 3视频生成模型是最引人注目的发布内容。

该模型能自动生成画面，还能一键生成配音、音效、环境音，根据提示词自动配出对白。已经应用在Gemini聊天机器人上，只对订阅了每月249.99美元AI Ultra的用户开放。其特色是“音画同步”。

关键观点3: Imagen 4图像生成模型也同步推出。

在表现精细细节方面有惊人的清晰度，并能生成写实和抽象图像。渲染字体方面有显著提升，能以多种宽高比生成分辨率高达2K的图像。

关键观点4: 谷歌推出了新应用Flow来整合Veo、Imagen和Gemini，用于创作电影级片段和场景。

用户可以用自然语言描述他们想要的最终效果，Flow会自动生成。目前这一新工具仅对美国的Google AI Pro和Ultra订阅用户开放。

关键观点5: AI生成视频的发展对创作者带来了独特的机会。

创造的门槛被打破，人人都可以做自己的导演。但同时也存在行业难题，如AI生成视频容易被滥用或恶意篡改。DeepMind采用自研的SynthID技术在每帧嵌入不可见水印，提升防伪和追溯能力。

文章预览

有点激动，有些激动。每年 I/O 大会，谷歌都会带来重磅炸弹。今天同样如此，谷歌一口气发布了 AI 搜索模式、Flow 应用、Gemini 2.5 Pro 的增强推理模式、智能眼镜等，但最引人注目的，还是 DeepMind 带来的 Veo 3 视频生成模型。 AI 生成视频并不陌生，包括 Sora、Runway、Pika 可灵、Pixverse、即梦在内的产品都在关注这个赛道。这次，Veo3，突破性的将 AI 视频直接拉进了有声时代：不仅能自动生成画面，还能一键生成配音、音效、环境音，甚至连对白都能根据提示词自动配出来。 DeepMind CEO Demis Hassabis 在现场说得很直白：“我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景，还能指定对白和语气。”你甚至可以直接写一句“主角在雨中说出那句台词”，AI 就能按你的要求还原出来。这波新体验，已经在 Gemini 聊天机器人应用 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博