今天起，汉字也能AI视频生成了！《滕王阁序》直接拿捏到位了

量子位 · 公众号 · AI · 2025-01-09 12:18

主要观点总结

文章介绍了通义万相新升级的AI视频生成模型，包括其能够生成汉字、处理复杂运动、还原真实物理规律等特点。文章还详细描述了通义万相的技术创新，包括VAE与DiT架构协同发力、超长序列训练上的突破、数据与评估双轮驱动等。

关键观点总结

关键观点1: AI视频生成模型能够生成汉字和其他语言，且还原真实场景。

文章中提到的通义万相新升级模型能够生成包含汉字的复杂视频，并且能够处理英文单词的生成。此外，该模型还能还原真实场景的物理规律，呈现出逼真的效果。

关键观点2: 通义万相的技术创新包括三步走策略。

这三步走策略包括视频VAE与DiT架构协同发力、超长序列训练上的突破以及数据与评估双轮驱动。这些技术创新使得通义万相能够在视频生成领域取得更高的性能。

关键观点3: 通义万相具有多种功能特点，如在线免费体验、支持多种风格类型、可选择的视频尺寸等。

读者可以通过在线体验入口体验该模型，并通过API调用打造自己的专属应用。此外，该模型还支持多种风格类型和可选的视频尺寸，能够满足用户的不同需求。

文章预览

金磊发自凹非寺量子位 | 公众号 QbitAI “汉字” 这个难关，今天终于被 AI视频生成给拿下了！话不多说，我们直接先来看效果：这个 “福” 字，就这样被AI水灵灵地一笔一划滴了出来。再如下面这个例子，我们的Prompt是：有汉字“量子位”，古风。但这样还是略显单调，我们上一下难度：赛博朋克风格城市夜景，镜头视角是车辆在马路上行驶，对面大楼楼体有巨大的LED广告牌，上面写着“量子位”三个字。好的，我们也算是打了一波赛博广告了。那么让字数再多一点，AI是否能hold住呢？我们直接来挑战一下：水彩透叠插画风格，三只不同颜色的可爱小猫咪手举着一条超大的鱼，从右边走到左边。它们分别穿着粉色、蓝色和黄色的小背心，眼睛圆圆的，表情呆萌。充满童趣，笔触淡雅温馨，简笔画风格。纯白背景上逐渐显示出来几个字 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博