看啥推荐读物
手机:16601807362,可咨询购买自动驾驶开发套件、自动驾驶教学平台及解决方案、线控底盘、Mobileye相机、德尔福和博世4D雷达、激光雷达。
今天看啥  ›  专栏  ›  人工智能AI大模型与汽车自动驾驶

超越 Sora 极限,120 秒超长 AI 视频模型诞生!

人工智能AI大模型与汽车自动驾驶  · 公众号  ·  · 2024-04-13 15:28
Sora一出,文生视频的在长度这个指标上就卷的没边了。从Pika和Runway的4秒,到VideoPoet的理论无限长,各个团队都在通过各种不同的技术路径不断延长视频生成长度的上限。最近,来自Picsart AI Research,UT Austin和Shi Labs的研究团队提出了一个新的文生视频技术——StreamingT2,可以生成高度一致而且长度可扩展的视频。文生视频技术进入长视频时代。论文地址:https://arxiv.org/abs/2403.14773具体来说,StreamingT2V可以生成1200帧甚至理论上无限长的长视频,并且能保证视频内容过渡非常自然平滑,内容丰富多样。帝国士兵在烟雾中不停奔跑,虽然动作很滑稽,但是幅度很大,人物一致性很好。它的核心构架由3个部分组成:- 一个短期记忆单元——条件注意力模块(CAM),它能够确保视频的连贯性,通过关注前一个视频片段的特征来引导当前片段的生成;- 一个长期 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照