专栏名称: AIGC新智界

区块链/数字货币/比特币中文资讯，创立于2011年，200多位专栏作入驻平台，国内最大区块链资讯原创基地（公众号【原创】认证），我们为以下合作伙伴供稿：火币、OKCoin、BTC.com、BTCC、币看、BTC123、比特时代、挖币网

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

全球最大开源视频模型，现在也Created in China了，阶跃出品

AIGC新智界 · 公众号 · 比特币 · 2025-02-18 17:53

主要观点总结

阶跃星辰联合吉利汽车集团开源了两款多模态大模型：Step-Video-T2V和Step-Audio。这两款模型在Benchmark中表现优秀，性能超过国内外同类开源模型。Step-Video-T2V可以直接生成视频，最长可达204帧，分辨率540P，并引入Video-VAE技术提高生成效率。Step-Audio是行业内首款产品级开源语音交互大模型，具备高逼真度和丰富的语音表达能力。阶跃星辰的开源行动旨在促进大模型技术的共享与创新，推动人工智能的普惠发展。同时，通过开源策略降低产业接入门槛，吸引更多开发者使用其模型。中国开源力量正在壮大，阶跃星辰的开源行动是中国开源力量崛起的一个缩影。

关键观点总结

关键观点1: 开源两款多模态大模型

阶跃星辰联合吉利汽车集团开源了Step-Video-T2V和Step-Audio两款多模态大模型，这是国内首次开源此类模型。

关键观点2: 模型性能表现优秀

这两款模型在Benchmark中表现优秀，性能超过国内外同类开源模型，经过实测验证其效果。

关键观点3: Step-Video-T2V的技术特点

Step-Video-T2V可以生成最长204帧、分辨率540P的视频，并引入Video-VAE技术提高生成效率。此外，它还具有先进的预训练和后训练策略，包括训练效率的提升和Video-DPO算法的引入。

关键观点4: Step-Audio的特点

Step-Audio是行业内首款产品级开源语音交互大模型，具备高逼真度和丰富的语音表达能力。它可以根据不同的场景需求生成不同风格的语音表达，与用户进行高质量对话。

关键观点5: 开源行动的目的

阶跃星辰的开源行动旨在促进大模型技术的共享与创新，推动人工智能的普惠发展。通过开源策略降低产业接入门槛，吸引更多开发者使用其模型。

关键观点6: 中国开源力量的崛起

随着阶跃星辰的开源行动和中国开源力量的壮大，中国在全球开源领域的影响力不断提升。阶跃星辰的开源行动是中国开源力量崛起的一个缩影。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博