EchoMimic全面升级！从数字脸到数字人，输入图+音频+手势即可！

GitHubStore · 公众号 · · 2024-11-27 09:21

文章预览

项目简介蚂蚁集团支付宝开源了数字人技术：EchoMimic，可用于虚拟主播、视频编辑等效果比SadTalker、MuseTalk好，表情更丰富动作更顺畅 EchoMimic是一个基于音频驱动的肖像动画生成工具，通过可编辑的特征点条件生成逼真、自然的动画，用户可以根据自己的需求调整动画细节功能 1、音频驱动动画，可以根据音频生成人物肖像的动画，比如唱歌、说话视频等 2、姿势驱动动画，可以根据姿势数据生成人物肖像的动画 3、音频和姿势混合驱动动画，可以同时使用音频和姿势数据来生成动画 4、WebUI 和 GradioUI，提供图形界面，易于使用安装下载代码 git clone https://github.com/antgroup/echomimic_v2 cd echomimic_v2 Python环境设置测试的系统环境：Centos 7.2/Ubuntu 22.04，Cuda >= 11.7 测试的GPU：A100(80G) / RTX4090D (24G) / V100(16G) 测试的Python版本：3.8 / 3.10 / 3.11 创建conda环境（ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Chiphell · [摄影] 【真正中画幅？】富士GFX100s& Fotodiox RhinoCam Vertex 旋转转接环

11 月前

钱币收藏 · 硬分币珍稀等级划分

10 月前

催化进展 · 北京大学郭少军Nature Synthesis: 诱导不对称电子分布增强COF中过氧化氢的光合作用

8 月前

环球时报 · 央视主播上新，“00后”！

3 月前

常岩CY · 朋友圈，微博之王们火花闪现了！小米理想互动你顶谁？雷军央视夸理想-20250310180101

2 月前