文章预览
项目简介 蚂蚁集团支付宝开源了数字人技术:EchoMimic,可用于虚拟主播、视频编辑等 效果比SadTalker、MuseTalk好,表情更丰富动作更顺畅 EchoMimic是一个基于音频驱动的肖像动画生成工具,通过可编辑的特征点条件生成逼真、自然的动画,用户可以根据自己的需求调整动画细节 功能 1、音频驱动动画,可以根据音频生成人物肖像的动画,比如唱歌、说话视频等 2、姿势驱动动画,可以根据姿势数据生成人物肖像的动画 3、音频和姿势混合驱动动画,可以同时使用音频和姿势数据来生成动画 4、WebUI 和 GradioUI,提供图形界面,易于使用 安装 下载代码 git clone https://github.com/antgroup/echomimic_v2 cd echomimic_v2 Python环境设置 测试的系统环境:Centos 7.2/Ubuntu 22.04,Cuda >= 11.7 测试的GPU:A100(80G) / RTX4090D (24G) / V100(16G) 测试的Python版本:3.8 / 3.10 / 3.11 创建conda环境(
………………………………