注册登录

专栏名称: GitHubStore

分享有意思的开源项目

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

目录

相关文章推荐

直播海南 · 官方通报“一学校食堂绞肉机发现活蛆”：属实！ · 12 小时前

直播海南 · 交警通报“警用巡逻车撞倒3名行人” · 昨天

文明海南 · 三亚大东海旅游区荣膺国家4A级旅游景区 · 昨天

文明海南 · 三亚大东海旅游区荣膺国家4A级旅游景区 · 昨天

直播海南 · 海南一地4名党员干部和公职人员酒驾醉驾被通报 · 昨天

今天看啥 › 专栏 › GitHubStore

实时语音交互数字人平台VideoChat

GitHubStore · 公众号 · · 2024-11-19 21:50

文章预览

项目简介实时语音交互数字人，支持端到端语音方案（GLM-4-Voice - THG）和级联方案（ASR-LLM-TTS-THG）。可自定义形象与音色，支持音色克隆，首包延迟低至3s。技术选型 ASR (Automatic Speech Recognition): FunASR LLM (Large Language Model): Qwen End-to-end MLLM (Multimodal Large Language Model): GLM-4-Voice TTS (Text to speech): GPT-SoVITS, CosyVoice, edge-tts THG (Talking Head Generation): MuseTalk 本地部署 0. 显存需求级联方案(ASR-LLM-TTS-THG)：约8G，首包约3s（单张A100）。端到端语音方案(MLLM-THG)：约20G，首包约7s（单张A100）。对于不需要使用端到端 MLLM 的开发者，可以选择仅包含级联方案的 cascade_only 分支。 $ git checkout cascade_only 1. 环境配置 ubuntu 22.04 python 3.10 CUDA 12.2 torch 2.3.0 $ git lfs install $ git clone https://www.modelscope.cn/studios/AI-ModelScope/video_chat.git $ conda create -n metahuman python=3.10 $ conda activate metahum ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

直播海南 · 官方通报“一学校食堂绞肉机发现活蛆”：属实！

12 小时前

直播海南 · 交警通报“警用巡逻车撞倒3名行人”

昨天

文明海南 · 三亚大东海旅游区荣膺国家4A级旅游景区

昨天

文明海南 · 三亚大东海旅游区荣膺国家4A级旅游景区

昨天

直播海南 · 海南一地4名党员干部和公职人员酒驾醉驾被通报

昨天

聚美丽 · 20亿体量却裁掉半个公司！美容仪赛道走到头了？

10 月前

旅行雷达助手 · 速度！暑期中秋全都有！含税仅490飞新加坡，五星新航新一波

10 月前

对冲研投 · 研客专栏 | 央行7月的“降”心独具

10 月前

新黄河 · 湖南一村挂横幅“不带女朋友回来不准进村”？村支书回应

4 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 小百科（海外） · Link管理

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号