今天看啥  ›  专栏  ›  语音之家

沙龙回顾丨NaturalSpeech 3: 大数据时代的语音解藕和零样本TTS

语音之家  · 公众号  ·  · 2024-04-04 18:00
2024年3月29日,由CCF语音对话与听觉专委会 、深圳市人工智能学会、香港中文大学(深圳)、语音之家、希尔贝壳共同主办的【语音之家】AI技术沙龙—NaturalSpeech 3: 大数据时代的语音解藕和零样本TTS在线上成功举办。  沙龙简介微软NaturalSpeech项目团队联合中科大、港中大(深圳)、浙大等机构联合发布了全新的系统:NaturalSpeech 3,它从语音数据的 “表示” 和 “建模” 两个角度出发,利用创新的属性分解扩散模型和属性分解语音神经编解码器 FACodec,通过 Data/Model Scaling,高效地实现了像人类一样多样化的语音合成,包含不同说话人的、韵律、情感、风格等。实现了零样本语音合成的重要突破。  沙龙回顾琚泽谦琚泽谦是微软亚洲研究院和中国科学技术大学联合培养项目的三年级博士生。在ICML, NeurIPS, ACL, EMNLP等顶级学术会议上发表多篇文章。他 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照