看啥推荐读物
专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

语音版deepfake出现:从文本到逼真人声,被模仿者高呼真得可怕

机器之心  · 公众号  · AI  · 2019-05-18 12:29
机器之心报道参与:淑婷、路加拿大创业公司 Dessa 开发出一个语音合成系统 RealTalk,与以往基于语音输入学习人声的系统不同,它可以仅基于文本输入生成完美逼近真人的声音。不过,出于伦理、社会影响等方面的考虑,Dessa 并未公布该项目的研究细节、模型和数据集。加拿大创业公司 Dessa 近日发布了一项新研究:利用其最新开发的 RealTalk 系统,仅利用文本输入即可生成完美逼近真人的声音。其 demo 中展示了美国著名脱口秀喜剧演员、主持人 Joe Rogan 的声音(Joe Rogan 就是那个让马斯克在节目中嗨了的主持人)。所有音频均为机器学习模型使用文本输入生成的。音频中包括换气声、「um」「ah」等词语和噪声。视频中,「Joe Rogan」用他一贯的语调和风格,谈论黑猩猩曲 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照