今天看啥  ›  专栏  ›  机器之心

学界 | 普林斯顿与Adobe提出音频编辑技术VoCo:可基于文本插入和替换语音

机器之心  · 公众号  · AI  · 2017-05-28 23:45
选自 kurzweilai机器之心编译参与:Jane W,吴攀普林斯顿大学计算机科学家发明的技术可以像文本编辑软件对文字和 Adobe Photoshop 对图像一样对人的声音进行编辑。正在研发中的「VoCo」软件使得添加或者替换语音中的词变得容易,仅仅通过编辑语音的文字转录(transcript)。新词将会自动合成到讲话中 —— 尽管这些词并没有出现在录音中。该系统使用一个成熟的算法来学习和重建一段特定的声音。这将会使编辑播客和视频中的解说词更加容易,或者在将来,根据联合开发者 Adam Finkelstein 的想法(普林斯顿计算机科学教授),创建更自然的机器人拟人化声音。这将帮助因受伤或疾病失去声音的人借助机器系统重建更自然的声音。 VoCo 的早期版本于 2016 年 11 月发布。相 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照