看啥推荐读物
专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

不识字也能翻译:谷歌AI直接用音频翻音频,不用先转文本

量子位  · 公众号  · AI  · 2019-04-16 14:21
翻栗子 发自 凹非寺量子位 出品 | 公众号 QbitAI在我们的世界里,谷歌翻译是这样的:△ 一直被调戏的翻译娘在谷歌的世界里,谷歌翻译是这样的:△ 西语→英语:你不问,就不会知道了请注意,视频里的文字只是为了便于观赏,才存在的。而AI在翻译语音的时候,不把西语的音频转成文本,也不生成任何英语的文本,直接产出了英文音频。和标答一字不差。这是谷歌团队的最新成果,想法大胆而有效。仿佛在双语环境里出生的小朋友,还没识字,就能把爸爸说的话翻译给妈妈。怎么会不用看文本?这个翻译模型,名字叫做S2ST (全称Speech-to-Speech Translation) 。不看文本只靠听,背后的原理是把一种语音的声谱图 (Spectrogram) ,映射到另一种语音的声谱图上。那么,声 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照