今天看啥  ›  专栏  ›  大数据文摘

全离线,无延迟!谷歌手机更新语音识别系统,模型大小仅80M

大数据文摘  · 公众号  · 大数据  · 2019-03-13 12:54
大数据文摘出品来源:ai.googleblog编译:周素云、魏子敏识别延迟一直是设备端语音识别技术需要解决的重大问题,谷歌手机今天更新了手机端的语音识别技术——Gboard,重磅推出了一款端到端、全神经、基于设备的语音识别器,支持Gboard中的语音输入。通过谷歌最新的(RNN-T)技术训练的模型,该模型精度超过CTC,并且只有80M,可直接在设备上运行。2012年,语音识别研究获得新突破——深度学习可以提高识别的准确性,最早探索这项技术的产品便是谷歌语音搜索了。这标志这语音识别革命的开始,从深层神经网络(DNNs)到递归神经网络(RNNs),长短期记忆网络(LSTMs),卷积网络(CNNs)等等,新的架构和开发质量每年都在快速提升。在发展过程中,识别延迟仍然是 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照