注册登录

看啥推荐读物

专栏名称: AI科技评论

「AI科技评论」是国内顶尖人工智能媒体和产业服务平台，专注全球 AI 业界、学术和开发三大方向的深度报道。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

爱可可-爱生活 · 【RealTime ...· 21 小时前

爱可可-爱生活 · 【ComfyUI-APISR：针对动漫超分的 ...· 2 天前

爱可可-爱生活 · 几篇论文实现代码：《Safety ...· 4 天前

量子位 · 微软高通英特尔都力推的AI ...· 4 天前

宝玉xp · 一起学多 AI 智能体系统（双语字幕）- ...· 5 天前

今天看啥 › 专栏 › AI科技评论

谷歌再获语音识别新进展：利用序列转导来实现多人语音识别和说话人分类

AI科技评论 · 公众号 · AI · 2019-08-24 20:10

准确识别「谁·在何时·说了啥」作者 | MrBear编辑 | Pita 　从 WaveNet 到 Tacotron，再到 RNN-T，谷歌一直站在语音人工智能技术的最前沿。近日，他们又将多人语音识别和说话人分类问题融合在了同一个网络模型中，在模型性能上取得了重大的突破。对于自动理解人类音频的任务来说，识别「谁说了什么」（或称「说话人分类」）是一个关键的步骤。例如，在一段医生和患者的对话中，医生问：「你按时服用心脏病药物了吗？」患者回答道：「Yes」。这与医生反问患者「Yes？」的意义是有本质区别的。传统的说话人分类（speaker diarization，SD）系统有两个步骤。在第一步中，系统将检测声谱中的变化，从而确定在一段对话中，说话人什么时候改变了；在第二步中，系统将识 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · 【RealTime QA：实时问答平台，定期评估实时基线系统如G-20240528141335

21 小时前

爱可可-爱生活 · 【ComfyUI-APISR：针对动漫超分的非官方APISR实现-20240526145114

2 天前

爱可可-爱生活 · 几篇论文实现代码：《Safety Fine-Tuning at -20240524213916

4 天前

量子位 · 微软高通英特尔都力推的AI PC，为啥联想更先造好？

4 天前

宝玉xp · 一起学多 AI 智能体系统（双语字幕）- 2. 概览这门课程旨在-20240524092943

5 天前

小齐的公考常识 · 【全面改版升级】2025行测高分计划2.0版（超有效的理论+提升+刷题课程）

1 月前

中华会计网校 · 刚刚！增值税又出新规！2020年2月1日开始执行！抓紧时间打印出来学习！

4 年前

浪潮工作室 · 没存在感，是江西人最大的存在感

4 年前

玩车教授 · 10几万的价，20几万的配置，这台高端中国SUV有点料！

4 年前

玩物志 · 玩物日报 | 网易让你云养招财猫、Nike 新款正式发售、全民答题直播火了！一起看看今天的新鲜事

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号