看啥推荐读物
专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

【剑桥大学博士论文】主动学习和半监督学习在语音识别中的应用

数据派THU  · 公众号  · 大数据  · 2024-04-22 19:16
来源:专知本文约1600字,建议阅读5分钟对于主动学习,本论文提出了一种基于贝叶斯框架的方法,称为NBest-BALD。近年来,语音识别技术取得了显著进展,这在很大程度上可以归功于语音识别中深度学习的兴起和计算能力的增强。计算能力的增强使得模型能够在不断扩大的数据集上进行训练,而深度学习则使得这些大型数据集得到了更好的利用。对于商业产品而言,常见的做法是在数千小时的转录音频上进行训练。然而,音频的手动转录成本高昂,高性能系统的发展通常仅限于商业上可行的任务和语言。为了推广不同语言的语音识别技术并使其更易于获取,至关重要的是要最小化训练所需的转录音频量。本论文通过探索各种方法来减少在训练自动语音识别系统中对转录数据的依赖,这些方法包括新颖的主动学习和半监督学习方法。对于主动学习, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照