今天看啥  ›  专栏  ›  HuggingFace

TTS 擂台: 文本转语音模型的自由搏击场

HuggingFace  · 公众号  ·  · 2024-03-15 21:18
对文本转语音 (text-to-speech, TTS) 模型的质量进行自动度量非常困难。虽然评估声音的自然度和语调变化对人类来说是一项微不足道的任务,但对人工智能来说要困难得多。为了推进这一领域的发展,我们很高兴推出 TTS 擂台。其灵感来自于LMSys为 LLM 提供的Chatbot 擂台。借鉴 Chatbot 擂台的做法,我们开发了一款工具,让任何人可以很轻松地对 TTS 模型进行并排比较。你仅需提交想要转成语音的文本,然后听一下两个不同的模型生成的音频,最后投票选出生成质量较好的模型。我们把投票结果组织成一个排行榜,用以展示社区评价最高的那些模型。LMSyshttps://lmsys.org/Chatbot 擂台https://hf.co/spaces/lmsys/chatbot-arena-leaderboard动机长期以来,语音合成领域缺乏准确的方法以度量不同模型的质量。常用客观指标 (如 WER (word error rate,单词错误率) 等) 并不能可靠地度量 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照