文章预览
机器之心报道 编辑:Panda、张倩 如果不提前告诉你,你可能很难相信这段视频里的语音全部是 AI 生成的: 这些声音来自 Dia-1.6B ——一个刚刚在 𝕏、GitHub 等平台上走红的开源语音模型。它不仅能生成说话的声音、对话,同时也能合成真实感非常强的笑声、喷嚏声和吸鼻子声等表达情绪的声音。 由于效果过于逼真,它在 GitHub 上线后不到 24 小时就收获了超过 3.4k star,现在的 star 数更是已经达到了 5.4k 。同时,Dia-1.6B 也是目前 Hugging Face 上热度第二的模型,目前已经被下载了超过 5600 次。 GitHub:https://github.com/nari-labs/dia/ Hugging Face: https://huggingface.co/nari-labs/Dia-1.6B 试用地址:https://huggingface.co/spaces/nari-labs/Dia-1.6B 在和 ElevenLabs Studio、Sesame CSM-1B 等之前以逼真著称的模型对比之后,Dia-1.6B 依然有着明显的优势,尤其是在情绪表达方面。 Dia-1.6B 生成
………………………………