今天看啥  ›  专栏  ›  机器之心

一天拿下3.4k star,这个1.6B开源模型火了,合成对话超逼真

机器之心  · 公众号  · AI  · 2025-04-23 17:12
    

文章预览

机器之心报道 编辑:Panda、张倩 如果不提前告诉你,你可能很难相信这段视频里的语音全部是 AI 生成的: 这些声音来自  Dia-1.6B ——一个刚刚在 𝕏、GitHub 等平台上走红的开源语音模型。它不仅能生成说话的声音、对话,同时也能合成真实感非常强的笑声、喷嚏声和吸鼻子声等表达情绪的声音。 由于效果过于逼真,它在 GitHub 上线后不到 24 小时就收获了超过  3.4k  star,现在的 star 数更是已经达到了  5.4k 。同时,Dia-1.6B 也是目前 Hugging Face 上热度第二的模型,目前已经被下载了超过 5600 次。 GitHub:https://github.com/nari-labs/dia/ Hugging Face: https://huggingface.co/nari-labs/Dia-1.6B 试用地址:https://huggingface.co/spaces/nari-labs/Dia-1.6B 在和 ElevenLabs Studio、Sesame CSM-1B 等之前以逼真著称的模型对比之后,Dia-1.6B 依然有着明显的优势,尤其是在情绪表达方面。 Dia-1.6B 生成 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览