今天看啥  ›  专栏  ›  Renee 创业随笔

Cartesia - 超逼真、超快速且高度可控的 AI 语音

Renee 创业随笔  · 公众号  ·  · 2025-05-27 19:37
    

文章预览

Cartesia 旨在构建 超逼真、超快速且高度可控 的语音 AI 系统。这个月刚刚宣布完成  6400万美元 A 轮融资 ,领投方为  Kleiner Perkins 。 试用 整体试用体验下来效果还是不错的,声音也很自然,克隆某个人的声音很快,效果也很好。 我用的原始的 Trump 的音频。 分别进行了如下操作: 声音克隆 本地化 声音转换 个性化 创始团队 创始团队在斯坦福大学人工智能实验室攻读博士期间相识,并共同发明了 状态空间模型(State Space Models,简称 SSMs) ——这是一种用于训练大规模基础模型的全新核心机制,具备更高质量和更高效率。 在过去四年中,Cartesia 团队不仅构建了 SSM 的理论基础,还将其扩展应用至多种模态,包括 文本、音频、视频、图像和时间序列数据 ,并在多个领域实现了 最先进的性能表现 。 🧠 技术核心:Sonic 2.0 模型 📌 架构特点 基于  stat ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览