今天看啥  ›  专栏  ›  OSC开源社区

神级程序员Fabrice Bellard发布音频压缩工具TSAC:底层采用Transformer模型、算力要求高

OSC开源社区  · 公众号  · 程序员  · 2024-04-09 16:49
FFmpeg 之父 Fabrice Bellard 朴实无华的个人主页增加了一个新项目——音频压缩工具 TSAC,可对音频的比特率进行极低压缩。根据介绍,对于 44.1 kHz 的音频,TSAC 可将其压缩至 5.5 kb/s (单声道)或 7.5 kb/s (立体声)—— 并确保提供可感知的 “良好” 质量。此外还可将一首 3.5 分钟的立体声乐曲压缩至 192 KiB。下面感受一波 TSAC 的压缩效果:original(原始音频)stereo 7.26 kb/s(立体声)mono 5.61 kb/s(单声道)stereo 2.99 kb/s(立体声)Fabrice Bellard 表示,TSAC 基于针对立体声扩展的 Descript Audio Codec 的修改版本和 Transformer 模型,以进一步提高压缩比。两种模型均量化为每个参数 8 位。由于 TSAC 需要大量的计算能力,如果希望快速运行推荐使用英伟达 GPU,当然也支持 CPU,但速度较慢。Fabrice Bellard 是法国计算机程序员,以编写FFmpeg,QEMU和Tiny C编译器而闻名。他开 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照