专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

【[37星]Ola:打破多模态边界,实现图像、视频、音频全方位理-20250207194005

爱可可-爱生活  · 微博  · AI  · 2025-02-07 19:40
    

文章预览

2025-02-07 19:40 本条微博链接 【[37星]Ola:打破多模态边界,实现图像、视频、音频全方位理解的全能语言模型。亮点:1. 在多模态基准测试中性能超越30B参数以下所有模型,平均得分高达72.6分;2. 支持文本、图像、视频、音频四种模态输入,一站式解决多模态理解难题;3. 提供实时流式解码功能,让文本和语音交互更流畅】 'Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment' GitHub: github.com/Ola-Omni/Ola ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览