今天看啥  ›  专栏  ›  机器之心

阿里妈妈发布MUSE:用多模态搞定十万级超长行为序列,并开源Taobao-MM数据集

机器之心  · 公众号  · AI  · 2025-12-16 12:08
    

主要观点总结

阿里妈妈团队提出了MUSE框架,这是一个面向推荐系统的多模态搜索框架,用于唤醒用户的“沉睡数据”并读懂它们背后的语义和视觉关联。MUSE不仅是一个新的CTR模型,更像一个给推荐系统安装上的“多模态海马体”。它利用图像和文本的语义力量,重构了用户跨越时空的兴趣图谱。

关键观点总结

关键观点1: 问题背景:推荐系统面临的长尾数据利用、多模态信息融合以及序列建模的挑战。

现有推荐系统在处理用户积累的大量行为日志时,面临效果不佳和效率不高的问题。特别是在处理包含图像和文本信息的多模态数据时,如何有效融合这些信息以提高推荐效果成为了一个挑战。

关键观点2: MUSE框架的核心理念

MUSE框架通过引入多模态信息,重新组织用户的行为序列,提高推荐系统的效果。它利用图像和文本的语义信息,构建了一个统一的表达框架,从而提高了对用户行为的建模能力。

关键观点3: MUSE框架的技术细节

MUSE框架包括多模态表征的预训练、GSU(粗检索)阶段和ESU(精细建模)阶段。其中,预训练阶段负责生成高质量的多模态embedding;GSU阶段通过余弦相似度检索选出与用户目标item最相关的行为;ESU阶段则通过融合多模态信号和用户ID信息,进行精细的建模。

关键观点4: MUSE框架的工程实现

MUSE框架在工程上通过异步预取的方式解决了长序列和多模态信息带来的计算瓶颈。同时,通过引入多模态信息增强了模型的泛化能力,提高了推荐系统的效果。

关键观点5: MUSE框架的影响和启示

MUSE框架的提出,不仅为推荐系统的发展带来了新的思路和方法,也为工业界和学术界提供了丰富的数据和研究方向。同时,MUSE框架的成功实践也证明了多模态信息在推荐系统中的重要性和潜力。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照