专栏名称: 机器学习算法与自然语言处理

一个有情怀的公众号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

一次可输入多张图像，还能多轮对话！最新开源数据集，让AI聊天更接近现实

机器学习算法与自然语言处理 · 公众号 · AI 科技自媒体 · 2024-07-01 00:00

主要观点总结

该文章介绍了MLNLP社区及其愿景，以及关于最新开源的超长多图多轮对话理解数据集MMDU的相关内容。文章详细阐述了MMDU的优势和挑战，包括多轮对话与多图像输入、长上下文以及开放式评估等特点。同时，介绍了MMDU基准测试在构建过程中的方法和流程，以及使用GPT-4o作为评判的评估流程。文章还提到了使用MMDU-45k数据集对LVLMs进行微调后的性能提升，并给出了相关指标和数据。最后介绍了MLNLP社区的相关情况。

关键观点总结

关键观点1: MLNLP社区介绍及愿景

MLNLP社区是国内外知名的机器学习与自然语言处理社区，旨在促进学术界、产业界和广大爱好者之间的交流和进步。

关键观点2: 关于MMDU数据集的特点

MMDU数据集具有多轮对话与多图像输入、长上下文以及开放式评估等特点，能够真实复制现实世界的聊天互动情景。

关键观点3: MMDU数据集的构建方法和流程

MMDU数据集的构建过程中采用了从开源的维基百科中选取图像和文本信息，并通过GPT-4o模型辅助构建问题和答案对的方法。

关键观点4: 使用GPT-4o作为评判的评估流程

为了评估模型的性能，使用了GPT-4o作为评判，根据参考答案给出总体分数，并参考多个维度进行评分。

关键观点5: 使用MMDU-45k数据集微调LVLMs的性能提升

使用MMDU-45k数据集对LVLMs进行微调后，模型在多图多轮问答等任务上的性能得到了显著提升。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

倪叔的思考暗时间 · 美团加码，即时零售正式进入爆发期

23 小时前

小狮生活 · 新加坡中小企业韧性十足超六成通过数字化转型逆势增长

昨天

宝玉xp · 据《The Information》报道，OpenAI 正准备通-20250625123003

昨天

爱可可-爱生活 · 【[71星]awesome-vision-language-ac-20250623221337

2 天前

爱可可-爱生活 · 晚安～ #晚安# -20250623224250

2 天前

BioArt · NAR | 季雄团队揭示RNA聚合酶II降解导致GPCR配体结合基因上调机制

1 年前

CCIA数据安全工作委员会 · 知识科普 | 手机号失控背后的数据与安全：看不见的风险是最大的风险

1 年前

机器学习算法与自然语言处理 · 贾佳亚团队新作：10k数据让大模型数学能力超GPT-4

11 月前

金融业招聘官 · 校招 | 上银基金2025届校园招聘（上海）

10 月前

CareerIn投行PEVC求职 · 商业航天公司BP.pdf

8 月前