专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

预训练真的结束了吗？可能没有，而且是以一种新范式出现

深度学习自然语言处理 · 公众号 · · 2025-04-01 17:35

文章预览

在近期关于大规模模型与数据规模极限的讨论中，OpenAI 的 Ilya Sutskever 以及微软研究院的 Shital Shah 都提出了一个值得关注的观点：随着模型不断扩张，数据的质量与多样性会逐渐成为训练的瓶颈，传统的预训练范式可能走向终结。 Ilya Sutskever 在演讲中直言“预训练（as we know it）将会终结”，暗示需要全新的思路来拓展数据边界。Shital Shah 则在社交媒体上更是指出，真实数据的高质量部分是有限的，继续简单堆砌相似数据并不能突破“质量上限”，而合成数据（synthetic data）的潜力尚未被充分发掘。基于这一背景，今天的arxiv, 一篇关于多模态foundation model构建的文章首次验证了该想法。论文：Will Pre-Training Ever End? A First Step Toward Next-Generation Foundation MLLMs via Self-Improving Systematic Cognition 链接：https://arxiv.org/abs/2503.12303 当前多模态大模型（如GPT-4、LLaVA ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博