看啥推荐读物
专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」

数据派THU  · 公众号  · 大数据  · 2024-04-18 17:00
本文约5W+字,建议阅读30+分钟本文从一个独特的视角解释了现有多模态大模型幻觉产生的原因。本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一,同时与最近OpenAI暴露出的project Q*可能的关于细粒度过程学习再到系统①(快)思考与系统②(慢)思考的形式化统一的延展性思考,以展望并探索当下面向未来的AGI->ASI的路径可行性。正如前几日AI一姐李飞飞所说,人工智能即将迎来它的「牛顿时刻」本篇文章拟分为「上篇」「中篇」「下篇」作者:吕明,坐标西二旗,技术探索方向LLM/RL/AGI/AI4S..「中篇」「系统一 · 快思考与系统二 · 慢思考」的本质&阐释‍细心的读者可能会在上篇的内容预告与中篇内容的更新中对比发现,将「系统一 · 快思考与系统二 · 慢思考的本质&阐释」 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照