看啥推荐读物
专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

融合RL与LLM思想,探寻世界模型迈向AGI/ASI的第一性原理反思和探索:RL×LLM×WM>AI4S>AGI>ASI「上篇」

数据派THU  · 公众号  · 大数据  · 2024-04-16 16:35
本文约16000字,建议阅读20+分钟针对围绕LLM的洞察思考上,我们尝试通过在几个方面进行对LLM内涵的深入阐释。本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一,同时与最近OpenAI暴露出的project Q*可能的关于细粒度过程学习再到系统①(快)思考与系统②(慢)思考的形式化统一的延展性思考,以展望并探索当下面向未来的AGI->ASI的路径可行性。正如前几日AI一姐李飞飞所说,人工智能即将迎来它的「牛顿时刻」本篇文章拟分为「上篇」「中篇」「下篇」作者:吕明,坐标西二旗,技术探索方向LLM/RL/AGI/AI4S..「上篇」AlphaDev的尝试探索的开始,想以一个去年(23年)年中颇具戏剧性的两个事件为开端...故事的背景和起因是这样的,自AlphaGO为AI制造的涟漪还在、ChatGPT为AIGC掀起了更 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照