融合RL与LLM思想，探寻世界模型迈向AGI/ASI的第一性原理反思和探索：RL×LLM×WM>AI4S>AGI>ASI「上篇」

数据派THU · 公众号 · 大数据 · 2024-04-16 16:35

本文约16000字，建议阅读20+分钟针对围绕LLM的洞察思考上，我们尝试通过在几个方面进行对LLM内涵的深入阐释。本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统一，同时与最近OpenAI暴露出的project Q*可能的关于细粒度过程学习再到系统①(快)思考与系统②(慢)思考的形式化统一的延展性思考，以展望并探索当下面向未来的AGI->ASI的路径可行性。正如前几日AI一姐李飞飞所说，人工智能即将迎来它的「牛顿时刻」本篇文章拟分为「上篇」「中篇」「下篇」作者：吕明，坐标西二旗，技术探索方向LLM/RL/AGI/AI4S..「上篇」AlphaDev的尝试探索的开始，想以一个去年(23年)年中颇具戏剧性的两个事件为开端...故事的背景和起因是这样的，自AlphaGO为AI制造的涟漪还在、ChatGPT为AIGC掀起了更 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博