主要观点总结
上海AI Lab发布升级版大模型「书生·思客InternThinker」,首度打破围棋AI推理黑盒,具备职业3-5段棋力。该模型通过「通专融合」技术路径和创新训练平台InternBootcamp,构建三层架构体系,推动AI向自我进化、自主科学发现迈进。模型具备自然语言交互性,能解释围棋策略,应对复杂逻辑推理任务。除围棋外,在其他任务中也有不俗表现。研究人员还观察到强化学习的「涌现时刻」。这些进展得益于底层技术的突破,包括记忆体+解码器大模型架构、强化学习算法等。
关键观点总结
关键观点1: 「书生·思客InternThinker」大模型发布
上海AI Lab发布了新一代的大模型,该模型在围棋专业领域具有强大的推理能力,并具备自然语言交互性。
关键观点2: 首次打破围棋AI推理黑盒
大模型首度实现了用自然语言解释围棋策略,打破了长期存在的“黑盒”问题。
关键观点3: 具备职业3-5段棋力
模型能够展示出色的围棋策略分析,被评价为具有职业3-5段的棋力。
关键观点4: 「通专融合」技术路径和Innovation训练平台
大模型通过「通专融合」技术路径和创新训练平台InternBootcamp,构建了一个高效的三层架构体系。
关键观点5: 强化学习的「涌现时刻」
研究人员观察到强化学习中的「涌现时刻」,即多个任务混合训练后,模型能够成功获取任务的正向反馈,实现领域外专业任务的有效强化学习训练。
关键观点6: 底层技术突破
团队在底层技术方面取得了一系列突破,包括记忆体+解码器大模型架构、强化学习算法等。
文章预览
新智元报道 编辑:定慧 好困 【新智元导读】 上海AI Lab发布升级版大模型「书生·思客InternThinker」,首度打破围棋AI推理黑盒,实现用自然语言解释落子逻辑,具备职业3-5段棋力。依托「通专融合」技术路径和创新训练平台InternBootcamp,构建三层架构体系,推动AI向自我进化、自主科学发现迈进。 围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。 近日,上海人工智能实验室(上海AI Lab)发布新一代 书生·思客 (InternThinker)。
………………………………