牛津&谷歌联合发文：大模型在高级心智理论任务上达到成人水平表现！| 大模型持续学习最新进展综述....

AI for Research · 公众号 · · 2024-05-30 16:46

文章预览

前言：看论文就像是一次美食之旅，每一篇论文都是一道不同的菜肴。有些论文会让你大快朵颐，有些论文会让你欲罢不能，而有些论文则会让你咬牙切齿。但是别忘了，只有尝试了各种不同的菜肴，才能成为一个真正的“吃货”哦！ 1. 大模型在高级心智理论任务上达到成人水平表现标题： LLMs achieve adult human performance on higher-order theory of mind tasks 机构：牛津大学、谷歌研究院、约翰霍普金斯大学相关领域：模型评估、数据集构建、评估指标作者： Winnie Street, John Oliver Siy, Geoff Keeling 分析：本文探讨了大型语言模型（LLMs）在高级心智理论（ToM）方面的发展程度，即人类通过递归方式推理多个心理和情感状态的能力。文章通过引入一个手工测试套件——多级心智理论问答，并将五个LLMs的表现与新收集的成人基准进行比较。研究 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博