文章预览
前言: 看论文就像是一次美食之旅,每一篇论文都是一道不同的菜肴。有些论文会让你大快朵颐,有些论文会让你欲罢不能,而有些论文则会让你咬牙切齿。但是别忘了,只有尝试了各种不同的菜肴,才能成为一个真正的“吃货”哦! 1. 大模型在高级心智理论任务上达到成人水平表现 标题: LLMs achieve adult human performance on higher-order theory of mind tasks 机构: 牛津大学、谷歌研究院、约翰霍普金斯大学 相关领域: 模型评估、数据集构建、评估指标 作者: Winnie Street, John Oliver Siy, Geoff Keeling 分析: 本文探讨了大型语言模型(LLMs)在高级心智理论(ToM)方面的发展程度,即人类通过递归方式推理多个心理和情感状态的能力。文章通过引入一个手工测试套件——多级心智理论问答,并将五个LLMs的表现与新收集的成人基准进行比较。研究
………………………………