今日arXiv最热NLP大模型论文：无需提示也能推理！Google DeepMind新研究揭示AI内在推理能力

夕小瑶科技说 · 公众号 · · 2024-02-23 13:01

夕小瑶科技说原创作者 | 松果、Python引言：探索无需特定提示的LLM推理能力在人工智能领域，大语言模型（LLMs）已经在各种复杂的推理基准测试中展现出了令人瞩目的性能。传统上，这些推理能力是通过精心设计的提示技术来激发的，例如少量示例提示（few-shot prompting）或零示例提示（zero-shot prompting）。然而，这些方法往往涉及到手动密集的提示工程，限制了它们在不同任务中的通用性。本项工作探索了一个不同的视角，提出了一个关键的问题：LLMs能否在没有特定提示的情况下有效地进行推理？研究发现一令人惊讶的结果，通过简单地改变解码过程，可以从预训练的LLMs中自然地激发出链式推理（CoT）路径。这种解码修改绕过了CoT提示，并且是完全无监督的，不需要模型调整。研究还揭示了预训练语言模型固有的推理能力，这一发现与之前侧 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博