今天看啥  ›  专栏  ›  追问nextquestion

大模型的智能真的是涌现出来的吗? | 追问新知

追问nextquestion  · 公众号  ·  · 2024-04-17 17:42
两年前,在“超越模仿游戏基准”(Beyond the Imitation Game Benchmark,简称BIG-bench)项目中,450名研究人员编制了一个包含204个任务的列表,旨在测试大语言模型(LLM,支撑ChatGPT等聊天机器人的模型)的能力。1在大多数情况下,随着模型规模的扩大,性能的提高是可预测且平滑的——模型越大,它的性能就越好。但做有些任务时,能力的提升并非循序渐进,而是在一段时间内表现平平接近零,然后突然跃升。其他研究也发现了类似的能力飞跃。作者将这描述为“突破”(breakthrough)行为;其他研究人员将其比喻为物理中的相变,就像液态水冻结成冰一样。在2022年8月发表的一篇论文中,研究人员指出,这些行为不仅令人惊讶,而且不可预测,它们应该为围绕AI安全、潜能和风险不断发展的讨论提供信息。2他们将这些能力称作“涌现”(emergent),这一 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照