看啥推荐读物
专栏名称: 数据科学杂谈
关注我们,分享数据科学学习经验!
目录
相关文章推荐
今天看啥  ›  专栏  ›  数据科学杂谈

比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

数据科学杂谈  · 公众号  ·  · 2024-03-31 21:18
编辑:alan文章来源:新智元大模型的幻觉问题怎么解?谷歌DeepMind:用AI来做同行评审!事实核验正确率超过人类,而且便宜20倍。AI的同行评审来了!一直以来,大语言模型胡说八道(幻觉)的问题最让人头疼,而近日,来自谷歌DeepMind的一项研究引发网友热议:大模型的幻觉问题,好像被终结了?论文地址:https://arxiv.org/pdf/2403.18802.pdf项目地址:https://github.com/google-deepmind/long-form-factuality在这篇工作中,研究人员介绍了一种名为 "搜索增强事实性评估器"(Search-Augmented Factuality Evaluator,SAFE)的方法。对于LLM的长篇回答,SAFE使用其他的LLM,将答案文本分解为单个叙述,然后使用诸如RAG等方法,来确定每个叙述的准确性。——简单来说就是:AI答题,AI判卷,AI告诉AI你这里说的不对。真正的「同行」评审。另外,研究还发现,相比于人工标注和判断事 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照