专栏名称: InfoQ
有内容的技术社区媒体。
目录
今天看啥  ›  专栏  ›  InfoQ

好消息:OpenAI 突然发了新模型!坏消息:只是纠错,没你想得逆天

InfoQ  · 公众号  · 科技媒体  · 2024-07-03 12:30
    

文章预览

整理 | 华卫 对于 ChatGPT 等聊天机器人提供支持的大型语言模型来说,最大问题之一是,永远不知道何时可以信任它们。它们可以针对任何问题生成清晰而有说服力的答案,并且提供的大部分信息都是准确而有用的,但它们也会产生幻觉。用不太礼貌的话来说,它们会胡编乱造,需要人类用户自己去发现错误。它们还会阿谀奉承,试图告诉用户他们想听的内容。 如今,OpenAI 在这个问题的解决上迈出了最新的一小步:开发了一种上游工具,能够帮助训练模型的人类引导模型走向真实和准确。 6 月 27 日,OpenAI 宣布,其研究人员训练了一个用于捕捉 ChatGPT 代码输出错误的模型,名为 CriticGPT。CriticGPT 是一个基于 GPT-4 的模型,它撰写了对 ChatGPT 响应的评论,以帮助人类训练师在 RLHF 期间发现错误。 OpenAI 发现,当人们在 CriticGPT 的帮助下审阅 ChatGPT 代码时 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览