好消息：OpenAI 突然发了新模型！坏消息：只是纠错，没你想得逆天

InfoQ · 公众号 · 科技媒体 · 2024-07-03 12:30

文章预览

整理 | 华卫对于 ChatGPT 等聊天机器人提供支持的大型语言模型来说，最大问题之一是，永远不知道何时可以信任它们。它们可以针对任何问题生成清晰而有说服力的答案，并且提供的大部分信息都是准确而有用的，但它们也会产生幻觉。用不太礼貌的话来说，它们会胡编乱造，需要人类用户自己去发现错误。它们还会阿谀奉承，试图告诉用户他们想听的内容。如今，OpenAI 在这个问题的解决上迈出了最新的一小步：开发了一种上游工具，能够帮助训练模型的人类引导模型走向真实和准确。 6 月 27 日，OpenAI 宣布，其研究人员训练了一个用于捕捉 ChatGPT 代码输出错误的模型，名为 CriticGPT。CriticGPT 是一个基于 GPT-4 的模型，它撰写了对 ChatGPT 响应的评论，以帮助人类训练师在 RLHF 期间发现错误。 OpenAI 发现，当人们在 CriticGPT 的帮助下审阅 ChatGPT 代码时 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博