专栏名称: 大侠学Python

我们或许是在学宇宙第一热门语言Python吧！大家都在学Python，大侠和大家一起分享Python资料、Python文章、Python工具资源、Python源码、Python教程，会Python的人生就跟开了挂一样

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

ChatGPT 和 InstructGPT 技术解析

大侠学Python · 公众号 · · 2023-06-23 13:00

来源：机器学习研习院GPT (Generative Pre-Trained Transformer) 是 OpenAI 发布的一系列预训练模型，其目的就是以 Transformer 模型为基础，使用预训练技术，构建通用的文本模型。目前已经公布的模型有：文本预训练 GPT-1，GPT-2，GPT-3，图像预训练 iGPT，多模态预训练 GPT-4。最近非常热门的 ChatGPT 和今年年初公布的 InstructGPT 是一对姊妹模型，有时它们也被叫做 GPT3.5，其模型结构和训练方式都完全一致，即都使用了指示学习（Instruction Learning）和人工反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF）来指导模型的训练，它们的不同仅仅是采集数据的方式有所差异。因此，要搞懂 ChatGPT，我们先从 InstructGPT 开始。背景知识在介绍 ChatGPT/InstructGPT 之前，我们先了解它们依赖的基础算法。1.GPT系列文本预训练模型 GPT-1，GPT-2，GPT-3 都采用的以 Transformer 为核心的结 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博