专栏名称: 大侠学Python
我们或许是在学宇宙第一热门语言Python吧!大家都在学Python,大侠和大家一起分享Python资料、Python文章、Python工具资源、Python源码、Python教程,会Python的人生就跟开了挂一样
今天看啥  ›  专栏  ›  大侠学Python

ChatGPT 和 InstructGPT 技术解析

大侠学Python  · 公众号  ·  · 2023-06-23 13:00
来源:机器学习研习院GPT (Generative Pre-Trained Transformer) 是 OpenAI 发布的一系列预训练模型,其目的就是以 Transformer 模型为基础,使用预训练技术,构建通用的文本模型。目前已经公布的模型有:文本预训练 GPT-1,GPT-2,GPT-3,图像预训练 iGPT,多模态预训练 GPT-4。最近非常热门的 ChatGPT 和今年年初公布的 InstructGPT 是一对姊妹模型,有时它们也被叫做 GPT3.5,其模型结构和训练方式都完全一致,即都使用了指示学习(Instruction Learning)和人工反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来指导模型的训练,它们的不同仅仅是采集数据的方式有所差异。因此,要搞懂 ChatGPT,我们先从 InstructGPT 开始。背景知识在介绍 ChatGPT/InstructGPT 之前,我们先了解它们依赖的基础算法。1.GPT系列文本预训练模型 GPT-1,GPT-2,GPT-3 都采用的以 Transformer 为核心的结 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照