注册登录

专栏名称: Founder Park

来自极客公园，专注与科技创业者聊「真问题」。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

目录

相关文章推荐

红星新闻 · 最新！俄乌同意交换所有重伤病及25岁以下战俘 ... · 昨天

晨枫老苑 · F-35和歼-35为什么在隐身状态下难以发射近距弹 · 昨天

晨枫老苑 · F-35和歼-35为什么在隐身状态下难以发射近距弹 · 昨天

今天看啥 › 专栏 › Founder Park

ChatGPT 负责人：GPT-4 越来越聪明是因为 post-traning，大模型短期没有数据瓶...

Founder Park · 公众号 · · 2024-05-31 19:49

文章预览

本文编译自 Dwarkesh Patel 对 John Schulman 的访谈。John Schulman 是 OpenAI 联合创始人、研究科学家（OpenAI 现存最主要具有技术背景的创始人），他领导了 ChatGPT 项目，在 OpenAI 内部长期负责模型 post-traning，在 Ilya 和 Jan Leike 离开 OpenAI 后，下一代模型安全性风险相关的研究也会由 John Schulman 来接替负责。John Schulman 的研究主要集中在 RLHF 相关领域，他曾提出 RLHF 是 ChatGPT 成功的秘密武器。本次访谈中，John Schulman 主要分享了自己关于模型训练的最新认知。John 认为 post-training 是模型变得越来越聪明的重要原因，GPT-4 的 Elo 分数之所以能比第一代 GPT 高出 100 分也和 post-traning 的提升相关，在未来的模型训练中，post-traning 需要被分配到更多的计算资源。对于下一阶段模型训练的问题上。John Schulman 认为模型能力的提升应该集中在如何处理连续任务上，今天 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

红星新闻 · 最新！俄乌同意交换所有重伤病及25岁以下战俘，还将互换6000具阵亡军人遗体

昨天

晨枫老苑 · F-35和歼-35为什么在隐身状态下难以发射近距弹

昨天

晨枫老苑 · F-35和歼-35为什么在隐身状态下难以发射近距弹

昨天

博物馆看展览 · 【全国其他】五月份有什么好看的展览（第5期）

1 年前

科创闵行 · 闵行的TA们，获奖了！

9 月前

深圳本地宝 · 2024深圳莲花山簕杜鹃花展出行攻略！

6 月前

电动中国 · 实现突破，锂金属固态电池成功搭载无人驾驶载人航空器上

6 月前

梅特涅的信徒 · 资治通鉴：赤眉军的覆灭

4 月前

关于移动版 · RSS之家 · 卧龙AI搜索 · 更多产品 ·

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号