OpenAI:Superalignment的一种途径——Weak-to-Strong GeneralizationIIya在OpenAI出大新闻之前在好多场合讲了要推进“Superalignment”,而且OpenAI提出要投入1000万美元来资助superhuman AI alignment。虽然不知道动荡以后OpenAI还会不会在这个方面投入,但是大佬既然都这么看好这个方向,那么我这种灌水小将怎么能放弃这个蹭热点的机会呢?跟着读一读找一找机会应该还是可以的吧?看简中互联网上讨论这个topic的内容比较少,来简单解读下OpenAI去年12月在相关领域发表的第一篇论文——Weak-to-Strong Generalization: Eliciting Strong Capabilities With Weak Supervision ,然后分享下个人关于还可以怎么做的拙见。img用weak supervision训练的strong models性能超过了supervisor本文大概分为四个部分,第一部分介绍下OpenAI提出来的Superalignment的概念,第二部分介绍论文提出的Weak-to-Strong Generalization的框架
………………………………