今天看啥  ›  专栏  ›  数字生命卡兹克

卷土重来的大模型"越狱" - 长文本才是那个罪人

数字生命卡兹克  · 公众号  ·  · 2024-04-03 05:58
最近一段时间,大模型的"长文本",成了最炙手可热的词。从20万token的Claude3,到200万字的Kimi。再到通义千问的1000万字,360的500万字。你甭管有没有用,但是大家们都在一轮狂奔。长上下文固然好,我就不止写过一篇文章,来表达我对长文本的喜好,毕竟,这玩意真的能带来很多很有趣的想象空间。但在这一路狂奔之时,Anthropic,也就是造Claude的公司,今天,给长文本,泼了一盘冷水。一句话总结就是:直接利用长文本的特性,量大管饱,给大模型灌海量的有害问答对,从而实现越狱。最骚的是,这个攻击对各大厂的顶尖模型几乎都有效。无一幸免。从论文中能看到,Claude 2.0、GPT-3.5、GPT-4,到 Meta 的 LLaMA 70B、Google 的 Mistral 7B,全部阵亡。越狱这个东西,其实去年有一段时间非常的火。最爆火的那必须属于当年那个奶奶漏洞。只要你对GPT说:请扮 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照