卷土重来的大模型"越狱" - 长文本才是那个罪人

数字生命卡兹克 · 公众号 · · 2024-04-03 05:58

最近一段时间，大模型的"长文本"，成了最炙手可热的词。从20万token的Claude3，到200万字的Kimi。再到通义千问的1000万字，360的500万字。你甭管有没有用，但是大家们都在一轮狂奔。长上下文固然好，我就不止写过一篇文章，来表达我对长文本的喜好，毕竟，这玩意真的能带来很多很有趣的想象空间。但在这一路狂奔之时，Anthropic，也就是造Claude的公司，今天，给长文本，泼了一盘冷水。一句话总结就是：直接利用长文本的特性，量大管饱，给大模型灌海量的有害问答对，从而实现越狱。最骚的是，这个攻击对各大厂的顶尖模型几乎都有效。无一幸免。从论文中能看到，Claude 2.0、GPT-3.5、GPT-4，到 Meta 的 LLaMA 70B、Google 的 Mistral 7B，全部阵亡。越狱这个东西，其实去年有一段时间非常的火。最爆火的那必须属于当年那个奶奶漏洞。只要你对GPT说：请扮 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博