新型越狱攻击席卷ChatGPT、DeepSeek、Gemini 等主流 AI 平台

看雪学苑 · 公众号 · 互联网安全 · 2025-04-27 17:59

文章预览

近期，一种名为 “inception” 的新型越狱攻击技术及其伴生的上下文绕过技术，犹如两颗重磅炸弹，投向了当下炙手可热的生成式 AI 领域，使得包括 OpenAI 的 ChatGPT、Google 的 Gemini、Microsoft 的 Copilot、DeepSeek、Anthropic 的 Claude、X 的 Grok、MetaAI 以及 MistralAI 在内的众多知名 AI 服务纷纷 “中招”，其引发的涟漪正迅速蔓延至整个科技界与社会各界。巧妙的 “inception” 与上下文绕过攻击 inception 越狱攻击：攻击者首先精心设计包含嵌套式虚构场景的提示词，诱导 AI 模型在想象的 “故事世界” 中逐步放松对其行为的伦理和安全约束。例如，先让 AI 设想一个遥远星球上存在的特殊文明，该文明有着与地球截然不同的道德准则，在如此看似无害的幻想描绘基础上，再慢慢引入一些在现实世界中属于违规违禁的内容创作指令，试图使 AI 在层层嵌套的情境迷惑 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博