专栏名称: 看雪学苑
致力于移动与安全研究的开发者社区,看雪学院(kanxue.com)官方微信公众帐号。
今天看啥  ›  专栏  ›  看雪学苑

新型越狱攻击席卷ChatGPT、DeepSeek、Gemini 等主流 AI 平台

看雪学苑  · 公众号  · 互联网安全  · 2025-04-27 17:59
    

文章预览

近期,一种名为 “inception” 的新型越狱攻击技术及其伴生的上下文绕过技术,犹如两颗重磅炸弹,投向了当下炙手可热的生成式 AI 领域,使得包括 OpenAI 的 ChatGPT、Google 的 Gemini、Microsoft 的 Copilot、DeepSeek、Anthropic 的 Claude、X 的 Grok、MetaAI 以及 MistralAI 在内的众多知名 AI 服务纷纷 “中招”,其引发的涟漪正迅速蔓延至整个科技界与社会各界。 巧妙的 “inception” 与上下文绕过攻击 inception 越狱攻击:攻击者首先精心设计包含嵌套式虚构场景的提示词,诱导 AI 模型在想象的 “故事世界” 中逐步放松对其行为的伦理和安全约束。例如,先让 AI 设想一个遥远星球上存在的特殊文明,该文明有着与地球截然不同的道德准则,在如此看似无害的幻想描绘基础上,再慢慢引入一些在现实世界中属于违规违禁的内容创作指令,试图使 AI 在层层嵌套的情境迷惑 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览