专栏名称: CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
今天看啥  ›  专栏  ›  CV技术指南

NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS

CV技术指南  · 公众号  ·  · 2023-11-03 11:10
前言 把大模型从「守口如瓶」调教成「耿直boy」,最新NDSS论文研究用全自动化的方式实现「越狱」,用大模型敲碎狱墙。Pytorch训练营,花两个星期彻底掌握代码实现CV各大方向专栏与各个部署框架最全教程整理CV全栈指导班、基础入门班、论文指导班 全面上线!!来源:新智元仅用于学术分享,若侵权请联系删除今年,被网友戏称为「奶奶漏洞」的大语言模型「越狱」方法,可以说是火了火。简单来说,对于那些会被义正言辞拒绝的需求,包装一下话术,比如让ChatGPT「扮演已经过世的祖母」,它大概率就会满足你了。不过,随着服务提供商不断地更新和强化安全措施,越狱攻击的难度也不断提高。与此同时,由于这些聊天机器人多作为一个「黑箱」存在,使得外部安全分析人员在评估和理解这些模型的决策过程以及潜在的安全隐患方面面临巨大困 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照