看啥推荐读物
专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

[LG] Defending Against Unforesee-20240317064603

爱可可-爱生活  · 微博  · AI  · 2024-03-17 06:46
2024-03-17 06:46 本条微博链接 [LG] Defending Against Unforeseen Failure Modes with Latent Adversarial Training 网页链接 深入探讨了AI系统部署后出现的意外行为,并提出一种新的防御手段:潜对抗训练(LAT)。LAT区别于传统的对抗训练(AT),它不通过生成触发模型失败的输入,而是在模型的潜表示层面进行干预,利用网络对信息进行处理时构建的更加压缩、抽象和结构化的概念表示。通过在图像分类、文本分类和文本生成任务中的实验表明,与AT相比,LAT通常能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照