LLM越狱攻击与防御框架

LLM越狱攻击与防御框架
文章介绍《LLM越狱攻击预防与框架 v3.3》，系统分析大语言模型的越狱路径及防御体系（对齐-检测-沙箱-监控），拆解提示工程等六大类攻击，并提供测试脚本与演练方案，帮助定位加固脆弱点，适用于AI产品、红队及合规审计人员。 2025-8-17 05:35:30 Author: vipread.com(查看原文) 阅读量:0 收藏

简介

《LLM越狱攻击预防与框架 v3.3》系统梳理了大语言模型从指令注入到多模态对抗、表征工程到智能体工具滥用的全部越狱路径，配套可落地的防御体系（对齐-检测-沙箱-监控）。文档以威胁模型为纲，将攻击按提示工程、输出结构、优化、模糊、组合、MCP滥用六大类拆解，并提供测试脚本与红队演练方案，帮助安全团队在模型全生命周期内快速定位脆弱点、迭代加固。适用于AI产品、红队及合规审计人员。
提示

本站仅做资料的整理和索引,转载引用请注明出处

2025-08-10 12:58:21.769108
2025-08-15 02:45:44.623486

附件下载

LLM越狱攻击与防御框架_v3.3_20250608_from_freedemon.pdf

时间: 大小: 1.56 M 下载: 3

文章来源: https://vipread.com/library/topic/4014
如有侵权请联系:admin#unsafe.sh