LLM越狱攻击与防御框架
文章介绍《LLM越狱攻击预防与框架 v3.3》,系统分析大语言模型的越狱路径及防御体系(对齐-检测-沙箱-监控),拆解提示工程等六大类攻击,并提供测试脚本与演练方案,帮助定位加固脆弱点,适用于AI产品、红队及合规审计人员。 2025-8-17 05:35:30 Author: vipread.com(查看原文) 阅读量:0 收藏

  • 简介

    《LLM越狱攻击预防与框架 v3.3》系统梳理了大语言模型从指令注入到多模态对抗、表征工程到智能体工具滥用的全部越狱路径,配套可落地的防御体系(对齐-检测-沙箱-监控)。文档以威胁模型为纲,将攻击按提示工程、输出结构、优化、模糊、组合、MCP滥用六大类拆解,并提供测试脚本与红队演练方案,帮助安全团队在模型全生命周期内快速定位脆弱点、迭代加固。适用于AI产品、红队及合规审计人员。

  • 提示

    本站仅做资料的整理和索引,转载引用请注明出处

  • 2025-08-10 12:58:21.769108

  • 2025-08-15 02:45:44.623486

附件下载
  • LLM越狱攻击与防御框架_v3.3_20250608_from_freedemon.pdf

    时间: 大小: 1.56 M 下载: 3


文章来源: https://vipread.com/library/topic/4014
如有侵权请联系:admin#unsafe.sh