让安全大模型不做花瓶
文章提出基于RAG+ToT架构的安全大模型解决方案,通过分解-探索-剪枝三阶段推理提升复杂场景下的理解与推理能力。利用230M网安图书和1.1B公开数据进行预训练,并结合强化学习与人类对抗训练,实现漏洞挖掘、渗透测试等自动化决策。配套工具链支持人机协同与无人对抗闭环。 2025-8-10 12:58:21 Author: vipread.com(查看原文) 阅读量:9 收藏

本议题聚焦于面向复杂场景的模型训练与架构设计,提出多种解决方案提升模型在网络安全场景下的理解与推理能力。在此方案下的实验中,体现了自动渗透、自动修复、自动信息收集、自动打靶、参与CTF竞赛等通用能力,初步具备无需人工干预的通用执行能力。

《让安全大模型不做花瓶》提出以RAG+ToT(Tree-of-Thoughts)架构破解大模型在安全场景中的上下文瓶颈,通过“分解-探索-剪枝”三阶段推理,把复杂网安任务拆成可验证的子链,再按优先级回溯生成最优策略。我们使用230M网安图书、1.1B公开文章及CTF Write-up继续预训练Hive-0模型,并引入GRPO强化学习与人类红队对抗,实现漏洞挖掘、渗透测试、告警研判等场景的自动化决策。配套浏览器驱动、Console工具链,支持一键调用扫描器、取证脚本,形成“人机协同-无人对抗”的闭环,真正让安全大模型从“问答玩具”变成可落地的防御生产力。


文章来源: https://vipread.com/library/topic/4003
如有侵权请联系:admin#unsafe.sh