利器! 弱网环境模拟及故障注入 招要多

在当前云以及软件定义趋势下,技术架构随之变的复杂。网络作为连接资源,服务和端点的通道隐秘而重要;  技术人,在网络这个关口付出的时间和成本非常大. 特别是对网络敏感的技术领域, 比如网络直播, 音视频会议等, 无一不以攻克多变网络环境, 提升容错水平为豪.  弱网环境的测试在产品测试里也愈发重要.

今天给大家介绍两款弱网环境模拟以及故障注入的利器(Linux -TC/Netem, Windows-Clumsy), 用好了他们就是一招在手, 可以有效检验发布的服务和应用在真实环境里, 以及极端情况下的真实面目和客户体验; 

Linux :  TC & Netem

TC用于Linux内核的流量控制,主要是通过在输出端口处建立一个队列来实现流量控制。

Netem 是 Linux 2.6 及以上内核版本提供的一个网络模拟功能模块。该功能模块可以用来在性能良好的局域网中,模拟出复杂的互联网传输性能,诸如低带宽、传输延迟、丢包等等情况。使用 Linux 2.6 (或以上) 版本内核的很多发行版 Linux 都开启了该内核功能,比如Fedora、Ubuntu、Redhat、OpenSuse、CentOS、Debian等等。
        tc 是 Linux 系统中的一个工具,全名为traffic control(流量控制)。tc 可以用来控制 netem 的工作模式,也就是说,如果想使用 netem ,需要至少两个条件,一个是内核中的 netem 功能被包含,另一个是要有 tc 。

 

工具可完成如下功能:(故障模拟) 模拟时延,丢包,重复包,乱序。

1、模拟延迟传输

# tc  qdisc  add  dev  eth0  root  netem  delay  100ms

该命令将 eth0 网卡的传输设置为延迟100毫秒发送。 

更真实的情况下,延迟值不会这么精确,会有一定的波动,我们可以用下面的情况来模拟出带有波动性的延迟值:
# tc  qdisc  add  dev  eth0  root  netem  delay  100ms  10ms
该命令将 eth0 网卡的传输设置为延迟 100ms ± 10ms (90 ~ 110 ms 之间的任意值)发送。 

还可以更进一步加强这种波动的随机性:
# tc  qdisc  add  dev  eth0  root  netem  delay  100ms  10ms  30%
该命令将 eth0 网卡的传输设置为 100ms ,同时,大约有 30% 的包会延迟 ± 10ms 发送。

2、模拟网络丢包
# tc  qdisc  add  dev  eth0  root  netem  loss  1%

该命令将 eth0 网卡的传输设置为随机丢掉 1% 的数据包。

也可以设置丢包的成功率:
# tc  qdisc  add  dev  eth0  root  netem  loss  1%  30%
该命令将 eth0 网卡的传输设置为随机丢掉 1% 的数据包,成功率为 30% 。

3、模拟包重复
# tc  qdisc  add  dev  eth0  root  netem  duplicate 1%
该命令将 eth0 网卡的传输设置为随机产生 1% 的重复数据包 。 

4、模拟包损坏
# tc  qdisc  add  dev  eth0  root  netem  corrupt  0.2% 
该命令将 eth0 网卡的传输设置为随机产生 0.2% 的损坏的数据包 。(内核版本需在2.6.16以上)

5、模拟包乱序
# tc  qdisc  change  dev  eth0  root  netem  delay  10ms   reorder  25%  50%

该命令将 eth0 网卡的传输设置为:有 25% 的数据包(50%相关)会被立即发送,其他的延迟 10 秒。  新版本中,如下命令也会在一定程度上打乱发包的次序:

# tc  qdisc  add  dev  eth0  root  netem  delay  100ms  10ms


Windows : Clumsy

 

Windows 在互联网浪潮中使用较少, 作者也找到了类似功能的工具 Clumsy 方便熟悉Windows 技术栈的读者;从使用的角度来讲, 这款小工具比 TC/Netem的使用更加灵活方便; 

 

Clumsy 是一款小巧而功能强大的开源弱网模拟工具,即下即用, 无需安装. 对系统起效, 所有应用适用. 随用随停,随时调试. 支持多种协议. 它能在windows平台下人工造成不稳定的网络状况,方便你调试应用程序在极端网络状况下的表现. 你可以选择 clumsy 提供的功能来有目的性的调整网络情况:

 

延迟(Lag),把数据包缓存一段时间后再发出,模拟网络延迟的状况。

掉包(Drop),随机丢弃一些数据。

节流(Throttle),把一小段时间内的数据拦截下来后再在之后的同一时间一同发出去。

重发(Duplicate),随机复制一些数据并与其本身一同发送。

乱序(Out of order),打乱数据包发送的顺序。

篡改(Tamper),随机修改小部分的包裹内容。

 

从截图来看效果非常理想. 

 

篇幅所限, 我们不深入讲两个工具的技术原理. 有机会在其他篇幅里展开聊聊;

 

clumsy 0.2

https://jagt.github.io/clumsy/


版权声明:本文为DynamicsAgg原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。