内核软死锁:NMI watchdog: BUG: soft lockup - CPU#6 stuck for 27s!

现象:虚拟机卡死,在控制看到内核软死锁提示,报错截图如下:
在这里插入图片描述
解决办法:

设置为30s覆盖到配置文件中
echo 30 > /proc/sys/kernel/watchdog_thresh 

查看
 tail -1 /proc/sys/kernel/watchdog_thresh
30

临时生效
sysctl -w kernel.watchdog_thresh=30

常见原因:
1>服务器电源供电不足,导致CPU电压不稳导致CPU死锁
2>vcpus超过物理cpu实际核数
3>虚机所在的宿主机的CPU负载较高或磁盘IO太高
4>虚机CPU负载较高或磁盘IO太高
5>VM网卡驱动存在bug,处理高水位流量时存在bug导致CPU死锁
6>BIOS开启了超频,导致超频时电压不稳,容易出现CPU死锁

本次出现的原因是:
因为开启多台虚拟机vcpu数量超过实际物理核数,同时虚拟机作为NFS 服务端磁盘IO也比较高


版权声明:本文为weixin_47003048原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。