作者:中国移动云能力中心——刘志帅
概要:网络排错对于网络工程师或运维人员都十分重要,因此了解网络排错的实践流程以及流程中每一步的原理就显得非常重要,当网络出现问题时,可以迅速排查出网络问题所在,从而快速解决网络问题。
一、虚拟机网路连接示意图
虚拟机网路连接分为:物理层>虚拟层>GOS层,如下图:
二、故障原因分析逻辑
三、排错过程
- 执行初始化故障检查
- 在虚拟机的 cmd 界面下执行 ping 命令失败
- 尝试从虚拟机上 ping 其它 VMs 或 ESXi Hosts 时失败;从其它设备 ping 过来时依然失败
- 检查 IP 和防火墙设定故障
- IP 设定故障:去 GOS 里检查 IP、子网掩码和网关等的设定
- GOS 防火墙故障:确认防火墙的 Inbound 和 Outbound 的 Traffic Policy,如非必要,关闭防火墙
- 检查端口组配置
- 虚拟机所连 Port Group 名字不对:执行esxcfg-vswitch -l 命令验证 ESXi Host 上是否存在这个 Port Group,且其所连接的 Port Group是否一致
- 虚拟机网路卡没有连接到 Port Group:如下图所示,确认 Connected 选项正常:
- 检查 ESXi Host 连接
- 检查 ESXi Host 上是否存在存储或资源争用:确认虚拟机没有处于离线状态和没有存在资源争用情况
- 检查 ESXi Host 的网路连接是否存在问题:执行ping、telnet等命令去诊断是否存在 ESXi Host 的网路问题
- 检查是否存在 pNIC 或其它物理故障:将虚拟机连接到配置了 NIC Teaming 的 vSwitch 上,检查 vSwitch 是否有足够的可用端口
- 虚拟交换机可能无法提供足够的虚拟端口用于虚拟机连接到网路中:执行 esxcfg-vswitch -l 命令来查看已配置端口数量,如下图:
- 解决 vSwitch 端口数量不足的方法,如果确认由于 vSwitch 无法提供足够端口数量用于虚拟机网路连接时,才可以采取如下方式来处理:
- 增加当前 vSwitch 上的虚拟端口数量,然后重启这台 ESXi Host
- 创建新的 vSwitch,然后分离一部分 VMs 到新的 vSwitch 上
版权声明 (原创):本文内容由移动云用户自发贡献,版权归原作者所有,移动云开发者社区不拥有其著作权,亦不承担相应法律责任。如果您发现本社区有涉嫌抄袭的内容,可填写举报信息,一经查实,本社区将立刻删除涉嫌侵权内容。
版权声明:本文为ecloud_developer原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。