k8s第六节 故障排查

k8s故障排查,k8s组件比较多,经常会有一些问题,需要排查。
----
生僻单词
taint: 污点(查看污点、设置污点、取消污点)
cordon: 封锁;标记节点不可调度
uncordon: 标记节点可以调度;
drain: 驱逐节点上的pod.

一、使用 Rancher2发现的一些故障和问题

1.1、kubeadm安装k8s 组件controller-manager 和scheduler状态 Unhealthy

Unhealthy

参见:kubeadm安装k8s 组件controller-manager 和scheduler状态 Unhealthy

1.2 kubeadm主节点不可不可调度

node-role.kubernetes.io/master:NoSchedule
node-role.kubernetes.io/master:NoSchedule
参考:k8s taint命令让master节点参与调度(去除污点node-role.kubernetes.io/master:NoSchedule)

 #1:查看节点 `jiuzhou-web` 污点
 kubectl describe nodes jiuzhou-web | grep Taint 
 #2:删除节点`jiuzhou-web`的污点`node-role.kubernetes.io/master:NoSchedule`,注意:减号`-`是去掉污点的意思
 kubectl taint nodes jiuzhou-web node-role.kubernetes.io/master:NoSchedule-
 #3: 验证污点是否去掉,重新执行 命令1,发现污点是<none>:Taints:             <none>
  kubectl describe nodes jiuzhou-web | grep Taint