记一次Kubernetes排错实战
背景
故障定位
操作
ceph pg repair 1.7c
Kubelet宿主机的Linux内核过低 - Linux version 3.10.0-862.el7.x86_64
可以通过禁用kmem解决
kubectl cordon node02
kubectl drain node02 --delete-local-data --ignore-daemonsets --force
--delete-local-data 删除本地数据,即使emptyDir也将删除;
--ignore-daemonsets 忽略DeamonSet,否则DeamonSet被删除后,仍会自动重建;
--force 不加force参数只会删除该Node节点上的ReplicationController,ReplicaSet,DaemonSet,StatefulSet or Job,加上后所有Pod都将删除。
kubectl uncordon node02
反思
后期可以对部署Kubernetes集群内核进行升级。
集群内可能Pod的异常,由于底层存储或者其他原因导致,需要具体定位到问题进行针对性修复。
(版权归原作者所有,侵删)
点击下方“阅读原文”查看更多
评论