Pod异常问题排查_容器服务 Kubernetes 版 ACK(ACK)-阿里云帮助中心

本文目录

类别	内容
诊断流程	诊断流程
常见排查方法	检查Pod的状态检查Pod的详情检查Pod的配置检查Pod的事件检查Pod的日志检查Pod的监控使用终端进入容器 Pod故障诊断
常见问题及解决方案	常见的Pod异常状态及处理方式 Pod OOM异常问题处理 Pod访问数据库概率性网络断联

诊断流程2

查看Pod是否处于异常状态，具体操作，请参见检查Pod的状态。
1. 如果Pod状态异常，可通过查看Pod的事件、Pod的日志、Pod的配置等信息确定异常原因。具体操作，请参见常见排查方法。关于Pod异常状态及处理方式，请参见常见的Pod异常状态及处理方式。
2. 如果Pod状态为Running但未正常工作，请参见 Pod状态为Running但没正常工作。
若确认是Pod OOM异常问题，请参见 Pod OOM异常问题处理。
如果问题仍未解决，请提交工单。

Pod状态	Pod含义	解决方案
Pending	Pod未被调度到节点上。	Pod状态为Pending
Init:N/M	Pod包含M个Init容器，其中N个已经启动完成。	Pod状态为Init:N/M（Init:Error和Init:CrashLoopBackOff）
Init:Error	Init容器已启动失败。	Pod状态为Init:N/M（Init:Error和Init:CrashLoopBackOff）
Init:CrashLoopBackOff	Init容器启动失败，反复重启。	Pod状态为Init:N/M（Init:Error和Init:CrashLoopBackOff）
Completed	Pod的启动命令已执行完毕。	Pod状态为Completed
CrashLoopBackOff	Pod启动失败，反复重启。	Pod状态为CrashLoopBackOff
ImagePullBackOff	Pod镜像拉取失败。	Pod状态为ImagePullBackOff
Running	Pod运行正常。 Pod Running但是未正常工作。	无需处理 Pod状态为Running但没正常工作
Terminating	Pod正在关闭中。	Pod状态为Terminating
Evicted	Pod被驱逐。	Pod状态为Evicted

登录容器服务管理控制台。
在控制台左侧导航栏，单击集群。
在 集群列表 页面，单击目标集群名称或者目标集群右侧操作列下的详情。
在集群管理页左侧导航栏，选择 工作负载 > 容器组 。
在 容器组 页面左上角选择Pod所在的 命名空间 ，查看Pod状态。
- 若状态为Running，说明Pod运行正常。
- 若状态不为Running，说明Pod状态异常，请参见常见的Pod异常状态及处理方式进行处理。

登录容器服务管理控制台。
在控制台左侧导航栏，单击集群。
在 集群列表 页面中，单击目标集群名称或者目标集群右侧操作列下的详情。
在集群管理页左侧导航栏，选择 工作负载 > 容器组 。
在 容器组 页面左上角选择Pod所在的 命名空间 ，然后单击目标Pod名称或者目标Pod右侧操作列下的详情，查看Pod的名称、镜像、Pod IP、所在节点等详细信息。

kubectl delete pod [$Pod] -n [$namespace] --grace-period=0 --force

kubectl get pods -n [$namespace]| grep Evicted | awk '{print $1}' | xargs kubectl delete pod -n [$namespace]