kubernetes 对象名称 | 类型 | 资源量 | Namespaces |
node-problem-detector | DaemonSet | 0.5C80M | kube-system |
node-problem-detector | ServiceAccount | - | kube-system |
node-problem-detector | ClusterRole | - | - |
node-problem-detector | ClusterRoleBinding | - | - |
功能 | 涉及对象 | 涉及操作权限 |
需要在节点遇到故障时上报故障信息,需要修改 node 的 condition | nodestatus | patch |
需要发送 event 通知集群 | event | create/patch/update |
rules:- apiGroups:- ""resources:- nodesverbs:- get- apiGroups:- ""resources:- nodes/statusverbs:- patch- apiGroups:- ""resources:- eventsverbs:- create- patch- update
Condition Type | 默认值 | 描述 |
ReadonlyFilesystem | False | 文件系统是否只读 |
FDPressure | False | 查看主机的文件描述符数量是否达到最大值的80% |
FrequentKubeletRestart | False | Kubelet 是否在20Min内重启超过5次 |
CorruptDockerOverlay2 | False | DockerImage 是否存在问题 |
KubeletProblem | False | Kubelet service 是否 Running |
KernelDeadlock | False | 内核是否存在死锁 |
FrequentDockerRestart | False | Docker 是否在20Min内重启超过5次 |
FrequentContainerdRestart | False | Containerd 是否在20Min内重启超过5次 |
DockerdProblem | False | Docker service 是否 Running(若节点运行时为 Containerd,则一直为 False) |
ContainerdProblem | False | Containerd service 是否 Running(若节点运行时为 Docker,则一直为 False) |
ThreadPressure | False | 系统目前线程数是否达到最大值的90% |
NetworkUnavailable | False | NTP service 是否 Running |
SerfFailed | False | 分布式检测节点网络健康状态 |
本页内容是否解决了您的问题?