KubeDiag云原生诊断运维编排框架
KubeDiag 为 Kubernetes 集群中的诊断运维管理提供了一套统一的编排框架。用户通过 Kubernetes 自定义资源可以定义运维操作、如何执行复杂的诊断运维流水线、如何通过报警自动触发诊断运维流水线。
该系统通过下列自定义资源为用户提供了运维操作的自动化管理能力:
- Operation 用于定义故障运维和集群检查等操作。
- OperationSet 用于定义诊断运维流水线。
- Trigger 支持用户通过 Prometheus、Kafka 等系统自动触发诊断运维流水线。
- Diagnosis 中记录了一次诊断运维流水线的结果和状况。
评论