tencent cloud

文档反馈

容器服务 TKE 监控实践

最后更新时间:2024-01-27 17:51:37

    新版 TKE 监控特性

    ● 支持自动更新监控对象。 ● 新增 Workload/Component/Node 监控场景。 ● 更多的监控指标监控,新版 TKE 指标总数可达140个。 ● 可针对某个监控维度屏蔽特殊对象(例如频繁告警的 Pod)。

    操作步骤

    下列以“容器监控-pod”维度为例,介绍如何实现 自动更新 Dashboard 监控对象自动更新告警监控对象屏蔽频繁告警监控对象

    自动更新 Dashboard 监控对象

    2. 选择【Dashboard】>【Dashboard 列表】>【新建 Dashboard】>【新建图表】。
    3. 参考下列步骤配置监控图表。
    监控类型:选择云产品监控。
    指标:选择云产品为“容器服务(新)-pod”,选择指标为“CPU利用率(%)”。
    筛选:可以通过维度筛选绑定图表对象(地域、集群、命名空间、工作负载等)。
    地域:选择监控对象所在的地域
    集群:选择监控对象所在的集群。
    筛选条件:需要创建两个筛选条件,一个为命名空间;另一个为工作负载均衡类型,监控指定 Workload 下的所有 Pod,并在 Pods 发生频繁新增/更新时进行自动更新 Dashboard 监控对象。如下图所示:
    
    
    4. 配置完后在页面右上方单击【保存】,即可保存图表。

    自动更新告警监控对象

    2. 选择【告警配置】>【告警策略】>【新建】,进入新建告警策略页。
    3. 选择策略类型为 “容器服务(新)-pod”,并参考下列步骤配置告警对象。
    地域:选择监控对象所在的地域
    集群:选择监控对象所在的集群。
    筛选条件:需要创建两个筛选条件,一个为命名空间;另一个为工作负载均衡类型,监控指定 Workload 下的所有 Pod,并在 Pods 发生频繁新增/更新时进行自动更新告警监控对象。如下图:
    
    
    说明:
    如需了解更多告警配置请参见 新建告警策略

    屏蔽频繁告警监控对象

    当 Pod 频繁触发告警,您可以参考以下说明屏蔽 Node下部分或所有 Pods 监控告警对象。
    如下图,可通过配置 Pod 名称 “!=”操作符进行部分 Pod 告警屏蔽。
    
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持