操作场景
腾讯云默认为所有用户提供腾讯云可观测平台功能,无需用户手动开通。用户在使用了腾讯云某个产品后,腾讯云可观测平台才可以开始收集监控数据。
TDMQ RocketMQ 版支持监控您账户下创建的资源,帮助您实时掌握资源状态。您可以为监控指标配置告警规则,当监控指标达到设定的报警阈值时,腾讯云可观测平台可以通过设置好的通知方式及时通知您,帮助您及时应对异常情况。
操作步骤
配置告警规则
创建的告警会将一定周期内监控的指标与给定阈值的情况进行比对,从而判断是否需要触发相关通知。当 TDMQ RocketMQ 版状态改变而导致告警触发后,您可以及时进行相应的预防或补救措施,合理地创建告警能帮助您提高应用程序的健壮性和可靠性。
注意
请务必对实例配置告警,防止因突发流量或者到达规格限制而导致的异常。
2. 在左侧导航栏选择告警配置 > 告警策略,单击新建。
3. 在告警策略页面,选择好策略类型和要设置告警的实例,设置好告警规则和告警通知模板。
策略类型:选择 消息队列 TDMQ/RocketMQ/主题告警。
告警对象:选择需要配置告警策略的 TDMQ RocketMQ 版资源。
触发条件:支持选择模板和手动配置,默认选择手动配置,手动配置参见以下说明,新建模板参见 新建触发条件模板。 说明
指标:例如“消息堆积量”,选择统计粒度为1分钟,则在1分钟内,消息堆积量连续N个数据点超过阈值,就会出发告警。
告警频次:例如“每30分钟警告一次”,指每30分钟内,连续多个统计周期指标都超过了阈值,如果有一次告警,30分钟内就不会再次进行告警,直到下一个30分钟,如果指标依然超过阈值,才会再次告警。
通知模板:选择通知模板,也可以新建通知模板,设置告警接收对象和接收渠道。
4. 单击完成,完成配置。
新建触发条件模板
2. 在左侧导航栏中,单击触发条件模板,进入触发条件列表页面。
3. 在触发条件模板页单击新建。
4. 在新建模板页,配置策略类型。
策略类型:选择消息队列 TDMQ-RocketMQ-主题告警。
使用预置触发条件:勾选此选项,会出现系统建议的告警策略。
5. 确认无误后,单击保存。
6. 返回新建告警策略页,单击刷新,则会显示刚配置的告警策略模板。
告警指标维度说明
目前 RocketMQ 的指标分为以下几个维度,用户可以根据需要选择相应的指标进行监控和告警的配置:
|
集群 | 整个集群维度的数据聚合,如集群的生产/消费速率,集群的生产/消费流量,消息堆积数量和被限流的次数 |
存储(仅专享集群) | 当前专享集群剩余的可用的存储空间,以及存储已使用的占比 |
节点(仅专享集群) | 当前集群的各个计算节点的负载情况 |
主题(Topic) | 所选中的主题的生产/消费速率,生产/消费流量,消息堆积数量 |
消费者组(Group) | 所选中的消费者组的在线消费者(客户端)的数量,消费消息的速率和流量,当前 Group 的堆积和死信数量等 |
主题下的消费者组 | 将上述的 Group 的指标按照所订阅的主题进行拆分,展示订阅了某个主题的 group 的消费速率和流量以及堆积数等 |
本页内容是否解决了您的问题?