tencent cloud

文档反馈

【2024年07月01日】事件告警部分指标下线公告

最后更新时间:2024-06-18 14:03:42
    尊敬的腾讯云用户,为了给您提供更准确、完整的事件告警说明,云数据库 MySQL 计划于2024年07月01日下线“主节点服务故障”、“主节点服务故障恢复”、“备节点服务故障”、“备节点服务故障恢复”这四个事件指标,并将分别优化为“主节点服务拨测异常”、“主节点服务拨测异常恢复”、“备节点服务拨测异常”、“备节点服务拨测异常恢复”。涉及的事件指标的告警原理不变,本次优化仅针对事件名称、事件描述、处理方法和建议,以更好的帮助您理解。
    说明:
    涉及的事件指标下线后,您需要重新设置“主节点服务拨测异常”、“主节点服务拨测异常恢复”、“备节点服务拨测异常”、“备节点服务拨测异常恢复”这四个新指标的事件告警,操作指引请参考 设置事件告警

    下线时间

    北京时间2024年07月01日(周一)。

    优化后相关事件指标信息

    事件中文名称
    事件英文名称
    事件类型
    从属维度
    有无恢复概念
    事件描述
    处理方法和建议
    主节点服务拨测异常(原:主节点服务故障)
    MasterHealthCheckError
    异常事件
    云数据库 MySQL 实例维度
    主实例可能因高负载、连接数满、运行异常、网络波动等情况导致无法判断当前主实例节点服务状态为存活。
    可适当增加节点配置来降低风险发生的概率。
    1. 如您收到 MasterHealthCheckRecovery 事件,则代表主节点恢复,HA 切换回滚,并未实际发生 HA。
    2. 如您收到 Switch 和 SlaveHealthCheckRecovery,则代表发生 HA 并成功恢复。
    3. 如您收到 Switch,但没收到 SlaveHealthCheckRecovery,则代表发生 HA 且原 Master 实例被重建。
    主节点服务拨测异常恢复(原:主节点服务故障恢复)
    MasterHealthCheckRecovery
    恢复事件
    云数据库 MySQL 实例维度
    数据库主节点出现服务异常后恢复。
    数据库主节点服务异常(MasterHealthCheckError)已恢复,可正常运行。
    备节点服务拨测异常(原:备节点服务故障)
    SlaveHealthCheckError
    异常事件
    云数据库 MySQL 实例维度
    备实例可能因高负载、连接数满、运行异常、网络波动等情况导致无法判断当前备实例节点服务状态为存活。
    可适当增加节点配置或只读节点数量来降低风险发生的概率。
    1. 如您收到 SlaveHealthCheckRecovery,说明备节点已恢复。
    2. 如您未收到 SlaveHealthCheckRecovery,则说明备节点拨测已超时重建。
    备节点服务拨测异常恢复(原:备节点服务故障恢复)
    SlaveHealthCheckRecovery
    恢复事件
    云数据库 MySQL 实例维度
    1. 数据库备节点出现服务异常后恢复。
    2. 原主节点异常,主备切换后,原异常主节点恢复为备节点。
    1. 数据库备节点服务异常(SlaveHealthCheckError)已恢复,可正常运行。
    2. 数据库原主节点服务异常(MasterHealthCheckError)已恢复,可正常运行。

    影响说明

    本次更新对您的业务使用数据库无影响。如果您在2024年07月01日前设置了将要下线的事件指标的告警,下线后则不会触发旧的事件告警,请您及时设置新的事件指标的告警;如果您在2024年07月01日前没有设置将要下线的事件指标的告警,我们建议您届时设置新的事件指标的告警,便于您更清晰地发现拨测异常
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持