tencent cloud

文档反馈

告警迁移公告

最后更新时间:2022-11-25 16:06:46

    背景

    弹性 MapReduce 产品于2019年9月10日对主机以及组件服务监控项进行了升级,新增了“弹性 MapReduce”策略类型,覆盖了数百监控项指标,您可以在腾讯云可观测平台弹性 MapReduce策略类型下配置告警策略。原“EMR”策略类型将于2021年03月30日23:00下线,已配置的“EMR”策略类型将全部失效。后续新增告警策略,请配置在“弹性 MapReduce”策略类型下。
    “EMR”与“弹性 MapReduce”策略类型对比:
    策略类型
    指标覆盖
    支持与维护
    EMR
    集群告警(12个指标)
    子机告警(8个指标)
    将于2021年04月09日23:00下线,且不在维护
    弹性 MapReduce
    主机监控
    服务监控
    集群监控
    已于2019年09月10日上线,持续维护
    注意
    “弹性 MapReduce”策略类型已覆盖原有 EMR 策略所有指标,详情可参考 新老指标对照表

    告警策略迁移说明

    在“EMR”策略类型下线时,系统会自动将原有的“EMR”策略类型的告警策略后台迁移至新的“弹性 MapReduce”策略类型下,具体规则和验证方法见后续通知。
    注意
    不排除极个别用户存在需要手动迁移的特殊情况。
    手动迁移具体步骤如下:
    1. 梳理已有告警指标以及告警策略 登录 腾讯云可观测平台控制台,选择左侧菜单栏【告警管理】>【告警配置】>【告警策略】中,单击【高级筛选】,在弹出页面中按【策略类型】选择“EMR”策略类型对应的告警策略类型,查询对应类别下的告警策略,并下载原“EMR”策略类型下已配置的告警策略。
    
    
    2. 配置新告警策略 在集群列表中单击【告警配置】,跳转至【告警策略】页面后,单击【新建】,在策略类型中选择“弹性 MapReduce”,根据第1步梳理下载的策略进行告警配置,告警配置方法可参考 配置告警
    3. 验证新的告警策略 验证“弹性 MapReduce”告警策略是否启用并能成功触发告警。在【指标告警】设置一个最小触发阈值,选择设定【接收组或接收人】,以及选择接受渠道(邮件、短信、微信),达到测试验证效果。例如内存区域占比_SO,统计周期五分钟,当阈值大于等于1%,持续1周期即触发告警,每五分钟告警一次。
    4. 清理旧告警策略 新策略类型验证完成后删除原“EMR”策略类型下配置的告警策略。在告警策略筛选条件中按【策略类型】选择“EMR”策略类型对应的告警策略进行查询,对照步骤1中下载策略表,进行删除。
    如果您在迁移中遇到问题,请及时 联系我们进行处理。

    新老指标对照表

    原有策略类型
    指标/事件告警
    原有指标/事件告警名称
    新策略类型
    新指标/事件名称
    EMR-集群告警
    指标告警
    HDFS 已用存储空间
    弹性 MapReduce-HDFS-概览
    集群存储容量_CapacityUsed
    指标告警
    HDFS 存储利用率
    弹性 MapReduce-HDFS-概览
    HDFS 存储空间使用率_capacityused
    指标告警
    YARN 应用阻塞数
    弹性 MapReduce-YARN-概览
    Applications_pending
    指标告警
    YARN 应用失败数
    弹性 MapReduce-YARN-概览
    Applications_failed
    指标告警
    集群 CPU 已分配核数
    弹性 MapReduce-YARN-概览
    Cores_allocatedVirtualCores
    指标告警
    集群 CPU 利用率
    弹性 MapReduce-YARN-概览
    CPU 使用率_usageRatio
    指标告警
    集群内存可用空间
    弹性 MapReduce-YARN-概览
    Memory_availableMB
    指标告警
    集群内存利用率
    弹性 MapReduce-YARN-概览
    内存使用率_usageRatio
    指标告警
    集群容器阻塞数
    弹性 MapReduce-YARN-概览
    Containers_containersPending
    指标告警
    Hbase 请求量
    弹性 MapReduce-HBASE-概览
    集群总请求数量_clusterRequests
    指标告警
    Hbase 同步耗时
    不在维护
    -
    指标告警
    Hbase 同步 log 长度
    不在维护
    -
    事件告警
    节点监控心跳丢失
    弹性 MapReduce-主机监控-网络
    节点监控心跳丢失
    事件告警
    进程重启
    弹性 MapReduce-主机监控-进程
    进程 OOM
    EMR-子机告警
    指标告警
    磁盘利用率
    弹性 MapReduce-主机监控-磁盘
    磁盘空间使用率_used_all
    指标告警
    内存使用量
    弹性 MapReduce-主机监控-内存
    内存使用情况_MemFree
    指标告警
    机器重启
    不在维护
    机器重启
    指标告警
    内存利用率
    弹性 MapReduce-主机监控-内存
    内存使用占比_used_percent
    指标告警
    CPU 利用率
    弹性 MapReduce-主机监控-CPU
    CPU 使用率_idle
    指标告警
    内网入包量
    不在维护
    -
    指标告警
    内网出包量
    不在维护
    -
    指标告警
    TCP 连接数
    弹性 MapReduce-主机监控-网络
    TCP 连接数
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持