tencent cloud

文档反馈

非腾讯云主机监控

最后更新时间:2024-12-13 11:21:27

    背景

    本文主要引导用户如何快速采集非腾讯云主机的监控数据,降低用户配置成本。

    接入方式

    方式一:一键安装(推荐)

    操作步骤

    2. 在实例列表中,选择对应的 Prometheus 实例。
    3. 进入实例详情页,单击数据采集 > 集成中心
    4. 在集成中心找到并单击非腾讯云主机监控,即会弹出一个安装窗口。
    
    
    

    步骤一:安装并运行 node_exporter

    1. 在需要上报数据的主机上执行以下脚本。
    wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x
    node_exporter_install && ./node_exporter_install
    执行脚本会自动触发以下动作:下载 node exporter、运行 node exporter、检查数据上报、完成(数据成功暴露在9100端口)。
    脚本执行结果示例如下:
    
    
    
    说明:
    脚本中默认的参数:port=9100,path=/metrics ,如需自定义参数或对脚本进行重启、停止、健康检查、查看日志等操作,可使用 systemctl 来管理。
    自定义参数:
    修改 port,执行脚本语句替换为:
    wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x node_exporter_install && ./node_exporter_install --web.listen-address=":9100"
    修改 path,执行脚本语句替换为:
    wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter_install -O node_exporter_install && chmod +x node_exporter_install && ./node_exporter_install --web.telemetry-path="/metrics"
    说明:
    更多自定义参数的配置指引可参考 文档说明
    常用的脚本管理操作:
    重启:
    systemctl restart node_exporter
    停止:
    systemctl stop node_exporter
    状态检查:
    systemctl status node_exporter
    日志查看:
    journalctl -u node_exporter
    2. 保证主机网络与 Prometheus 实例内网互通
    如已通过专线连通,则可以通过内网上报,无需任何操作。否则需要通过公网上报,操作如下:
    主机需要开通公网 IP,作为采集目标 IP。
    Prometheus 实例所在 VPC 的路由表需要配置 NAT 网关,可参考 TKE Serverless 集群如何放通外网
    3. 主动放开安全组限制
    主机安全组的入站规则,需要配置允许访问的授权策略:协议类型为自定义 TCP、端口为上述脚本中的<port>,源地址为0.0.0.0/0。

    步骤二:配置抓取任务

    
    
    
    参数
    说明
    任务名称
    集成名称,命名规范如下:
    名称具有唯一性。
    名称需要符合下面的正则:'^[a-z0-9]([-a-z0-9]*[a-z0-9])?(\\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*$'。
    指标采集间隔(s)
    输入指标采集间隔,单位s。
    采集目标地址
    输入采集目标地址,格式:host:port,支持添加多个。
    指标采集路径
    输入指标采集路径,默认为/metrics。

    方式二:自定义安装

    上述步骤1中脚本安装的方式,还可以替换为自定义安装,参考下述指引。

    1. 下载安装 node_exporter:

    在需要上报数据的主机上,下载并安装 node_exporter,您可以点击进入 Prometheus 开源官网下载地址 node_exporter,也可以直接执行下列命令:
    wget https://rig-1258344699.cos.ap-guangzhou.myqcloud.com/prometheus-agent/node_exporter -O node_exporter
    目录为当前文件夹:
    
    
    

    2. 运行 node_exporter 采集基础监控数据:

    赋予权限,执行 node_exporter并查看日志。
    chmod +x node_exporter && nohup ./node_exporter &
    cat nohup.out
    如下图所示即为执行成功:
    
    
    
    可通过下列命令,查看暴露在9100端口的监控数据:
    curl 127.0.0.1:9100/metrics
    如下图为执行命令后看到的暴露出来的指标监控数据:
    
    
    
    完成上述操作后,需在页面中配置抓取任务,参考方式一中的 配置描述

    查看监控

    前提条件

    Prometheus 实例已绑定 Grafana 实例。

    操作步骤

    1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
    2. 选择数据采集 > 集成中心,在集成中心页面找到非腾讯云主机监控卡片并点击弹出集成页面,选择 Dashboard > Dashboard 安装/升级 来安装对应的 Grafana Dashboard。
    3. 打开 Prometheus 实例关联的Grafana实例地址,在 Dashboards页面查看相关的监控大盘。
    
    
    
    
    
    

    配置告警

    1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
    2. 选择告警管理,可以添加相应的告警策略,详情请参见 新建告警策略
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持