tencent cloud

文档反馈

节点监控指标

最后更新时间:2023-12-27 14:46:43

    节点-CPU

    标题
    指标名称
    指标单位
    指标含义
    CPU 使用率
    idle
    %
    CPU IDLE 时间占比
    irq
    %
    中断占比
    nice
    %
    NICE 优先级使用 CPU 占比
    steal
    %
    虚拟 CPU 等待实际 CPU 时间占比
    softirq
    %
    CPU 软中断占比
    guest
    %
    运行虚拟处理器所用的时间百分比
    system
    %
    内核态 CPU 占用比
    user
    %
    用户态 CPU 占用比
    iowait
    %
    进程等待 IO CPU 空闲占比
    负载
    1m
    %
    1分钟负载
    5m
    %
    5分钟负载
    15m
    %
    15分钟负载
    核数
    cpu_count
    CPU 核数

    节点-MEMORY

    标题
    指标名称
    指标单位
    指标含义
    内存使用情况
    MemTotal
    GB
    内存总量
    MemFree
    GB
    空闲内存总量
    MemAvailable
    GB
    可用内存总量
    Buffers
    GB
    BUFFER 缓存占用内存总量
    Cached
    GB
    文件缓存占用内存总量
    SwapCached
    GB
    匿名页写入交换区内存总量
    SwapFree
    GB
    可用交换区总量
    AnonPages
    GB
    未映射内存总量
    SwapTotal
    GB
    交换区总量
    Dirty
    GB
    需要写入磁盘的内存总量
    Writeback
    GB
    正在被写回磁盘的内存总量
    HardwareCorrupted
    GB
    内存硬件故障导致不可用内存总量
    Shmem
    GB
    共享内存占用的内存总量
    MemUsed
    GB
    已使用内存总量
    内存使用占比
    available_percent
    %
    可用内存占总内存百分比
    used_percent
    %
    已使用内存占总内存百分比

    节点-磁盘

    标题
    指标名称
    指标单位
    指标含义
    设备读写速率
    Read
    MB/s
    设备读写速率,每秒读数据量
    Write
    MB/s
    设备读写速率,每秒写数据量
    设备 IOPS
    all
    次/s
    设备IOPS,当前设备上正在进行的 IO 操作
    IO 操作时间
    Read
    ms
    平均每次设备 I/O 读操作的等待时间
    Write
    ms
    平均每次设备 I/O 写操作的等待时间
    IO
    ms
    平均每次 IO 请求的处理时间
    设备读写请求 QPS
    Read
    次/s
    读操作 QPS
    Write
    次/s
    写操作 QPS
    Merge-Read
    次/s
    合并读操作 QPS
    Merge-Write
    次/s
    合并写操作 QPS
    IO 设备使用率
    all
    %
    IO 设备使用率,磁盘繁忙程度
    磁盘空间
    Free
    GB
    磁盘空闲存储空间
    Available
    GB
    磁盘可用存储空间(非特权用户)
    Total
    GB
    磁盘总存储空间
    磁盘空间使用率
    Used
    %
    磁盘空间使用率
    INODES
    Free
    磁盘剩余 INODES 数量
    Total
    磁盘 INODES 总数量
    INODES 使用率
    Used
    %
    磁盘 INODES 使用率

    节点-文件句柄

    标题
    指标名称
    指标单位
    指标含义
    文件句柄
    allocated
    已分配文件句柄数量
    maximum
    最大文件句柄数量
    系统中断
    intr_total
    次/s
    系统中断数量
    系统上下文切换
    context_switches_total
    次/s
    系统上下文切换数量
    系统进程
    forks_total
    系统新建进程数量
    procs_running
    系统运行进程数量
    procs_blocked
    系统阻塞进程数量
    procs_total
    系统总进程数量
    thrds_total
    系统总线程数
    Agent 版本
    AgentVersionl
    version
    agent 的版本

    节点-NETWORK

    标题
    指标名称
    指标单位
    指标含义
    TCP LISTEN 异常
    ListenDrops
    次/s
    任何原因导致的丢弃传入连接(SYN 包)的次数
    ListenOverflows
    次/s
    三次握手最后一步完成之后,Accept 队列超过上限的次数
    TCPSyncookies
    SyncookiesFailed
    次/s
    收到携带无效 SYN Cookie 信息的包的个数
    SyncookiesRecv
    次/s
    收到携带有效 SYN Cookie 信息的包的个数
    SyncookiesSent
    次/s
    使用 SYN Cookie 发送的 SYN/ACK 包个数
    TCP 链接异常 Abort
    TCPAbortOnTimeout
    次/s
    因各种计时器(RTO/PTO/keepalive)的重传次数超过上限而关闭连接的次数
    TCPAbortOnData
    次/s
    socket 收到未知数据导致被关闭的次数
    TCPAbortOnClose
    次/s
    用户态程序在缓冲区内还有数据时关闭 socket 的次数
    TCPAbortOnMemory
    次/s
    因内存问题关闭连接的次数
    TCPAbortOnLinger
    次/s
    关闭后,在徘徊状态中止的连接的次数
    TCPAbortFailed
    次/s
    尝试结束连接失败的次数
    TCP 建立链接
    ActiveOpens
    个/s
    主动建立 TCP 连接数量
    CurrEstab
    个/s
    当前已建立 TCP 连接数量
    PassiveOpens
    个/s
    被动建立 TCP 连接数量
    AttemptFails
    个/s
    建立连接失败数量
    EstabResets
    个/s
    连接被 RESET 的数量
    TCP 数据包
    InSegs
    个/s
    收到的数据包个数,包括有错误的包个数
    OutSegs
    个/s
    发送的数据包个数
    RetransSegs
    个/s
    TCP 接收报文数量
    InErrs
    个/s
    重传的包个数
    OutRsts
    个/s
    发出 RST 包个数
    TCP 重传率
    RetransSegsRate
    %
    TCP 层重传率
    ResetRate
    %
    RESET 发送频率
    InErrRate
    %
    错误包占比
    TCP TIME-WAIT
    TW
    个/s
    经过正常的超时结束 TIME_WAIT 状态的 socket 数量
    TWKilled
    个/s
    通过 tcp_tw_recycle 机制结束 TIME_WAIT 状态的 socket 数量
    TCPTimeWaitOverflow
    个/s
    因为超过限制而无法分配的 TIME_WAIT socket 数量
    TWRecycled
    个/s
    通过 tcp_tw_reuse 机制结束 TIME_WAIT 状态的 socket 数量
    TCP RTO
    TCPTimeouts
    次/s
    RTO timer 第一次超时次数
    TCPSpuriousRTOs
    次/s
    通过 F-RTO 机制发现的虚假超时次数
    TCPLossProbes
    次/s
    Probe Timeout(PTO) 导致发送 Tail Loss Probe(TLP) 包的次数
    TCPLossProbeRecovery
    次/s
    丢失包刚好被 TLP 探测包修复的次数
    TCPRenoRecoveryFail
    次/s
    先进入 Recovery 阶段,然后又 RTO 的次数,对端不支持 SACK 选项
    TCPSackRecoveryFail
    次/s
    先进入 Recovery 阶段,然后又 RTO 的次数,对端支持 SACK 选项
    TCPRenoFailures
    次/s
    先进 TCP_CA_Disorder 阶段,然后又 RTO 超时的次数,对端不支持 SACK 选项
    TCPSackFailures
    次/s
    先进 TCP_CA_Disorder 阶段,然后又 RTO 超时的次数,对端支持 SACK 选项
    TCPLossFailures
    次/s
    先进 TCP_CA_Loss 阶段,然后又 RTO 超时的次数
    TCP RTO 常数
    RtoAlgorithm
    1/s
    转发未答复对象的延时的算法的数
    RtoMax
    1
    TCP 延迟重发的最大值
    RtoMin
    1
    TCP 延迟重发的最小值
    TCP 重传
    TCPLostRetransmit
    次/s
    丢失重传 SKB 的次数
    TCPFastRetrans
    次/s
    快重传 SKB 次数
    TCPForwardRetrans
    次/s
    一般重传 SKB 次数
    TCPSlowStartRetrans
    次/s
    成功慢启动重传 SKB 数量
    TCPRetransFail
    次/s
    尝试重传失败次数
    UDP 数据报
    OutDatagrams
    个/s
    发送 UDP 数据报文数量
    InDatagrams
    个/s
    接收 UDP 数据报文数量
    网卡收发数据速率
    eth0-receive_bytes
    MB/s
    网卡接收数据量
    eth0-transmit_bytes
    MB/s
    网卡发送数据量
    网卡数据包率
    eth0-receive_drop
    个/s
    网卡接收丢弃数据量
    eth0-receive_errs
    个/s
    网卡接收异常数据量
    eth0-transmit_drop
    个/s
    网卡发送丢弃数据量
    eth0-transmit_errs
    个/s
    网卡发送异常数据量
    eth0-transmit_packetsl
    个/s
    网卡发送包数量
    TCP 套接字
    TCP_inuse
    在使用(正在侦听)的 TCP 套接字数量
    TCP_orphan
    等待关闭的 TCP 连接数
    TCP_tw
    待销毁的 TCP socket 数
    TCP_alloc
    已分配(已建立、已申请到 sk_buff)的 TCP 套接字数量
    sockets_used
    已使用的套接字总量
    TCP 链接状态
    ESTABLISHED
    Established 状态的 TCP 链接数量
    SYN-SENT
    SYN-SENT 状态的 TCP 链接数量
    SYN-RECV
    SYN-RECV 状态的 TCP 链接数量
    FIN-WAIT1
    FIN-WAIT1 状态的 TCP 链接数量
    FIN-WAIT2
    FIN-WAIT2 状态的 TCP 链接数量
    TIME-WAIT
    TIME-WAIT 状态的 TCP 链接数量
    CLOSE
    CLOSE 状态的 TCP 链接数量
    CLOSE-WAIT
    CLOSE-WAIT 状态的 TCP 链接数量
    LAST-ACK
    LAST-ACK 状态的 TCP 链接数量
    LISTEN
    LISTEN 状态的 TCP 链接数量
    CLOSEING
    CLOSEING 状态的 TCP 链接数量

    节点-事件

    标题
    指标名称
    指标单位
    指标含义
    CPU 使用率
    used
    %
    1-(CPU IDLE 时间占比)
    CPU 十五分钟负载
    15m
    -
    15分钟负载
    CPU 一分钟负载
    1m
    -
    1分钟负载
    CPU 五分钟负载
    5m
    -
    5分钟负载
    磁盘 IOPS
    all
    -
    设备 IOPS,当前设备上正在进行的 IO 操作
    磁盘 IO 操作时间
    IO
    -
    平均每次 IO 请求的处理时间
    磁盘空间使用率
    Used
    -
    磁盘空间使用率
    磁盘 IO 设备使用率
    all
    -
    IO 设备使用率,磁盘繁忙程度
    内存使用率
    used_percent
    -
    已使用内存占总内存百分比
    出网络流量速率
    *-transmit_bytes
    -
    网卡发送数据量
    入网络流量速率
    *-receive_bytes
    -
    网卡接收数据量
    TCP 连接数
    CurrEstab
    -
    当前已建立 TCP 连接数量
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持