操作场景
在使用 MongoDB 过程中需要对 MongoDB 运行状态进行监控,以便了解 MongoDB 服务是否运行正常,排查 MongoDB 故障问题原因, Prometheus 监控服务提供了基于 Exporter 的方式来监控 MongoDB 运行状态,并提供了开箱即用的 Grafana 监控大盘。本文介绍如何部署 Exporter 以及实现 MongoDB Exporter 告警接入等操作。
说明:
为了方便安装管理 Exporter,推荐使用腾讯云 容器服务 进行统一管理。 前提条件
操作步骤
Exporter 部署
2. 单击需要获取集群访问凭证的集群 ID/名称,进入该集群的管理页面。
使用 Secret 管理 MongoDB 连接串
1. 在左侧菜单中选择工作负载 > Deployment,进入 Deployment 页面。
2. 在页面右上角单击 YAML创建资源,创建 YAML 配置,配置说明如下:
使用 Kubernetes 的 Secret 来管理密码并对密码进行加密处理,在启动 MongoDB Exporter 的时候直接使用 Secret Key,需要调整对应的 URI,YAML 配置示例如下:
apiVersion: v1
kind: Secret
metadata:
name: mongodb-secret-test
namespace: mongodb-test
type: Opaque
stringData:
datasource: "mongodb://{user}:{passwd}@{host1}:{port1},{host2}:{port2},{host3}:{port3}/admin"
部署 MongoDB Exporter
在 Deployment 管理页面,单击新建,选择对应的命名空间来进行部署服务。可以通过控制台的方式创建,如下以 YAML 的方式部署 Exporter,YAML 配置示例如下:
apiVersion: apps/v1
kind: Deployment
metadata:
labels:
k8s-app: mongodb-exporter
name: mongodb-exporter
namespace: mongodb-test
spec:
replicas: 1
selector:
matchLabels:
k8s-app: mongodb-exporter
template:
metadata:
labels:
k8s-app: mongodb-exporter
spec:
containers:
- args:
- --collect.database
- --collect.collection
- --collect.topmetrics
- --collect.indexusage
- --collect.connpoolstats
env:
- name: MONGODB_URI
valueFrom:
secretKeyRef:
name: mongodb-secret-test
key: datasource
image: ssheehy/mongodb-exporter
imagePullPolicy: IfNotPresent
name: mongodb-exporter
ports:
- containerPort: 9216
name: metric-port
securityContext:
privileged: false
terminationMessagePath: /dev/termination-log
terminationMessagePolicy: File
dnsPolicy: ClusterFirst
imagePullSecrets:
- name: qcloudregistrykey
restartPolicy: Always
schedulerName: default-scheduler
securityContext: { }
terminationGracePeriodSeconds: 30
验证
1. 在 Deployment 页面单击上述步骤创建的 Deployment,进入 Deployment 管理页面。
2. 单击日志页签,可以查看到 Exporter 成功启动并暴露对应的访问地址,如下图所示:
3. 单击 Pod 管理页签,进入 Pod 页面。
4. 在右侧的操作项下单击远程登录登录 Pod,在命令行中执行以下 wget 命令对应 Exporter 暴露的地址,可以正常得到对应的 MongoDB 指标,若发现未能得到对应的数据,请检查一下连接 URI 是否正确,具体如下:
wget 127.0.0.1:9216/metrics
cat metrics
添加采集任务
2. 通过集成容器服务列表单击集群 ID 进入到容器服务集成管理页面。
3. 通过服务发现添加 Pod Monitor
来定义 Prometheus 抓取任务,YAML 配置示例如下:
apiVersion: monitoring.coreos.com/v1
kind: PodMonitor
metadata:
name: mongodb-exporter
namespace: cm-prometheus
spec:
podMetricsEndpoints:
- interval: 30s
port: metric-port
path: /metrics
relabelings:
- action: replace
sourceLabels:
- instance
regex: (.*)
targetLabel: instance
replacement: 'cmgo-xxxxxxxx'
namespaceSelector:
matchNames:
- mongodb-test
selector:
matchLabels:
k8s-app: mongodb-exporter
说明:
由于 Exporter
和 MongoDB
部署在不同的服务器上,因此建议通过 Prometheus Relabel 机制将 MongoDB 实例的信息放到监控指标中,以便定位问题。
查看监控
2. 单击集成中心,进入集成中心页面。找到 MongoDB
监控,安装对应的 Grafana Dashboard 即可开启 MongoDB
监控大盘,查看实例相关的监控数据,如下图所示:
MongoDB 概览:以实例的纬度查看实例状态,例如文档个数、连接使用率、读写耗时等,可单击实例跳转到该实例详情。
MongoDB 详情:可以查看某个实例的详细状态,例如元数据概览、核心指标、命令操作、请求流量、读写 Top 等。
告警以及接入
2. 单击告警策略,可以添加相应的告警策略,详情请参见 新建告警策略。 常见问题
客户端报错:client checkout connect timeout,该如何处理?
可能是连接池使用率达到100%,导致创建连接失败。可以通过 Grafana 大盘 MongoDB 详情/核心指标/连接使用率指标排查。
写入不断超时,该如何处理?
需检查 Cache 使用率是否过高、Transactions 可用个数是否为0,可以通过 Grafana 大盘 MongoDB 详情/核心指标/ WiredTiger Transactions 可用个数| WiredTiger Cache 使用率| GetLastError 写耗时| GetLastError 写超时指标排查。
本页内容是否解决了您的问题?