Prometheus + Grafana 监控体系搭建
Prometheus 和 Grafana 组合提供强大的监控和可视化能力。从零构建完整的监控体系。
一、Prometheus 概述
CNCF 顶级项目,专注时间序列数据采集和存储。
- 多维数据模型(指标名+标签)
- 强大的 PromQL
- Pull 模式采集
- 内置告警引擎
- 支持服务发现
docker run -d -p 9090:9090 -v /etc/prometheus:/etc/prometheus prom/prometheus
二、Exporter 配置
Exporter 是数据采集器。
| Exporter | 端口 | 内容 |
|---|---|---|
| node_exporter | 9100 | 系统指标 |
| mysqld_exporter | 9104 | MySQL |
| redis_exporter | 9121 | Redis |
| blackbox_exporter | 9115 | 网络探测 |
wget https://github.com/prometheus/node_exporter/releases/latest/download/node_exporter-*.linux-amd64.tar.gz
tar xvfz node_exporter-*.linux-amd64.tar.gz
sudo cp node_exporter-*/node_exporter /usr/local/bin/
三、Grafana
Grafana 提供强大的仪表盘和可视化。
docker run -d -p 3000:3000 --name=grafana -v grafana_data:/var/lib/grafana grafana/grafana
- 导入预配置仪表盘
- 创建自定义面板
- 配置多数据源
- 设置告警通知
四、告警配置
groups:
- name: alerts
rules:
- alert: HighCPU
expr: 100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
for: 5m
labels: {severity: warning}
- alert: HighMemory
expr: (node_memory_MemTotal - node_memory_MemAvailable) / node_memory_MemTotal * 100 > 85
for: 5m
labels: {severity: warning}
五、总结
Prometheus + Grafana 是云原生时代最流行的监控方案。构建完整的可观测性体系是保障系统稳定的基础。
本文基于实际生产环境经验编写,配置参数需根据具体情况调整。建议在测试环境验证后再应用于生产环境。如需了解更多技术细节和实践案例,请关注本站后续文章。
虾米生活分享

评论前必须登录!
注册