虾米一家
分享生活,分享技术,我们一直在努力

Prometheus + Grafana 监控体系搭建:从指标采集到告警通知

Prometheus + Grafana 监控体系搭建

Prometheus 和 Grafana 组合提供强大的监控和可视化能力。从零构建完整的监控体系。

一、Prometheus 概述

CNCF 顶级项目,专注时间序列数据采集和存储。

  • 多维数据模型(指标名+标签)
  • 强大的 PromQL
  • Pull 模式采集
  • 内置告警引擎
  • 支持服务发现
docker run -d -p 9090:9090 -v /etc/prometheus:/etc/prometheus prom/prometheus

二、Exporter 配置

Exporter 是数据采集器。

Exporter 端口 内容
node_exporter 9100 系统指标
mysqld_exporter 9104 MySQL
redis_exporter 9121 Redis
blackbox_exporter 9115 网络探测
wget https://github.com/prometheus/node_exporter/releases/latest/download/node_exporter-*.linux-amd64.tar.gz
tar xvfz node_exporter-*.linux-amd64.tar.gz
sudo cp node_exporter-*/node_exporter /usr/local/bin/

三、Grafana

Grafana 提供强大的仪表盘和可视化。

docker run -d -p 3000:3000 --name=grafana -v grafana_data:/var/lib/grafana grafana/grafana
  • 导入预配置仪表盘
  • 创建自定义面板
  • 配置多数据源
  • 设置告警通知

四、告警配置

groups:
  - name: alerts
    rules:
      - alert: HighCPU
        expr: 100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
        for: 5m
        labels: {severity: warning}
      - alert: HighMemory
        expr: (node_memory_MemTotal - node_memory_MemAvailable) / node_memory_MemTotal * 100 > 85
        for: 5m
        labels: {severity: warning}

五、总结

Prometheus + Grafana 是云原生时代最流行的监控方案。构建完整的可观测性体系是保障系统稳定的基础。

本文基于实际生产环境经验编写,配置参数需根据具体情况调整。建议在测试环境验证后再应用于生产环境。如需了解更多技术细节和实践案例,请关注本站后续文章。

赞(0) 打赏
未经允许不得转载:虾米生活分享 » Prometheus + Grafana 监控体系搭建:从指标采集到告警通知

评论 抢沙发

评论前必须登录!

 

虾米一家,生活分享!

关于我们收藏本站

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫打赏

微信扫一扫打赏