云服务器Prometheus监控部署教程

云服务器推荐配置

轻量应用服务器

2核4G配置，适合小型Prometheus部署，监控数十台服务器

¥??/年起

立即选购

标准型云服务器

4核8G配置，适合中型监控平台，支持数百台服务器监控

¥??/年起

立即选购

内存型云服务器

8核32G配置，适合大型Prometheus集群，海量指标存储

¥??/年起

立即选购

高IO型云服务器

4核16G高IO配置，适合高频指标采集，低延迟查询响应

¥??/年起

立即选购

计算型云服务器

16核32G配置，适合复杂PromQL查询和聚合计算场景

¥??/年起

立即选购

大数据型云服务器

32核64G配置，适合大规模监控集群和长期数据存储

¥??/年起

立即选购

Prometheus核心功能特性

时序数据存储

内置TSDB高效存储时序数据，支持压缩和长期保留，查询性能优异

PromQL查询

灵活强大的查询语言，支持聚合、计算、函数操作，满足复杂分析需求

Alertmanager告警

独立告警管理组件，支持告警分组、静默、抑制，多渠道通知

服务发现

自动发现监控目标，支持静态配置、文件发现、K8s服务发现

Exporter采集

丰富的Exporter生态，采集服务器、数据库、应用等各类指标

Grafana可视化

配合Grafana构建精美仪表盘，实时展示监控数据和告警状态

云服务器Prometheus部署教程

下载安装Prometheus

从官网下载Prometheus安装包，解压到指定目录。编辑prometheus.yml配置文件，设置全局参数、采集间隔、数据保留时间等基础配置。

配置监控目标

在prometheus.yml配置scrape_configs段，定义监控目标。配置静态targets列表或使用服务发现机制自动发现监控对象。

部署Node Exporter

在被监控服务器部署Node Exporter，采集CPU、内存、磁盘、网络等系统指标。启动Exporter服务开放9100端口供Prometheus采集。

启动Prometheus服务

使用命令启动Prometheus进程，指定配置文件路径。访问9090端口打开Web界面，验证配置和采集状态正常。

配置告警规则

创建告警规则文件，定义告警条件和表达式。在prometheus.yml配置rule_files引用规则文件，触发告警发送到Alertmanager。

部署Grafana可视化

安装Grafana并配置Prometheus数据源。导入官方Dashboard模板或自定义仪表盘，可视化展示监控指标和告警状态。

PromQL常用查询示例

CPU使用率查询

100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

计算5分钟内CPU使用率平均值，排除idle模式得出实际使用百分比。

内存使用率查询

(1 - (node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes)) * 100

计算内存使用百分比，使用可用内存与总内存比值得出使用率。

磁盘使用率查询

(node_filesystem_size_bytes{fstype!~"tmpfs"} - node_filesystem_avail_bytes) / node_filesystem_size_bytes * 100

计算磁盘分区使用百分比，排除tmpfs临时文件系统得出实际使用率。

网络流量查询

rate(node_network_receive_bytes_total[5m]) * 8 / 1024 / 1024

计算5分钟内网络接收速率，转换为Mbps单位展示带宽使用情况。

系统负载查询

node_load1 / count(node_cpu_seconds_total{mode="idle"}) by(instance)

计算1分钟系统负载与CPU核心数比值，判断负载是否过高。

服务响应时间

histogram_quantile(0.95, rate(http_request_duration_seconds_bucket[5m]))

计算HTTP请求95分位响应时间，使用histogram数据得出延迟分布。

常用Exporter监控组件

Node Exporter

采集服务器硬件和操作系统指标，CPU、内存、磁盘、网络等

MySQL Exporter

采集MySQL数据库性能指标，连接数、查询性能、缓存命中率

Redis Exporter

采集Redis缓存指标，内存使用、命中率、连接数、命令统计

cAdvisor

采集容器资源使用指标，CPU、内存、网络、文件系统使用情况

Blackbox Exporter

探测服务可用性，HTTP、TCP、ICMP探测检测服务存活状态

JMX Exporter

采集Java应用JMX指标，堆内存、线程数、GC统计等

Nginx Exporter

采集Nginx指标，请求数、连接数、响应状态码统计

PostgreSQL Exporter

采集PostgreSQL数据库指标，连接、查询、锁、缓存统计

云服务器Prometheus部署常见问题

Prometheus需要什么配置？

监控服务器建议4核8G以上，存储空间根据数据量和保留周期规划。大规模监控需要更高配置和分布式架构。

Prometheus数据保留多久？

默认保留15天，修改storage.tsdb.retention.time参数设置保留周期。建议保留数天实时数据，长期数据可远程存储。

Prometheus采集频率如何设置？

默认15秒采集一次，修改scrape_interval全局或每个job单独设置。高频采集增加存储压力需权衡。

如何配置服务发现？

配置static_configs静态目标列表，或使用file_sd_configs文件发现、kubernetes_sd_configs K8s服务发现自动发现监控目标。

Alertmanager如何配置？

部署Alertmanager配置alertmanager.yml，设置receiver通知渠道。在Prometheus配置alerting连接Alertmanager地址。

Prometheus如何高可用部署？

部署多实例Prometheus采集相同目标，配置负载均衡分发查询。使用联邦架构聚合多集群数据，远程存储长期数据。

如何监控K8s集群？

配置kubernetes_sd_configs自动发现Pod、Service、Node。部署kube-state-metrics和cAdvisor采集K8s和容器指标。

PromQL如何学习？

从简单即时查询开始，学习rate、avg、sum等常用函数。参考官方文档和社区示例，逐步掌握复杂聚合和计算。

Grafana如何配置Dashboard？

创建Prometheus数据源，使用Query编辑器编写PromQL。添加Panel配置图表类型，导入官方模板快速构建仪表盘。

Prometheus存储空间如何规划？

根据指标数量、采集频率、保留周期估算存储需求。每个样本约1-2字节，预留足够空间避免存储不足影响采集。

如何配置告警规则？

创建rules文件定义告警组，设置expr表达式、for持续时间、labels标签、annotations描述。配置severity级别分类告警。

Node Exporter如何部署？

下载Node Exporter解压，启动进程开放9100端口。在Prometheus配置job添加targets地址，开始采集系统指标。

Prometheus如何监控应用？

应用集成Prometheus客户端库暴露/metrics端点，或使用Exporter采集应用指标。配置Prometheus采集应用暴露的指标。

如何使用Pushgateway？

部署Pushgateway接收短生命周期任务推送的指标。配置Prometheus采集Pushgateway，注意不要用于长期指标推送。

Prometheus性能如何优化？

减少不必要的指标采集，优化PromQL查询复杂度。配置合理的数据保留时间，使用远程存储分担长期数据压力。

如何监控数据库？

部署数据库专用Exporter如MySQL Exporter、Redis Exporter。配置Exporter连接数据库采集性能指标供Prometheus抓取。

Prometheus如何扩容？

增加Prometheus实例分片采集不同目标，使用联邦架构聚合数据。扩展存储容量，配置远程存储长期数据。

告警通知如何配置？

在Alertmanager配置receiver设置通知渠道，支持邮件、Slack、PagerDuty、Webhook等。配置routing规则分发告警。

Prometheus与Zabbix区别？

Prometheus适合云原生场景，查询灵活，时序存储高效。Zabbix功能全面适合传统监控。根据技术栈选择合适方案。

Prometheus部署成本如何？

基础配置年费数百元起，开源Prometheus免费使用。根据监控规模和数据量选择合适配置，成本可控。

云服务器推荐配置

轻量应用服务器

标准型云服务器

内存型云服务器

高IO型云服务器

计算型云服务器

大数据型云服务器

Prometheus核心功能特性

时序数据存储

PromQL查询

Alertmanager告警

服务发现

Exporter采集

Grafana可视化

云服务器Prometheus部署教程

下载安装Prometheus

配置监控目标

部署Node Exporter

启动Prometheus服务

配置告警规则

部署Grafana可视化

PromQL常用查询示例

CPU使用率查询

内存使用率查询

磁盘使用率查询

网络流量查询

系统负载查询

服务响应时间

常用Exporter监控组件

Node Exporter

MySQL Exporter

Redis Exporter

cAdvisor

Blackbox Exporter

JMX Exporter

Nginx Exporter

PostgreSQL Exporter

云服务器Prometheus部署常见问题

云服务器Prometheus部署专属优惠