在ACK集群中应用阿里云Prometheus监控

您可以通过阿里云Prometheus监控查看容器服务ACK集群中预先配置的监控大盘和监控性能指标。本文介绍如何使用Prometheus监控服务以及配置Prometheus监控告警。

背景信息


  • 阿里云 Prometheus 监控全面对接开源 Prometheus 生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。
  • 借助阿里云Prometheus监控,您无需自行搭建Prometheus监控系统,因而无需关心底层数据存储、数据展示、系统运维等问题。

前提条件


操作步骤


步骤一:查看 Prometheus 监控大盘

1、在ARMS控制台左侧导航栏,单击Promethues 监控,找到并单击已安装监控插件的目标集群。

arms-promethues-entry

2、点击需要查看的大盘,即可跳转至对应的 Grafana 监控图表。

arm-promethues-dashboard

步骤二:配置 Prometheus 监控告警

为监控任务创建报警可在满足报警条件时通过邮件、短信、钉钉等渠道实时报警,主动帮助您发现异常。报警规则被触发时会向您指定的联系人分组发送通知,而在创建联系人分组之前必须先创建联系人。创建联系人时,您可以指定联系人用于接收通知的手机号码和邮箱地址,也可以提供用于自动发送报警通知的钉钉机器人地址。

说明 如需将钉钉机器人添加为联系人,则需要先获取钉钉机器人的地址。详情请参见设置钉钉机器人报警

1、登录 ARMS 控制台

2、在左侧导航栏中选择报警管理 > 联系人管理

3、在联系人页签上,单击右上角的新建联系人

arms-contact

报警规则说明

ARMS Promethues 预置了多种报警规则。Prometheus监控报警规则包括 Pod 告警规则、Kube-state 告警规则、Node 告警规则和 Kubelet 告警规则等。

  • 您可以在 Promethues 监控页面访问 报警配置(Beta) 配置报警规则,输入PromQL语句进行配置(参见 快速创建 ARMS 报警),或者直接开启预置的规则。

arm-promethues-alert-enable

  • 开启后的规则也可以在 ARMS 全局 报警策略管理 进行管理。

arms-promethues-rule

  • 钉钉告警

进行手动测试,触发钉钉告警。正常触发告警如下:

arms-prometheus-alert