Amazon Managed Service for Prometheus 专业2020年〜
兼容 Prometheus 的托管监控服务,提供容器指标的收集、查询和告警
它能做什么
Amazon Managed Service for Prometheus (AMP) 是兼容 Prometheus 的全托管监控服务。从 EKS、ECS、EC2 上的容器工作负载收集指标,使用 PromQL 执行查询和告警。支持 Prometheus 的远程写入 API,便于从现有 Prometheus 环境迁移。
使用场景
用于 Kubernetes 集群指标监控、容器工作负载性能监控、微服务指标收集和可视化,以及大规模 Prometheus 环境的扩展。
日常类比
可以将其比作体检中心。定期收集各患者 (容器) 的生命体征 (指标),检测异常值 (告警)。数据的保管和分析由中心 (AMP) 完成,医生 (Grafana) 查看结果。
什么是 Managed Prometheus
Amazon Managed Service for Prometheus 是以托管方式提供 Prometheus 存储和查询引擎的服务。自建 Prometheus 面临存储管理、高可用性构建和长期保存设计等挑战,AMP 由 AWS 管理这些。指标自动复制到多可用区,保留 150 天。
指标收集与告警
指标收集使用 Prometheus 服务器、AWS Distro for OpenTelemetry (ADOT) 或 Grafana Agent 等。这些收集器将指标发送到 AMP 的远程写入端点。可在 AMP 的规则管理器中定义基于 PromQL 的告警规则,通过 SNS 发送通知。 如需了解指标收集与告警的实践知识,可参考 Amazon 技术书籍。
如何开始
在 AMP 控制台创建工作空间。在 EKS 集群中部署 ADOT 收集器或 Prometheus 服务器,将远程写入目标设为 AMP 端点。在 Managed Grafana 中添加 AMP 作为数据源,即可使用 PromQL 查询指标并构建仪表板。
注意事项
- 按指标摄取量、存储量和查询样本处理数按量计费
- 指标收集需另外部署收集器 (ADOT、Prometheus 服务器)