Prometheus Web UI 实战:从零开始执行 PromQL 查询与可视化
问题引入
本文将精准解答以下技术问题:
19. 如何在 Web UI 中执行一个简单的 PromQL 查询并查看结果图表?
对于一位拥有8年大数据生态(Spring/Flink/ClickHouse/Hudi/Kafka/Parquet)开发经验的工程师而言,这个问题是踏入Prometheus世界的第一道门。你可能已经习惯了在Flink SQL或ClickHouse客户端中编写查询,但PromQL是一种全新的、专为时间序列设计的查询语言。掌握它,意味着你能直接与你的系统“对话”,实时洞察其健康状况。
想象这样一个真实场景:你负责一个Kafka消息总线,它是整个公司数据流的命脉。突然,你收到一条告警:“kafka_topic_partition_lag超过阈值”。你立刻打开Prometheus Web UI,不是去翻看日志,而是直接输入一条PromQL查询:kafka_consumergroup_lag{topic="user-activity"}。几秒钟后,一张清晰的折线图展现在你面前,显示了不同消费者组的Lag随时间的变化趋势。你发现是flink-streaming-job这个消费者组的Lag在急剧上升,而其他组正常。这让你瞬间将排查焦点锁定在该