添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
版本:2.3

监控报警

本文介绍如何为 StarRocks 设置监控报警。

StarRocks 提供两种监控报警的方案。企业版用户可以使用内置的 StarRocksManager,其自带的 Agent 从各个 Host 采集监控信息,上报至 Center Service,然后做可视化展示。StarRocksManager 提供邮件和 Webhook 的方式发送报警通知。如果您有二次开发需求,需要自行搭建部署监控服务,也可以使用开源 Prometheus+Grafana 方案,StarRocks 提供了兼容 Prometheus 的信息采集接口,可以通过直接连接 BE 或 FE 的 HTTP 端口来获取集群的监控信息。

使用 StarRocksManager

StarRocksManager 的监控可以分成 集群 节点 两个维度。

您可以在集群页面可以看到下列监控项:

  • 集群性能监控
  • CPU 使用率
  • 磁盘 I/O 使用率,磁盘使用量、磁盘空闲量
  • 发包带宽、收包带宽,发包数、收包数
  • 集群查询监控
  • 平均响应时间
  • 50/75/90/95/99/999 分位响应时间
  • 数据导入量监控
  • 发起导入次数
  • 导入数据量
  • 数据组合并(Compaction)监控
  • 基线合并数据组速率
  • 基线合并数据量
  • 增量合并数据组速率
  • 增量合并数据量
  • 节点 页面可以看到所有 BE/FE 的机器列表和状态等基础信息

    点击节点链接可以看到每一个节点的详细监控信息。在右侧的节点列表中选择多个节点同时展示,也可以在上方的下拉框中选择各类指标。

    使用 Prometheus+Grafana

    您可以使用 Prometheus 作为 StarRocks 监控数据存储方案,并使用 Grafana 作为可视化组件。

    Prometheus 是一个拥有多维度数据模型的、灵活的查询语句的时序数据库。它可以通过 Pull 或 Push 采集被监控系统的监控项,存入自身的时序数据库中。并且通过丰富的多维数据查询语言,满足用户的不同需求。

    Grafana 是一个开源的 Metric 分析及可视化系统。支持多种数据源,详情可参考官网文档。通过对应的查询语句,从数据源中获取展现数据。通过灵活可配置的 Dashboard,快速的将这些数据以图表的形式展示给用户。

    本文档仅提供基于 Prometheus 和 Grafana 实现的一种 StarRocks 可视化监控方案,原则上不维护和开发这些组件。更多详细的介绍和使用,请参考对应的官网文档。

    监控架构

    Prometheus 通过 Pull 方式访问 FE 或 BE 的 Metric 接口,然后将监控数据存入时序数据库。

    用户可以通过 Grafana 配置 Prometheus 为数据源,自定义绘制 Dashboard。

    部署 Prometheus

    下载并安装 Prometheus