查询 悦数图数据库 监控指标
悦数图数据库 支持多种方式查询服务的监控指标,本文将介绍最基础的方式,即通过 HTTP 端口查询。
监控指标结构说明
悦数图数据库 的每个监控指标都由三个部分组成,中间用英文句号(.)隔开,例如num_queries.sum.600。不同的 悦数图数据库 服务支持查询的监控指标也不同。指标结构的说明如下。
| 类别 | 示例 | 说明 |
|---|---|---|
| 指标名称 | num_queries | 简单描述指标的含义。 |
| 统计类型 | sum | 指标统计的方法。当前支持 SUM、AVG、RATE 和 P 分位数(P75、P95、P99、P999)。 |
| 统计时间 | 600 | 指标统计的时间范围,当前支持 5 秒、60 秒、600 秒和 3600 秒,分别表示最近 5 秒、最近 1 分钟、最近 10 分钟和最近 1 小时。 |
通过 HTTP 端口查询监控指标
语法
curl -G "http://<host>:<port>/stats?stats=<metric_name_list> [&format=json]"
| 选项 | 说明 |
|---|---|
host | 服务器的 IP 或主机名,可以在安装目录内查看配置文件获取。 |
port | 服务器的 HTTP 端口,可以在安装目录内查看配置文件获取。默认情况下,Meta 服务端口为 19559,Graph 服务端口为 19669,Storage 服务端口为 19779。 |
metric_name_list | 监控指标名称,多个监控指标用英文逗号(,)隔开。 |
&format=json | 将结果以 JSON 格式返回。 |
备注
如果 悦数图数据库 服务部署在容器中,需要执行docker-compose ps命令查看映射到容器外部的端口,然后通过该端口查询。
查询单个监控指标
查询 Graph 服务中,最近 10 分钟的请求总数。
$ curl -G "http://192.168.8.40:19669/stats?stats=num_queries.sum.600"
num_queries.sum.600=400
查询多个监控指标
查询 Meta 服务中,最近 1 分钟的心跳平均延迟和最近 10 分钟 P99 心跳(1%最慢的心跳)的平均延迟。
$ curl -G "http://192.168.8.40:19559/stats?stats=heartbeat_latency_us.avg.60,heartbeat_latency_us.p99.600"
heartbeat_latency_us.avg.60=281
heartbeat_latency_us.p99.600=985
查询监控指标并以 JSON 格式返回
查询 Storage 服务中,最近 10 分钟新增的点数量,并以 JSON 格式返回结果。
$ curl -G "http://192.168.8.40:19779/stats?stats=num_add_vertices.sum.600&format=json"
[{"value":1,"name":"num_add_vertices.sum.600"}]
查询服务器的所有监控指标
不指定查询某个监控指标时,会返回该服务器上所有的监控指标。
$ curl -G "http://192.168.8.40:19559/stats"
heartbeat_latency_us.avg.5=304
heartbeat_latency_us.avg.60=308
heartbeat_latency_us.avg.600=299
heartbeat_latency_us.avg.3600=285
heartbeat_latency_us.p75.5=652
heartbeat_latency_us.p75.60=669
heartbeat_latency_us.p75.600=651
heartbeat_latency_us.p75.3600=642
heartbeat_latency_us.p95.5=930
heartbeat_latency_us.p95.60=963
heartbeat_latency_us.p95.600=933
heartbeat_latency_us.p95.3600=929
heartbeat_latency_us.p99.5=986
heartbeat_latency_us.p99.60=1409
heartbeat_latency_us.p99.600=989
heartbeat_latency_us.p99.3600=986
num_heartbeats.rate.5=0
num_heartbeats.rate.60=0
num_heartbeats.rate.600=0
num_heartbeats.rate.3600=0
num_heartbeats.sum.5=2
num_heartbeats.sum.60=40
num_heartbeats.sum.600=394
num_heartbeats.sum.3600=2364
...
查询图空间监控指标
Graph 服务支持一系列基于图空间的监控指标,对不同图空间的数据分别记录。
图空间指标只能通过查询所有监控指标的形式查询到,例如curl -G "http://192.168.8.40:19559/stats",返回结果中以{space=space_name}的形式包含图空间名称,例如num_active_queries{space=basketballplayer}.sum.5=0。
警告
如需开启图空间监控指标,先在 Graph 服务的配置文件中将enable_space_level_metrics参数的值修改为true,再启动 悦数图数据库 。修改配置的详细方式参见配置管理。