broker监控指标
- Kafka集群broker总数
- broker的状态值(是否正常、是否leader)
- broker的每秒消费请求数
- broker的每秒生产请求数
- broker的消息流入总数
- broker的消息流出总数
- broker的每秒消息流入数
- broker的每秒消息流出数
- broker的字节流入总数(byte)
- broker的每秒字节流入数(byte/s)
- broker的字节流出总数(byte)
- broker的每秒字节流出数(byte/s)
- broker的partition的数量
Kafka集群监控指标
- 消息积压变化趋势(h 小时)
- 消息收发变化趋势
- 消息生产、消费成功率/失败率(h)
- 一次FetchConsumer耗费的时间(10ms、100ms、500ms分段统计)
- 一次FetchFollower耗费的时间(10ms、100ms、500ms)
- 一个次Produce耗费的时间(10ms、100ms、500ms)
- 每秒fetch请求失败的数量
- 每秒produce请求失败的数量
运行环境监控指标
- 系统CPU利用率
- 进程CPU利用率
- 空闲物理内存
- 使用物理内存
- GC次数