黄永杰

0 声望

这家伙太懒,什么都没留下

个人动态
  • 黄永杰 回复 黄永杰kafka监控 中 :

    https://grafana.com/grafana/dashboards/11962
    peometheus里的这个dashboard直接拿sum(kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms{job=\"$job\",instance=~\"$broker\"})by(instance)
    统计的延迟,感觉不太对吧

    2年前
  • 黄永杰 回复 黄永杰kafka监控 中 :

    kafka jmx metric里显示这个指标格式

    kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms{quantile="0.50"} 1.0
    kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms{quantile="0.75"} 1.0
    kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms{quantile="0.95"} 4.0
    kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms{quantile="0.98"} 14587.7
    kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms{quantile="0.99"} 17068.0
    kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms{quantile="0.999",} 17068.0
    

    看一篇文章里介绍quantile:假设0.9-quantile的值为120,意思就是所有的采样值中,小于120的采样值的数量占总体采样值的90%.

    https://cloud.tencent.com/developer/news/319419

    看来不能单纯作为延迟值来看…

    2年前
  • 半兽人 回复 黄永杰kafka监控 中 :

    从指标的名字来看,就是kafka请求zk的延迟时间(毫秒)。越大代表延迟的越高。表面意思吧。

    2年前
  • 黄永杰 回复 半兽人kafka监控 中 :

    kafka_server_zookeeperclientmetrics_zookeeperrequestlatencyms 有碰到过dashboard显示这个指标统计值很大的情况吗?
    kafka metrics里显示0.999的统计值17000+,0.99也很高。
    楼主理解这个指标的metrics含义么?

    2年前