Prometheus在应对上千节点监控时,如何保障性能?

無名 发表于: 2021-07-27   最后更新时间: 2022-08-23 14:05:25   1,287 游览

Prometheus在应对上千节点监控时,如何保障性能?

发表于 2021-07-27
添加评论
  1. 避免跨网调用

  2. 数据源侧:

    2.1 优化指标采样率

    2.2 删除非核心指标的采集

    top10的metrics数量,按metrcis名称区分:

    topk(10,count by (__name__) ({__name__=~'.+'}))
    

    2.3 业务侧拆分,采用集群联邦

  3. prom数据生命周期管理(减少保存时间)或者远程写入nas/oss

  4. 高可用方案thonas

你的答案

查看Prometheus相关的其他问题或提一个您自己的问题