• 监控日志
  • v3.3.1 所有组件都健康,但是没有任何监控数据

原本是有数据的,但是服务器断电重启后就没有任何数据了,资源用量、节点、pod等都没有监控数据。

k8s:v1.24.9 kubeadm部署

ks:v3.3.1

OS:centos7.5

CRI:containerd

所有组件状态健康,无明显报错

啥数据也没有了

    frezes prometheus有数据, 能在web中查询到实时数据,targets状态也都是up

      frezes

      日志如下,我这另外一个集群B也有这些日志,但是集群B有监控数据

        tan90

        这里的日志不是问题,开启浏览器调试模式,看看监控API的返回是否有报错, API 路径带有“monitoring.kubesphere.io/v1alpha3” ,看看返回

          frezes 看起不太一样,我这边所有数据都没有,但是prometheus本身是能查询到数据的

          frezes 没有报错,status code 200,response也有返回,但是返回的json没有数据

            kilvn 我这部署好是有数据的,重启过后才没有数据

            frezes 查询了一个cluster_disk_size_usage,有数据,时间是实时的

              tan90

              prometheus 是双副本?看看日志,是不是两个pod 都健康的? 如果prometheus 都是健康的,试着重启下ks-apiserver,在观察下

                frezes prometheus 两个pod, 双容器,唯一一条警告日志many-to-many matching not allowed: matching labels must be unique on one side

                tan90

                是不是后边改过prometheus 端点的配置? ks-apiserver 和你页面访问的不是同一个Prometheus ? 看起来监控后端都是OK的。 查查kubesphere-config 里的prometheus.endpoint

                  frezes 只改过node-exporter监听端口,其他的没有改过哦

                  时间同步呢? 你浏览器时间与prometheus 容器的时间 相差多少? 找个节点详情页的监控看下范围查询?

                  frezes prometheus endpoint是改过了,改回ks自己的prometheus有数据了,但是原本外接prometheus也是有数据的,这是个问题,我得研究研究。非常感谢!!!