Youngo 操作系统信息 AWS EKS Kubernetes版本信息 1.2.6 KubeSphere版本信息 v3.4.0 我这边有2个EKS集群测试和生产,每个节点配置如图(截图为生产集群): 测试从11月4号左右突然3个节点的CPU用量都达到了100%。 生产从11月14号左右突然3个节点的CPU用量都达到了100%。 因为生产环境有你随意修改以下操作为测试环境的内容 1.使用kubectl top nodes 。结果如下如(因为测试节点修改了图为生产,不过情况一样): 2.新加节点将原满CPU的容器全部驱离有截图如下: 因为排查问题中替换了2个满CPU的节点,如图中无法调度的为被替换后的2个节点。 上图中为今天新建节点,为了将第四个满CPU节点容器全部驱离。 3.节点容器情况如下 4.aws平台EKS节点容量分配如下 5.EC2节点监控如下 6.节点实例内部top如下 7.atop如下 8.htop如下 请问如何排查当前节点如ip-192-168-148-241.ap-northeast-1.compute.internal CPU用量100%的问题