yudong gongyuhaha 从这个日志看,是 k8s 的 etcd 服务有问题:etcdserver: request timed out 可以在节点上检查修复下 etcd 服务:systemctl status etcd ;
gongyuhaha yudong pipelinerun-controller “msg”=“unable to run pipeline” “error”="Get \“http://devops-jenkins.kubesphere-devops-system/crumbIssuer/api/json\”: dial tcp: lookup devops-jenkins.kubesphere-devops-system on 169.254.25.10:53: no such host" “Pipeline”=“ai-admin-java” “PipelineRun”={“Namespace”:“ai-devopsh6bj5”,“Name”:“ai-admin-java-llkh7”} “namespace”=“ai-devopsh6bj5” “pipeline”=“ai-admin-java”
yudong gongyuhaha 从这些日志上看,应该是升级后 k8s 底层 etcd 服务异常导致的上面这些问题;您可以根据相关日志排查下 etcd、localdns、coredns 服务; 比如上面的:`etcdserver: request timed out` ,搜索这个日志,发现有多种可能: https://blog.csdn.net/textdemo123/article/details/96460680 https://blog.csdn.net/weixin_42072280/article/details/121902249 这个需要自行排查解决。
gongyuhaha yudong 还有个很奇怪的问题,我下面截图里明明有ai-admin-react和ai-admin-java,我点创建输别的名称都报404找不到进入不到下一步,但是输有的这两个名称能进到下一步。但是最后创建又报已存在。这个创建不是本来是创建新的流水线用的吗。
yudong gongyuhaha 这个可能是 devops-apiserver 请求 devops-jenkins 时有问题了,要看下创建流水线时候 devops-apiserver 的日志;也可以看下 devops-jenkins pod 是不是正常的,以及它的日志,根据这些日志分析下;