我的kubernetes豆荚不断崩溃与“CrashLoopBackOff”，但我找不到任何日志

这就是我一直得到的答案:

[root@centos-master ~]# kubectl get pods
NAME               READY     STATUS             RESTARTS   AGE
nfs-server-h6nw8   1/1       Running            0          1h
nfs-web-07rxz      0/1       CrashLoopBackOff   8          16m
nfs-web-fdr9h      0/1       CrashLoopBackOff   8          16m

下面是描述pods的输出 Kubectl描述了豆荚

Events:
  FirstSeen LastSeen    Count   From                SubobjectPath       Type        Reason      Message
  --------- --------    -----   ----                -------------       --------    ------      -------
  16m       16m     1   {default-scheduler }                    Normal      Scheduled   Successfully assigned nfs-web-fdr9h to centos-minion-2
  16m       16m     1   {kubelet centos-minion-2}   spec.containers{web}    Normal      Created     Created container with docker id 495fcbb06836
  16m       16m     1   {kubelet centos-minion-2}   spec.containers{web}    Normal      Started     Started container with docker id 495fcbb06836
  16m       16m     1   {kubelet centos-minion-2}   spec.containers{web}    Normal      Started     Started container with docker id d56f34ae4e8f
  16m       16m     1   {kubelet centos-minion-2}   spec.containers{web}    Normal      Created     Created container with docker id d56f34ae4e8f
  16m       16m     2   {kubelet centos-minion-2}               Warning     FailedSync  Error syncing pod, skipping: failed to "StartContainer" for "web" with CrashLoopBackOff: "Back-off 10s restarting failed container=web pod=nfs-web-fdr9h_default(461c937d-d870-11e6-98de-005056040cc2)"

我有两个pod: nfs-web-07rxz, nfs-web-fdr9h，但如果我做kubectl日志nfs-web-07rxz或带-p选项，我在两个pod中都看不到任何日志。

[root@centos-master ~]# kubectl logs nfs-web-07rxz -p
[root@centos-master ~]# kubectl logs nfs-web-07rxz

这是我的replicationController yaml文件: replicationController yaml文件

apiVersion: v1 kind: ReplicationController metadata:   name: nfs-web spec:   replicas: 2   selector:
    role: web-frontend   template:
    metadata:
      labels:
        role: web-frontend
    spec:
      containers:
      - name: web
        image: eso-cmbu-docker.artifactory.eng.vmware.com/demo-container:demo-version3.0
        ports:
          - name: web
            containerPort: 80
        securityContext:
          privileged: true

我的Docker镜像是由这个简单的Docker文件制作的:

FROM ubuntu
RUN apt-get update
RUN apt-get install -y nginx
RUN apt-get install -y nfs-common

我在CentOs-1611上运行我的kubernetes集群，kube版本:

[root@centos-master ~]# kubectl version
Client Version: version.Info{Major:"1", Minor:"3", GitVersion:"v1.3.0", GitCommit:"86dc49aa137175378ac7fba7751c3d3e7f18e5fc", GitTreeState:"clean", BuildDate:"2016-12-15T16:57:18Z", GoVersion:"go1.6.3", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"3", GitVersion:"v1.3.0", GitCommit:"86dc49aa137175378ac7fba7751c3d3e7f18e5fc", GitTreeState:"clean", BuildDate:"2016-12-15T16:57:18Z", GoVersion:"go1.6.3", Compiler:"gc", Platform:"linux/amd64"}

如果我通过docker run运行docker映像，我能够运行映像而没有任何问题，只有通过kubernetes我得到了崩溃。

有人能帮我一下吗，我怎么调试而不看到任何日志?

当前回答

我也有同样的问题，现在我终于解决了。我没有使用docker-compose文件。我只是在Docker文件中添加了这一行，它起作用了。

ENV CI=true

参考: https://github.com/GoogleContainerTools/skaffold/issues/3882

2020-06-09 22:30:23

其他回答

在我的例子中，这个错误是特定于hello-world docker映像的。我使用nginx图像而不是hello-world图像，错误被解决了。

2021-01-21 17:08:35

#Show details of specific pod
kubectl  describe pod <pod name> -n <namespace-name>

# View logs for specific pod
kubectl  logs <pod name> -n <namespace-name>

2018-06-04 08:54:42

如上所述，容器在创建时退出。

如果您希望在不使用yaml文件的情况下进行测试，可以将sleep命令传递给kubectl创建部署语句。双连字符——表示命令，相当于Pod或Deployment yaml文件中的command:。

下面的命令为使用sleep 1234的debian创建了一个部署，因此它不会立即退出。

kubectl create deployment deb --image=debian:buster-slim -- "sh" "-c" "while true; do sleep 1234; done"

然后你可以创建一个服务等，或者，测试容器，你可以kubectl exec -it <pod-name>——sh(或——bash)到你刚刚创建的容器中测试它。

2021-06-10 08:46:26

我需要为后续的kubectl执行调用保持一个pod运行，正如上面的评论所指出的，我的pod正在被我的k8s集群杀死，因为它已经完成了所有的任务。我设法保持我的豆荚运行，只需用一个不会自动停止的命令踢豆荚:

kubectl run YOUR_POD_NAME -n YOUR_NAMESPACE --image SOME_PUBLIC_IMAGE:latest --command tailf /dev/null

2017-06-13 17:23:03

就我而言，问题就像Steve S.提到的:

吊舱崩溃是因为它启动后立即退出，因此Kubernetes重新启动，循环继续。

也就是说，我有一个Java应用程序，它的主抛出了一个异常(并且某些东西覆盖了默认的未捕获异常处理程序，因此没有记录任何内容)。解决方案是将main的主体放入try{…}捕获并输出异常。这样我就能找出问题所在并修复它。

(另一个原因可能是应用程序中调用System.exit的东西;您可以使用自定义SecurityManager与覆盖的checkExit来防止(或记录的调用者)退出;参见https://stackoverflow.com/a/5401319/204205)。

2019-01-15 12:40:28

我的kubernetes豆荚不断崩溃与“CrashLoopBackOff”，但我找不到任何日志

推荐文章

最新文章

标签