吊舱处于终止状态

我试图删除一个有12个pod的ReplicationController，我可以看到一些pod卡在终止状态。

我的Kubernetes集群由一个控制平面节点和三个安装在Ubuntu虚拟机上的工作节点组成。

这个问题的原因是什么?

NAME        READY     STATUS        RESTARTS   AGE
pod-186o2   1/1       Terminating   0          2h
pod-4b6qc   1/1       Terminating   0          2h
pod-8xl86   1/1       Terminating   0          1h
pod-d6htc   1/1       Terminating   0          1h
pod-vlzov   1/1       Terminating   0          1h

实用的答案——你可以通过运行:

kubectl delete pod NAME --grace-period=0

历史答案——在1.1版本中有一个问题，有时如果pod的节点被不干净地从集群中移除，则它们会处于终止状态。

2016-02-18 04:22:31

可以使用以下命令强制删除POD。

kubectl delete pod <PODNAME> --grace-period=0 --force --namespace <NAMESPACE>

2016-07-04 07:13:53

强制删除pod:

kubectl delete pod --grace-period=0 --force --namespace <NAMESPACE> <PODNAME>

——force标志是强制的。

2017-01-19 22:33:24

从资源(pod,deployment,ds等)中删除终结器块

"finalizers": [
  "foregroundDeletion"
]

2018-02-27 10:31:03

如果——grace-period=0不起作用，那么你可以这样做:

kubectl delete pods <pod> --grace-period=0 --force

2018-03-29 21:06:23

我最近在删除rook ceph命名空间时偶然发现了这个问题——它卡在了终止状态。

唯一有帮助的是通过使用curl直接调用k8s api来删除kubernetes终结器。

Kubectl获取命名空间鲁克-ceph -o json > tmp.json 删除tmp中的kubernetes终结器。Json(留下空数组“终结器”:[]) 在另一个终端上运行kubectl代理进行身份验证，并在返回的端口上运行curl请求 curl -k -H "Content-Type: application/json" -X PUT——data-binary @tmp。json 127.0.0.1:8001 /美丽/集群/ c-mzplp / api / v1 /命名空间/ rook-ceph /完成命名空间消失了

详细的rook ceph拆卸在这里。

2018-09-19 19:26:47

我最近在释放集群中的资源时偶然发现了这一点。下面是删除它们的命令。

kubectl get pods --all-namespaces | grep Terminating | while read line; do
  pod_name=$(echo $line | awk '{print $2}' ) \
  name_space=$(echo $line | awk '{print $1}' ); \
  kubectl delete pods $pod_name -n $name_space --grace-period=0 --force
done

希望这能帮助到读到这篇文章的人

2019-01-23 00:25:10

我发现这个命令更直接:

for p in $(kubectl get pods | grep Terminating | awk '{print $1}'); do kubectl delete pod $p --grace-period=0 --force;done

它将删除默认命名空间中处于终止状态的所有pod。

2019-03-09 17:53:35

在我的案例中，——force选项不太管用。我还能看到豆荚!它卡在终止/未知模式。跑步之后

kubectl -n redis delete pods <pod> --grace-period=0 --force

我跑

kubectl -n redis patch pod <pod> -p '{"metadata":{"finalizers":null}}'

2019-05-09 17:12:37

最初的问题是“这个问题的原因是什么?”，答案在https://github.com/kubernetes/kubernetes/issues/51835和https://github.com/kubernetes/kubernetes/issues/65569上讨论，请参阅https://www.bountysource.com/issues/33241128-unable-to-remove-a-stopped-container-device-or-resource-busy

这是由于码头挂载泄漏到其他命名空间造成的。

您可以登录到pod主机进行调查。

minikube ssh
docker container ps | grep <id>
docker container stop <id>

2019-07-14 00:26:19

我不建议强制删除pod，除非容器已经退出。

验证kubelet日志，看看是什么导致了问题“journalctl -u kubelet” 检查docker日志:journalctl -u docker.service 检查吊舱的卷挂载点是否仍然存在，是否有人持有锁。检查主机内存或磁盘是否不足

2020-07-02 19:46:09

在做强制删除之前，我会先做一些检查。 1- node state:获取节点正在运行的节点名，可以使用以下命令查看:

"kubectl -n YOUR_NAMESPACE describe pod YOUR_PODNAME"

在“Node”标签下，您将看到节点名称。你可以这样做:

kubectl describe node NODE_NAME

如果您看到任何奇怪的东西，请检查“条件”字段。如果这是好的，那么你可以移动到步骤，重做:

"kubectl -n YOUR_NAMESPACE describe pod YOUR_PODNAME"

检查它挂起的原因，你可以在“事件”部分找到这个。我这么说是因为在强制删除pod之前，您可能需要采取初步的操作，强制删除pod只删除pod本身，而不删除底层资源(例如，一个卡住的docker容器)。

2020-07-30 08:41:01

你可以使用awk:

kubectl get pods --all-namespaces | awk '{if ($4=="Terminating") print "oc delete pod " $2 " -n " $1 " --force --grace-period=0 ";}' | sh

2021-01-27 19:39:51

请尝试以下命令: Kubectl补丁pod -p '{"metadata":{"finalizers":null}}'

2021-02-09 11:42:59

对我来说，我不喜欢变通。所以有几个步骤:

k get pod -o wide ->这会显示哪个Node正在运行pod k get nodes ->检查节点状态…我明白了

我修复了这个节点。对于我的情况，它只是重新启动kubelet:

ssh that-node ->运行swapoff -a && systemctl restart kubelet(或systemctl restart k3s，如果k3s |或systemctl restart crio，在其他情况下，如OCP 4。X (k8s <1.23))

现在删除豆荚应该工作而不强迫可怜豆荚。

2021-04-04 10:43:12

发生这种情况的一个原因可能是关闭一个节点(而不耗尽它)。在这种情况下修复是再次打开节点;那么终止应该成功。

2021-05-01 13:16:23

强制删除命名空间中的所有pod:

kubectl delete pods --all -n <namespace> --grace-period 0 --force

2021-05-13 12:52:01

以下命令与awk和xargs可以使用——grace-period=0——force删除所有处于终止状态的pod。

kubectl get pods|grep -i terminating | awk '{print $1}' | xargs kubectl delete --grace-period=0 --force pod

2021-11-30 09:30:22

我使用这个命令删除pods

kubectl delete pod --grace-period=0 --force --namespace <NAMESPACE> <PODNAME>

但是当我尝试运行另一个pod时，它没有工作，它被卡在“Pending”状态，它看起来像节点本身被卡住了。

对我来说，解决方案是重新创建节点。我只是去了GKE控制台，从集群中删除了节点，所以GKE开始了另一个。

从那以后，一切又开始正常工作了。

2021-12-02 00:18:22

我在Kubernetes生产集群中遇到了同样的问题。

一个吊舱被困在终止阶段一段时间:

pod-issuing   mypod-issuing-0   1/1     Terminating   0  27h

我尝试使用命令检查日志和事件:

kubectl describe pod mypod-issuing-0 --namespace pod-issuing
kubectl logs mypod-issuing-0 --namespace pod-issuing

但没有人可以看到

我是如何解决的:

我运行下面的命令来强制删除pod:

kubectl delete pod <PODNAME> --grace-period=0 --force --namespace <NAMESPACE>

这将立即删除pod并开始创建一个新的pod。然而，当创建另一个pod时，我遇到了下面的错误:

无法挂载或挂载卷:unmounted volumes=[data]， unattach volumes=[data mypod- issue -token-5swgg aws-iam-token]:超时等待条件

我不得不等待7到10分钟，使卷从我删除的上一个pod中分离出来，以便它可以用于我正在创建的新pod。

2022-02-12 08:35:25

Go模板可以在没有awk的情况下工作，对我来说，它可以在没有-grace-period=0 -force的情况下工作，但是，如果你喜欢的话，可以添加它

这将输出删除终止pods的命令。

kubectl get pods --all-namespaces -otemplate='{{ range .items }}{{ if eq .status.reason  "Terminated" }}{{printf "kubectl delete pod -n %v %v\n" .metadata.namespace .metadata.name}}{{end}}{{end}}'

如果您对输出感到满意，可以添加| sh -来执行它。遵循:

kubectl get pods --all-namespaces -otemplate='{{ range .items }}{{ if eq .status.reason  "Terminated" }}{{printf "kubectl delete pod -n %v %v\n" .metadata.namespace .metadata.name}}{{end}}{{end}}' |sh -

2022-05-29 13:44:06

我的pod卡在“终止”中，即使在我尝试重新启动docker和重新启动服务器之后。在编辑pod并删除'finalizer'下面的项目后解决

$ kubectl -n mynamespace edit pod/my-pod-name

2022-08-25 15:03:27

我将尝试最广泛的答案，因为上面没有一个是错误的，但它们并不适用于所有情况。

终止豆荚的通常方法是:

kubectl delete pod -n ${namespace} ${pod} --grace-period=0

但您可能需要删除可能会阻止POD停止使用的终结器:

kubectl -n ${namespace} patch pod ${pod} -p '{"metadata":{"finalizers":null}}'

如果这些都不起作用，你可以用etcdctl从etcd中删除pod:

# Define variables
ETCDCTL_API=3
certs-path=${HOME}/.certs/e
etcd-cert-path=${certs-path}/etcd.crt
etcd-key-path=${certs-path}/etcd.key
etcd-cacert-path=${certs-path}/etcd.ca
etcd-endpoints=https://127.0.0.1:2379
namespace=myns
pod=mypod

# Call etcdctl to remove the pod
etcdctl del \
--endpoints=${etcd-endpoints}\
--cert ${etcd-cert-path} \
--key ${etcd-client-key}\
--cacert ${etcd-cacert-path} \
--prefix \
/registry/pods/${namespace}/${pod}

这最后的情况下应该被用作最后的资源，在我的情况下，我结束不得不这样做，因为死锁阻止calico在节点中启动，由于Pods处于终止状态。在calico完成之前，这些pod不会被移除，但它们保留了足够的CPU以避免calico或任何其他pod初始化。

2023-01-12 14:23:51

吊舱处于终止状态

推荐文章

最新文章

标签