我如何检查一个失败的“docker构建”的文件系统?

我试图为我们的开发过程构建一个新的Docker映像，使用cpanm安装一堆Perl模块作为各种项目的基本映像。

在开发Dockerfile时，cpanm返回一个失败代码，因为一些模块没有干净地安装。

我很确定我需要准备安装更多的东西。

我在哪里可以找到/。在输出中引用Cpanm /work目录，以便检查日志?在一般情况下，我如何检查一个失败的docker构建命令的文件系统?

在运行一个发现后，我发现

/var/lib/docker/aufs/diff/3afa404e[...]/.cpanm

这是可靠的吗，还是我最好构建一个“裸”容器并手动运行一些东西，直到我拥有所有我需要的东西?

当前回答

调试构建步骤失败确实非常烦人。

我发现的最好的解决方案是确保每一个真正工作的步骤都成功，并在那些失败的步骤之后添加检查。通过这种方式，您可以获得一个包含您可以检查的失败步骤的输出的已提交层。

一个Dockerfile，在# Run DB2静默安装行之后有一个示例:

#
# DB2 10.5 Client Dockerfile (Part 1)
#
# Requires
#   - DB2 10.5 Client for 64bit Linux ibm_data_server_runtime_client_linuxx64_v10.5.tar.gz
#   - Response file for DB2 10.5 Client for 64bit Linux db2rtcl_nr.rsp 
#
#
# Using Ubuntu 14.04 base image as the starting point.
FROM ubuntu:14.04

MAINTAINER David Carew <carew@us.ibm.com>

# DB2 prereqs (also installing sharutils package as we use the utility uuencode to generate password - all others are required for the DB2 Client) 
RUN dpkg --add-architecture i386 && apt-get update && apt-get install -y sharutils binutils libstdc++6:i386 libpam0g:i386 && ln -s /lib/i386-linux-gnu/libpam.so.0 /lib/libpam.so.0
RUN apt-get install -y libxml2


# Create user db2clnt
# Generate strong random password and allow sudo to root w/o password
#
RUN  \
   adduser --quiet --disabled-password -shell /bin/bash -home /home/db2clnt --gecos "DB2 Client" db2clnt && \
   echo db2clnt:`dd if=/dev/urandom bs=16 count=1 2>/dev/null | uuencode -| head -n 2 | grep -v begin | cut -b 2-10` | chgpasswd && \
   adduser db2clnt sudo && \
   echo '%sudo ALL=(ALL) NOPASSWD:ALL' >> /etc/sudoers

# Install DB2
RUN mkdir /install
# Copy DB2 tarball - ADD command will expand it automatically
ADD v10.5fp9_linuxx64_rtcl.tar.gz /install/
# Copy response file
COPY  db2rtcl_nr.rsp /install/
# Run  DB2 silent installer
RUN mkdir /logs
RUN (/install/rtcl/db2setup -t /logs/trace -l /logs/log -u /install/db2rtcl_nr.rsp && touch /install/done) || /bin/true
RUN test -f /install/done || (echo ERROR-------; echo install failed, see files in container /logs directory of the last container layer; echo run docker run '<last image id>' /bin/cat /logs/trace; echo ----------)
RUN test -f /install/done

# Clean up unwanted files
RUN rm -fr /install/rtcl

# Login as db2clnt user
CMD su - db2clnt

2017-11-26 11:09:35

其他回答

我要做的是注释掉下面的Dockerfile，并包括违规行。然后，您可以手动运行容器和docker命令，并以通常的方式查看日志。例如，如果Dockerfile是

RUN foo
RUN bar
RUN baz

我也会这么做的

RUN foo
# RUN bar
# RUN baz

Then

$ docker build -t foo .
$ docker run -it foo bash
container# bar
...grep logs...

2014-10-06 17:33:24

每次docker成功执行Dockerfile中的RUN命令时，镜像文件系统中的一个新层就会被提交。你可以方便地使用这些图层id作为图像来启动一个新容器。

以以下Dockerfile为例:

FROM busybox
RUN echo 'foo' > /tmp/foo.txt
RUN echo 'bar' >> /tmp/foo.txt

并建立它:

$ docker build -t so-26220957 .
Sending build context to Docker daemon 47.62 kB
Step 1/3 : FROM busybox
 ---> 00f017a8c2a6
Step 2/3 : RUN echo 'foo' > /tmp/foo.txt
 ---> Running in 4dbd01ebf27f
 ---> 044e1532c690
Removing intermediate container 4dbd01ebf27f
Step 3/3 : RUN echo 'bar' >> /tmp/foo.txt
 ---> Running in 74d81cb9d2b1
 ---> 5bd8172529c1
Removing intermediate container 74d81cb9d2b1
Successfully built 5bd8172529c1

你现在可以从00f017a8c2a6, 044e1532c690和5bd8172529c1开始一个新容器:

$ docker run --rm 00f017a8c2a6 cat /tmp/foo.txt
cat: /tmp/foo.txt: No such file or directory

$ docker run --rm 044e1532c690 cat /tmp/foo.txt
foo

$ docker run --rm 5bd8172529c1 cat /tmp/foo.txt
foo
bar

当然，你可能想要启动一个shell来探索文件系统并尝试命令:

$ docker run --rm -it 044e1532c690 sh      
/ # ls -l /tmp
total 4
-rw-r--r--    1 root     root             4 Mar  9 19:09 foo.txt
/ # cat /tmp/foo.txt 
foo

当其中一个Dockerfile命令失败时，你需要做的是寻找前一层的id，并在由该id创建的容器中运行shell:

docker run --rm -it <id_last_working_layer> bash -il

一旦进入容器:

尝试失败的命令，并重现问题然后修复该命令并测试它最后用fixed命令更新Dockerfile

如果你真的需要在实际失败的层中进行实验，而不是从最后一个工作层开始工作，请参阅Drew的回答。

2014-10-06 18:38:36

目前最新的docker-desktop，没有办法选择退出的新Buildkit，它还不支持调试(请参考在这个GitHub线程上的最新更新: https://github.com/moby/buildkit/issues/1472)。

找出Dockerfile中的哪一行出错了。添加到Dockerfile的顶部:FROM xxx作为调试添加一个额外的目标:FROM xxx作为下一个，就在失败命令的前一行(因为你不想构建那部分)。例子:

FROM xxx as debug
RUN echo "working command"

FROM xxx as next
RUN echoo "failing command"

运行docker build -f Dockerfile——target debug——tag debug。然后你可以调试容器:docker运行- debug /bin/sh

您可以通过按CTRL P + CTRL Q退出shell

如果你想使用docker compose build而不是docker build，可以在docker-compose中添加target: debug。Yml正在建设中。然后通过docker撰写运行xxxYourServiceNamexxx来启动容器，并使用其中之一:

上面的第二个答案是找出如何在容器中运行shell。或者在FROM xxx之前添加ENTRYPOINT /bin/sh作为Dockerfile中的下一行。

2021-09-01 13:27:15

调试构建步骤失败确实非常烦人。

一个Dockerfile，在# Run DB2静默安装行之后有一个示例:

#
# DB2 10.5 Client Dockerfile (Part 1)
#
# Requires
#   - DB2 10.5 Client for 64bit Linux ibm_data_server_runtime_client_linuxx64_v10.5.tar.gz
#   - Response file for DB2 10.5 Client for 64bit Linux db2rtcl_nr.rsp 
#
#
# Using Ubuntu 14.04 base image as the starting point.
FROM ubuntu:14.04

MAINTAINER David Carew <carew@us.ibm.com>

# DB2 prereqs (also installing sharutils package as we use the utility uuencode to generate password - all others are required for the DB2 Client) 
RUN dpkg --add-architecture i386 && apt-get update && apt-get install -y sharutils binutils libstdc++6:i386 libpam0g:i386 && ln -s /lib/i386-linux-gnu/libpam.so.0 /lib/libpam.so.0
RUN apt-get install -y libxml2


# Create user db2clnt
# Generate strong random password and allow sudo to root w/o password
#
RUN  \
   adduser --quiet --disabled-password -shell /bin/bash -home /home/db2clnt --gecos "DB2 Client" db2clnt && \
   echo db2clnt:`dd if=/dev/urandom bs=16 count=1 2>/dev/null | uuencode -| head -n 2 | grep -v begin | cut -b 2-10` | chgpasswd && \
   adduser db2clnt sudo && \
   echo '%sudo ALL=(ALL) NOPASSWD:ALL' >> /etc/sudoers

# Install DB2
RUN mkdir /install
# Copy DB2 tarball - ADD command will expand it automatically
ADD v10.5fp9_linuxx64_rtcl.tar.gz /install/
# Copy response file
COPY  db2rtcl_nr.rsp /install/
# Run  DB2 silent installer
RUN mkdir /logs
RUN (/install/rtcl/db2setup -t /logs/trace -l /logs/log -u /install/db2rtcl_nr.rsp && touch /install/done) || /bin/true
RUN test -f /install/done || (echo ERROR-------; echo install failed, see files in container /logs directory of the last container layer; echo run docker run '<last image id>' /bin/cat /logs/trace; echo ----------)
RUN test -f /install/done

# Clean up unwanted files
RUN rm -fr /install/rtcl

# Login as db2clnt user
CMD su - db2clnt

2017-11-26 11:09:35

如果您希望在命令失败之前立即检查状态，上面的答案是有效的。

但是，问题询问如何检查失败容器本身的状态。在我的情况下，失败的命令是一个需要几个小时的构建，所以在失败的命令之前倒回并再次运行它需要很长时间，而且没有太大帮助。

这里的解决方案是找到失败的容器:

$ docker ps -a
CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS                          PORTS               NAMES
6934ada98de6        42e0228751b3        "/bin/sh -c './utils/"   24 minutes ago      Exited (1) About a minute ago                       sleepy_bell

将其提交到一个图像:

$ docker commit 6934ada98de6
sha256:7015687976a478e0e94b60fa496d319cdf4ec847bcd612aecf869a72336e6b83

然后运行映像[如果需要，运行bash]:

$ docker run -it 7015687976a4 [bash -il]

现在您实际上看到的是构建失败时的状态，而不是运行导致失败的命令之前的状态。

2016-02-14 01:35:33

我如何检查一个失败的“docker构建”的文件系统?

推荐文章

最新文章

标签