我用子进程模块调用不同的进程。然而,我有一个问题。

在以下代码中:

callProcess = subprocess.Popen(['ls', '-l'], shell=True)

and

callProcess = subprocess.Popen(['ls', '-l']) # without shell

这两个工作。在阅读了文档之后,我知道shell=True意味着通过shell执行代码。也就是说,如果不存在,这个过程将直接启动。

那么对于我的情况,我应该选择什么呢?我需要运行一个进程并获得它的输出。从壳内或者壳外调用有什么好处呢?


当前回答

不通过shell调用的好处是,您不会调用一个“神秘程序”。在POSIX上,环境变量SHELL控制作为“SHELL”调用的二进制文件。在Windows上,没有bourne shell的后代,只有cmd.exe。

因此调用shell调用用户选择的程序,并且依赖于平台。一般来说,避免通过shell调用。

通过shell调用确实允许您根据shell的通常机制展开环境变量和文件glob。在POSIX系统上,shell将文件glob扩展为一个文件列表。在Windows上,一个文件glob(例如,“*.*”)不会被shell扩展(但是命令行上的环境变量会被cmd.exe扩展)。

如果您想要环境变量扩展和文件glob,请研究1992-ish对通过shell执行子程序调用的网络服务的ILS攻击。示例包括涉及ILS的各种sendmail后门。

总之,使用shell=False。

其他回答

不通过shell调用的好处是,您不会调用一个“神秘程序”。在POSIX上,环境变量SHELL控制作为“SHELL”调用的二进制文件。在Windows上,没有bourne shell的后代,只有cmd.exe。

因此调用shell调用用户选择的程序,并且依赖于平台。一般来说,避免通过shell调用。

通过shell调用确实允许您根据shell的通常机制展开环境变量和文件glob。在POSIX系统上,shell将文件glob扩展为一个文件列表。在Windows上,一个文件glob(例如,“*.*”)不会被shell扩展(但是命令行上的环境变量会被cmd.exe扩展)。

如果您想要环境变量扩展和文件glob,请研究1992-ish对通过shell执行子程序调用的网络服务的ILS攻击。示例包括涉及ILS的各种sendmail后门。

总之,使用shell=False。

这里展示了一个Shell=True可能出错的示例

>>> from subprocess import call
>>> filename = input("What file would you like to display?\n")
What file would you like to display?
non_existent; rm -rf / # THIS WILL DELETE EVERYTHING IN ROOT PARTITION!!!
>>> call("cat " + filename, shell=True) # Uh-oh. This will end badly...

查看这里的文档:

上面的回答是正确的,但不够直接。 让我们使用ps命令看看会发生什么。

import time
import subprocess

s = subprocess.Popen(["sleep 100"], shell=True)
print("start")
print(s.pid)
time.sleep(5)
s.kill()
print("finish")

运行它,然后显示

start
832758
finish

你可以在完成前使用ps -auxf > 1,然后在完成后使用ps -auxf > 2。这是输出

1

cy         71209  0.0  0.0   9184  4580 pts/6    Ss   Oct20   0:00  |       \_ /bin/bash
cy        832757  0.2  0.0  13324  9600 pts/6    S+   19:31   0:00  |       |   \_ python /home/cy/Desktop/test.py
cy        832758  0.0  0.0   2616   612 pts/6    S+   19:31   0:00  |       |       \_ /bin/sh -c sleep 100
cy        832759  0.0  0.0   5448   532 pts/6    S+   19:31   0:00  |       |           \_ sleep 100

看到了吗?而不是直接运行sleep 100。它实际上运行/bin/sh。它输出的pid实际上是/bin/sh的pid。如果你调用s.kill(),它会杀死/bin/sh,但sleep仍然存在。

2

cy         69369  0.0  0.0 533764  8160 ?        Ssl  Oct20   0:12  \_ /usr/libexec/xdg-desktop-portal
cy         69411  0.0  0.0 491652 14856 ?        Ssl  Oct20   0:04  \_ /usr/libexec/xdg-desktop-portal-gtk
cy        832646  0.0  0.0   5448   596 pts/6    S    19:30   0:00  \_ sleep 100

下一个问题是,/bin/sh能做什么?每个linux用户都知道它,听过它,并使用它。但我敢打赌,有很多人并不真正理解什么是壳。也许你也听说过/bin/bash,它们很相似。

shell的一个显著功能就是方便用户运行linux应用程序。由于sh或bash等shell程序,可以直接使用ls等命令,而不是/usr/bin/ls它将搜索ls的位置并为您运行它。

另一个函数是它将$后面的字符串解释为环境变量。您可以比较这两个python脚本来自己找出答案。

subprocess.call(["echo $PATH"], shell=True)
subprocess.call(["echo", "$PATH"])

最重要的是,它使linux命令可以以脚本的形式运行。如if else是由shell引入的。它不是原生的Linux命令

>>> import subprocess
>>> subprocess.call('echo $HOME')
Traceback (most recent call last):
...
OSError: [Errno 2] No such file or directory
>>>
>>> subprocess.call('echo $HOME', shell=True)
/user/khong
0

将shell参数设置为真值会导致子进程生成一个中间shell进程,并告诉它运行该命令。换句话说,使用中间shell意味着在运行命令之前处理命令字符串中的变量、glob模式和其他特殊shell特性。在本例中,$HOME在echo命令之前被处理。实际上,这就是shell扩展命令的情况,而ls -l命令被认为是一个简单的命令。

源:子进程模块

通过shell执行程序意味着传递给程序的所有用户输入都将根据所调用shell的语法和语义规则进行解释。在最好的情况下,这只会给用户带来不便,因为用户必须遵守这些规则。例如,包含特殊shell字符(如引号或空格)的路径必须转义。在最坏的情况下,它会导致安全泄漏,因为用户可以执行任意程序。

shell=True有时可以方便地使用特定的shell特性,如分词或参数展开。然而,如果需要这样的特性,请使用提供给您的其他模块(例如os.path.expandvars()用于参数展开或shlex用于单词分割)。这意味着更多的工作,但避免了其他问题。

简而言之:无论如何要避免shell=True。