python subprocess库

Published by rcdfrd on 2022-05-24

subprocess 模块主要用于创建子进程，并连接它们的输入、输出和错误管道，获取它们的返回状态。通俗地说就是通过这个模块，你可以在 Python 的代码里执行操作系统级别的命令，比如“ipconfig”、“du -sh”等等。subprocess 模块替代了一些老的模块和函数，比如：

os.system
os.spawn*

subprocess 过去版本中的 call()，check_call() 和 check_output() 已经被 run() 方法取代了。run() 方法为 3.5 版本新增。

大多数情况下，推荐使用 run() 方法调用子进程，执行操作系统命令。在更高级的使用场景，你还可以使用 Popen 接口。其实 run() 方法在底层调用的就是 Popen 接口。

subprocess.run(args, *, stdin=None, input=None, stdout=None, stderr=None, shell=False, timeout=None, check=False, encoding=None, errors=None)

功能：执行 args 参数所表示的命令，等待命令结束，并返回一个 CompletedProcess 类型对象。

注意，run()方法返回的不是我们想要的执行结果或相关信息，而是一个 CompletedProcess 类型对象。

上面参数表里展示的只是一些常用的，真实情况还有很多。

args：表示要执行的命令。必须是一个字符串，字符串参数列表。

stdin、stdout 和 stderr：子进程的标准输入、输出和错误。其值可以是 subprocess.PIPE、subprocess.DEVNULL、一个已经存在的文件描述符、已经打开的文件对象或者 None。subprocess.PIPE 表示为子进程创建新的管道。subprocess.DEVNULL 表示使用 os.devnull。默认使用的是 None，表示什么都不做。另外，stderr 可以合并到 stdout 里一起输出。

timeout：设置命令超时时间。如果命令执行时间超时，子进程将被杀死，并弹出 TimeoutExpired 异常。

check：如果该参数设置为 True，并且进程退出状态码不是 0，则弹出 CalledProcessError 异常。

encoding:如果指定了该参数，则 stdin、stdout 和 stderr 可以接收字符串数据，并以该编码方式编码。否则只接收 bytes 类型的数据。

shell：如果该参数为 True，将通过操作系统的 shell 执行指定的命令。

看下面的例子：

>>> subprocess.run(["ls", "-l"])  # 没有对输出进行捕获
CompletedProcess(args=['ls', '-l'], returncode=0)

>>> subprocess.run("exit 1", shell=True, check=True)
Traceback (most recent call last):
  ...
subprocess.CalledProcessError: Command 'exit 1' returned non-zero exit status 1

>>> subprocess.run(["ls", "-l", "/dev/null"], stdout=subprocess.PIPE)
CompletedProcess(args=['ls', '-l', '/dev/null'], returncode=0,
stdout=b'crw-rw-rw- 1 root root 1, 3 Jan 23 16:23 /dev/null\n')

>>> subprocess.run("python --version", stdout=subprocess.PIPE)
CompletedProcess(args='python --version', returncode=0, stdout=b'Python 3.6.1\r\n')

>>>s= subprocess.run("ipconfig", stdout=subprocess.PIPE)    # 捕获输出
>>>print(s.stdout.decode("GBK"))

class subprocess.CompletedProcess

run()方法的返回值，表示一个进程结束了。CompletedProcess 类有下面这些属性：

args 启动进程的参数，通常是个列表或字符串。
returncode 进程结束状态返回码。0 表示成功状态。
stdout 获取子进程的 stdout。通常为 bytes 类型序列，None 表示没有捕获值。如果你在调用 run()方法时，设置了参数 stderr=subprocess.STDOUT，则错误信息会和 stdout 一起输出，此时 stderr 的值是 None。
stderr 获取子进程的错误信息。通常为 bytes 类型序列，None 表示没有捕获值。
check_returncode() 用于检查返回码。如果返回状态码不为零，弹出 CalledProcessError 异常。

subprocess.DEVNULL

一个特殊值，用于传递给 stdout、stdin 和 stderr 参数。表示使用 os.devnull 作为参数值。

subprocess.PIPE

管道，可传递给 stdout、stdin 和 stderr 参数。

subprocess.STDOUT

特殊值，可传递给 stderr 参数，表示 stdout 和 stderr 合并输出。

args 与 shell 参数

args 参数可以接收一个类似 'du -sh' 的字符串，也可以传递一个类似 ['du', '-sh'] 的字符串分割列表。shell 参数默认为 False，设置为 True 的时候表示使用操作系统的 shell 执行命令。下面我们来看一下两者的组合结果。

先到 Linux 系统下试一试：

In [14]: subprocess.run('du -sh')
---------------------------------------------------------------------------
FileNotFoundError                         Traceback (most recent call last)
......
FileNotFoundError: [Errno 2] No such file or directory: 'du -sh'

In [15]: subprocess.run('du -sh', shell=True)
175M    .
Out[15]: CompletedProcess(args='du -sh', returncode=0)

可见，在 Linux 环境下，当 args 是个字符串时，必须指定 shell=True。成功执行后，返回一个 CompletedProcess 对象。

In [16]: subprocess.run(['du', '-sh'], shell=True)
.....大量的数据
4   ./文档
179100  .
Out[16]: CompletedProcess(args=['du', '-sh'], returncode=0)

In [17]: subprocess.run(['du', '-sh'])
175M    .
Out[17]: CompletedProcess(args=['du', '-sh'], returncode=0)

可见，当 args 是一个 ['du', '-sh'] 列表，并且 shell=True 的时候，参数被忽略了，只执行不带参数的‘du’命令。

总结：Linux 中，当 args 是个字符串是，请设置 shell=True，当 args 是个列表的时候，shell 保持默认的 False。

下面，到 windows 系统中测试一下，分别独立执行下面的语句：

ret = subprocess.run('dir d:\\')
ret = subprocess.run('dir d:\\', shell=True)
ret = subprocess.run(['dir', 'd:\\'])
ret = subprocess.run(['dir', 'd:\\'], shell=True)
ret = subprocess.run('ipconfig /all')
ret = subprocess.run('ipconfig /all', shell=True)
ret = subprocess.run(['ipconfig', '/all'])
ret = subprocess.run(['ipconfig', '/all'], shell=True)

结果表明，在 windows 中，args 和 shell 参数组合比较复杂，根据命令的不同有不同的情况。建议 shell 设置为 True。

获取执行结果

run()方法返回的是一个 CompletedProcess 类型对象，不能直接获取我们通常想要的结果。要获取命令执行的结果或者信息，在调用 run()方法的时候，请指定 stdout=subprocess.PIPE。

>>> ret = subprocess.run('dir', shell=True)
>>> ret
CompletedProcess(args='dir', returncode=0)


>>> ret = subprocess.run('dir', shell=True, stdout=subprocess.PIPE)
>>> ret
CompletedProcess(args='dir', returncode=0, stdout=b' \xc7\xfd\xb6\xaf\xc6\xf7 ......')

>>> ret.stdout
b' \xc7\xfd\xb6\xaf\xc6\xf7 C \xd6\xd0\xb5\xc4\xbe\xed\xca\xc7 ......'

>>> ret.stdout.decode('gbk')
' 驱动器 C 中的卷是 系统\r\n 卷的序列号是 C038-3181\r\n\r\n C:\\Python36 的目录\r\n\r\n2017/08/11  10:14   ...... 15,275,020,288 可用字节\r\n'

从例子中我们可以看到，如果不设置 stdout=subprocess.PIPE，那么在返回值 CompletedProcess(args='dir', returncode=0) 中不会包含 stdout 属性。反之，则会将结果以 bytes 类型保存在 ret.stdout 属性中。注意：中文 windows 系统使用 GBK 编码，需要 decode('gbk') 才可以看见熟悉的中文。

交互式输入

并不是所有的操作系统命令都像‘dir’或者‘ipconfig’那样单纯地返回执行结果，还有很多像‘python’这种交互式的命令，你要输入点什么，然后它返回执行的结果。使用 run()方法怎么向 stdin 里输入？

这样？

import subprocess

ret = subprocess.run("python", stdin=subprocess.PIPE, stdout=subprocess.PIPE,shell=True)
ret.stdin = "print('haha')"     # 错误的用法
print(ret)

这样是不行的，ret 作为一个 CompletedProcess 对象，根本没有 stdin 属性。那怎么办呢？前面说了，run()方法的 stdin 参数可以接收一个文件句柄。比如在一个 1.txt 文件中写入 print('i like Python')。然后参考下面的使用方法：

import subprocess

fd = open("d:\\1.txt")
ret = subprocess.run("python", stdin=fd, stdout=subprocess.PIPE,shell=True)
print(ret.stdout)
fd.close()

这样做，虽然可以达到目的，但是很不方便，也不是以代码驱动的方式。这个时候，我们可以使用 Popen 类。

class subprocess.Popen()

用法和参数与 run()方法基本类同，但是它的返回值是一个 Popen 对象，而不是 CompletedProcess 对象。

>>> ret = subprocess.Popen("dir", shell=True)
>>> type(ret)
<class 'subprocess.Popen'>
>>> ret
<subprocess.Popen object at 0x0000000002B17668>

Popen 对象的 stdin、stdout 和 stderr 是三个文件句柄，可以像文件那样进行读写操作。

>>>s = subprocess.Popen("ipconfig", stdout=subprocess.PIPE, shell=True)
>>>print(s.stdout.read().decode("GBK"))

要实现前面的‘python’命令功能，可以按下面的例子操作：

import subprocess

s = subprocess.Popen("python", stdout=subprocess.PIPE, stdin=subprocess.PIPE, shell=True)
s.stdin.write(b"import os\n")
s.stdin.write(b"print(os.environ)")
s.stdin.close()

out = s.stdout.read().decode("GBK")
s.stdout.close()
print(out)

通过 s.stdin.write() 可以输入数据，而 s.stdout.read() 则能输出数据。