18

我正在使用子进程模块中的Popen函数来执行命令行工具:

subprocess.Popen(args, bufsize=0, executable=None, stdin=None, stdout=None, stderr=None, preexec_fn=None, close_fds=False, shell=False, cwd=None, env=None, universal_newlines=False, startupinfo=None, creationflags=0)

我正在使用的工具需要一个然后处理的文件列表。在某些情况下,此文件列表可能很长。有没有办法找到 args 参数的最大长度?将大量文件传递给该工具时,我收到以下错误:

Traceback (most recent call last):
  File "dump_output_sopuids.py", line 68, in <module>
    uid_map = create_sopuid_to_path_dict_dcmdump(dicom_files)
  File "dump_output_sopuids.py", line 41, in create_sopuid_to_path_dict_dcmdump
    dcmdump_output = subprocess.Popen(cmd,stdout=subprocess.PIPE).communicate(0)[0]
  File "c:\python26\lib\subprocess.py", line 621, in __init__
    errread, errwrite)
  File "c:\python26\lib\subprocess.py", line 830, in _execute_child
    startupinfo)
WindowsError: [Error 206] The filename or extension is too long

有没有找到这个最大长度的通用方法?我在 msdn 上找到了以下文章:命令提示符 (Cmd.exe) 命令行字符串限制,但我不想在值中硬编码。我宁愿在运行时获取值以将命令分解为多个调用。

我在 Windows XP 64 上使用 Python 2.6。

编辑:添加代码示例

paths = ['file1.dat','file2.dat',...,'fileX.dat']
cmd = ['process_file.exe','+p'] + paths
cmd_output = subprocess.Popen(cmd,stdout=subprocess.PIPE).communicate(0)[0]

出现问题是因为paths列表中的每个实际条目通常是一个非常长的文件路径,并且有数千个。

我不介意将命令分解为对process_file.exe. 我正在寻找一种通用方法来获取 args 的最大长度,以便我知道每次运行要发送多少条路径。

4

2 回答 2

12

如果您传递 shell=False,则 Cmd.exe 不会发挥作用。

在 Windows 上,子进程将使用 Win32 API 中的 CreateProcess 函数来创建新进程。此函数的文档指出,第二个参数(由 subprocess.list2cmdline 构建)的最大长度为 32,768 个字符,包括 Unicode 终止空字符。如果 lpApplicationName 为 NULL,则 lpCommandLine 的模块名称部分仅限于 MAX_PATH 字符。

鉴于您的示例,我建议为可执行文件 (args[0]) 提供一个值,并将 args 用作第一个参数。如果我对 CreateProcess 文档和子流程模块源代码的阅读是正确的,那么这应该可以解决您的问题。

[编辑:在我拿到 Windows 机器并进行测试后删除了 args[1:] 位]

于 2010-03-04T18:29:16.873 回答
2

对于类 Unix 平台,内核常量ARG_MAXPOSIX 定义。它至少需要 4096 字节,但在现代系统上,它可能是 1 兆字节或更多。

在许多系统上,getconf ARG_MAX会在 shell 提示符处显示其值。

shell 实用程序xargs可以方便地拆分长命令行。例如,如果

python myscript.py *

在大目录中失败,因为文件列表扩展为字节长度超过的值ARG_MAX,您可以使用类似的方法解决它

printf '%s\0' * |
xargs -0 python myscript.py

(该选项-0是 GNU 扩展,但实际上是唯一完全安全的方法来明确传递可能包含换行符、引用字符等的文件名列表。)也许还探索

find . -maxdepth 1 -type f -exec python myscript.py {} +

相反,要将一长串参数传递给subprocess.Popen()朋友,比如

p = subprocess.Popen(['xargs', '-0', 'command'],
    stdin=subprocess.PIPE, stdout=subprocess.PIPE,
    stderr=subprocess.PIPE)
out, err = p.communicate('\0'.join(long_long_argument_list))

...在大多数情况下,您可能应该避免使用 rawPopen()并让包装器像run()check_call()完成大部分工作一样:

r = subprocess.run(['xargs', '-0', 'command'],
    input='\0'.join(long_long_argument_list),
    universal_newlines=True)
out = r.stdout

subprocess.run()在 3.7+ 中支持text=True作为universal_newlines=True. 比 3.5 更旧的 Python 版本没有run,因此您需要回退到旧的遗留函数check_output,check_call或 (很少) call

于 2019-03-02T14:51:44.787 回答