0

我正在尝试使用 Wand(Imagemagick 绑定 python)将 PDF 的第一页(包含图像和文本)转换为图像。输出是这样的!!!http://i.stack.imgur.com/OdCMZ.jpg 这里的文字不是图像的一部分。图像没有完全跨越。它只显示在一半上。

如果 PDF 没有任何文本,它完全像这样跨越.. http://i.stack.imgur.com/NmcjO.jpg 这里的文本是图像的一部分

我不明白问题出在文本还是库上。第一个图像怎么可能也完全跨越。

4

1 回答 1

0

当 pdf 转换时,imagemagick 使用Ghostscript。如果你想要结果只有内部边框内容。您可以使用“-dUseCropBox”选项。

import subprocess
cmd = [
    'gs',
    '-q',
    '-dQUIET',
    '-dSAFER',
    '-dBATCH',
    '-dNOPAUSE',
    '-dNOPROMPT',
    '-dMaxBitmap=500000000',
    '-dAlignToPixels=0',
    '-dGridFitTT=2',
    '-dUseCropBox',
    '-dTextAlphaBits=4',
    '-dGraphicsAlphaBits=4',
    '-r{0}x{0}'.format(200),
    '-sDEVICE=jpeg',
    '-dJPEGQ=100',
    '-sOutputFile=%05d.jpg',
    'test.pdf'
]
subprocess.call(cmd)
于 2015-03-22T09:48:12.787 回答