我正在尝试使用 Wand(Imagemagick 绑定 python)将 PDF 的第一页(包含图像和文本)转换为图像。输出是这样的!!!http://i.stack.imgur.com/OdCMZ.jpg 这里的文字不是图像的一部分。图像没有完全跨越。它只显示在一半上。
如果 PDF 没有任何文本,它完全像这样跨越.. http://i.stack.imgur.com/NmcjO.jpg 这里的文本是图像的一部分
我不明白问题出在文本还是库上。第一个图像怎么可能也完全跨越。
我正在尝试使用 Wand(Imagemagick 绑定 python)将 PDF 的第一页(包含图像和文本)转换为图像。输出是这样的!!!http://i.stack.imgur.com/OdCMZ.jpg 这里的文字不是图像的一部分。图像没有完全跨越。它只显示在一半上。
如果 PDF 没有任何文本,它完全像这样跨越.. http://i.stack.imgur.com/NmcjO.jpg 这里的文本是图像的一部分
我不明白问题出在文本还是库上。第一个图像怎么可能也完全跨越。
当 pdf 转换时,imagemagick 使用Ghostscript。如果你想要结果只有内部边框内容。您可以使用“-dUseCropBox”选项。
import subprocess
cmd = [
'gs',
'-q',
'-dQUIET',
'-dSAFER',
'-dBATCH',
'-dNOPAUSE',
'-dNOPROMPT',
'-dMaxBitmap=500000000',
'-dAlignToPixels=0',
'-dGridFitTT=2',
'-dUseCropBox',
'-dTextAlphaBits=4',
'-dGraphicsAlphaBits=4',
'-r{0}x{0}'.format(200),
'-sDEVICE=jpeg',
'-dJPEGQ=100',
'-sOutputFile=%05d.jpg',
'test.pdf'
]
subprocess.call(cmd)