1

给定一个 PDF 文档,是否可以生成 XSL-FO (FOP) 模板?

显然,这将是一次性的事情 - 生成的模板只是创建适当模板以提取适当数据的起点。

对我来说,这样做的理想工具是基于 Java 的工具,并且应该可以从命令行或通过 ANT 任务执行。如果做不到这一点,它将是在 Linux 和 MacOS X 上运行的东西。

4

1 回答 1

2

我知道没有这样的工具。没有文档结构信息的 PDF(标记的 PDF)很像扫描的页面。没有语义。你甚至不能确定你能猜出段落开始或结束的正确位置。如果您有标记的 PDF,您可能会根据文档结构中的详细程度获得更进一步的信息。但我敢肯定,那样你永远不会得到令人满意的结果。IMO,您学习 XSLT 并手动重新创建文档模板(即样式表)要快得多。这为您提供了良好的代码可读性、更好的语义和更好的机会来分解相似文档类型之间的共同元素。

于 2010-06-02T07:31:48.020 回答