0

我有一个带有一些音标 (IPA) 的 PDF 文件,例如:ʤ、ə 等。如果我复制带有这些符号的文本,我会粘贴没有它们的文本。

Linux 薄荷 17.

4

1 回答 1

0

我建议使用apache tika。安装后使用此示例命令:

java -jar tika-app-1.0.jar ‐‐text < document.pdf > document.txt
于 2016-09-29T20:00:03.453 回答