Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个带有一些音标 (IPA) 的 PDF 文件,例如:ʤ、ə 等。如果我复制带有这些符号的文本,我会粘贴没有它们的文本。
Linux 薄荷 17.
我建议使用apache tika。安装后使用此示例命令:
java -jar tika-app-1.0.jar ‐‐text < document.pdf > document.txt