Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一堆 PDF,它们是公司的财务报告。这些财务报告采用表格形式,但大小、形状和格式各不相同。我想提取流动资产、负债和权益等信息并将它们保存在数据库中。
UIMA 可以允许我这样做吗?
我的计划是使用 Tika 将 PDF 转换为文本,然后使用 UIMA 对这些文本进行注释,并像 Current Asset、Current Liability 对这些注释进行索引。
谢谢你的手。
是的,这是 UIMA 的一个非常好的用例。几点建议: