问题标签 [uima]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1020 浏览

java - 使用多个模型进行实体提取——OpenNLP

我有两个模型文件:1)en-politicians-ner.bin 2)en-engineers-ner.bin

现在,有没有办法将这两个模型添加到单个 NameFinderME 对象中。使用这两个模型的解决方法可能是创建两个 NameFinderME 对象并对其进行迭代以提取实体,但我不想这样做。

0 投票
2 回答
1853 浏览

java - 用于运行 UIMA Ruta 脚本的 Java API

我是 UIMA Ruta 的新手。我使用脚本语言制作了一些注释器。我能够在 EclipseIDE 中运行它们。我想编写一个 JAVA API 来根据提供的输入自动运行脚本。

我正在使用 UIMA 文档中提供的相同示例项目。

到目前为止,我已经能够做到这一点

在使用默认 BasicEngine.xml 和输入文本文件运行上述代码段时。它给出了下面的堆栈跟踪

我被困住了。请帮忙。

编辑:

上面编写的 Java API 来自 uima 文档中的 uimaj-example。我在类路径中添加了一些 ruta jar 和通用 jar,之后文件执行良好。

0 投票
1 回答
352 浏览

java - DKPro Core Groovy 使用与 UIMA 安装

嘿,我是 groovy 的极端贵族,我刚刚发现它存在。我将它安装在 centos 5 系统上,这些是版本

然后我尝试运行在这里找到的一个简单脚本,而无需下载或安装或包含任何其他内容。运行失败,结果如下。我究竟做错了什么?

0 投票
0 回答
809 浏览

java - UIMA Ruta 与 Maven

我是 UIMA Ruta 的初学者。我按照这个将 Ruta 与 Maven 一起使用。我明白这一点,但我想做更多的事情。

下面是我运行这个例子的简单测试用例

这是我下面提到的脚本。

正如教程中所建议的那样。我在同一个 Eclipse 工作区中使用不同的 UIMA Ruta 项目(称为示例项目)制作了这个脚本。我将它作为 UIMA ruta 文件执行并获得了相应的描述符文件(TestAnnotator.xml)。我粘贴了相同的内容,只是将以下内容更改为

它最初指向 BasicTypeSystem.xml 文件。目前我能够构建它并执行此脚本,但生成的描述符文件(TestAnnotator.xml)使用相应 xml 中的本地文件路径。这些本地文件路径是以前 UIMA 项目(示例项目)中的文件夹。

当我尝试在上述路径中配置脚本文件的运行设置时,即在我的 Maven 项目中,配置无法在给定路径中找到脚本。

我应该如何在 Maven 项目中添加 Ruta 脚本的动态特性

请帮忙。

0 投票
1 回答
174 浏览

eclipse - UIMA 中的名称实体关系

我是 UIMA 的新手,目前我陷入了以下情况。

如何对从 UIMA 中的注释器获得的不同标记集进行分类和关联?就像 {John,Smith} 之类的个人实体令牌集名称和 {car,home} 之类的资产实体集。我想编写规则来分类,如下面的 xml。

提前感谢您的帮助..

0 投票
1 回答
452 浏览

java - 如何序列化 UIMA CAS 结合 Java 序列化

我有这些课程:

我想使用默认的 Java 序列化将每个 DocumentObj 作为文件转储到磁盘上。稍后它们也将被反序列化回 Java 对象。我知道我需要对 JCases 和句子注释进行一些特殊处理,因为它们不可序列化(现在我得到了NotSerializableException)。希望治疗可以尽可能少。

关于 JCas 的序列化并将其与 Java 序列化相结合,您如何建议这样做?

我正在使用 Java 1.6 和 UIMA 2.4.0 在 Windows 上工作。我对所有 JCases 和注释使用相同的类型系统和相同的 3 个视图。

0 投票
0 回答
814 浏览

java - 获取给定句子的下一个单词(或 POS)建议。自动完成一个句子

我必须在基于桌面的 java 应用程序中实现自动建议功能。要求如下:
用户将给出一个句子作为输入,我必须返回下一个可能Part-Of-Speech的建议。例如:
1. UserInput:Mike 想要 Suggestions:[阅读、玩耍、玩乐、学习、编码……等]
2. UserInput:Mike Suggestions:想要 [阅读、Naboo N-1 星际战斗机、马……等]

这是这个问题的副本,但这个问题是针对 Android 的。这可以通过使用一些 NLP 库(如 Stanford-NLP 或 OpenNLP 等)来完成吗?如果您需要更多详细信息,请告诉我。

谢谢!

0 投票
1 回答
148 浏览

spring - 想在 UIMA 框架中使用@Value(从属性文件中读取属性)

我有一个像 myProperties.properties 这样的属性文件。我想在UIMA JCasAnnotator_ImplBase 扩展类 中使用 spring 注释 @value 读取像 MAX_YEARS 这样的属性,如下所示。private @Value("${REQUIRED_COLUMNS}") String requiredColumns;

或者从 UIMA 框架中的属性文件读取属性的任何替代方法。提前致谢。纳拉辛哈。

0 投票
2 回答
2187 浏览

nlp - 一起使用 UIMA、Stanford Core NLP

UIMA 和 StanfordNLP 在操作管道之后生成输出,就像我们想要进行 POS 标记一样,因此在输入文本中首先完成标记化,然后进行 POS 标记。

我想使用 UIMA 的标记化并在 Stanford CoreNLP 的 POS 标记器中使用该标记。但是Stanford CoreNLP 的词性标注器需要在词性标注器之前运行分词器。

那么,是否可以在同一管道中使用不同的 API?是否可以同时使用 UIMA 标记器和斯坦福 CoreNLP?

0 投票
1 回答
475 浏览

pdf - 使用 UIMA 从 PDF 中提取数据

我有一堆 PDF,它们是公司的财务报告。这些财务报告采用表格形式,但大小、形状和格式各不相同。我想提取流动资产、负债和权益等信息并将它们保存在数据库中。

UIMA 可以允许我这样做吗?

我的计划是使用 Tika 将 PDF 转换为文本,然后使用 UIMA 对这些文本进行注释,并像 Current Asset、Current Liability 对这些注释进行索引。

谢谢你的手。