问题标签 [uima]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
221 浏览

uima - UIMA RUTA:如何检查不匹配的要素注释对象的属性

我的注释具有同一文档中其他注释的功能。不过,主机和功能通常不会重叠。然后我想检查特征注释对象是否具有某些属性。尝试执行此操作时遇到两个问题:

首先,我无法访问深层功能,例如:

这不起作用,因为它似乎只将最后一个“.foo”解释为成员表达式,而之前的所有内容都解释为一种类型。

其次,在 DeepAnnotation.bar.foo 是注释对象的情况下,我似乎无法使用 IS() 等来检查其属性或将其分配给变量。是否有哪些条件接受不匹配的注释作为第二个参数的列表?对于我的用例,能够检查不匹配注释上的所有条件并可能将它们分配给变量,我将受益匪浅。如果这是错误的论坛,我会很乐意在其他地方提交功能请求。

谢谢!

0 投票
1 回答
650 浏览

uima - 从我自己的注释器中使用 Apache UIMA Ruta

我有一系列 UIMA Ruta 规则,我希望在我自己的 UIMA 注释器中运行这些规则。这在这里描述,但我无法让它工作:http ://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.integration

当我尝试运行注释器时(从 JUnit 测试中,我过去成功地与其他 UIMA 注释器一起使用过),我收到一个错误,告诉我 Ruta 基本注释类型之一(org.apache.uima.ruta .type.TokenSeed) 在 Java 代码中使用,但未在 XML 中定义。

我已将 Ruta 类型系统(BasicTypeSystem.xml 和 InternalTypeSystem.xml)的绝对路径添加到 descriptorPaths 参数中(详见此处:http://uima.apache.org/d/ruta-current/tools.ruta。 book.html#ugr.tools.ruta.ae.basic.parameter.descriptorPaths),但这似乎没有什么区别。

我查看了 Ruta 源代码,但无法弄清楚我哪里出错了。

有没有人成功地获得了一个 Ruta 脚本来从 UIMA 注释器中运行?你是如何设法让它工作的?

0 投票
1 回答
1318 浏览

uima - UIMA RUTA - 如何使用正则表达式和组进行查找和替换

RUTA 新手在这里。我正在使用 RUTA 处理文档,并且在开始注释之前要做很多规范化。我试图找到使用正则表达式和组在 RUTA 中的原始文档上查找和替换字符序列的最佳方法。本质上,我正在尝试了解如何在 RUTA 中执行类似于 String.replaceAll 的操作。

例如,在 Java 中,

但我想不出在 RUTA 中实现这一目标的简单方法。

谢谢

0 投票
1 回答
367 浏览

uima - 一个简单的 Ruta 注释器

我刚从 Ruta 开始,我想写一个这样的规则:

它会尝试匹配一个单词,例如 XYZ,当它碰到它时,它会将之前出现的文本分配给 Annotator CompanyDetails。

例如 :

这是一个包含我们感兴趣的短语的段落,它位于句子之后。LL, Inc. 特拉华州有限责任公司 (XYZ)。

运行脚本后,注释器 CompanyDetails 将包含以下字符串:LL, Inc. a Delaware limited liability company

0 投票
1 回答
130 浏览

java - RUTA 如何根据条件执行块

我有一个简单的 Ruta 问题。

在取自 tools.ruta.book.pdf 的示例中

段落{IF(keywordAmount > 5)->MARK(KeywordParagraph)};

是否可以执行之前定义的块或函数,而不是只执行一条语句?

0 投票
1 回答
310 浏览

uima - RUTA:如何解析日期-MM/dd/yyyy-并将其存储在一个复杂的结构中?

我想要的是解析日期的三个组成部分,将每个组成部分存储到自己的注释中,然后创建一个复杂的结构,代表整个日期。我尝试了以下方法,但没有奏效。

当我用类似“2014 年 12 月 31 日”的内容输入它时,虽然为三个 CommenceXXX 注释分配了值,但复杂的结构 CommDate 却没有。

0 投票
1 回答
292 浏览

uima - 如何运行 uima-text-segmenter 的示例?

我想调用 uima-text-segmenter 的 API https://code.google.com/p/uima-text-segmenter/source/browse/trunk/INSTALL?r=22来运行一个例子。但是我不知道如何调用API......自述文件说,

例如,谁能给我一些可以直接在 main func 中运行的代码?非常感谢!

0 投票
0 回答
106 浏览

java - Ruta:如何逐行读取文本文件,将每一行视为一个字符串

使用 Ruta 脚本,我尝试读取一个包含多行且每行包含多个单词的文本文件。

我使用了 WORDLIST 和 STRINGLIST,

WORDLIST personNameList = 'PersonName.txt';

STRINGLIST pList = {“约翰”,“保罗牛顿”};

但是两者虽然在一行只包含一个单词时工作得很好,但当一行包含多个单词时似乎不起作用。

0 投票
2 回答
789 浏览

xml - 使用 UIMA 从 XML 文件中提取文本

我正在使用 UIMA 为 XML 构建文本提取器。由于我是 UIMA 框架的初学者,我想知道如何去做。

我知道 UIMA 可以对文件的特定部分进行注释,但是如何有效地提取信息?任何帮助表示赞赏。

谢谢,贾廷

0 投票
1 回答
473 浏览

uima - UIMA RUTA - 沙发映射 - 聚合管道

这是关于问题的。

UIMA RUTA - 如何使用正则表达式和组进行查找和替换

我正在尝试按照建议设置沙发映射。我有一个包含多个 AE 的聚合 AE,并尝试在此管道中合并 2 个 RUTA AE/脚本。两个 RUTA AE(和相关脚本)都负责使用修饰符进行 REGEXP 查找和替换。第二个 AE 取决于第一个 AE 的输出。我必须配置修改器的第二个 AE 的输出视图,否则我会收到“沙发数据已设置”异常。

本质上,我无法将一个AE的输出编织为另一个AE的输入。

我的设置类似于下面,

这是聚合 AE 代码

需要注意的几点,

  • 所有三个 RUTA AE(step1、step2、normalizer)都使用 RUTA Modifier
  • 上述设置引发异常“找不到名为 norm_2_out 的沙发FS”。- 这发生在第 2 步之后。
  • 我试图将“norm_2_out”切换为“已修改”作为规范化器的输入沙发,这似乎将处理移至管道中的下一步(规范化器),但这会引发异常“沙发功能 setLocalSofaData() 的数据有已经设置好了。” 在 org.apache.uima.ruta.engine.RutaModifier.process(RutaModifier.java:107)
  • 我尝试使用 RUTA 2.2.0(快照),结果相同

由于我对 UIMA 和 RUTA 都比较陌生,因此不确定我是否做错了什么,或者我是否遇到了限制。

顺便说一句,我正在使用 RUTA 2.1.0

谢谢