“uima”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

221 浏览

uima - UIMA RUTA：如何检查不匹配的要素注释对象的属性

我的注释具有同一文档中其他注释的功能。不过，主机和功能通常不会重叠。然后我想检查特征注释对象是否具有某些属性。尝试执行此操作时遇到两个问题：

首先，我无法访问深层功能，例如：

这不起作用，因为它似乎只将最后一个“.foo”解释为成员表达式，而之前的所有内容都解释为一种类型。

其次，在 DeepAnnotation.bar.foo 是注释对象的情况下，我似乎无法使用 IS() 等来检查其属性或将其分配给变量。是否有哪些条件接受不匹配的注释作为第二个参数的列表？对于我的用例，能够检查不匹配注释上的所有条件并可能将它们分配给变量，我将受益匪浅。如果这是错误的论坛，我会很乐意在其他地方提交功能请求。

谢谢！

uima ruta

2014-03-06T16:43:04.783

0 投票

1 回答

650 浏览

uima - 从我自己的注释器中使用 Apache UIMA Ruta

我有一系列 UIMA Ruta 规则，我希望在我自己的 UIMA 注释器中运行这些规则。这在这里描述，但我无法让它工作：http ://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.integration

当我尝试运行注释器时（从 JUnit 测试中，我过去成功地与其他 UIMA 注释器一起使用过），我收到一个错误，告诉我 Ruta 基本注释类型之一（org.apache.uima.ruta .type.TokenSeed) 在 Java 代码中使用，但未在 XML 中定义。

我已将 Ruta 类型系统（BasicTypeSystem.xml 和 InternalTypeSystem.xml）的绝对路径添加到 descriptorPaths 参数中（详见此处：http://uima.apache.org/d/ruta-current/tools.ruta。 book.html#ugr.tools.ruta.ae.basic.parameter.descriptorPaths），但这似乎没有什么区别。

我查看了 Ruta 源代码，但无法弄清楚我哪里出错了。

有没有人成功地获得了一个 Ruta 脚本来从 UIMA 注释器中运行？你是如何设法让它工作的？

uima ruta

2014-03-18T12:32:41.933

0 投票

1 回答

1318 浏览

uima - UIMA RUTA - 如何使用正则表达式和组进行查找和替换

RUTA 新手在这里。我正在使用 RUTA 处理文档，并且在开始注释之前要做很多规范化。我试图找到使用正则表达式和组在 RUTA 中的原始文档上查找和替换字符序列的最佳方法。本质上，我正在尝试了解如何在 RUTA 中执行类似于 String.replaceAll 的操作。

例如，在 Java 中，

但我想不出在 RUTA 中实现这一目标的简单方法。

谢谢

uima ruta

2014-03-22T13:15:44.280

0 投票

1 回答

367 浏览

uima - 一个简单的 Ruta 注释器

我刚从 Ruta 开始，我想写一个这样的规则：

它会尝试匹配一个单词，例如 XYZ，当它碰到它时，它会将之前出现的文本分配给 Annotator CompanyDetails。

例如：

这是一个包含我们感兴趣的短语的段落，它位于句子之后。LL, Inc. 特拉华州有限责任公司 (XYZ)。

运行脚本后，注释器 CompanyDetails 将包含以下字符串：LL, Inc. a Delaware limited liability company

uima ruta

2014-03-28T10:27:15.247

0 投票

1 回答

130 浏览

java - RUTA 如何根据条件执行块

我有一个简单的 Ruta 问题。

在取自 tools.ruta.book.pdf 的示例中

段落{IF(keywordAmount > 5)->MARK(KeywordParagraph)};

是否可以执行之前定义的块或函数，而不是只执行一条语句？

java uima ruta

2014-03-29T16:43:45.277

0 投票

1 回答

310 浏览

uima - RUTA：如何解析日期-MM/dd/yyyy-并将其存储在一个复杂的结构中？

我想要的是解析日期的三个组成部分，将每个组成部分存储到自己的注释中，然后创建一个复杂的结构，代表整个日期。我尝试了以下方法，但没有奏效。

当我用类似“2014 年 12 月 31 日”的内容输入它时，虽然为三个 CommenceXXX 注释分配了值，但复杂的结构 CommDate 却没有。

uima ruta

2014-03-31T12:53:51.453

0 投票

1 回答

292 浏览

uima - 如何运行 uima-text-segmenter 的示例？

我想调用 uima-text-segmenter 的 API https://code.google.com/p/uima-text-segmenter/source/browse/trunk/INSTALL?r=22来运行一个例子。但是我不知道如何调用API......自述文件说，

例如，谁能给我一些可以直接在 main func 中运行的代码？非常感谢！

uima text-segmentation

2014-04-01T04:01:46.317

0 投票

0 回答

106 浏览

java - Ruta：如何逐行读取文本文件，将每一行视为一个字符串

使用 Ruta 脚本，我尝试读取一个包含多行且每行包含多个单词的文本文件。

我使用了 WORDLIST 和 STRINGLIST，

WORDLIST personNameList = 'PersonName.txt';

STRINGLIST pList = {“约翰”，“保罗牛顿”};

但是两者虽然在一行只包含一个单词时工作得很好，但当一行包含多个单词时似乎不起作用。

java uima ruta

2014-04-01T14:15:30.770

0 投票

2 回答

789 浏览

xml - 使用 UIMA 从 XML 文件中提取文本

我正在使用 UIMA 为 XML 构建文本提取器。由于我是 UIMA 框架的初学者，我想知道如何去做。

我知道 UIMA 可以对文件的特定部分进行注释，但是如何有效地提取信息？任何帮助表示赞赏。

谢谢，贾廷

xml uima

2014-04-03T11:40:46.557

0 投票

1 回答

473 浏览

uima - UIMA RUTA - 沙发映射 - 聚合管道

这是关于问题的。

UIMA RUTA - 如何使用正则表达式和组进行查找和替换

我正在尝试按照建议设置沙发映射。我有一个包含多个 AE 的聚合 AE，并尝试在此管道中合并 2 个 RUTA AE/脚本。两个 RUTA AE（和相关脚本）都负责使用修饰符进行 REGEXP 查找和替换。第二个 AE 取决于第一个 AE 的输出。我必须配置修改器的第二个 AE 的输出视图，否则我会收到“沙发数据已设置”异常。

本质上，我无法将一个AE的输出编织为另一个AE的输入。

我的设置类似于下面，

这是聚合 AE 代码

需要注意的几点，

所有三个 RUTA AE（step1、step2、normalizer）都使用 RUTA Modifier
上述设置引发异常“找不到名为 norm_2_out 的沙发FS”。- 这发生在第 2 步之后。
我试图将“norm_2_out”切换为“已修改”作为规范化器的输入沙发，这似乎将处理移至管道中的下一步（规范化器），但这会引发异常“沙发功能 setLocalSofaData() 的数据有已经设置好了。” 在 org.apache.uima.ruta.engine.RutaModifier.process（RutaModifier.java:107）
我尝试使用 RUTA 2.2.0（快照），结果相同

由于我对 UIMA 和 RUTA 都比较陌生，因此不确定我是否做错了什么，或者我是否遇到了限制。

顺便说一句，我正在使用 RUTA 2.1.0

谢谢

uima ruta

2014-04-11T03:07:25.477

问题标签 [uima]

Reference