问题标签 [uima]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
uima - UIMA RUTA:如何检查不匹配的要素注释对象的属性
我的注释具有同一文档中其他注释的功能。不过,主机和功能通常不会重叠。然后我想检查特征注释对象是否具有某些属性。尝试执行此操作时遇到两个问题:
首先,我无法访问深层功能,例如:
这不起作用,因为它似乎只将最后一个“.foo”解释为成员表达式,而之前的所有内容都解释为一种类型。
其次,在 DeepAnnotation.bar.foo 是注释对象的情况下,我似乎无法使用 IS() 等来检查其属性或将其分配给变量。是否有哪些条件接受不匹配的注释作为第二个参数的列表?对于我的用例,能够检查不匹配注释上的所有条件并可能将它们分配给变量,我将受益匪浅。如果这是错误的论坛,我会很乐意在其他地方提交功能请求。
谢谢!
uima - 从我自己的注释器中使用 Apache UIMA Ruta
我有一系列 UIMA Ruta 规则,我希望在我自己的 UIMA 注释器中运行这些规则。这在这里描述,但我无法让它工作:http ://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.integration
当我尝试运行注释器时(从 JUnit 测试中,我过去成功地与其他 UIMA 注释器一起使用过),我收到一个错误,告诉我 Ruta 基本注释类型之一(org.apache.uima.ruta .type.TokenSeed) 在 Java 代码中使用,但未在 XML 中定义。
我已将 Ruta 类型系统(BasicTypeSystem.xml 和 InternalTypeSystem.xml)的绝对路径添加到 descriptorPaths 参数中(详见此处:http://uima.apache.org/d/ruta-current/tools.ruta。 book.html#ugr.tools.ruta.ae.basic.parameter.descriptorPaths),但这似乎没有什么区别。
我查看了 Ruta 源代码,但无法弄清楚我哪里出错了。
有没有人成功地获得了一个 Ruta 脚本来从 UIMA 注释器中运行?你是如何设法让它工作的?
uima - UIMA RUTA - 如何使用正则表达式和组进行查找和替换
RUTA 新手在这里。我正在使用 RUTA 处理文档,并且在开始注释之前要做很多规范化。我试图找到使用正则表达式和组在 RUTA 中的原始文档上查找和替换字符序列的最佳方法。本质上,我正在尝试了解如何在 RUTA 中执行类似于 String.replaceAll 的操作。
例如,在 Java 中,
但我想不出在 RUTA 中实现这一目标的简单方法。
谢谢
uima - 一个简单的 Ruta 注释器
我刚从 Ruta 开始,我想写一个这样的规则:
它会尝试匹配一个单词,例如 XYZ,当它碰到它时,它会将之前出现的文本分配给 Annotator CompanyDetails。
例如 :
这是一个包含我们感兴趣的短语的段落,它位于句子之后。LL, Inc. 特拉华州有限责任公司 (XYZ)。
运行脚本后,注释器 CompanyDetails 将包含以下字符串:LL, Inc. a Delaware limited liability company
java - RUTA 如何根据条件执行块
我有一个简单的 Ruta 问题。
在取自 tools.ruta.book.pdf 的示例中
段落{IF(keywordAmount > 5)->MARK(KeywordParagraph)};
是否可以执行之前定义的块或函数,而不是只执行一条语句?
uima - RUTA:如何解析日期-MM/dd/yyyy-并将其存储在一个复杂的结构中?
我想要的是解析日期的三个组成部分,将每个组成部分存储到自己的注释中,然后创建一个复杂的结构,代表整个日期。我尝试了以下方法,但没有奏效。
当我用类似“2014 年 12 月 31 日”的内容输入它时,虽然为三个 CommenceXXX 注释分配了值,但复杂的结构 CommDate 却没有。
uima - 如何运行 uima-text-segmenter 的示例?
我想调用 uima-text-segmenter 的 API https://code.google.com/p/uima-text-segmenter/source/browse/trunk/INSTALL?r=22来运行一个例子。但是我不知道如何调用API......自述文件说,
例如,谁能给我一些可以直接在 main func 中运行的代码?非常感谢!
java - Ruta:如何逐行读取文本文件,将每一行视为一个字符串
使用 Ruta 脚本,我尝试读取一个包含多行且每行包含多个单词的文本文件。
我使用了 WORDLIST 和 STRINGLIST,
WORDLIST personNameList = 'PersonName.txt';
STRINGLIST pList = {“约翰”,“保罗牛顿”};
但是两者虽然在一行只包含一个单词时工作得很好,但当一行包含多个单词时似乎不起作用。
xml - 使用 UIMA 从 XML 文件中提取文本
我正在使用 UIMA 为 XML 构建文本提取器。由于我是 UIMA 框架的初学者,我想知道如何去做。
我知道 UIMA 可以对文件的特定部分进行注释,但是如何有效地提取信息?任何帮助表示赞赏。
谢谢,贾廷
uima - UIMA RUTA - 沙发映射 - 聚合管道
这是关于问题的。
UIMA RUTA - 如何使用正则表达式和组进行查找和替换
我正在尝试按照建议设置沙发映射。我有一个包含多个 AE 的聚合 AE,并尝试在此管道中合并 2 个 RUTA AE/脚本。两个 RUTA AE(和相关脚本)都负责使用修饰符进行 REGEXP 查找和替换。第二个 AE 取决于第一个 AE 的输出。我必须配置修改器的第二个 AE 的输出视图,否则我会收到“沙发数据已设置”异常。
本质上,我无法将一个AE的输出编织为另一个AE的输入。
我的设置类似于下面,
这是聚合 AE 代码
需要注意的几点,
- 所有三个 RUTA AE(step1、step2、normalizer)都使用 RUTA Modifier
- 上述设置引发异常“找不到名为 norm_2_out 的沙发FS”。- 这发生在第 2 步之后。
- 我试图将“norm_2_out”切换为“已修改”作为规范化器的输入沙发,这似乎将处理移至管道中的下一步(规范化器),但这会引发异常“沙发功能 setLocalSofaData() 的数据有已经设置好了。” 在 org.apache.uima.ruta.engine.RutaModifier.process(RutaModifier.java:107)
- 我尝试使用 RUTA 2.2.0(快照),结果相同
由于我对 UIMA 和 RUTA 都比较陌生,因此不确定我是否做错了什么,或者我是否遇到了限制。
顺便说一句,我正在使用 RUTA 2.1.0
谢谢