问题标签 [uima]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 使用多个模型进行实体提取——OpenNLP
我有两个模型文件:1)en-politicians-ner.bin 2)en-engineers-ner.bin
现在,有没有办法将这两个模型添加到单个 NameFinderME 对象中。使用这两个模型的解决方法可能是创建两个 NameFinderME 对象并对其进行迭代以提取实体,但我不想这样做。
java - 用于运行 UIMA Ruta 脚本的 Java API
我是 UIMA Ruta 的新手。我使用脚本语言制作了一些注释器。我能够在 EclipseIDE 中运行它们。我想编写一个 JAVA API 来根据提供的输入自动运行脚本。
我正在使用 UIMA 文档中提供的相同示例项目。
到目前为止,我已经能够做到这一点
在使用默认 BasicEngine.xml 和输入文本文件运行上述代码段时。它给出了下面的堆栈跟踪
我被困住了。请帮忙。
编辑:
上面编写的 Java API 来自 uima 文档中的 uimaj-example。我在类路径中添加了一些 ruta jar 和通用 jar,之后文件执行良好。
java - DKPro Core Groovy 使用与 UIMA 安装
嘿,我是 groovy 的极端贵族,我刚刚发现它存在。我将它安装在 centos 5 系统上,这些是版本
然后我尝试运行在这里找到的一个简单脚本,而无需下载或安装或包含任何其他内容。运行失败,结果如下。我究竟做错了什么?
java - UIMA Ruta 与 Maven
我是 UIMA Ruta 的初学者。我按照这个将 Ruta 与 Maven 一起使用。我明白这一点,但我想做更多的事情。
下面是我运行这个例子的简单测试用例
这是我下面提到的脚本。
正如教程中所建议的那样。我在同一个 Eclipse 工作区中使用不同的 UIMA Ruta 项目(称为示例项目)制作了这个脚本。我将它作为 UIMA ruta 文件执行并获得了相应的描述符文件(TestAnnotator.xml)。我粘贴了相同的内容,只是将以下内容更改为
它最初指向 BasicTypeSystem.xml 文件。目前我能够构建它并执行此脚本,但生成的描述符文件(TestAnnotator.xml)使用相应 xml 中的本地文件路径。这些本地文件路径是以前 UIMA 项目(示例项目)中的文件夹。
当我尝试在上述路径中配置脚本文件的运行设置时,即在我的 Maven 项目中,配置无法在给定路径中找到脚本。
我应该如何在 Maven 项目中添加 Ruta 脚本的动态特性?
请帮忙。
eclipse - UIMA 中的名称实体关系
我是 UIMA 的新手,目前我陷入了以下情况。
如何对从 UIMA 中的注释器获得的不同标记集进行分类和关联?就像 {John,Smith} 之类的个人实体令牌集名称和 {car,home} 之类的资产实体集。我想编写规则来分类,如下面的 xml。
提前感谢您的帮助..
java - 如何序列化 UIMA CAS 结合 Java 序列化
我有这些课程:
我想使用默认的 Java 序列化将每个 DocumentObj 作为文件转储到磁盘上。稍后它们也将被反序列化回 Java 对象。我知道我需要对 JCases 和句子注释进行一些特殊处理,因为它们不可序列化(现在我得到了NotSerializableException
)。希望治疗可以尽可能少。
关于 JCas 的序列化并将其与 Java 序列化相结合,您如何建议这样做?
我正在使用 Java 1.6 和 UIMA 2.4.0 在 Windows 上工作。我对所有 JCases 和注释使用相同的类型系统和相同的 3 个视图。
java - 获取给定句子的下一个单词(或 POS)建议。自动完成一个句子
我必须在基于桌面的 java 应用程序中实现自动建议功能。要求如下:
用户将给出一个句子作为输入,我必须返回下一个可能Part-Of-Speech
的建议。例如:
1. UserInput:
Mike 想要 Suggestions:
[阅读、玩耍、玩乐、学习、编码……等]
2. UserInput:
Mike Suggestions:
想要 [阅读、Naboo N-1 星际战斗机、马……等]
这是这个问题的副本,但这个问题是针对 Android 的。这可以通过使用一些 NLP 库(如 Stanford-NLP 或 OpenNLP 等)来完成吗?如果您需要更多详细信息,请告诉我。
谢谢!
spring - 想在 UIMA 框架中使用@Value(从属性文件中读取属性)
我有一个像 myProperties.properties 这样的属性文件。我想在UIMA JCasAnnotator_ImplBase 扩展类 中使用 spring 注释 @value 读取像 MAX_YEARS 这样的属性,如下所示。private @Value("${REQUIRED_COLUMNS}") String requiredColumns;
或者从 UIMA 框架中的属性文件读取属性的任何替代方法。提前致谢。纳拉辛哈。
nlp - 一起使用 UIMA、Stanford Core NLP
UIMA 和 StanfordNLP 在操作管道之后生成输出,就像我们想要进行 POS 标记一样,因此在输入文本中首先完成标记化,然后进行 POS 标记。
我想使用 UIMA 的标记化并在 Stanford CoreNLP 的 POS 标记器中使用该标记。但是Stanford CoreNLP 的词性标注器需要在词性标注器之前运行分词器。
那么,是否可以在同一管道中使用不同的 API?是否可以同时使用 UIMA 标记器和斯坦福 CoreNLP?
pdf - 使用 UIMA 从 PDF 中提取数据
我有一堆 PDF,它们是公司的财务报告。这些财务报告采用表格形式,但大小、形状和格式各不相同。我想提取流动资产、负债和权益等信息并将它们保存在数据库中。
UIMA 可以允许我这样做吗?
我的计划是使用 Tika 将 PDF 转换为文本,然后使用 UIMA 对这些文本进行注释,并像 Current Asset、Current Liability 对这些注释进行索引。
谢谢你的手。