1

我正在尝试设置应该理解英语的 solr。例如,我已经索引了我们公司的网站 (www.biginfolabs.com),或者它可以是任何其他网站或我们自己的数据。

如果我提出一些类似英语的查询,我应该得到谷歌所做的一个词的答案;查询是:

  • 印度位于哪里。
  • 谁是奥巴马的父亲。

解决方法:

  • 集成 UIMA、Mahout 和 solr(人名、城市名提取完成)。
  • 我阅读了名为“Taming Text”的书并实现了https://github.com/tamingtext/book。但没有得到我想要的。

谁能告诉我如何进一步移动。它可以是我们团队准备做的任何事情。

4

1 回答 1

0

此任务称为命名实体识别。您可以查看本教程,了解他们如何使用 Solr 将文本中的原子元素提取到预定义的类别中,例如人名、组织、位置、时间表达、数量、货币价值、百分比等,然后学习模型回答查询。

还可以查看斯坦福 NLP,了解有关您可以使用的算法的更多想法。

于 2014-07-18T08:53:56.147 回答