1

我们有几个自定义的 nutch 字段,爬虫会拾取和索引。通过 solrindex(使用映射文件)将其传输到 solr 可以正常工作。日志显示一切正常,但是 solr 环境中的索引并未反映这一点。任何帮助都感激不尽,

谢谢,阿肖克

4

1 回答 1

2

我要做的是使用像tcpmon这样的工具来准确监控 Nutch 发送给 Solr 的内容。通过检查 xml 有效负载,您可以确定 Nutch 是否正确地将这些自定义字段发送到 Solr。如果 Nutch 正确发送它们,那么 Solr 方面就会发生一些事情。相反,重新检查您的 Nutch 代码。

于 2010-08-27T13:10:36.817 回答