实际上我是 nutch 的新手。我想知道有什么方法可以抓取 rss 提要,然后自定义解析数据,以便索引可以从 rss 中设置不同的字段。比如假设 rss 提要在项目中有一个字段源。我想索引这个字段..
thanxx vibs
实际上我是 nutch 的新手。我想知道有什么方法可以抓取 rss 提要,然后自定义解析数据,以便索引可以从 rss 中设置不同的字段。比如假设 rss 提要在项目中有一个字段源。我想索引这个字段..
thanxx vibs
您可以在这里找到许多nutch 专家
Nutch 有一个用于解析此类数据的插件。您只有两件事要做:在您的 nutch-site.xml 文件配置中激活该插件,添加插件“feed”。这使得解析器对于使用元数据相关的提要更新 solr 索引是必要的。