2

如何在 Nutch 中抓取图像?或者,是否有任何其他开放式搜索引擎可以生成带有图像的结果?

4

1 回答 1

0

改变你regex-urlfilter.txtconf

-.(ico|ICO|css|CSS|sit|SIT|eps|EPS|wmf|WMF|zip|ZIP|ppt|PPT|xls|XLS|gz|GZ|rpm|RPM|tgz|TGZ|exe|EXE |js|JS|gif|GIF|png|PNG||jpg|JPG|jpeg|JPEG|bmp|BMP|mpg|MPG|mov|MOV)$

删除jpeg, jpg,giftype您想要grep的图片。

然后换suffix-urlfilter.txt进去conf

添加#jpeg,gifpng

这对我有用!

于 2015-09-10T04:14:50.980 回答