如何在 Nutch 中抓取图像?或者,是否有任何其他开放式搜索引擎可以生成带有图像的结果?
1622 次
1 回答
0
改变你regex-urlfilter.txt
的conf
-.(ico|ICO|css|CSS|sit|SIT|eps|EPS|wmf|WMF|zip|ZIP|ppt|PPT|xls|XLS|gz|GZ|rpm|RPM|tgz|TGZ|exe|EXE |js|JS|gif|GIF|png|PNG||jpg|JPG|jpeg|JPEG|bmp|BMP|mpg|MPG|mov|MOV)$
删除jpeg
, jpg
,gif
或type
您想要grep的图片。
然后换suffix-urlfilter.txt
进去conf
添加#
到jpeg
,gif
或png
这对我有用!
于 2015-09-10T04:14:50.980 回答