我只是对这个话题有几个问题。
有人可以解释使用以下语言编写刮板的优缺点:
Java/Groovy
Perl
磷酸盐
硒
Python
我也想知道在抓取时会遇到什么样的问题,也许我应该如何处理它。例如,我遇到了片段身份,但还没有找到处理它的方法。(我正在使用 htmlunit)
只是为那些对该主题有所了解的人寻找一些指示。
我只是对这个话题有几个问题。
有人可以解释使用以下语言编写刮板的优缺点:
Java/Groovy
Perl
磷酸盐
硒
Python
我也想知道在抓取时会遇到什么样的问题,也许我应该如何处理它。例如,我遇到了片段身份,但还没有找到处理它的方法。(我正在使用 htmlunit)
只是为那些对该主题有所了解的人寻找一些指示。
考虑查看TestPlan。它有自己的高级语言,但您也可以用 Java 编写模块。它支持 Selenium 后端以及 HTMLUnit。
如果你可以用你的片段给出一个特定的问题(问题),那么我也可以回答这个问题。
优点/缺点更多地与可用的框架有关,而不是与编程语言本身有关。