邮轮行业有几个网站我想了解一下。示例: http ://www.silversea.com/cruise/cruise-results/?page_num=1 http://www.seabourn.com/find-luxury-cruise-vacation/FindCruises.action?cfVer=2&destCode=&durationCode= &dateCode=&shipCodeSearch=&portCode=
在某些情况下,如第一个所示,结果页面遵循模式 - ?page_num=1...17。但是,结果的数量会随时间而变化。
在第二种情况下,URL 不会随着分页而改变。
归根结底,我想做的是将每个网站的结果放入一个文件中。
Q1:除了为场景 1 设置 17 个爬虫,然后随着时间的推移积极观察结果的增长/收缩,还有其他选择吗?
Q2:我完全不知道如何从第二个场景中抓取内容。