我 99% 确定我hxs.select在这个网站上发生了什么事。我无法提取任何东西。当我运行以下代码时,我没有收到任何错误反馈。title或者link没有被填充。有什么帮助吗?
def parse(self, response):
self.log("\n\n\n We got data! \n\n\n")
hxs = HtmlXPathSelector(response)
sites = hxs.select('//div[@class=\'footer\']')
items = []
for site in sites:
item = CarrierItem()
item['title'] = site.select('.//a/text()').extract()
item['link'] = site.select('.//a/@href').extract()
items.append(item)
return items
有没有办法可以调试这个?我还尝试使用scrapy shell带有 url 的命令,但是当我view(response)在 shell 中输入时,它只是返回True并打开一个文本文件而不是我的 Web 浏览器。
>>> 响应.url
'https://qvpweb01.ciq.labs.att.com:8080/dis/login.jsp'
>>> hxs.select('//div')
回溯(最近一次通话最后):
文件“”,第 1 行,在
AttributeError:“NoneType”对象没有属性“选择”
>>> 视图(响应)
真的
>>> hxs.select('//body')
回溯(最近一次通话最后):
文件“”,第 1 行,在
AttributeError:“NoneType”对象没有属性“选择”