我正在尝试确定高匿名代理。也称为私人/精英代理。从一个论坛我读过这个:
高匿名服务器不发送 HTTP_X_FORWARDED_FOR、HTTP_VIA 和 HTTP_PROXY_CONNECTION 变量。主机甚至不知道您正在使用代理服务器,当然它也不知道您的 IP 地址。
高度匿名的代理将显示以下信息:
REMOTE_ADDR = 代理的 IP 地址
HTTP_VIA = 空白
HTTP_X_FORWARDED_FOR = 空白
那么,我如何在 Python 中检查此标头,将它们作为 HA 代理丢弃?我尝试使用requests
包检索 20-30 个代理的标头,也使用 urllib,使用内置 http.client,使用 urllib2。但我没有看到这些标题,从来没有。所以我应该做错什么...
这是我用来测试的代码requests
:
proxies = {'http': 'http://176.100.108.214:3128'}
header = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.360',}
s = requests.session()
s.proxies = proxies
r = s.get('http://www.python.org', headers=header)
print(r.status_code)
print(r.request.headers)
print(r.headers)