普通匿名代理能隐藏客户机的真实IP,但会改变我们的请求信息,服务器端有可能会认为我们使用了代理。不过使用此种代理时,虽然被访问的网站不能知道你的ip地址,但仍然可以知道你在使用代理,当然某些能够侦测ip的网页仍然可以查到你的ip。 高匿名代理不改变客户机的请求,这样在服务器看来就像有个真正的客户浏览器在访问它,这时客户的真实IP是隐藏的,服务器端不会认为我们使用了代理。
验证方式:通过代理访问http://httpbin.org/headers,会发现代理没有更改任何请求头。
另外要注意,爬虫程序如果需要长期稳定的采集网站,不仅仅需要高匿的爬虫代理IP,还需要做好基本的爬虫策略。