Python—IT审计网

热门标签

CISA CIA CPA CISSP GPT ITIL 行业分析 IT合规反舞弊 PMP 算法区块链信息安全 CIO 大数据人工智能 CAATs ITA COBIT ITEC ITGC ITAC SAP IPO IT技术 Python PowerBI 等级保护 RPA CISP

最新

精华

发帖

xiaotaomi 2021-01-07
IT点评 Python 900

Python爬虫基础

1. 一般网页的爬取抓取大多数情况属于get请求，即直接从对方服务器上获取数据。首先，Python中自带urllib及urllib2这两个模块，可以满足基本的数据采集功能要求，requests也是非常
xiaotaomi 2020-12-31
IT点评 ITA Python 901

API代理提取之后无法使用

1、什么是API代理API就是url链接，用户的程序需要支持API的读取，定期从url中获取代理IP的相关信息，其文本格式如下：该格式是最常见的文本方式，通过网页请求获取代理信息，通过回车换行的方式，
xiaotaomi 2020-12-25
IT点评 Python 715

主流动态代理IP产品的区别

1. API提取式代理通过URL获取代理IP信息，格式一般是IP:PORT，需验证IP的可用性、更换代理设置，同时需要设计多线程异步IO，实现代理IP并发处理，不仅繁琐，而且影响效率，可以自建IP池控
xiaotaomi 2020-12-15
IT点评 Python 671

爬虫代理使用过程中常见错误分析

爬虫程序要长期稳定的数据采集需要使用爬虫代理，避免目标网站出现IP访问限制。如何能够快速的分析数据采集的效果，准确分析采集过程中的问题，可以通过分析HTTP请求返回的各种状态码进行判断。一般来说在使用
xiaotaomi 2020-12-09
IT点评 Python 745

代理使用过程中Keep-Alive保持IP不变

在使用爬虫代理的过程中，由于该产品是自动转发代理，按照每个http请求随机分配一个代理ip的模式进行转发，会导致多个Session的请求ip不一致，如果目标网站进行了判断会按照爬虫限制请求，尤其是一些
xiaotaomi 2020-12-02
IT点评 Python 692

爬虫程序十分钟入门

经常有前端的程序员被公司临时要求做数据收集，针对某项目进行分析评估。如何才能快速的实现数据采集目标，同时减少程序的研发和运维工作，现在给大家推荐一个基本爬虫策略+爬虫代理IP的方案，从搭建项目到实现数

|◀

▶|