- 军军小站|张军博客

个人简介

java-web项目加密运行（支持window/linux）

网址导航

JAVA项目加密(Windows/Linux/Mac/龙芯系统)

视频讲解-Java调用DLL

Python爬虫动态ip代理防止被封的方法

在爬取的过程中难免发生ip被封和403错误等等，这都是网站检测出你是爬虫而进行反爬措施，在这里为大家总结一下怎么用IP代理防止被封首先，设置等待时间：常见的设置等待时间有两种，一种是显性等待时间（强制停几秒），一种是隐性等待时间（看具体情况，比如根据元素加载完成需要时间而等待）图1是显性等待时间设置，图2是隐性第二步，修改请求头：识别你是机器人还是人类浏览器浏览的重要依据就是User-Agent，比如人类用浏览器浏览就会使这个样子的User-Agent：'

系统 2019-09-27 17:46:26 2145

编程技术

正则表达式零拾

S.replace(/(^s*)|(s*$)/g,"");首先是把/(^/s*)|(/s*$)/g替换为""然后,/.../g里面的,是表示放置通配符的地方,g代表全局参数(^/s*)或者(/s*$)都将被替换为""匹配首尾空白字符的正则表达式：^/s*|/s*$可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，正则表达式零拾

系统 2019-08-29 23:51:47 2145

编程技术

热门排行

Python爬虫动态ip代理防止被封的方法

正则表达式零拾

简单入门正则表达式 - 第六章元字符与修饰符