拥有Python标签的文章
Python

Python爬虫动态ip代理防止被封的方法

在爬取的过程中难免发生ip被封和403错误等等,这都是网站检测出你是爬虫而进行反爬措施,在这里为大家总结一下怎么用IP代理防止被封首先,设置等待时间:常见的设置等待时间有两种,一种是显性等待时间(强制停几秒),一种是隐性等待时间(看具体情况,比如根据元素加载完成需要时间而等待)图1是显性等待时间设置,图2是隐性第二步,修改请求头:识别你是机器人还是人类浏览器浏览的重要依据就是User-Agent,比如人类用浏览器浏览就会使这个样子的User-Agent:'

系统 2019-09-27 17:46:26 2104

Python

一文秒懂python读写csv xml json文件各种骚操作

Python优越的灵活性和易用性使其成为最受欢迎的编程语言之一,尤其是对数据科学家而言。这在很大程度上是因为使用Python处理大型数据集是很简单的一件事情。如今,每家科技公司都在制定数据战略。他们都意识到,拥有正确的数据(干净、尽可能多)会给他们带来关键的竞争优势。数据,如果使用有效,可以提供深层次的、隐藏在表象之下的信息。多年来,数据存储的可能格式显著增加,但是,在日常使用中,还是以CSV、JSON和XML占主导地位。在本文中,我将与你分享在Pytho

系统 2019-09-27 17:38:06 2104

Python

使用Python的urllib2模块处理url和图片的技巧两则

获取带有中文参数的url内容对于中文的参数如果不进行编码的话,python的urllib2直接处理会报错,我们可以先将中文转换成utf-8编码,然后使用urllib2.quote方法对参数进行url编码后传递。content=u'你好sharejs.com'content=content.encode('utf-8')content=urllib2.quote(content)api_url='http://www.sharejs.com/q=%s'%co

系统 2019-09-27 17:38:06 2104

Python

关于python字符串方法分类详解

python字符串方法分类,字符串是经常可以看到的一个数据储存类型,我们要进行字符的数理,就需要用各种的方法,这里有许多方法,我给大家介绍比较常见的重要的方法,比如填充、删减、变形、分切、替代和查找。打开sublimetext3编辑器,新建一个PY文件。test="hey"test_new=test.center(10,"$")print(test_new)填充类的有center()这个方法,可以指定字符,然后往两边填充,第一个参数是总的字符串长度。tes

系统 2019-09-27 17:37:37 2104

Python

python的三目运算符和not in运算符使用示例

三目运算符也就是三元运算符一些语言(如Java)的三元表达式形如:判定条件?为真时的结果:为假时的结果result=xifxPython的三元表达式有如下几种书写方法:if__name__=='__main__':a=''b='True'c='False'#方法一:为真时的结果if判定条件else为假时的结果d=bifaelsecprint('方法一输出结果:'+d)#方法二:判定条件and为真时的结果or为假时的结果d=aandborcprint('方法

系统 2019-09-27 17:37:35 2104

Python

第11.9节 Python正则表达式的贪婪模式和非贪婪模式

在使用正则表达式时,匹配算法存在贪婪模式和非贪婪模式两种模式,在《第11.8节Pytho正则表达式的重复匹配模式及元字符“?”、“*”、“+”功能介绍》中的重复匹配模式就是贪婪模式。什么是贪婪模式呢?就是匹配的时候,在整体匹配的情况下最大可能多的匹配最多的字符。非贪婪模式就是只要在字符串从左往右匹配模式串成功即停止匹配。如模式串“<.*>”在匹配字符串'b'时,会匹配到整个字符串,这就是贪婪模式,如果是非贪婪模式,则匹配到’’就结束了。关于贪婪模式和非贪婪

系统 2019-09-27 17:54:17 2103

Python

python 最大深度最小深度 LeetCode 104,111

python最大深度最小深度LeetCode104,111解法:1、BFS:寻找最大深度的时候,很容易想到就是,可以直接进行层次遍历,当无法在进行遍历下去的时候就是最深的深度;当寻找最小深度的时候,对每一个节点检查它是否是叶子节点,也就是检查它是否有左子树和右子树。2、DFS:每次进行遍历的时候,要判断是否是叶子节点,更新max深度的值和min深度的值。BFS版本#Definitionforabinarytreenode.#classTreeNode(ob

系统 2019-09-27 17:54:14 2103

Python

python输出json格式log,方便LogStash收集

为了配合LogStash日志收集服务,需要将线上服务的日志输出改为json格式。python日志标准库中并没有json格式的formatter,网上虽然已经有一些json相关的formatter,但不是很满意,就自己开发了一个并放到了github和pypi,目前仅支持Python3,能够很方便的解决自定义名映射属性问题,也支持新增自定义属性。欢迎到我的github点星星、提问题:https://github.com/MyColorfulDays/jsonf

系统 2019-09-27 17:53:20 2103

Python

Python新手实现2048小游戏

接触Python不久,看到很多人写2048,自己也捣鼓了一个,主要是熟悉Python语法。程序使用Python3写的,代码150行左右,基于控制台,方向键使用输入字符模拟。演示图片2048.py#-*-coding:UTF-8-*-#!/usr/bin/python3importrandomv=[[0,0,0,0],[0,0,0,0],[0,0,0,0],[0,0,0,0]]defdisplay(v,score):'''显示界面'''print('{0:4

系统 2019-09-27 17:51:12 2103

Python

Python学习笔记之字符串和字符串方法实例详解

本文实例讲述了Python学习笔记之字符串和字符串方法。分享给大家供大家参考,具体如下:字符串在python中,字符串的变量类型显示为str。你可以使用双引号"或单引号'定义字符串定义字符串my_string='thisisastring!'my_string2="thisisalsoastring!!!"#Also,wecanusebackslash'/'toescapequotes.this_string='Simon\'sskateboardisin

系统 2019-09-27 17:50:43 2103

Python

Python字典操作简明总结

1.dict()创建字典复制代码代码如下:>>>fdict=dict((['x',1],['y',2]))>>>fdict{'y':2,'x':1}2.fromkeys()来创建一个"默认"字典,字典中元素具有相同的值复制代码代码如下:>>>ddict={}.fromkeys(('x','y'),-1)>>>ddict{'y':-1,'x':-1}3.遍历字典使用keys()遍历复制代码代码如下:>>>dict2={'name':'earth','port

系统 2019-09-27 17:50:06 2103

Python

python实现连连看辅助之图像识别延伸

python实现连连看辅助�C图像识别延伸(百度AI),供大家参考,具体内容如下百度AI平台提供图片相似检索API接口,并有详细的API文档说明,可以更好的实现图片识别。fromaipimportAipImageSearch"""你的APPIDAKSK"""APP_ID='***'API_KEY='***'SECRET_KEY='***'client=AipImageSearch(APP_ID,API_KEY,SECRET_KEY)withopen("{}

系统 2019-09-27 17:50:01 2103

Python

Python3 max()函数基础用法

描述max()方法返回给定参数的最大值,参数可以为序列。语法以下是max()方法的语法:max(x,y,z,....)参数x--数值表达式。y--数值表达式。z--数值表达式。返回值返回给定参数的最大值。实例以下展示了使用max()方法的实例:#!/usr/bin/python3print("max(80,100,1000):",max(80,100,1000))print("max(-20,100,400):",max(-20,100,400))prin

系统 2019-09-27 17:49:49 2103

Python

Python判断对象是否为文件对象(file object)的三种方法示例

文件操作是开发中经常遇到的场景,那么如何判断一个对象是文件对象呢?下面我们总结了3种常见的方法。方法1:比较类型第一种方法,就是判断对象的type是否为file>>>fp=open(r"/tmp/pythontab.com")>>>type(fp)>>>type(fp)==fileTrue注意:该方法对于从file继承而来的子类不适用,看下面的实例classfileDetect(file):pass#中间代码无所谓,直接跳过不处理fp2=fileDetec

系统 2019-09-27 17:49:34 2103

Python

Python xlrd读取excel日期类型的2种方法

有个excle表格需要做一些过滤然后写入数据库中,但是日期类型的cell取出来是个数字,于是查询了下解决的办法。基本的代码结构复制代码代码如下:data=xlrd.open_workbook(EXCEL_PATH)table=data.sheet_by_index(0)lines=table.nrowscols=table.ncolsprintu'Thetotallineis%s,colsis%s'%(lines,cols)读取某个单元格:复制代码代码如下

系统 2019-09-27 17:48:31 2103