搜索到与相关的文章
Python

对python数据清洗容易遇到的函数-re.sub bytes string

re.sub功能,比replace强大的替换函数,将正则表达式匹配上的模块替换成replre.sub(pattern,repl,string,count=0,flags=0)返回最左边正则表达式限定的被repl代替的字符串,如果正则表达式没有匹配上,则字符串不做修改。\nisconvertedtoasinglenewlinecharacter,\risconvertedtoacarriagereturn,andsoforth.Unknownescapess

系统 2019-09-27 17:46:01 2017

Python

在Python的while循环中使用else以及循环嵌套的用法

循环使用else语句在python中,for…else表示这样的意思,for中的语句和普通的没有区别,else中的语句会在循环正常执行完(即for不是通过break跳出而中断的)的情况下执行,while…else也是一样。#!/usr/bin/pythoncount=0whilecount<5:printcount,"islessthan5"count=count+1else:printcount,"isnotlessthan5"以上实例输出结果为:0is

系统 2019-09-27 17:38:42 2017

Python

深入解析Python中的变量和赋值运算符

Python变量类型变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。因此,变量可以指定不同的数据类型,这些变量可以存储整数,小数或字符。变量赋值Python中的变量不需要声明,变量的赋值操作既是变量声明和定义的过程。每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。等号(=)用来给变量赋值。等号

系统 2019-09-27 17:38:21 2017

Python

python3 shelve模块的详解

python3shelve模块的详解一、简介在python3中我们使用json或者pickle持久化数据,能dump多次,但只能load一次,因为先前的数据已经被后面dump的数据覆盖掉了。如果我们想要实现dump和load多次,可以使用shelve模块。shelve模块可以持久化所有pickle所支持的数据类型。二、持久化数据1、数据持久化importshelveimportdatetimeinfo={'name':'bigberg','age':22}

系统 2019-09-27 17:38:13 2017

Python

通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据(经典)

在学习python的时候,一定会遇到网站内容是通过ajax动态请求、异步刷新生成的json数据的情况,并且通过python使用之前爬取静态网页内容的方式是不可以实现的,所以这篇文章将要讲述如果在python中爬取ajax动态生成的数据。至于读取静态网页内容的方式,有兴趣的可以查看本文内容。这里我们以爬取淘宝评论为例子讲解一下如何去做到的。这里主要分为了四步:一获取淘宝评论时,ajax请求链接(url)二获取该ajax请求返回的json数据三使用python

系统 2019-09-27 17:38:05 2017

Python

python 的列表遍历删除实现代码

python的列表list可以用for循环进行遍历,实际开发中发现一个问题,就是遍历的时候删除会出错,例如l=[1,2,3,4]foriinl:ifi!=4:l.remove(i)printl这几句话本来意图是想清空列表l,只留元素4,但是实际跑起来并不是那个结果。再看下面,利用index来遍历删除列表ll=[1,2,3,4]foriinrange(len(l)):ifl[i]==4:dell[i]printl这样没问题,可以遍历删除,但是列表l如果变为l

系统 2019-09-27 17:38:00 2017

Python

CentOS 6.X系统下升级Python2.6到Python2.7 的方法

第一步:升级pythonCentOs6.x的系统默认安装的Python版本是2.6.x,想升级到Python2.7.x,从官方下载源文件,然后解压、编译wgethttp://www.python.org/ftp/python/2.7.10/Python-2.7.10.tar.xzunxzPython-2.7.10.tar.xztar-vxfPython-2.7.10.tar执行完以上命令会解压得到Python-2.7.10这个文件夹,进入该目录并执行以下命

系统 2019-09-27 17:37:55 2017

Python

Python下的常用下载安装工具pip的安装方法

1、pip下载安装1.1pip下载#wget"https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb"--no-check-certificate#wget"https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d

系统 2019-09-27 17:37:51 2017

编程技术

Lucene.net中文分词探究

一、中文分词方式:中文分词几种常用的方式:A.单字分词单字分词,顾名思义,就是按照中文一个字一个字地进行分词。如:我们是中国人,效果:我\们\是\中\国\人。B.二分法二分法,就是按两个字进行切分。如:我们是中国人,效果:我们\们是\是中\中国\国人。C.词库分词词库分词,就是按某种算法构造词然后去匹配已建好的词库集合,如果匹配到就切分出来成为词语。通常词库分词被认为是最理想的中文分词算法如:我们是中国人,通成效果为:我们\是\中国\中国人。二、Lucen

系统 2019-08-29 23:46:24 2017