【摘要】本节中,我们看一下正则表达式的相关用法。正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。当然,对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了。1.实例引入说了这么多,可能我们对它到底是个什么还是比较模糊,下面就用几个实例来看一下正则表达式的用法。打开开源中国提供的正则表达式测试工具http://tool.oschina.net/regex/,输入待匹配的文本,然后选择常用的
系统 2019-09-27 17:48:57 1727
python基础学习笔记(四)2013-04-1823:59虫师阅读(...)评论(...)编辑收藏列表本节继续讨论列表不同元组和字符串的地方:列表是可变的(mutable)----可以改变列表的内容,并且列表有很多有用的、专门的方法。List函数可以将一个字符串拆分成列表。>>>list('chongshi')['c','h','o','n','g','s','h','i']改变列表:元素赋值例如,我们想对一个列表中的某个元素赋值。>>>x=[1,2,3
系统 2019-09-27 17:48:57 1727
*args和**kwargs是常用的两个参数*args:用于接受多余的未命名的参数,元组类型。**kwargs:用于接受形参的命名参数,字典类型的数据。可变参数args:deffun(n,*args):print(n)print(args)#未拆包print(*args)#进行拆包fun(1,2,3,4)结果:1(2,3,4)234形参中的*args是接受数据的args,它是一个元组,把传入的数据放进args元组中。函数中的args仍然是元组,*args就
系统 2019-09-27 17:48:57 1727
python在抓取制定网站的错误提示:ssl.SSLCertVerificationError:[SSL:CERTIFICATE_VERIFY_FAILED]certificateverifyfailed:selfsignedcertificateincertificatechain(_ssl.c:1056)解决方式:在使用请求方法时添加一个参数verify=false就行了,如下:response=self.lagou_session.get(url=u
系统 2019-09-27 17:48:53 1727
下面看下python2.x和python3.x的区别1.大环境不同python2.x:源码重复,不规范python3.x:整合源码,更清晰优美简单2.默认编码不同python2.x:默认编码ASCII编码python3.x:默认编码UTF-83.python3.x没有长整型python2.x:有长整型longpython3.x:long整数类型被废弃,统一为int4.打印方式不同python2.x:print语句,print空格+打印内容python3.x
系统 2019-09-27 17:48:49 1727
>>>lst=['x'forninrange(5)]>>>print(lst)['x','x','x','x','x']>>>lst=['z']*5>>>print(lst)['z','z','z','z','z']>>>lst=[0]*3>>>print(lst)[0,0,0]
系统 2019-09-27 17:48:48 1727
下面通过几个案例来分析一下,注意:本节的parsematch函数请参考《妙用re.sub分析正则表达式解析匹配过程》案例一:>>>re.findall(r".*.*(.*)",'第二回悟彻菩提真妙理断魔归本合元神')['断魔归本合元神']>>>parsematch(r".*.*(.*)",'第二回悟彻菩提真妙理断魔归本合元神')第1次匹配,匹配情况:匹配子串group(0):第二回悟彻菩提真妙理断魔归本合元神,位置为:(0,19)匹配子串group(1):
系统 2019-09-27 17:48:48 1727
withopen("1.txt")asf:whileTrue:line=f.readline()ifnotline:break;print(line.rstrip())
系统 2019-09-27 17:48:48 1727
我觉得,开始学习一门编程时候,不仅仅是要去学习它的语法,而是在给你一段代码的时候,你能够对这段代码的主要结构在心里面有一个大致的框架,也就是你要知道这一块是干什么的,那一块又是干什么的,然后再一块一块的详细去看代码的具体语句。一、从对象到类1.对象是在应用程序中使用的、组合成一个单一的实体的数据。例如,如果编写一个程序使用汽车,那么将会创建一个Car对象,其中包含了一些汽车的信息,如车的重量、大小、引擎以及门的数量。如果你正在编写一个程序来记录人,那么你可
系统 2019-09-27 17:48:44 1727
python可以方便地支持多线程。可以快速创建线程、互斥锁、信号量等等元素,支持线程读写同步互斥。美中不足的是,python的运行在python虚拟机上,创建的多线程可能是虚拟的线程,需要由python虚拟机来轮询调度,这大大降低了python多线程的可用性。我们经今天用了经典的生产者和消费者的问题来说明下python的多线程的运用上代码:#encoding=utf-8importthreadingimportrandomimporttimefromQue
系统 2019-09-27 17:48:36 1727