现在拥有了正则表达式这把神兵利器,我们就可以进行对爬取到的全部网页源代码进行筛选了。下面我们一起尝试一下爬取内涵段子网站:http://www.neihan8.com/article/list_5_1.html打开之后,不难看出里面一个一个非常有内涵的段子,当你进行翻页的时候,注意url地址的变化:第一页url:http://www.neihan8.com/article/list_5_1.html第二页url:http://www.neihan8.com
系统 2019-09-27 17:48:39 1872
操作类题目Python交换两个变量的值答:在Python中交换两个对象的值通过下面的方式即可a,b=b,a但是需要强调的是这并不是元组解包,通过dis模块可以发现,这是交换操作的字节码是ROT_TWO,意思是在栈的顶端做两个值的互换操作。在读文件操作的时候会使用read、readline或者readlines,简述它们各自的作用答:read()每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。如果希望一行一行的输出那么就可以使用readline(
系统 2019-09-27 17:48:20 1872
Python下一切皆对象,每个对象都有多个属性(attribute),Python对属性有一套统一的管理方案。__dict__与dir()的区别:dir()是一个函数,返回的是list;__dict__是一个字典,键为属性名,值为属性值;dir()用来寻找一个对象的所有属性,包括__dict__中的属性,__dict__是dir()的子集;并不是所有对象都拥有__dict__属性。许多内建类型就没有__dict__属性,如list,此时就需要用dir()来
系统 2019-09-27 17:48:14 1872
概述Python3中我们利用内置模块json解码和编码JSON对象,JSON(JavaScriptObjectNotation)是指定RFC7159(废弃了RFC4627)和ECMA-404是一种轻量级数据交换格式,受JavaScript对象文字语法的启发(虽然它不是JavaScript1的严格子集)。下面为Python对象–>JSON对象的对照关系表。PythonJSONdictobjectlist,tuplearraystr,unicodestring
系统 2019-09-27 17:47:12 1872
朋友圈的学问对于刚刚过去的教师节,大家是否发现了点什么…凡是哪个混的风生水起,都喜欢在朋友圈里面感谢一下母校,缅怀一番师生情。那混的不好的,比如我这种苦逼IT搬砖民工,在教师节的朋友圈说说是什么样的呢?哈哈…孟子曾说穷则独善其身,达则兼善天下。意思是不得志的时候就要管好自己的道德修养,得志的时候就要努力让天下人都能得到好处。所以贫穷的我就用苦荞籽庆祝这个节日,为什么说庆祝?只能说,这年头,谁还没个教师资格证了,跟谁俩呢!不完美的Python自从各类Pyth
系统 2019-09-27 17:47:05 1872
Python3快速入门(九)——Python3并发编程一、Python线程模块1、线程简介一个标准的线程由线程ID,当前指令指针(PC),寄存器集合和堆栈组成。线程是进程中的一个实体,是被系统独立调度和分派的基本单位,线程本身不拥有系统资源,与进程内的其它线程共享进程的所有资源。一个进程中至少有一个线程,并作为程序的入口,即主线程,其它线程称为工作线程。多线程,是指从软件或者硬件上实现多个线程并发执行的技术。支持多线程能力的计算机因有硬件支持而能够在同一时
系统 2019-09-27 17:46:47 1872
预编译importrere1=re.compile(r'元字符组成的正则规则')#元字符下面会说re1.方法()#方法下边也会说元字符:表示普通字符:.#除了\n外都可以匹配的到\d#只匹配纯数字0-9\D#和\d相反,除了数字全都匹配\s#只匹配空格\S#和\s相反,除了空格,全都匹配#我喜欢用[\s\S]*?匹配所有\w#只匹配纯数字或大小写字母或下划线\W#与\w恰好相反,除了纯数字、大小写字母、下划线全都匹配[]#[abcde]只要包含这个列表的字
系统 2019-09-27 17:46:42 1872
直接交换2个数字的位置Python提供了一种直观的方式在一行代码中赋值和交换(变量值)。如下所示:x,y=10,20print(x,y)x,y=y,xprint(x,y)#1(10,20)#2(20,10)在上面代码中,赋值的右侧形成了一个新元组,而左侧则立刻将该(未被引用的)元组解包到名称和。待赋值完成后,新元组就变成了未被引用状态,并且被标为可被垃圾回收,最终也就发生了数字交换。链接比较操作符比较运算符的聚合是另一种有时用起来很顺手的技巧。n=10re
系统 2019-09-27 17:46:28 1872
Python对文件的操作还算是方便的,只需要包含os模块进来,使用相关函数即可实现目录的创建。主要涉及到三个函数:1、os.path.exists(path)判断一个目录是否存在2、os.makedirs(path)多层创建目录3、os.mkdir(path)创建目录直接上代码:复制代码代码如下:defmkdir(path):#引入模块importos#去除首位空格path=path.strip()#去除尾部\符号path=path.rstrip("\\"
系统 2019-09-27 17:46:08 1872
一.语法列表解析式是将一个列表(实际上适用于任何可迭代对象(iterable))转换成另一个列表的工具。在转换过程中,可以指定元素必须符合一定的条件,才能添加至新的列表中,这样每个元素都可以按需要进行转换。好处:1.简洁2.高效其实列表解析式并不是必须的,因为它能完成的工作都能够通过for循环完成,但是列表解析式比手动的for循环语句运行得更快(往往速度快一倍),因为它们的迭代在解释器内部是以C语言的速度执行的,而不是以手动的Python代码执行的,特别是
系统 2019-09-27 17:45:29 1872