首先要分析一下电影天堂网站的首页结构。在这里插入图片描述从上面的菜单栏中我们可以看到整个网站资源的总体分类情况。刚刚好我们可以利用到它的这个分类,将每一个分类地址作为爬虫的起点。①解析首页地址提取分类信息#解析首页defCrawIndexPage(starturl):print"正在爬取首页"page=__getpage(starturl)ifpage=="error":returnpage=page.decode('gbk','ignore')tree=
系统 2019-09-27 17:56:58 1876
半次元COS图爬取-写在前面今天在浏览网站的时候,忽然一个莫名的链接指引着我跳转到了半次元网站https://bcy.net/打开之后,发现也没有什么有意思的内容,职业的敏感让我瞬间联想到了cosplay,这种网站必然会有这个的存在啊,于是乎,我准备好我的大爬虫了。把上面的链接打开之后,被我发现了吧,就知道我的第八感不错滴。接下来就是找入口,一定要找到图片链接的入口才可以做下面的操作这个页面不断往下拖拽,页面会一直加载,当时当你拖拽一会,就停下来了,就是这
系统 2019-09-27 17:56:54 1876
python中查找指定的字符串的方法如下:code#查询defselStr():sStr1='jsjtt.com'sStr2='com'#index查询某个字符串,返回索引nPos=sStr1.index(sStr2)if(nPos>=0):print'sStr1中包括sStr2中的字符'printnPos#find方法如果没有查询到返回-1nPos2=sStr1.find('abc')printnPos2#查询到返回字符所在位置printsStr1.fi
系统 2019-09-27 17:56:53 1876
封装面向对象三大特性:继承封装多态隐藏对象的属性和实现细节,仅对外提供公共访问方法广义上的封装:把方法和变量都封装在类中狭义上的封装:在类的外部干脆不能调用了优点将变化隔离便于使用提高复用性提高安全性封装原则:将不需要对外提供的内容隐藏起来把属性都隐藏,提供公共方法对齐访问私有变量和私有方法在python中用双下划线开头的方式将属性隐藏起来(设置成私有的)代码实例#其实这仅仅这是一种变形操作#类中所有双下划线开头的名称如__x都会自动变形成:_类名__x的
系统 2019-09-27 17:56:45 1876
本文实例讲述了python对字典进行排序的方法,是非常实用的技巧。分享给大家供大家参考。具体实现方法如下:importitertoolsthekeys=['b','a','c']thevalues=['bbb','aaa','cccc']d=dict(itertools.izip(thekeys,thevalues))#创建字典printddefsortedDictValue(adict):keys=adict.keys()keys.sort()retur
系统 2019-09-27 17:56:31 1876
Python类的继承详解Python既然是面向对象的,当然支持类的继承,Python实现类的继承比JavaScript简单。Parent类:classParent:parentAttr=100def__init__(self):print("parentInit")defparentMethod(self):print("parentMethod")defsetAttr(self,attr):self.parentAttr=attrdefgetAttr(s
系统 2019-09-27 17:56:20 1876
本文实例讲述了python实现自动登录人人网并访问最近来访者的方法,分享给大家供大家参考。具体方法如下:##-*-coding:gbk-*-#在importosfromxml.domimportminidomimportreimporturllibimporturllib2importcookielibimportdatetimeimporttimefromurllib2importURLError,HTTPError#登录模块在网上找的defrenren
系统 2019-09-27 17:56:19 1876
说明:关于类的这部分,我参考了《LearningPython》一书的讲解。创建类创建类的方法比较简单,如下:复制代码代码如下:classPerson:注意,类的名称一般用大写字母开头,这是惯例。当然,如果故意不遵循此惯例,也未尝不可,但是,会给别人阅读乃至于自己以后阅读带来麻烦。既然大家都是靠右走的,你就别非要在路中间睡觉了。接下来,一般都要编写构造函数,在写这个函数之前,先解释一下什么是构造函数。复制代码代码如下:classPerson:def__ini
系统 2019-09-27 17:55:28 1876
Python算术运算符以下假设变量a为10,变量b为20:运算符描述实例+加-两个对象相加a+b输出结果30-减-得到负数或是一个数减去另一个数a-b输出结果-10*乘-两个数相乘或是返回一个被重复若干次的字符串a*b输出结果200/除-x除以yb/a输出结果2%取模-返回除法的余数b%a输出结果0**幂-返回x的y次幂a**b输出结果20//取整除-返回商的整数部分9//2输出结果4,9.0//2.0输出结果4.0以下实例演示了Python所有算术运算符
系统 2019-09-27 17:55:21 1876
通过将对象序列化可以将其存储在变量或者文件中,可以保存当时对象的状态,实现其生命周期的延长。并且需要时可以再次将这个对象读取出来。Python中有几个常用模块可实现这一功能。pickle模块存储在变量中dumps(obj)返回存入的字节dic={'age':23,'job':'student'}byte_data=pickle.dumps(dic)#out->b'\x80\x03}q\x00(X\x03\x00\x00\...'print(byte_dat
系统 2019-09-27 17:54:49 1876