爬虫的概念:爬虫就是获取网页并提取和保存信息的自动化程序爬虫的分类:主要有四类:通用网络爬虫,聚焦网络爬虫,增量式网络爬虫,深层网络爬虫爬虫的流程:常见的几种爬虫问题:主要有五类:静态网页的爬取,Ajax数据的爬取,动态渲染页面爬取,验证码的识别,代理的使用常见的爬虫框架:pyspider框架,Scrapy框架分布式爬虫:在多台机器上运行爬虫程序爬虫的一些常用"库":解析库:lxml;BeautifulSoup;pyquery;tesserocr请求库:r
系统 2019-09-27 17:56:05 1833
Python设计模式设计模式(DesignPattern)是一套被反复使用、多数人知晓的、经过分类的、代码设计经验的总结。使用设计模式的目的:为了代码可重用性、让代码更容易被他人理解、保证代码可靠性。设计模式使代码编写真正工程化;设计模式是软件工程的基石脉络,如同大厦的结构一样。所有的设计模式示例都是来源于菜鸟教程,每个设计模式的UML都可以在菜鸟教程中找到相应的示例github地址:Python设计模式以工厂模式为例:工厂模式在菜鸟教程中的UML图为工厂
系统 2019-09-27 17:55:33 1833
python函数的闭包问题(内嵌函数)>>>deffunc1():...print('func1running...')...deffunc2():...print('func2running...')...func2()...>>>func1()func1running...func2running...内部函数func2作用域都在外部函数func1作用域之内如果试图在外部函数的外部调用内部函数将会报错>>>func2()Traceback(mostre
系统 2019-09-27 17:54:55 1833
前言树是数据结构中非常重要的一种,主要的用途是用来提高查找效率,对于要重复查找的情况效果更佳,如二叉排序树、FP-树。另外可以用来提高编码效率,如哈弗曼树。用Python实现树的构造和几种遍历算法。实现功能如下:树的构造递归实现先序遍历、中序遍历、后序遍历堆栈实现先序遍历、中序遍历、后序遍历队列实现层次遍历#-*-coding=utf-8-*-classNode(object):"""节点类"""def__init__(self,element=-1,l_
系统 2019-09-27 17:54:16 1833
Python学习笔记--坐标轴范围参靠视频:《Python数据可视化分析matplotlib教程》链接:https://www.bilibili.com/video/av6989413/?p=6所用的库及环境:IDE:PycharmPython环境:python3.7Matplotlib:Matplotlib1.11Numpy:Numpy1.15.坐标轴范围概念根据需求调整坐标轴的范围坐标轴范围调整第一种形式通过plt.axis()可以查看图形的x轴的最小
系统 2019-09-27 17:53:50 1833
defsend_mail(to_mail,subject,data,filename=None):smtp_server='smtp.exmail.qq.com'from_mail=""mail_pass=""msg=MIMEMultipart()msg["From"]=from_mailmsg["To"]=','.join(to_mail)msg["Subject"]=Header(subject,'utf-8').encode()#构造htmld=da
系统 2019-09-27 17:53:10 1833
我这边使用的是Pycharm2019.1.3Pycharm下载地址官网:https://www.jetbrains.com/pycharm/?fromMenu网盘:链接:https://pan.baidu.com/s/1wENzS6uIlIPjpKmNPnjo-g提取码:qqsk##开始破解找到系统的hosts文件hosts文件路径一般在:C:\Windows\System32\drivers\etc右键编辑,在最下方加上如下两句话0.0.0.0accou
系统 2019-09-27 17:52:49 1833
搜狗微信搜索提供两种类型的关键词搜索,一种是搜索公众号文章内容,另一种是直接搜索微信公众号。通过微信公众号搜索可以获取公众号的基本信息及最近发布的10条文章,今天来抓取一下微信公众号的账号信息爬虫首先通过首页进入,可以按照类别抓取,通过“查看更多”可以找出页面链接规则:importrequestsasreqimportrereTypes=r'id="pc_\d*"uigs="(pc_\d*)">([\s\S]*?)'Entry="http://weixin
系统 2019-09-27 17:51:38 1833
首先globals()和locals()是作用于作用域下的内置函数,所以我将它们分为作用域类型的内置函数1.作用域相关:1)globals()#返回全局作用域中的所有名字2)locals()#返回本地作用域中的所有名字可能对于这个作用域相关的内置函数,大家一接触都会很懵,这个东西是干什么的?它怎么用?今天小编就给大家来解释一下,首先我们来先看下官方的解释:globals()——获取全局变量的字典locals()——获取执行本方法所在命名空间内的局部变量的字
系统 2019-09-27 17:50:51 1833
返回被去除指定字符的字符串默认去除空白字符删除首尾字符:str.strip([char])删除首字符:str.lstrip([char])删除尾字符str.strip([char])判断是否匹配首末字符匹配成功返回True,否则返回False匹配首字符:str.startswith(char[,start[,end]])匹配末字符:str.endswith(char[,start[,end]])查找字符,找到返回字符位置,否则返回-1从字符串开头查找str
系统 2019-09-27 17:50:02 1833