我们开始来谈谈python的爬虫。1,什么是爬虫:网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。互联网犹如一个大蜘蛛网,我们的爬虫就犹如一个蜘蛛,当在互联网遇到所需要的资源,我们就会爬取下来,即为爬虫是一个请求网站并且提取数据的自动化程序。2,下面我们来提到两个名词:1)请求,request即为我们的请求,当我们在浏览器内输入网址,敲击回车时,这时浏览器就会发送消息给该网址所在
系统 2019-09-27 17:50:56 1859
在使用对比过一些python虚拟环境管理工具后,个人觉得还是使用conda管理最方便(conda不仅仅能用来管理python环境,还有许多其它功能,更多介绍可参考其官网)。conda官网:https://docs.conda.io/en/latest/index.html从个人使用而言,吸引我的主要原因主要是以下两点:方便、统一的环境管理命令(在任意目录,都可以直接使用conda创建、切换、退出、删除虚拟环境等,无需切换到项目所在路径)创建虚拟环境时不仅可
系统 2019-09-27 17:50:16 1859
访问FTP,无非两件事情:upload和download,最近在项目中需要从ftp下载大量文件,然后我就试着去实验自己的ftp操作类,如下(PS:此段有问题,别复制使用,可以参考去试验自己的ftp类!)importosfromftplibimportFTPclassFTPSync():def__init__(self,host,usr,psw,log_file):self.host=hostself.usr=usrself.psw=pswself.log_
系统 2019-09-27 17:48:23 1859
在python中安装非自带python模块,有三种方式:1.easy_install2.pip3.下载压缩包(.zip,.tar,.tar.gz)后解压,进入解压缩的目录后执行pythonsetup.pyinstall命令本文主要针对pip安装时可能会碰到的一种情况,及解决办法:假如我要安装pylint模块,该模块非python自带模块,用import肯定不能导入,需要额外安装复制代码代码如下:>>>importpylintTraceback(mostre
系统 2019-09-27 17:46:05 1859
一、持久化--shelve持久化工具(1)作用:类似字典,用kv对保存数据,存取方式类似于字典(2)例子:通过一下案例创建了一个数据库,第二个程序我们读取了数据库#使用shelve创建文件并使用importshelveshv=shelve.open(r"shv.db")shv["one"]=1shv["two"]=2shv.close()shv=shelve.open(r"shv.db")try:print(shv["one"])print(shv["th
系统 2019-09-27 17:45:48 1859
脚本功能:利用itertools生成密码字典(迭代器形式)多线程并发从密码字典中取出密码进行验证验证成功后把密码写入文件中保存#!/usr/bin/envpython#-*-coding:UTF-8-*-#Author:Leslie-ximportitertoolsasitsimportthreadingimportrarfileimportoswords='0123456789abcdefghijklmnopqrstuvwxyz'#涉及到生成密码的参数f
系统 2019-09-27 17:45:48 1859
今天为大家整理了32个Python爬虫项目。整理的原因是,爬虫入门简单快速,也非常适合新入门的小伙伴培养信心。所有链接指向GitHub,祝大家玩的愉快~O(∩_∩)OWechatSogou[1]-微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。DouBanSpider[2]-豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选
系统 2019-09-27 17:45:44 1859
在不同平面上绘制二维条形图。本实例制作了一个3d图,其中有二维条形图投射到平面y=0,y=1,等。演示结果:完整代码:frommpl_toolkits.mplot3dimportAxes3Dimportmatplotlib.pyplotaspltimportnumpyasnp#Fixingrandomstateforreproducibilitynp.random.seed(19680801)fig=plt.figure()ax=fig.add_subpl
系统 2019-09-27 17:38:47 1859
网页可见区域宽:document.body.clientWidth网页可见区域高:document.body.clientHeight网页可见区域宽:document.body.offsetWidth(包括边线的宽)网页可见区域高:document.body.offsetHeight(包括边线的高)网页正文全文宽:document.body.scrollWidth网页正文全文高:document.body.scrollHeight网页被卷去的高:docum
系统 2019-08-29 23:44:10 1859
FTTP/FTTH的市场背景随着互联网的持续快速发展,网上新业务层出不穷,特别是近年来开始风靡的网络游戏,MSN和QQ等实时网络通信工具,使得人们对网络接入带宽的需求持续增加。主流接入技术从拨号逐渐过渡到速度更快的ADSL和以太网,也反映出人们这种对接入带宽需求永无止境、不断上升的趋势。与其他有线、无线通信技术相比,光纤通信在带宽容量方面具有无与伦比的优势。光纤通信经过多年的发展,已经在遍布全球的干线通信网络中占据了绝对优势。目前,骨干网络容量超前,带宽资
系统 2019-08-29 23:30:38 1859