协程是什么我们已经做过不少爬虫项目,不过我们爬取的数据都不算太大,如果我们想要爬取的是成千上万条的数据,那么就会遇到一个问题:因为程序是一行一行依次执行的缘故,要等待很久,我们才能拿到想要的数据。既然一个爬虫爬取大量数据要爬很久,那我们能不能让多个爬虫一起爬取?这样无疑能提高爬取的效率,就像一个人干不完的活儿,组个团队一起干,活一下被干完了。这是一个很好的思路——让多个爬虫帮我们干活。但具体怎么用Python实现这事呢?我们可以先别急着想怎么实现这件事,后
系统 2019-09-27 17:50:16 1839
python项目如何在另一个环境上重新构建项目所需要的运行环境依赖包?使用的时候边记载是个很麻烦的事情,总会出现遗漏的包的问题,这个时候手动安装也很麻烦,不能确定代码报错的需要安装的包是什么版本。这些问题,requirements.txt都可以解决!生成requirements.txt,有两种方式:第一种适用于单虚拟环境的情况::pipfreeze>requirements.txt为什么只适用于单虚拟环境?因为这种方式,会将环境中的依赖包全都加入,如果使用
系统 2019-09-27 17:50:13 1839
目录本面试题题库,由公号:非本科程序员整理发布第1题:Flask中的请求上下文和应用上下文是什么?第2题:django中间件的使用?第3题:django开发中数据做过什么优化?第4题:解释一下Django和Tornado的关系、差别?DjangoTornado第5题:什么是restfulAPI,谈谈你的理解?REST的特点第6题:关注题,最近在公号更新一个神奇的系列入门文章@本面试题题库,由公号:非本科程序员整理发布第1题:Flask中的请求上下文和应用上
系统 2019-09-27 17:50:03 1839
通过Python\text{Python}Python仿真一个FireFoxorChrome\text{FireFoxorChrome}FireFoxorChrome浏览器,然后通过send_keys\text{send\_keys}send_keys发送数据到input\text{input}input文本框,当数据字节数比较小时,完全不会发现任何异常,但是当发送长文本时,会出现卡顿或者阻塞的现象,导致数据的实时性下降了很多。查看send_keys\te
系统 2019-09-27 17:49:52 1839
具体代码如下所示:importsmtplib,email,os,timefromemail.mime.multipartimportMIMEMultipartfromemail.mime.textimportMIMETextfromemail.headerimportHeader#设置smtplib所需的参数smtpserver='smtp.qq.com'#SMTP服务器地址username='xxx@qq.com'#发件人地址,通过控制台创建的发件人地址
系统 2019-09-27 17:49:18 1839
通常来说,Python的变量/数据类型非常多,但是它是不需要用户指定的,因为有些是根据部份系统函数生成,另外一些是自动根据变量的值识别的,这些数据类型常量在classtypes定义,所以使用时需要importtypes如:复制代码代码如下:importtypesa=[1,2,3]iftype(a)istypes.ListType:printaelse:print'notlist'Python的具体变量/数据类型如下:NoneTypeNone类型TypeTy
系统 2019-09-27 17:48:24 1839
前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童鞋不要再走弯路。1.搜索引擎的选取选择一个好的搜索引擎意味着你能够得到更准确的搜索结果。我用过的搜索引擎有四种:Google、Bing、Baidu、Yahoo!。作为程序员,我首选Google。但当我看见我最爱的Google返回给我的全是一堆的js代码,根本没我想要的搜索结果。于是我转而投向了Bing的阵营,在用过一段
系统 2019-09-27 17:48:21 1839
5.1字典数据类型字典的索引可以使用许多不同类型的数据,不只是整数。字典的索引被称为“键”,键及其关联的值称为“键—值”对,在代码中,字典输入时带花括号{}。字典中的表项是不排序的,所以字典不能像列表那样切片。5.1.1keys()、values()和items()方法key()、values()和items()方法将返回类似于列表的值,分别对应于字典的键、值和键-值对。这些方法返回的值不是真正的列表,他们不能被修改,没有append()方法。但这些数据类
系统 2019-09-27 17:48:20 1839
0x00:使用xpath进行网页解析#coding:utf-8importrequestsimportosimportrefromlxmlimportetreeimporttimedefget_title(title):#获取标题,创建文件path=r"./Pic/"+titleifos.path.exists(path):#文件夹存在,返回returnpathelse:os.makedirs(path)#创建空文件夹returnpathdefpic_ge
系统 2019-09-27 17:48:14 1839
python中,遍历dict的方法有四种。但这四种遍历的性能如何呢?我做了如下的测试l=[(x,x)forxinxrange(10000)]d=dict(l)fromtimeimportclockt0=clock()foriind:t=i+d[i]t1=clock()fork,vind.items():t=k+vt2=clock()fork,vind.iteritems():t=k+vt3=clock()fork,vinzip(d.iterkeys(),d
系统 2019-09-27 17:48:13 1839