分析分析网站寻找需要的网址用谷歌浏览器摁F12打开开发者工具,然后打开斗鱼颜值分类的页面,如图:在里面的请求中,最后发现它是以ajax加载的数据,数据格式为json,如图:圈住的部分是我们需要的数据,然后复制它的网址为https://www.douyu.com/gapi/rknc/directory/yzRec/1,出于学习目的只爬取第一页(减少服务器压力)。然后把网址放到浏览器中测试是否可以访问。如图:结果正常。分析json数据,提取图片链接最后分析发现
系统 2019-09-27 17:46:57 1787
fileinput模块可以遍历文本文件的所有行.它的工作方式和readlines很类似,不同点在于,它不是将全部的行读到列表中而是创建了一个xreadlines对象.下面是fileinput模块中的常用函数input()#它会返回能够用于for循环遍历的对象.filename()#返回当前文件的名称lineno()#返回当前(累计)的行数filelineno()#返回当前文件的行数isfirstline()#检查当前行是否是文件的第一行复制代码代码如下:#
系统 2019-09-27 17:46:52 1787
项目目录结构:按照下图所示创建build文件夹及内容Dockerfile:FROMubuntu:16.04FROMpython:3.6ENVhttp_proxy=http://172.16.6.67:3128ENVhttps_proxy=http://172.16.6.67:3128RUNapt-get-yupdate&&\apt-get-yupgrade&&\apt-getinstall-y\vim\git\python3-dev\python3-set
系统 2019-09-27 17:46:45 1787
什么是生成器?可以理解为一种数据类型,这种数据自动实现了迭代器协议(其他数据类型需要调用自己内置的_iter_方法),所以生成器就是可迭代对象python提供生成器的两种表现形式:1.生成器函数:常规函数的定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行。**函数里有yiled,执行函数就是一个生成器,不管yield位置在哪。采集函数创建生成器时,如
系统 2019-09-27 17:46:40 1787
多线程类似于同时执行多个不同程序,多线程运行有如下优点:使用线程可以把占据长时间的程序中的任务放到后台去处理。用户界面可以更加吸引人,比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度。程序的运行速度可能加快。在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行,必须
系统 2019-09-27 17:46:37 1787
本文记录了笔者用Python爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论。项目内容本案例选择>>商品类目:沙发;数量:共100页4400个商品;筛选条件:天猫、销量从高到低、价格500元以上。项目目的1.对商品标题进行文本分析词云可视化2.不同关键词word对应的sales的统计分析3.商品的价格分布情况分析4.商品的销量分布情况分析5.不同价格区间的商品的平均销量分布6.商品价格对销量的影响分析7.商品价格对销售额的影响分析8.不同
系统 2019-09-27 17:46:23 1787
django使用app机制来实现组件的重用,充分的利用已有的app可以极大的简化开发工作。目前django下的app虽然还不够丰富,却也还是有部分不错的。django-tagging就是一个不错的app。现在tag的应用非常广泛,tag基本上成了各网站的必备项目之一,django-tagging就是一个提供tag功能的app。django-tagging提供的功能非常丰富,使用起来却十分简单。下面我就介绍一些常用的用法,让大家对该app有个基本的了解,更详
系统 2019-09-27 17:46:09 1787
一、《新时代中国特色社会主义》的词云1、直接上代码:importjieba,wordcloudf=open("./data/新时代中国特色社会主义.txt","r",encoding="utf-8")#打开文件t=f.read()#读取文件f.close()#关闭文件ls=jieba.lcut(t)#分词txt="".join(ls)#将分好的词用空格串起来#配置参数#width:指定词云对象生成图片的宽度,默认400像素#height:指定词云对象生成图
系统 2019-09-27 17:45:38 1787
目录首先我们来安装Python,Python3.5+以上即可1、首先进入网站下载:点击打开链接(或自己输入网址https://www.python.org/downloads/),进入之后如下图,选择图中红色圈中区域进行下载。2、下载完成后如下图所示3、双击exe文件进行安装,如下图,并按照圈中区域进行设置,切记要勾选打钩的框,然后再点击Customizeinstallation进入到下一步:4、对于上图中,可以通过Browse进行自定义安装路径,也可以直
系统 2019-09-27 17:45:34 1787
python通过安装使用paramiko模块,将本地文件上传到服务器上importparamikoimportdatetimeimportoshostname='服务器ip'username='root'password='服务器密码'port=22#配置信息可以写到配置文件中#loacl_file是要上传的本地文件路径#remote_path是要上传到服务器上指定文件的路径defupload(local_file,remote_path):try:t=p
系统 2019-09-27 17:45:24 1787
概述考虑这样一个问题,有hello.py脚本,输出”hello,world!”;有TestInput.py脚本,等待用户输入,然后打印用户输入的数据。那么,怎么样把hello.py输出内容发送给TestInput.py,最后TestInput.py打印接收到的”hello,world!”。下面我来逐步讲解一下shell的交互方式。hello.py代码如下:#!/usr/bin/pythonprint"hello,world!"TestInput.py代码如
系统 2019-09-27 17:38:38 1787
python异常处理机制和java类似,采用try-except-finally的结构.try-except检测异常格式复制代码代码如下:try:try_statementexcept(ErrorType1,ErrorType2),e:handle_statementfinally:finally_statement实例复制代码代码如下:#!/usr/bin/pythontry:a=12b=0c=a/bexceptException,e:print"Exc
系统 2019-09-27 17:38:36 1787
写程序经常需要用到从文件或者标准输入中按行读取信息,这里汇总一下。方便使用1.C++读取文件#include#includeintmain(){constchar*in_file="input_file_name";constchar*out_file="output_file_name";FILE*p_in=fopen(in_file,"r");if(!p_in){printf("openfile%sfailed!!!",in_file);return-
系统 2019-09-27 17:38:25 1787
实例如下:defTestDic1():dict2={'aa':222,11:222}forvalindict2:printvaldefTestDic2():dict2={'aa':222,11:222}for(key,val)indict2.items():printkey,":",valdefTestList1():list=[1,2,3,4,5,3,2,'ada','fs3']foriinrange(len(list)):printlist[i]def
系统 2019-09-27 17:38:16 1787
想必很多初次接触python都会见到这样一个语句,if__name__=="__main__":那么这个语句到底是做什么用的呢?在解释之前,首先要声明的是,不管你是多么小白,你一定要知道的是:1.python文件的后缀为.py;2..py文件既可以用来直接执行,就像一个小程序一样,也可以用来作为模块被导入(比如360安全卫士,就是依靠一个个功能模块来实现的,好比360安全卫士本身框架是一个桌面,而上面的图标就是快捷方式,这些快捷方式所指向的就是这一个个功能
系统 2019-09-27 17:38:10 1787