拥有Python标签的文章
Python

Python爬虫:现学现用xpath爬取豆瓣音乐

爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比。抓取方式性能使用难度正则表达式快困难Lxml快简单BeautifulSoup慢简单这样一比较我我选择了Lxml(xpath)的方式了,虽然有三种方式,但肯定是要选择最好的方式来爬虫,这个道理大家都懂,另外有兴趣的朋友也可以去了解另外两种爬虫方式!好了现在来讲讲xpath由于Xpath属于lxml模块

系统 2019-09-27 17:49:52 2015

Python

python利用7z批量解压rar的实现

一开始我使用了rarfile这个库,奈何对于含有密码的压缩包支持不好,在linux上不抛出异常;之后有又尝试了unrar。。比rarfile还费劲。。所以用了调用系统命令的方法,用7z来解压通过apt可以安装上7z-full和7z的rar插件有一个地方要注意-o和-p与后面的目录、密码之间没有空格!!同样可以用这个代码暴力破解压缩包密码#coding:utf-8importosimportzipfileimporttracebackimporttimeim

系统 2019-09-27 17:49:33 2015

Python

终极利器|一篇文章讲清楚Python虚拟环境

阅读更多全文阅读6分钟我在之前写过一篇「Python新手常见的几个问题及工具推荐」说过新手往往没有注意环境隔离,导致Python项目包与包之间冲突。并且Python2与3代码执行有问题等等。鉴于此我今天给大家聊聊关于Python环境隔离问题以及如何进行隔离。Virtualenv我们都知道Python开发项目很容易,项目也经得起工业级别考验。很多开发者都会习惯用Python开发项目,但是由于我们每个项目情况都有些不一样。比如今天可能用的是Django1.8,

系统 2019-09-27 17:48:20 2015

Python

python 打印或输出对象

python中对对象dump报错:ObjectoftypeCOUPON_CATE_V2isnotJSONserializable使用classObj.__dict__如打印对象:print(str(coupon_cate_v2.__dict__))

系统 2019-09-27 17:48:11 2015

Python

用python打印九九乘法表

标题python基础题~九九乘法表forxinrange(1,10):forjinrange(1,x+1):print('{0}*{1}={2}'.format(x,j,x*j),end='\t')print()1*1=12*1=22*2=43*1=33*2=63*3=94*1=44*2=84*3=124*4=165*1=55*2=105*3=155*4=205*5=256*1=66*2=126*3=186*4=246*5=306*6=367*1=77*2

系统 2019-09-27 17:47:42 2015

Python

python小案例_工作报告词云

一、《新时代中国特色社会主义》的词云1、直接上代码:importjieba,wordcloudf=open("./data/新时代中国特色社会主义.txt","r",encoding="utf-8")#打开文件t=f.read()#读取文件f.close()#关闭文件ls=jieba.lcut(t)#分词txt="".join(ls)#将分好的词用空格串起来#配置参数#width:指定词云对象生成图片的宽度,默认400像素#height:指定词云对象生成图

系统 2019-09-27 17:45:38 2015

Python

Python提取网页中超链接的方法

下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接代码如下:importurllib2importreurl='http://www.sunbloger.com/'req=urllib2.Request(url)con=urllib2.urlopen(req)doc=con.read()con.close()links=re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]

系统 2019-09-27 17:38:07 2015

Python

在arcgis使用python脚本进行字段计算时是如何解决中文问题的

一、引言在arcgis打开一个图层的属性表,可以对属性表的某个字段进行计算,但是在平常一般都是使用arcgis提供的字段计算器的界面进行傻瓜式的简答的赋值操作,并没有使用到脚本对字段值进行逻辑的操作。由于最近一直在学python脚本,刚好又碰上一好基友需要我的助攻(使用arcgis制图),这就用上了。本以为能够轻松搞定的,没想到搬石头砸脚了,下面就来说我是如何被砸脚的吧。二、问题描述:将test字段中值为“湖南”的变为“湖南省”。这个逻辑是相当的简单,使用

系统 2019-09-27 17:38:07 2015

Python

在Python的Django框架中编写错误提示页面

你应该在生产环境中把TEMPLATE_DEBUGFalse如果这个设为``True``,为了在那个好看的错误页面上显示足够的东西,Django的模版系统就会为每一个模版保存一些额外的信息。实现一个404模板如果``DEBUG``设置为``True``,Django会显示那个自带的404错误页面。但如果``DEBUG``被设置成``False``,那它的行为就不一样了:他会显示一个在你的模版根目录中名字叫``404.html``的模版所以,当你准备部署你的应

系统 2019-09-27 17:37:36 2015

Python

Python将视频或者动态图gif逐帧保存为图片

本文是基于opencv将视频和动态图gif保存为图像帧。可以根据输入视频格式的不同,修改第21行。对动图的处理不同于视频,PIL库包含对图像序列的基本支持。当打开gif图像时,自动加载第一帧。当图像读取完成时,抛出EOFError异常。我们可以使用seek()与tell()函数完成图像帧的读取。本代码的前部分是对文件的读取。数据集文件结构如下:|——datasets|——action1action1_1.gifaction1_2.gif......|——a

系统 2019-09-27 17:57:27 2014

Python

跟老齐学Python之有容乃大的list(1)

前面的学习中,我们已经知道了两种python的数据类型:int和str。再强调一下对数据类型的理解,这个世界是由数据组成的,数据可能是数字(注意,别搞混了,数字和数据是有区别的),也可能是文字、或者是声音、视频等。在python中(其它高级语言也类似)把状如2,3这样的数字划分为一个类型,把状如“你好”这样的文字划分一个类型,前者是int类型,后者是str类型(这里就不说翻译的名字了,请看官熟悉用英文的名称,对日后编程大有好处,什么好处呢?谁用谁知道!)。

系统 2019-09-27 17:56:59 2014

Python

Python 详解基本语法_函数_返回值

Python详解基本语法概要:函数的返回值是函数重要的组成部分。函数的根本在于实现程序的部分功能,所以很多时候我们需要将函数执行后的结果返回给程序再由程序作出进一步的操作。可以说是函数的返回值令函数与函数之间,函数与主程序之间更加紧密的联系起来。函数的返回值在Python的函数中都有一个返回值,默认为None。也可以使用returnvalue语句来定义一个且只能定义一个可为任意类型的返回值。但是我们能够返回一个序列类型的对象,来实现返回多个值的效果。Exa

系统 2019-09-27 17:56:49 2014

Python

python 计算文件夹里所有内容的大小总和

计算文件夹里所有内容的大小总和递归方法'''计算文件夹的大小'''importosdefdir_file_size(path):ifos.path.isdir(path):file_size=0dir_list=os.listdir(path)fordir_nameindir_list:file_path=os.path.join(path,dir_name)ifos.path.isfile(dir_name):file_size+=os.path.get

系统 2019-09-27 17:56:49 2014

Python

【Python】文本情感分析及绘制词云

码字不易,喜欢请点赞!!!这篇文章主要分享了使用Python来对文本数据进行情感分析以及绘制词云。主要步骤包括:1.文本预处理2.文本分词3.去除停用词(这里设置为单个词和一些常见的停用词)4.词频统计5.情感分析6.绘制词云首先导入所需的程序办和文本数据:#带入程序包importpandasaspdimportreimportjiebaimportcollectionsfromwordcloudimportWordCloud,ImageColorGene

系统 2019-09-27 17:56:28 2014