Python

详解详解Python中writelines()方法的使用

writelines()方法写入字符串序列到文件。该序列可以是任何可迭代的对象产生字符串,字符串为一般列表。没有返回值。语法以下是writelines()方法的语法:fileObject.writelines(sequence)参数sequence--这是字符串的序列。返回值此方法不返回任何值。例子下面的例子显示writelines()方法的使用。#!/usr/bin/python'#Openafileinwitremodefo=open("foo.txt

系统 2019-09-27 17:46:22 2263

Python

Python按行读取文件的简单实现方法

1:readline()file=open("sample.txt")while1:line=file.readline()ifnotline:breakpass#dosomethingfile.close()一行一行得从文件读数据,显然比较慢;不过很省内存;测试读10M的sample.txt文件,每秒大约读32000行;2:fileinputimportfileinputforlineinfileinput.input("sample.txt"):pas

系统 2019-09-27 17:38:15 2263

Python

编写Python爬虫抓取暴走漫画上gif图片的实例分享

本文要介绍的爬虫是抓取暴走漫画上的GIF趣图,方便离线观看。爬虫用的是python3.3开发的,主要用到了urllib、request和BeautifulSoup模块。urllib模块提供了从万维网中获取数据的高层接口,当我们用urlopen()打开一个URL时,就相当于我们用Python内建的open()打开一个文件。但不同的是,前者接收一个URL作为参数,并且没有办法对打开的文件流进行seek操作(从底层的角度看,因为实际上操作的是socket,所以理

系统 2019-09-27 17:37:40 2263

Python

Python3网络爬虫之解析库pyquery的使用(三)

pyquery的安装:ubtuntu和windows下安装lxml:pip3installpyquery验证安装:安装完成,在python命令行下输入importpyquery没有报错,证明库已经安装好了。pyquery的介绍:PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery是Python仿照jQuery的严格实现。语法与jQuery几乎完全相同,所

系统 2019-09-27 17:55:39 2262

Python

廖雪峰Python教程笔记(四)

廖雪峰Python教程笔记(四)6高级特性切片slice迭代列表生成式生成器迭代器6高级特性在Python中,代码不是越多越好,而是越少越好。代码不是越复杂越好,而是越简单越好。基于这一思想,我们来介绍Python中非常有用的高级特性,1行代码能实现的功能,决不写5行代码。请始终牢记,代码越少,开发效率越高。切片slice经常取指定索引范围的操作,用循环十分繁琐,因此,Python提供了切片(Slice)操作符取前3个元素,用一行代码就可以完成切片:L[0

系统 2019-09-27 17:55:36 2262

Python

Python实现K折交叉验证法的方法步骤

学习器在测试集上的误差我们通常称作“泛化误差”。要想得到“泛化误差”首先得将数据集划分为训练集和测试集。那么怎么划分呢?常用的方法有两种,k折交叉验证法和自助法。介绍这两种方法的资料有很多。下面是k折交叉验证法的python实现。##一个简单的2折交叉验证fromsklearn.model_selectionimportKFoldimportnumpyasnpX=np.array([[1,2],[3,4],[1,3],[3,5]])Y=np.array([

系统 2019-09-27 17:54:40 2262

Python

Python 入门之 内置模块 -- re模块

Python入门之内置模块--re模块1、re模块(1)什么是正则?正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过re模块实现。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。元字符匹配内容\w匹配字母(包含中文)或数字或下划线\W匹配非字母(包含中文)或数字或下划线\s匹配任意的空白符\S匹配任意非空白符

系统 2019-09-27 17:52:48 2262

Python

Python产生一个数值范围内的不重复的随机数的实现方法

Python产生一个数值范围内的不重复的随机数,可以使用random模块中的random.sample函数,其用法如下:importrandomrandom.sample(population,k)函数从序列或集合population中返回一个长度为k的随机数列表,并且列表中的随机数元素之间是不重复的,如:>>>a=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]>>>a[1,2,3,4,5,6,7,

系统 2019-09-27 17:52:06 2262

Python

python爬取Ajax动态加载网页过程解析

常见的反爬机制及处理方式1、Headers反爬虫:Cookie、Referer、User-Agent解决方案:通过F12获取headers,传给requests.get()方法2、IP限制:网站根据IP地址访问频率进行反爬,短时间内进制IP访问解决方案:1、构造自己IP代理池,每次访问随机选择代理,经常更新代理池2、购买开放代理或私密代理IP3、降低爬取的速度3、User-Agent限制:类似于IP限制解决方案:构造自己的User-Agent池,每次访问随

系统 2019-09-27 17:51:32 2262

Python

python的pygal模块绘制反正切函数图像方法

python是一个很有趣的语言,可以在命令行窗口运行。python中有很多功能强大的模块,这篇经验告诉你,如何使用python的pygal模块绘制反正切函数图像。1.简介pygal是一个SVG图表库。SVG是一种矢量图格式。全称ScalableVectorGraphics--可缩放矢量图形。用浏览器打开svg,可以方便的与之交互。2.pygal安装Windows下pygal的安装比pip还要简单,直接在命令模式执行python-mpipinstall--u

系统 2019-09-27 17:51:22 2262

Python

Python3系统学习记录

Python3系统学习记录1、Python简介2、安装Python3.73、第一个Python程序4、Python基础5、函数6、高级特征7、函数式编程8、模块9、面向对象编程10、面向对象高级编程11、错误、调试和测试12、IO编程13、进程和线程14、正则表达式15、常用内建模块16、常用第三方模块17、virtuallenv18、图形界面19、网络编程1、Python简介--代码简洁,运行速度慢--日常任务、网站(youtobe、Instagram)

系统 2019-09-27 17:49:29 2262

Python

python批量修改图片尺寸,并保存指定路径的实现方法

如下所示:importosfromPILimportImagefilename=os.listdir("D:\\Work\\process\\样本处理\\polyu-all-train")base_dir="D:\\Work\\process\\样本处理\\polyu-all-train\\"new_dir="D:\\Work\\process\\样本处理\\polyu\\"size_m=128size_n=128forimginfilename:imag

系统 2019-09-27 17:49:04 2262

Python

用Python从0开始实现一个中文拼音输入法的思路详解

众所周知,中文输入法是一个历史悠久的问题,但也实在是个繁琐的活,不知道这是不是网上很少有人分享中文拼音输入法的原因,接着这次NLPProject的机会,我觉得实现一发中文拼音输入法,看看水有多深,结果发现还挺深的,但是基本效果还是能出来的,而且看别的组都做得挺好的,这次就分享一下我们做的结果吧。(注:此文假设读者已经具备一些隐马尔可夫模型的知识)任务描述实现一个中文拼音输入法。经过分析,分为以下几个模块来对中文拼音输入法进行实现:核心功能包括拼音切分(Sp

系统 2019-09-27 17:48:20 2262

Python

python离线下载和安装库

离线批量下载,首先可以使用:pipfreeze>requirements.txt可以将其中的==改成>=,批量修改即可使用命令,把下载的库放入dependency文件夹下:中途可能因为网络原因下载失败,再次执行该命令即可,已经下载好的包不会重复下载pipdownload-ddependency-rrequirements.txt批量离线安装:pipinstall--no-index--find-links=安装包路径-rrequirements.txt下载

系统 2019-09-27 17:47:58 2262

Python

聊聊 Python 的单元测试框架(一):unittest

聊聊Python的单元测试框架(一):unittest作者:HelloGitHub-ProdesireHelloGitHub的《讲解开源项目》系列,项目地址:https://github.com/HelloGitHub-Team/Article前言说到Python的单元测试框架,想必接触过Python的朋友脑袋里第一个想到的就是unittest。的确,作为Python的标准库,它很优秀,并被广泛用于各个项目。但你知道吗?其实在Python众多项目中,主流的

系统 2019-09-27 17:47:56 2262