用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示:复制代码代码如下:importurllib2url="http://mm.taobao.com/json/request_top_list.htm?type=0&page=1"up=urllib2.urlopen(url)#打开目标页面,存入变量upcont=up.read()#从up中读入该HTML文件key1='ke
系统 2019-09-27 17:53:24 1841
首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来。友情提示糗事百科在前一段时间进行了改版,导致之前的代码没法用了,会导致无法输出和CPU占用过高的情况,是因为正则表达式没有匹配到的缘故。现在,博主已经对程序进行了重新修改,代码亲测可用,包括截图和说明,之前一直在忙所以没有及时更新,望大家海涵!糗事百科又又又又改版了,博主已经没心再去一次次匹配它了,如果大家遇到长时间运行不出结果也不报错的情况,请大家参考最新
系统 2019-09-27 17:52:43 1841
Python自带的pdb库,发现用pdb来调试程序还是很方便的,当然了,什么远程调试,多线程之类,pdb是搞不定的。用pdb调试有多种方式可选:1.命令行启动目标程序,加上-m参数,这样调用myscript.py的话断点就是程序的执行第一行之前复制代码代码如下:python-mpdbmyscript.py2.在Python交互环境中启用调试复制代码代码如下:>>>importpdb>>>importmymodule>>>pdb.run(‘mymodule.
系统 2019-09-27 17:51:04 1841
dict的特性dict是python中的一个可变的数据类型,用{}表示,dict的key必须是不可变的数据类型,而value的数据类型可以任意。格式:{key:value,key:value,key:value}注:键值对如果是字符串使用单引号,最后一个键值对没有逗号dict的优点①:查询速度快,可以二分查找②:key是不可以重复的注:不可变数据类型:元组,bool,int,str可以hashset可变数据类型:dict,listdict的方法1,增加的方
系统 2019-09-27 17:50:26 1841
前天在微信上遇到一个小伙伴问我一个关于Sublimetext配置Python解释器的问题,可能是初学者,对这方面还不是很懂,想使用快捷键但是徒劳一场,因为缺少Python解释器,直接按下快捷键Ctrl+B是不会得到想要的结果的。鉴于此,如果有小伙伴想使用Sublime跑Python程序的话,那么配置Python解释器是必不可少的一步,这里小编整理这篇手把手教程,希望为后来者铺砖引路。下面是详细教程:1、首先打开Sublime,如下图所示,然后选择“Pref
系统 2019-09-27 17:50:11 1841
01-初心缘由最近在研究语音识别方向,看了很多的语音识别的资料和文章,了解了一下语音识别的前世今生,其中包含了很多算法的演变,目前来说最流行的语音识别算法主要是依赖于深度学习的神经网络算法,其中RNN扮演了非常重要的作用,深度学习的应用真正让语音识别达到了商用级别。然后我想动手自己做一个语音识别系统,从GitHub上下载了两个流行的开源项目MASR和ASRT来进行复现,发现语音识别的效果没有写的那么好,其中如果要从零来训练自己的语言模型势必会非常耗时。因此
系统 2019-09-27 17:49:34 1841
这篇快文介绍了使用Gmail作为您的e-mail服务器,通过Python的内置SMTP库发送电子邮件。它并不复杂,我保证。下面是如何在Python中登录GMail:importsmtplib#Thebelowcodeneverchanges,thoughobviouslythosevariablesneedvalues.session=smtplib.SMTP('smtp.gmail.com',587)session.ehlo()session.start
系统 2019-09-27 17:49:08 1841
使用pip安装python库的几种方式1、使用pip在线安装1.1安装单个package格式如下:pipinstallSomePackage示例如下:比如:pipinstallscipy或者指定版本安装:pipinstallscipy==1.3.01.2安装多个package示例如下:pipinstall-rreq.txtreq.txt可以通过以下命令获取:pipfreeze>req.txt1.3在线安装的其它问题1.3.1代理问题如果需要通过代理安装,可
系统 2019-09-27 17:48:46 1841
客户要求将微信的带参二维码增加log,首次生成的时候log直接是个没颜色的,客户想要给点颜色看看,第一次生成图片如下生成的客户需要的原因是因为底图的数据通道和log的数据通道不同为L8像素黑白,log为RGB3x8位像素真彩通道一个图片可以包含一到多个数据通道,如果这些通道具有相同的维数和深度,Pil允许将这些通道进行叠加模式11位像素,黑和白,存成8位的像素L8位像素,黑白P8位像素,使用调色板映射到任何其他模式RGB3×8位像素,真彩RGBA4×8位像
系统 2019-09-27 17:48:30 1841
好吧,我承认我是对晚上看到一张合适的票转让但打过电话去说已经被搞走了这件事情感到蛋疼。直接上文件吧。#coding:utf-8'''春运查询火车票转让信息Author:piglei2007@gmail.comDate:2011.01.25'''importreimportosimporttimeimporturlparseimportdatetimeimporttracebackimporturllib2importsocketsocket.setdefa
系统 2019-09-27 17:47:42 1841