本文实例讲述了Python实现的文轩网爬虫。分享给大家供大家参考,具体如下:encoding=utf8importpymysqlimporttimeimportsysimportrequestsimportos#捕获错误importtracebackimporttypes#将html实体化importcgiimportwarningsreload(sys)sys.setdefaultencoding('utf-8')frompyqueryimportPyQ
系统 2019-09-27 17:55:19 1941
Anaconda是一个旗舰版的python安装包,因为普通的python没有库,如果需要安装一些重要的库,要经常一个一个下载,会非常麻烦.所以这个一个集成的,可以手动批量升级的软件.而且库的安装也很全下载速度快.从官网下载完以后,next安装好.配置环境变量,把安装的文件夹的绝对路径拷贝到环境变量的path里面.不配置python都启动不了,当然,如果之前安装过其他版本的python可以考虑把之前多余的环境变量路径删掉.打开anacondaprompt,输
系统 2019-09-27 17:55:04 1941
锁在使用用的过程中需要导入threading模块的Lock类使用锁:当多个线程几乎同时修改某一个共享数据的时候,需要进行同步控制线程同步能够保证多个线程安全访问竞争资源,最简单的同步机制是引入互斥锁。互斥锁为资源引入一个状态:锁定/非锁定。锁的语法创建锁、锁定锁、释放锁fromthreadingimportLock#创建锁mutex=Lock()#获取锁(上锁)mutex.acquire()#释放锁(解锁)mutex.release()在锁定锁的过程中ac
系统 2019-09-27 17:55:04 1941
1、元素的分类需求:有如下集合[11,22,33,44,55,66,77,88,99,90……],将所有大于66的值保存在字典的第一个key中,将小于66的值保存在第二个key的值中代码实现:1#定义一个list列表2li=[11,22,33,44,55,66,77,88,99,90]3#定义空字典4dic={"k1":[],"k2":[]}5foriinli:6ifi<=66:7dic['k1'].append(i)8else:9dic['k2'].ap
系统 2019-09-27 17:54:43 1941
戳这里~小结Python的函数具有非常灵活的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。默认参数一定要用不可变对象,如果是可变对象,程序运行时会有逻辑错误!要注意定义可变参数和关键字参数的语法:*args是可变参数,args接收的是一个tuple;**kw是关键字参数,kw接收的是一个dict。以及调用函数时如何传入可变参数和关键字参数的语法:可变参数既可以直接传入:func(1,2,3),又可以先组装list或tuple,再通过*args传
系统 2019-09-27 17:54:27 1941
一:从各种不同的格式文件中导入数据,总结目前最常用的文件格式导入数据的一些方法:#-*-coding:utf-8-*-fromnumpyimport*defloadDataSet(fileName):'''导入数据'''numFeat=len(open(fileName).readline().split('\t'))-1dataMat=[]labelMat=[]fr=open(fileName)forlineinfr.readlines():lineAr
系统 2019-09-27 17:54:24 1941
话不多说,代码说话:importnumpyasnpimportmathclassConv2D(object):def__init__(self,shape,output_channels,ksize=3,stride=1,method='VALID'):self.input_shape=shapeself.output_channels=output_channelsself.input_channels=shape[-1]self.batchsize=s
系统 2019-09-27 17:54:06 1941
利用python库random,string生成大小写字母和数字的随机验证码importrandomimportstringdefgenerate_code(bit_num):''':parambit_num:生成验证码位数:return:返回生成的验证码'''all_str=string.printable.split('!')[0]code=''.join([random.choice(all_str)foriinrange(bit_num)])ret
系统 2019-09-27 17:54:02 1941
Windows•安装lxml最好的安装方式是通过wheel文件来安装,http://www.lfd.uci.edu/~gohlke/pythonlibs/,从该网站找到lxml的相关文件。假如是Python3.5版本,WIndows64位系统,那就找到lxml‑3.7.2‑cp35‑cp35m‑win_amd64.whl这个文件并下载,然后通过pip安装。下载之后,运行如下命令安装:pip3installwheelpip3installlxml‑3.7.2
系统 2019-09-27 17:53:34 1941
requests提供了一个叫做session类,来实现客户端和服务端的会话保持使用方法1.实例化一个session对象2.让session发送get或者post请求session=requests.session()session.get(url,headers)下面就用人人网来实战一下#coding=utf-8importrequestssession=requests.session()#登录的表单urlpost_url="http://www.ren
系统 2019-09-27 17:53:16 1941