早听说用python做网络爬虫非常方便,正好这几天单位也有这样的需求,需要登陆XX网站下载部分文档,于是自己亲身试验了一番,效果还不错。本例所登录的某网站需要提供用户名,密码和验证码,在此使用了python的urllib2直接登录网站并处理网站的Cookie。Cookie的工作原理:Cookie由服务端生成,然后发送给浏览器,浏览器会将Cookie保存在某个目录下的文本文件中。在下次请求同一网站时,会发送该Cookie给服务器,这样服务器就知道该用户是否合
系统 2019-09-27 17:53:11 2065
微信订阅号:Rabbit_svip变量就是可变的量。在Python中使用变量时,要遵守一些规则和指南。变量名只能包含字母、数字和下划线。变量名可以字母或下划线打头,但不能以数字打头。变量名不能包含空格,但可以使用下划线来分隔其中的单词。不要将Python关键字和函数名用作变量名。变量的声明和赋值在Python中声明变量并赋值很简单。message="HelloPython!"上面的例子中,message就是变量名;等号右边就是值。把值赋给变量。变量名=值这
系统 2019-09-27 17:52:36 2065
原文链接:https://www.numpy.org.cn/本节内容:数组的创建数组操作(获取数组属性,数组运算,数组复制,数组展开等等)获取数组特定元素1、创建数组(1)常用的创建一维数组的方式#可以将任意类型的序列(列表、元组、字典、集合、字符串)传递给np.array()a1=np.array([1,2,3,4])#传递列表a2=np.array((1,2,3,4))#传递元组a3=np.array([1,2,3,4],dtype=float)#在创
系统 2019-09-27 17:52:35 2065
今天谈一下关于python中input的一些基本用法(写给新手入门之用,故只谈比较实用的部分)。首先,我们可以看一下官方文档给我们的解释(在python的shell中输入命令即可):上面的英文说的是什么呢?大家有兴趣的可以自己在网上翻译一下,大致说的就是input这个函数,第一个参数是提示语,它默认是空的。在我们使用input的时候,会从标准输入中读取一个string,即字符串(请注意,这里很重要,下面我们会继续说),对于用户输入的换行是不会读入的,因为我
系统 2019-09-27 17:52:12 2065
目录第十五章、Python多线程同步锁,死锁和递归锁1.引子:2.同步锁3.死锁引子:4.递归锁RLock原理:不多说,放代码总结:5.大总结第十五章、Python多线程同步锁,死锁和递归锁1.引子:1.创建线程对象t1=threading.Thread(target=say,args=('tony',))2.启动线程t1.start()后面又说了两个点就是join和守护线程的概念以上就是python多线程的基本使用说明:前面说的两个功能是相互独立的,
系统 2019-09-27 17:51:52 2065
搜狗微信搜索提供两种类型的关键词搜索,一种是搜索公众号文章内容,另一种是直接搜索微信公众号。通过微信公众号搜索可以获取公众号的基本信息及最近发布的10条文章,今天来抓取一下微信公众号的账号信息爬虫首先通过首页进入,可以按照类别抓取,通过“查看更多”可以找出页面链接规则:importrequestsasreqimportrereTypes=r'id="pc_\d*"uigs="(pc_\d*)">([\s\S]*?)'Entry="http://weixin
系统 2019-09-27 17:51:38 2065
黑客泛指擅长IT技术的人群,简单地说,是对计算机系统和网络的缺陷和漏洞的发现进行攻击。他们有着高超的技术能力,同时身怀多种编程语言,随随便便就能攻击别的网站,进行活动。在黑客中,最受喜欢的就是Python语言。有资料显示,目前GitHub代码库中,有超过20%的网络攻击工具或PoC(概念验证)代码都是采用Python编写的,这表明Python是黑客开发网络攻击工具时的首选。作为一门编程语言,Python在信息安全领域拥有极大的优势,其中很重要的一个原因就是
系统 2019-09-27 17:51:31 2065
创建类Python类使用class关键字来创建。简单的类的声明可以是关键字后紧跟类名:复制代码代码如下:classClassName(bases):'classdocumentationstring'#'类文档字符串'class_suite#类体实例化通过类名后跟一对圆括号实例化一个类复制代码代码如下:mc=MyClass()#instantiateclass初始化类‘int()'构造器def__int__(self):pass注意:self类似Java的
系统 2019-09-27 17:50:12 2065
理解新概念PythonV2.2中引入了迭代器的思想。唔,这并不十分正确;这种思想的“苗头”早已出现在较老的函数xrange()以及文件方法.xreadlines()中了。通过引入yield关键字,Python2.2在内部实现的许多方面推广了这一概念,并使编程定制迭代器变得更为简单(yield的出现使函数转换成生成器,而生成器反过来又返回迭代器)。迭代器背后的动机有两方面。将数据作为序列处理通常是最简单的方法,而以线性顺序处理的序列通常并不需要都同时实际存在
系统 2019-09-27 17:49:57 2065
文章作者:Tyan博客:noahsnail.com|CSDN|1.引言众所周知,Python语言简单、易学、开源、具有丰富的库,Python的第一个编译器是用C语言实现的。但Python的缺点也非常明显,最让人诟病的就是Python的性能问题。因此,为了提高程序的运行效率,通常会将程序的关键部分使用C或C++重写,编译成动态链接库,然后在Python(CPython)中进行调用。运行环境:Ubuntu16.04、Python2.7、Python3.5。2.
系统 2019-09-27 17:49:18 2065