最近博主手上有一个爬虫项目,开始深入研究python爬虫开发,这是我篇博客也相当于是我的学习笔记,我认为学习爬虫第一步,先学习python多线程与多进程,熟悉网络编程,接下来会陆续以博客的方式跟大家做分享。多进程Python实现多进程的方式主要有两种,一种方法是使用os模块中的fork方法,另一种方法是使用multiprocessing模块。这两种方法的区别在于前者仅适用于Unix/Linux操作系统,对Windows不支持,后者则是跨平台的实现方式,目前
系统 2019-09-27 17:53:30 1721
在C++11和C#中都有匿名函数的存在。下面看看在python中匿名函数的使用。1.lambda只是一个表达式,函数体比def简单很多。2.lambda的主体是一个表达式,而不是一个代码块。仅仅能在lambda表达式中封装有限的逻辑进去。3.lambda表达式是起到一个函数速写的作用。允许在代码内嵌入一个函数的定义。例1.定义一个lambda表达式,求三个数的和#-*-coding:UTF-8-*-f=lambdax,y,z:x+y+zprintf(1,2
系统 2019-09-27 17:53:21 1721
python一直对中文支持的不好,最近老遇到编码问题,而且几乎没有通用的方案来解决这个问题,但是对常见的方法都试过之后,发现还是可以解决的,下面总结了常用的支持中文的编码问题(这些方法中可能其中一个就能解决问题,也可能是多个组合)。(1)、首先,要保证文件的开头要加上编码设置来说明文件的编码复制代码代码如下:#encoding=utf-8(2)、然后,在连接数据的连接参数里加上字符集说明查询出的结果的编码,这个不加的后果可能是查询出的汉字字符都是问号复制代
系统 2019-09-27 17:53:20 1721
三大相关系数:pearson,spearman,kendall统计学中的三大相关性系数:pearson,spearman,kendall,他们反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1。0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强。1.personcorrelationcoefficient(皮尔森相关性系数)皮尔逊相关系数通常用r或ρ表示,度量两变量X和Y之间相互关系(线性相关)(1)公式皮尔森相关性
系统 2019-09-27 17:53:11 1721
早听说用python做网络爬虫非常方便,正好这几天单位也有这样的需求,需要登陆XX网站下载部分文档,于是自己亲身试验了一番,效果还不错。本例所登录的某网站需要提供用户名,密码和验证码,在此使用了python的urllib2直接登录网站并处理网站的Cookie。Cookie的工作原理:Cookie由服务端生成,然后发送给浏览器,浏览器会将Cookie保存在某个目录下的文本文件中。在下次请求同一网站时,会发送该Cookie给服务器,这样服务器就知道该用户是否合
系统 2019-09-27 17:53:11 1721
pythonargparse使用注意事项!!!importargparse1.parser=argparse.ArgumentParser(description="testargparse")2.parser.add_argument('-j','--workers',dest='pretrained',default=1,type=int,metavar='N',choices=[1,2],help='numberoftotalepochstorun'
系统 2019-09-27 17:53:09 1721
其实网上已经有许多python语言书写的串口,但大部分都是python2写的,没有找到一个合适的python编写的串口助手,只能自己来写一个串口助手,由于我只需要串口能够接收读取数据就可以了,故而这个串口助手只实现了数据的接收读取。创建串口助手首先需要创建一个类,重构类的实现过程如下:#coding=gb18030importthreadingimporttimeimportserialclassComThread:def__init__(self,Por
系统 2019-09-27 17:53:09 1721
0x00前言eval是Python用于执行python表达式的一个内置函数,使用eval,可以很方便的将字符串动态执行。比如下列代码:>>>eval("1+2")>>>eval("[xforxinrange(10)]")[0,1,2,3,4,5,6,7,8,9]当内存中的内置模块含有os的话,eval同样可以做到命令执行:>>>importos>>>eval("os.system('whoami')")win-20140812chj\administrat
系统 2019-09-27 17:53:02 1721
Python中经常遇到这样那样的字符编码问题,尤其在处理网页源码时(特别是爬虫中):UnicodeDecodeError:‘XXX'codeccan'tdecodebytesinposition12-15:illegalmultibyte...每次看到上面这段文字的时候,感觉整个世界都昏暗了,然后就只能各种搜索找资料,过后就忘了。下次遇到时就让世界再昏暗一次。为了彻底解决这个拦路虎,今天咱们就好好的来唠嗑唠嗑。下面以汉字'哈'来解释作示例解释所有的问题,汉
系统 2019-09-27 17:53:00 1721
关于Python语言,众说纷纭,但无外乎两种,强大,垃圾。大多数人还是对Python持肯定意见,认为它很强大。前些天和两个的大学同学聊天,一个是在做手机测试,一个是给银行系统做维护一类的工作,都在北京。都在一边工作一边学习,其中一个学的就是Python。我也不能落后啊,走上了Python的不归路。我个人觉得对广大编程爱好者来说,尤其是在校大学生,大家可以有时间学习一门语言,对以后是很有帮助的。以下实例为通过用户输入三角形三边长度,并计算三角形的面积:#-*
系统 2019-09-27 17:52:59 1721