搜索到与相关的文章
Python

Python爬虫:现学现用xpath爬取豆瓣音乐

爬虫的抓取方式有好几种,正则表达式,Lxml(xpath)与BeautifulSoup,我在网上查了一下资料,了解到三者之间的使用难度与性能三种爬虫方式的对比。抓取方式性能使用难度正则表达式快困难Lxml快简单BeautifulSoup慢简单这样一比较我我选择了Lxml(xpath)的方式了,虽然有三种方式,但肯定是要选择最好的方式来爬虫,这个道理大家都懂,另外有兴趣的朋友也可以去了解另外两种爬虫方式!好了现在来讲讲xpath由于Xpath属于lxml模块

系统 2019-09-27 17:49:52 2171

Python

python学习笔记之匿名函数

defadd(x,y):returnx+yadd=lambdax,y:x+yprint(add(1,2))dic={'k1':10,'k2':100,'k3':30}deffunc(key):returndic[key]print(max(dic,key=func))#根据返回值判断最大值,返回值最大的那个参数是结果print(max(dic,key=lambdakey:dic[key]))max([1,2,3,4,5,-6,-7],key=abs)ret

系统 2019-09-27 17:48:36 2171

Python

python os.fork() 循环输出方法

先看下面这段代码:importosdefmain():foriinrange(0,2):os.fork()print'Hello'if__name__=='__main__':main()猜测一下,会输出几行Hello。答案是:HelloHelloHelloHelloHelloHello6行!为什么呢?首先,你要明白os.fork()创建的子进程会接着下一行代码继续执行,它有返回值,返回值可以为0表示子进程或者大于0表示父进程pid,os.getpid()

系统 2019-09-27 17:48:15 2171

Python

在Python中处理字符串之isdecimal()方法的使用

isdecimal()方法检查字符串是否仅由十进制字符组成。此方法只存在于unicode对象。注意:要定义一个字符串为Unicode,只需前缀分配'u'左引号。以下是示例。语法以下是isdecimal()方法的语法:str.isdecimal()参数NA返回值如果字符串中的所有字符为十进制此方法返回true,否则返回false。例子下面的例子显示了isdecimal()方法的使用。#!/usr/bin/pythonstr=u"this2009";print

系统 2019-09-27 17:47:04 2171

Python

Python django框架输入汉字,数字,字符生成二维码实现详解

这篇文章主要介绍了Pythondjango框架输入汉字,数字,字符转成二维码实现详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下模块必备:Python环境+pillow+qrcode模块核心代码importqrcodeqr=qrcode.QRCode(version=2,error_correction=qrcode.constants.ERROR_CORRECT_L,box_size=20,borde

系统 2019-09-27 17:38:37 2171

编程技术

gtalk 翻譯機器人(英翻繁體)已完成

沒想到進度超前,在今天釋出第一個版本,只要在gmail或是gtalk邀請en2zhtw@gmail.com設定成為聯絡人,送出整段英文訊息給en2zhtw@gmail.com,機器人就會翻譯英文-->繁體,實作過程中,最複雜的還是TLS的實作,其他並沒有太多的阻礙,另外xmpp的訂閱聯絡人協定做的有點不是很好,連gtalk都沒有完整實做,這在幾種不同的SERVER測過,目前最標準的是openfire,其餘或多或少都有部分不太符合rfc3921,相較於msn

系统 2019-08-29 23:22:29 2171

编程技术

并发编程基础概念(一) IO-同步,异步,阻塞,非

原文链接:http://blog.csdn.net/historyasamirror/article/details/4270633作为程序员从应用层面来考虑的四个概念同步阻塞IO:在这个模型中,应用程序(application)为了执行这个read操作,会调用相应的一个systemcall,将系统控制权交给kernel,然后就进行等待(这其实就是被阻塞了)。kernel开始执行这个systemcall,执行完毕后会向应用程序返回响应,应用程序得到响应后,

系统 2019-08-29 23:17:51 2171

编程技术

websphere 数据源绑定问题

在was5.1上正常使用的war包,发布到6.0上就报找不到数据源,还以为是数据源配置上有问题,结果怎么弄也不行,偶尔换了一个war包上去,居然可以用,分析这个包发现,那个web-inf目录下多了一个ibm-web-bnd.xmi文件,原来这个war包是从工程上发布好的was中中拷贝出来,然后打的war包!坑人啊,删掉这个文件,重新发布,我靠,好用了!websphere数据源绑定问题

系统 2019-08-29 23:07:34 2171

编程技术

Lucene-2.2.0 源代码阅读学习(26)

如果在初始化一个IndexWriter索引器的时候,指定useCompoundFile=false,则在指定的索引目录中生成的索引文件就不是.cfs复合索引文件。通过这种方式生成的索引文件,它的不同格式表明了它锁存储的关于索引的不同内容。至少,明确了在建立索引过程中,经过加工处理的数据究竟去向如何,能够加深对Lucene索引过程的理解。通过在文章Lucene-2.2.0源代码阅读学习(4)中的那个例子,可以运行主函数,观察到索引目录中生成了大量的不同扩展名

系统 2019-08-29 22:58:01 2171

编程技术

WEB开发偷懒相当牛B之 -- Zen Coding

可以说是偷懒吧,也可以说是敏捷吧,因为他减少了好多重复繁杂的劳动。有时间慢慢研究。另外,http://zen-coding.ru/貌似是这东西的官网,但就一张图片,啥也没有。http://zen-coding.ru/demo/是一个在线DEMO。其他目录都没有去试探过了。WEB开发偷懒相当牛B之--ZenCoding

系统 2019-08-29 22:43:52 2171