分析分析网站寻找需要的网址用谷歌浏览器摁F12打开开发者工具,然后打开斗鱼颜值分类的页面,如图:在里面的请求中,最后发现它是以ajax加载的数据,数据格式为json,如图:圈住的部分是我们需要的数据,然后复制它的网址为https://www.douyu.com/gapi/rknc/directory/yzRec/1,出于学习目的只爬取第一页(减少服务器压力)。然后把网址放到浏览器中测试是否可以访问。如图:结果正常。分析json数据,提取图片链接最后分析发现
系统 2019-09-27 17:46:57 1973
对Python中正则表达式的理解,主要就是对符号的理解,本文即对Python中常用的正则表达式符号进行简析。其主要的符号有:.默认匹配一个字符,不包含换行符,如果设置DOTALL则匹配换行符^匹配行首$匹配行尾*匹配0个或者多个重复+匹配一个或者多个重复?匹配一个或者零个重复*?,+?,??按照非贪婪模式匹配{m},{m,n},{m,n}?分别匹配m个重复,m至n个重复,m至n个重复按照非贪婪模式\转义[][abc],[a-z][^a-z]|或者匹配'a|
系统 2019-09-27 17:46:52 1973
Python引入了一个机制:引用计数。引用计数python内部使用引用计数,来保持追踪内存中的对象,Python内部记录了对象有多少个引用,即引用计数,当对象被创建时就创建了一个引用计数,当对象不再需要时,这个对象的引用计数为0时,它被垃圾回收。总结一下对象会在一下情况下引用计数加1:1.对象被创建:x=42.另外的别人被创建:y=x3.被作为参数传递给函数:foo(x)4.作为容器对象的一个元素:a=[1,x,'33']引用计数减少情况1.一个本地引用离
系统 2019-09-27 17:45:58 1973
Python2中编码相关的问题很是让人蛋疼,特别是中文字符。比如本文所述的中文网页GBK编码的诡异问题。现象例如:盲录�氓��,其实网页里面正常的应该是会员分析接着上面的例子,会员这部分乱码通过repr()函数求值得到如下结果\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98使用type()函数求值得到的结果为unicodeeval(repr())出来值为盲录�氓��通过查表上述6个汉字对应c3a4c2bcc2
系统 2019-09-27 17:45:40 1973
C语言中三目运算符复制代码代码如下:expression?expr1:expr2;//expression为真则取表达式expr1的值,否则取expr2的值python三目实现方法:(1)expr=判断表达式andexpr1orexpr2判断表达式为真,此时如果expr1为真则expr=expr1,为假则变成Falseorexpr2,expr=expr2.判断表达式为假,则演变成Falseorexpr2,此时expr=expr2.只要表达式expr1,ex
系统 2019-09-27 17:45:34 1973
简单记一下python中List的sort方法(或者sorted内建函数)的用法。List的元素可以是各种东西,字符串,字典,自己定义的类等。sorted函数用法如下:sorted(data,cmp=None,key=None,reverse=False)其中,data是待排序数据,可以使List或者iterator,cmp和key都是函数,这两个函数作用与data的元素上产生一个结果,sorted方法根据这个结果来排序。cmp(e1,e2)是带两个参数的
系统 2019-09-27 17:38:23 1973
解决思路首先想到的就是利用python的正则表达式来匹配非法字符,然后找出非法记录。然而理想总是丰满的,现实却是残酷的。在实现的过程中,才发现自己对于字符编码、以及python内部字符串表示的相关知识的缺乏。在这期间,踩过了不少坑,到最后虽然还有些模糊的地方,但总算有一个总体清晰的了解。在此记录下心得,避免以后在同一个地方跌倒。以下的测试环境是ArcGIS10.3自带的python2.7.8环境,不保证其他python环境也适用。python正则表达式py
系统 2019-09-27 17:37:48 1973
CNET科技资讯网8月28日北京报道微软今天宣布其新一代互联网多媒体交互式内容播放应用插件——Silverlight将于今年9月正式发布。微软(中国)有限公司平台与开发合作部总监林毅介绍,Silverlight具有三方面优质特性,包括:高清晰、互动、天然SEO特性。微软今天宣布其新一代互联网多媒体交互式内容播放应用插件——Silverlight将于今年9月正式发布。微软同时向国内媒体预览了Silverlight的部分功能。Silverlight是一种跨平台
系统 2019-08-29 23:43:09 1973
functionupperCase(x){vary=document.getElementById(x).valuedocument.getElementById(x).value=y.toUpperCase()}输入些:
系统 2019-08-29 22:58:09 1973
今天是第一次来JavaEye,浏览了一下网站感觉不错,就注册了帐号建个新家。因为是第一次在这写blog,所以先整一些废话填充一下门面。其实真正的原因是本人才疏学浅写不出什么有深度的文章,况且是个java初学者--半年多的学习经历。以前就听说过JavaEye,真的是很有名很出色的java交流平台。今天真是高兴能来到这个java的大家庭,看见有和自己一样的菜鸟还有大票的。感觉真是热闹啊~人是群居动物就是喜欢凑热闹,呵呵!看见这么多志同道合的兄弟姐妹真的很亲切。
系统 2019-08-29 22:42:53 1973