搜索到与相关的文章
Python

python3爬虫之入门基础和正则表达式

前面的python3入门系列基本上也对python入了门,从这章起就开始介绍下python的爬虫教程,拿出来给大家分享;爬虫说的简单,就是去抓取网路的数据进行分析处理;这章主要入门,了解几个爬虫的小测试,以及对爬虫用到的工具介绍,比如集合,队列,正则表达式;用python抓取指定页面:代码如下:importurllib.requesturl="http://www.baidu.com"data=urllib.request.urlopen(url).rea

系统 2019-09-27 17:45:49 2026

Python

Python 中 Meta Classes详解

接触过Django的同学都应该十分熟悉它的ORM系统。对于python新手而言,这是一项几乎可以被称作“黑科技”的特性:只要你在models.py中随便定义一个Model的子类,Django便可以:获取它的字段定义,并转换成表结构读取Meta内部类,并转化成相应的配置信息。对于特殊的Model(如abstract、proxy),还要进行相应的转换为没有定义objects的Model加上一个默认的Manager开发之余,我也曾脑补过其背后的原理。曾经,我认为

系统 2019-09-27 17:38:17 2026

Python

Python提取网页中超链接的方法

下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接代码如下:importurllib2importreurl='http://www.sunbloger.com/'req=urllib2.Request(url)con=urllib2.urlopen(req)doc=con.read()con.close()links=re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]

系统 2019-09-27 17:38:07 2026

编程技术

互联网:从流量经营到服务经营

把网站当成媒体来经营,是互联网在中国发展到后来形成的一种惯性思维,由这种思维推导出的经营思路便是影响力,由影响力提升盈利能力。于是,二次营销或三次营销理论由媒体

系统 2019-08-29 23:51:48 2026

编程技术

穿越红尘不扰关,回旋天地去复还

实在不好意思,前一段我家老爷子住院做了个颈椎手术,最近他老人家身体好了(刚刚和母上逛公园去了),我也就闲下来了。很长时间没上博客,也没有读任何邮件,非常对不住大家,这两天我会补回来。——————————————————————————————————————————————————不过,这段时间小弟并非什么都没干,话说LGame的0.3.3正式版,已经到了整理下代码就能发的程度了,顺便传两张图。我对Java版也做了一些修正,比如小弟最近将ADT升级到2.0

系统 2019-08-29 23:43:22 2026

编程技术

Quartz 1.8.4 发布

Quartz是一个开源的作业调度框架,它完全由Java写成,并设计用于J2SE和J2EE应用中。它提供了巨大的灵活性而不牺牲简单性。你能够用它来为执行一个作业而创建简单的或复杂的调度。它有很多特征,如:数据库支持,集群,插件,EJB作业预构建,JavaMail及其它,支持cron-like表达式等等。该版本主要修复一些小bug,下载地址:http://www.terracotta.org/dl/quartz-oss-sign-up该项目已经被Terraco

系统 2019-08-29 23:33:52 2026

编程技术

简单入门正则表达式 - 第八章 捕获群和逆向引用