接下来准备用糗百做一个爬虫的小例子。但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。一、正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达
系统 2019-09-27 17:54:47 2144
datetime模块中包含五种基本类型:date、time、datetime、timedelta和tzinfo,tz是timezone的缩写,tzinfo用于表示时区信息。一,date类型date类型表示日期,是由year、month和day构成的对象1,初始化date对象使用date(year,month,day)函数来初始化date对象:fromdatetimeimportdatemydate=date(year,month,day)2,date对象函
系统 2019-09-27 17:54:44 2144
本文实例讲述了Python读写文件模式和文件对象方法。分享给大家供大家参考,具体如下:一.读写文件模式利用open()读写文件时,将会返回一个file对象,其基本语法格式如:open(filename,mode)其中,filename变量是一个包含了你要访问的文件名称的字符串值。而mode决定了你打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。注:这个参数是非强制的,默认文件访问模式为只读模式(r)例如,我们现在将一个字符串写入到test.
系统 2019-09-27 17:54:20 2144
原文链接:https://edu.csdn.net/bundled/detail/49?utm_source=topic「超级星推官/每周分享」是一个围绕程序员生活、学习相关的推荐栏目。CSDN出品,每周发布,暂定5期。关键词:靠谱!优质!本期内容,我们将抽1人送出由我司程序员奉为“超级神作”的《疯狂Python讲义》1本,并在文章内隐藏了5门好课,敬请关注。2019年,有人说是Python元年,背靠AI和大数据,连续半年拿下TOP1编程语言,这些都给了P
系统 2019-09-27 17:53:20 2144
zip函数接受任意多个(包括0个和1个)序列作为参数,返回一个tuple列表。具体意思不好用文字来表述,直接看示例:1.示例1:复制代码代码如下:x=[1,2,3]y=[4,5,6]z=[7,8,9]xyz=zip(x,y,z)printxyz运行的结果是:[(1,4,7),(2,5,8),(3,6,9)]从这个结果可以看出zip函数的基本运作方式。2.示例2:复制代码代码如下:x=[1,2,3]y=[4,5,6,7]xy=zip(x,y)printxy运
系统 2019-09-27 17:52:42 2144
MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可护展的高性能数据存储解决方案。它的特点是高性能、易部署、易使用,存储数据非常方便。MongoDB简单使用联接数据库复制代码代码如下:In[1]:importpymongoIn[2]:frompymongoimportConnectionIn[3]:connection=Connection('192.168.1.3',27017)//创建联接Connection相关参数
系统 2019-09-27 17:52:17 2144
作为临时测试用python命令来搭建web测试是最好不过的选择了;CD切换到当前目录只需要一句python命令就迅速搭建好了简单的web服务器,pythonlinux自带又无需额外配置安装感觉还是很好用的;python开启web服务器命令python-mSimpleHTTPServer8080端口号可以任意指定一个没有被占用的端口,但必须能通过防火墙;执行完上面命令后,直接输入IP地址加端口号就行了http://:端口号/路径如:http://192.16
系统 2019-09-27 17:52:09 2144
初试牛刀假设你希望学习Python这门语言,却苦于找不到一个简短而全面的入门教程。那么本教程将花费十分钟的时间带你走入Python的大门。本文的内容介于教程(Toturial)和速查手册(CheatSheet)之间,因此只会包含一些基本概念。很显然,如果你希望真正学好一门语言,你还是需要亲自动手实践的。在此,我会假定你已经有了一定的编程基础,因此我会跳过大部分非Python语言的相关内容。本文将高亮显示重要的关键字,以便你可以很容易看到它们。另外需要注意的
系统 2019-09-27 17:52:00 2144
一、定义函数def函数名():函数体代码例:#定义函数defemail():print('sendemail')#调用执行函数email()二、函数的返回值defemail():print("sendemail")return"发送成功"#没有return,默认返回Noneret=email()#函数return后面是什么值,ret等于返回值print(ret)注意:一旦遇到return,函数内部return以下的代码不再执行。三、函数的普通参数defem
系统 2019-09-27 17:51:12 2144
今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中,也会好奇自己养的爬虫一分钟可以爬多少页面,多大的数据量,当然查询的方式多种多样。今天我来讲一种可视化的方法。关于爬虫数据在mongodb里的版本我写了一个可以热更新配置的版本,即添加了新的爬虫配置以后,不用重启程序,即可获取刚刚添加的爬虫的状态数据。1.成品图这个是监控服务器网速的最后成果,显示的是下载与上传的网速,单位为M。爬虫的原理都是一样的,只不过将数据存到InfluxDB的
系统 2019-09-27 17:50:52 2144