正则表达式什么是正则表达式?正则表达式是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式可以干什么?快速高效的查找与分析字符串进行有规律查找比对字符串,也叫:模式匹配具有查找、比对、匹配、替换、插入
系统 2019-09-27 17:54:35 1706
前提:python3.4windows作用:通过搜狗的微信搜索接口http://weixin.sogou.com/来搜索相关微信文章,并将标题及相关链接导入Excel表格中说明:需xlsxwriter模块,另程序编写时间为2017/7/11,以免之后程序无法使用可能是网站做过相关改变,程序较为简单,除去注释40多行。正题:思路:打开初始Url-->正则获取标题及链接-->改变page循环第二步-->将得到的标题及链接导入Excel爬虫的第一步都是先手工操作
系统 2019-09-27 17:54:31 1706
pycharm软件很好,但是不能在无图形的终端下使用,另外它们是“重量级选手”。如果偶尔需要vim编辑python程序,让vim支持python的语法提示不是更好!实际上,vim支持python提示,就是把python以及各种各样模块的常用指令都写到一个字典里。操作步骤如下:1、创建vim插件工作目录[root@zsl~]#mkdir-p~/.vim/bundle/2、下载插件[root@zsl~]#cd~/.vim/bundle/[root@zsl~]#
系统 2019-09-27 17:54:31 1706
视频地址:https://www.icourse163.org/course/NJU-10015710051.1python简介:历史,特点,应用1.2第一个python程序:1.输出:print(字符串)print(变量)2.输入:varibale=input("message":)返回的是字符串str类型如需其它类型,可使用int(),float()等函数进行类型转换3.注释:#4.缩进:具有相同缩进的程序语句构成同一语句块1.3python语法基础1
系统 2019-09-27 17:54:30 1706
python里面可以将路径里面的\替换成/避免转义。os.walk方法可以将目标路径下文件的root,dirs,files提取出来。后面对每个文件进行操作。切片操作[:]判断是否为.jpg或.JPG文件。shutil的copy方法将文件从旧路径复制到新路径。glob的glob方法提取目标文件夹的所有图片,对每张图片进行显示保存等操作。详细代码及注释如下:importosimportshutilimportglobimportcv2path='C:/User
系统 2019-09-27 17:54:30 1706
【摘要】在前一章中,我们已经成功尝试分析Ajax来抓取相关数据,但是并不是所有页面都可以通过分析Ajax来完成抓取。比如,淘宝,它的整个页面数据确实也是通过Ajax获取的,但是这些Ajax接口参数比较复杂,可能会包含加密密钥等,所以如果想自己构造Ajax参数,还是比较困难的。对于这种页面,最方便快捷的抓取方法就是通过Selenium。本节中,我们就用Selenium来模拟浏览器操作,抓取淘宝的商品信息,并将结果保存到MongoDB。1.本节目标本节中,我们
系统 2019-09-27 17:54:29 1706
jsonJSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,易于人阅读和编写。json是我们在制作爬虫时非常常见的网络对象,本文就列举python对于json的基本操作。json函数使用json函数首先要导入json库即importjson主要使用以下两个函数:json.dumps将Python对象编码成JSON字符串json.loads将已编码的JSON字符串解码为Python对象json.dumpsjson.dump
系统 2019-09-27 17:54:25 1706
本文实例讲述了python3实现的对象与json相互转换操作。分享给大家供大家参考,具体如下:1.python主要有三种数据类型:字典、列表、元组,其分别由花括号,中括号,小括号表示。例如:字典:dictData={'a':12,'b':34}列表:listData=[1,2,3,4]元组:tupleData=(1,2,3,4)2.使用json时,导入importjson即可3.python对象转json字符串,主要用到的函数:json.dumps()。例
系统 2019-09-27 17:54:24 1706
项目中想使用以前的代码,或者什么样的需求致使你需要导入外部的包如果是web下,比如说django,那么你新建一个app,把你需要导入的说用东东,都写到这个app中,然后在setting中的app也配上基本就ok了如果是本地代码,可以有几种方式,1、这种最简单,也可能最不实用,将你的外部文件放到跟需要调用外部文件的文件同一个包下,同一目录folder------toinvoke.py------tobeinvoded.py这样在toinvoke.py中引入i
系统 2019-09-27 17:54:22 1706
Python日期的加减等操作经常会用的,总结一下。1.日期输出格式化所有日期、时间的api都在datetime模块内。datetime=>stringnow=datetime.datetime.now()now.strftime('%Y-%m-%d%H:%M:%S')#输出2012-03-0516:26:23.870105strftime是datetime类的实例方法。2.string=>datetimet_str='2012-03-0516:26:23'
系统 2019-09-27 17:54:18 1706