- 军军小站|张军博客
搜索到与相关的文章
Python

Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)

背景说明感觉微信公众号算得是比较难爬的平台之一,不过一番折腾之后还是小有收获的。没有用Scrapy(估计爬太快也有反爬限制),但后面会开始整理写一些实战出来。简单介绍下本次的开发环境:python3requestspsycopg2(操作postgres数据库)抓包分析本次实战对抓取的公众号没有限制,但不同公众号每次抓取之前都要进行分析。打开Fiddler,将手机配置好相关代理,为避免干扰过多,这里给Fiddler加个过滤规则,只需要指定微信域名mp.wei

系统 2019-09-27 17:53:47 1936

Python

python控制台实现tab补全和清屏的例子

在shell(bash)下有2个很基本的功能,那就是tab补全,和clear清屏,对于我这种时不时不自觉的就手残要clear清屏一下的人来说,python控制台不能清屏很不爽,经过google的帮忙,找到了解决办法。执行“manpython”可以看到这样一个环境变量:PYTHONSTARTUPIfthisisthenameofareadablefile,thePythoncommandsinthatfileareexecutedbeforethefirst

系统 2019-09-27 17:52:47 1936

Python

Python学习:操作列表

创建数值列表列表非常适合用于存储数字集合,而Python提供了很多工具,可帮助你高效地处理数字列表。明白如何有效地使用这些工具后,即便列表包含数百万个元素,你编写的代码也能运行得很好。使用函数range()数range()让你能够轻松地生成一系列的数字。forvalueinrange(1,5):print(value)输出:1234在这个示例中,range()只是打印数字1~4,这是你在编程语言中经常看到的差一行为的结果。函数range()让Python从

系统 2019-09-27 17:52:44 1936

Python

弄懂这56个Python使用技巧(轻松掌握Python高效开发)

1.枚举-enumerate可以有参数哦之前我们这样操作:i=0foriteminiterable:printi,itemi+=1现在我们这样操作:fori,iteminenumerate(iterable):printi,itemenumerate函数还可以接收第二个参数。就像下面这样:>>>list(enumerate('abc'))[(0,'a'),(1,'b'),(2,'c')]>>>list(enumerate('abc',1))[(1,'a')

系统 2019-09-27 17:52:08 1936

Python

Python3.6 openCV3.4.3车牌自动识别

算法思想来自于网上资源,先使用图像边缘和车牌颜色定位车牌,再识别字符。车牌定位在predict方法中,为说明清楚,完成代码和测试后,加了很多注释,请参看源码。车牌字符识别也在predict方法中,请参看源码中的注释,需要说明的是,车牌字符识别使用的算法是opencv的SVM,opencv的SVM使用代码来自于opencv附带的sample,StatModel类和SVM类都是sample中的代码。SVM训练使用的训练样本来自于github上的EasyPR的c

系统 2019-09-27 17:51:17 1936

Python

详解python编译器和解释器的区别

高级语言不能直接被机器所理解执行,所以都需要一个翻译的阶段,解释型语言用到的是解释器,编译型语言用到的是编译器。编译型语言通常的执行过程是:源代码――预处理器――编译器――目标代码――链接器――可执行程序。某种意义上来说预处理事实上是一个附加的功能,C,PHP,都可以添加这种功能,其中,预处理指令多为头文件包含,宏定义等等。因为宏定义的核心说白了就是一个字“换”,所以预处理就是提供一个程序执行的环境。编译器――目标代码就是把高级程序语言转换成机器可以理解执

系统 2019-09-27 17:49:00 1936

Python

Python中turtle库的使用

Turtle图形库Turtle库是Python内置的图形化模块,属于标准库之一,位于Python安装目录的lib文件夹下,常用函数有以下几种:画笔控制函数penup():抬起画笔;pendown():落下画笔;pensize(width):画笔宽度;pencolor(color):画笔颜色;运动控制函数forward(d)/fd(d):直行d个像素;circle(r,extent=None):绘制半径为r,角度为extent的弧形,圆心默认在海龟左侧距离r

系统 2019-09-27 17:48:49 1936

Python

anaconda如何查看并管理python环境

Anaconda是Python的一个开源发行版本,主要面向科学计算,预装了丰富强大的库。使用Anaconda可以轻松管理多个版本的Python环境。Download:https://www.anaconda.com/download/Anaconda默认有两个版本,可以选择64位还是32位安装,当你安装了其中一个版本时,系统默认为该版本。同时你可以在已安装的Anaconda版本中添加另一个版本的Python,实现多版本共存。Anaconda可以使用命令行进

系统 2019-09-27 17:48:03 1936

Python

Python中的模块导入和读取键盘输入的方法

导入模块import语句想使用Python源文件,只需在另一个源文件里执行import语句,语法如下:importmodule1[,module2[,...moduleN]当解释器遇到import语句,如果模块在当前的搜索路径就会被导入。搜索路径是一个解释器会先进行搜索的所有目录的列表。如想要导入模块hello.py,需要把命令放在脚本的顶端:#!/usr/bin/python#-*-coding:UTF-8-*-#导入模块importsupport#现在

系统 2019-09-27 17:38:12 1936

Python

Python requests 处理返回的JSON格式数据

参考:JSON响应内容Requests中也有一个内置的JSON解码器,助你处理JSON数据:>>>importrequests>>>r=requests.get('https://api.github.com/events')>>>r.json()[{u'repository':{u'open_issues':0,u'url':'https://github.com/...如果JSON解码失败,r.json()就会抛出一个异常。例如,响应内容是401(Un

系统 2019-09-27 17:37:43 1936