前言python图像识别一般基础到的就是tesseract了,在爬虫中处理验证码广泛使用。安装安装教程网上大都差不多,Windows下确实比较麻烦,涉及到各种路径、环境变量甚至与linux不同的路径分隔符,所以这里的安装是基于Centos7。1.依赖安装yuminstall-yautomakeautoconflibtoolgccgcc-c++2.安装leptonicaLeptonica主要用于图像处理和图像分析原则上所有的库文件都是可以直接用yum安装的,
系统 2019-09-27 17:54:02 2517
原文链接:https://www.jianshu.com/p/4fedbc832899python数据可视化:pyecharts发现了一个做数据可视化非常好的库:pyecharts。非常便捷好用,大力推荐!!官方介绍:pyecharts是一个用于生成Echarts图表的类库。Echarts是百度开源的一个数据可视化JS库。用Echarts生成的图可视化效果非常棒,pyecharts是为了与Python进行对接,方便在Python中直接使用数据生成图。中文教
系统 2019-09-27 17:53:40 2517
python元组(tuple)Python的元组和列表类似,不同之处在于元组中的元素不能修改(因此元组又称为只读列表),且元组使用小括号而列表使用中括号;1、元组中只包含一个元素时,需要在元素后面添加逗号来消除歧义;2、元组中的元素值使不允许修改的,但可以对元组进行连接组合;3、元组中的元素是不允许删除的,但可以使用del语句来删除整个元组;4、元组之间可以使用+和*,即允许元组进行组合连接和重复复制,运算后会生成一个新的元组tu=((2,2),(3,3)
系统 2019-09-27 17:52:35 2517
安装好Python3.7后,查看Python版本:1.未进入pythonshell,两种命令:[root@VM_0_8_centos~]#python3-VPython3.7.3[root@VM_0_8_centos~]#python--versionPython2.7.52、直接使用python命令,进入Python环境,会自动显示其版本号。如果需要更详细的版本信息,则可以通过sys模块得到。[root@VM_0_8_centos~]#pythonPyt
系统 2019-09-27 17:51:54 2517
一、Python函数中的参数1、使用python的函数时,有参数类别,比如位置参数、关键字参数、可变长参数2、位置参数、关键字参数很好理解,关键是可变长参数经常能见到,但是一直没有搞懂是什么意思二、可变长参数1、一个星号:函数可以接收任意个数的参数,只需要在形参前面加一个*(星号),一个星号形参的函数会把多个位置参数值当成元祖的形式传入,也就是传入的多个参数值可以在函数内部进行元祖遍历deflength_param(a,*args):print("a=",
系统 2019-09-27 17:45:33 2517
简介提到爬虫,大部分人都会想到使用Scrapy工具,但是仅仅停留在会使用的阶段。为了增加对爬虫机制的理解,我们可以手动实现多线程的爬虫过程,同时,引入IP代理池进行基本的反爬操作。本次使用天天基金网进行爬虫,该网站具有反爬机制,同时数量足够大,多线程效果较为明显。技术路线IP代理池多线程爬虫与反爬编写思路首先,开始分析天天基金网的一些数据。经过抓包分析,可知:./fundcode_search.js包含所有基金的数据,同时,该地址具有反爬机制,多次访问将会
系统 2019-09-27 17:57:51 2516
导包效果展示以下截图显示的撤回消息类型依次是文字消息、微信自带表情、图片、语音、定位地图、名片、公众号文章、音乐、视频。有群里撤回的,也有个人号撤回的。图文来源:http://kks.me/aULmF图文来源:http://kks.me/aULmF程序思路主要由两部分组成:handler_receive_msg():处理接收到的消息,将消息临时放在字典中。send_msg_helper():将撤回的消息自动发给文件传输助手。程序分析首先,我们定义一个字典来
系统 2019-09-27 17:48:55 2516
一.描述colorlog.ColoredFormatter是一个Pythonlogging模块的格式化,用于在终端输出日志的颜色二.安装pipinstallcolorlog三.用法importcolorloghandler=colorlog.StreamHandler()handler.setFormatter(colorlog.ColoredFormatter('%(log_color)s%(levelname)s:%(name)s:%(message)
系统 2019-09-27 17:47:37 2516
需要ping一个网段所有机器的在线情况,shell脚步运行时间太长,用python写个多线程ping吧,代码如下:#!/usr/bin/python#coding=utf-8'''Createdon2015-8-4@author:Administrator'''importthreading,subprocessfromtimeimportctime,sleep,timeimportQueuequeue=Queue.Queue()classThreadUr
系统 2019-09-27 17:38:35 2516
python3与python2的还是有诸多的不同,比如说在2中:复制代码代码如下:print"Hello,World!"raw_input()在3里面就成了:复制代码代码如下:print("Hello,World!")input()所以如果用的python2开发的项目要迁移到3中,就需要进行代码的转换。Python3中自带了个转换工具,下面用个最简单的例子来说说2to3转换工具。例子:(2to3Test.py里面只有print这行代码)复制代码代码如下:#
系统 2019-09-27 17:37:46 2516
python3中print函数中的参数end默认值为’\n’,表示换行,改变end的赋值,就不会换行了,例如打印个99乘法表:foriinrange(1,10):print()forjinrange(1,i+1):print("%d*%d=%d,"%(i,j,i*j),end='')1*1=1,2*1=2,2*2=4,3*1=3,3*2=6,3*3=9,4*1=4,4*2=8,4*3=12,4*4=16,5*1=5,5*2=10,5*3=15,5*4=20
系统 2019-09-27 17:08:20 2516
基于requests模块发起ajax的get请求需求:爬取豆瓣电影分类排行榜https://movie.douban.com/中的电影详情数据用抓包工具捉取使用ajax加载页面的请求鼠标往下下滚轮拖动页面,会加载更多的电影信息,这个局部刷新是当前页面发起的ajax请求,用抓包工具捉取页面刷新的ajax的get请求,捉取滚轮在最底部时候发起的请求这个get请求是本次发起的请求的urlajax的get请求携带参数获取响应内容不再是页面数据,是json字符串,是
系统 2019-09-27 17:53:20 2515
前言本人前端不太懂Centos上面的东西,这两天在搞阿里云的Ecs在上面安装Python环境,刚开始直接在官网下载了源码包编译安装了Python3.7.4。但其实部署项目的时候大多会涉及到多项目以及Python的版本、环境不同,所以可以多版本Python+虚拟环境。0.Pyenv安装篇需要先安装依赖:yum-yinstallgitgccmakepatchzlib-develgdbm-developenssl-develsqlite-develbzip2-d
系统 2019-09-27 17:49:38 2515
目录Mixin类Mixin类的实例运行流程流程图《PythonGUIProgrammingwithTkinter》作者的话Mixin类Mixin类只包含了一组特定的函数集合,而我们将会将其与其他类进行混合,从而生成一个适用于实际需要的新类Mixin类的实例代码改编自《PythonGUIProgrammingwithTkinter》classDisplayer():defdisplay(self,message):print('2:display:Displ
系统 2019-09-27 17:47:59 2515
下载Anaconda安装包官网下载或是在清华大学镜像站下载,我安装的是下面这个版本:安装过程配置环境将anaconda的scripts文件夹路径添加到环境变量中。如果命令行输入输出如图所示则安装成功:为了避免可能发生的错误,我们在命令行输入condaupgrade--all先把所有工具包进行升级。(也可以不安装升级)打开pycharm,如图点击addlocal点击第三个选项,systeminterpreter,选择python.exe路径,点击ok,就可以
系统 2019-09-27 17:47:33 2515