1。总体概要kNN算法已经在上一篇博客中说明。对于要处理手写体数字,需要处理的点主要包括:(1)图片的预处理:将png,jpg等格式的图片转换成文本数据,本博客的思想是,利用图片的rgb16进制编码(255,255,255)为白色,(0,0,0)为黑色,获取图片大小后,逐个像素进行判断分析,当此像素为空白时,在文本数据中使用0来替换,反之使用1来替换。fromPILimportImage'''将图片转换成文档,使用0,1分别替代空白和数字'''pic=Im
系统 2019-09-27 17:54:43 2100
目录一、变量存哪了?二、Python垃圾回收机制2.1引用计数三、小整数池一、变量存哪了?x=10变量存放在内存中这句话太宽泛了,我们把它具体化。对于电脑内存这个大内存,每定义一个变量就会在这个大内存中开辟一个小空间,小空间内存放变量值10,然后内存给这个小空间一个变量名x(门牌号),x指向10。二、Python垃圾回收机制对于p1.py,如果我们再加上一段代码x=11,大内存会开辟另一个小空间存储变量值11,把变量值绑定另一个门牌号x,但是由于之前有x,
系统 2019-09-27 17:54:25 2100
openpyxl特点openpyxl(可读写excel表)专门处理Excel2007及以上版本产生的xlsx文件,xls和xlsx之间转换容易注意:如果文字编码是“gb2312”读取后就会显示乱码,请先转成Unicode1、openpyxl读写单元格时,单元格的坐标位置起始值是(1,1),即下标最小值为1,否则报错!tableTitle=['userName','Phone','age','Remark']#维护表头#ifrow<1orcolumn<1:#
系统 2019-09-27 17:54:22 2100
本文利用Python3爬虫抓取豆瓣图书Top250,并利用xlwt模块将其存储至excel文件,图片下载到相应目录。旨在进行更多的爬虫实践练习以及模块学习。工具1.Python3.52.BeautifulSoup、xlwt模块开始动手首先查看目标网页的url:https://book.douban.com/top250?start=0,然后我尝试了在代码里直接通过字符串连接仅改变”start=“后面的数字的方法来遍历所有的250/25=10页内容,但是后来
系统 2019-09-27 17:53:39 2100
英文文档classmethod(function)Returnaclassmethodforfunction.Aclassmethodreceivestheclassasimplicitfirstargument,justlikeaninstancemethodreceivestheinstance.Todeclareaclassmethod,usethisidiom:classC:@classmethoddeff(cls,arg1,arg2,...):.
系统 2019-09-27 17:52:28 2100
最近学习《Python参考手册》学到Class部分,遇到了类的构造析构部分的问题:1、什么时候构造?2、什么时候析构?3、成员变量如何处理?4、Python中的共享成员函数如何访问?------------------------探索过程:1、经过查找,Python中没有专用的构造和析构函数,但是一般可以在__init__和__del__分别完成初始化和删除操作,可用这个替代构造和析构。还有一个__new__用来定制类的创建过程,不过需要一定的配置,此处不
系统 2019-09-27 17:51:55 2100
有时网页中会嵌套一个或者多个Frame,此时我们直接去找嵌套在Frame里面的元素会抛出异常,所以在操作的时候我们需要将页面焦点切换到Frame里面,下面我们就以一个实例演示一下!首先先创建三个html文件,文件代码如下:1)frameset.html2)frame_left.html3)frame_right.html4)frame_middle.html5)把这四个html文件放在同一个文件夹下<以下是python实现该逻辑的代码:importunit
系统 2019-09-27 17:50:57 2100
python2和python3实现在图片上加汉字,最主要的区别还是内部编码方式不一样导致的,在代码上表现为些许的差别。理解了内部编码原理也就不会遇到这些问题了,以下代码是在WIN10系统上时测好用的。Python2在图片上加汉字代码实现#-*-coding:cp936-*-importcv2importnumpyasnpfromPILimportImage,ImageDraw,ImageFontdefID_2_Word(txt):tmp_ID=txt.sp
系统 2019-09-27 17:50:33 2100
实际上JSON就是Python字典的字符串表示,但是字典作为一个复杂对象是无法直接传递,所以需要将其转换成字符串形式.转换的过程也是一种序列化过程.用json.dumps序列化为json字符串格式复制代码代码如下:>>>importjson>>>dic{'Connection':['keep-alive'],'Host':['127.0.0.1:5000'],'Cache-Control':['max-age=0']}>>>jdict=json.dumps
系统 2019-09-27 17:50:19 2100
python基础学习笔记(十一)2013-05-1423:31虫师阅读(...)评论(...)编辑收藏迭代器本节进行迭代器的讨论。只讨论一个特殊方法----__iter__,这个方法是迭代器规则的基础。迭代器规则迭代的意思是重复做一些事很多次---就像在循环中做的那样。__iter__方法返回一个迭代器,所谓迭代器就是具有next方法的对象,在调用next方法时,迭代器会返回它的下一个值。如果next方法被调用,但迭代器没有值可以返回,就会引发一个Stop
系统 2019-09-27 17:48:51 2100