搜索到与相关的文章
Python

以Python代码实例展示kNN算法的实际运用

邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。kNN方法在类别决策时,只与极

系统 2019-09-27 17:38:02 2066

编程技术

宏定义

得到指定地址上的一个字节或字#defineMEM_B(x)(*((byte*)(x)))#defineMEM_W(x)(*((word*)(x)))求最大值和最小值#defineMAX(x,y)(((x)>(y))?(x):(y))#defineMIN(x,y)(((x)<(y))?(x):(y))得到一个field在结构体(struct)中的偏移量#defineFPOS(type,field)((dword)&((type*)0)->field)得到一个

系统 2019-08-29 22:56:35 2066

编程技术

【Lucene3.0 初窥】索引文件格式(4):dictionar

Terms数据磁盘文件存储细节从这篇开始,已经涉及到倒排索引表的信息存储问题了。我们都知道倒排索引表中的Dictionary有许多不同的terms组成,Lucene关于这些terms数据的存储,就放在磁盘的.tii和.tis文件中。★.tii词典索引文件.tis词典数据文件1、tii保存了tis中每隔IndexInterval个词的位置信息,这是为了加快对词典文件tii中词的查找速度具体结构如下:TermInfoIndex(.tii)-->TIVersio

系统 2019-08-29 21:59:40 2066

编程技术

【文本分类】 概述

部分转载:http://www.blogjava.net/zhenandaci/archive/2008/05/31/204646.html作者:Jasper文本分类(textcategorization)问题就是将一篇文档归入预先定义的几个类别中的一个或几个,而文本的自动分类则是使用计算机程序来实现这样的分类。通俗点说,就好比你拿一篇文章,问计算机这文章要说的究竟是体育,经济还是教育,计算机答不上就打它的屁屁(……)。注意这个定义当中着重强调的两个事实。

系统 2019-08-29 21:59:32 2066

Python

python3生成随机数实例

本文实例讲述了python3生成随机数的方法。分享给大家供大家参考。具体实现方法如下:该实例是根据一本书上看到过一个随机数的小程序,经过自己改动,变为了一个猜数字的小游戏,现在在python3下重写了一遍。这是一个控制台下的猜数程序,winxp+python3.2+eric5和IDLE测试通过,但直接用winxp的命令行运行有问题,原因还未知,慢慢找。ubuntu+python3.1测试通过。具体实现代码如下:复制代码代码如下:#-*-coding:utf

系统 2019-09-27 17:55:11 2065

Python

python利用urllib实现爬取京东网站商品图片的爬虫实例

本例程使用urlib实现的,基于python2.7版本,采用beautifulsoup进行网页分析,没有第三方库的应该安装上之后才能运行,我用的IDE是pycharm,闲话少说,直接上代码!#-*-coding:utf-8-*importreimportosimporturllibimporturllib2frombs4importBeautifulSoupdefcraw(url,page):html1=urllib2.urlopen(url).read(

系统 2019-09-27 17:53:53 2065

Python

Python使用Pandas对csv文件进行数据处理的方法

今天接到一个新的任务,要对一个140多M的csv文件进行数据处理,总共有170多万行,尝试了导入本地的MySQL数据库进行查询,结果用Navicat导入直接卡死....估计是XAMPP套装里面全默认配置的MySQL性能不给力,又尝试用R搞一下吧结果发现光加载csv文件就要3分钟左右的时间,相当不给力啊,翻了翻万能的知乎发现了Python下的一个神器包:Pandas(熊猫们?),加载这个140多M的csv文件两秒钟就搞定,后面的分类汇总等操作也都是秒开,太牛

系统 2019-09-27 17:52:33 2065

Python

025 Python基础小结

目录一、执行Python程序的两种方式1.1交互式1.2命令行式二、变量2.1什么是变量2.2如何定义变量2.3变量的组成2.4变量名的规范2.5变量名的两种命名风格三、常量四、Python变量内存管理4.1引用计数4.2垃圾回收机制4.3小整数池五、花式赋值5.1链式赋值5.2交叉赋值六、注释6.1单行注释6.2多行注释七、数据类型基础7.1为什么要有数据类型八、解压缩九、Python与用户交互十、Python格式化输出的三种方式10.1占位符%10.2

系统 2019-09-27 17:51:57 2065

Python

自学Python编程的第八天----------来自苦逼的转行人

2019-09-18-21:11:24(初学者不会学博客,望大家见谅见谅)今天学的内容是有关list.、dict、set集合的使用方法和注意事项list和dict在循环中不可删,而且list在迭代输出时进行删除是会导致索引跟着改变所以一般list不在循环过程中进行删除list和dict要进行删除时,应该把要删除的记录到另一个列表中,然后在进行删除深浅拷贝:浅拷贝只拷贝第一层的内容,而深拷贝是全部内容都进行了拷贝下面是总结的内容:一.重要知识点1.str.j

系统 2019-09-27 17:51:29 2065

Python

Python有趣的小案例

美国队长的锅emmmmmmmm.......没错就是他的锅#所需依赖:python3pycharm#print打印print('helloworld!')#注释符号#井号后面灰色的内容是注释,相当于笔记,会被机器忽略#变量和值#n是变量,100是值,等号的作用是赋值#n相当于高中数学的xyz,只不过xyz的值只能是数字,变量的功能要更强大n=100m='hello'print(n)print(m)#数据类型,这里只讲两个,剩下的需要同学自己去系统地学习了#

系统 2019-09-27 17:50:55 2065