部分转载:http://www.blogjava.net/zhenandaci/archive/2008/05/31/204646.html作者:Jasper文本分类(textcategorization)问题就是将一篇文档归入预先定义的几个类别中的一个或几个,而文本的自动分类则是使用计算机程序来实现这样的分类。通俗点说,就好比你拿一篇文章,问计算机这文章要说的究竟是体育,经济还是教育,计算机答不上就打它的屁屁(……)。注意这个定义当中着重强调的两个事实。
系统 2019-08-29 21:59:32 2010
1.urllib.error.URLError:解决办法:退出网页上的谷歌账号,然后在命令行中进行认证。2.安装pyCrypto出现error:MicrosoftVisualC++14.0isrequired.安装pycryptodome来代替pyCrypto
系统 2019-09-27 17:55:09 2009
实验一:下面这个代码主要是为了给文件编号,方便后面打标记和分类等操importospath=‘你需要处理的文件的路径';count=0;filelist=os.listdir(path)#该文件夹下所有的文件(包括文件夹)defrename():globalcountforfilesinfilelist:#遍历所有文件Olddir=os.path.join(path,files);#原来的文件路径filename=os.path.splitext(file
系统 2019-09-27 17:55:08 2009
之前想爬取一些淘宝的数据,后来发现需要登录,找了很多的资料,有个使用request的sessions加上cookie来登录的,cookie的获取在登录后使用开发者工具可以找到。不过这个登录后获得的网页的代码是静态的,获取动态网页还得另寻他法,一般需要的数据可以在网页的源码中得到,但是你知道的,有些动态加载的就不是那么简单了,而且我发现这样获得的源码中,有些想要获取的数据的格式是经过改动的,比如我要某个商品的具体链接,发现并不能直接使用。总体而言,这是一次失
系统 2019-09-27 17:54:47 2009
实例如下:#-*-coding:utf-8-*-fromnumpyimport*importnumpyasnpimportpandasaspdfrommathimportlogimportoperator#计算数据集的香农熵defcalcShannonEnt(dataSet):numEntries=len(dataSet)labelCounts={}#给所有可能分类创建字典forfeatVecindataSet:currentLabel=featVec[-
系统 2019-09-27 17:54:47 2009
前言如果你曾经写过或者用过Python,你可能已经习惯了看到Python源代码文件;它们的名称以.Py结尾。你可能还见过另一种类型的文件是.pyc结尾的,它们就是Python“字节码”文件。(在Python3的时候这个.pyc后缀的文件不太好找了,它在一个名为__pycache__的子目录下面。).pyc文件可以防止Python每次运行时都重新解析源代码,该文件大大节省了时间。Python是如何工作的Python通常被描述为一种解释语言,在这种语言中,你的
系统 2019-09-27 17:53:52 2009
本文实例讲述了Python类的专用方法。分享给大家供大家参考。具体分析如下:Python类可以定义专用方法,专用方法是在特殊情况下或当使用特别语法时由Python替你调用的,而不是在代码中直接调用(象普通的方法那样)。1.__init__类似于构造函数复制代码代码如下:#!/usr/local/bin/pythonclassStudy:def__init__(self,name=None):self.name=namedefsay(self):prints
系统 2019-09-27 17:53:14 2009
什么是特殊方法?当我们在设计一个类的时候,python中有一个用于初始化的方法$__init__$,类似于java中的构造器,这个就是特殊方法,也叫作魔术方法。简单来说,特殊方法可以给你设计的类加上一些神奇的特性,比如可以进行python原生的切片操作,迭代、连乘操作等。在python中,特殊方法以双下划线开始,以双下划线结束。一个大例子数学中有一个表示数的概念叫做向量,但是python中的数据类型却没有。我们来设法用python实现它。首先考虑,向量跟普
系统 2019-09-27 17:53:07 2009
函数的嵌套在Python编程语言中,在函数体内创建另外一个函数(对象,因为Python一切皆对象,函数其实也是对象)是完全合法的,这种函数叫做内部/嵌套函数。例子:#coding:utf-8defouter():definner():print("isInnerMethod")print("IsouterMethod")inner()#调用outer函数outer()#调用outer()的内部函数,报错#inner()运行结果:IsouterMethodi
系统 2019-09-27 17:52:56 2009
本文实例讲述了python日志logging模块使用方法。分享给大家供大家参考,具体如下:一、从一个使用场景开始开发一个日志系统,既要把日志输出到控制台,还要写入日志文件importlogging#创建一个loggerlogger=logging.getLogger('mylogger')logger.setLevel(logging.DEBUG)#创建一个handler,用于写入日志文件fh=logging.FileHandler('test.log')
系统 2019-09-27 17:51:47 2009