一、概论C4.5主要是在ID3的基础上改进,ID3选择(属性)树节点是选择信息增益值最大的属性作为节点。而C4.5引入了新概念“信息增益率”,C4.5是选择信息增益率最大的属性作为树节点。二、信息增益以上公式是求信息增益率(ID3的知识点)三、信息增益率信息增益率是在求出信息增益值在除以。例如下面公式为求属性为“outlook”的值:四、C4.5的完整代码fromnumpyimport*fromscipyimport*frommathimportlogim
系统 2019-09-27 17:54:47 1951
网络爬虫,是在网上进行数据抓取的程序,使用它能够抓取特定网页的HTML数据。虽然我们利用一些库开发一个爬虫程序,但是使用框架可以大大提高效率,缩短开发时间。Scrapy是一个使用Python编写的,轻量级的,简单轻巧,并且使用起来非常的方便。使用Scrapy可以很方便的完成网上数据的采集工作,它为我们完成了大量的工作,而不需要自己费大力气去开发。首先先要回答一个问题。问:把网站装进爬虫里,总共分几步?答案很简单,四步:新建项目(Project):新建一个新
系统 2019-09-27 17:54:44 1951
题目:给定一个二叉树,检查它是否是镜像对称的。例如,二叉树[1,2,2,3,4,4,3]是对称的。1/\22/\/\3443但是下面这个[1,2,2,null,3,null,3]则不是镜像对称的:1/\22\\33用递归和队列实现#递归#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,x):#self.val=x#self.left=None#self.right=Noneclas
系统 2019-09-27 17:53:29 1951
1.递归时用self.函数名2.python中只有None表示空,没有null,NULL3.切片:切片的语法表达式为:[start_index:end_index:step],同时索引可分为正向和负向两种,其中:start_index表示起始索引end_index表示结束索引step表示步长,步长不能为0,且默认值为1或split()通过指定分隔符对字符串进行切片,如果参数num有指定值,则仅分隔num+1个子字符串str.split(str="",num
系统 2019-09-27 17:53:07 1951
random模块中的常用函数复制代码代码如下:random()返回一个位于区间[0,1]内的实数;uniform(a,b)返回一个位于区间[a,b]内的实数;randint(a,b)返回一个位于区间[a,b]内的整数;choice(sequence)返回一个位于sequence中的元素,其中,sequence为一个有序序列,如list、string或者tuple等类型;randrange([start],stop[,step])等效于choice(rang
系统 2019-09-27 17:52:43 1951
zip文件是我们经常使用的打包格式之一,python解压和压缩zip效率非凡。python解压zip文档:复制代码代码如下:#/usr/bin/python#coding=utf-8importos,sys,timeimportzipfilefilename='callofdutyblackopszombies_1349649132343_my.zip'#要解压的文件filedir='data/'#解压后放入的目录r=zipfile.is_zipfile(
系统 2019-09-27 17:52:13 1951
Python正则表达式简介正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。re模块使Python语言拥有全部的正则表达式功能。compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。本章节
系统 2019-09-27 17:49:55 1951
1.命令介绍最近学习并使用了一个python的内置函数dir,首先help一下:复制代码代码如下:>>>help(dir)Helponbuilt-infunctiondirinmodule__builtin__:dir()dir([object])->listofstringsReturnanalphabetizedlistofnamescomprising(someof)theattributesofthegivenobject,andofattribu
系统 2019-09-27 17:49:49 1951
背景:最近写的Python代码不知为何,总是执行到一半卡住不动,为了使程序能够继续运行,设置了函数调用超时机制。代码:importtimeimportsignaldeftest(i):time.sleep(i%4)print"%dwithintime"%(i)returniif__name__=='__main__':defhandler(signum,frame):raiseAssertionErrorforiinrange(1,10):try:sign
系统 2019-09-27 17:48:29 1951
要求:实现功能:创建一个可以聊天的机器人importrequestsimportjsonuserid=str(1)#1可以替换成任何长度小于32的字符串哦apikey=str(‘A')#这里的A,记得替换成你自己的apikey哦~#创建post函数defrobot(content):#图灵apiapi=r'http://openapi.tuling123.com/openapi/api/v2'#创建post提交的数据data={"perception":{
系统 2019-09-27 17:48:19 1951