参考:http://blog.csdn.net/qiaochao911/article/details/8613988http://xm-king.iteye.com/blog/1088422HIVE分区,实际上是通过一个路径来标识的,而不是在物理数据中。比如每天的数据,可能分区是pt=20121023这样,那么路径中它就会变成:/hdfs/path/pt=20121023/data_files。通过路径来标识的好处是,如果我们需要取特定分区的数据,只需要
系统 2019-08-12 01:55:14 3089
如果在我们的分类问题中,输入特征$x$是连续型随机变量,高斯判别模型(GaussianDiscriminantAnalysis,GDA)就可以派上用场了。以二分类问题为例进行说明,模型建立如下:样本输入特征为\(x\in\mathbb{R}^n\),其类别\(y\in\{0,1\}\);样本类别\(y\)服从参数为\(\phi\)的伯努力分布,即\(y\simBernoulli(\phi)\);两类样本分别服从不同的高斯分布,即\(x|y=0\sim\ma
系统 2019-08-12 01:33:04 3089
第一章引言第二章预备知识第三章直接聚类法第四章K-means第五章DBSCAN第六章OPTICS第七章聚类分析的效果评测第八章数据尺度化问题作者:peghoty出处:http://blog.csdn.net/itplus/article/details/10088101欢迎转载/分享,但请务必声明文章出处.聚类算法初探(二)预备知识
系统 2019-08-12 01:32:58 3089
目录一、Python进阶实战之三级菜单一、Python进阶实战之三级菜单打印省、市、县三级菜单可返回上一级可随时退出程序menu=\{'北京':{'海淀':{'五道口':{'soho':{},'网易':{},'google':{}},'中关村':{'爱奇艺':{},'汽车之家':{},'youku':{},},'上地':{'百度':{},},},'昌平':{'沙河':{'老男孩':{},'北航':{},},'天通苑':{},'回龙观':{},},'朝阳':
系统 2019-09-27 17:49:10 3088
函数调用约定和堆栈1什么是堆栈编译器一般使用堆栈实现函数调用。堆栈是存储器的一个区域,嵌入式环境有时需要程序员自己定义一个数组作为堆栈。Windows为每个线程自动维护一个堆栈,堆栈的大小可以设置。编译器使用堆栈来堆放每个函数的参数、局部变量等信息。函数调用经常是嵌套的,在同一时刻,堆栈中会有多个函数的信息,每个函数占用一个连续的区域。一个函数占用的区域被称作帧(frame)。编译器从高地址开始使用堆栈。假设我们定义一个数组a[1024]作为堆栈空间,一开
系统 2019-08-12 01:51:32 3088
配置环境需要:1.Apache服务器,下载地址:http://httpd.apache.org/download.cgi#apache222.tomcat6.0或者tomcat7.0,(集群中tomcat不能既有tomcat6又有tomcat7,否则虽能够负载均衡,但不能进行session复制,下载地址:http://tomcat.apache.org/3.jk是tomcat提供给http服务器的插件mod_jk-1.2.31-httpd-2.2.3.so
系统 2019-08-12 01:32:53 3088
数据集数据集:ris鸢尾花数据集,它包含3个不同品种的鸢尾花:[Setosa,Versicolour,andVirginica]数据,特征:[‘sepallength’,‘sepalwidth’,‘petallength’,‘petalwidth’],一共150个数据。由于这是2分类问题,所以选择前两类数据进行算法测试。代码实现importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_iri
系统 2019-09-27 17:46:36 3087
7-Zip是一款号称有着现今最高压缩比的压缩软件,它不仅支持独有的7z文件格式,而且还支持各种其它压缩文件格式,其中包括ZIP,RAR,CAB,GZIP,BZIP2和TAR。此软件压缩的压缩比要比普通ZIP文件高30-50%。因此,它可以把经WinZip压缩的文件再压缩2-10%。文件扩展名:.7z,可目前windows服务器无法支持.7z格式,所以我们需要设置一下。win2003的IIS6默认是不支持7z的,需要手工添加在IIS里所需要的站点---属性-
系统 2019-08-29 23:52:26 3087
打包过很多个版本的deb包,都不怎么满意,2009sp6,2010wine的时候也是会崩溃的,虽然这两个版本支持自动自动下载备注。这次打包的版本,使用的是QQ2009preview3(build305),原来使用的是preview2(build225)。看看这版的功能:支持自动下载备注支持语言聊天(暂时没法使用视频功能)支持截图以及截图小工具聊天记录以及消息管理器对比一下wineqq2010的优势登陆不崩溃菜单无黑影对比原wineqq2009preview
系统 2019-08-29 22:31:22 3087
堆排序的概念:首先,我们先要理解堆的定义,堆定义:n个关键字序列K1,K2,...,Kn称为(Heap),当且仅当该序列满足如下性质(简称:堆性质):(1)k(i)<=k(2i)且k(i)<=k(2i+i)(1<=i<=n/2),当然,这是最小根堆,(2)k(i)>=k(2i)且k(i)>=k(2i+i)(1<=i<=n/2),大根堆则换成>=号。k(i)相当于二叉树的非叶结点,k(2i)则是左孩子,k(2k+1)是右孩子若将此序列所存储的向量R[1...
系统 2019-08-12 09:30:35 3087