一.概述首先需要先介绍一下无监督学习,所谓无监督学习,就是训练样本中的标记信息是位置的,目标是通过对无标记训练样本的学习来揭示数据的内在性质以及规律。通俗得说,就是根据数据的一些内在性质,找出其内在的规律。而这一类算法,应用最为广泛的就是“聚类”。聚类算法可以对数据进行数据归约,即在尽可能保证数据完整的前提下,减少数据的量级,以便后续处理。也可以对聚类数据结果直接应用或分析。而Kmeans算法可以说是聚类算法里面较为基础的一种算法。二.从样例开始我们现在在
系统 2019-09-27 17:50:00 2149
RSS是一个可用多种扩展来表示的缩写:“RDF站点摘要(RDFSiteSummary)”、“真正简单的辛迪加(ReallySimpleSyndication)”、“丰富站点摘要(RichSiteSummary)”,也许还能用其他扩展来表示。在如此混乱的名称背后,您会发现和这样一个平凡的技术领域相关的故事多得令人吃惊。RSS是用于分发Web站点上的内容的摘要的一种简单的XML格式。它能够用于共享各种各样的信息,包括(但不是仅限于)简讯、Web站点更新、事件日
系统 2019-09-27 17:49:55 2149
celery英文官方网站:www.celeryproject.org中文网站:http://docs.jinkan.org/docs/celery/celeryCelery是一个简单、灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必需工具。专注于实时处理的任务队列,同时也支持任务调度。作用:解决耗时操作:开一个新的进程,去操作耗时操作,不影响原有进程定时操作,使Listitem用celery定时执行操作:定义一个任务task,也就是一个
系统 2019-09-27 17:48:28 2149
动态链接库在Windows中为.dll文件,在linux中为.so文件。以linux平台为例说明python调用.so文件的使用方法。本例中默认读者已经掌握动态链接库的生成方法,如果不太清楚的可以参考动态链接库的使用调用上例动态链接库的使用中的sum.soimportctypesso=ctypes.CDLL('./sum.so')print"so.sum(50)=%d"%so.sum(50)so.display("helloworld!")print"so
系统 2019-09-27 17:47:56 2149
super的工作原理如下:defsuper(cls,inst):mro=inst.__class__.mro()returnmro[mro.index(cls)+1]其中,cls代表类,inst代表实例,上面的代码做了两件事:获取inst的MRO列表查找cls在当前MRO列表中的index,并返回它的下一个类,即mro[index+1]当你使用super(cls,inst)时,Python会在inst的MRO列表上搜索cls的下一个类。下面看一个例子:cl
系统 2019-09-27 17:47:45 2149
PostgreSQL是一款功能强大的开源关系型数据库,本文使用python实现了对开源数据库PostgreSQL的常用操作,其开发过程简介如下:一、环境信息:1、操作系统:RedHatEnterpriseLinux4WindowsXPSP22、数据库:PostgreSQL8.33、开发工具:Eclipse+Pydev+python2.6+PyGreSQL(提供pg模块)4、说明:a、PostgreSQL数据库运行于RedHatLinux上,Windows下
系统 2019-09-27 17:47:07 2149
一、说明类似json将xml解析为python对象,可以使用第三方库untangle或xmltodict实现。将以下内容保存为xml2obj.xml,后我我们就使用该文件。1.第一行的是xml文件的声明,它定义了xml的版本(1.0)和所使用编码为UTF-8。2.接下来就是xml文件的内容了,这些内容按一个树状结构进行组织摆放,形式如下:section1contentsection2content其中,每一个.叫做一个节点,也叫一个元素,节点可以嵌套放置,
系统 2019-09-27 17:46:25 2149
Scrapy官方介绍是Anopensourceandcollaborativeframeworkforextractingthedatayouneedfromwebsites.Inafast,simple,yetextensibleway.意思就是一个开源和协作框架,用于以快速,简单,可扩展的方式从网站中提取所需的数据。环境准备本文项目使用环境及工具如下python3scrapymongodbpython3scrapy的安装就不再叙述mongodb是用来存
系统 2019-09-27 17:46:17 2149
目录一、异常TODO二、深浅拷贝2.1拷贝2.2浅拷贝2.3深拷贝三、数据类型内置方法3.1数字类型内置方法3.1.1整型3.1.2浮点型3.2字符串类型内置方法3.3列表类型内置方法3.4元祖类型内置方法3.5字典类型内置方法3.6集合类型内置方法3.7布尔类型四、数据类型分类4.1按值个数4.2按有序无序4.3按可变不可变一、异常TODO万能捕捉异常公式try:#逻辑代码1/0exceptExceptionase:print(e)divisionbyz
系统 2019-09-27 17:45:32 2149
一、注意你的Python版本Python官方网站为http://www.python.org/,当前最新稳定版本为3.6.5,在3.0版本时,Python的语法改动较大,而网上的不少教程及语法针对的是1.0或者2.0版本的,这样就造成不少初学者按照示例代码来写,但编译都无法通过的问题。1、print()函数旧的print函数用法为print‘Hello',而新的print函数对此改成了print(‘Hello')并且不再兼容之前版本。如果在3.X版本上Py
系统 2019-09-27 17:38:38 2149