部分转载:http://www.blogjava.net/zhenandaci/archive/2008/05/31/204646.html作者:Jasper文本分类(textcategorization)问题就是将一篇文档归入预先定义的几个类别中的一个或几个,而文本的自动分类则是使用计算机程序来实现这样的分类。通俗点说,就好比你拿一篇文章,问计算机这文章要说的究竟是体育,经济还是教育,计算机答不上就打它的屁屁(……)。注意这个定义当中着重强调的两个事实。
系统 2019-08-29 21:59:32 1745
今天这堂培训课讲什么呢?我既不讲Spring,也不讲Hibernate,更不讲Ext,我不讲任何一个具体的技术。我们抛开任何具体的技术,来谈谈如何提高代码质量。如何提高代码质量,相信不仅是在座所有人苦恼的事情,也是所有软件项目苦恼的事情。如何提高代码质量呢,我认为我们首先要理解什么是高质量的代码。高质量代码的三要素我们评价高质量代码有三要素:可读性、可维护性、可变更性。我们的代码要一个都不能少地达到了这三要素的要求才能算高质量的代码。1.可读性强一提到可读
系统 2019-08-29 21:58:58 1745
AndyBudd的样式指南转自:http://www.cnblogs.com/JustinYoung/articles/763052.htmlkeyword:cssMastery,andyBudd,styleGuide,css样式表组织与规划.下载地址:http://files.cnblogs.com/JustinYoung/Styleguide.rar《CSSMastery》作者AndyBudd提供的《StyleGuide》.对web标准中的css组织和
系统 2019-08-12 09:29:31 1745
根据讲师所讲做了一下笔记以便自己能方便学习:------------------------------------------grasp设计模式;grasp(generalresponsibilityassignmentsoftwarepatterns:通用职责分配软件模式)模式相对于gof23模式更加抽象,它的核心思想:职责如何分配和如何用用职责设计对象;它的五个基本模式:---信息专家、创建者、高内聚、低耦合、控制器;四个扩展模式;---多态性、纯虚
系统 2019-08-12 01:33:35 1745
使用过anaconda环境下打包py文件的一点感悟,使用的是pyinstaller+anaconda环境下打包py文件打包:pyinstaller-F-w-ilogo.icoxxxx.py-F:强制打包-w:不带后台命令窗口-i:使用logo图标的地址需要打包的文件遇到的问题:1.首先对于使用anaconda打包py文件是存在问题的;1)打包出来的exe会很大,会打包很多关联库;2)而其中的一些关联库是没有用,而导入这些库会拖慢程序运行的效率。解决:使用虚
系统 2019-09-27 17:57:11 1744
本文实例为大家分享了pythonrsync服务器之间文件夹同步的具体代码,供大家参考,具体内容如下Aboutrsync配置两台服务器之间3ssh-key后,可以实现自动化无需手动输入密码,脚本如下:importargparseimportdatetimefromfunctoolsimportpartialimportmultiprocessingasmpimportosimportparamikoaspmkimporttimedefcheck_ssh(ho
系统 2019-09-27 17:57:04 1744
进程杂谈#进程就是正在执行的一个过程,是对正在运行程序的一个抽象#进程由程序、数据集和进程控制块(最重要的,进程切换状态如何保存,恢复和记录)组成"""进程调度:1.先来先服务2.短作业优先调度3.时间片轮转法4.多级反馈队列进程遇到IO就会被挂起"""'''将一个单独的cpu变成多个虚拟的cpu(多道技术:时间多路复用和空间多路复用+硬件上支持隔离)没有进程的抽象,现代计算机将不复存在''''''操作系统的作用:1.隐藏丑陋复杂的硬件接口,提供良好的抽象
系统 2019-09-27 17:57:03 1744
今天,我实现了一个很有趣的demo,它可以在视频里找到并解析二维码,然后把解析的内容实时在屏幕上显示出来。然后我们直入主题,首先你得确保你装了opencv,python,zbar等环境。然后这个教程对于学过opencv的人可能更好理解,但是没学过也无妨,到时候也可以直接用。比如我的电脑上的环境是opencv2.4.x,python2.7,和最新的zbar,在Ubuntu12.12的系统下运行的假设你的opencv已经安装好了,那么我们就可以安装zbar你可
系统 2019-09-27 17:57:00 1744
前言在K近邻的原始算法中,没有对K近邻的方法进行优化,还是遍历训练集,找到与输入实例最近的K个训练实例,统计他们的类别,以此作为输入实例类别的判断。具体的模型理论见:统计学习方法——K近邻法(原始方法)1.K近邻算法的实现在算法实现的过程中,利用的是欧氏距离进行点与点之间的距离度量。在进行数据运算的时候,没有利用numpy,而是利用Python中自带的list来进行数据的计算。defknn(x,dataSet,labels,k):distanceMemor
系统 2019-09-27 17:56:59 1744
首先要分析一下电影天堂网站的首页结构。在这里插入图片描述从上面的菜单栏中我们可以看到整个网站资源的总体分类情况。刚刚好我们可以利用到它的这个分类,将每一个分类地址作为爬虫的起点。①解析首页地址提取分类信息#解析首页defCrawIndexPage(starturl):print"正在爬取首页"page=__getpage(starturl)ifpage=="error":returnpage=page.decode('gbk','ignore')tree=
系统 2019-09-27 17:56:58 1744