搜索到与相关的文章
编程技术

【文本分类】文本表示 --- VSM

要使得计算机能高效的处理真实文本,就必须找到一种理想的形式化表示方法,这种表示一方面能真实的反映文档内容(主题、领域或结构等),另一方面也要有对不同文档的区分能力。目前文本表示通常采用向量空间模型(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。下面首先给出VSM设计的基本概念:(1)文档(document):通常是文章中具有一定规模的字符串。文档通常我们也叫文本。(

系统 2019-08-29 21:59:30 1950

编程技术

大话重构连载首页

《大话重构》这本书是我写的第一本书,从今天起我将通过连载的形式逐渐跟大家分享。这本书让你:告别游击队转变为正规军,远离劣质代码走向精妙设计真正明白专业级的软件开发是怎样的真正明白重构是怎样一步一步进行的高效重构七步曲,面对实践不卡壳让遗留系统维护不再是你的梦魇读完这本书以后:需求变更不再纠结,重构让你润物细无声地容纳它们超越代码级的重构,从各个层面深度领略重构之美自动化测试不再是梦想,重构让自动化测试走你重新审视熟悉而陌生的技术,将碎了一地的它们重新铆合在

系统 2019-08-29 21:59:06 1950

编程技术

如何在struts+spring+hibernate的框架下构建低

一.问题的提出我常常在思考一个问题,我们如何能设计出高水平、高质量的软件出来。怎样是高水平、高质量的软件?它应当是易于维护、易于适应变更、可重用性好的一个系统。如何做到这一点呢?答案当然是“低耦合、高内聚”了。低耦合就是软件在构造的时候,各个模块、各个功能、各个类都不会过度依赖于它周围的环境。只有这样,才能使我们的模块(功能、类)在周围发生变更时不受影响,做到易于维护和易于适应变更。正因为如此,也使它更易于重用到其它功能类似的环境中,提高了重用性。高内聚则

系统 2019-08-29 21:59:02 1950

编程技术

人人都是领域专家-活动图

/***转载请注明作者longdickhttp://longdick.iteye.com**/相关帖子:1、人人都是领域专家-用例图2、人人都是领域专家-活动图3、人人都是领域专家-类图4、人人都是领域专家-顺序图5、人人都是领域专家-类图关系化6、人人都是领域专家-类图关系说明需求阶段用例图完成以后,需要进一步描述用例。由于每一个用例可能对应几个事件流,单从用例不能获取有效的信息。这时候就要用到活动图了。活动图专门用来描述用例的事件流。我们借用上一节其中

系统 2019-08-12 09:30:24 1950

编程技术

笔者带你剖析Apache Commons DbUtils 1.6

《笔者带你剖析ApacheCommonsDbUtils1.6》前言关于Apache的DbUtils中间件或许了解的人并不多,大部分开发人员在生成环境中更多的是依靠Hibernate、Ibatis、SpringJDBC、JPA等大厂提供的持久层技术解决方案,或者是企业内部自己研发的持久层技术。但无论如何,使用这些技术的初衷和本质都是为了能够减少企业开发成本,提高生产效率,降低耦合。放眼企业级项目,Hibernate等ORM产品是首选,而互联网领域,大部分开发

系统 2019-08-12 09:29:33 1950

Python

python爬虫urllib的request与parse方法

在爬虫前,需要知道这两个知识点!!!字符串转字节类型str-->bytesencode()字节类型转字符串bytes-->strdecode()1.以一个简单的例子讲解urllib.request方法read读取相应内容,内容geturl获取请求的urlgetheaders获取头部信息getcode获取状态码readlines按行读取,返回列表,都是字节类型1.1获取百度的网页代码importurllib.requesturl="https://www.b

系统 2019-09-27 17:57:13 1949

Python

详解python脚本自动生成需要文件实例代码

python脚本自动生成需要文件在工作中我们经常需要通过一个文件写出另外一个文件,然而既然是对应关系肯定可以总结规律让计算机帮我们完成,今天我们就通过一个通用文件生成的python脚本来实现这个功能,将大家从每日重复的劳动中解放!定义一个函数defproduceBnf(infilename,outfilename):List=[]withopen(infilename,'r')asinf:forlineininf.readlines():List.appe

系统 2019-09-27 17:56:45 1949

Python

python的pstuil模块使用方法总结

代码importpsutilprint(dir(psutil))#查看逻辑cpu的个数print(psutil.cpu_count())#查看物理cpu的个数print(psutil.cpu_count(logical=False))#查看cpu的用户时间,系统时间,空闲时间,中断时间print(psutil.cpu_times())#统计每个cpu的使用率print(psutil.cpu_percent(interval=2,percpu=True))#

系统 2019-09-27 17:56:18 1949

Python

Python 3.x标准库有哪些

文本库string:通用字符串操作re:正则表达式操作difflib:差异计算工具textwrap:文本填充unicodedata:Unicode字符数据库stringprep:互联网字符串准备工具readline:GNU按行读取接口rlcompleter:GNU按行读取的实现函数二进制数据库struct:将字节解析为打包的二进制数据codecs:注册表与基类的编×××数据类型库datetime:基于日期与时间工具calendar:通用月份函数collec

系统 2019-09-27 17:56:06 1949

Python

Python字典排序

defreverse_rank(id,score):values=list()fori,vinzip(id,score):values.append((i,(np.argmax(v),v[1])))values=sorted(values,key=lambdaitem:(item[1][0],item[1][1]),reverse=True)returnvaluesid=['1','2','3','4']score=[(1,0.45),(0,0.32),(

系统 2019-09-27 17:55:51 1949