- 军军小站|张军博客
搜索到与相关的文章
编程技术

【Lucene3.0 初窥】索引文件格式(4):dictionar

Terms数据磁盘文件存储细节从这篇开始,已经涉及到倒排索引表的信息存储问题了。我们都知道倒排索引表中的Dictionary有许多不同的terms组成,Lucene关于这些terms数据的存储,就放在磁盘的.tii和.tis文件中。★.tii词典索引文件.tis词典数据文件1、tii保存了tis中每隔IndexInterval个词的位置信息,这是为了加快对词典文件tii中词的查找速度具体结构如下:TermInfoIndex(.tii)-->TIVersio

系统 2019-08-29 21:59:40 1796

Python

Python提取文本tf、idf

"""python提取文本的tfidf特征"""importmathfromcollectionsimportCounter#1.语料库corpus=['thisisthefirstdocument','thisisthesecondseconddocument','andthethirdone','isthisthefirstdocument']#2.对语料进行分词word_list=[]foriinrange(len(corpus)):word_lis

系统 2019-09-27 17:57:10 1795

Python

第十五章、python中的进程操作-开启多进程

目录第十五章、python中的进程操作-开启多进程一、multprocess模块二、multprocess.process模块三、Process()对象方法介绍四、Process()对象属性介绍五、使用process模块创建进程六、进程之间的数据隔离问题七、守护进程八、terminate方法九、pid和name属性第十五章、python中的进程操作-开启多进程一、multprocess模块multiprocess不是一个模块而是python中一个操作、管理

系统 2019-09-27 17:56:35 1795

Python

Python利用WMI实现ping命令的例子

WMI是Windows系统的一大利器,Python的win32api库提供了对WMI的支持,安装win32api即可使用WMI。本例通过WMI的WQL实现ping命令。importwmic=wmi.WMI()wql="SELECTStatusCodeFROMWin32_PingStatusWHEREAddress='127.0.0.1'"foriinc.query(wql):ifi.StatusCode:print'offline'else:print'o

系统 2019-09-27 17:56:28 1795

Python

python的pstuil模块使用方法总结

代码importpsutilprint(dir(psutil))#查看逻辑cpu的个数print(psutil.cpu_count())#查看物理cpu的个数print(psutil.cpu_count(logical=False))#查看cpu的用户时间,系统时间,空闲时间,中断时间print(psutil.cpu_times())#统计每个cpu的使用率print(psutil.cpu_percent(interval=2,percpu=True))#

系统 2019-09-27 17:56:18 1795

Python

python自动化测试之连接几组测试包实例

本文实例讲述了python自动化测试之连接几组测试包的方法,分享给大家供大家参考。具体方法如下:具体代码如下:classRomanNumeralConverter(object):def__init__(self):self.digit_map={"M":1000,"D":500,"C":100,"L":50,"X":10,"V":5,"I":1}defconvert_to_decimal(self,roman_numeral):val=0forchari

系统 2019-09-27 17:56:05 1795

Python

利用Python判定IP地址合法性的三种方法

在帮朋友解决这个问题后,随便记录一下这三种方法:第一种方法:使用正则表达式:因为当时的要求是判定10.0.0.1到10.255.255.255,原理其实是一样。这里简单回顾一下正则表达式模式的内容:常见的如:\d可以表示0~9的任意一个数字字符而\D是匹配一个非数字字符等价于^^是匹配字符串的开头,但放在[]中表示匹配不在[]中的字符$是匹配字符串的末尾.是匹配除了换行符任意字符{}表示重复几次,例如:^a{2,4}$aa,aaa或aaaa|的是或的意思[

系统 2019-09-27 17:55:59 1795

Python

Python实现计算对象的内存大小示例

本文实例讲述了Python实现计算对象的内存大小。分享给大家供大家参考,具体如下:一般的sys.getsizeof()显示不了复杂的字典。查看类中的内容:defdump(obj):forattrindir(obj):#dir显示类的所有方法print("obj.%s=%r"%(attr,getattr(obj,attr)))这里用递归调用所有对象的getsizeof:defget_size(obj,seen=None):#Fromhttps://goshi

系统 2019-09-27 17:55:55 1795

Python

详谈Python2.6和Python3.0中对除法操作的异同

Python中除法有两种运算符:'/'和'//';有三种类型的除法:传统除法、Floor除法和真除法。X/Y类型:在Python2.6或者之前,这个操作对于整数运算会省去小数部分,而对于浮点数运算会保持小数部分;在Python3.0中变成真除法(无论任何类型都会保持小数部分,即使整除也会表示为浮点数形式)。示例代码:Python2.7版本中结果:>>>3/21>>>3/2.01.5>>>4/22>>>4/2.02.0Python3.4版本中结果:>>>3/

系统 2019-09-27 17:55:54 1795

Python

[python学习笔记]loc与iloc函数的用法及区别

loc(location)为SelectionbyLabel函数,即通过标签(行列索引的具体值)来索引数据,由于loc函数中索引的标签是str类型,所以标签的开头和结尾都要写。importpandasaspdimportnumpyasnpdf=pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc'))df.loc[0:2,['b','c']]#默认行索引情况下,选取df前三行的b,c两

系统 2019-09-27 17:55:53 1795