- 军军小站|张军博客
搜索到与相关的文章
编程技术

【Lucene3.0 初窥】索引创建(3):DocumentWrite

上接《索引创建(2):DocumentWriter处理流程一》1.3.2第二车间——DocInverterPerFieldDocInverterPerField负责对DocFieldProcessorPerThread对象的Fieldable[]数组的内容建立倒排索引,也就是处理同名字的所有Field。但实际上这个类主要解决的是前期工作,比如分词,统计位置信息等。倒排索引结构的核心的工作由TermsHashPerField和FreqProxTermsWri

系统 2019-08-29 21:59:47 1887

编程技术

【Lucene3.0 初窥】索引创建(2):DocumentWrite

上接《索引创建(1):IndexWriter索引器》1.3索引创建过程DocumentsWriter是由IndexWriter调用来负责对多个document建立索引的核心类,但整个索引过程并不是由一个对象来完成的。而是有一系列的对象组成的处理链(IndexingChain)来完成的(这个过程就像流水线生产汽车)。下面是DocumentWriter开始建立索引的源代码。//由IndexWriter调用的方法booleanaddDocument(Docume

系统 2019-08-29 21:59:47 1887

编程技术

消费互联网大势已去 产业互联网时代到来

然而从互联网发展的角度看,消费互联网市场已趋于稳定与饱和,而对实体资源有充分把控能力的企业仍有很大探索空间,他们正开始尝试与移动互联网融合,创造全新的价值经济,进而推动互联网行业迈向产业互联网时代。本文着重探讨消费互联网时代的特征,BAT在消费互联网时代的战略布局,以及投资人对消费互联网企业的看法。(一)消费互联网消费互联网是一种眼球经济消费互联网即以满足消费者在互联网中的消费需求应运而具备两个属性,一个是媒体属性,由提供资讯为主的门户网站、自媒体和社交媒

系统 2019-08-12 09:30:26 1887

Python

python 解析html

获取制定标签内容,以及HTML全部文本代码#-*-coding:utf-8-*-importrehtml="岗位职责:完成推荐算法、数据统计、接口、后台等服务器端相关工作必备要求:良好的自我驱动力和职业素养,工作积极主动、结果导向"#获得全部文本dr=re.compile(r'<[^>]+>',re.S)dd=dr.sub('',html)print(dd)print("*"*20)#取出p标签中的文本html_regex=r".*?(.*?)"resul

系统 2019-09-27 17:56:47 1886

Python

python学习笔记之包

#把解决一类问题的模块放在同一个文件夹里——包policy.get()importosos.makedirs('glance/api')os.makedirs('glance/cmd')os.makedirs('glance/db')l=[]l.append(open('glance/__init__.py','w'))l.append(open('glance/api/__init__.py','w'))l.append(open('glance/api

系统 2019-09-27 17:56:42 1886

Python

小白学Python

本人财务狗一枚,编程基础为0。因为提升工作效率的主观愿望(备注:懒),准备开始学点python。因为平时比较忙(事多),可能更新的非常慢,估计2019年11月开始正式学习更新。给自己立个flag,主要学习内容两个:(1)提升办公效率(2)pandas库学习day1基础软件安装安装anaconda\pycharm\cmder软件介绍:Pycharm是集成开发环境(操作平台),Anaconda是集成环境管理器(库包),cmder好用的程序操作命令参考文档:Py

系统 2019-09-27 17:56:37 1886

Python

详解Python self 参数

1、概述1.1场景我们在使用Python中的方法method时,经常会看到参数中带有self,但是我们也没对这个参数进行赋值,那么这个参数到底是啥意思呢?2、知识点2.1成员函数(m)和普通方法(f)Python中的"类方法"必须有一个额外的第一个参数名称(名称任意,不过推荐self),而"普通方法"则不需要。m、f、c都是代码自动提示时的左边字母(method、function、class)#-*-coding:utf-8-*-classTest(obj

系统 2019-09-27 17:56:05 1886

Python

利用Python判定IP地址合法性的三种方法

在帮朋友解决这个问题后,随便记录一下这三种方法:第一种方法:使用正则表达式:因为当时的要求是判定10.0.0.1到10.255.255.255,原理其实是一样。这里简单回顾一下正则表达式模式的内容:常见的如:\d可以表示0~9的任意一个数字字符而\D是匹配一个非数字字符等价于^^是匹配字符串的开头,但放在[]中表示匹配不在[]中的字符$是匹配字符串的末尾.是匹配除了换行符任意字符{}表示重复几次,例如:^a{2,4}$aa,aaa或aaaa|的是或的意思[

系统 2019-09-27 17:55:59 1886

Python

Python实现计算对象的内存大小示例

本文实例讲述了Python实现计算对象的内存大小。分享给大家供大家参考,具体如下:一般的sys.getsizeof()显示不了复杂的字典。查看类中的内容:defdump(obj):forattrindir(obj):#dir显示类的所有方法print("obj.%s=%r"%(attr,getattr(obj,attr)))这里用递归调用所有对象的getsizeof:defget_size(obj,seen=None):#Fromhttps://goshi

系统 2019-09-27 17:55:55 1886