- 军军小站|张军博客
搜索到与相关的文章
编程技术

挖掘闭合模式的高性能算法学习笔记——CFIST

这是由以下的数据集所创建的CFIST(compoundfrequentitemsettree)复合频繁项集树01|acdfgImp02|abcflmo03|bchmo04|bfkps05|aceflmnp结点描述参见论文。对于路径root->3->7,kis(7)为{c,f},AIS-all={m},则fis(7)={c,f}并上{AIS-all的任意自己(含空集)}={c,f}并上{c,f,m},支持度为kis(7)的支持度为3,fis(v)为候选频繁模

系统 2019-08-29 23:00:58 1887

编程技术

【Lucene3.0 初窥】索引创建(3):DocumentWrite

上接《索引创建(2):DocumentWriter处理流程一》1.3.2第二车间——DocInverterPerFieldDocInverterPerField负责对DocFieldProcessorPerThread对象的Fieldable[]数组的内容建立倒排索引,也就是处理同名字的所有Field。但实际上这个类主要解决的是前期工作,比如分词,统计位置信息等。倒排索引结构的核心的工作由TermsHashPerField和FreqProxTermsWri

系统 2019-08-29 21:59:47 1887

编程技术

【Lucene3.0 初窥】索引创建(2):DocumentWrite

上接《索引创建(1):IndexWriter索引器》1.3索引创建过程DocumentsWriter是由IndexWriter调用来负责对多个document建立索引的核心类,但整个索引过程并不是由一个对象来完成的。而是有一系列的对象组成的处理链(IndexingChain)来完成的(这个过程就像流水线生产汽车)。下面是DocumentWriter开始建立索引的源代码。//由IndexWriter调用的方法booleanaddDocument(Docume

系统 2019-08-29 21:59:47 1887

编程技术

消费互联网大势已去 产业互联网时代到来

然而从互联网发展的角度看,消费互联网市场已趋于稳定与饱和,而对实体资源有充分把控能力的企业仍有很大探索空间,他们正开始尝试与移动互联网融合,创造全新的价值经济,进而推动互联网行业迈向产业互联网时代。本文着重探讨消费互联网时代的特征,BAT在消费互联网时代的战略布局,以及投资人对消费互联网企业的看法。(一)消费互联网消费互联网是一种眼球经济消费互联网即以满足消费者在互联网中的消费需求应运而具备两个属性,一个是媒体属性,由提供资讯为主的门户网站、自媒体和社交媒

系统 2019-08-12 09:30:26 1887

Python

python 解析html

获取制定标签内容,以及HTML全部文本代码#-*-coding:utf-8-*-importrehtml="岗位职责:完成推荐算法、数据统计、接口、后台等服务器端相关工作必备要求:良好的自我驱动力和职业素养,工作积极主动、结果导向"#获得全部文本dr=re.compile(r'<[^>]+>',re.S)dd=dr.sub('',html)print(dd)print("*"*20)#取出p标签中的文本html_regex=r".*?(.*?)"resul

系统 2019-09-27 17:56:47 1886

Python

python学习笔记之包

#把解决一类问题的模块放在同一个文件夹里——包policy.get()importosos.makedirs('glance/api')os.makedirs('glance/cmd')os.makedirs('glance/db')l=[]l.append(open('glance/__init__.py','w'))l.append(open('glance/api/__init__.py','w'))l.append(open('glance/api

系统 2019-09-27 17:56:42 1886

Python

小白学Python

本人财务狗一枚,编程基础为0。因为提升工作效率的主观愿望(备注:懒),准备开始学点python。因为平时比较忙(事多),可能更新的非常慢,估计2019年11月开始正式学习更新。给自己立个flag,主要学习内容两个:(1)提升办公效率(2)pandas库学习day1基础软件安装安装anaconda\pycharm\cmder软件介绍:Pycharm是集成开发环境(操作平台),Anaconda是集成环境管理器(库包),cmder好用的程序操作命令参考文档:Py

系统 2019-09-27 17:56:37 1886

Python

详解Python self 参数

1、概述1.1场景我们在使用Python中的方法method时,经常会看到参数中带有self,但是我们也没对这个参数进行赋值,那么这个参数到底是啥意思呢?2、知识点2.1成员函数(m)和普通方法(f)Python中的"类方法"必须有一个额外的第一个参数名称(名称任意,不过推荐self),而"普通方法"则不需要。m、f、c都是代码自动提示时的左边字母(method、function、class)#-*-coding:utf-8-*-classTest(obj

系统 2019-09-27 17:56:05 1886

Python

跟老齐学Python之不要红头文件(2)

文件的属性所谓属性,就是能够通过一个文件对象得到的东西。复制代码代码如下:>>>f=open("131.txt","a")>>>f.name'131.txt'>>>f.mode#显示当前文件打开的模式'a'>>>f.closed#文件是否关闭,如果关闭,返回True;如果打开,返回FalseFalse>>>f.close()#关闭文件的内置函数>>>f.closedTrue文件的有关状态很多时候,我们需要获取一个文件的有关状态(有时候成为属性,但是这里的文

系统 2019-09-27 17:56:05 1886