各行各业 - 军军小站|张军博客
各行各业

nutch 存储到数据库

就像我们知道的一样,nutch是一个架构在lucene之上的网络爬虫+搜索引擎.是由lucene的作者在lucene基础之上开发,并整合了hadoop,实现在分布式云计算,使用google标准的HFDS文件系统作为存储结构,是一款高伸缩性能与高效高并发的网络爬虫+搜索引擎.FaceYe在后台已经整合了nutch,在适当的时候,就可以开始为用户提供高质量的知识索引服务.顺便说一下,nutch在生产环境中,并不能在windows下运行,需要在liux下运行,这

系统 2019-08-12 09:27:33 1949

各行各业

httpd.ini

[ISAPI_Rewrite]CacheClockRate3600RepeatLimit32RewriteRule^(.*)/plus/list-tid-([0-9]+)\.html$$1/plus/list\.php\?tid=$2RewriteRule^(.*)/plus/view-aid-([0-9]+)\.html$$1/plus/view\.php\?aid=$2浏览器输入^(.*)/plus/list-tid-([0-9]+)\.html$则在

系统 2019-08-12 09:26:58 1949

各行各业

UESTC 1237 质因子分解

水题一枚。。#include#include#include#include#include#includeusingnamespacestd;intisprime(intb,intn){inti;for(i=b;i<=sqrt(n);i++){if(n%i==0)returni;}return1;}intres[10005];intmain(){in

系统 2019-08-12 09:26:56 1949

各行各业

Installer magic of setup project

Gotacasehelptheotherday:https://connect.microsoft.com/VisualStudio/feedback/ViewFeedback.aspx?FeedbackID=476401,whichisaboutbackslashestrimmedofaUNCpathstartingwith"\\"as/SourceDir="[SourceDir]\".Thinkofaworkaroundforhim:if(Regex.

系统 2019-08-12 09:26:43 1949

各行各业

DXperience 8.2.2 简繁体汉化,本地化,Skins

下载地址:http://download.csdn.net/source/564144有问题请跟帖简体:在项目中加入附件中的DevExpress.Localization.v8.2.dll引用winform:在MDIMainForm的FormLoad事件中加入以下sourceswebform:Default.aspx的Page_Load事件中加入以下sourcesDevExpress.Web.ASPxClasses.Localization.ASPxper

系统 2019-08-12 09:27:41 1948

各行各业

keystone源码分析(一)——Paste Deploy的应用

本keystone源码分析系列基于Juno版Keystone,于2014年10月16日随Juno版OpenStack发布。Keystone作为OpenStack中的身份管理与授权模块,主要实现系统用户的身份认证、基于角色的授权管理、其他OpenStack服务的地址发现和安全策略管理等功能。Keystone作为开源云系统OpenStack中至关重要的组成部分,与OpenStack中几乎所有的其他服务(如Nova,Glance,Neutron等)都有着密切的联

系统 2019-08-12 09:27:21 1948

各行各业

自动化测试(一):自动化测试理论

什么是自动化测试:自动化测试是把以人为驱动的测试行为转化为机器执行的一种过程。通常,在设计了测试用例并通过评审之后,由测试人员根据测试用例中描述的规程一步步执行测试,得到实际结果与期望结果的比较。在此过程中,为了节省人力、时间或硬件资源,提高测试效率,便引入了自动化测试的概念。自动化测试常见的误区:1.认为录制回放就是自动化测试(自动化测试的不同层次)2.只验证界面上的信息3.让测试相关的材料自由组织,应妥善管理测试相关的文档和输出4.过早或过多的自动化自

系统 2019-08-12 09:27:14 1948

各行各业

让程序只启动一次 -- Mutex

有时在开发程序的时候,有时需要只能同时运行一个实例.Mutex类,称为互拆体,是一个同步基元,它只向一个线程授予对共享资源的独占访问权。当两个或更多线程需要同时访问一个共享资源时,系统需要使用同步机制来确保一次只有一个线程使用该资源。如果一个线程获取了互斥体,则要获取该互斥体的第二个线程将被挂起,直到第一个线程释放该互斥体。下面演示Mutex类来保证应用程序只有唯一实例usingSystem;usingSystem.Collections.Generic;

系统 2019-08-12 09:26:51 1948

各行各业

resiprocate install and build

https://github.com/resiprocate/resiprocatehttp://www.resiprocate.org/Main_Pagehttp://www.resiprocate.org/Configuration_Optionshttp://www.resiprocate.org/AutotoolsBuildmkdirresiprocatecdresiprocatesudogitclonehttps://github.com/res

系统 2019-08-12 09:26:45 1948

各行各业

map/reduce多个field组合排序

年初领导让做一个检索热词的干预,也就是将统计用户搜索热词的结果,人工的指定其在排行榜中的位置。当然这任务比较恶心,咱只是个出来混饭碗的民工,不出格的事儿也可以忍了说技术。工作流程是收集用户的搜索日志,统计每个keyword在一天之中被搜索的次数,根据每个keyword的统计历史,使用数学方差得出它近期热度的评分,然后降序排序给出结果列表。(如果做的更细致可以在计算前加入语义分析的部分,这样能更好的分析出刚刚流行的网络用语,我没有做那么深,这里暂时不表)现在

系统 2019-08-12 09:27:35 1947

各行各业

我又对自己说,要好好写写我的文字了

我又对自己说,要好好写写我的文字了。已经因为烦恼,因为繁忙,忘记了太多,放弃了太多。就如人说的,为什么而活着呢窗外阳光灿烂,北风凛冽。我们为什么活着呢?为什么执意要想活得精彩呢。在经历了一些些人事和挫折,看到自己的反应的时候才知道自己的确不是那开局定运之辈,不过像童安格得歌一样,是个平凡人,想过平凡知足的人生吧如若没有负担,没有担子,会很轻拂,浮躁罢;也许,这些都是男人必须承担的。现在面对这样的压力,忽然觉得社会于自己很陌生,如此沉重的隔阂让我也滋生了许多

系统 2019-08-12 09:27:23 1947

各行各业

服务并未及时响应启动或控制请求

问题:2000AdvanceServer系统,IIS里默认站点显示“已停止”,点启动后过一会儿显示“服务并未及时响应启动或控制请求”,重启重装IIS也没有用,怎么解决啊?解决:进入管理工具>>服务>>启动WorldWideWebPublishingService服务。若启动不了,看看它的依存关系,启用它所依赖的服务。同时还要注意启动“EventLog”服务。虽然“WorldWideWebPublishingService”服务和SMTP服务的依存关系列表中

系统 2019-08-12 09:27:12 1947

各行各业

POJ 3807 Shuffle'm Up

解题思路:普通模拟题NULL#include#include#includeusingnamespacestd;intmain(){setshuf;chars1[101],s2[101];stringaim,str;inti,j,n,m,iter;boolIsFind;cin>>n;for(i=1;i<=n;i++){iter=IsFind=0;cin>>m>>s1>>s2>>aim;str.r

系统 2019-08-12 09:27:05 1947

各行各业

记住我一周免登陆实现

privatevoidaddCookie(HttpServletResponseresponse,Stringusername,Stringpassword){Cookiename=newCookie("userName",username);Cookiepwd=newCookie("password",password);//cookie存在7天name.setMaxAge(7*24*60*60);pwd.setMaxAge(7*24*60*60);re

系统 2019-08-12 09:26:39 1947

各行各业

protobuf安装

1在网站http://code.google.com/p/protobuf/downloads/list上可以下载Protobuf的源代码。然后解压编译安装便可以使用它了。安装步骤如下所示:也可在https://github.com/google/protobuf/releases/tag/v3.0.0-alpha-3上面下载这个,我是从上面的网站直接跳转过来的找到的提取protobuf-3.0.0-alpha-3cdprotobuf-3.0.0-alph

系统 2019-08-12 09:27:21 1946