搜索到与相关的文章
各行各业

自己实现文本相似度算法(余弦定理) - 呼吸的J

自己实现文本相似度算法(余弦定理)-呼吸的Java-开源中国社区自己实现文本相似度算法(余弦定理)52人收藏此文章,我要收藏发表于9个月前(2012-03-0416:59),已有5592次阅读,共6个评论最近由于工作项目,需要判断两个txt文本是否相似,于是开始在网上找资料研究,因为在程序中会把文本转换成String再做比较,所以最开始找到了这篇关于距离编辑算法Blog写的非常好,受益匪浅。于是我决定把它用到项目中,来判断两个文本的相似度。但后来实际操作发

系统 2019-08-12 01:32:18 2855

Python

基于python分析你的上网行为 看看你平时上网都在干嘛

简介想看看你最近一年都在干嘛?看看你平时上网是在摸鱼还是认真工作?想写年度汇报总结,但是苦于没有数据?现在,它来了。这是一个能让你了解自己的浏览历史的Chrome浏览历史记录分析程序,当然了,他仅适用于Chrome浏览器或者以Chrome为内核的浏览器。在该页面中你将可以查看有关自己在过去的时间里所访问浏览的域名、URL以及忙碌天数的前十排名以及相关的数据图表。部分截图代码思路1.目录结构首先,我们先看一下整体目录结构Code├─app_callback.

系统 2019-09-27 17:57:54 2854

编程技术

Flex Builder教程

www.diy567.com累了,去上面休息一下下,QQ空间,美文,非主流,网络日记,搞笑短信,祝福短信,热门短信,有意思啊一,概述二,使用MXML组件构建用户界面三,数据绑定四,界面布局和导航五,使用CSS格式化组件六,使用特效丰富用户体验七,使用ActionScript处理事件六,数据服务器访问概述七,HTTPService八,WebService九,FlexDataServices十,其它RemoteObject技术十一,创建自定义组件参见一,概述F

系统 2019-08-29 22:52:22 2854

各行各业

Ralph Kimball

RalphKimball是数据仓库和商务智能领域的权威专家。作为一名最早的数据仓库架构师,他长期以来一直坚信数据仓库的设计必须遵循易于理解和快速反应的准则。他创立的维度建模方法论(或Kimball方法论)已经成为决策支持领域的金科玉律。相较于数据仓库的其他领先架构(BillInmon的架构),Kimball的方法被归类为自底向上的方法。RalphKimball博士自1982年以来一直是数据仓库行业最主要的开拓者,并且是目前最知名的演讲人、咨询师与培训员之一

系统 2019-08-12 09:27:29 2854

数据库相关

由limits.h看整型范围

欢迎访问我的新博客:http://www.milkcu.com/blog/原文地址:http://www.milkcu.com/blog/archives/1367305920.html前言声明一个变量,经常要考虑的问题是这个类型的变量能不能装的下。今天MilkCu就总结下吧,以解除后顾之忧。关于变量取值范围的问题,在Kernighan的《C程序设计语言》第28页练习2-1就提到过。编写一个程序以确定分别由signed及unsigned限定的char、sh

系统 2019-08-12 01:54:34 2854

数据库相关

不同库表间(含字段)比较的SQL代码

不同库表间(含字段)比较的SQL代码useaccdb1--为zy旧库,Accdb为液晶版标准库,已知Accdb库比Accdb1库多出表和字段,求多出的表和字段SELECTaccdb.table_nameASaccdb_table_name,accdb.columns_nameASaccdb_columns_name,accdb1.table_nameASaccdb1_table_name,accdb1.columns_nameASaccdb1_column

系统 2019-08-12 01:54:07 2854

Linux

linux下 Oracle自动启动与停止

1、修改Oracle系统配置文件,把N改成Y:sudovi/etc/orataborcl:/oracle/oracle_home:Yblogs:/oracle/oracle_home:Y说明:/etc/oratab格式为:SID:ORACLE_HOME:AUTO把N设置为Y(大写),只有这样,oracle自带的dbstart和dbshut才能够发挥作用。2、以root登录编写服务脚本:如下#!/bin/bash##chkconfig:35951#descr

系统 2019-08-12 01:51:32 2854

操作系统

薄积薄发的国内BlogNetwork

1:王冉的《博客逼着我们薄积薄发》(http://blog.sina.com.cn/u/47665bc1010005op):1.99%的作者在99%的时候写出来的东西都是薄积薄发的产物。。。我们不要对博客的内容有太多的奢望。2.剩下的事就交给几率。毕竟有1%的作者在1%的时候能写出好东西,因此当您有一万篇上传量的时候,自然会出现偶尔的惊喜。。。3.虽然99%的作者在99%的时候都在那里薄积薄发,但是99%的读者在99%的时候都能分清哪一篇文字是“厚着”出来

系统 2019-08-12 01:32:21 2854

各行各业

Opencv学习笔记(六)SURF学习笔记

原创文章,转载请注明出处:http://blog.csdn.net/crzy_sparrow/article/details/7392345本人挺菜的,肯定有非常多错误纰漏之处,希望大家不吝指正。看了harris角点检測之后,開始研究SURF角点检測,发现挺复杂的,一时也仅仅了解了大概,把了解的东西总结下,以便下次深入学习。SURF角点检測算法是对SIFT的一种改进,主要体如今速度上,效率更高。它和SIFT的主要差别是图像多尺度空间的构建方法不同。在计算视

系统 2019-08-12 01:31:57 2854

Python

Python定时任务随机时间执行的实现方法

背景:有一个爬虫服务,需要定时从公开网站上拉取一些数据,为了避免被识别为爬虫(防爬虫的识别需要根据很多特征,时间仅仅是其中一个维度),需要在指定的时间内,随机生成一个时间爬取脚本是python写的,直接上代码...importloggingimporttracebackfromdatetimeimportdatetimefromapscheduler.schedulers.backgroundimportBackgroundSchedulerschedul

系统 2019-09-27 17:57:09 2853