搜索到与相关的文章
Hive

搜索研发部官方博客 » Blog Archive » 相似度计

搜索研发部官方博客»BlogArchive»相似度计算常用方法综述相似度计算常用方法综述(2012-7-0509:07:59)标签:主题相似度,向量空间模型,相似度计算分类:数据挖掘引言相似度计算用于衡量对象之间的相似程度,在数据挖掘、自然语言处理中是一个基础性计算。其中的关键技术主要是两个部分,对象的特征表示,特征集合之间的相似关系。在信息检索、网页判重、推荐系统等,都涉及到对象之间或者对象和对象集合的相似性的计算。而针对不同的应用场景,受限于数据规模、

系统 2019-08-12 01:32:55 3357

Java

java解惑之无穷大和NaN

1、i==i+1一个数字永远不会等于它自己加1?Java强制要求使用IEEE754浮点数算术运算[IEEE754],它可以让你用一个double或float来表示无穷大。正如我们在学校里面学到的,无穷大加1还是无穷大。你可以用任何被计算为无穷大的浮点算术表达式来初始化i,例如:doublei=1.0/0.0;不过,你最好是能够利用标准类库为你提供的常量:doublei=Double.POSITIVE_INFINITY;事实上,你不必将i初始化为无穷大以确保

系统 2019-08-29 22:51:27 3356

Linux

[图解]红旗Linux6.0下如何安装VMWARE TOOLS

经常在论坛里看到许多朋友(其实本人也是新手)不知道在Linux6.0下如何安装VMWARETOOLS的问题,所以特制作了下面的图解安装过程,我是以本机红旗Linux6.0下安装VMWARETOOLS的过程,希望能对在Linux6.0下如何安装VMWARETOOLS的问题抛砖引玉。1、首先安装好红旗Linux6.0,操作系统后,加载VMware_tools_linux镜像文件。2、点VMware上面的菜单虚拟机,再选择安装vmwaretools。3、按系统提

系统 2019-08-29 22:29:32 3356

C++

[C++]MySQL数据库操作实例

由于课程大实验需要使用c++操作MySQL数据库,经过一番研究终于成功实现VS2008中与MySQL的连接。环境设置:安装完MySQL之后,将安装目录中的MySQL5\lib\debug\目录下的libmysql.lib文件拷到VS2008安装目录中的VC\lib\下,然后在项目-选项-c/c++-常规中的附加包含目录以及链接器-常规中的附加库目录中加入“c:\MySQL\include\”,并且在链接器-输入中的附加依赖项内添加“libmysql.lib

系统 2019-08-12 09:30:27 3356

Windows

windows server 2008 R2 远程连接用户数修改

设置windowsserver2008R2远程连接用户数修改,三步搞定1.运行(win+R)中输入tsconfig.msc2.双击“限制每个用户只能进行一个会话”,取消这个选项负选框3.双击RDP-Tcp,设置“网络适配器”中的“最大连接”windowsserver2008R2远程连接用户数修改

系统 2019-08-12 01:33:35 3356

Hive

hive实战

1.安装hive2.hive实战3.hive存储模型4.深入hql查询语言5.参考资料及代码下载<1>.安装hive下载hive,下载地址http://mirror.bjtu.edu.cn/apache//hive/,解压该文件:xuqiang@ubuntu:~/hadoop/src/hive$tarzxvfhive-0.7.0-bin.tar.gz设置环境变量:xuqiang@ubuntu:~/hadoop/src/hive$cdhive-0.7.0-b

系统 2019-08-12 01:33:29 3356

编程技术

80386内存分页机制

80386开始支持存储器分页管理机制。分页机制是存储器管理机制的第3二部分。段管理机制实现虚拟地址(由段和偏移构成的逻辑地址)到线性地址的转换,分页管理机制实现线性地址到物理地址的转换。如果不启用分页管理机制,那么线性地址就是物理地址。本文将介绍80386的存储器分页管理机制和线性地址如何转换为物理地址。<一>存储器分页管理机制在保护模式下,控制寄存器CR0中的最高位PG位控制分页管理机制是否生效。如果PG=1,分页机制生效,把线性地址转换为物理地址。如果

系统 2019-08-29 23:23:30 3355

Linux

Linux命令行抓包及包解析工具tshark(wireshark)

在Linux下,当我们需要抓取网络数据包分析时,通常是使用tcpdump抓取网络raw数据包存到一个文件,然后下载到本地使用wireshark界面网络分析工具进行网络包分析。最近才发现,原来wireshark也提供有Linux命令行工具-tshark。tshark不仅有抓包的功能,还带了解析各种协议的能力。下面我们以两个实例来介绍tshark工具。1、安装方法CentOS:yuminstall-ywiresharkUbuntu:apt-getinstall

系统 2019-08-12 01:33:11 3355

PostgreSql

PostgreSQL: Documentation: 8.3: Populating a

PostgreSQL:Documentation:8.3:PopulatingaDatabase14.4.PopulatingaDatabaseOnemightneedtoinsertalargeamountofdatawhenfirstpopulatingadatabase.Thissectioncontainssomesuggestionsonhowtomakethisprocessasefficientaspossible.14.4.1.Disabl

系统 2019-08-12 01:33:02 3355