搜索到与相关的文章
Hadoop

Hadoop 编写WordCount

本文发表于本人博客。前面几次讲了关于Hadoop的环境搭建、HDFS操作,今天接着继续。本来Hadoop源码中就有一个例子WordCount,但是今天我们来自己实现一个加深对这个Mapper、Reducer的理解,如有不对欢迎指正。我们先来梳理一下思路,对于自定义Mapper以及Reducer,我们先要覆盖其map以及reduce函数,然后按照相关步骤比如设置输入文件目录、输入文件格式化类、设置自定义Mapper、分区、排序、分组、规约、设置自定义Redu

系统 2019-08-12 09:27:04 3112

Linux

Linux下Tomcat的安装配置

Tomcat的安装及配置一.Jdk的安装及配置1.通过ftp将jdk传到linux中2.安装步骤—cd/home/guest#回到/home/guest目录下—cpjdk-1_5_0_06-linux-i586.bin/usr/jlocal#复制将jdk复制到/usr/local目录下—chmod+xjdk-1_5_0_06-linux-i586.bin#赋予jdk可执行的权限—./jdk-1_5_0_06-linux-i586.bin#执行安装3.安装成

系统 2019-08-12 01:33:17 3112

Python

python实现字符串完美拆分split()的方法

函数:split()例子我们想要将以下字符串rule进行拆分。字符串表示的是一个规则,由“…”得到“…”。我们需要将规则中的条件属性与取值分别提取出来,存放在条件属性列表cf_list与值列表cv_list中,规则的结论的属性与取值也提取出来,分别存放结果属性列表rf_list与值列表rc_list。rule='{age=Middle-aged,sex=Male,education=Bachelors}=>{native-country=United-St

系统 2019-09-27 17:50:50 3111

数据库相关

构建访问AWS的本地命令行环境

并不是所有的EC2的功能,都可以通过基于web的AWSManagementConsole来操作,所以在本地配置一个访问EC2的命令行环境还是很重要的,特别是需要直接在EC2上去构筑服务器环境的时候。AWS一共有三种访问证书,用于不同的目的,命令行环境下需要用到其中两种:Accesskeys:用于基于REST和Query协议的请求X.509certificates:用于基于SOAP协议请求Keypairs:访问EC2实例和保护CloudFront中的内容。搭

系统 2019-08-12 01:33:22 3111

编程技术

git 使用详解

考虑到CVS的一些局限性,最近和同事在公司推行Git。其实,如果推行SVN的化,可能推行的难度会降低很多。不过lark说既然推行一个新的版本管理工具,总要花费一定的时间进行培训、部署、转换。而推行Git和SVN的代价不如想象中差距那么大。因此,不如就多花些精力推行Git,可以带来更多的好处。这个想法说服了我。然后就开始筹备了。我发现网上很多git教程对一些基础命令(比如git-reset)的介绍还是不够清楚。另外,介绍git1.5的少,介绍git1.4的多

系统 2019-08-29 22:36:48 3110

操作系统

centos 5 yum安装与配置vsFTPd FTP服务器

转自:http://www.centos.bz/2011/03/centos-install-vsftpd-ftp-server/vsftpd作为FTP服务器,在Linux系统中是非常常用的。下面我们介绍如何在centos系统上安装vsftp。什么是vsftpdvsftpd是一款在Linux发行版中最受推崇的FTP服务器程序。特点是小巧轻快,安全易用。vsftpd的名字代表”verysecureFTPdaemon”,安全是它的开发者ChrisEvans考虑

系统 2019-08-12 01:33:20 3110

各行各业

Joomla和Drupal的比较

这两个CMS是国外CMS软件中最流行的.很多人都在中间作选择,我发文来比较一下.流行程度看来2005年以来joomla就飞速发展远远超过drupal的流行程度了.谷歌趋势查询结果光看这个肯定不够,看看技术比较吧:界面美观Joomla的界面比Drupal更好看,尤其对站长来说,后台的界面也比较舒服。Drupal的一般较难看一些.也许因为更多的是程序员参与吧,可能美工底子差些?呵呵.后台系统Joomla后台操作比较繁琐,不适合新手.光设置都要费很长时间,再加上

系统 2019-08-12 01:32:43 3110

Ubuntu

ubuntu10.10不再提供支持后的source.list更新

将/etc/apt/source.list中内容用下列代码覆盖。##Majorbugfixupdatesproducedafterthefinalreleaseofthe##distribution.debhttp://old-releases.ubuntu.com/ubuntu/maverickmainrestricteddeb-srchttp://old-releases.ubuntu.com/ubuntu/maverickmainrestricted

系统 2019-08-12 01:32:04 3110

各行各业

CORBA的基本内容(下)

CORBA的基本内容(下)(本文转载自软件工程专家网www.21cmm.com)苏洋接口仓库CORBA引入接口仓库(InterfaceRepository)的目的在于使服务对象能够提供持久的对象服务。将接口信息存入接口仓库后,如果客户端应用提交动态调用请求(DynamicInvocation),ORB可以根据接口仓库中的接口信息及分布环境下数据对象的描述,获取请求调用所需的信息。接口仓库作为CORBA系统的组成部分,管理和提供到OMGIDL映射接口定义的访

系统 2019-08-12 01:31:51 3110

编程技术

使用Visual FoxPro 8.0的成员类和Excel实现自定

作者:张洪举(http://www.vfptop.com)日期:2003年12月应用于:Microsoft®VisualFoxPro®8.0摘要:使用VisualFoxPro8.0的新增Header类来选择表格列,实现自定义字段打印。概述许多VisualFoxPro程序员希望将显示在表格控件中的数据能够直接输出到打印机上,并且也希望能够自定义输出列来选择要打印的字段,这在VisualFoxPro8.0以前还是比较烦琐的事情。从VisualFoxPro8.0

系统 2019-08-29 23:17:53 3109