- 军军小站|张军博客
搜索到与相关的文章
Python

使用Python将文本按标点整句切分

利用分词工具包例如jieba可以轻易的将句子切分为不同的单词,但是当你有切分整句的需求时,该怎么解决呢?将段落按句号切分整句1.jieba分词可以切分单词进行中文自然语言处理时,分词是一个常见的操作,例如:importjieba.possegaspsegtxt="【#奔驰女车主不接受4S店道歉#双方现场交涉言语激烈】4月13日,西安维权奔驰女车主和4S店方见面,双方并未当场和解。4S店相关负责人称,由于出差等原因未及时联系车主,车主则反驳称,可通过电话联系

系统 2019-09-27 17:49:47 2981

各行各业

GitHub Flow

HowWeDoItSo,whatisGitHubFlow?AnythinginthemasterbranchisdeployableToworkonsomethingnew,createadescriptivelynamedbranchoffofmaster(ie:new-oauth2-scopes)Committothatbranchlocallyandregularlypushyourworktothesamenamedbranchontheserve

系统 2019-08-12 09:27:18 2981

Hadoop

Hadoop 集群 傻瓜式搭建手记

关于Hadoop的配置,按照我的理解,应该有六个文件需要修改,它们都在Hadoop的conf文件夹下,分别是:masters/slavers:配置masters和slavers的机器IPhadoop-env.sh:Hadoop运行时的环境变量,比如JAVA_HOME,LOG之类的core-site.xml:Hadoop的核心配置文件,对应并覆盖core-default.xml中的配置项hdfs-site.xml:HDFS的配置文件,对应并覆盖hdfs-de

系统 2019-08-29 23:51:04 2980

IOS

XCode iOS project only shows “My Mac 64-bit

转载自:http://stackoverflow.com/questions/8377970/xcode-ios-project-only-shows-my-mac-64-bit-but-not-simulator-or-device问:2downvotefavorite1share[fb]share[tw]ThisjuststartedhappeningthatmyiOSprojectisonlyshowing"MyMac64-bit"rathertha

系统 2019-08-12 09:30:29 2980

Hadoop

Hadoop 的 TotalOrderPartitioner

http://blog.oddfoo.net/2011/04/17/mapreduce-partition%E5%88%86%E6%9E%90-2/Partition所处的位置Partition位置Partition主要作用就是将map的结果发送到相应的reduce。这就对partition有两个要求:1)均衡负载,尽量的将工作均匀的分配给不同的reduce。2)效率,分配速度一定要快。Mapreduce提供的PartitionerMapreduce默认的

系统 2019-08-12 09:29:57 2980

ASP.NET

ASP.NET生成复合控件

适用于:MicrosoftASP.NET2.0VisualBasic2005VisualC#2005.NETFrameworksVisualWebDeveloper2005摘要:DinoEsposito一直在编写有关ASP.NET控件开发的系列教程,并在以下第四部分中介绍了如何使用和创建复合控件。随本文提供了VisualBasic和C#两种源代码。请从此处下载。简介复合控件只不过是普通的ASP.NET控件,还不属于要论及的另一种类型的ASP.NET服务器控

系统 2019-08-29 22:26:45 2979

Hadoop

Hadoop中shuffle阶段流程分析

宏观上,Hadoop每个作业要经历两个阶段:Mapphase和reducephase。对于Mapphase,又主要包含四个子阶段:从磁盘上读数据-》执行map函数-》combine结果-》将结果写到本地磁盘上;对于reducephase,同样包含四个子阶段:从各个maptask上读相应的数据(shuffle)-》sort-》执行reduce函数-》将结果写到HDFS中。Hadoop处理流程中的两个子阶段严重降低了其性能。第一个是map阶段产生的中间结果要写

系统 2019-08-12 09:30:30 2979

编程技术

JVM Perm方法存储区,后面有一点跑题

在一个jvm实例的内部,类型信息被存储在一个称为方法区的内存逻辑区中。类型信息是由类加载器在类加载时从类文件中提取出来的。类(静态)变量也存储在方法区中如果上面写的是对的,那么在我们静态变量用多了的情况下,就会出现java.lang.OutOfMemoryError:PermGenspace所以那个permSize一直不释放是合理的,因为static变量JVM一般情况下是不会去回收。我刚才看了一下我们状态的所有JAR包也只有一百二十几M,但是为什么我们设年

系统 2019-08-12 09:29:29 2979