在做datamining,很重要的一部是对数据进行清洗,由于数据量巨大,我是分段从数据库中取出数据存成文本格式,最后再将所有的文本合并成一个大的文件,在文件合并的过程中,我用了一个小工具,Txtunit.exe,短小精悍,合并完之后会有一些空白行的出现,我们需要将这些空白行清除掉,做法参见emeditor删除空行-HOHO网页设计-51CTO技术博客主要是使用了一个匹配的正则^[\t]*\n数据清洗小工具及技巧
系统 2019-08-29 23:22:43 2731
有时候我们说某个语言具有很强的动态性,有时候我们会区分动态和静态的不同技术与作法。我们朗朗上口动态绑定(dynamicbinding)、动态链接(dynamiclinking)、动态加载(dynamicloading)等。然而“动态”一词其实没有绝对而普遍适用的严格定义,有时候甚至像对象导向当初被导入编程领域一样,一人一把号,各吹各的调。一般而言,开发者社群说到动态语言,大致认同的一个定义是:“程序运行时,允许改变程序结构或变量类型,这种语言称为动态语言”
系统 2019-08-29 23:08:53 2731
在Perl和PHP中生成中文图片最关键的一点是需要设置一个可以显示中文的字体。在Linux平台上,我们可以把windows下的雅黑文件拷过去。在控制面板-字体里可以拷贝雅黑字体文件:放在Ubuntu的/usr/share/fonts/vista下。Perl的关键代码类似下面所示:GD::Image->trueColor(1);my$image=newFromPngGD::Image($imagepath)||die"cantopenimage:$!";my
系统 2019-08-29 22:56:48 2731
系统 2019-08-29 22:53:56 2731
LIKE确定给定的字符串是否与指定的模式匹配。模式可以包含常规字符和通配符字符。模式匹配过程中,常规字符必须与字符串中指定的字符完全匹配。然而,可使用字符串的任意片段匹配通配符。与使用=和!=字符串比较运算符相比,使用通配符可使LIKE运算符更加灵活。如果任何参数都不属于字符串数据类型,Microsoft®SQLServer™会将其转换成字符串数据类型(如果可能)。语法match_expression[NOT]LIKEpattern[ESCAPEescap
系统 2019-08-29 22:45:13 2731
在ASP.NET中值得注意的两个地方作者:ZDNETCHINA2002-07-2203:6PM
三个星期以前我发布了一篇文章,介绍了base64加密的PHP脚本的解码方法。前几天,飞信好友行者又扔来了一段更加复杂、诡异的PHP脚本:下载每一步的源代码//0.php
系统 2019-08-12 09:30:37 2731
HashMap是Hashtable的轻量级实现(非线程安全的实现),他们都完成了Map接口,主要区别在于HashMap允许空(null)键值(key),由于非线程安全,效率上可能高于Hashtable。HashMap允许将null作为一个entry的key或者value,而Hashtable不允许。HashMap把Hashtable的contains方法去掉了,改成containsvalue和containsKey。因为contains方法容易让人引起误解
系统 2019-08-12 09:30:20 2731
Android软件开发之TextView详解雨松MOMO原创文章如转载,请注明:转载自雨松MOMO的博客原文地址:http://blog.csdn.net/xys289187120/article/details/6625662TextView的API中文文档中说明它的结构结构java.lang.Objectandroid.view.Viewandroid.widget.TextView直接子类:Button,CheckedTextView,Chronom
系统 2019-08-12 09:29:59 2731
SqlServer索引使用情况及优化的相关Sql语句,非常好的SQL语句,记录于此:--BeginIndex(索引)分析优化的相关Sql--返回当前数据库所有碎片率大于25%的索引--运行本语句会扫描很多数据页面--避免在系统负载比较高时运行--避免在系统负载比较高时运行declare@dbidintselect@dbid=db_id()SELECTo.nameastablename,s.*FROMsys.dm_db_index_physical_stat
系统 2019-08-12 01:55:42 2731