近来经常和心理系做实验,总是有各种“什么什么随机化,刺激的物理性质保持一样。。”的需求。之前做《去掩蔽》的实验时,有一套图片就是做的像素随机化,这是最简单的随机化了。当时图像只有两种像素,灰的和深灰的,而且深灰的比较少。于是我就统计了深灰像素点的个数,然后在一张同样大的灰色图片中的随机位置洒深灰像素点。intpix_count=0;for(inti=0;i
系统 2019-08-12 01:32:23 2554
利用统计进行中文分词与词性分析-IveelyLiu-博客园利用统计进行中文分词与词性分析今天,翻出了我以前在本科阶段写的一些论文,虽然有几篇没有发表。突然发现很多还是比较实用,虽然学术价值并不是很大,于是我重新整理了下,用最简单的方式,摘要了部分出来拼成此文,当然拼的原料都是自己的,本文适合初学者,如若转载,请著名版权。中文分词已经是老调重弹的话题了,传统的基于词库的分词技术应该是目前最基本的分词技术,在这里我不去深入挖掘,什么好什么不好的问题,今天我只想
系统 2019-08-12 01:31:59 2554
Subclipse1.8.20发布了,完整的改进内容请看:http://subclipse.tigris.org/subclipse_1.8.x/changes.htmlSubclipse是一个为EclipseIDE添加Subversion支持的项目。支持几乎所有版本的Eclipse。Eclipse的更新地址是:http://subclipse.tigris.org/update_1.6.xhttp://subclipse.tigris.org/updat
系统 2019-08-12 01:31:44 2554
从url中找到域名,首先想到的是用正则,然后寻找相应的类库。用正则解析有很多不完备的地方,url中有域名,域名后缀一直在不断增加等。通过google查到几种方法,一种是用Python中自带的模块和正则相结合来解析域名,另一种是使第三方用写好的解析模块直接解析出域名。要解析的url复制代码代码如下:urls=["http://meiwen.me/src/index.html","http://1000chi.com/game/index.html","htt
系统 2019-09-27 17:56:17 2553
标志位说明re.I字母不区分大小写re.S使.匹配包括换行re.X忽略空格和#后面的注释re.M多行匹配,影响^和$re.UUnicode解码,影响\w,\W,\b,\B,\d,\D,\s,\Sre.L本地化识别匹配,影响\w,\W,\b,\B,\d,\D,\s,\S模式说明^匹配字符串的开头$匹配字符串的末尾。.匹配任意一个字符,不包括换行符l或*匹配0个以上+匹配1个以上?匹配最少字符(非贪婪模式)模式说明[]匹配组内字符,[abc]匹配a,b,c[^
系统 2019-09-27 17:56:14 2553
scipy的signal模块经常用于信号处理,卷积、傅里叶变换、各种滤波、差值算法等。*两个一维信号卷积>>>importnumpyasnp>>>x=np.array([1,2,3])>>>h=np.array([4,5,6])>>>importscipy.signal>>>scipy.signal.convolve(x,h)#卷积运算array([4,13,28,27,18])卷积运算大致可以分成3步,首先先翻转,让两个信号列反过来,如上面就是1,2,3
系统 2019-09-27 17:55:19 2553
最近几天了解了一下人脸识别,应用场景可以是图片标注,商品图和广告图中有没有模特,有几个模特,模特的性别,年龄,颜值,表情等数据的挖掘。基础的识别用dlib来实现,dlib是一个机器学习的包,主要用C++写的,但是也有Python版本。其中最流行的一个功能是FacialLandmarkDetection,配备已经训练好的轮廓预测模型,叫shape_predictor_68_face_landmarks.dat,从名字就可以看出,它可以检测出面部的68个关键点
系统 2019-09-27 17:52:05 2553
这是书籍《PandasCookbook》书籍第05章的代码复现,所有代码运行在JupyterNotebook上,原讲解地址是:https://www.jianshu.com/p/d67080f59b06我上传代码的github地址是:https://github.com/Asunqingwen/PandasCookbook.gitgithub上有该书中用到的data,里面代码会不定期更新(因为工作原因,时间不定),直到本书学习完成!相比原讲解,会穿插一些自
系统 2019-09-27 17:52:02 2553
Python安装下载最新版本安装程序点这里进入官方下载页面然后选择对应的Mac/Windows...installer下载后直接安装,Windows用户注意勾选【AddPython..topath】打开命令行工具(Windows的命令提示符工具,MacOS的终端,下同)。尝试执行python3-V命令和pip3-V命令检查是否安装成功。安装TensorflowWindows右键命令行工具,以管理员身份运行,执行以下代码:pip3install-ihttp:
系统 2019-09-27 17:48:31 2553
个人理解这里的规范化处理指对提取后的特征集进行处理,不是对原始的数据信号进行处理,包括归一化和标准化。规范化的原因:不同特征具有不同量级时会导致:a.数量级的差异将导致量级较大的特征占据主导地位;b.数量级的差异将导致迭代收敛速度减慢;c.依赖于样本距离的算法对于数据的数量级非常敏感。归一化:,也就是原数据减去该特征列最小值,再除以该特征列的极差,将属性缩放到[0,1]之间。标准化:,也就是原数据减去该特征列的均值,再除以该特征列的标准差。注意:1.所谓规
系统 2019-09-27 17:48:10 2553