这是最近找机器学习实习的一个笔试题:看到这个题的时候第一想法就是用关联规则(Apriori算法)来实现。关联规则最重要的就是支持度Support和置信度Confidence。支持度的计算方法:#下面式中X∩Y表示X和Y同时发生的次数,N表示总事物数support(X->Y)=X∩Y/N置信度的计算方法:confidence(X->Y)=support(X->Y)/support(X)知道支持度和置信度的计算方法之后就可以实现上面算法了,首先本题给的数据集比
系统 2019-09-27 17:56:04 1755
本文实例为大家分享了python实现复制大量文件的具体代码,供大家参考,具体内容如下本来是去项目公司拷数据,结果去了发现有500G,靠系统的复制功能怕是得好几个小时,于是回来学一手操作,话不多说上代码:说明:CopyFiles1是可以将sourceDir连子目录一起原样复制到targetDir,而CopyFiles2是在sourceDir中筛选特定格式文件,然后将其直接放在targetDir中,会很乱,但是很快importosimporttimeimpor
系统 2019-09-27 17:55:43 1755
PIL(PythonImageLibrary)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了。其官方主页为:PIL。PIL历史悠久,原来是只支持python2.x的版本的,后来出现了移植到python3的库pillow,pillow号称是friendlyforkforPIL,其功能和PIL差不多,但是支持python3。PIL(PythonImagingLibrary)是Python一个
系统 2019-09-27 17:54:43 1755
写在最前程序是为人类服务的,最近正好身边小伙伴们在做球衣生意,当然是去nikenba专区购买了,可是有些热门球衣发布几分钟就被抢完,有些折扣球衣也是很快就被抢售一空,那么我们只能靠自己的眼睛一直盯着网站吗?NoNoNo,作为计算机专业的学生,怎么能为这种事情浪费时间呢?那肯定想法就是写爬虫自动比对价格啊,后来又在想,爬虫数据也是在PC端啊,该怎么实时提醒我们呢?再弄一个微信机器人发送数据不就可以了吗?说干就干,代码开撸先看下效果:准备工作:首先本文使用py
系统 2019-09-27 17:53:30 1755
一引子从封装本身的意思去理解,封装就好像是拿来一个麻袋,把青菜,土豆,花菜,还有苹果一起装进麻袋,然后把麻袋封上口子。照这种逻辑看,封装=‘隐藏’,这种理解是相当片面的。在面向对象中这个麻袋就是你的类或者对象,类或者对象这俩麻袋内部装了数据属性和函数属性,那么对于类和对象来说"封"的概念从何而来,其实封的概念代表隐藏。在学完了面向对象的类和对象相关的知识后,大家都知道了如何把属性装进类或者对象中,那么如何完成封的效果呢?第一个层面的封装:类就是麻袋,这本身
系统 2019-09-27 17:52:56 1755
背景介绍从学sklearn时,除了算法的坎要过,还得学习matplotlib可视化,对我的实践应用而言,可视化更重要一些,然而matplotlib的易用性和美观性确实不敢恭维。陆续使用过plotly、seaborn,最终定格在了Bokeh,因为它可以与Flask完美的结合,数据看板的开发难度降低了很多。前阵子看到这个库可以较为便捷的实现数据探索,今天得空打算学习一下。原本访问的是英文文档,结果发现已经有人在做汉化,虽然看起来也像是谷歌翻译的,本着拿来主义,
系统 2019-09-27 17:52:35 1755
python_opencv这个库功能还是非常强大的,可以读取本地摄像头的内容,并且可以直接使用不同分类器对人脸进行识别。这里主要展示使用opencv实现对笔记本摄像头中的人脸实时识别和标注。主要是笔记本摄像头实时获取画面,然后获取其中人脸的位置,并在人脸位置的正方形进行标注。代码主要如下:#导入cv模块importcv2cap=cv2.VideoCapture(0)#告诉OpenCV使用人脸识别分类器#分类器下载地址https://github.com/o
系统 2019-09-27 17:52:34 1755
缘由日常工作中经常遇到类似的问题:把某个服务器上的某些指定的表同步到另外一台服务器。类似需求用SSIS或者其他ETL工作很容易实现,比如用SSIS的话,就会会存在相当一部分反复的手工操作。建源的数据库信息,目标的数据库信息,如果是多个表,需要一个一个地拉source和target,然后一个一个地mapping,然后运行实现数据同步。然后很可能,这个workflow使用也就这么一次,就寿终正寝了,却一样要浪费时间去做这个ETL。快速数据同步实现于是在想,可不
系统 2019-09-27 17:52:07 1755
目录一、什么是协程二、为什么要有协程三、协程的优缺点四、如何实现协程五、Gevent模块5.1模块的安装5.2用法介绍5.3代码实例六、gevent之应用一、什么是协程协程:就是单线程下实现并发协程概念本质是程序员抽象出来的,是人为的控制通过程序的IO去进行切换任务的执行并发:任务切换+保存状态二、为什么要有协程自己控制切换要比操作系统切换快的多.降低了单个线程的io堵塞时间,也就是实现了单线程下效率最高.三、协程的优缺点优点:自己控制切换要比操作系统切换
系统 2019-09-27 17:49:35 1755
numpy.ptp()是计算最大值与最小值差的函数,用法如下:importnumpyasnpa=np.array([np.random.randint(0,20,5),np.random.randint(0,20,5)])print('原始数据\n'a)print('对所有数据计算\n',a.ptp())print('axis=0,按行方向计算,即每列\n',a.ptp(axis=0))#按行方向计算,即每列print('axis=1,按列方向计算,即每行
系统 2019-09-27 17:48:43 1755