Apriori代码importpandasaspd#自定义连接函数,用于实现L_{k-1}到C_k的连接defconnect_string(x,ms):"""x:频繁项集列表ms:连接符,这里用‘---’return:返回长度+1的频繁项集,即L_{k-1}到C_k的连接"""x=list(map(lambdai:sorted(i.split(ms)),x))#去除序列中的连接符,并将元素排列n=len(x[0])#每个频繁项集的长度为nr=[]forii
系统 2019-09-27 17:57:03 2226
这里分享DataFrame的列标准化以及对DataFrame分组之后列标准化。DataFrame的列标准化importpandasaspdimportnumpyasnpdf=pd.DataFrame(data={'A':[1,1,2,2,2],'B':[2,3,4,6,5],'C':[3,8,5,12,6]})dfdf.apply(lambdax:(x-np.min(x))/(np.max(x)-np.min(x)))3.DataFrame分组之后列标准化
系统 2019-09-27 17:56:06 2226
环境:Mac10.14.3,python3.6使用pipinstall,安装步骤如下:(1)pipinstallsix(2)pipinstallbit_array(3)pipinstallthriftpy(4)pipinstallthrift_sasl==0.2.1(5)pipinstallimpyla其中,在安装第四步的时候报错如下:warning:includepathforstdlibc++headersnotfound;pass‘-stdlib=l
系统 2019-09-27 17:54:55 2226
python基础语法这个是我初学Python写的博客第一次写博客为了让自己记忆深刻一些。目的很单纯:我是为了学习人工智能才来学习python的python就是一种面向对象的一种语言(高级语言)python一切皆对象注释:python的注释分为两种单行注释#多行注释可以用多个"""注释内容"""号,还有'''注释内容"'行与缩进:这个是python与其他语言不一样的地方,python是通过缩进是否一致来判断是不是同一代码块(一般缩进都是占四个空格)例如:标识
系统 2019-09-27 17:54:11 2226
以下代码对于元组,字典和列表都是可以用的A=[1,2,3]print(A)#输出整个列表,包括逗号和括号等A=[1,2,3]forainA:print(a)#输出所有元素A=[1,2,3]N=0whileN列表的排序https://blog.csdn.net/GrofChen/article/details/91466264列表的所有内置函数https://blog.csdn.net/GrofChen/article/details/91371937
系统 2019-09-27 17:53:29 2226
在Python中我们主要是通过thread和threading这两个模块来实现的,其中Python的threading模块是对thread做了一些包装的,可以更加方便的被使用,所以我们使用threading模块实现多线程编程。一般来说,使用线程有两种模式,一种是创建线程要执行的函数,把这个函数传递进Thread对象里,让它来执行;另一种是直接从Thread继承,创建一个新的class,把线程执行的代码放到这个新的class里。将函数传递进Thread对象复
系统 2019-09-27 17:50:58 2226
ljust()方法返回字符串左对齐的字符串长度宽度。填充是通过使用指定的fillchar(默认为空格)。如果宽度小于len(s)返回原始字符串。语法以下是ljust()方法的语法:str.ljust(width[,fillchar])参数width--这是填充后字符串的总长度。fillchar--这是填充符,默认为空格。返回值此方法返回字符串左对齐的字符串的长度宽度。填充是通过使用指定fillchar(默认为空格)。如果宽度小于len(s),返回原始字符串
系统 2019-09-27 17:47:12 2226
京东图书评论有非常丰富的信息,这里面就包含了购买日期、书名、作者、好评、中评、差评等等。以购买日期为例,使用Python+Mysql的搭配进行实现,程序不大,才100行。相关的解释我都在程序里加注了:fromseleniumimportwebdriverfrombs4importBeautifulSoupimportreimportwin32com.clientimportthreading,timeimportMySQLdbdefmydebug():dr
系统 2019-09-27 17:45:44 2226
前言最近需要使用https搭建一个api故简单记录一下搭建过程搭建http的服务简单快捷,这里就不做其他介绍有关https的原理请参考图解HTTPS环境搭建(非必须)这个环境其实不是必须的,我再搭建的时候,并没有安装这个环境,因为我的linux服务器自带的有了,可能是在安装其他软件的时候再带安装上去了,所以可以自我检测一下。一、安装OpenSSLOpenSSL介绍OpenSSL是一个强大的安全套接字层密码库,囊括主要的密码算法、常用的密钥和证书封装管理功能
系统 2019-09-27 17:57:00 2225
今天给大家分享的是Jupyter安装和基本使用教程,同时在我安装的过程中遇到了一些问题,解决方法,一并和大家分享一、Jupyter介绍JupyterNotebook的本质是一个Web应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。优点:好用,很好用。JupyterNotebook也是一个算法工程师友好的工具,但仍有许多拓展的空间,比如:当你的文件中包含大量
系统 2019-09-27 17:55:56 2225
题目描述某人有8角的邮票5张,1元的邮票4张,1元8角的邮票6张,用这些邮票中的一张或若干张可以得到多少中不同的邮资?输入描述:无输出描述:输出一行,表示题目所求。本人解答:a=[8,10,18]b=[5,4,6]all=[]foriinrange(b[0]+1):forjinrange(b[1]+1):forzinrange(b[2]+1):all.append(a[0]*i+a[1]*j+a[2]*z)all_=[]forxinall:ifxnotin
系统 2019-09-27 17:55:30 2225
Python中有两种循环,分别为:for循环和while循环。1.for循环for循环可以用来遍历某一对象(遍历:通俗点说,就是把这个循环中的第一个元素到最后一个元素依次访问一次)。for循环的基本结构如下:具体看这个案例:设计一个函数,在桌面创建10个文本,用数字从1-10依次给它们命名。deftext_create():path='/Users/duwangdan/Desktop/'fortext_nameinrange(1,11):#1-10的范围需
系统 2019-09-27 17:55:05 2225
实现代码如下:说明:现在代码已实现du命令的-s统计功能,统计与系统du命令稍有差别,比如用ls-ld/root结果为4096,而du计算出来是1040,用当前python计算出来也是4096。另外暂时还没有实现类似于自动根据大小显示为人性化的单位,后续补上#!/usr/bin/python#*-*coding:utf8*-*importsysimportosfromoptparseimportOptionParser#使用选项帮助信息可以使用中文relo
系统 2019-09-27 17:54:38 2225
python简单数据类型python中变量不需要声明,但是使用前必须赋值,赋值之后才会创建该变量。我们所说的变量的类型其实是内存中值的类型包括最基本的6种字符串,数字,元组,列表,字典,集合其中字符串,数字,元组是不可变数据类型;列表,字典,集合是可变数据类型就是改变值内存地址有没有发生变化,变化就是不可变,不变就是可以变字符串字符串的创建有两种方式:1.用'同一行的值'引起来2.用”同一行的值“引起来还可以用'''不同行的值"'或者”“”不同行的值“”“
系统 2019-09-27 17:52:34 2225
不扯没用的,直接上代码1、环境:windows(Linux下应该也没问题)2、python版本:3.63、所需依赖:PyMuPDF(pipinstallpymupdf)以下是代码#-*-coding:utf-8-*-"""1、安装库pipinstallpymupdf2、直接运行"""importfitz#打开PDF文件,生成一个对象doc=fitz.open('1.pdf')forpginrange(doc.pageCount):page=doc[pg]r
系统 2019-09-27 17:49:25 2225