python3中print函数中的参数end默认值为’\n’,表示换行,改变end的赋值,就不会换行了,例如打印个99乘法表:foriinrange(1,10):print()forjinrange(1,i+1):print("%d*%d=%d,"%(i,j,i*j),end='')1*1=1,2*1=2,2*2=4,3*1=3,3*2=6,3*3=9,4*1=4,4*2=8,4*3=12,4*4=16,5*1=5,5*2=10,5*3=15,5*4=20
系统 2019-09-27 17:08:20 2429
#导入扩展库importre#正则表达式库importcollections#词频统计库importnumpyasnp#numpy数据处理库importjieba#结巴分词importwordcloud#词云展示库fromPILimportImage#图像处理库importmatplotlib.pyplotasplt#图像展示库#读取文件fn=open('c.csv')#打开文件string_data=fn.read()#读出整个文件fn.close()#
系统 2019-09-27 17:52:07 2428
上一篇我们讲了关联分析的几个概念,支持度,置信度,提升度。以及如何利用Apriori算法高效地根据物品的支持度找出所有物品的频繁项集。Python--深入浅出Apriori关联分析算法(一)这次呢,我们会在上次的基础上,讲讲如何分析物品的关联规则得出关联结果,以及给出用apyori这个库运行得出关联结果的代码。一.基础知识上次我们介绍了几个关联分析的概念,支持度,置信度,提升度。这次我们重点回顾一下置信度和提升度:置信度(Confidence):置信度是指
系统 2019-09-27 17:50:15 2428
一.破解参数加密有道翻译的请求是post,携带一系列参数,直接F12刷新进行调试,如下图所示:这是一个post请求,目标网址是'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'接下来让我们看看发送该请求需要携带哪些参数如图所示,红色方框里的就是需要携带的参数了。最后看一看返回的数据显而易见,返回的数据是json格式的数据。好了,现在我们可以写程序进行爬取了#-*-c
系统 2019-09-27 17:49:48 2428
python学习记录1——常用命令总结with关键字Python中的关键字with详解浅谈Python的with语句structPython使用struct处理二进制(pack和unpack用法)lambda表达式python–lambda表达式@装饰器特点:1参数是一个函数;2返回值是一个函数python装饰器Python函数装饰器装饰器-廖雪峰的官方网站defaultdict方法python中defaultdict方法的使用对dict进行排序pytho
系统 2019-09-27 17:56:11 2427
这里分享DataFrame的列标准化以及对DataFrame分组之后列标准化。DataFrame的列标准化importpandasaspdimportnumpyasnpdf=pd.DataFrame(data={'A':[1,1,2,2,2],'B':[2,3,4,6,5],'C':[3,8,5,12,6]})dfdf.apply(lambdax:(x-np.min(x))/(np.max(x)-np.min(x)))3.DataFrame分组之后列标准化
系统 2019-09-27 17:56:06 2427
我们已经在Python运算中看到Python最基本的数学运算功能。此外,math包补充了更多的函数。当然,如果想要更加高级的数学功能,可以考虑选择标准库之外的numpy和scipy项目,它们不但支持数组和矩阵运算,还有丰富的数学和物理方程可供使用。此外,random包可以用来生成随机数。随机数不仅可以用于数学用途,还经常被嵌入到算法中,用以提高算法效率,并提高程序的安全性。math包math包主要处理数学相关的运算。math包定义了两个常数:复制代码代码如
系统 2019-09-27 17:38:01 2427
我的Python学习之路(一)跟着廖雪峰的Python教程学习Task1:输入和输出Task2:打印变量Task3:格式化输出Task4:按要求打印tuple元素Task5:if分支练习Task6:循环练习Task7:调用函数Task8:定义函数Task9:可变参数Task10:递归函数实现Task11:切片练习Task12:迭代练习Task13:列表生成式练习Task14:生成器练习Task15:map/reduceTask16:Filter练习Task
系统 2019-09-27 17:57:00 2426
课程作业要求,遂学习了python的自动化selenium工具,并爬取京东商品评论数据练练手。目录:一、环境二、第三方库三、分析1.1chrome驱动1.2定位评论元素1.3循环爬取评论数据并保存为CVS文件导出其中xpath对应网页元素评论:用户名:四、代码五、结果一、环境我使用的是windows+python3.6+pycharm,大家自己去下载对应的环境。二、第三方库fromseleniumimportwebdriverfromtimeimports
系统 2019-09-27 17:55:01 2426
摘要:有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。应用场景:我有10W行数据,每一行都11列的属性。现在,我们只需要随机抽取其中的2W行。实现方法很简单:利用Pandas库中的sample。DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)n是要抽取
系统 2019-09-27 17:54:34 2426
Python的装饰器的英文名叫Decorator,当你看到这个英文名的时候,你可能会把其跟DesignPattern里的Decorator搞混了,其实这是完全不同的两个东西。虽然好像,他们要干的事都很相似――都是想要对一个已有的模块做一些“修饰工作”,所谓修饰工作就是想给现有的模块加上一些小装饰(一些小功能,这些小功能可能好多模块都会用到),但又不让这个小装饰(小功能)侵入到原有的模块中的代码里去。但是OO的Decorator简直就是一场恶梦,不信你就去看
系统 2019-09-27 17:52:03 2426
实现一个简单的发号器根据snowflake算法的原理实现一个简单的发号器,产生不重复、自增的id。1.snowflake算法的简单描述这里的snowflake算法是用二进制的,有64位。其中41位的时间戳表示:当前时间戳减去某个设定的起始时间,10位标识表示:不同的机器、数据库的标识ID等等,序列号为每秒或每毫秒内自增的id。我做的时候没有用位运算去实现,而是做了一个十进制的,16位的(当时项目要求是16位的)。但是实现发号器的基本策略是一样的,通过时间戳
系统 2019-09-27 17:50:10 2426
前言本文主要给大家介绍了关于python计算时间差(返回天数)的相关资料,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧方法如下:将时间戳转换成日期格式:importtimetime_stamp=1547445305time_arr=time.localtime(time_stamp)data_time=time.strftime("%Y-%m-%d%H:%M:%S",time_arr)计算两个日期格式相差的天数:deftime_long(
系统 2019-09-27 17:49:42 2426
本文实例讲述了Python使用import导入本地脚本及导入模块的技巧。分享给大家供大家参考,具体如下:导入本地脚本import如果你要导入的Python脚本与当前脚本位于同一个目录下,只需输入import,然后是文件名,无需扩展名.py。伪代码如下:importuseful_functionsuseful_functions.add_five([1,2,3,4])我们可以为导入模块添加别名,以使用不同的名称引用它。importuseful_functio
系统 2019-09-27 17:49:18 2426
1.计算给出两个时间之间的时间差importdatetimeasdt#currenttimecur_time=dt.datetime.today()#onedaypre_time=dt.date(2016,5,20)#eg:2016.5.20delta=cur_time-pre_time#ifyouwanttogetdiscrepancyindaysprintdelta.days#ifyouwanttogetdiscrepancyinhoursprintd
系统 2019-09-27 17:38:14 2426