摘要在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。这里就简单的介绍一下对于DataFrame去重和取重复值的操作。创建DataFrame这里首先创建一个包含一行重复值的DataFrame。DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我
系统 2019-09-27 17:56:02 2202
函数也是对象要理解Python装饰器,首先要明白在Python中,函数也是一种对象,因此可以把定义函数时的函数名看作是函数对象的一个引用。既然是引用,因此可以将函数赋值给一个变量,也可以把函数作为一个参数传递或返回。同时,函数体中也可以再定义函数。装饰器本质可以通过编写一个纯函数的例子来还原装饰器所要做的事。defdecorator(func):defwrap():print("Doingsometingbeforeexecutingfunc()")fun
系统 2019-09-27 17:55:37 2202
数字类型数字提供了标量贮存和直接访问。它是不可更改类型,也就是说变更数字的值会生成新的对象。当然,这个过程无论对程序员还是对用户都是透明的,并不会影响软件的开发方式。Python支持多种数字类型:整型、长整型、布尔型、双精度浮点型、十进制浮点型和复数。创建数值对象并用其赋值(数字对象)创建数值对象和给变量赋值一样同样简单:复制代码代码如下:>>>anInt=1>>>along=-555555555555L>>>afloat=3.141595468565>>
系统 2019-09-27 17:55:09 2202
一.垃圾回收机制Python中的垃圾回收是以引用计数为主,分代收集为辅。1、导致引用计数+1的情况对象被创建,例如a=23对象被引用,例如b=a对象被作为参数,传入到一个函数中,例如func(a)对象作为一个元素,存储在容器中,例如list1=[a,a]2、导致引用计数-1的情况对象的别名被显式销毁,例如dela对象的别名被赋予新的对象,例如a=24一个对象离开它的作用域,例如f函数执行完毕时,func函数中的局部变量(全局变量不会)对象所在的容器被销毁,
系统 2019-09-27 17:55:03 2202
join方法join这个方法,将可迭代的数据类型,转为字符串或者bytes,没错可以转为bytes类型。注意这个可迭代的数据中的元素必须是相同类型的。jion里的参数可迭代对象就行,可迭代对象是指有__iter__方法的对象#列表为可迭代对象list_1=["1","2","3","4"]#元素为字符串的列表res="".join(list_1)#res的值为"1234",数据类型为str#字典为可迭代对象dict_1={"key1":"value2","
系统 2019-09-27 17:53:52 2202
该GIF图来自于官网,文末有给出链接。描述依托于百度网盘巨大的的云存储空间,绝大数人会习惯性的将一些资料什么的存储到上面,但是有的私密链接需要提取码,但是让每个想下载私密资源的人记住每一个提取码显然是不现实的。这个时候,云盘万能钥匙诞生了,我们通过安装相应的浏览器插件就可以自动获获取相应链接的提取码。我在Github上看了一下,有WebJS版的,python版的貌似还没有找到,所以我参照了JS版本和官网的请求接口写了两种方式的获取脚本。实现下述两种方式的具
系统 2019-09-27 17:52:27 2202
逻辑回归的推导过程:https://blog.csdn.net/ACM_hades/article/details/90448785代码主要实现了下面公式:Wk+1=Wk+λX(Y−fWk(XT))W^{k+1}=W^k+λX(Y-f_{W^k}(X^T))Wk+1=Wk+λX(Y−fWk(XT))数据集:我们选择MNIST数据集进行实验,它包含各种手写数字(0-9)图片,图片大小28*28。MNIST数据集本身有10个类别,为了将其变成二分类问题我们进
系统 2019-09-27 17:52:11 2202
一代码编排1缩进4个空格的缩进(编辑器都可以完成此功能),不要使用Tap,更不能混合使用Tap和空格。2每行最大长度79,换行可以使用反斜杠,最好使用圆括号。换行点要在操作符的后边敲回车。3类和top-level函数定义之间空两行;类中的方法定义之间空一行;函数内逻辑无关段落之间空一行;其他地方尽量不要再空行。二文档编排1模块内容的顺序:模块说明和docstring―import―globals&constants―其他定义。其中import部分,又按标准
系统 2019-09-27 17:51:16 2202
操作:输入带分页的地址,去掉最后面的数字,设置一下起始页数和终点页数功能:下载对应页码的所有页面并储存为HTML文件,以当前时间命名代码:#-*-coding:utf-8-*-#----------------------------#程序:百度贴吧的小爬虫#日期:2015/03/28#语言:Python2.7#操作:输入带分页的地址,去掉最后面的数字,设置一下起始页数和终点页数#功能:下载对应页码的所有页面并储存为HTML文件,以当前时间命名#-----
系统 2019-09-27 17:51:10 2202
在Python中也可以像gcc/gdb那样调试程序,只要在运行Python程序时引入pdb模块(假设要调试的程序名为d.py):复制代码代码如下:$vid.py#!/usr/bin/pythondefmain():i,sum=1,0foriinxrange(100):sum=sum+iprintsumif__name__=='__main__':main()$python-mpdbd.py运行上面的命令后进入以下界面,可以输入类似gdb的命令来改变程序的执
系统 2019-09-27 17:48:42 2202