搜索到与相关的文章
Python

python使用pandas处理大数据节省内存技巧(推荐)

一般来说,用pandas处理小于100兆的数据,性能不是问题。当用pandas来处理100兆至几个G的数据时,将会比较耗时,同时会导致程序因内存不足而运行失败。当然,像Spark这类的工具能够胜任处理100G至几个T的大数据集,但要想充分发挥这些工具的优势,通常需要比较贵的硬件设备。而且,这些工具不像pandas那样具有丰富的进行高质量数据清洗、探索和分析的特性。对于中等规模的数据,我们的愿望是尽量让pandas继续发挥其优势,而不是换用其他工具。本文我们

系统 2019-09-27 17:49:29 2094

Python

shell,python,golang,日期时间与时间戳的转换

Shellshell获取文件最后修改时间的秒时间戳:stat-c%Y$path/$newest_logshell获取当前时间的秒时间戳:date+%s两个时间戳相减:timegap=$[$timestamp-$filetimestamp]将日期时间字符串转化为时间戳:date-d"2019-08-26"+%s将时间戳转化为日期时间字符串:date-d@1566748800获取n天前的日期时间:date-d"1dayago"+"%Y-%m-%d"获取n分钟前

系统 2019-09-27 17:48:12 2094

Python

用Python爬取需要登录的网站

最近我必须执行一项从一个需要登录的网站上爬取一些网页的操作。它没有我想象中那么简单,因此我决定为它写一个辅助教程。在本教程中,我们将从我们的bitbucket账户中爬取一个项目列表。教程中的代码可以从我的Github中找到。我们将会按照以下步骤进行:提取登录需要的详细信息执行站点登录爬取所需要的数据在本教程中,我使用了以下包(可以在requirements.txt中找到):requestslxml#步骤一:研究该网站打开登录页面进入以下页面“bitbuck

系统 2019-09-27 17:47:27 2094

Python

浅谈Python中的数据类型

数据类型:float―浮点数可以精确到小数点后面15位int―整型可以无限大bool―非零为true,零为falselist―列表Float/Int:运算符:/―浮点运算除//―当结果为正数时,取整;11//5=2;11//4=2当结果为负数时,向下取整;-11//5=-3;-11//4=-3当分子分母都是float,结果为float型**―计算幂;11**2=121%―取余其他数学运算:1.分数:importfractions;fractions.Fra

系统 2019-09-27 17:47:01 2094

Python

Python写的Discuz7.2版faq.php注入漏洞工具

Discuz7.2faq.php全自动利用工具,getshell以及dump数据,python版的uc_keygetshell部分的代码来自网上(感谢作者)实现代码:#!/usr/bin/envpython#-*-coding:gbk-*-#-*-coding:gb2312-*-#-*-coding:utf_8-*-#authoriswinimportsysimporthashlibimporttimeimportmathimportbase64impor

系统 2019-09-27 17:46:57 2094

Python

Python学习笔记之爬虫 汇总篇(更新中)

[TOC]Python网络爬虫之规则01Python爬虫之Requests库入门02Python爬虫之盗亦有道03Python爬虫之Requests网络爬取实战Python网络爬虫之提取04Python爬虫之BeautifulSoup库05Python爬虫之信息标记与提取方法06Python爬虫之Re(正则表达式)库

系统 2019-09-27 17:46:30 2094

Python

python习题(1-40)

【程序1】题目:有1、2、3、4个数字,能组成多少个互不相同且无重复数字的三位数?都是多少?count=0forainrange(1,5):forbinrange(1,5):forcinrange(1,5):ifa!=banda!=candb!=c:print('%d%d%d'%(a,b,c))count+=1print('一共有%s个'%count)【程序2】题目:企业发放的奖金根据利润提成。利润(I):低于或等于10万元时,奖金可提10%;高于10万元

系统 2019-09-27 17:46:18 2094

Python

python画图matplotlib—实现多块图

摘要:matplotlib是可以组合许多的小图,放在一张大图里面显示的.使用到的方法叫作subplot.1.定义引用importmatplotlib.pyplotaspltimportnumpyasnp#matplotlib是可以组合许多的小图,放在一张大图里面显示的.使用到的方法叫作subplot.#使用import导入matplotlib.pyplot模块,并简写成plt2.编写函数defmultiGraph():"""图中图"""plt.figure

系统 2019-09-27 17:46:02 2094

Python

Python中的闭包实例详解

一般来说闭包这个概念在很多语言中都有涉及,本文主要谈谈python中的闭包定义及相关用法。Python中使用闭包主要是在进行函数式开发时使用。详情分析如下:一、定义python中的闭包从表现形式上定义(解释)为:如果在一个内部函数里,对在外部作用域(但不是在全局作用域)的变量进行引用,那么内部函数就被认为是闭包(closure).这个定义是相对直白的,好理解的,不像其他定义那样学究味道十足(那些学究味道重的解释,在对一个名词的解释过程中又充满了一堆让人抓狂

系统 2019-09-27 17:45:52 2094

Python

浅谈python 四种数值类型(int,long,float,complex)

Python支持四种不同的数值类型,包括int(整数)long(长整数)float(浮点实际值)complex(复数),本文章向码农介绍python四种数值类型,需要的朋友可以参考一下。数字数据类型存储数值。他们是不可改变的数据类型,这意味着改变数字数据类型的结果,在一个新分配的对象的值。Number对象被创建,当你给他们指派一个值。例如:var1=1var2=10您也可以删除数字对象的参考,使用del语句。del语句的语法是:delvar1[,var2[

系统 2019-09-27 17:38:28 2094