- 军军小站|张军博客
搜索到与相关的文章
Python

python使用pandas处理大数据节省内存技巧(推荐)

一般来说,用pandas处理小于100兆的数据,性能不是问题。当用pandas来处理100兆至几个G的数据时,将会比较耗时,同时会导致程序因内存不足而运行失败。当然,像Spark这类的工具能够胜任处理100G至几个T的大数据集,但要想充分发挥这些工具的优势,通常需要比较贵的硬件设备。而且,这些工具不像pandas那样具有丰富的进行高质量数据清洗、探索和分析的特性。对于中等规模的数据,我们的愿望是尽量让pandas继续发挥其优势,而不是换用其他工具。本文我们

系统 2019-09-27 17:49:29 1737

Python

python os模块的使用

文章目录获取当前决定路径os.getcwd()获取路径下的所有文件名和路径名os.listdir()创建文件夹os.makedirs()删除文件夹os.remove()获取文件的绝对路径os.path.abspath("init.py")判断指定路径或者文件是否存在os.path.exists()将文件路径和文件组成一个完成的路径os.ptah.join()获取当前决定路径os.getcwd()paths=os.getcwd()print(paths)#D

系统 2019-09-27 17:48:26 1737

Python

python开发之路

第一篇:Python基础Python入门python的数据类型文件操作第二篇:函数函数基础用户注册register()示例扩展注册功能装饰器举例函数嵌套调用、名称空间与作用域、函数对象函数装饰器迭代器生成器面向过程、三元表达式、函数递归匿名函数日志输出格式内置函数列表生成式、生成器表达式、模块导入第三篇:模块软件开发目录规范、logging模块序列化与反序列化、os模块包的使用time模块、datetime模块(打印进度条)random模块、shutil模

系统 2019-09-27 17:48:25 1737

Python

60道硬核 Python 面试题,论面霸是如何炼成的

说实话,都9012了,还在用这种背题式的方法来考核程序员,实在太不切合程序员的实际工作了……文末给出了一种更极客的考核方式,Talkischeap,Showmethecode(写代码,憋bb)——写得出工作代码,就说明你有工作能力;写不出,书背的再溜也不行面试官只需要:节选一段工作代码,然后把原有代码删除,让面试者自己写代码实现;或是保留一段有bug的代码,让面试者修改即可——这都是最常见的程序员工作场景,最能考核面试者的真实代码能力;而且题目随处可见,扒

系统 2019-09-27 17:48:17 1737

Python

Stack Overflow2019开发者调查报告:“Python再次

继PLPY4月榜单官宣,Python躺赢,再度“夺”冠,实力甩下Java和C后,近期,StackOverflow发布了2019开发者调查报告,也证实了王者陨落这一事实。那么,2019年大环境下,程序员群体正在发生哪些变化?收入究竟如何?这份报告邀请超147个国家、9万名开发者参与调查,内容涉及开发者基本情况、技术、工作、社区、方法论多个维度。以下为和正在敲代码的你息息相关的结论。2019年Python趋势分析:https://edu.csdn.net/to

系统 2019-09-27 17:48:16 1737

Python

手动实现把python项目发布为exe可执行程序过程分享

1.手动制作python的exe可执行程序Python没有内建一个编译为exe的功能。给python程序的部署带来不少的麻烦。所以就会出现一些py2exe之类的很不错的工具,用于自动把.py文件编译为.exe文件。最近抽空研究了一下手动实现类似py2exe的功能,希望加强对python的了解。结果还相当不错。把结果记录下来,与大家共享。1.1.原理文中所描述的方法,基于python的以下几个功能1)python程序运行时,会在sys.path指定的路径中查

系统 2019-09-27 17:47:34 1737

Python

python 之 Django框架(APP和ORM的使用)

12.3APP12.31创建APP一个Django项目可以分为很多个APP,用来隔离不同功能模块的代码用命令行创建一个APP:python3manage.pystartappapp01创建好APP,记得告诉Django,app的名字,在settings.py中添加:INSTALLED_APPS=['django.contrib.admin','django.contrib.auth','django.contrib.contenttypes','djang

系统 2019-09-27 17:47:27 1737

Python

19、 Python快速开发分布式搜索引擎Scrapy精讲—css选择器

【百度云搜索,搜各种资料:http://www.lqkweb.com】【搜网盘,搜各种资料:http://www.swpan.cn】css选择器1、2、3、::attr()获取元素属性,css选择器::text获取标签文本举例:extract_first('')获取过滤后的数据,返回字符串,有一个默认参数,也就是如果没有数据默认是什么,一般我们设置为空字符串extract()获取过滤后的数据,返回字符串列表#-*-coding:utf-8-*-import

系统 2019-09-27 17:47:14 1737

Python

python urllib中的编码处理示例

复制代码代码如下:>>>importurllib>>>data='丽江'>>>printdata丽江>>>data'\xe4\xb8\xbd\xe6\xb1\x9f'>>>urllib.quote(data)'%E4%B8%BD%E6%B1%9F'那我们想转回去呢?复制代码代码如下:>>>urllib.unquote('%E4%B8%BD%E6%B1%9F')'\xe4\xb8\xbd\xe6\xb1\x9f'>>>printurllib.unquote(

系统 2019-09-27 17:47:11 1737

Python

python中时间、日期、时间戳的转换的实现方法

1.简介在编写代码时,往往涉及时间、日期、时间戳的相互转换。2.示例#引入模块importtime,datetime2.1str类型的日期转换为时间戳#字符类型的时间tss1='2013-10-1023:40:00'#转为时间数组timeArray=time.strptime(tss1,"%Y-%m-%d%H:%M:%S")printtimeArray#timeArray可以调用tm_year等printtimeArray.tm_year#2013#转为时

系统 2019-09-27 17:46:52 1737