前言在使用Python进行数据分析时,经常会遇到时间日期格式处理和转换,特别是分析和挖掘与时间相关的数据,比如量化交易就是从历史数据中寻找股价的变化规律。Python中自带的处理时间的模块有datetime,NumPy库也提供了相应的方法,Pandas作为Python环境下的数据分析库,更是提供了强大的日期数据处理的功能,是处理时间序列的利器。1、生成日期序列主要提供pd.data_range()和pd.period_range()两个方法,给定参数有起始
系统 2019-09-27 17:53:00 1916
1Python开发环境搭建1.1Python版本介绍Python目前官方运营维护的版本分为2.x版本和3.x版本。2.x版本相对来说,稳定性更高,兼容的主流第三方扩展库更多,商用开发首选;3.x架构设计更完善,性能更好,一些发展前端的第三方扩展库以3.x版本首选兼容和维护。因为2.x版本和3.x版本存在架构上的差异,所以互不兼容,在开发选择版本时需要注意。目前2.x版本的最新版本是2.7.14;3.x版本的最新版本是3.6.3。1.2Python下载与安装
系统 2019-09-27 17:52:53 1916
上面我们学习了RDD如何转换,即一个RDD转换成另外一个RDD,但是转换完成之后并没有立刻执行,仅仅是记住了数据集的逻辑操作,只有当执行了Action动作之后才会真正触发Spark作业,进行算子的计算执行操作有:reduce(func)collect()count()first()take(n)takeSample(withReplacement,num,[seed])takeOrdered(n,[ordering])saveAsTextFile(path
系统 2019-09-27 17:52:33 1916
python是一门灵活的语言,也可以说python是一门胶水语言,顾名思义,就是其可以导入各类的包,python的包可以说是所有语言中最多的。当然导入包大部分是为了更快捷,更方便,效率更高。对于刚入门的python爱好者来说最初接触的应该是import直接导入包的方式,例如importtime,就是导入了python的time包,这个包中的方法可以处理大部分我们项目中遇到的关于时间的问题。下面我会详细介绍几种导入包的方式(在开发过程中绝对够用)以及怎样把其
系统 2019-09-27 17:52:19 1916
Python的虚拟环境极大地方便了人们的生活。本指南先介绍虚拟环境的基础知识以及使用方法,然后再深入介绍虚拟环境背后的工作原理。注意:本指南在macOSMojave系统上使用最新版本的Python3.7.x。1.为什么使用虚拟环境?虚拟环境为一系列潜在问题提供简单的解决方案,尤其是在以下几个方面:允许不同的项目使用不同版本的程序包,从而解决依赖性问题。例如,可以将ProjectAv2.7用于ProjectX,并将PackageAv1.3用于ProjectY
系统 2019-09-27 17:51:02 1916
最简单的网页取源(不用模拟浏览器的情况)1importrequests2defgetHTML(url):3try:4r=requests.get(url,timeout=30)5r.raise_for_status()6r.encoding='utf-8'7returnr.text8except:9return""10url="http://baidu.com"11print(getHTML(url))
系统 2019-09-27 17:50:19 1916
下面先给大家介绍下Python3判断2个字典相同的方法,Python自带的数据结构dict非常好用,之前不知道怎么比较2个字典是否相同,做法是一个一个key比较过去。。。现在想到可以直接用==进行判断!!!a=dict(one=1,two=2,three=3)b={'one':1,'two':2,'three':3}c=dict(zip(['one','two','three'],[1,2,3]))d=dict([('two',2),('one',1),(
系统 2019-09-27 17:50:06 1916
前言在Python开发中,有些情况下,我们可能面临在一台机器上同时安装多版本Python的需求。比如:有多个Python项目,每个项目依赖不同的Python版本。有一个Python项目,它需要同时支持多个Python版本。那么,如何高效地在单台机器上实现多个版本Python(具体来说,这里Python指的是Python解释器)的安装和维护呢?除此之外,我们还可能面临在一台机器上安装多个版本的某个Python第三方库的需求。比如:有多个Python项目,每个
系统 2019-09-27 17:50:01 1916
关于我一个有思想的程序猿,终身学习实践者,目前在一个创业团队任teamlead,技术栈涉及Android、Python、Java和Go,这个也是我们团队的主要技术栈。Github:https://github.com/hylinux1024微信公众号:终身开发者(angrycode)在前一篇《一文彻底搞懂Python可迭代(Iterable)、迭代器(Iterator)和生成器(Generator)的概念》的文中,知道生成器(Generator)可由以下两
系统 2019-09-27 17:49:37 1916
1.创建一个边界值为1而内部都是0的数组,图例如下:[提示:]解此题可以先把所有值都设置为1,这是大正方形;其次,把边界除外小正方形全部设置为0。本题用到numpy的切片原理。多维数组同样遵循x[start:stop:step]的原理。[1.1.1.1.1.1.1.1.1.1.][1.0.0.0.0.0.0.0.0.1.][1.0.0.0.0.0.0.0.0.1.][1.0.0.0.0.0.0.0.0.1.][1.0.0.0.0.0.0.0.0.1.][1
系统 2019-09-27 17:49:14 1916