拥有Python标签的文章
Python

第六章Python数据可视化

前言文不如字,字不如表,表不如图”,说的就是可视化的重要性。从事与数据相关的工作者经常会作一些总结或展望性的报告,如果报告中密密麻麻都是文字,相信听众或者老板一定会厌烦;如果报告中呈现的是大量的图形化结果,就会受到众人的喜爱,因为图形更加直观、醒目。本章内容的重点就是利用Python绘制常见的统计图形,例如条形图、饼图、直方图、折线图、散点图等,通过这些常用图形的展现,将复杂的数据简单化。这些图形的绘制可以通过matplotlib模块、pandas模块或者

系统 2019-09-27 17:48:28 2813

Python

使用python打印十行杨辉三角过程详解

杨辉三角,是二项式系数在三角形中的一种几何排列每个数等于它上方两数之和。每行数字左右对称,由1开始逐渐变大。第n行的数字有n项。第n行数字和为2n-1。第n行的m个数可表示为C(n-1,m-1),即为从n-1个不同元素中取m-1个元素的组合数。第n行的第m个数和第n-m+1个数相等,为组合数性质之一。每个数字等于上一行的左右两个数字之和。可用此性质写出整个杨辉三角。即第n+1行的第i个数等于第n行的第i-1个数和第i个数之和,这也是组合数的性质之一。即C(

系统 2019-09-27 17:55:45 2785

Python

Python --处理nc数据

首先你得安装netCDF4这个库(pipinstall)简单读取如下可以看到dimensions(sizes):longitude(480),latitude(241),time(480)variables(dimensions):float32longitude(longitude),float32latitude(latitude),int32time(time),int16z(time,latitude,longitude)这是一个三维数据集,空间两

系统 2019-09-27 17:55:06 2777

Python

Python二维数组按列取元素

Numpy数组可以直接切片,但是普通的Python二维数组不行。方法一a=[[1,2],[3,4]]b=[i[0]foriina]#从a中的每一行取第一个元素。print(b)[1,4]方法二a=[[1,2],[3,4]]b=list(zip(*a))print(b)[(1,3),(2,4)]

系统 2019-09-27 17:49:20 2773

Python

解析python实现Lasso回归

Lasso原理Lasso与弹性拟合比较python实现importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.metricsimportr2_score#defmain():#产生一些稀疏数据np.random.seed(42)n_samples,n_features=50,200X=np.random.randn(n_samples,n_features)#randn(...)产生的是正态分布的数据c

系统 2019-09-27 17:46:46 2767

Python

python 利用scipy.stats生成截断正态分布(truncated

关于截断正态分布(truncatednormaldistribution)这里不再赘述,简言之就是在均值和方差之外,再指定正态分布随机数群的上下限,如[μ-3σ,μ+3σ],上代码:importmatplotlib.pyplotaspltimportscipy.statsasstatsimportpylabfrompylabimport*mu,sigma=5,0.7lower,upper=mu-2*sigma,mu+2*sigma#截断在[μ-2σ,μ+2

系统 2019-09-27 17:45:44 2760

Python

python实现鸢尾花三种聚类算法(K-means,AGNES,DBScan)

一.分散性聚类(kmeans)算法流程:1.选择聚类的个数k.2.任意产生k个聚类,然后确定聚类中心,或者直接生成k个中心。3.对每个点确定其聚类中心点。4.再计算其聚类新中心。5.重复以上步骤直到满足收敛要求。(通常就是确定的中心点不再改变。优点:1.是解决聚类问题的一种经典算法,简单、快速2.对处理大数据集,该算法保持可伸缩性和高效率3.当结果簇是密集的,它的效果较好缺点1.在簇的平均值可被定义的情况下才能使用,可能不适用于某些应用2.必须事先给出k(

系统 2019-09-27 17:54:36 2745

Python

Python 批量刷博客园访问量脚本过程解析

今早无聊。。。7点起来突然想写个刷访问量的。。那就动手吧仅供测试,不建议刷访问量哦~~很简单的思路,第一步提取代理ip,第二步模拟访问。提取HTTP代理IP网上很多收费的代理和免费的代理IP如:无论哪个网站,我们需要的就是爬取上面的ip和端口号,整理到一起。具体的网站根据具体的结构爬取比如上面那个网站,ip和端口在td标签这里利用bs4爬取即可。贴上脚本##获取代理ipdefGet_proxy_ip():print("==========批量提取ip刷博客

系统 2019-09-27 17:56:29 2735

Python

使用Python来计算均值、中位数、标准差

计算一串数组的均值、中位数、标准差#!/usr/bin/envpython#-*-coding:utf-8-*-'''@author:FIGTHING@file:DataMining.py@function:@software:Pycharm@time:2019/06/13/15:40'''importnumpyasnpage=[23,23,27,27,39,41,47,49,50,52,54,54,56,57,58,58,61]fat=[9.5,26.5

系统 2019-09-27 17:52:08 2731

Python

Dijkstra算法的Python实现-最短路径问题

使用狄克斯特拉算法找出下图中从起点至终点耗时最短的路径,路径上的每个数字表示的都是时间,单位分钟。狄克斯特拉算法包含的4个步骤:(1)找出开销/消耗“最便宜”的节点,即在最短时间内到达的节点(2)对于该节点的邻居,检查是否有前往它们的更短路径,如果有,更新该节点的邻居的开销(3)重复上述过程,直到对图中的每个节点都这样做了(4)计算最终路径python代码实现:#描述各节点、时间开销、父节点信息#创建节点信息,start起点,fin终点graph={}gr

系统 2019-09-27 17:47:33 2727

Python

Python 窗体(tkinter)按钮 位置实例

如下所示:importtkinterdefgo():#函数print("go函数")win=tkinter.Tk()#构造窗体win.title("hellozhaolin")#标题win.geometry("800x800+300+0")#800宽度,800高度,x,y坐标,左上角button=tkinter.Button(win,text="有种点我",command=go)#收到消息执行go函数button.pack()#加载到窗体,button1=

系统 2019-09-27 17:51:48 2713

Python

Python打印“菱形”星号代码方法

本人是一名python初学者,刚刚看到一道有趣的python问题,“用python如何在编译器中打印出菱形图案?”因此决定尝试一下,代码不多,仅供参考。代码defprintStar(intNum):s="*"spaceLength=intNumblockCount=int(intNum/2+1)foriinrange(spaceLength):result=s.rjust(blockCount)ifi>=int(spaceLength/2):print(r

系统 2019-09-27 17:52:19 2705

Python

[Python爬虫]模拟登陆天眼查网站

这是一篇使用Python模拟登陆天眼查网站的详细介绍,天眼查网站上有许多的企业信息,因此抓取天眼查数据十分重要,本文使用selenium模拟登陆天眼查网站。其实我之前就想写这个python模拟登录网站的,因为之前爬虫用的时候感觉还挺好用的,后来想学一下R爬虫再来用R写的,结果最近的爬虫还是用的python,so,给大家用python讲解咯。今天给大家讲的是模拟登录“天眼查”这个网站,网站登录页面就是下面这样。我们用的工具就是PyCharm编译器,类似于R里

系统 2019-09-27 17:56:13 2691

Python

如何使用python编程创建kafka的topic

阅读更多Youcanprogrammaticallycreatetopicseitherusingkafka-pythonorconfluent_kafkaclientwhichisalightweightwrapperaroundlibrdkafka.Usingkafka-pythonfromkafka.adminimportKafkaAdminClient,NewTopicadmin_client=KafkaAdminClient(bootstrap_

系统 2019-09-27 17:56:42 2670