如果你对数据分析有所了解,一定听说过一些亲民的工具如Excel、Tableau、PowerBI等,都能成为数据分析的得力助手。但它们的不足也是显而易见的:操作繁琐,复用性差,功能相对局限单一。怎么解决呢?——PythonPython有很多优点,如果你能很好的运用到工作中,会发现工作效率大大提升,涨薪也是再正常不过的事情。Python优点一:“流程可控,工作高效”举个例子,Excel做分析的过程:定位空值-删除空值-修改数据格式-去除异常值-公式计算-数据透
系统 2019-09-27 17:56:50 1842
一、在豆瓣网爬取以下图书的信息:二、参考代码:1、连接MongoDB数据库,并且创建数据库和表importpymongomyclient=pymongo.MongoClient("mongodb://127.0.0.1:27017/")db=myclient['webCrawler']#创建数据库webCrawlerdatatable=db['Book_info']#创建Book_info表2、爬取数据并且存储到数据库importreimportpanda
系统 2019-09-27 17:56:44 1842
list的话题的确不少,而且,在编程中,用途也非常多。有看官可能要问了,如果要生成一个list,除了要把元素一个一个写上之外,有没有能够让计算机自己按照某个规律生成list的方法呢?如果你提出了这个问题,充分说明你是一个“懒人”,不过这不是什么坏事情,这个世界就是因为“懒人”的存在而进步。“懒人”其实不懒。对list的操作range(start,stop)生成数字listrange(start,stop[,step])是一个内置函数。要研究清楚一些函数特别
系统 2019-09-27 17:56:07 1842
把做工程过程重要的一些代码做个记录,下边代码内容是关于python使用Flask框架的简单入门范例的代码。importos#UsingFlasksincePythondoesn'thavebuilt-insessionmanagementfromflaskimportFlask,sessionapp=Flask(__name__)#Generateasecretrandomkeyforthesessionapp.secret_key=os.urandom(
系统 2019-09-27 17:54:35 1842
非阻塞IO(non-blockingIO)Linux下,可以通过设置socket使其变为non-blocking。当对一个non-blockingsocket执行读操作时,流程是这个样子:从图中可以看出,当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。从用户进程角度讲,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道
系统 2019-09-27 17:53:07 1842
前言在Python中,enumrate和range都常用于for循环中,enumrate函数用于同时循环列表和元素,而range()函数可以生成数值范围变化的列表,而能够用于for循环即都是可迭代的。range概述range是用于产生连续或者带步长的数字元素组成的列表,下面是一些基本使用及场景示例。产生数字序列#产生0-9的序列foriinrange(0,10):print(i)print('-'*40)#产生0-20,步进(间隔)为3的数字元素组成的序列
系统 2019-09-27 17:53:03 1842
python_opencv这个库功能还是非常强大的,可以读取本地摄像头的内容,并且可以直接使用不同分类器对人脸进行识别。这里主要展示使用opencv实现对笔记本摄像头中的人脸实时识别和标注。主要是笔记本摄像头实时获取画面,然后获取其中人脸的位置,并在人脸位置的正方形进行标注。代码主要如下:#导入cv模块importcv2cap=cv2.VideoCapture(0)#告诉OpenCV使用人脸识别分类器#分类器下载地址https://github.com/o
系统 2019-09-27 17:52:34 1842
Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-#byustcwq#2015-03-15importurllib,urllib2,os,timefrombs4importBeautifulSoupstart=time.c
系统 2019-09-27 17:51:30 1842
一个用python实现的统计代码行数的小工具,供大家参考,具体内容如下实现功能计算出某一目录以及子目录下代码文件的行数在计算代码的过程中,只对标准命名的文件进行统计,如[文件名.文件类型]排除了以“#”开头的包含文件,宏定义等,如#include,#define,#pragma等排除了c,cpp文件中的“//”,“/…/”等的注释排除了python文件中import,from等开头的导入使用方法新建countLines.py文件,复制代码到文件中,将其放在
系统 2019-09-27 17:50:59 1842
美国队长的锅emmmmmmmm.......没错就是他的锅#所需依赖:python3pycharm#print打印print('helloworld!')#注释符号#井号后面灰色的内容是注释,相当于笔记,会被机器忽略#变量和值#n是变量,100是值,等号的作用是赋值#n相当于高中数学的xyz,只不过xyz的值只能是数字,变量的功能要更强大n=100m='hello'print(n)print(m)#数据类型,这里只讲两个,剩下的需要同学自己去系统地学习了#
系统 2019-09-27 17:50:56 1842