搜索到与相关的文章
Python

使用Python抓取模板之家的CSS模板

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-#byustcwq#2015-03-15importurllib,urllib2,os,timefrombs4importBeautifulSoupstart=time.c

系统 2019-09-27 17:51:30 2082

Python

Python基础(九)

今日主要内容函数初识函数定义函数调用函数返回值函数参数一、函数初识(一)为什么要用函数有一个需求,给出一个变量,计算变量的长度,要求不能使用len()s="郭老湿今天崩溃了,在后面直叹气"count=0foriins:count+=1print(count)我们利用上述一段代码完成了需求,很强666。但是问题来了,现在100个人每个人给你一个变量,让你计算变量的长度,此时只能苦逼的敲代码来计算!!!s=......count=0foriins:count+

系统 2019-09-27 17:51:05 2082

Python

python 缺失值处理的方法(Imputation)

一、缺失值的处理方法由于各种各样的原因,真实世界中的许多数据集都包含缺失数据,这些数据经常被编码成空格、nans或者是其他的占位符。但是这样的数据集并不能被scikit-learn算法兼容,因为大多数的学习算法都会默认数组中的元素都是数值,因此素偶有的元素都有自己的代表意义。使用不完整的数据集的一个基本策略就是舍弃掉整行或者整列包含缺失值的数值,但是这样处理会浪费大量有价值的数据。下面是处理缺失值的常用方法:1.忽略元组当缺少类别标签时通常这样做(假定挖掘

系统 2019-09-27 17:50:59 2082

Python

在Python中利用Pandas库处理大数据的简单介绍

在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:硬件环境CPU:3.5GHzIntelCorei7内存:32GBHDDR31600MHz硬盘:3TBFusionDrive数据

系统 2019-09-27 17:50:47 2082

Python

python抽取pdf中内容

这两天一直在windows上做用python(版本是3.6)抽取pdf中内容的东西,主要就是从pdf中提取出里面的字体和表格内容。尝试了好些个库,现在算是找到比较符合我需求(比较好用)的pdf解析的了。在这个过程中,用了以下几个库:PDFminerPDFminer算是一个还算不错的吧,安装直接用pip安装就行。如下:pipinstallpdfminer3k它这个对pdf中内容做了好些个对象,用这些对象来存储不同的信息,比如表格有LTFigure对象存储、文

系统 2019-09-27 17:50:26 2082

Python

python openCV 基于TCP的socket网络传输视频(一)

createtime:2019年7月17日我在网上找了好多,现在基本实现了传输视频的功能,其思路是:首先得先了解如何使用openCV采集摄像头数据,其次得了解pythonsocket网络编程。因为socket不能直接传输openCV采集的数据,所以还需要转码操作。在下个版本,我用的类的方式实现了视频传输,这个版本先用平常方法实现的,也是一个客户端,一个服务端。服务端#!/usr/bin/python#-*-coding:utf-8-*-importsock

系统 2019-09-27 17:50:02 2082

Python

Python2.x和3.x下maketrans与translate函数使用

maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包含字节数据和我们常见的ASCII码数据;而3.X版本则重新对字符串进行了划分,分为了字节字符串bytes和文本字符串str,两者都是不可变的,所以添加了一个可变的字节字符串类型byte

系统 2019-09-27 17:49:54 2082

Python

安装Python双版本

1.下载地址https://www.python.org/,目前版本是https://www.python.org/downloads/release/python-373/,https://www.python.org/downloads/release/python-2715/。2.依次完成v2版本和v3版本的安装,安装是勾选pip和安装环境变量。3.进入v2版本的安装目录,重命名python为python24.cmd进入v2版本的scripts目录,

系统 2019-09-27 17:49:49 2082

Python

python学习 第二天

一、运算符1、算术运算符:+-*///**%+加两个数相加1+2=3-减两个数相减3-1=2*乘两个数相乘1*2=2/除两个数相除5/2=2.5//整除两个数相除得到整数5//2=2**幂幂次方2**3=8%取余两个数的余数5%2=1(可以用来判断奇偶数取余为0的时候为偶数取余为1的时候为奇数)2、比较运算符:>、<、>=、<=、==、!=结果只有真假truefalse为bool类型3、赋值运算符:+=-=*=/=//=%=**=num+=1等价于num=

系统 2019-09-27 17:49:47 2082

Python

快速排序(python)

2.快速排序2.1算法思想快速排序是对冒泡排序的一种改进。通过一次排序(设要排序的数组是A[0]……A[N-1],首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它左边,所有比它大的数都放到它右边,这个过程称为一次快速排序)将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。快速排序的

系统 2019-09-27 17:49:43 2082