- 军军小站|张军博客
搜索到与相关的文章
Python

python爬虫系列(一)

前言关于python爬虫目前有两个主流的库一个是urllib和requests在python3中urllib2已经没有了,取而代之的是urllib.request。这里的话我将首先介绍urllib.request的使用。之后我再介绍request,我本人是打算做一个系列的爬虫教程不仅仅包括入门还有实战进阶所以我希望浏览我写的博客时可以按顺序浏览学习。那么废话不多说奉上名言成功没有偶然。即便有些胜利者谦虚地说,自己的成功是偶然的缘故。——尼采开始正片!!!u

系统 2019-09-27 17:57:27 1919

Python

python网络爬虫学习笔记之一 爬虫基础入门

爬虫工作的三个基本步骤:爬取网页、解析内容、存储数据准备先安装爬取网页需要用到的第三方库:requests和bs4pipinstallrequestspipinstallbs4爬取网页#coding:UTF-8importrequestslink="http://www.santostang.com/"headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(K

系统 2019-09-27 17:57:02 1919

Python

快速入门 Python 数据分析实用指南

Python现如今已成为数据分析和数据科学使用上的标准语言和标准平台之一。那么作为一个新手小白,该如何快速入门Python数据分析呢?下面根据数据分析的一般工作流程,梳理了相关知识技能以及学习指南。数据分析一般工作流程如下:数据采集数据存储与提取数据清洁及预处理数据建模与分析数据可视化1.数据采集数据来源分为内部数据和外部数据,内部数据主要是企业数据库里的数据,外部数据主要是下载一些公开数据取或利用网络爬虫获取。(如果数据分析仅对内部数据做处理,那么这个步

系统 2019-09-27 17:56:33 1919

Python

【Python】DataFrame使用drop_duplicates()函数

摘要在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。这里就简单的介绍一下对于DataFrame去重和取重复值的操作。创建DataFrame这里首先创建一个包含一行重复值的DataFrame。DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我

系统 2019-09-27 17:56:02 1919

Python

python自动化测试之从命令行运行测试用例with verbosity

本文实例讲述了python自动化测试之从命令行运行测试用例withverbosity,分享给大家供大家参考。具体如下:实例文件recipe3.py如下:classRomanNumeralConverter(object):def__init__(self,roman_numeral):self.roman_numeral=roman_numeralself.digit_map={"M":1000,"D":500,"C":100,"L":50,"X":10,

系统 2019-09-27 17:55:59 1919

Python

python[requests]爬取知乎个人信息数据

效果技术栈python3requestsredisechart源码地址https://github.com/MasakiOvO/...python需要安装的库requests,BeautifulSoup,redis,django思路两个程序。一个程序负责爬取用户关注和粉丝列表,并把用户名存入set另一个程序负责根据用户名获取详细信息,存入hash维护两个列表1.已爬用户2.未爬用户第一个程序的流程:当未爬set不为空时:执行如下操作:每次从未爬取列表中取出

系统 2019-09-27 17:55:04 1919

Python

Python学习笔记(四)----Pywin32+Pyinstaller制作

一:pywin32+pyinstaller安装双击pywin32-221.win-amd64-py3.5.exe安装,注意安装的时候会自动检测之前安装的Python。下一步,下一步。在CMD命令行进入Python3.5目录下的Scripts目录并执行:pythonpywin32_postinstall.py-install命令在CMD命令行中进入D:\Programs\Python\pyinstaller-pyinstaller目录(之前解压的pyInst

系统 2019-09-27 17:53:44 1919

Python

详解Python对JSON中的特殊类型进行Encoder

Python处理JSON数据时,dumps函数是经常用到的,当JSON数据中有特殊类型时,往往是比较头疼的,因为经常会报这样一个错误。自定义编码类#!/usr/bin/envpython#-*-coding:utf-8-*-#Author:wxnacy(wxnacy@gmail.com)importjsonfromdatetimeimportdatetimeUSER_DATA=dict(id=1,name='wxnacy',ts=datetime.now(

系统 2019-09-27 17:52:11 1919

Python

简单分析python的类变量、实例变量

1、类变量、实例变量概念类变量:类变量就是定义在类中,但是在函数体之外的变量。通常不使用self.变量名赋值的变量。类变量通常不作为类的实例变量的,类变量对于所有实例化的对象中是公用的。实例变量:实例变量是定义在方法中的变量,使用self绑定到实例上的变量,只是对当前实例起作用。2、访问类变量在类的内部和外部类变量都可以直接使用className.类变量的形式访问。但是在类的内部,也可以使用self.类变量来访问,但是这个是用含义就不同了(后面使用代码验证

系统 2019-09-27 17:49:16 1919

Python

python 处理微信对账单数据的实例代码

下面一段代码给大家介绍python处理微信对账单数据,具体代码如下所示:#下载对账单并存储到数据库@app.route("/bill/",methods=["GET","POST"])defdownload_bill(date):pay=MyWeiXinPay()#自己的支付类bill=pay.download_mybill(date)#下载原始对账单,下载下来为字符串billArray=bill.split("\r\n")#分割账单,一行为一组数据,分割

系统 2019-09-27 17:48:58 1919