搜索到与相关的文章
Python

2019最新Python爬虫高频率面试题总结(一)

今天给大家出一个关于Python爬虫面试题的总结,相对于来说出现频率比较高的一些!1.为什么requests请求需要带上header?原因是:模拟浏览器,欺骗服务器,获取和浏览器一致的内容header的形式:字典headers={"User-Agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/54.0.2840.99Safari/537.

系统 2019-09-27 17:56:15 2080

Python

Python Matplotlib 基于networkx画关系网络图

前言昨天才开始接触,鼓捣了一个下午,接下来会持续更新,如果哪里有错误的地方,望各位大佬指出,谢谢!数据描述两个文件,一个文件包含了网络图的节点,节点存在类别(0,1,2,3)四类,但是0类别舍去,不画出;另一个文件包含了网络图的边,数据基本特征如下:图1中,id表示节点,b是类别;图2中,两个数字表示边连接的两个点。Networkx安装我的系统是MacOS,直接在terminal输入sudopipinstallnetworkx就可以安装,由于代码中涉及几个

系统 2019-09-27 17:56:07 2080

Python

详解Python self 参数

1、概述1.1场景我们在使用Python中的方法method时,经常会看到参数中带有self,但是我们也没对这个参数进行赋值,那么这个参数到底是啥意思呢?2、知识点2.1成员函数(m)和普通方法(f)Python中的"类方法"必须有一个额外的第一个参数名称(名称任意,不过推荐self),而"普通方法"则不需要。m、f、c都是代码自动提示时的左边字母(method、function、class)#-*-coding:utf-8-*-classTest(obj

系统 2019-09-27 17:56:05 2080

Python

「Python 面试」第六次更新

1.说一说Redis是什么Redis是一种「Key-Value」的内存型、非关系型数据库,属于NoSQL的一种。Redis的读写速度特别快,特别适合读写频繁的场景。Redis支持主从复制,支持数据持久化。2.知道Redis有哪些常用数据类型吗StringListHashSetZset3.说一下Redis用来做什么利用String,可以很容易实现「计数器」功能。利用List,可以实现「粉丝列表」功能。利用Hash,可以实现「浏览记录」功能。利用Set的并集、

系统 2019-09-27 17:55:50 2080

Python

Python进阶之使用selenium爬取淘宝商品信息功能示例

本文实例讲述了Python进阶之使用selenium爬取淘宝商品信息功能。分享给大家供大家参考,具体如下:#encoding=utf-8__author__='Jonny'__location__='西安'__date__='2018-05-14''''需要的基本开发库文件:requests,pymongo,pyquery,selenium开发流程:搜索关键字:利用selenium驱动浏览器搜索关键字,得到查询后的商品列表分析页码并翻页:得到商品页码数,模

系统 2019-09-27 17:55:34 2080

Python

13. 罗马数字转整数-----leetcode刷题(python解题)

[TOC]题目罗马数字包含以下七种字符:I,V,X,L,C,D和M。字符数值I1V5X10L50C100D500M1000例如,罗马数字2写做II,即为两个并列的1。12写做XII,即为X+II。27写做XXVII,即为XX+V+II。通常情况下,罗马数字中小的数字在大的数字的右边。但也存在特例,例如4不写做IIII,而是IV。数字1在数字5的左边,所表示的数等于大数5减小数1得到的数值4。同样地,数字9表示为IX。这个特殊的规则只适用于以下六种情况:I可

系统 2019-09-27 17:54:21 2080

Python

Python3之数据指纹MD5校验与对比

MD5消息摘要算法(英语:MD5Message-DigestAlgorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hashvalue),用于确保信息传输完整一致。MD5由美国密码学家罗纳德·李维斯特(RonaldLinnRivest)设计,于1992年公开,用以取代MD4算法。概述MD5校验码通过散列函数计算而成,可以生成任何数据的数据“指纹”,即我们可以利用MD5将消息或者数据压缩成摘要,是的数据量变小,便于比较

系统 2019-09-27 17:54:19 2080

Python

python中的break、continue、exit()、pass全面解析

1、breakbreak是终止本次循环,比如你很多个while循环,你在其中一个while循环里写了一个break,满足条件,只会终止这个while里面的循环,程序会跳到上一层while循环继续往下走以简单的for循环来举例foriinrange(10):print("-----%d-----"%i)forjinrange(10):ifj>5:breakprint(j)这里遇到j>5的时候第二层的for就不循环了,继续跳到上一层循环2、continueco

系统 2019-09-27 17:54:11 2080

Python

python+selenium 点击单选框-radio的实现方法

例子:以百度文库中选择文档的类型为例问题一:遍历点击所有文档类型的单选框#coding=utf-8fromseleniumimportwebdriverfromtimeimportsleepdriver=webdriver.Chrome()driver.maximize_window()driver.get("http://wenku.baidu.com")driver.implicitly_wait(8)foriindriver.find_element

系统 2019-09-27 17:53:47 2080

Python

Python 自动登录淘宝并保存登录信息的方法

前段时间时间为大家讲解了如何使用requests库模拟登录淘宝,而今天我们将对该功能进行丰富。所以我们把之前的那个版本定为1.0,而今天修改的版本定为2.0。版本的迭代意味着功能的升级,那今天的2.0版本较之前的1.0版本有哪些改进呢?我们一起来看看!1.0版本实现步骤我们先来回顾一下模拟登录淘宝的步骤吧,我们还是先看看淘宝登录的详细时序图:这是淘宝网登录的一个请求流程,而我们模拟登录也是根据这样的一个流程。但是在代码模拟登录的时候就不会分的这么细,我们根

系统 2019-09-27 17:52:34 2080