- 军军小站|张军博客
搜索到与相关的文章
Python

25、Python快速开发分布式搜索引擎Scrapy精讲—Requests请求

【百度云搜索,搜各种资料:http://www.lqkweb.com】【搜网盘,搜各种资料:http://www.swpan.cn】Requests请求Requests请求就是我们在爬虫文件写的Requests()方法,也就是提交一个请求地址,Requests请求是我们自定义的**Requests()方法提交一个请求参数:url=字符串类型url地址callback=回调函数名称method=字符串类型请求方式,如果GET,POSTheaders=字典类型

系统 2019-09-27 17:54:11 1780

Python

python的mysqldb安装步骤详解

python的mysqldb安装步骤详解安装MySQLdb:一、什么是MySQLdb?解释:MySQLdb是Python操作MySQL的一个接口包。这里要理解一个概念,python操作数据库,都是需要一个类似MySQLdb这样的中间层,这些中间层抽象了具体的实现,提供了统一的API供开发者使用。二、如何安装MySQLdb?python2环境下:sudopipinstallMySQL-python。MySQL-python目前暂时还不支持python3,有些

系统 2019-09-27 17:54:02 1780

Python

用python wxpy管理微信公众号并利用微信获取自己的开源数据

之前了解到itchat乃至于wxpy时是利用tuling聊天机器人的接口。调用接口并保存双方的问答结果可以作为自己的问答词库的一个数据库累计。这些数据可以用于自己训练。而最近希望获取一些语音资源,用于卷积神经网络的训练。。--------------------------------------------------------------------------------首先wxpy是itchat的升级版,通过wxpybot.core即可原封不动的

系统 2019-09-27 17:53:42 1780

Python

详解python和matlab的优势与区别

Python是一种面向对象的解释型计算机程序设计语言。Python是纯粹的自由软件,源代码和解释器CPython遵循GPL(GNUGeneralPublicLicense)协议。Python语法简洁清晰,特色之一是强制用空白符(whitespace)作为语句缩进。Python的优势:Python相对于Matlab最大的优势:免费。但既然你已经能用上Matlab,想必不在乎这个了。Python次大的优势:开源。你可以大量更改科学计算的算法细节。可移植性,Ma

系统 2019-09-27 17:53:35 1780

Python

MySQL-Python安装问题小记

安装完mysql-python后import加载模块提示以下错误,复制代码代码如下:ImportError:libmysqlclient_r.so.16:cannotopensharedobjectfile:Nosuchfileordirectory于是google之,总结一下解决方法:(1)在mysql-ython的安装目录下找到site.cfg,将#mysql_config=XXXXXXXXXXXXXXXX注释符号去掉,并填上mysql_config的

系统 2019-09-27 17:53:27 1780

Python

python机器学习库常用汇总

汇总整理一套Python网页爬虫,文本处理,科学计算,机器学习和数据挖掘的兵器谱。1.Python网页爬虫工具集一个真实的项目,一定是从获取数据开始的。无论文本处理,机器学习和数据挖掘,都需要数据,除了通过一些渠道购买或者下载的专业数据外,常常需要大家自己动手爬数据,这个时候,爬虫就显得格外重要了,幸好,Python提供了一批很不错的网页爬虫工具框架,既能爬取数据,也能获取和清洗数据,也就从这里开始了:1.1Scrapy鼎鼎大名的Scrapy,相信不少同学

系统 2019-09-27 17:53:22 1780

Python

python爬取分析30万条微博评论,看毕业生与翟天临的爱恨情仇|凹凸数读

使用python爬取微博评论:本文首发于《凹凸数读》,关注后台回复“源码”获取相关python代码2019年5月27日凌晨,翟天临又上了热搜。我们爬取了翟天临2月道歉微博下的30万余条评论,看看毕业生们是如何吐槽他的?本文首发于《凹凸数读》,关注后台回复“源码”获取相关python代码

系统 2019-09-27 17:53:21 1780

Python

python实现Dijkstra算法--最短路径问题

本文借鉴于张广河教授主编的《数据结构》,对其中的代码进行了完善。从某源点到其余各顶点的最短路径Dijkstra算法可用于求解图中某源点到其余各顶点的最短路径。假设G={V,{E}}是含有n个顶点的有向图,以该图中顶点v为源点,使用Dijkstra算法求顶点v到图中其余各顶点的最短路径的基本思想如下:使用集合S记录已求得最短路径的终点,初始时S={v}。选择一条长度最小的最短路径,该路径的终点w属于V-S,将w并入S,并将该最短路径的长度记为Dw。对于V-S

系统 2019-09-27 17:53:14 1780

Python

python输入错误密码用户锁定实现方法

小编给大家带来了用python实现用户多次密码输入错误后,用户锁定的实现方式,以及具体的流程,让大家更好的理解运行的过程。1.新建一个文件,用以存放白名单用户(正确注册的用户格式:username:password),再建一个文件,用以存放黑名单用户(输入三次用户名均错误的用户)。2.读取白名单文件,将内容赋值给一个变量,并关闭。3.将变量以“:”分割,分割出得第一位(索引为0)赋值给username,第二位(索引为1)赋值给password。4.读取黑名

系统 2019-09-27 17:53:10 1780

Python

Python爬虫图片懒加载技术 selenium和PhantomJS解析

一.什么是图片懒加载?-案例分析:抓取站长素材http://sc.chinaz.com/中的图片数据#!/usr/bin/envpython#-*-coding:utf-8-*-importrequestsfromlxmlimportetreeif__name__=="__main__":url='http://sc.chinaz.com/tupian/gudianmeinvtupian.html'headers={'User-Agent':'Mozill

系统 2019-09-27 17:52:42 1780