前言关于python爬虫目前有两个主流的库一个是urllib和requests在python3中urllib2已经没有了,取而代之的是urllib.request。这里的话我将首先介绍urllib.request的使用。之后我再介绍request,我本人是打算做一个系列的爬虫教程不仅仅包括入门还有实战进阶所以我希望浏览我写的博客时可以按顺序浏览学习。那么废话不多说奉上名言成功没有偶然。即便有些胜利者谦虚地说,自己的成功是偶然的缘故。——尼采开始正片!!!u
系统 2019-09-27 17:57:27 2198
爬虫工作的三个基本步骤:爬取网页、解析内容、存储数据准备先安装爬取网页需要用到的第三方库:requests和bs4pipinstallrequestspipinstallbs4爬取网页#coding:UTF-8importrequestslink="http://www.santostang.com/"headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(K
系统 2019-09-27 17:57:02 2198
本文实例讲述了Python实现的ftp服务器功能。分享给大家供大家参考,具体如下:python具备强大的网络编程功能,而且代码简介,用简单的代码,就能实现一个功能强大的FTP服务器。我亲自测试了这个pythonftpserver.代码下载,在文章的末尾处,整个部署介绍如下:1.环境,python2.7.3,centos6.2.2.定义服务器ip,端口等信息,可以在下载的源码中查看listen_ip="192.168.4.128"#ftpserver的ip地
系统 2019-09-27 17:55:36 2198
简介生活中的日志是记录你生活的点点滴滴,让它把你内心的世界表露出来,更好的诠释自己的内心世界,而电脑里的日志是有价值的信息宝库。日志文件是专门用于记录系统操作事件的记录文件或文件集合,操作系统有操作系统日志文件,数据库系统有数据库系统日志文件,等等。系统日志文件是包含关于系统消息的文件,包括内核、服务、在系统上运行的应用程序等。不同的日志文件记载不同的信息。例如,有的是默认的系统日志文件,有的记载特定任务。在数据库中用事务日志文件记录数据的修改操作,其中的
系统 2019-09-27 17:55:34 2198
基础篇正则表达式在python中运用的非常多,因为他可以进行任意的匹配,可以匹配我们想要提取的信息。当我们接触正则的时候你就会知道正则的强大。正则有一个库re在一些工程中我们会经常调用正则的库来做与匹配相关的问题。字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用。正则表达式是一种用来匹配字符
系统 2019-09-27 17:55:32 2198
概述Python3中函数参数一般都是通过赋值进行传递的,而调用者只需要知道如何正确的传递参数即可直接使用函数,位置参数即我们使用最频繁的参数传递方法,通过参数的默认位置从左到右进行匹配deff(x,y,z):print(x,y,z)f(1,2,3)示例结果:123关键词参数我们可以通过函数参数关键字进行参数传递,此时参数的传递是通过变量名匹配,而不是位置的方式匹配,所以在我们在使用混合的基于位置的参数和基于关键字的参数传递的原则就是,先基于位置的参数从左到
系统 2019-09-27 17:55:29 2198
这里写自定义目录标题阅读目录urllib.request.urlopen()请求示例程序urlopen()提供的返回值方法urlopen()传递data参数urlopen()传递timeout参数阅读目录urllib是python内置的HTTP请求库,无需安装即可使用,它包含了4个模块:request:它是最基本的http请求模块,用来模拟发送请求error:异常处理模块,如果出现错误可以捕获这些异常parse:一个工具模块,提供了许多URL处理方法,如:
系统 2019-09-27 17:54:47 2198
很多企业开发语言从Python转向了Golang的原因因为原生Python的性能真的是太捉襟见肘了。单机运行计算型任务,速度慢是有目共睹的。IO型人物不涉及多线程(比如用协程)的还好,一旦涉及到多线程,立刻懵逼。比如,你开个Python线程,让它sleep5秒,再开第二个线程,随便算个fibonacci或者直接写个busyloop,你就会发现你的程序实际上会sleep6秒。想突破也不难,用pybinding11写c++,再用python调用。但都这样了
系统 2019-09-27 17:54:29 2198
(一)方法方法简单说明add_cookie(cookie_dict)在当前会话中添加cookie信息cookie_dict:字典,name和value是必须的delete_all_cookies()在当前会话中删除所有cookie信息delete_cookie(name)删除单个名为name的cookie信息get_cookie(name)返回单个名为name的cookie信息,如果没有找到,返回noneget_cookies()返回当前会话所有的cook
系统 2019-09-27 17:54:00 2198
Python中的is和==比较两个对象的两种方法在Python中有两种方式比较两个对象是否相等,分别是is和==,两者之间是不同的==比较的是值(如同java中的equals方法)is比较的是引用(可以看作比较内存地址,类似于java中的==)对于:>>>n=1>>>nis1True>>>b='1'>>>bis1False>>>n==bFalse由于1和'1'不管在值上面还是在引用上面都不同,所以结果都为false对于:>>>n=1>>>nis1True这
系统 2019-09-27 17:53:48 2198