[TOC]Python网络爬虫之规则01Python爬虫之Requests库入门02Python爬虫之盗亦有道03Python爬虫之Requests网络爬取实战Python网络爬虫之提取04Python爬虫之BeautifulSoup库05Python爬虫之信息标记与提取方法06Python爬虫之Re(正则表达式)库
系统 2019-09-27 17:46:30 1993
本文代码运行于Win10+Python3.6.8,需要先下载并安装软件ImageMagick-7.0.8-59-Q16-x64-dll.exe。阅读原文
系统 2019-09-27 17:46:25 1993
前言关于python版本,我一开始看很多资料说python2比较好,因为很多库还不支持3,但是使用到现在为止觉得还是pythin3比较好用,因为编码什么的问题,觉得2还是没有3方便。而且在网上找到的2中的一些资料稍微改一下也还是可以用。好了,开始说爬百度百科的事。这里设定的需求是爬取北京地区n个景点的全部信息,n个景点的名称是在文件中给出的。没有用到api,只是单纯的爬网页信息。1、根据关键字获取url由于只需要爬取信息,而且不涉及交互,可以使用简单的方法
系统 2019-09-27 17:38:45 1993
首先,我们了解下什么是数据类型计算机顾名思义就是可以做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值。但是,计算机能处理的远不止数值,还可以处理文本、图形、音频、视频、网页等各种各样的数据,不同的数据,需要定义不同的数据类型。在Python中,能够直接处理的数据类型有以下几种:整数Python可以处理任意大小的整数,当然包括负整数,在程序中的表示方法和数学上的写法一模一样,例如:1,100,-8080,0,等等。计算机由于使用二进制,所以,有时
系统 2019-09-27 17:38:39 1993
Python实现截屏的函数#-*-coding:cp936-*-importtime,Imageimportos,win32gui,win32ui,win32con,win32apidefwindow_capture(dpath):'''''截屏函数,调用方法window_capture('d:\\'),参数为指定保存的目录返回图片文件名,文件名格式:日期.jpg如:2009328224853.jpg'''hwnd=0hwndDC=win32gui.Get
系统 2019-09-27 17:38:39 1993
四六级成绩查询网站我所知道的有两个:学信网(http://www.chsi.com.cn/cet/)和99宿舍(http://cet.99sushe.com/),这两个网站采用的都是动态网页。我使用的是学信网,好了,网站截图如下:网站的代码如下:准考证号:请输入15位准考证号姓名:姓名超过3个字,可只输入前3个由图中可以看出表单提交的链接为/cet/query,即:http://www.chsi.com.cn/cet/query,好了,填写表单和结果如下:
系统 2019-09-27 17:38:16 1993
1、安装scikit-learn1.1Scikit-learn依赖Python(>=2.6or>=3.3),NumPy(>=1.6.1),SciPy(>=0.9).分别查看上述三个依赖的版本,python-V结果:Python2.7.3python-c'importscipy;printscipy.version.version'scipy版本结果:0.9.0python-c"importnumpy;printnumpy.version.version"n
系统 2019-09-27 17:38:11 1993
配置好virtualenv和virtualenvwrapper后,使用pycharm创建新项目。之后要面临的问题就来了,之前一直使用的是sqlite作为开发数据库进行学习,按照之前看教程的原则,好像就是说开发环境要和生产环境尽量的一致,所以现在想尝试一下使用更有可能在生产环境部署的mysql数据库进行开发。本觉得是一件应该很轻松的事情,没想到遇到了一些麻烦根据一通百度,搜出来的方案大概有:MySQLdbmysql安装时候自带的connectorpymysq
系统 2019-09-27 17:37:58 1993
首先第一步,打开文件,有两个函数可供选择:open()和file()①.f=open('file.txt',‘w')...file.close()②.f=file('file.json','r')...file.close()#记得打开文件时最后不要忘记关闭!open()和file()都是Python的内建函数,返回一个文件对象,具有相同的功能,可以任意替换。使用语法为:f=open(fileName,access_mode='r',buffering=-
系统 2019-09-27 17:37:51 1993
需求背景最近为公司开发了一套邮件日报程序,邮件一般就是表格,图片,然后就是附件。附件一般都是默认写到txt文件里,但是PM希望邮件里的附件能直接用Excel这种软件打开,最开始想保存为Excel,但是一想Excel的文件体积会多出好多倍,csv文件默认也是使用Excel打开的,但是根本还是文本文件,体积小,保存也方便,于是最终决定使用csv模块来保存文件。Python写csv文件Python提供了内置模块读写csv文件,这里我只用到了写,读这里就不做介绍了
系统 2019-09-27 17:37:50 1993