- 军军小站|张军博客
搜索到与相关的文章
Python

Python爬虫包 BeautifulSoup 递归抓取实例详解

Python爬虫包BeautifulSoup递归抓取实例详解概要:爬虫的主要目的就是为了沿着网络抓取需要的内容。它们的本质是一种递归的过程。它们首先需要获得网页的内容,然后分析页面内容并找到另一个URL,然后获得这个URL的页面内容,不断重复这一个过程。让我们以维基百科为一个例子。我们想要将维基百科中凯文・贝肯词条里所有指向别的词条的链接提取出来。#-*-coding:utf-8-*-#@Author:HaonanWu#@Date:2016-12-2510

系统 2019-09-27 17:56:47 1782

Python

python获取当前运行函数名称的方法实例代码

python获取当前运行函数名称的方法实例代码摘要:c/c++中获取函数所在源码名,函数名和行号的方法很简单__FILE__,__FUNCTION__和__LINE__python没有这种语法,但也可以通过某种方法得到,这里给出例子,使用异常信息得到【可能会损失性能】直接贴代码[可参考python核心编程4.4]#获取调用该函数所在(被调用)的函数名#author:peterguo@vip.qq.comdefget_func_name():importsy

系统 2019-09-27 17:56:14 1782

Python

python字典嵌套字典的情况下找到某个key的value详解

最近在用python写接口的测试程序,期间用到解析字典获取某个key的value,由于多个接口返回的字典格式不是固定的并存在多层嵌套的情况。在字典的方法中也没有找到可直接达到目的的方法(也可能是我对字典的方法了解的不深的缘故),于是自己写了个程序。下面是代码#coding:utf-8importtypes#获取字典中的objkey对应的值,适用于字典嵌套#dict:字典#objkey:目标key#default:找不到时返回的默认值defdict_get(

系统 2019-09-27 17:55:32 1782

Python

Python单元测试工具doctest和unittest使用解析

Python标准库包含两个测试工具。doctest:一个简单的模块,为检查文档而设计,但也适合用来编写单元测试。unittest:一个通用的测试框架。一、使用doctest进行单元测试创建文件mymath.py,内容defsquare(x):'''计算平方并返回结果(下面是单元测试的格式)>>>square(2)>>>square(3)'''returnx*xif__name__=='__main__':importdoctest,mymathdoctes

系统 2019-09-27 17:54:39 1782

Python

python将类似json的数据存储到MySQL中的实例

由于之前对于爬取下来的数据都是存入MongoDB中,想起来还没有尝试存入MySQL,于是将一篇简单的文章爬取下来,存入MySQL试试这里用到的python模块是pymysql,因为MySQLdb之前已经停止维护首先在cmd中连接MySQL并且创建一个数据库json在图形化界面workbench中可以看到接下来就要在pycharm中写代码了,在pycharm中导入pymysql后即可#建立python与MySQL之间的连接mysql=pymysql.conn

系统 2019-09-27 17:53:26 1782

Python

python 读写文件 r r+ w w+ a a+

模式参数的说明:r:以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。r+:打开一个文件用于读写。文件指针将会放在文件的开头。w:打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。w+:打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。a:打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。

系统 2019-09-27 17:52:46 1782

Python

python2 与python3的print区别小结

在Python2和Python3中都提供print()方法来打印信息,但两个版本间的print稍微有差异主要体现在以下几个方面:1.python3中print是一个内置函数,有多个参数,而python2中print是一个语法结构;2.Python2打印时可以不加括号:print'helloworld',Python3则需要加括号print("helloworld")3.Python2中,input要求输入的字符串必须要加引号,为了避免读取非字符串类型发生的

系统 2019-09-27 17:52:34 1782

Python

详解DeBug Python神级工具PySnooper

PySnooper在GitHub上自嘲是一个“乞丐版”调试工具(poorman'sdebugger)。一般情况下,在编写Python代码时,如果想弄清楚为什么Python代码没有按照预期执行、哪些代码在运行哪些没在运行、局部变量又是什么,我们会使用包含断点和观察模式等功能的调试器,或者直接使用print语句打印出来。但上面的方法都比较麻烦,例如使用调试器需要进行繁琐的设置,使用print打印也要很仔细。与它们相比,使用PySnooper只需为要调试的函数添

系统 2019-09-27 17:50:04 1782

Python

利用Python中的输入和输出功能进行读取和写入的教程

读取、写入和Python编写程序的最后一个基本步骤就是从文件读取数据和把数据写入文件。阅读完这篇文章之后,可以在自己的to-do列表中加上检验这个技能学习效果的任务。简单输出贯穿整个系列,一直用print语句写入(输出)数据,它默认把表达式作为string写到屏幕上(或控制台窗口上)。清单1演示了这一点。清单1重复了第一个Python程序“Hello,World!”,但是做了一些小的调整。清单1.简单输出>>>print"HelloWorld!"Hello

系统 2019-09-27 17:49:42 1782

Python

用Python中的wxPython实现最基本的浏览器功能

通常,大多数应用程序通过保持HTML简单来解决大多数浏览器问题�D或者说,根据最低共同特性来编写。然而,即便如此,也仍然存在字体和布局的问题,发行新浏览器和升级现有浏览器时,也免不了测试应用程序的痛苦。替代方案�D只支持一种浏览器�D通常不是一种用户友好的解决方案。明显的解决方案是在应用程序中嵌入自己的表现HTML的窗口构件。当然,从头开始编写这样的窗口构件工作量很大,因此,求助于预先封装的解决方案好象是合理的。商界有许多选择及几个开放源码软件包。本文将向

系统 2019-09-27 17:49:37 1782