- 军军小站|张军博客
搜索到与相关的文章
Python

Python实现的文轩网爬虫完整示例

本文实例讲述了Python实现的文轩网爬虫。分享给大家供大家参考,具体如下:encoding=utf8importpymysqlimporttimeimportsysimportrequestsimportos#捕获错误importtracebackimporttypes#将html实体化importcgiimportwarningsreload(sys)sys.setdefaultencoding('utf-8')frompyqueryimportPyQ

系统 2019-09-27 17:55:19 1828

Python

Python3之数据指纹MD5校验与对比

MD5消息摘要算法(英语:MD5Message-DigestAlgorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hashvalue),用于确保信息传输完整一致。MD5由美国密码学家罗纳德·李维斯特(RonaldLinnRivest)设计,于1992年公开,用以取代MD4算法。概述MD5校验码通过散列函数计算而成,可以生成任何数据的数据“指纹”,即我们可以利用MD5将消息或者数据压缩成摘要,是的数据量变小,便于比较

系统 2019-09-27 17:54:19 1828

Python

Python+sklearn机器学习应该了解的33个基本概念

机器学习(MachineLearning)根据已知数据来不断学习和积累经验,然后总结出规律并尝试预测未知数据的属性,是一门综合性非常强的多领域交叉学科,涉及线性代数、概率论、逼近论、凸分析、算法复杂度理论等多门学科。目前机器学习已经有了十分广泛的应用,例如数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。总体上说,机器学习算法和问题可以分为有监督学习和无

系统 2019-09-27 17:53:49 1828

Python

33关Python游戏,测试你的爬虫能力到底及格不?

作者|苏克1900责编|胡巍巍转载自高级农民工(ID:Mocun6)最近在网上看到一个非常有意思的Python游戏通关网站,一共有33关,每一关都需要利用Python知识解题找到答案,然后进入下一关。很考验对Python的综合掌握能力,比如有的闯关需要用到正则表达式,有的要用到爬虫。我们平常学Python都是按章节顺序、包或者模块来学,容易前学后忘。正好可以拿这个网站来综合测试一下对Python的掌握情况,以便查缺补漏。来说说这个网站怎么玩。mark这是网

系统 2019-09-27 17:53:08 1828

Python

详解Python核心编程中的浅拷贝与深拷贝

一、问题引出浅拷贝首先看下面代码的执行情况:a=[1,2,3]print('a=%s'%a)#a=[1,2,3]b=aprint('b=%s'%b)#b=[1,2,3]a.append(4)#对a进行修改print('a=%s'%a)#a=[1,2,3,4]print('b=%s'%b)#b=[1,2,3,4]b.append(5)#对b进行修改print('a=%s'%a)#a=[1,2,3,4,5]print('b=%s'%b)#b=[1,2,3,4,

系统 2019-09-27 17:52:42 1828

Python

python之yield和Generator深入解析

首先我们从一个小程序导入,各定一个list,找出其中的素数,我们会这样写importmathdefis_Prims(number):ifnumber==2:returnTrue//除2以外的所有偶数都不是素数elifnumber%2==0:returnFalse//如果一个数能被除1和本身之外的数整除,则为合数。其实我们的判定范围到根号n就可以forcurinrange(2,int(math.sqrt(number))+1,2):ifnumber%cur=

系统 2019-09-27 17:52:34 1828

Python

python--使用两个栈实现队列

问题:用两个栈来实现一个队列,完成队列的Push和Pop操作。分析:栈的特性是“先进后出”,队列为“先进先出”。思路:入队:直接把新元素压入stack1即可。出队:根据队列先进先出的性质,由于先进入队列的元素被压倒stack1的栈底,要想实现先入队列的先出队,需要将stack1中的元素逐个弹出并压入stack2,经过弹出和压入之后最先进入的元素就处于stack2的栈顶,有可以直接弹出。python实现代码:classSolution:def__init__

系统 2019-09-27 17:52:27 1828

Python

python之psutil模块

#/usr/bin/envpython#coding:utf-8#进程检测程序importosimportpsutilimportdatetime#获取用户输入的PID#获取pid对应的应用名p=psutil.Process(os.getpid())print('Processname:%s'%p.name())#获取进程bin路径print('Processbinpath:%s'%p.exe())#获取pid对应的路径print('Processpath

系统 2019-09-27 17:50:43 1828

Python

简单介绍Python中的JSON模块

(一)什么是json:JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLanguage,StandardECMA-2623rdEdition-December1999的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C,C++,C#,Java,JavaScript,Perl,Python

系统 2019-09-27 17:50:34 1828

Python

python中update的基本使用方法详解

前言Python字典update()方法用于更新字典中的键/值对,可以修改存在的键对应的值,也可以添加新的键/值对到字典中。语法格式d.update(e)参数说明将e中键-值对添加到字典d中,e可能是字典,也可能是键-值对序列。详见实例。返回值该方法没有任何返回值。实例以下实例展示了update()方法的使用方法:d={‘one':1,'two':2}d.update({‘three':3,'four':4})#传一个字典print(d)d.update(

系统 2019-09-27 17:50:31 1828