A:西米喜欢健身B:超超不爱健身,喜欢打游戏step1:分词A:西米/喜欢/健身B:超超/不/喜欢/健身,喜欢/打/游戏step2:列出两个句子的并集西米/喜欢/健身/超超/不/打/游戏step3:计算词频向量A:[1,1,1,0,0,0,0]B:[0,1,1,1,1,1,1]step4:计算余弦值余弦值越大,证明夹角越小,两个向量越相似。step5:python代码实现importjiebaimportjieba.analysedefwords2vec(
系统 2019-09-27 17:52:29 2102
思路一、想要实现登录豆瓣关键点分析真实post地址----寻找它的formdata,如下图,按浏览器的F12可以找到。实战操作实现:模拟登录豆瓣,验证码处理,登录到个人主页就算是success数据:没有抓取数据,此实战主要是模拟登录和处理验证码的学习。要是有需求要抓取数据,编写相关的抓取规则即可抓取内容。登录成功展示如图:spiders文件夹中DouBan.py主要代码如下:#-*-coding:utf-8-*-importscrapy,urllib,re
系统 2019-09-27 17:52:01 2102
最近学习《Python参考手册》学到Class部分,遇到了类的构造析构部分的问题:1、什么时候构造?2、什么时候析构?3、成员变量如何处理?4、Python中的共享成员函数如何访问?------------------------探索过程:1、经过查找,Python中没有专用的构造和析构函数,但是一般可以在__init__和__del__分别完成初始化和删除操作,可用这个替代构造和析构。还有一个__new__用来定制类的创建过程,不过需要一定的配置,此处不
系统 2019-09-27 17:51:55 2102
有时网页中会嵌套一个或者多个Frame,此时我们直接去找嵌套在Frame里面的元素会抛出异常,所以在操作的时候我们需要将页面焦点切换到Frame里面,下面我们就以一个实例演示一下!首先先创建三个html文件,文件代码如下:1)frameset.html2)frame_left.html3)frame_right.html4)frame_middle.html5)把这四个html文件放在同一个文件夹下<以下是python实现该逻辑的代码:importunit
系统 2019-09-27 17:50:57 2102
一、学好Python好就业:1、Linux运维。Linux运维是必须而且一定要掌握Python语言,Python可以满足Linux运维工程师的工作需求提升效率,总而提升自己的能力。用Python实现的测试工具及过程,包含服务器端、客户端、Web、Android、client端的自动化测试,自动化性能测试的执行、监控和分析,常用seleniumappium等框架。2、Python自动化测试。大家都知道,Python语言对测试的帮助是非常大的,掌握Python
系统 2019-09-27 17:49:55 2102
[TOC]一、队列queue队列:使用importqueue,用法与进程Queue一样实际上这里就是Python解释器中的一种数据结构中的类型——队列这里直接使用队列也可以。如果还要类似计数器的功能可以加上task_done和joinFIFO先进先出LIFO后进先出优先级队列二、先进先出(FIFO)classqueue.Queue(maxsize=0)###普通队列q=queue.Queue()###没有计数器进行阻塞FIFOq.put("first")q
系统 2019-09-27 17:49:51 2102
运行一下python代码自动创建pip/pip.ini文件并添加pip源"""python建立pip.ini.py2016年4月30日03:35:11codegay"""importosini="""[global]index-url=https://pypi.doubanio.com/simple/[install]trusted-host=pypi.doubanio.com"""pippath=os.environ["USERPROFILE"]+"\\
系统 2019-09-27 17:49:41 2102
Hmac模块其实这个模块类似hashlib模块,它能将一些重要的信息通过算法加密成密文,让信息更具有安全性。关于hmac加密算法的了解:它的全名是哈希运算消息认证码(Hash-basedMessageAuthenticationCode),HMAC利用hash算法,以一个消息M和一个秘钥K作为输入,生成一个定长的消息摘要作为输出。HMAC算法利用已有的hash函数,关键问题是如何使用秘钥。使用importhmac#这个模块和hashlib机制很相似h=hm
系统 2019-09-27 17:49:28 2102
1、Python函数函数是Python为了代码最大程度的重用和最小化代码冗余而提供的基本程序结构,用于将相关功能打包并参数化Python中可以创建4种函数:1)、全局函数:定义在模块中,每个模块都是一个全局作用域,因此,全局作用域的范围仅限于单个程序文2)、局部函数:嵌套在其它函数中3)、lambda函数:表达式4)、方法:与特定数据类型关联的函数表,并且只能与数据类型关联一起使用Python提供众多内置函数Python创建、改变、查找变量名都是在名称空间
系统 2019-09-27 17:49:01 2102
因为盘搜搜索出来的链接有很多已经失效了,影响找数据的效率,因此想到了用爬虫来过滤出有效的链接,顺便练练手~这是本次爬取的目标网址http://www.pansou.com,首先先搜索个python,之后打开开发者工具,可以发现这个链接下的json数据就是我们要爬取的数据了,把多余的参数去掉,剩下的链接格式为http://106.15.195.249:8011/search_new?q=python&p=1,q为搜索内容,p为页码以下是代码实现:import
系统 2019-09-27 17:48:14 2102