SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。MIT许可下发行。其github主页我自己修改了上文链接中的python代码
系统 2019-09-27 17:54:43 2221
本文实例讲述了python3.6编写的单元测试。分享给大家供大家参考,具体如下:使用python3.6编写一个单元测试demo,例如:对学生Student类编写一个简单的单元测试。1、编写Student类:#!/usr/bin/envpython3#-*-coding:utf-8-*-classStudent(object):def__init__(self,name,score):self.name=nameself.score=scoredefget_
系统 2019-09-27 17:54:24 2221
多路复用IO(IOmultiplexing)这种IO方式为事件驱动IO(eventdrivenIO)。我们都知道,select/epoll的好处就在于单个进程process就可以同时处理多个网络连接的IO。它的基本原理就是select/epoll这个function会不断的轮询所负责的所有socket,当某个socket有数据到达了,就通知用户进程。它的流程如图:select是多路复用的一种当用户进程调用了select,那么整个进程会被block,而同时,
系统 2019-09-27 17:52:57 2221
首先需要安装itchat库,可以pipinstallitchat安装,也可以在pycharm里安装#-*-coding:utf-8-*-__author__="MuT6Sch01aR"importitchatdefget_friends():friends=itchat.get_friends(update=True)#获取微信好友列表,如果设置update=True将从服务器刷新列表foriinfriends:print(i)defmain():itch
系统 2019-09-27 17:51:50 2221
Python语言的初学者,特别是"惊奇者"(也就是那种第一眼就被毫无意义的某些特性吸引,之后持续说服自己的人)认为Python不需要C语言的for语句,因为他们能用优雅的Pythonfor来代替类C的for.Cpy的循环方式:复制代码代码如下:for(i=s;i}Python的循环方式:复制代码代码如下:foriinrange(num)[s:e:step]:最近,我写了一个循环100000000遍的代码,不幸的是(也正是所预计的),Python把机器内存吃
系统 2019-09-27 17:51:24 2221
首先是数据源:#需要求加权平均值的数据列表elements=[]#对应的权值列表weights=[]使用numpy直接求:importnumpyasnpnp.average(elements,weights=weights)附纯python写法:#不使用numpy写法1round(sum([elements[i]*weights[i]foriinrange(n)])/sum(weights),1)#不使用numpy写法2round(sum([j[0]*j[
系统 2019-09-27 17:50:32 2221
相信很多小伙伴平时写python的时候都是需要调试程序的,出问题了,需要了解函数内部是怎么跑的,而这个时候很多人都会想到在疑惑的地方使用print函数来打印一下参数来调试。虽然用print也是不失为是一种方法,但是有时如果疑惑的地方多就要每个地方都要加print,这样就显得比较麻烦了。今天发现在Github开源了一个神器,可以清楚让你清楚了解函数内部的运行以及参数值的变化,PySnooper,项目地址:https://github.com/cool-RR/
系统 2019-09-27 17:50:04 2221
本文实例讲述了Pythonflask框架post接口调用。分享给大家供大家参考,具体如下:fromflaskimportFlask,render_template,requestapp=Flask(__name__)@app.route("/login",methods=['POST','GET'])deflogin():ifrequest.method=="POST":username=request.form.get('username')passwo
系统 2019-09-27 17:50:02 2221
1.什么是FM?FM即FactorMachine,因子分解机。2.为什么需要FM?1、特征组合是许多机器学习建模过程中遇到的问题,如果对特征直接建模,很有可能会忽略掉特征与特征之间的关联信息,因此,可以通过构建新的交叉特征这一特征组合方式提高模型的效果。2、高维的稀疏矩阵是实际工程中常见的问题,并直接会导致计算量过大,特征权值更新缓慢。试想一个10000*100的表,每一列都有8种元素,经过one-hot独热编码之后,会产生一个10000*800的表。因此
系统 2019-09-27 17:48:36 2221
本文实例讲述了python实现爬虫抓取小说功能。分享给大家供大家参考,具体如下:#-*-coding:utf-8-*-frombs4importBeautifulSoupfromurllibimportrequestimportreimportos,time#访问url,返回html页面defget_html(url):req=request.Request(url)req.add_header('User-Agent','Mozilla/5.0')res
系统 2019-09-27 17:47:40 2221