上接《索引创建(3):DocumentWriter处理流程二》1.3.3第三车间——TermsHashPerField&FreqProxTermsWriterPerFieldTermsHashPerField和FreqProxTermsWriterPerField负责将token信息(字符串内容termTest,所在文档编号docID,所在文档中的位置position,所在文档中的词频frequence)添加到索引的Hash表结构(postingsHash
系统 2019-08-29 21:59:43 1763
这些日子在公司测试机顶盒游戏,每次启动游戏的时候都要在windows黑色的dos窗口输命令,非常不方便,于是借着自己刚学的一点点python+wxPython的知识,写了这个telnet客户端,功能比较简单,根据需要可以再作修改。界面用wxGlade生成,本来我不喜欢wxGlade的,觉得不是很好用,但用着用着发现其实还不错,生成的代码也很容易和自己的代码结合。输入指令的输入框有默认的指令提示,为了方便写了个COMMAND指令列表,这是公司里用的,可以在源
系统 2019-08-12 09:30:17 1763
在帮朋友解决这个问题后,随便记录一下这三种方法:第一种方法:使用正则表达式:因为当时的要求是判定10.0.0.1到10.255.255.255,原理其实是一样。这里简单回顾一下正则表达式模式的内容:常见的如:\d可以表示0~9的任意一个数字字符而\D是匹配一个非数字字符等价于^^是匹配字符串的开头,但放在[]中表示匹配不在[]中的字符$是匹配字符串的末尾.是匹配除了换行符任意字符{}表示重复几次,例如:^a{2,4}$aa,aaa或aaaa|的是或的意思[
系统 2019-09-27 17:55:59 1762
这篇文章将解除你使用python的pipinstallxxx受到的网速限制,如果只是下载较小的第三方库,可以尝试pip--default-timeout=100install-Uxxx。一、Windows找到python安装目录下的:\Lib\site-packages\pip\models\index.py文件,将PYPI的值改为你所需要的镜像源即可,例如改为豆瓣镜像源:#PyPI=Index('https://pypi.python.org/')PyP
系统 2019-09-27 17:55:57 1762
立即学习:https://edu.csdn.net/course/play/24797/282153来自edu.csdn.net的第一篇笔记,Python行业分析与课程简介
系统 2019-09-27 17:55:12 1762
用Python来编写网站,必须要能够通过python操作数据库,所谓操作数据库,就是通过python实现对数据的连接,以及对记录、字段的各种操作。上一讲提到的那种操作方式,是看官直接通过交互模式来操作数据库。安装python-MySQLdb要想通过python来操作数据库,还需要在已经安装了mysql的基础上安装一个称之为mysqldb的库,它是一个接口程序,python通过它对mysql数据实现各种操作。在编程中,会遇到很多类似的接口程序,通过接口程序对
系统 2019-09-27 17:54:55 1762
1.目的每天上班,工作需要,电脑上需要每天开机启动一些软件,下班时候,需要关掉一些软件。一个一个打开和关闭貌似是很繁琐的,于是乎,这个脚本产生了。2.环境系统环境:-win7-32位-python2.7.9你还需要安装pywin32。pipinstallpywin323.编写脚本启动应用程序脚本#coding=utf-8importwin32api#日报软件启动win32api.ShellExecute(0,'open',r'C:\ProgramFiles
系统 2019-09-27 17:53:58 1762
代码如下fromfake_useragentimportUserAgentfromlxmlimportetreeimportrequests,osimporttime,re,datetimeimportbase64,json,pymysqlfromfontTools.ttLibimportTTFontua=UserAgent()classCustomException(Exception):def__init__(self,status,msg):self
系统 2019-09-27 17:53:51 1762
Python数据科学入门DmitryZinoviev著熊子源译第三章使用文本数据第13单元处理HTML文件Beautifulsoup通过Python字典接口实现对HTML标签属性的访问。如果标签对象t表示超链接,则超链接目标的字符串值为t[“herf”].string。HTML标签是不区分大小写的。Soup最有用的函数:soup.find()找到目标的一个实例soup.find_all()找到目标的所有实例HTML\XML之所以强大,是因为有多样化的功能,
系统 2019-09-27 17:53:41 1762
模块:模块就是一个python文件。模块就是一个python文件。功能:1.可以提高文件的重复利用率。提高开发效率2.用于划分程序结构。自定义模块:模块就是一个python文件而已,所有python代码都可以放入模块,实际开发中,模块放入的内容都是重复利用率高的内容主要包含:1.为当前模块专门定义的变量【其他语言一般都是常量】2.函数。3.类4.测试代码注意:模块的命名不要和内置模块重名!测试代码统一放到判断当中if__name__=='__main__'
系统 2019-09-27 17:53:19 1762