前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童鞋不要再走弯路。1.搜索引擎的选取选择一个好的搜索引擎意味着你能够得到更准确的搜索结果。我用过的搜索引擎有四种:Google、Bing、Baidu、Yahoo!。作为程序员,我首选Google。但当我看见我最爱的Google返回给我的全是一堆的js代码,根本没我想要的搜索结果。于是我转而投向了Bing的阵营,在用过一段
系统 2019-09-27 17:48:21 1882
#money=int(input('你有多少钱?'))#ifmoney>50:#print('打车回家')#b=input('到家了吗?')#ifb=='到家了':#print('我到家了阿')#else:#pass#please=input('你是男的还是女的?')#ifplease=='男的'orplease=='男':#print('你走吧')#elifplease=='美女':#age=int(input("今年多大拉?"))#ifint(age)
系统 2019-09-27 17:48:20 1882
推荐系统中经常需要处理类似user_id,item_id,rating这样的数据,其实就是数学里面的稀疏矩阵,scipy中提供了sparse模块来解决这个问题,但scipy.sparse有很多问题不太合用:1、不能很好的同时支持data[i,...]、data[...,j]、data[i,j]快速切片;2、由于数据保存在内存中,不能很好的支持海量数据处理。要支持data[i,...]、data[...,j]的快速切片,需要i或者j的数据集中存储;同时,为了
系统 2019-09-27 17:48:09 1882
在使用uliweb开发soapwebservice后,启动uliweb时,werkzeug的日志莫名其妙丢失了。正常的日志:复制代码代码如下:[INFO]*LoadingDebuggedApplication...[INFO]*Runningonhttp://localhost:8000/[INFO]*Restartingwithreloader[INFO]*LoadingDebuggedApplication...异常的日志:复制代码代码如下:[INFO
系统 2019-09-27 17:48:08 1882
有很久没有更新我的博客了,在学习flask去了,别人都说flask不难,其实现在我也这么觉得,但是在刚接触的时候还是有点吃力的。在学习的过程中查阅了不少,也了解了许多,今天想做个总结。。。以免觉得学了那么久什么都没学到,还有防止以后忘记。一.关于装饰器,路由最开始接触的时候觉得好神奇,只会照着敲不知道怎么自己用起来@app.route(‘/')defhello:print(‘hello')注意:1.只有@这个东西是固定的,app是可以换的,这与蓝本中的定义
系统 2019-09-27 17:48:05 1882
fromPILimportImage,ImageFont,ImageDrawdefCreateImg(text):fontSize=30liens=text.split('\n')print(len(liens))im=Image.new("RGB",(480,len(lines)*(fontSize+5)),(255,0,0))dr=ImageDraw.Draw(im)fontPath=r"C:\Windows\Fonts\STKAITI.TTF"#fo
系统 2019-09-27 17:48:05 1882
在类中每次实例化一个对象都会生产一个字典来保存一个对象的所有的实例属性,这样非常的有用处,可以使我们任意的去设置新的属性。每次实例化一个对象python都会分配一个固定大小内存的字典来保存属性,如果对象很多的情况下会浪费内存空间。可通过__slots__方法告诉python不要使用字典,而且只给一个固定集合的属性分配空间classFoo(object):__slots__=("x","y","z")def__init__(self,x,y):self.x=
系统 2019-09-27 17:47:50 1882
字节串bytes字节串也叫字节序列,是不可变的序列,存储以字节为单位的数据字节串表示方法:b"ABCD"b"\x41\x42"...字节串的构造函数:bytes()创建一个空的字节串,同b””bytes(整数可迭代对象)用可迭代对象创建一个字节串bytes(整数n)生成n个值为0的字节串bytes(字符串,encoding='utf-8')转码字节串的运算:同其他序列的运算+、+=、*、*=<、<=、>、>=、!=、==in/notin切片和索引函数:le
系统 2019-09-27 17:47:04 1882
1.简介在编写代码时,往往涉及时间、日期、时间戳的相互转换。2.示例#引入模块importtime,datetime2.1str类型的日期转换为时间戳#字符类型的时间tss1='2013-10-1023:40:00'#转为时间数组timeArray=time.strptime(tss1,"%Y-%m-%d%H:%M:%S")printtimeArray#timeArray可以调用tm_year等printtimeArray.tm_year#2013#转为时
系统 2019-09-27 17:46:52 1882
对Python中正则表达式的理解,主要就是对符号的理解,本文即对Python中常用的正则表达式符号进行简析。其主要的符号有:.默认匹配一个字符,不包含换行符,如果设置DOTALL则匹配换行符^匹配行首$匹配行尾*匹配0个或者多个重复+匹配一个或者多个重复?匹配一个或者零个重复*?,+?,??按照非贪婪模式匹配{m},{m,n},{m,n}?分别匹配m个重复,m至n个重复,m至n个重复按照非贪婪模式\转义[][abc],[a-z][^a-z]|或者匹配'a|
系统 2019-09-27 17:46:52 1882