一、在豆瓣网爬取以下图书的信息:二、参考代码:1、连接MongoDB数据库,并且创建数据库和表importpymongomyclient=pymongo.MongoClient("mongodb://127.0.0.1:27017/")db=myclient['webCrawler']#创建数据库webCrawlerdatatable=db['Book_info']#创建Book_info表2、爬取数据并且存储到数据库importreimportpanda
系统 2019-09-27 17:56:43 2969
详细:1.闵可夫斯基距离(MinkowskiDistance)2.欧氏距离(EuclideanDistance)3.曼哈顿距离(ManhattanDistance)4.切比雪夫距离(ChebyshevDistance)5.夹角余弦(Cosine)6.汉明距离(Hammingdistance)7.杰卡德相似系数(Jaccardsimilaritycoefficient)8.贝叶斯公式1.闵氏距离的定义:两个n维变量A(x11,x12,…,x1n)与B(x21
系统 2019-09-27 17:48:00 2967
一、最小二乘法先来解释几个概念拟合函数/估值函数:在回归问题中,当给定一组样本时,找到一个最佳的函数来匹配所有的样本,这个函数就是拟合函数/估值函数损失函数:判断函数拟合的好不好的函数,损失函数越小,说明拟合值与真实值越接近,误差越小,就越能用拟合函数来进行预测,损失函数的标准有以下几种:a)残差和:指拟合值与真实值的差的和,有正有负会存在抵消的情况,不能反应真实误差b)残差绝对值和:这个可以解决残差和有正有负的问题,但是绝对值在后续的求导会异常麻烦c)残
系统 2019-09-27 17:47:03 2967
【语音识别】之梅尔频率倒谱系数(mfcc)及Python实现一、mel滤波器二、mfcc特征Python实现语音识别系统的第一步是进行特征提取,mfcc是描述短时功率谱包络的一种特征,在语音识别系统中被广泛应用。一、mel滤波器每一段语音信号被分为多帧,每帧信号都对应一个频谱(通过FFT变换实现),频谱表示频率与信号能量之间的关系。mel滤波器是指多个带通滤波器,在mel频率中带通滤波器的通带是等宽的,但在赫兹(Hertz)频谱内mel滤波器在低频处较密集
系统 2019-09-27 17:55:46 2966
收集一些python的练习题,在追求应用的同时千万不要忘了基础的东西,我会不定期的总结一些我做过的小题目,大家一起进步!题目描述给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。解题一这道题拿过来首先很容易想到暴力解决没错我第一步也是这么干的,很容易想到两个循环进行判断,这个代码很容易看的懂,也很容易理解,不做多解释,但是这样运行的时间和所占内存都是非常大的。很不好的一种方法。classSol
系统 2019-09-27 17:56:22 2965
写了一段时间java切回写python偶尔会出现一些小麻烦,比如:在java中自定义对象变成json串很简单,调用一个方法就行,但同样的转换在python中却不太容易实现。在寻找python自定义对象转json串的过程中,接触到了猴子补丁这个东西,感觉还有点意思;本文先实现python自定义对象转json串,再简单谈一下猴子补丁。python自定义对象转json串python自带的json包不支持自定义对象转json串,在python中用json.dump
系统 2019-09-27 17:56:00 2965
pythonsocket.error:[Errno10054]远程主机强迫关闭了一个现有的连接。问题解决方案:前几天使用python读取网页。因为对一个网站大量的使用urlopen操作,所以会被那个网站认定为攻击行为。有时就不再允许下载。导致urlopen()后,request.read()一直卡死在那里。最后会抛出errno10054.这个错误是connectionresetbypeer.也就是传说的远端主机重置了此连接。原因可能是socket超时时间过
系统 2019-09-27 17:48:06 2962
在Python中使用字典,格式如下:dict={key1:value1,key2;value2...}在实际访问字典值时的使用格式如下:dict[key]多键值字典的多键值形式如下:dict={(ke11,key12):value,(key21,key22):value...}在实际访问字典里的值时的具体形式如下所示(以第一个键为例):dict[key11,key12]或者是:dict[(key11,key12)]以下是实际例子:多值在一个键值对应多个值时
系统 2019-09-27 17:37:53 2961
需求:一台机器上有多个网卡,如何访问指定的URL时使用指定的网卡发送数据呢?$curl--interfaceeth0www.baidu.com#curlinterface可以指定网卡阅读urllib.py的源码,追述到open_http�C>httplib.HTTP�C>httplib.HTTP._connection_class=HTTPConnectionHTTPConnection在创建的时候会指定一个source_address.HTTPConne
系统 2019-09-27 17:51:30 2960
3D图形需要的数据与等高线图基本相同:X、Y数据决定坐标点,Z轴数据决定X、Y坐标点对应的高度。与等高线图使用等高线来代表高度不同,3D图形将会以更直观的形式来表示高度。为了绘制3D图形,需要调用Axes3D对象的plot_surface()方法来完成。下面程序将使用与前面等高线图相同的数据来绘制3D图形,此时将看到程序会以更直观的形式来显示高度。上面程序开始准备了和前一个程序相同的数据,只是该程序将delta设置为0.125,这样可以避免生成太多的数据点
系统 2019-09-27 17:52:38 2958
参考链接:https://blog.csdn.net/yuanlulu/article/details/79017116从x86_64+ubuntu18.04+python3.5中importcv2(opencv4.1),遇到以下错误:ImportError:libSM.so.6:cannotopensharedobjectfile:NosuchfileordirectoryImportError:libXrender.so.1:cannotopensha
系统 2019-09-27 17:52:50 2956
print('------欢迎来到一次性的电话簿------')importpickledict1={}whileTrue:x=input('请输入要进行的操作:如:新建或修改为"1"、查询:"2"、删除"3":')#存储数据序列化字典withopen('addressbook.txt','ab+')asio1:pickle.dump(dict1,io1)#循环反序列化次数i=0whilei<50:#读取50次i+=1withopen('addressbo
系统 2019-09-27 17:46:17 2956
第一种方式:蜂鸣声importwinsound#系统音效winsound.Beep(300,500)#响铃:300频率,500持续时间第二种方式:音乐(wav格式或mp3格式)安装playsound库pipinstallplaysound运行示例:fromplaysoundimportplaysound#音频播放playsound('D:/myworkspace/JupyterNotebook/People/music/welcome.wav')plays
系统 2019-09-27 17:57:33 2952
importnumpyasnpIn[9]:#1创建一个长度为10的一维全为0的ndarray对象,然后让第5个元素等于1n=np.zeros(10)n[4]=1print(n)[0.0.0.0.1.0.0.0.0.0.]In[10]:#2创建一个元素为从10到49的ndarray对象np.arange(10,50)Out[10]:array([10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,
系统 2019-09-27 17:47:31 2952
转载自王晔的流水账http://wangye.org/blog/archives/629/代码上面应该没有什么问题,Python使用的是版本2.7,但是在运行的时候出现了异常错误UnicodeEncodeError:Traceback(mostrecentcalllast):File"makedb.py",line33,inmain()File"makedb.py",line30,inmainfp.write(row[1])UnicodeEncodeErr
系统 2019-09-27 17:08:14 2951