在互联网出现之前,“抄”很不方便,一是“源”少,而是发布渠道少;而在互联网出现之后,“抄”变得很简单,铺天盖地的“源”源源不断,发布渠道也数不胜数,博客论坛甚至是自建网站,而爬虫还可以让“抄”完全自动化不费劲。这就导致了互联网上的“文章”重复性很高。这里的“文章”只新闻、博客等文字占据绝大部分内容的网页。中文新闻网站的“转载”(其实就是抄)现象非常严重,这种“转载”几乎是全文照抄,或改下标题,或是改下编辑姓名,或是文字个别字修改。所以,对新闻网页的去重很有
系统 2019-09-27 17:51:18 2286
1.9//2#向下取整0.01.9/2#不取整0.95importmathmath.floor(1/2)#向下取整0math.ceil(1/2)#向上取整round(0.3)#四舍五入0round(0.8)#四舍五入1round(1.22222,2)#保留2位小数1.22“”"从数学理论上来说,四舍五入,round(10.5,0)应该进位为11,但是到了python3.5的doc中,文档变成了"valuesareroundedtotheclosestmul
系统 2019-09-27 17:51:04 2286
MENU安装Python3(Windows操作系统环境)下载Python安装包安装Notepad++配置Notepad++的Python环境命令原理部分内容摘自百度经验安装Python3(Windows操作系统环境)下载Python安装包下载Python3.如图点击打开下载页面选择适合自己电脑版本的安装包一般就下载executableinstaller,x86表示是32位机子的,x86-64表示64位机子的。下载并打开安装包记得勾选AddPython3.6
系统 2019-09-27 17:50:55 2286
本文实例讲述了Python数学形态学。分享给大家供大家参考,具体如下:一原始随机图像1、代码importnumpyasnpimportmatplotlib.pyplotaspltsquare=np.zeros((32,32))#全0数组square[10:20,10:20]=1#把其中一部分设置为1x,y=(32*np.random.random((2,15))).astype(np.int)#随机位置square[x,y]=1#把随机位置设置为1plt.
系统 2019-09-27 17:50:26 2286
测试步骤1.导入unittest模块importunittest2.编写测试的类继承unittest.TestCaseclassTester(unittest.TestCase)3.编写测试的方法必须以test开头deftest_add(self)deftest_sub(self)4.使用TestCaseclass提供的方法测试功能点5.调用unittest.main()方法运行所有以test开头的方法复制代码代码如下:if__name__=='__mai
系统 2019-09-27 17:50:01 2286
一般情况下x,y,z=1,2,3print("x:",x)print("y:",y)print("z:",z)#运行结果x:1y:2z:3对元祖序列解包name=("qiaobushi","wanglihong","leibushi")x,y,z=nameprint(name)print("x:",x)print("y:",y)print("z:",z)#运行结果('qiaobushi','wanglihong','leibushi')x:qiaobush
系统 2019-09-27 17:48:57 2286
原文链接:https://www.cnblogs.com/bdhk/p/7506691.html枚举是绑定到唯一的常量值的一组符号名称(成员)。在枚举中,成员可以通过身份进行比较,枚举本身可以迭代。1.Enum模块该模块定义了四个枚举类,可用于定义唯一的名称和值集:Enum,IntEnum,Flag和IntFlag。它还定义了一个装饰器,unique()和一个helper,auto。ContentDescriptionRemarksclassenum.En
系统 2019-09-27 17:48:52 2286
在接口测试学习过程中,遇到了利用requests库进行文件下载和上传的问题。同样,在真正的测试过程中,我们不可避免的会遇到上传和下载的测试。文件上传:url=ztx.host+'upload/uploadFile?CSRFToken='+self.getCSRFToken()#上传文件的接口地址header={'User-Agent':'Mozilla/5.0(WindowsNT6.1;WOW64;Trident/7.0;rv:11.0)likeGecko
系统 2019-09-27 17:48:44 2286
转发:https://blog.csdn.net/qq_37482544/article/details/63720726
系统 2019-09-27 17:48:11 2286
importrefromurllib.requestimporturlopendefgetPage(url):response=urlopen(url)returnresponse.read().decode('utf-8')defparsePage(s):ret=re.findall('.*?.*?(?P\d+).*?(?P''.*?(?P.*?).*?(?P.*?)评价',s,re.S)returnretdefmain(num):url='https:
系统 2019-09-27 17:47:12 2286