前言上项目的时候,遇见一次需求,需要把在线的其中一个collection里面的数据迁移到另外一个collection下,于是就百度了看到好多文章,其中大部分都是使用导入的方法,没有找到在线数据的迁移方法。于是写了python脚本,分享出来。思路:collection数据量比较大,所以一次性操作所有数据太大,于是分段执行操作。先分段按1000条数据量进行查询,处理成json数据把处理后的json数据发送到目的collection上即可实现:一、使用http的
系统 2019-09-27 17:52:33 2144
问题:用两个栈来实现一个队列,完成队列的Push和Pop操作。分析:栈的特性是“先进后出”,队列为“先进先出”。思路:入队:直接把新元素压入stack1即可。出队:根据队列先进先出的性质,由于先进入队列的元素被压倒stack1的栈底,要想实现先入队列的先出队,需要将stack1中的元素逐个弹出并压入stack2,经过弹出和压入之后最先进入的元素就处于stack2的栈顶,有可以直接弹出。python实现代码:classSolution:def__init__
系统 2019-09-27 17:52:27 2144
阅读更多本文分享自6丁一的猫的博客,主要是python调用hanlp进行命名实体识别的方法介绍。以下为分享的全文。1、python与jdk版本位数一致2、pipinstalljpype1(python3.5)3、类库hanlp.jar包、模型data包、配置文件hanlp.properties放在一个新建目录4、修改hanlp.properties中root根目录,找到data代码调用如下:1|#coding:utf-82|'''3|Createdon20
系统 2019-09-27 17:52:23 2144
来自:Python编程与实战(微信号:pthon1024),作者:Jerryning没有办法转,整个复制下来了本文要点字符串拼接拆分含有多种分隔符的字符串判读字符串a是否以字符串b开头或结尾调整字符串中文本的格式对字符串进行左,右,居中对齐删除字符串中不需要的字符字符串拼接实际场景:把列表中的数据拼接成一个字符串解决方案:使用str.join()方法>>>li=['cxk','cxk','kk','caibi']>>>''.join([str(i)fori
系统 2019-09-27 17:52:00 2144
for我们先来看一下for语句的格式:foriinrange(0,5):print(i)其中range相当于一个迭代器。我们可以这么尝试:print(list(range(0,5)))输出很简单了,就是01234当然了这里的迭代器可以用自己的list比如:cgg=["cgg","cgg1","cgg2"]foriincgg:print(i)输出结果就是三个字符串以此输出。while循环语句当然少不了while了先来看看while的格式:whilecgg<1
系统 2019-09-27 17:51:52 2144
python安装教程,分享给大家。一、安装python1、首先进入网站下载:点击打开链接(或自己输入网址),进入之后如下图,选择图中红色圈中区域进行下载。2、下载完成后如下图所示3、双击exe文件进行安装,如下图,并按照圈中区域进行设置,切记要勾选打钩的框,然后再点击Customizeinstallation进入到下一步:4、对于上图中,可以通过Browse进行自定义安装路径,也可以直接点击Install进行安装,点击install后便可以完成安装了。5、
系统 2019-09-27 17:51:44 2144
到今日,已经去到python的第5课了,是不是很激动,已经对Python产生兴趣了,感觉python人家说胶水语言,比其他语言都简单,我还是觉得学习python再去学其他可能会更加高效。今日我们来学习列表和字典。这2个东西跟之前说的3数据类型有什么区别(字符串,整数int,浮点数float)有什么关系?这个还真是别疑惑。我们从变量这块去说吧。name="samly71"####这个name赋值字符串samly71这串;number=111####numbe
系统 2019-09-27 17:51:24 2144
这里给大家分享几个面试时遇到的趣味性比较浓厚的题目,答案呢也是个人的理解,不足的地方,还望大家指出!1、25匹马,有一条只能5匹马比赛的赛道,我们无法计时,只能看到马的排名,如何用最短的次数找出跑的最快的5匹马?这道题目的话最好的情况是7次,最坏的情况是10次。我们首先建立一个表格,先把25匹马分为如下的五组:每组进行比赛,假设第一组快慢顺序为A1、A2、A3、A4和A5,第二组依次类推。那么各组的第一分别是A1、B1、C1、D1、E1。在最好的情况下,先
系统 2019-09-27 17:50:54 2144
。。。。。。刚看到时,我有一点肤浅的吃惊:python都已经没了明确的数据类型概念,竟然还有类。好了,请忽略我的无知。下面我们来看知识点。类的定义首先是类的定义:classname:pass我们能看一下格式,首先是一个普通的class,然后是我们类的名字,冒号后则是类的具体内容。而这里的pass并不是我随便写的,而是有含义的。当我们创建了一个空的类或方法,并且一时半会不想设计它的内容,我们就需要为其加上一个pass来告诉编译器,这是一个空的类或函数。继承p
系统 2019-09-27 17:50:39 2144
事情是这样的,我写了一个tornado的服务,过程当中我用logging记录一些内容,由于一开始并没有仔细观察tornado自已的日志管理,所以我就一般用debug来记录普通日志,error记录有问题的日志,但是当服务跑起来以后才发现,tornado的访问日志的级别是info,也就是20,debug是10的,所以如果我定义了日志的级别是debug,那么默认情况下肯定也会输出到日志文件中的。但是我现在并不关心访问日志,而且由于我这个服务可能每时每刻都会有访问
系统 2019-09-27 17:50:30 2144