- 军军小站|张军博客
搜索到与相关的文章
Python

python下wordpdf转换总结

近期涉及到了关于doc文档读取的处理,也查了很久,为了便于大家使用,故集大成一下。Doc文档读取有如下几种:1、从doc读取文本目前没有找到直接的方式,一般是先转为docx文件在处理。所使用工具为doc2doc(批量时可用),或人工另存处理。2、从docx读取文本一般使用python-docx库的方法,但只支持创建新文档和读取一些基本的文件数据,如文件大小和文件标题,不支持正文读取。或直接从docx中读取xml的方法。3、从pdf读取文本一般使用pdf

系统 2019-09-27 17:53:01 1860

Python

八大排序算法使用python实现

一、冒泡排序冒泡排序算法的运作如下:比较相邻的元素。如果第一个比第二个大,就交换他们两个。对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。针对所有的元素重复以上的步骤,除了最后一个。持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。以上节选自维基百科代码实现:defbubble_sort(numberlist):length=len(numberlist)foriinrange(lengt

系统 2019-09-27 17:52:52 1860

Python

Spark学习实例(Python):RDD、DataFrame、DataSet

在学习转换之前先了解以下它们的基本概念RDD:弹性分布式数据集,是一个只读分区集合DataFrame:以命名列方式组织的分布式数据集,概念上和关系型数据库的一张表一样DataSet:分布式数据集合,Python暂时不支持了解了基本的概念之后,接下来我们通过代码编写三种数据集的形成RDD的形成frompyspark.sqlimportSparkSessionif__name__=='__main__':spark=SparkSession\.builder\

系统 2019-09-27 17:52:31 1860

Python

为什么选择python编程语言入门黑客攻防 给你几个理由!

如果选择一门编程语言来入门黑客攻防的话,你觉得哪个最合适?不如来试试Python,或许会是一次很好的尝试哦~Python语言的优点目前,Python在各领域都有着广泛的应用。由此可见,作为一种编程开发语言,Python拥有众多优点,其语法简单易学且支持多种库,相同代码可以运行于多种平台。■易学易用学习一种新编程语言时,往往会遇到各种各样的问题。为了解决这些问题,Python语言做了大量努力。比如,Python中不必声明变量类型,而在运行时动态确定。此外,也

系统 2019-09-27 17:52:20 1860

Python

Python 元组操作总结

Python的元组和列表类似,不同之处在于元组中的元素不能修改(因此元组又称为只读列表),且元组使用小括号而列表使用中括号,如下:tup1=('physics','chemistry',1997,2000)tup2=(1,2,3,4,5,6)特别注意:1、元组中只包含一个元素时,需要在元素后面添加逗号来消除歧义tup1=(50,)2、元组中的元素值使不允许修改的,但可以对元组进行连接组合tup1=(12,34.56)tup2=('abc','xyz')tu

系统 2019-09-27 17:52:18 1860

Python

浅析Python与Mongodb数据库之间的操作方法

MongoDB是目前最流行的NoSQL数据库之一,使用的数据类型BSON(类似JSON)。1.安装Mongodb和pymongoMongodb的安装和配置Mongodb的安装教程请网上搜索,安装完成后,进行以下配置过程:1.1创建目录,该目录为Mongodb数据文件的存放目录:*注:本人使用的不是root用户,所以修改目录的拥有者.*sudomkdir/datasudochown-Rpython:python/datamkdir/data/db1.2分别执

系统 2019-09-27 17:52:16 1860

Python

Python基础之常用内置函数

python常用内置函数dir(__builtins__)#获取内置函数dir(random)#查看random中有哪些内置函数help(random.shuffle)#查看random.shuffle的用法id(a)#获取内存地址chr()#数字转为asciiord()#ascii转为数字isinstance(1,int)#判断1是否为int类型eval("1+1")#可以把字符串里的字符转换为可执行代码,但只支持一行。可以返回执行后得到的值,用于计算一

系统 2019-09-27 17:52:02 1860

Python

[转]Python 资源大全中文版

Python资源大全中文版原文链接:http://www.jianshu.com/p/9c6ae64a1bd7GitHub上有一个Awesome-XXX系列的资源整理,资源非常丰富,涉及面非常广。awesome-python是vinta发起维护的Python资源列表,内容包括:Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等。版权是https://github.com/jobbo

系统 2019-09-27 17:51:57 1860

Python

python获取未来和过去的时间

获取现在的时间用方法datetime.datetime.now().strftime('%F%T'),获取未来或者过去的时间可以用如下方法:#-*-coding:utf-8-*-importdatetimeif__name__=='__main__':print(datetime.datetime.now().strftime('%F%T'))print((datetime.datetime.now()-datetime.timedelta(days=1)

系统 2019-09-27 17:51:23 1860

Python

Python数据类型详解——字符串

Python数据类型详解——字符串一、定义字符串是一个有序的字符集合,用于存储和表示基本的文本信息,用''、""、''''''中间包含的内容称之为字符串创建:s='Helloworld!'二、特性按照从左到右的顺序定义字符集合,下标从0开始顺序访问,有序。可以进行切片操作不可变,字符串是不可变的,不能想列表一样修改其中某个元素,所有对字符串的修改操作都是相当与生成一份新的数据。字符串的单引号和双引号都无法取消特殊字符的含义,如果想让引号内所有的字符均取消特

系统 2019-09-27 17:51:12 1860