Python

Python网络爬虫与信息提取——正则表达式

Python网络爬虫与信息提取——正则表达式正则表达式的语法正则表达式的常用操作符操作符说明实例.表示任何单个字符[]字符集,对单个字符给出取值范围[abc]表示a、b、c,[a-z]表示a到z单个字符[^]非字符集,对单个字符给出排除范围[^abc]表示非a或b或c的单个字符*前一个字符0次或无限次扩展abc*表示ab、abc、abcc、abccc等+前一个字符1次或无限次扩展abc+表示abc、abcc、abccc等?前一个字符0次或1次扩展abc?表

系统 2019-09-27 17:46:58 2465

Python

bat和python批量重命名文件的实现代码

最近从某网站下载了一批文档,但是文件是用数字串命名的文档(很多图书馆都这样吧),现在我也下载完了这些文件,也有这些文件的列表,就是不能一个一个的把文件给重命名吧所以从网上找了这几个脚本。一、使用bat脚本(windows系统默认可用)打开记事本,将这些代码写入记事本,另存为xx.bat文件(注意后缀名,很多小白保存成了xx.bat.txt,因为txt是隐藏的,以为不行)@echoofffor/r“d:\pdf”%%ain(*.pdf)do(for/f“to

系统 2019-09-27 17:38:41 2465

Python

收集的几个Python小技巧分享

获得当前机器的名字:复制代码代码如下:defhostname():sys=os.nameifsys=='nt':hostname=os.getenv('computername')returnhostnameelifsys=='posix':host=os.popen('echo$HOSTNAME')try:hostname=host.read()returnhostnamefinally:host.close()else:return'Unkwonhos

系统 2019-09-27 17:38:03 2465

Python

python 在某.py文件中调用其他.py内的函数的方法

假设名为A.py的文件需要调用B.py文件内的C(x,y)函数假如在同一目录下,则只需importBif__name__=="__main__":B.C(x,y)若只需调用单个函数,也可以fromBimportCif__name__=="__main__":C(x,y)若A.py和B.py位于不同的目录下,可以用以下方法(假设B.py位于D盘的根目录下)1.引用所在路径importsyssys.path.append('D:/')importBif__na

系统 2019-09-27 17:56:22 2464

Python

005 Python的IDE之Pycharm的使用

一、为什么用IDE(Python集成开发环境-Pycharm)到现在为止,我们也是写过代码的人啦,但你有没有发现,每次写代码要新建文件、写完保存时还要选择存放地点,执行时还要切换到命令行调用python解释器,好麻烦呀,能否一气呵成,让我简单的写代码?此时开发工具IDE上场啦,一个好的IDE能帮你大大提升开发效率。很多语言都有比较流行的开发工具,比如JAVA的Eclipse,C#,C++的VisualStudio,Python的是啥呢?Pycharm和Ju

系统 2019-09-27 17:55:55 2464

Python

python开启debug模式的方法

python开启debug模式的代码如下所示:importrequestssession=requests.session()importloggingimportrequestslogging.basicConfig(level=logging.DEBUG,format='%(asctime)s%(filename)s[line:%(lineno)d]%(levelname)s%(message)s',datefmt='%a,%d%b%Y%H:%M:%S

系统 2019-09-27 17:54:59 2464

Python

抖音爬虫python(来自github)非原创

#-*-coding:utf-8-*-importosimportsysimportgetoptimporturllib.parseimporturllib.requestfromurllib.parseimporturlencodeimportcopyimportcodecsimportrequestsimportrefromsix.movesimportqueueasQueuefromthreadingimportThreadimportjsonimp

系统 2019-09-27 17:51:14 2464

Python

基数排序(python)

10.基数排序10.1算法思想基数排序是对桶排序的扩展。第一类:最低位优先法,简称LSD法:先从最低位开始排序,再对次低位排序,直到对最高位排序后得到一个有序序列;第二类:最高位优先法,简称MSD法:先从最高位开始排序,再逐个对各分组按次高位进行子排序,循环直到最低位。(位没有数的话,补0)这里以LSD为例,由于待排序元素每一位上的数字的取值范围是0—9,因此每按照某一位,需要10个桶,这样每一位上相同的数字会分配到一个桶里。10.2算法过程假设有一未排序

系统 2019-09-27 17:49:44 2464

Python

Python编程中的文件操作攻略

open函数你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的辅助方法才可以调用它进行读写。语法:fileobject=open(file_name[,access_mode][,buffering])各个参数的细节如下:file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这

系统 2019-09-27 17:45:46 2464

Python

决策树⑤——Python代码实现决策树

决策树①——信息熵&信息增益&基尼系数决策树②——决策树算法原理(ID3,C4.5,CART)决策树③——决策树参数介绍(分类和回归)决策树④——决策树Sklearn调参(GridSearchCV调参及过程做图)决策树应用实例①——泰坦尼克号分类决策树应用实例②——用户流失预测模型决策树应用实例③——银行借贷模型上一篇总结了Sklearn库用GridSearchCV调参的过程,今天用python依据现代女生的审美创建一颗简单的决策树,看下是否能代表大众的心

系统 2019-09-27 17:45:44 2464

Python

Python依赖库版本备份以及虚拟环境的搭建

生成依赖文件命令:pipfreeze>requirements.txt安装依赖文件命令:pipinstall-rrequirements.txt最好在虚拟环境下生成依赖文件,否则会生成全局的依赖anaconda虚拟环境的搭建:anaconda创建虚拟环境命令:condacreate-nyour_env_namepython=X.X虚拟环境激活命令:Linux:sourceactivateyour_env_namewindows:activateyour_e

系统 2019-09-27 17:57:27 2463

Python

一文总结数据科学家常用的Python库(上)

点击上方“Datawhale”,选择“星标”公众号第一时间获取价值内容概述这篇文章中,我们挑选了24个用于数据科学的Python库。这些库有着不同的数据科学功能,例如数据收集,数据清理,数据探索,建模等,接下来我们会分类介绍。您觉得我们还应该包含哪些Python库?让我们知道!介绍我是Python语言的忠实粉丝,它是我在数据科学方面学到的第一门编程语言。Python有三个特点:它的易用性和灵活性全行业的接受度:它是业内最流行的数据科学语言用于数据科学的庞大

系统 2019-09-27 17:57:18 2463

Python

使用Python实现图像标记点的坐标输出功能

Sometimeswehaveneedtointeractwithanapplication,forexamplebymarkingpointsinanimage,oryouneedtoannotationsometrainingdata.PyLabcomeswithasimplefunctionginput()thelet'syoudojustthat.Here'sashortexample.fromPILimportImagefrompylabimpo

系统 2019-09-27 17:57:02 2463

Python

Python下的Softmax回归函数的实现方法(推荐)

Softmax回归函数是用于将分类结果归一化。但它不同于一般的按照比例归一化的方法,它通过对数变换来进行归一化,这样实现了较大的值在归一化过程中收益更多的情况。Softmax公式Softmax实现方法1importnumpyasnpdefsoftmax(x):"""Computesoftmaxvaluesforeachsetsofscoresinx."""pass#TODO:Computeandreturnsoftmax(x)x=np.array(x)x=

系统 2019-09-27 17:55:58 2463

Python

python获取多线程及子线程的返回值

最近有个需求,用多线程比较合适,但是我需要每个线程的返回值,这就需要我在threading.Thread的基础上进行封装importthreadingclassMyThread(threading.Thread):def__init__(self,func,args=()):super(MyThread,self).__init__()self.func=funcself.args=argsdefrun(self):self.result=self.fun

系统 2019-09-27 17:53:22 2463