Python

python字符串编码识别模块chardet简单应用

python的字符串编码识别模块(第三方库):官方地址:http://pypi.python.org/pypi/chardetimportchardetimporturllib#可根据需要,选择不同的数据TestData=urllib.urlopen('http://www.baidu.com/').read()printchardet.detect(TestData)#运行结果:#{'confidence':0.99,'encoding':'GB2312

系统 2019-09-27 17:37:46 2341

Python

初学Python之爬虫的简单入门

初学Python之爬虫的简单入门一、什么是爬虫?1.简单介绍爬虫爬虫的全称为网络爬虫,简称爬虫,别名有网络机器人,网络蜘蛛等等。网络爬虫是一种自动获取网页内容的程序,为搜索引擎提供了重要的数据支撑。搜索引擎通过网络爬虫技术,将互联网中丰富的网页信息保存到本地,形成镜像备份。我们熟悉的谷歌、百度本质上也可理解为一种爬虫。如果形象地理解,爬虫就如同一只机器蜘蛛,它的基本操作就是模拟人的行为去各个网站抓取数据或返回数据。2.爬虫的分类网络爬虫一般分为传统爬虫和聚

系统 2019-09-27 17:56:55 2340

Python

python每日经典算法题5(基础题)+1(较难题)

一:基础算法题5道1.阿姆斯特朗数如果一个n位正整数等于其各位数字的n次方之和,则称该数为阿姆斯特朗数。判断用户输入的数字是否为阿姆斯特朗数。(1)题目分析:这里要先得到该数是多少位的,然后再把每一位的数字截取出来,把各位数字的n次方之和和该数一起判断即可。(2)算法分析:python中有len()函数可以得到一个字符串的长度,因此需要先把一个正整数转化为正整数字符串。然后从高位向低位截取(也可以反过来)。或者高效算法利用for循环切片。从高位到低位:用正

系统 2019-09-27 17:56:25 2340

Python

Python3 对象组合zip()和回退方式*zip详解

zip概述zip即将多个可迭代对象组合为一个可迭代的对象,每次组合时都取出对应顺序的对象元素组合为元组,直到最少的对象中元素全部被组合,剩余的其他对象中未被组合的元素将被舍弃。keys=['one','two','three']values=[1,2,3]d=zip(keys,values)print(list(d))示例结果:[('one',1),('two',2),('three',3)]可以看到我们由zip模拟了一个类似字典的一一对应的元组迭代对象,

系统 2019-09-27 17:55:59 2340

Python

Python函数编程——列表生成式和生成器

Python函数编程——列表生成式和生成器一、列表生成式现在有个需求,现有列表a=[0,1,2,3,4,5,6,7,8,9],要求你把列表里的每个值加1,你怎么实现?1、二逼青年版生成一个新列表b,遍历列表a,把每个值加1后存在b里,最后再把a=b,这样二逼的原因不言而喻,生成了新列表,浪费了内存空间。>>>a[0,1,2,3,4,5,6,7,8,9]>>>b=[]>>>foriina:b.append(i+1)...>>>b[1,2,3,4,5,6,7,

系统 2019-09-27 17:54:51 2340

Python

Python中实现从目录中过滤出指定文件类型的文件

最近学习下python,将从指定目录中过滤出指定文件类型的文件输出的方法总结一下,供日后查阅复制代码代码如下:#!/usr/bin/envpythonimportglobimportosos.chdir(“./”)forfileinglob.glob(“*.py”):printfileprint“#######AnotherOne##########”forfileinos.listdir(“./”):iffile.endswith(“.py”):prin

系统 2019-09-27 17:52:35 2340

Python

Python中可迭代对象是什么?

Python中可迭代对象(Iterable)并不是指某种具体的数据类型,它是指存储了元素的一个容器对象,且容器中的元素可以通过__iter__()方法或__getitem__()方法访问。__iter__方法的作用是让对象可以用for…in循环遍历,getitem()方法是让对象可以通过“实例名[index]”的方式访问实例中的元素。老猿认为这两个方法的目的是Python实现一个通用的外部可以访问可迭代对象内部数据的接口。一个可迭代对象是不能独立进行迭代的

系统 2019-09-27 17:52:31 2340

Python

Python获取时间范围内日期列表和周列表的函数

Python获取时间范围内日期列表和周列表的函数1、获取日期列表#-*-coding=utf-8-*-importdatetimedefdateRange(beginDate,endDate):dates=[]dt=datetime.datetime.strptime(beginDate,"%Y-%m-%d")date=beginDate[:]whiledate<=endDate:dates.append(date)dt=dt+datetime.timed

系统 2019-09-27 17:50:42 2340

Python

随机森林算法python实现

随机森林算法python实现瞎BB代码导入数据切分训练集测试集找到最有用的几个属性根据上面的代码更改属性参数组合遍历找最优随机森林样本数据瞎BB1.实现根据样本数据(用眼距离distance、最长持续用眼时长duration、总用眼时长total_time、户外运动时长outdoor、用眼角度angle、健康环境光照用眼比例proportion)判别是否需要近视预警2.样本实在太少,结果还行,原理都是一样的代码导入数据importpandaspatient

系统 2019-09-27 17:50:10 2340

Python

经典损失函数——均方误差(MSE)和交叉熵误差(CEE)的python实现

损失函数(lossfunction)用来表示当前的神经网络对训练数据不拟合的程度。这个损失函数有很多,但是一般使用均方误差和交叉熵误差等。1.均方误差(meansquarederror)先来看一下表达式:用于将的求导结果变成,是神经网络的输出,是训练数据的标签值,k表示数据的维度。用python实现:defMSE(y,t):return0.5*np.sum((y-t)**2)使用这个函数来具体计算以下:t=[0,1,0,0]y=[0.1,0.05,0.05

系统 2019-09-27 17:47:48 2340

Python

python time模块

importtimetime.sleep(100)print(time.time())print(time.strftime("%Y-%m-%d%a%H:%M:%S"))#yearmonthdayHOURMINUTESECONDprint(time.strftime("%Y/%m/%d%H:%M:%S"))#yearmonthdayHOURMINUTESECONDprint(time.strftime("%m-%d%H:%M:%S"))#yearmonth

系统 2019-09-27 17:46:46 2340

Python

python聚类算法解决方案(rest接口/mpp数据库/json数据/下载

1.场景描述一直做java,因项目原因,需要封装一些经典的算法到平台上去,就一边学习python,一边网上寻找经典算法代码,今天介绍下经典的K-means聚类算法,算法原理就不介绍了,只从代码层面进行介绍,包含:rest接口、连接mpp数据库、回传json数据、下载图片及数据。2.解决方案2.1项目套路(1)python经典算法是单独的服务器部署,提供rest接口出来,供java平台调用,交互的方式是http+json;(2)数据从mpp数据库-Green

系统 2019-09-27 17:46:08 2340

Python

浅谈Python的文件类型

Python的文件类型主要分为3种:源代码(sourcefile)、字节码(byte-codefile)、优化的字节码(optimizedfile)。这些代码都可以直接运行,不需要编译或者连接。这正是Python语言的特性,Python的文件通过python.exe和pythonw.exe解释运行。1.源代码Python的源文件以"py"为扩展名,有python.exe解释运行,可在控制台下运行。"pyw"是图形开发用户接口(GUI)文件的扩展名,作为桌面

系统 2019-09-27 17:38:37 2340

Python

Python中一些自然语言工具的使用的入门教程

NLTK是使用Python教学以及实践计算语言学的极好工具。此外,计算语言学与人工智能、语言/专门语言识别、翻译以及语法检查等领域关系密切。NLTK包括什么NLTK会被自然地看作是具有栈结构的一系列层,这些层构建于彼此基础之上。那些熟悉人工语言(比如Python)的文法和解析的读者来说,理解自然语言模型中类似的――但更深奥的――层不会有太大困难。术语表全集(Corpora):相关文本的集合。例如,莎士比亚的作品可能被统称为一个文集(corpus);而若干个

系统 2019-09-27 17:38:32 2340

Python

好用的Python编辑器WingIDE的使用经验总结

用法:分析一个脚本的依赖:analysis_dependency.pyscript1.py递归分析依赖:analysis_dependency.pyscript1.py-r#!/usr/bin/envpython#encoding:utf-8#source:https://github.com/MrLYC/ycyc/blob/dev/tools/analysis_dependency.pyimportastimportimportlibimportinsp

系统 2019-09-27 17:38:28 2340