Python

机器学习(一)——K近邻算法(python实现)

一、K近邻算法概念K近邻(k-NearestNeighbor,简称kNN)学习是一种或常用的监督学习方法,其工作机制非常简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。通常,在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果;在回归任务中可使用“平均法”,即将这k个样本的实质输出标记的平均值作为预测结果;还可基于距离远近进行加权平均或者加权投票,距离越近的样本权重

系统 2019-09-27 17:57:18 2558

Python

Python中的相关分析correlation analysis的实现

相关分析(correlationanalysis)研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;r>0,线性正相关;r<0,线性负相关;r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。相关分析函数DataFrame.corr()Series.corr(other)函数说明:如果由数据框调用corr函数,那么将会计算每个列两两之间

系统 2019-09-27 17:56:53 2558

Python

[python学习笔记]map(), apply()和applymap

原文链接:https://stackoverflow.com/questions/19798153/difference-between-map-applymap-and-apply-methods-in-pandas原文链接:https://stackoverflow.com/questions/19798153/difference-between-map-applymap-and-apply-methods-in-pandasapply()、map(

系统 2019-09-27 17:55:30 2558

Python

Python随机函数库random的使用方法详解

前言众所周知,python拥有丰富的内置库,还支持众多的第三方库,被称为胶水语言,随机函数库random,就是python自带的标准库,他的用法极为广泛,除了生成比较简单的随机数外,还有很多功能。使用random库:importrandomrandom库主要函数:函数名说明用法random()生成一个0~1之间的随机浮点数,范围0<=n<1.0random.random()uniform(a,b)返回a,b之间的随机浮点数,范围[a,b]或[a,b),取决

系统 2019-09-27 17:51:33 2558

Python

在Python3 numpy中mean和average的区别详解

mean和average都是计算均值的函数,在不指定权重的时候average和mean是一样的。指定权重后,average可以计算一维的加权平均值。具体如下:importnumpyasnpa=np.array([np.random.randint(0,20,5),np.random.randint(0,20,5)])print('原始数据\n',a)print('mean函数'.center(20,'*'))print('对所有数据计算\n',a.mean

系统 2019-09-27 17:48:44 2558

Python

python人和机器猜拳游戏实现

人机猜拳比赛完成人机猜拳互动游戏的开发,用户通过控制台输入实现出拳,电脑通过程序中的随机数实现出拳,每一局结束后都要输出结果。当用户输入n时停止游戏,并输出总结果。#!/usr/bin/envpython#-*-coding:UTF-8-*-#人和机器猜拳游戏#选择角色1曹操2张飞3刘备#角色猜拳1剪刀2石头3布玩家输入一个1-3的数字#电脑出拳随机产生1个1-3的数字,提示电脑出拳结果,本局对战结果...赢...输,是否继续?y/n#输出结果角色赢几局电

系统 2019-09-27 17:48:17 2558

Python

详解Python中用于计算指数的exp()方法

exp()方法返回指数x:ex.语法以下是exp()方法的语法:importmathmath.exp(x)注意:此函数是无法直接访问的,所以我们需要导入math模块,然后需要用math的静态对象来调用这个函数。参数x--这是一个数值表达式返回值此方法返回指数x:ex.例子下面的例子显示了exp()方法的使用。#!/usr/bin/pythonimportmath#Thiswillimportmathmoduleprint"math.exp(-45.17):

系统 2019-09-27 17:47:40 2558

Python

Linux下为不同版本python安装第三方库

问题背景目前的linux发行版上,有很多安装了两个版本的python。我的机器上默认的版本为python2.x。且在使用easy_install安装第三方库时,也默认安装到了2.x的版本上,在3.x版本下则无法import安装的库。环境:Kubuntu15.04解决方法安装python3-setuptools和easy_install3,并安装pip3sudoapt-getinstallpython3-setuptoolssudoeasy_install3

系统 2019-09-27 17:38:29 2558

Python

Sublime Python 插件配置合集

PythonPEP8Autoformat插件这是用来按PEP8自动格式化代码的。可以在包管理器中安装。快捷键CTRL+SHIFT+R自动格式化python代码1{2"auto_complete":false,3"caret_style":"solid",4"ensure_newline_at_eof_on_save":true,5"find_selected_text":true,6"font_size":11.0,7"highlight_modified

系统 2019-08-12 09:27:23 2558

Python

【python】用asq实现count(distinct cln)

假设一个表有6个字段c1,c2,c3,c4,c5,c6,有如下的sql语句:selectc1,count(distinct(c6))fromtblwherec3>1groupbyc3;python中asq模块可以实现类似的查询,以下用一个示例说明。#!/usr/bin/envpython2.7#-*-encoding:utf-8-*-importosfromdatetimeimport*importtimefromasq.initiatorsimportq

系统 2019-08-12 01:52:34 2558

Python

【Python】爬取天眼查公司电话以及地址信息

码字不易,喜欢请点赞!!!背景:其实两年前就爬了天眼查的很多信息,包括电话、地址等基本信息之外,还有公司的股东、专利以及对外投资等信息,但是当时的电脑没备份,代码都没了。这次山东的某个教育机构有偿找我帮爬天眼查公司电话以及地址信息,所以就重新爬了一下天眼查。准备:selenium+PhatomJS或者selenium+Firefox我这里直接用的后者selenium+Firefox思路爬取这部分信息的话,代码其实不难,主要包括模拟登陆、获得页面网址以及抓取

系统 2019-09-27 17:56:18 2557

Python

python非递归全排列实现方法

刚刚开始学习python,当前看到了函数这一节。结合数组操作,写了个非递归的全排列生成。原理是插入法,也就是在一个有n个元素的已有排列中,后加入的元素,依次在前,中,后的每一个位置插入,生成n+1个新的全排列。因为Python切割数组或者字符串,以及合并比较方便,所以,程序会节省很多代码。defgetArrayInsertCharToStr(STR,CHAR):arr=[]s_len=len(STR)index=0whileindex<=s_len:#分割

系统 2019-09-27 17:56:11 2557

Python

跟老齐学Python之关于类的初步认识

在开始部分,请看官非常非常耐心地阅读下面几个枯燥的术语解释,本来这不符合本教程的风格,但是,请看官谅解,因为列位将来一定要阅读枯燥的东西的。这些枯燥的属于解释,均来自维基百科。1、问题空间问题空间是问题解决者对一个问题所达到的全部认识状态,它是由问题解决者利用问题所包含的信息和已贮存的信息主动地构成的。一个问题一般有下面三个方面来定义:•初始状态――一开始时的不完全的信息或令人不满意的状况;•目标状态――你希望获得的信息或状态;•操作――为了从初始状态迈向

系统 2019-09-27 17:55:29 2557

Python

用Python爬取中国校花网后,我发现她们都有个共同点

我们都知道,爬虫获取页面的响应之后,最关键的就是如何从繁杂的网页中把我们需要的数据提取出来,python从网页中提取数据的包很多,常用的解析模块有下面的几个:BeautifulSoupAPI简单但解析速度慢,不推荐使用lxml由C语言编写的xml解析库(libxm2),解析速度快但是API复杂Scrapy综合以上两者优势实现了自己的数据提取机制,被称为Selector选择器。它是由lxml库构建的,并简化了API,先通过XPath或者CSS选择器选中要提取

系统 2019-09-27 17:54:28 2557

Python

Python程序打包工具py2exe和PyInstaller详解

前言通常执行python程序要有相应的Python环境,但某些特定场景下,我们可能并不愿意这么麻烦的去配置这些环境(比如将写好的脚本发给客户进行操作),如果可以提前将程序打包成Windows平台的.exe文件或者是Linux下的.sh脚本,那么使用起来就会方便很多,py2exe和PyInstaller这两款工具都是干这么个事的,下面以hello.py脚本(代码内容如下)为例进行介绍。age=input("Howoldareyou?\n")print("A:

系统 2019-09-27 17:53:51 2557