搜索到与相关的文章
Python

Python数据挖掘入门与实践

本书特色在数据规模急速膨胀的大数据时代,数据挖掘这项甄别重要数据的核心技术正发挥越来越重要的作用。它将赋予你解决实际问题的“超能力”:预测体育赛事结果、精确投放广告、根据作品的风格解决作者归属问题,等等。本书使用简单易学且拥有丰富第三方库和良好社区氛围的Python语言,由浅入深,以真实数据作为研究对象,真刀实枪地向读者介绍Python数据挖掘的实现方法。通过本书,读者将迈入数据挖掘的殿堂,透彻理解数据挖掘基础知识,掌握解决数据挖掘实际问题的最佳实践!理解

系统 2019-09-27 17:49:13 1961

Python

【Python3网络爬虫开发实战】3.3-正则表达式

【摘要】本节中,我们看一下正则表达式的相关用法。正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。当然,对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了。1.实例引入说了这么多,可能我们对它到底是个什么还是比较模糊,下面就用几个实例来看一下正则表达式的用法。打开开源中国提供的正则表达式测试工具http://tool.oschina.net/regex/,输入待匹配的文本,然后选择常用的

系统 2019-09-27 17:48:57 1961

Python

Python 使用USB Camera录制MP4视频

#!/usr/bin/envpythonimportcv2importsysimporttimeimportnumpyasnpimporttimeif__name__=="__main__":print(cv2.__version__)print(np.__version__)'''4.1.01.16.3'''#//@打开摄像头/dev/video0cap_1=cv2.VideoCapture(0)#cap_1.set(3,640)#cap_1.set(4

系统 2019-09-27 17:48:54 1961

Python

Python数据类型 — 集合

集合是一个无序的,不重复的数据组合,它的主要作用如下:去重,把一个列表变成集合,就自动去重了关系测试,测试两组数据之前的交集、差集、并集等关系s=set([3,5,9,10])#创建一个数值集合t=set("Hello")#创建一个唯一字符的集合a=t|s#t和s的并集b=t&s#t和s的交集c=t-s#求差集(项在t中,但不在s中)d=t^s#对称差集(项在t或s中,但不会同时出现在二者中)基础功能List=[1,2,5,6,8]List=set(lis

系统 2019-09-27 17:48:36 1961

Python

python中的列表与元组的使用

在python中的数据类型和控制流这篇文章中我们提到过列表,它是基本的数据类型之一。通俗来说,它就是用来存储一系列数据的。比如存储一个班级的学生。列表中的每个元素可以通过下标(索引)访问,索引从0开始。既然列表存储的是一系列值,这必然存在「增删改查」的情况,就像一个班级的学生,有进入学的,也有退学的。接下来我们来说说,首先我们先从列表的创建开始。创建列表list=[ele1,ele2,elem3,...,elen]比如,创建一个数字列表或英文字符列表num

系统 2019-09-27 17:48:06 1961

Python

用Python爬取需要登录的网站

最近我必须执行一项从一个需要登录的网站上爬取一些网页的操作。它没有我想象中那么简单,因此我决定为它写一个辅助教程。在本教程中,我们将从我们的bitbucket账户中爬取一个项目列表。教程中的代码可以从我的Github中找到。我们将会按照以下步骤进行:提取登录需要的详细信息执行站点登录爬取所需要的数据在本教程中,我使用了以下包(可以在requirements.txt中找到):requestslxml#步骤一:研究该网站打开登录页面进入以下页面“bitbuck

系统 2019-09-27 17:47:27 1961

Python

Python字符串处理之count()方法的使用

count()方法返回出现在范围内串子数range[start,end]。可选参数的start和end都解释为片符号。语法以下是count()方法的语法:str.count(sub,start=0,end=len(string))参数sub--这是子串用来进行搜索。start--搜索从这一索引。第一个字符从0开始的索引。默认情况下搜索从0开始的索引。end--搜索从该索引结束。第一个字符从0开始的索引。默认情况下搜索结束的最后一个索引。返回值此方法返回集中

系统 2019-09-27 17:47:22 1961

Python

详解Python中find()方法的使用

find()方法判断字符串str,如果起始索引beg和结束end索引能找到在字符串或字符串的一个子串中。语法以下是find()方法的语法:str.find(str,beg=0end=len(string))参数str--此选项指定要搜索的字符串。beg--这是开始索引,默认情况下为0。end--这是结束索引,默认情况下它等于字符串的长度。返回值如果找到此方法返回的索引,否则返回-1。例子下面的例子显示了find()方法的使用。#!/usr/bin/pyth

系统 2019-09-27 17:47:19 1961

Python

给定一篇文本(新闻),确定其归属地(地名)的python工具

简介有时候需要确定一篇新闻文本的地名,比如上海市实施了垃圾分类...其地名,即归属地是上海,本工具就是实现这个功能的。给定一篇文章,可包含标题和正文(或仅标题,仅正文),确定其归属地(地名)。结果标准:区分国内国外,国外到国家名一级国内到省市一级安装使用python3$gitclonehttps://github.com/dongrixinyu/location_detect.git$cdlocation_detect$pipinstall.使用方法样例1

系统 2019-09-27 17:46:49 1961

Python

使用Python爬了4400条淘宝商品数据,竟发现了这些“潜规则”

本文记录了笔者用Python爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论。项目内容本案例选择>>商品类目:沙发;数量:共100页4400个商品;筛选条件:天猫、销量从高到低、价格500元以上。项目目的1.对商品标题进行文本分析词云可视化2.不同关键词word对应的sales的统计分析3.商品的价格分布情况分析4.商品的销量分布情况分析5.不同价格区间的商品的平均销量分布6.商品价格对销量的影响分析7.商品价格对销售额的影响分析8.不同

系统 2019-09-27 17:46:23 1961