导入模块frombs4importBeautifulSoupsoup=BeautifulSoup(html_doc,"html.parser")下面看下常见的用法print(soup.a)#拿到soup中的第一个a标签print(soup.a.name)#获取a标签的名称print(soup.a.string)#获取a标签的文本内容print(soup.a.text)#获取a标签的文本内容print(soup.a["href"])#获取a标签的href属性
系统 2019-09-27 17:55:49 2030
Python笔记004-元组的拆包和命名元组以下是我学习《流畅的Python》后的个人笔记,现在拿出来和大家共享,希望能帮到各位Python学习者。首次发表于:微信公众号:科技老丁哥,ID:TechDing,敬请关注。本篇主要知识点:元组的拆包就是将元组内部的每个元素按照位置一一对应的赋值给不同变量,可以应用到变量赋值,函数参数赋值,获取元组中特定位置的元素值等场合。namedtuple:用于存储对象序列,不能改变元素值,可以像dict一样通过名字进行访问
系统 2019-09-27 17:55:37 2030
上一章我们介绍了python中的列表,本章介绍其余三种数据结构:字典、集合和元组。1、字典字典有两个特点:其一,字典是由大括号{}包围的;其二,字典的每一个元素的模式都是“键:值”,而不是“键=值”,两个元素之间用逗号,隔开。注意,字典初始化的顺序不会保持,在初始化后,再次查看字典时,元素顺序可能变化。一般访问字典的数据时,使用中括号记法,中括号中是键,使用键来访问其关联的数据值。python字典的底层是一个大小可变的散列表。空字典的初始化就是一个空的大括
系统 2019-09-27 17:54:55 2030
阅读更多####if语句###cars=['audi','bmw','subaru','toyota']forcarincars:ifcar=='bmw':#==检查是否相等即相等时返回Ture,不相等时返回Flaseprint(car.upper())else:print(car.title())cars=['audi','bmw','subaru','toyota']forcarincars:ifcar!="bmw":#!=检查是否不相等即不相等时返回
系统 2019-09-27 17:54:53 2030
pip源配置文件可以放置的位置:Linux/Unix:/etc/pip.con~/.pip/pip.conf(每一个我都找了都没有,所以我是在这个文件夹中创建的pip.conf文件)~/.config/pip/pip.confMacOSX:~/Library/ApplicationSupport/pip/pip.conf~/.pip/pip.conf/Library/ApplicationSupport/pip/pip.confWindows:%APPDA
系统 2019-09-27 17:53:45 2030
Python标准库中的BaseHTTPServer模块实现了一个基础的HTTP服务器基类和HTTP请求处理类。这在文章python探索之BaseHTTPServer-实现Web服务器介绍中进行了相关的介绍。然而,BaseHTTPServer模块中并没有定义相关的请求方法,诸如GET、HEAD、POST等。在BaseHTTPServer模块的基础上,Python标准库中的SimpleHTTPServer模块实现了简单的GET、HEAD请求。在该模块中,它沿用
系统 2019-09-27 17:53:34 2030
本文实例讲述了决策树剪枝算法的python实现方法。分享给大家供大家参考,具体如下:决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,如果有多个输出,可以分别建立独立的决策树以处理不同的输出。ID3算法:ID3算法是决策树的一种
系统 2019-09-27 17:52:43 2030
阅读更多本文分享自6丁一的猫的博客,主要是python调用hanlp进行命名实体识别的方法介绍。以下为分享的全文。1、python与jdk版本位数一致2、pipinstalljpype1(python3.5)3、类库hanlp.jar包、模型data包、配置文件hanlp.properties放在一个新建目录4、修改hanlp.properties中root根目录,找到data代码调用如下:1|#coding:utf-82|'''3|Createdon20
系统 2019-09-27 17:52:23 2030
在上一篇文章里已经写过如何安装python和在eclipse中配置python插件,这篇就不多说了,开始入门。1.先新建一个python工程,File-->New-->Other,直接搜pyDev就出来了,选择pyDevproject创建一个src文件夹2.在src中新建一个python文件,右键-->New-->pyDewModule,名字么,既然是第一个程序,那肯定来个经典的helloworld3.python文件是以.py结尾的4.接下来写我们第一行
系统 2019-09-27 17:52:15 2030
Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-#byustcwq#2015-03-15importurllib,urllib2,os,timefrombs4importBeautifulSoupstart=time.c
系统 2019-09-27 17:51:30 2030