导入模块frombs4importBeautifulSoupsoup=BeautifulSoup(html_doc,"html.parser")下面看下常见的用法print(soup.a)#拿到soup中的第一个a标签print(soup.a.name)#获取a标签的名称print(soup.a.string)#获取a标签的文本内容print(soup.a.text)#获取a标签的文本内容print(soup.a["href"])#获取a标签的href属性
系统 2019-09-27 17:55:49 2147
认识模块对于模块,在前面的一些举例中,已经涉及到了,比如曾经有过:importrandom(获取随机数模块)。为了能够对模块有一个清晰的了解,首先要看看什么模块,这里选取官方文档中对它的定义:复制代码代码如下:AmoduleisafilecontainingPythondefinitionsandstatements.Thefilenameisthemodulenamewiththesuffix.pyappended.Withinamodule,themo
系统 2019-09-27 17:55:19 2147
详解python中的文件与目录操作一获得当前路径1、代码1>>>importos>>>print('Currentdirectoryis',os.getcwd())CurrentdirectoryisD:\Python362、代码2如果将上面的脚本写入到文件再运行CurrentdirectoryisE:\python\work二获得目录的内容Python代码>>>os.listdir(os.getcwd())['DLLs','Doc','include',
系统 2019-09-27 17:54:32 2147
表单操作一、表结构操作1.创建表2.查看表信息3.修改表结构二、表记录操作1.表纪录之增,删,改2.表记录之查三、外键约束四、多表查询准备两张表笛卡尔积查询内连接查询外连接查询五、索引1.索引简介2.索引语法1.创建表时创建索引2.已存在的表创建索引3.删除索引3.索引测试实验一、表结构操作1.创建表createtabletab_name(field1type[完整性约束条件],field2type,...fieldntype)[charactersetx
系统 2019-09-27 17:54:20 2147
例子:classFileTool:def__init__(self,filepath):self.filepath=filepathdefwrite_to_file(self,line):f=open(self.filepath,'a')f.write(line)f.close()defread_to_file(self):f=open(self.filepath,'r')lines=f.readlines()f.close()returnlines
系统 2019-09-27 17:53:57 2147
一、字符编码简史:美国:1963年ASCII(包含127个字符占1个字节)中国:1980年GB2312(收录7445个汉字,包括6763个汉字和682个其它符号)1993年GB13000(收录20902个汉字)1995年GBK1.0(收录21003个汉字)2000年GB18030(收录70244个汉字)世界:1991年unicode(‘万国码'也就统一编码,通常占2字节,复杂的汉字占4字节)UTF-8(可变长的字符编码)二、python中的编码解码应用Py
系统 2019-09-27 17:53:49 2147
python3.7链接:https://pan.baidu.com/s/1Lob447oqCgD6nb39sB9cig提取码:vn0apycharm链接:https://pan.baidu.com/s/1BndDvTG1hPnBmq5leu3gDQ提取码:3jus#huajiimportturtleast#-------------脸t.setup(960,959,0,0)t.color("orange")t.pensize("25")t.penup()t
系统 2019-09-27 17:53:49 2147
问题说明最近在写爬虫,由于单个账号访问频率太高会被封,所以需要在爬虫执行一段时间间隔后自己循环切换账号所以就在想,有没有像单片机那样子设置一个定时中断,再定义一个中断入口,这样子每隔一段时间执行一次中断当然不能用sleep,这样子整个进程就停在这了,而不是接着爬数据解决方法用到threading的Timer,也类似单片机那样子,在中断程序中再重置定时器,设置中断,python实例代码如下importthreadingimporttimedefchange_
系统 2019-09-27 17:53:13 2147
本文实例讲述了决策树剪枝算法的python实现方法。分享给大家供大家参考,具体如下:决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,如果有多个输出,可以分别建立独立的决策树以处理不同的输出。ID3算法:ID3算法是决策树的一种
系统 2019-09-27 17:52:43 2147
-基于如下5点展开requests模块的学习什么是requests模块requests模块是python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求。功能强大,用法简洁高效。在爬虫领域中占据着半壁江山的地位。为什么要使用requests模块因为在使用urllib模块的时候,会有诸多不便之处,总结如下:手动处理url编码手动处理post请求参数处理cookie和代理操作繁琐......使用requests模块:自动处理url编码自动处理po
系统 2019-09-27 17:52:20 2147