- 军军小站|张军博客
搜索到与相关的文章
Python

python2爬取百度贴吧指定关键字和图片代码实例

目的:在百度贴吧输入关键字和要查找的起始结束页,获取帖子里面楼主所发的图片思路:获取分页里面的帖子链接列表获取帖子里面楼主所发的图片链接列表保存图片到本地注意事项:问题:在谷歌浏览器使用xpathhelper插件时有匹配结果,但在程序里面使用python内带的xpath匹配却为空的原因。原因:不同服务器会对不同的浏览器返回不同的数据,导致在谷歌浏览器看到的和服务器返回的有区别解决方法:使用IE浏览器的User-agenet,而且越老的版本,报错几率相对越小

系统 2019-09-27 17:57:03 1895

Python

Python 文件处理注意事项总结

Python文件处理注意事项总结文件处理在编程中是常见的操作,文件的打开,关闭,重命名,删除,追加,复制,随机读写非常容易理解和使用。需要注意的是文件的安全关闭,采用with语句轻松便捷:withopen(pathname,”r”)asmyfile:do_some_with(myfile)1.CSV的文件处理csv模块可以很好地处理csv文件,而Pandas模块则可以较好的处理大型的csv文件,还可以处理HTML等,并提供分块处理。2.XML的文件处理对于

系统 2019-09-27 17:56:11 1895

Python

python获取Linux下文件版本信息、公司名和产品名的方法

本文实例讲述了python获取Linux下文件版本信息、公司名和产品名的方法,分享给大家供大家参考。具体如下:区别于前文所述。本例是在linux下得到文件版本信息,主要是通过pefile模块解析文件中的字符串得到的。代码如下:def_get_company_and_product(self,file_path):"""Readallpropertiesofthegivenfilereturnthemasadictionary.@return:atumple

系统 2019-09-27 17:55:49 1895

Python

理解Python中的生成器

Python生成器是什么?先说一下生成器函数,抽象地说,生成器函数就是一个顺序执行过程的抽象。具体地说,它就是一种特殊的函数,这种特殊性源于这个函数中出现了一个yield关键字。解释器在发现函数中有yield关键字时,将这个函数标记为一个生成器函数,其执行的结果会返回一个生成器,而这个生成器是支持迭代器协议的。创建一个生成器函数生成器函数的创建是非常简单的:In[1]:defmygenerator():...:yield1...:正如前面提到的,如果一个函

系统 2019-09-27 17:55:34 1895

Python

Python程序设计模式

Python设计模式设计模式(DesignPattern)是一套被反复使用、多数人知晓的、经过分类的、代码设计经验的总结。使用设计模式的目的:为了代码可重用性、让代码更容易被他人理解、保证代码可靠性。设计模式使代码编写真正工程化;设计模式是软件工程的基石脉络,如同大厦的结构一样。所有的设计模式示例都是来源于菜鸟教程,每个设计模式的UML都可以在菜鸟教程中找到相应的示例github地址:Python设计模式以工厂模式为例:工厂模式在菜鸟教程中的UML图为工厂

系统 2019-09-27 17:55:33 1895

Python

python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法

首先在火狐浏览器上登录知乎,然后使用火狐浏览器插件Httpfox获取GET请求的Cookie,这里注意使用状态值为200(获取成功)的某次GET.将Cookies复制出来,注意这一行非常长,不要人为添加换行符。而且Cookie中使用了双引号,最后复制到代码里使用单引号包起来。使用下边代码检验是否是模拟了登录的用户的请求:importrequestsimportreheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.

系统 2019-09-27 17:55:03 1895

Python

Python之pyecharts使用

最近碰巧需要用到pyecharts,但是实数门外汉,完全不懂怎么使用。网上找了一些教程和博客,不是CV大法,就是通篇代码,既没有代码里的注释,也没有文字解释。看了半天还是不知道各项属性是什么意思,怎么使用,到头来还要自己慢慢摸索。(以上纯属个人吐槽,并非贬低所有博主,也没有表示我写的就好。只是单纯觉得有一些博文语焉不详,并没有什么实际意义。同时告诫自己。)欢迎交流,喷子勿扰,侵权删除。回归正题pyecharts有一个官方API文档,几乎包揽了全部内容。便于

系统 2019-09-27 17:54:22 1895

Python

python爬虫_自动获取seebug的poc实例

简单的写了一个爬取www.seebug.org上poc的小玩意儿~首先我们进行一定的抓包分析我们遇到的第一个问题就是seebug需要登录才能进行下载,这个很好处理,只需要抓取返回值200的页面,将我们的headers信息复制下来就行了(这里我就不放上我的headers信息了,不过headers里需要修改和注意的内容会在下文讲清楚)headers={'Host':******,'Connection':'close','Accept':******,'Use

系统 2019-09-27 17:54:11 1895

Python

python扫描proxy并获取可用代理ip的实例

今天咱写一个挺实用的工具,就是扫描并获取可用的proxy首先呢,我先百度找了一个网站:http://www.xicidaili.com作为例子这个网站里公布了许多的国内外可用的代理的ip和端口我们还是按照老样子进行分析,就先把所有国内的proxy扫一遍吧点开国内部分进行审查发现,国内proxy和目录为以下url:http://www.xicidaili.com/nn/x这个x差不多两千多页,那么看来又要线程处理了。。。老样子,我们尝试是否能直接以最简单的r

系统 2019-09-27 17:54:09 1895

Python

Appium+python自动化(二十五)- 那些让人抓耳挠腮、揪头发和掉头发

简介在前边的第二十二篇文章里,已经分享了通过获取控件的坐标点来获取点击事件的所需要的点击位置,那么还有没有其他方法来获取控件点击事件所需要的点击位置呢?答案是:Yes!因为在不同的大小屏幕的手机上获取控件的坐标点,不是一样的,而是有变化的,因此在不同的手机机型上,我们可能都需要重新获取坐标点,这么操作起来,如果操作控件特别的多,那么获取控件的坐标点就会显得特别的繁琐。因此我们可以通过获取控件的ID来避免获取控件坐标点的这种弊端。通过控件ID实现自动化脚本的

系统 2019-09-27 17:53:35 1895