背景说明感觉微信公众号算得是比较难爬的平台之一,不过一番折腾之后还是小有收获的。没有用Scrapy(估计爬太快也有反爬限制),但后面会开始整理写一些实战出来。简单介绍下本次的开发环境:python3requestspsycopg2(操作postgres数据库)抓包分析本次实战对抓取的公众号没有限制,但不同公众号每次抓取之前都要进行分析。打开Fiddler,将手机配置好相关代理,为避免干扰过多,这里给Fiddler加个过滤规则,只需要指定微信域名mp.wei
系统 2019-09-27 17:53:47 2157
Python有一些技巧对你来说是新知识,但是还有一些技巧会让你的代码效率大幅提升。本文总结了一下自己用到的一些Python高级编程技巧,希望对大家有帮助。列表生成器a=[1,2,3][x*xforxinaifx>1][4,9]集合生成器a=[1,2,3]s={x*xforxinaifx>1}s{4,9}type(s)set字典生成器a=[1,2,3]{str(x):x+1forxinaifx>1}{'2':3,'3':4}rangelist(range(1
系统 2019-09-27 17:52:59 2157
ftp登陆连接fromftplibimportFTP#加载ftp模块ftp=FTP()#设置变量ftp.set_debuglevel(2)#打开调试级别2,显示详细信息ftp.connect("IP","port")#连接的ftpsever和端口ftp.login("user","password")#连接的用户名,密码printftp.getwelcome()#打印出欢迎信息ftp.cmd("xxx/xxx")#进入远程目录bufsize=1024#设置
系统 2019-09-27 17:50:53 2157
inux开发人员经常使用Python完成小块的工作,因为你可以编写脚本的情况很容易。它已经成为完成配置和部署等小任务的一个流行方式。WindowsAzure,微软的云,也没有什么不同。通过PythonSDK所提供的可用性,Python成为WindowsAzure的头等公民。让我们看看我们如何能够使用Python无需其它而只需一个WindowsAzure订阅就可以用编程方式从vmdepot部署一个映像到WindowsAzure上。建立一个管理证书任何与Win
系统 2019-09-27 17:49:19 2157
Python内置了多种类型的数据结构,常用的有:列表、元组、集合和字典。本文主要介绍列表和元组。列表(list)和元组(tuple)定义列表和元组,都是一个可以放置任意数据类型的有序集合。列表和元组的区别列表是动态的,长度大小不固定,可以随意增加、删减或者改变元素(mutable)。元组是静态的,长度大小固定,无法增加删减或改变(immutable)。如果要对已有的元组做任何“改变”,只能重新开辟一块内存,创建新的元组。#列表(list)list=[1,2
系统 2019-09-27 17:47:55 2157
概述在我们使用内置打印函数print时,打印出的Python数据结构对象总是一行的输出的方式,这样对数据结构较复杂或数据较多的对象的显示并不美观,这时我们可以利用pprint输出美化数据结构对象。pprint方法概览美化输出我们可以利用pprint中的PrettyPrinter控制输出的打印时的缩进,行宽、甚至打印深度等,定义类如下classpprint.PrettyPrinter(indent=1,width=80,depth=None,stream=N
系统 2019-09-27 17:45:58 2157
Python身份运算符身份运算符用于比较两个对象的存储单元以下实例演示了Python所有身份运算符的操作:#!/usr/bin/pythona=20b=20if(aisb):print"Line1-aandbhavesameidentity"else:print"Line1-aandbdonothavesameidentity"if(id(a)==id(b)):print"Line2-aandbhavesameidentity"else:print"Lin
系统 2019-09-27 17:38:42 2157
Python提供多种数据类型来存放数据项集合,主要包括序列(列表list和元组tuple),映射(如字典dict),集合(set),下面对这几种一一介绍:一序列1.列表list列表是一种有序的集合,相对于元组和字符串的不同是它其中的元素可变,可以随时添加和删除其中的元素。(1)创建list在命令行中测试,如下:>>>L1=[1,2,3]>>>L1[1,2,3]>>>L2=['abc']>>>L2['abc']>>>L3=["a","b","c"]>>>L3
系统 2019-09-27 17:38:27 2157
本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1.标准化(StandardizationorMeanRemovalandVarianceScaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。sklearn.preprocessing.scale(X)一般会把train和test集放在一起做标准化,或者在tr
系统 2019-09-27 17:38:06 2157
准备我测试使用的Python版本为2.7.10,如果你的版本是Python3.5的话,这里就不太适合了。使用SpeechAPI原理我们的想法是借助微软的语音接口,所以我们肯定是要进行调用相关的接口。所以我们需要安装pywin32来帮助我们完成这一个底层的交互。示例代码importwin32com.clientspeaker=win32com.client.Dispatch("SAPI.SpVoice")speaker.Speak("Hello,itwork
系统 2019-09-27 17:37:43 2157