码字不易,喜欢请点赞!!!背景:其实两年前就爬了天眼查的很多信息,包括电话、地址等基本信息之外,还有公司的股东、专利以及对外投资等信息,但是当时的电脑没备份,代码都没了。这次山东的某个教育机构有偿找我帮爬天眼查公司电话以及地址信息,所以就重新爬了一下天眼查。准备:selenium+PhatomJS或者selenium+Firefox我这里直接用的后者selenium+Firefox思路爬取这部分信息的话,代码其实不难,主要包括模拟登陆、获得页面网址以及抓取
系统 2019-09-27 17:56:18 2134
参考链接:https://www.cnblogs.com/geaozhang/p/7111961.html#lajihuishou目录一、变量与对象1、变量,通过变量指针引用对象2、对象,类型已知,每个对象都包含一个头部信息(头部信息:类型标识符和引用计数器)3、引用所指判断一、变量与对象1、变量,通过变量指针引用对象变量指针指向具体对象的内存空间,取对象的值。2、对象,类型已知,每个对象都包含一个头部信息(头部信息:类型标识符和引用计数器)注意:变量没有
系统 2019-09-27 17:55:39 2134
本文实例讲述了python每次处理一个字符的三种方法。分享给大家供大家参考。具体方法如下:a_string="abccdea"print'thefirst'forcina_string:printord(c)+1print"thesecond"result=[ord(c)+1forcina_string]printresultprint"thethrid"defdo_something(c):returnord(c)+1result=map(do_some
系统 2019-09-27 17:55:36 2134
处理丢失数据有两种丢失数据:Nonenp.nan(NaN)In[1]:importnumpyasnpIn[12]:%timeitnp.arange(0,10000,dtype=int).sum()21.3µs±1.66µsperloop(mean±std.dev.of7runs,10000loopseach)In[13]:%timeitnp.arange(0,10000,dtype=float).sum()24.2µs±2.7µsperloop(mean±
系统 2019-09-27 17:55:21 2134
#python中的函数定义,使用和传参###-------------------必要参数-------------------------------------必要参数,即函数调用时必须要传的参数,#下面进行举例说明defhelloWorld(a):print('输出:hello')if__name__=='__main__':helloWorld("aaa")##必须要有参数##------------默认参数--------------------
系统 2019-09-27 17:55:02 2134
1、连续信号的相加与相乘在MATLAB和Python中,连续信号的相加、相减和相乘都是用符号“+”“-”“*”实现的。Python代码如下:"""连续信号相加和相乘"""importnumpyasnpimportmatplotlib.pyplotaspltt=np.linspace(0,2,200)f1=np.exp(-3*t)f2=np.sin(4*np.pi*t)plt.subplot(221)plt.ylim(-1,2)plt.title(u'f1'
系统 2019-09-27 17:52:13 2134
1.背景项目需求,要求获得github的repo的api,以便可以提取repo的数据进行分析。研究了一天,终于解决了这个问题,虽然效率还是比较低下。因为github的那个显示repo的api,列出了每个repo的详细信息,而且是json格式的。现在貌似还没有找到可以分析多个json格式数据的方法,所以用的是比较蠢得splite加re的方法。如果大家有更好的方法,不发留言讨论!2.代码importreimportosdefGetUrl(num):str=os
系统 2019-09-27 17:48:11 2134
一、安装python31、安装依赖包yuminstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgcc*make-y2、下载python安装包wgethttps://www.python.org/ftp/python/3.5.2/Python-3.5.2.tar.xz这里下载安装python3.5.2的原因主要是由于后期结合Django
系统 2019-09-27 17:46:52 2134
参考脚本之家首先,安装thriftthrift链接:https://github.com/SparksFly8/Tools下载thrift,这里用的是thrift-0.7.0-dev.tar.gz这个版本tarxzfthrift-0.7.0-dev.tar.gzcdthrift-0.7.0-devsudo./configure--with-cpp=no--with-ruby=nosudomakesudomakeinstalsrc/main/resource
系统 2019-09-27 17:56:24 2133
一:第一步windows下Anaconda与PyCharm的安装windows下Anaconda与PyCharm的安装与使用(致Python初学者们-Anaconda入门使用指南)或(Python数据分析必备Anaconda安装、快捷键、包安装)二:第二步python环境变量配置(看下文中如何配置环境变量)Anaconda安装后配置环境变量Anaconda安装后在cmd中运算python无效,是环境变量没有生效。正常安装需要有三个,配置好就行。D:\xwa
系统 2019-09-27 17:54:12 2133
前言通常我们的python代码都是遵循PEP8的规范化格式,目的是为了保持代码的一致性、可读性。,这里给大家推荐几个常用的静态代码检查工具,大家可以酌情选择使用1.pylintPylint是一个Python静态代码分析工具,它可以查找编程错误,帮助强制执行编码标准,嗅探代码异味并提供简单的重构建议。它具有高度可配置性,具有特殊的编译指示来控制代码中的错误和警告,以及广泛的配置文件。也可以编写自己的插件来添加自己的检查或以某种方式扩展pylint。缺省情况下
系统 2019-09-27 17:54:07 2133
本文实例讲述了Python使用scipy模块实现一维卷积运算。分享给大家供大家参考,具体如下:一介绍signal模块包含大量滤波函数、B样条插值算法等等。下面的代码演示了一维信号的卷积运算。二代码importnumpyasnpimportscipy.signalx=np.array([1,2,3])h=np.array([4,5,6])print(scipy.signal.convolve(x,h))#一维卷积运算三运行结果[413282718]四一维卷积
系统 2019-09-27 17:51:17 2133
作者|樱雨楼引言指针(Pointer)是C、C++以及Java、Go等语言的一个非常核心且重要的概念,而引用(Reference)是在指针的基础上构建出的一个同样重要的概念。指针对于任何一个编程语言而言都是必须且重要的,虽然Python对指针这一概念进行了刻意的模糊与限制,但指针对于Python而言依然是一个必须进行深入讨论的话题。本文基于C++与Python,讨论了Python中与指针及引用相关的一些行为。什么是指针?为什么需要指针?指针有两重含义:(1
系统 2019-09-27 17:48:41 2133
这次,我们来学习一种经典的降维方法:线性判别分析(LinearDiscriminantAnalysis,以下简称LDA).在前面博客中(点我)我们讲解了PCA降维算法。PCA追求的是在降维之后能够最大化保持数据的内在信息,并通过衡量在投影方向上的数据方差的大小来衡量该方向的重要性。PCA优缺点:优点:1.最小误差2.提取了主要信息缺点:PCA将所有的样本(特征向量集合)作为一个整体对待,去寻找一个均方误差最小意义下的最优线性映射投影,而忽略了类别属性,而它
系统 2019-09-27 17:45:40 2133
本文将通过一下几个方面来一一进行解决1、程序的主要功能2、实现过程3、类的定义4、用生成器generator动态更新每个对象并返回对象5、使用strip去除不必要的字符6、rematch匹配字符串7、使用timestrptime提取字符串转化为时间对象8、完整代码程序的主要功能现在有个存储用户信息的像表格一样的文档:第一行是属性,各个属性用逗号(,)分隔,从第二行开始每行是各个属性对应的值,每行代表一个用户。如何实现读入这个文档,每行输出一个用户对象呢?另
系统 2019-09-27 17:38:07 2133