编程技术 - 军军小站|张军博客
Python

Python多进程方式抓取基金网站内容的方法分析

本文实例讲述了Python多进程方式抓取基金网站内容的方法。分享给大家供大家参考,具体如下:在前面这篇//www.jb51.net/article/162418.htm我们已经简单了解了”python的多进程”,现在我们需要把抓取基金网站(28页)内容写成多进程的方式。因为进程也不是越多越好,我们计划分3个进程执行。意思就是:把总共要抓取的28页分成三部分。怎么分呢?#初始ranger=range(1,29)#步长step=10myList=[r[x:x+

系统 2019-09-27 17:45:24 1760

Python

python中快速进行多个字符替换的方法小结

先给出结论:要替换的字符数量不多时,可以直接链式replace()方法进行替换,效率非常高;如果要替换的字符数量较多,则推荐在for循环中调用replace()进行替换。可行的方法:1.链式replace()string.replace().replace()1.x在for循环中调用replace()「在要替换的字符较多时」2.使用string.maketrans3.先re.compile然后re.sub……defa(text):chars="&#"for

系统 2019-09-27 17:38:36 1760

Python

Python监控主机是否存活并以邮件报警

利用Python写了简单测试主机是否存活脚本,此脚本不适于线上使用,因为网络延迟、丢包现象会造成误报邮件,那么后续会更新判断三次ping不通后再发报警邮件,并启用多线程处理。#!/usr/bin/envpython#coding:UTF-8importtimeimportpexpectimportsmtplibfromemail.mime.textimportMIMETextmail_host="smtp.163.com"#定义smtp服务器mail_to

系统 2019-09-27 17:38:23 1760

Python

简单介绍Python中利用生成器实现的并发编程

我们都知道并发(不是并行)编程目前有四种方式,多进程,多线程,异步,和协程。多进程编程在python中有类似C的os.fork,当然还有更高层封装的multiprocessing标准库,在之前写过的python高可用程序设计方法中提供了类似nginx中masterprocess和workerprocess间信号处理的方式,保证了业务进程的退出可以被主进程感知。多线程编程python中有Thread和threading,在linux下所谓的线程,实际上是LW

系统 2019-09-27 17:38:17 1760

Python

Python 实现数据库更新脚本的生成方法

我在工作的时候,在测试环境下使用的数据库跟生产环境的数据库不一致,当我们的测试环境下的数据库完成测试准备更新到生产环境上的数据库时候,需要准备更新脚本,真是一不小心没记下来就会忘了改了哪里,哪里添加了什么,这个真是非常让人头疼。因此我就试着用Python来实现自动的生成更新脚本,以免我这烂记性,记不住事。主要操作如下:1.在原先basedao.py中添加如下方法,这样旧能很方便的获取数据库的数据,为测试数据库和生产数据库做对比打下了基础。defselect

系统 2019-09-27 17:38:12 1760

Python

python 读写、创建 文件的方法(必看)

python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。得到当前工作目录,即当前Python脚本工作的目录路径:os.getcwd()返回指定目录下的所有文件和目录名:os.listdir()函数用来删除一个文件:os.remove()删除多个目录:os.removedirs(r“c:\python”)检验给出的路径是否是一个文件:os.path.isfile()检验给出的路径是否是一个目录:os.path.isdir()判

系统 2019-09-27 17:38:10 1760

Python

浅析Python中MySQLdb的事务处理功能

前言任何应用都离不开数据,所以在学习python的时候,当然也要学习一个如何用python操作数据库了。MySQLdb就是python对mysql数据库操作的模块。今天写了个工具,目的是把csv中的数据插入到数据库中去。其中有一部分,是需要分别向两张表中插入两条数据,如果第二张表中的数据已经存在,那么第一张表中的数据也不需要插入。然后通过百度查找发现,其实MySQLdb库,自带了事务处理的功能,pymysql库也是一样。conn=MySQLdb.conne

系统 2019-09-27 17:38:06 1760

Python

深入解析Python中的urllib2模块

Python标准库中有很多实用的工具类,但是在具体使用时,标准库文档上对使用细节描述的并不清楚,比如urllib2这个HTTP客户端库。这里总结了一些urllib2的使用细节。Proxy的设置Timeout设置在HTTPRequest中加入特定的HeaderRedirectCookie使用HTTP的PUT和DELETE方法得到HTTP的返回码DebugLogProxy的设置urllib2默认会使用环境变量http_proxy来设置HTTPProxy。如果想

系统 2019-09-27 17:37:51 1760

Python

在Python 3中实现类型检查器的简单方法

示例函数为了开发类型检查器,我们需要一个简单的函数对其进行实验。欧几里得算法就是一个完美的例子:defgcd(a,b):'''Returnthegreatestcommondivisorofaandb.'''a=abs(a)b=abs(b)ifa

系统 2019-09-27 17:37:39 1760

编程技术

开源搜索引擎资源

开放源代码搜索引擎为人们学习、研究并掌握搜索技术提供了极好的途径与素材,推动了搜索技术的普及与发展,使越来越多的人开始了解并推广使用搜索技术。使用开源搜索引擎,可以大大缩短构建搜索应用的周期,并可根据应用需求打造个性化搜索应用,甚至构建符合特定需求的搜索引擎系统。搜索引擎的开源,无论是对技术人员还是普通用户,都是一个福音。搜索引擎的工作流程主要分为三步:从互联网抓取网页→创建抓取网页的索引库→从索引库中进行搜索。首先需要一个能访问网络的爬虫器程序,依据UR

系统 2019-08-29 23:51:17 1760

编程技术

047_《Delphi技术手册》

《Delphi技术手册》Delphi教程系列书籍(047)《Delphi技术手册》网友(邦)整理EMail:shuaihj@163.com下载地址:Pdf附书源码原书名:DelphiinaNutshell原出版社:O'Reilly作者:(美)RayLischner译者:肖雪莲朱腾辉丛书名:O'Reilly系列出版社:中国电力出版社ISBN:7508305426上架时间:2001-8-8出版日期:2001年4月页码:636版次:1-1内容简介Inprise/

系统 2019-08-29 23:43:15 1760

编程技术

dmp 数据增量导入

导出指定条件数据普通导入表方式导入出现日志如下:说明在建立表的时候报错,因为数据库里已经有这张表了,报错就中断退出了。可以这样处理,在导入的选项上选择忽略,就可以将建表的错误忽略,而到导入数据的地方了,这样增量的数据就可以导入到这个表里日志如下:哈哈。dmp数据增量导入

系统 2019-08-29 23:39:10 1760

编程技术

【Flex应用展示之】-GOOGLE WEB DESKTOP

Flex应用展示之-GOOGLEWEBDESKTOP刚刚拿到这个消息的时候,我很吃惊,啊,google终于要找哦web操作系统啦,也是我便去google的lab去找这个产品,早来找不到。到最后回到作者的网页上才发现,原来这个应用并不是google搞得,而是另一款的flex网络应用程序。太有才,我只能这么说了,于是便赶到其主页一睹新鲜。这个应用搜集了google几乎所有的产品,不过现在做的不是太完善,还有很多的bug有待改进,不过我很期待这款应用程序何时才能

系统 2019-08-29 23:30:03 1760

编程技术

对于水平一般的程序员,技术要深度还是广度

我是学习java的,不是专业出身,数学水平不高,技术水平一般,1年工作经验。总觉得java是web的,不涉及到底层技术,含金量不高。想学一下知识,不知道学什么,是继续学习java(深度),还是学习C/C++,还是Linux等(广度)。想通过学习能让自己有个好的发展,好的待遇。在下非常感谢前辈们给的建议,我会认真考虑的。我想不至一条路可以成功,贵在坚持。对于水平一般的程序员,技术要深度还是广度

系统 2019-08-29 23:25:00 1760