编程技术 - 军军小站|张军博客
Python

Python 爬虫:scrapy 没有crawl 命令

scrapy爬虫框架启用命令注意事项1.cd到你指定的文件夹下;2.scrapystartprojectSpider(项目名字:自定义);3.cdSpider(cd到你创建的项目下);4.scrapygenspiderexample(爬虫.py的名字)example.com9(你要访问的域名,不要写http/https协议);5.scrapycrawlexample(爬虫py.的名字)在执行第4步时,一定要保证在你创建的爬虫项目之下去执行命令,否则爬虫文件

系统 2019-09-27 17:52:55 2196

Python

Python 卸载一个第三方模块,并卸载其依赖包

原文链接:https://www.jianshu.com/p/81bffb457ac4使用pip安装了一个Python的第三方模块的时候,总会安装其依赖的其他模块。而当我们卸载的时候,却不能将其依赖的模块一并删除。现在我想要达到的效果就是当我删除某一个模块的时候,我希望将其依赖的模块也删掉。想要达到这个目标,需要知道下面这些东西:pipshow<模块名>这个命令行命令可以查看一个包的详细信息,包括这个包的依赖关系。重要的一点是,如果输入的模块包根本不存在,

系统 2019-09-27 17:47:40 2196

Python

python用match()函数爬数据方法详解

match()函数的使用。以及从文本中提取数据的方法。在学习re模块的相关函数前应了解正则表达式的特殊字符准备一个要爬取的文本文档:直接从某个网页拷贝一份代码,粘贴在一个txt文件里,以供学习。方法很简单,比如打开百度视频的热门电影网页,右键点击查看源代码,然后复制,粘贴到一个txt文件里,保存到工作目录下。有4000多行。re.match(pattern,string,flags=0)①pattern,是正则表达式。string,被检验的字符串。②fla

系统 2019-09-27 17:46:09 2196

Python

Python模拟百度登录实例详解

最近公司产品和百度贴吧合作搞活动,为了增加人气,打算做个自动签到的小程序。这个是测试登录的代码,写的比较随意,仅实现了登录并读取关注贴吧列表,下边的就比较简单。百度登录还是有点麻烦的,由于用的ssl,所以要先获取token,然后再登录,这个用finddle2分析下,还是比较好解决的。#-*-coding:utf8-*-importurllib2importurllibimportcookielibimportreimportbs4URL_BAIDU_IND

系统 2019-09-27 17:38:35 2196

编程技术

猎头读书链接

10月17日如何准备软件工程师的面试对《如何准备软件工程师的面试》的补充如何写一份好的工程师简历博客创作十大秘笈RecruitingFirmSuesAkinGumpforFeesInPartnerPlacementJobSearchVerticls-ThislistSo,YouWannaBeARecruiter?AttractingandRetainingITPros:AnIdeaYouMayNotHaveThoughtOf猎头读书链接

系统 2019-08-29 23:51:08 2196

编程技术

制作多级滑动tab菜单

效果演示网站:http://kr.shopping.yahoo.com/就是上面网址中居中的那个多级的滑动tab菜单,下面的图是我自己用jquery制作出的效果:我自己制作的效果演示网址是:http://taotao.wsyren.com/multitab/multitab.html总的来说制作这个效果用到的js代码并不是很难,难的主要就是CSS的样式设置问题,以上代码兼容ie6,7,8,opera,ff,chrome.附上源码,供有需要的朋友下载改动!制

系统 2019-08-29 23:40:49 2196

Java

java 正则表达式 pattern.unix_lines(即?d)解

在使用Pattern.compile函数时,可以加入控制正则表达式的匹配行为的参数:PatternPattern.compile(Stringregex,intflag)flag的取值范围如下:Pattern.CANON_EQ当且仅当两个字符的"正规分解(canonicaldecomposition)"都完全相同的情况下,才认定匹配。比如用了这个标志之后,表达式"a\u030A"会匹配"?"。默认情况下,不考虑"规范相等性(canonicalequival

系统 2019-08-29 23:31:52 2196

编程技术

OA开发笔记

OfficeAutomation,简称OA,是一种常见的办公管理系统。包括采购,销售,财务及人事和管理模块。我现在讲述的OA是根据讯盟软件的OA进行二次开发的OA。讯盟的OA是通过加密狗来加密的,我通过更换exe程序已经把OA的加密破解了。通过jad编译里面的Class文件,我可以修改其用户数的限制。里面的源代码多数是JSP的,做入门的时候做修改非常的容易,但安全性不够。里面的代码非常的杂乱,我花了很多时间才把代码看清楚。用户登陆:供应商要增加运费负担(卖

系统 2019-08-29 23:02:29 2196

Android

2011.09.13(2)——— android 图标上面添加数

2011.09.13(2)———android图标上面添加数字参考:http://flysnow.iteye.com/blog/906770新建名为NotificationIconCount的AndroidProject。首先修改AndroidManifest.xml,加入权限,因为我们要读取联

系统 2019-08-29 22:41:45 2196

编程技术

Asterisk::AMI perl 实现

useAsterisk::AMI;my$astman=Asterisk::AMI->new(PeerAddr=>'127.0.0.1',PeerPort=>'5038',Username=>'admin',Secret=>'supersecret');die"Unabletoconnecttoasterisk"unless($astman);my$action=$astman->({Action=>'Command',Command=>'sipshowpe

系统 2019-08-29 22:06:51 2196

Android

Android 4.1官方文档chm格式

最近看到一个开源项目,某位爱好者把Android4.1官方文档做成了CHM,就像jdk的chm一样,查阅API极其方便。Thethingis,I’vealwayspreferredtoworkwithdocumentationsinWindowsCHMformat.Why?Because:1.CHMdocumentscomewithabuilt-inmenu.2.CHMdocumentscomewithanindex.3.CHMdocumentscomew

系统 2019-08-12 09:30:38 2196

编程技术

XNA2D缩放图片的两种方法

第一种,原样放大图片MatrixscaleMatrix=Matrix.CreateScale(stretchX,stretchY,0f);spriteBatch.Begin(SpriteSortMode.Deferred,BlendState.AlphaBlend,null,null,null,null,scaleMatrix);第二种,放大图片并且模糊图像spriteBatch.Draw(texture,newVector2(10,20),null,Co

系统 2019-08-12 09:29:56 2196

编程技术

CodeForces Round 200 Div2

这次比赛出的题真是前所未有的水!只用了一小时零十分钟就过了前4道题,不过E题还是没有在比赛时做出来,今天上午我又把E题做了一遍,发现其实也很水.昨天晚上人品爆发,居然排到Rank55,运气好的话没准能领到T-shirt.除此之外,锁上程序之后,看到一个人数组开小了,我还提交了一个大数据,成功Hack了一次,然后Room排名顿时升到第1.Mysubmissions#WhenWhoProblemLangVerdictTimeMemory4474604Sep15

系统 2019-08-12 01:32:34 2196

Python

python 使用get_argument获取url query参数

python使用get_argument获取urlquery参数ornado的每个请求处理程序,我们叫做handler,handler里可以自定义自己的处理程序,其实也就是重写方法,如post,get,get_current_user,send_error等等,这里我们只讲get和post的自定义。我们都知道,在Tornado里,获得用户的输入,都是一个get_argument搞定,似乎很顺理成章:defpost(self):nowamagic=self.

系统 2019-09-27 17:55:52 2195