最简单的网页取源(不用模拟浏览器的情况)1importrequests2defgetHTML(url):3try:4r=requests.get(url,timeout=30)5r.raise_for_status()6r.encoding='utf-8'7returnr.text8except:9return""10url="http://baidu.com"11print(getHTML(url))
系统 2019-09-27 17:50:19 1972
一、操作系统中相关进程的知识Unix/Linux操作系统提供了一个fork()系统调用,它非常特殊。普通的函数调用,调用一次,返回一次,但是fork()调用一次,返回两次,因为操作系统自动把当前进程(称为父进程)复制了一份(称为子进程),然后,分别在父进程和子进程内返回。子进程永远返回0,而父进程返回子进程的ID。这样做的理由是,一个父进程可以fork出很多子进程,所以,父进程要记下每个子进程的ID,而子进程只需要调用getppid()就可以拿到父进程的I
系统 2019-09-27 17:50:08 1972
前言一个偶然的机会来到博客园,看到了vamei的博文,瞬间被大神言简意赅,深入浅出的Python快速课程所吸引,开始了一步一步的学习编程之路。同时也惊闻大神因抑郁症去世,真是天妒英才,感慨万千。有兴趣的可以看看大神生前的文章。https://www.cnblogs.com/vamei/archive/2012/09/13/2682778.html第一课Python的优缺点以及干什么用的,想必大家都很了解。主要有:简单易学,功能强大,可移植性强等,是人工智能
系统 2019-09-27 17:49:55 1972
之前用featureCount处理得到结果,要提出第一列gene_id和readcount列,首先软件输出的第一行默认是你使用的命令行,没有用,用bash批量删掉。foriin`ls`;dosed-i'1d'$i;done删除当前文件夹下所有文件第一行。其实提出两列很简单,不过我受够了每次一个文件执行一次的烦。想搞成别的程序调用时命令行参数直接就行。第一次知道sys.argv这玩意,学到了。我设置了-i输入,-o输出这两个参数来判断输入输出文件个数,不过对
系统 2019-09-27 17:49:32 1972
简单的说,Python是一个“优雅”、“明确”、“简单”的编程语言。学习曲线低,非专业人士也能上手开源系统,拥有强大的生态圈解释型语言,完美的平台可移植性支持面向对象和函数式编程能够通过调用C/C++代码扩展功能代码规范程度高,可读性强目前几个比较流行的领域,Python都有用武之地。云基础设施-Python/Java/GoDevOps-Python/Shell/Ruby/Go网络爬虫-Python/PHP/C++数据分析挖掘-Python/R/Scala
系统 2019-09-27 17:49:25 1972
Django里面集成了SQLite的数据库,对于初期研究来说,可以用这个学习。第一步,创建数据库就涉及到建表等一系列的工作,在此之前,要先在cmd执行一个命令:pythonmanage.pymigrate这个命令就看成一个打包安装的命令,它会根据mysite/settings.py的配置安装一系列必要的数据库表第二步,我们要建立一个Model层,修改demo/model.py:fromdjango.dbimportmodelsclassQuestion(m
系统 2019-09-27 17:49:15 1972
因为盘搜搜索出来的链接有很多已经失效了,影响找数据的效率,因此想到了用爬虫来过滤出有效的链接,顺便练练手~这是本次爬取的目标网址http://www.pansou.com,首先先搜索个python,之后打开开发者工具,可以发现这个链接下的json数据就是我们要爬取的数据了,把多余的参数去掉,剩下的链接格式为http://106.15.195.249:8011/search_new?q=python&p=1,q为搜索内容,p为页码以下是代码实现:import
系统 2019-09-27 17:48:14 1972
cmp()方法返回两个数的差的符号:-1如果xy.语法以下是cmp()方法的语法:cmp(x,y)参数x--这是一个数值表达式y--这也是一个数值表达式返回值此方法如果xy则返回1例子下面的例子显示cmp()方法的使用#!/usr/bin/pythonprint"cmp(80,100):",cmp(80,100)print"cmp(180,100):",cmp(180,100)print"cmp(-80,100):",c
系统 2019-09-27 17:47:43 1972
sequence序列sequence(序列)是一组有顺序的对象的集合。序列可以包含一个或多个元素,也可以没有任何元素。我们之前所说的基本数据类型,都可以作为序列的对象。对象还可以是另一个序列。序列有两种:list(表)和tuple(元组)。list和tuple的主要区别在于,一旦建立,tuple的各个元素不可再变更,而list的各个元素可以再变更。List获得list元素的个数:复制代码代码如下:>>>lst=['更新慢','python',5.44,Fa
系统 2019-09-27 17:47:24 1972
Python的sys模块提供访问解释器使用或维护的变量,和与解释器进行交互的函数。通俗来讲,sys模块负责程序与python解释器的交互,提供了一系列的函数和变量,用于操控python运行时的环境。#!/usr/bin/envpython__author__="lrtao2010"#python3.7sys模块#sys模块负责程序与python解释器的交互,提供了一系列的函数和变量,#用于操控python运行时的环境。#sys.argv接收命令行参数,生成
系统 2019-09-27 17:47:24 1972