Python - 军军小站|张军博客
Python

使用python爬取微博数据打造一颗“心”

前言一年一度的虐狗节终于过去了,朋友圈各种晒,晒自拍,晒娃,晒美食,秀恩爱的。程序员在晒什么,程序员在加班。但是礼物还是少不了的,送什么好?作为程序员,我准备了一份特别的礼物,用以往发的微博数据打造一颗“爱心”,我想她一定会感动得哭了吧。哈哈准备工作有了想法之后就开始行动了,自然最先想到的就是用Python了,大体思路就是把微博数据爬下来,数据经过清洗加工后再进行分词处理,处理后的数据交给词云工具,配合科学计算工具和绘图工具制作成图像出来,涉及到的工具包有

系统 2019-09-27 17:53:34 1824

Python

Python正则表达式:字符集及内部顺序

1.基础内容[](中括号)用于描述正则表达式中的字符集,可以通过向字符集内部输入字符来自定义匹配的内容。importreregex1=re.compile('[ABC]')message1="Hello.ThisisABCclub.Amanwillserveyouthen."print(regex1.findall(message1))输出:[‘A’,‘B’,‘C’,‘A’]正则表达式会根据中括号里的任意一个字符进行匹配。如果想要匹配的字符很多,例如所有的

系统 2019-09-27 17:52:45 1824

Python

Python可视化数据库Dash

Dash简介Dash是一个用于构建Web应用程序的Python数据可视化库。它基于PythonWeb框架Flask以及Javascript绘图库Plotly.js和用于构建用户界面的Javascript库React.js,所以它非常适合用于构建后端基于Flask,前端数据可视化的Web网页。因为Dash应用程序可以在Web浏览器中显示,所以可以将这些Dash应用程序部署到服务器,通过URL共享。Dash应用程序由两部分组成,第一部分是布局(Layout),

系统 2019-09-27 17:52:31 1824

Python

Python调用C语言开发的共享库方法实例

在helloworld工程中,编写了一个简单的两个数值相加的程序,编译成为共享库后,如何使用python对其进行调用呢?使用ll命令列出当前目录下的共享库,其中共享库名为libhelloworld.so.0.0.0复制代码代码如下:ufo@ufo:~/helloworld/.libs$ll总用量32drwxr-xr-x2ufoufo40961月2914:54./drwxr-xr-x6ufoufo40961月2916:08../-rw-r--r--1ufou

系统 2019-09-27 17:51:25 1824

Python

初学Python需要安装哪些软件?

​算法工程师Python这几年热度逐渐上升,在很多高校Python也被列为通识课程,之所以如此受欢迎正是由于它的高效、简洁、易用、强大的第三方库等优点。如今在web开发、人工智能、大数据等方便应用非常广泛。不管你是否喜欢,不管怎么吐槽,如果想要从事人工智能,依然很难绕过Python,虽然这两年julia、Go被炒得也很热,但是在人工智能方面依然无法撼动Python的地位。目录Python解释器IDEpip代理虚拟环境Python解释器编程语言都会涉及编译器

系统 2019-09-27 17:50:07 1824

Python

shell,python,golang,日期时间与时间戳的转换

Shellshell获取文件最后修改时间的秒时间戳:stat-c%Y$path/$newest_logshell获取当前时间的秒时间戳:date+%s两个时间戳相减:timegap=$[$timestamp-$filetimestamp]将日期时间字符串转化为时间戳:date-d"2019-08-26"+%s将时间戳转化为日期时间字符串:date-d@1566748800获取n天前的日期时间:date-d"1dayago"+"%Y-%m-%d"获取n分钟前

系统 2019-09-27 17:48:12 1824

Python

【Python】pickle包的dump函数和load函数

pickle包的dump函数和load函数分别实现了数据的序列化和反序列化。一、dump()方法pickle.dump(obj,file,[,protocol])注释:序列化对象,将对象obj保存到文件file中去。参数protocol是序列化模式,默认是0(ASCII协议,表示以文本的形式进行序列化),protocol的值还可以是1和2(1和2表示以二进制的形式进行序列化。其中,1是老式的二进制协议;2是新二进制协议)。file表示保存到的类文件对象,f

系统 2019-09-27 17:47:49 1824

Python

Python测试模块doctest使用解析

面试被问到了却没有用过,很尴尬;今天看了一下,真的是一个很简单的测试模块方便起见,这里直接拿菜鸟教程的介绍和例子过来开发高质量软件的方法之一是为每一个函数开发测试代码,并且在开发过程中经常进行测试;doctest模块提供了一个工具,扫描模块并根据程序中内嵌的文档字符串执行测试;测试构造如同简单的将它的输出结果剪切并粘贴到文档字符串中;通过用户提供的例子,它强化了文档,允许doctest模块确认代码的结果是否与文档一致;defaverage(values):

系统 2019-09-27 17:47:00 1824

Python

在Python程序中操作文件之flush()方法的使用教程

flush()方法刷新内部缓冲区,像标准输入输出的fflush。这类似文件的对象,无操作。Python关闭时自动刷新文件。但是可能要关闭任何文件之前刷新数据。语法以下是flush()方法的语法:fileObject.flush();参数NA返回值此方法不返回任何值。例子下面的例子显示了flush()方法的使用。#!/usr/bin/python#Openafilefo=open("foo.txt","wb")print"Nameofthefile:",fo

系统 2019-09-27 17:46:31 1824

Python

Python 中的 global 标识对变量作用域的影响

global标识用于在函数内部,修改全局变量的值。我们可以通过以下规则,来判定一个变量到底是在全局作用域还是局部作用域:变量定义在全局作用域,那就是全局变量。变量在函数中定义,并且加了global标识,就是全局变量。如果变量在函数中仅做了定义,那么就是局部变量。如果变量在函数中仅仅是使用,那么就是全局变量。下面的示例,有助于理解上述规则:defcook():globaldumplingsdumplings='10'#全局变量print('cook():'+

系统 2019-09-27 17:46:12 1824

Python

Python中使用ElementTree解析XML示例

【XML基本概念介绍】XML指可扩展标记语言(eXtensibleMarkupLanguage)。XML被设计用来传输和存储数据。概念一:复制代码代码如下:#foo元素的起始标签#foo元素的结束标签#note:每一个起始标签必须有对应的结束标签来闭合,也可以写成概念二:复制代码代码如下:#元素可以嵌套到任意参次#bar元素为foo元素的子元素#父元素foo的结束标签概念三:复制代码代码如下:#foo元素有个lang的属性,该属性值为:EN;对应Pytho

系统 2019-09-27 17:46:02 1824

Python

浅谈python 四种数值类型(int,long,float,complex)

Python支持四种不同的数值类型,包括int(整数)long(长整数)float(浮点实际值)complex(复数),本文章向码农介绍python四种数值类型,需要的朋友可以参考一下。数字数据类型存储数值。他们是不可改变的数据类型,这意味着改变数字数据类型的结果,在一个新分配的对象的值。Number对象被创建,当你给他们指派一个值。例如:var1=1var2=10您也可以删除数字对象的参考,使用del语句。del语句的语法是:delvar1[,var2[

系统 2019-09-27 17:38:28 1824

Python

详解python中executemany和序列的使用方法

详解python中executemany和序列的使用方法一代码importsqlite3persons=[("Jim","Green"),("Hu","jie")]conn=sqlite3.connect(":memory:")conn.execute("CREATETABLEperson(firstname,lastname)")conn.executemany("INSERTINTOperson(firstname,lastname)VALUES(?,

系统 2019-09-27 17:38:07 1824

Python

python os、sys模块总结

OS模块的常见用法os.remove()删除文件os.rename()重命名文件os.walk()生成目录树下的所有文件名os.chdir()改变目录os.mkdir/mkdirs创建目录/多层目录os.rmdir/removedirs删除目录/多层目录os.listdir()列出指定目录的文件os.getcwd()取得当前工作目录os.chmod()改变目录权限os.path.basename()去掉目录路径,返回文件名os.path.dirname()

系统 2019-09-27 17:56:42 1823

Python

filter用法--Python

filter被称为高阶函数是有道理的。filter(self,/,*args,**kwargs)Docstring:filter(functionorNone,iterable)-->filterobjectReturnaniteratoryieldingthoseitemsofiterableforwhichfunction(item)istrue.IffunctionisNone,returntheitemsthataretrue.从Doc的简单描述可

系统 2019-09-27 17:56:08 1823