推荐算法在互联网行业的应用非常广泛,今日头条、美团点评等都有个性化推荐,推荐算法抽象来讲,是一种对于内容满意度的拟合函数,涉及到用户特征和内容特征,作为模型训练所需维度的两大来源,而点击率,页面停留时间,评论或下单等都可以作为一个量化的Y值,这样就可以进行特征工程,构建出一个数据集,然后选择一个合适的监督学习算法进行训练,得到模型后,为客户推荐偏好的内容,如头条的话,就是咨询和文章,美团的就是生活服务内容。可选择的模型很多,如协同过滤,逻辑斯蒂回归,基于D
系统 2019-09-27 17:56:52 2251
importrename1="a#pple"#命名正确,aname2="apple!"ret=re.match("[a-zA-Z_][a-zA-Z0-9_]*",name1)ifret:print("命名正确,",ret.group())else:print("命名不正确")明明命名不合法,为什么返回正确,而且只匹配到正确部分因为默认match只会匹配开头(如果开头正确了,就等于匹配成功了)严格的匹配开头与结尾加上^和$(表示开头和结尾)importren
系统 2019-09-27 17:56:36 2251
#coding:utf-8'''@author:Jason.F@data:2019.07.15@function:Implementation:SVDBiasDatatset:Movielen-1mEvaluation:hitradio,ndcgSquaredlossfunctionwithexplicitrating.'''importpandasaspdimportnumpyasnpimportmathfromcollectionsimportdefa
系统 2019-09-27 17:54:27 2251
matplotlib图例中文乱码以及坐标负号显示在图片的标签名,标题名或者图例中出现中文时,直接运行会出现乱码,文字显示为框框importmatplotlib.pyplotaspltplt.figure()plt.title("哈哈")plt.show()快速解决办法在导入模块后加入下面代码plt.rcParams['font.sans-serif']=['SimHei']#用来正常显示中文标签plt.rcParams['axes.unicode_minu
系统 2019-09-27 17:52:29 2251
python运维必须会用的库:1os,pathlib(系统操作库)2logging(运维用到的核心库,用于快速写入日志,非常好用)3pymysql,pymssql,cx_oracle(这些是常用数据库驱动,很多,不一一列举)4datetime(日期计算最常用的库),time(经常在统计性能的时候用到,以及sleep)5random(随机数库,时常会用到)6threading,multiprocessing(多线程,多进程,什么区别就不赘述了,自己百度),q
系统 2019-09-27 17:51:46 2251
2019年7月15日17:24:49地点:武汉本人小白一枚记录一下学python的一点心得,主要记录python的基本数据类型。python基本数据类型包括:int(整型),float(浮点型),complex(复数),string(字符串),dict(字典),list(列表),tuple(元祖),set(集合),bool(布尔值)。记住查看数据类型时用type函数查看即可。int—整型a=0print(type(a))b=1**8#**表示乘方的意思,即
系统 2019-09-27 17:51:36 2251
个人理解这里的规范化处理指对提取后的特征集进行处理,不是对原始的数据信号进行处理,包括归一化和标准化。规范化的原因:不同特征具有不同量级时会导致:a.数量级的差异将导致量级较大的特征占据主导地位;b.数量级的差异将导致迭代收敛速度减慢;c.依赖于样本距离的算法对于数据的数量级非常敏感。归一化:,也就是原数据减去该特征列最小值,再除以该特征列的极差,将属性缩放到[0,1]之间。标准化:,也就是原数据减去该特征列的均值,再除以该特征列的标准差。注意:1.所谓规
系统 2019-09-27 17:48:10 2251
阅读更多分词工具的选择:现在对于中文分词,分词工具有很多种,比如说:jieba分词、thulac、SnowNLP等。在这篇文档中,笔者使用的jieba分词,并且基于python3环境,选择jieba分词的理由是其比较简单易学,容易上手,并且分词效果还很不错。分词前的准备:待分词的中文文档存放分词之后的结果文档中文停用词文档(用于去停用词,在网上可以找到很多)分词之后的结果呈现:图1去停用词和分词前的中文文档图2去停用词和分词之后的结果文档分词和去停用词代码
系统 2019-09-27 17:47:53 2251
目标:从零部署机器学习开发环境,包括python3.7安装、anaconda安装、虚拟环境部署、jupyternotebook界面优化、简单程序运行1、python安装https://www.python.org/2、anaconda安装https://www.anaconda.com/3、虚拟环境部署为方便后续开发,使用anaconda部署新的开发环境3.1、enviroment》base》openterminal3.2、condacreate-nenv
系统 2019-09-27 17:47:18 2251
对象我们可以通过以下几点来描述对象它们表示所开发的应用程序内的实体实体之间可以通过交互来解决现实世界的问题例如,Person是实体,而Car也是实体。Person可以驾驶Car,从一个地方开到另一个地方类类可以帮助开发人员表现现实世界中的主体类可以定义对象的属性和行为。属性是数据成员,行为由成员函数表示。类包含了构造函数,这些函数的作用是为对象提供初始状态。类就像模版一样,非常易于重复复用。例如,类Person可以带有属性name和age,同时提供成员函数
系统 2019-09-27 17:46:09 2251
Python3将数据保存为txt文件的方法,具体内容如下所示:f=open("data/model_Weight.txt",'a')#若文件不存在,系统自动创建。'a'表示可连续写入到文件,保留原内容,在原#内容之后写入。可修改该模式('w+','w','wb'等)f.write("hello,sha")#将字符串写入文件中f.write("\n")#换行if__name__=='__main__':fw=open("/exercise1/data/que
系统 2019-09-27 17:45:43 2251
python学习记录1——常用命令总结with关键字Python中的关键字with详解浅谈Python的with语句structPython使用struct处理二进制(pack和unpack用法)lambda表达式python–lambda表达式@装饰器特点:1参数是一个函数;2返回值是一个函数python装饰器Python函数装饰器装饰器-廖雪峰的官方网站defaultdict方法python中defaultdict方法的使用对dict进行排序pytho
系统 2019-09-27 17:56:11 2250
冒泡排序是一个排序算法。这个算法的名字由来是因为越大的元素会经由交换慢慢“浮”到数列的顶端。其核心是:重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。应用场景:小规模数据排序,队列从小到大排序实例:将下列列表从小到大进行排序List=[1,5,7,4,9]foriinrange(0,4):forjinrange(0,4-i):ifList[j]>Lis
系统 2019-09-27 17:55:44 2250
Python操作RabbitMQ发布/订阅(五)一、发布、订阅:我们将一个消息分发给多个消费者,这种模式被称为发布/订阅。为了更好的理解这个模式,我们将构建一个日志系统,它包括两个程序:第一个程序,负责发送日志消息;第二个程序,负责获取消息并输出内容;在日志系统中,所有正在运行的接收方程序都会接收消息;一个接受者,把日志写入硬盘中;另一个接受者,把日志输出到屏幕上;最终,日志消息被广播给所有的接受者。二、交换机(Exchanges):概念:应用程序发送消息
系统 2019-09-27 17:50:26 2250
本书特色Amazon编程入门类榜首图书从基本概念到完整项目开发,帮助零基础读者迅速掌握Python编程上到有编程基础的程序员,下到10岁少年,想入门Python并达到可以开发实际项目的水平,本书是最佳选择!本书是一本全面的Python编程从入门到实践教程,带领读者快速掌握编程基础知识、编写出能解决实际问题的代码并开发复杂项目。书中内容分为基础篇和实战篇两部分。基础篇介绍基本的编程概念,如列表、字典、类和循环,并指导读者编写整洁且易于理解的代码。另外还介绍了
系统 2019-09-27 17:49:13 2250