Python

文本倾斜校正的两种方法(Python-OpenCv)

一、通过minAreaRect方法获得斜率参考资料:【1】有关角度的说明,可供参考【2】https://blog.csdn.net/qq_24237837/article/details/77850496主要步骤:1、输入图片2、灰度化3、图像取非4、二值化5、获得有文本区域的点集6、求点集的最小外接矩形框,并返回旋转角度7、仿射变换,将原图校正参考代码:importnumpyasnpimportosimportcv2importmathdefrotate

系统 2019-09-27 17:55:13 2886

Python

递推最小二乘法——python程序

算法引用的数据为python自带的波士顿房价数据。代码如下:#data第一列为标记值#data后几列为特征向量#initialTheta为需要求得的thetaimportnumpyasnpimportsklearn.datasetsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportmean_squared_errorimportmatplotlibasmpli

系统 2019-09-27 17:56:20 2880

Python

"开火车的纸牌游戏"-python版本

小Byte和小Dance玩一种叫“开火车的”纸牌游戏,游戏规则如下:1.初始给两人随机平分52张扑克牌,每个人26张;2.小Byte先开始,将第一张牌放下;3.随后两人轮流按序(按从第一张到最后一张的顺序出牌,手中牌的顺序不可以被打乱)放置扑克,后一张扑克压在前一张扑克上;4.如果出现之前放下的某张扑克s和将要放下的扑克t点数相同,则当前玩家获得从s到t之间所有的牌(包括s和t这两张);5.玩家手上26张牌都出完后,清点双方获得的牌数,牌数多的玩家获胜,若

系统 2019-09-27 17:48:35 2876

Python

Python3使用科大讯飞API接口实现音频文件转写

注意事项科大讯飞语音转写API文档链接:https://www.xfyun.cn/doc/asr/lfasr/API.html.科大讯飞语音转写Python3的demo下载链接:http://xfyun-doc.ufile.ucloud.com.cn/1564736425808301/weblfasr_python3_demo.zip上一篇写了用百度智能云进行音频文件转写的博客,但是那个效果啊,有点惨不忍睹,至少我的识别结果是这样。然后转而使用了一下科大讯

系统 2019-09-27 17:50:42 2873

Python

python实现各种插值法(数值分析)

一维插值插值不同于拟合。插值函数经过样本点,拟合函数一般基于最小二乘法尽量靠近所有样本点穿过。常见插值方法有拉格朗日插值法、分段插值法、样条插值法。拉格朗日插值多项式:当节点数n较大时,拉格朗日插值多项式的次数较高,可能出现不一致的收敛情况,而且计算复杂。随着样点增加,高次插值会带来误差的震动现象称为龙格现象。分段插值:虽然收敛,但光滑性较差。样条插值:样条插值是使用一种名为样条的特殊分段多项式进行插值的形式。由于样条插值可以使用低阶多项式样条实现较小的插

系统 2019-09-27 17:53:54 2863

Python

使用python代码调用三汇语音卡硬件拨打电话

defpush_notification_by_call(voice,worker_phone_num):"""语音提醒:paramvoice:音频文件:paramworker_phone_num:用户电话:return:"""phone_num=str(worker_phone_num)shap3=ctypes.cdll.LoadLibrary("C:\Windows\SHP_A3.dll")#加载动态链接库shap3.SsmStartCti(path.

系统 2019-09-27 17:52:48 2862

Python

使用Python将文本按标点整句切分

利用分词工具包例如jieba可以轻易的将句子切分为不同的单词,但是当你有切分整句的需求时,该怎么解决呢?将段落按句号切分整句1.jieba分词可以切分单词进行中文自然语言处理时,分词是一个常见的操作,例如:importjieba.possegaspsegtxt="【#奔驰女车主不接受4S店道歉#双方现场交涉言语激烈】4月13日,西安维权奔驰女车主和4S店方见面,双方并未当场和解。4S店相关负责人称,由于出差等原因未及时联系车主,车主则反驳称,可通过电话联系

系统 2019-09-27 17:49:47 2861

Python

Python 安装cv2包出错

命令行输入pipinstallcv2时报错ERROR:Couldnotfindaversionthatsatisfiestherequirementcv2(fromversions:none)ERROR:Nomatchingdistributionfoundforcv2原因是CV2在的软件包不叫cv2而是叫opencv-python命令换成pipinstallopencv-python就可以了

系统 2019-09-27 17:46:15 2858

Python

用Python实现最速下降法求极值的方法

对于一个多元函数,用最速下降法(又称梯度下降法)求其极小值的迭代格式为其中为负梯度方向,即最速下降方向,αkαk为搜索步长。一般情况下,最优步长αkαk的确定要用到线性搜索技术,比如精确线性搜索,但是更常用的是不精确线性搜索,主要是Goldstein不精确线性搜索和Wolfe法线性搜索。为了调用的方便,编写一个Python文件,里面存放线性搜索的子函数,命名为linesearch.py,这里先只编写了Goldstein线性搜索的函数,关于Goldstein

系统 2019-09-27 17:56:03 2843

Python

[Python知识图谱] 二.哈工大pyltp词性标注、命名实体识别、依存

本系列文章主要结合Python语言实现知识图谱构建相关工程,具有一定创新性和实用性,非常希望各位博友交流讨论,相互促进成长。第一篇文章主要介绍哈工大pyltp工具,包括安装过程、中文分词等;第二篇文章主要讲解词性标注、实体识别、依存句法分析和语义角色标注。知识图谱系列文章:[知识图谱实战篇]一.数据抓取之Python3抓取JSON格式的电影实体[知识图谱实战篇]二.Json+Seaborn可视化展示电影实体[知识图谱实战篇]三.Python提取JSON数据

系统 2019-09-27 17:49:45 2843

Python

[Python知识图谱] 三.Jieba工具中文分词、添加自定义词典及词性标注

本系列文章主要结合Python语言实现知识图谱构建相关工程,具有一定创新性和实用性,非常希望各位博友交流讨论,相互促进成长。前面两篇文章详细讲解了哈工大Pyltp工具,包括中文分词、词性标注、实体识别、依存句法分析和语义角色标注等。但是其中文分词效果不是很理想,如“贵州财经大学”总是切分成“贵州”、“财经”和“大学”,这是因为词典中这些词的权重较高。这篇文章主要介绍最经典的自然语言处理工具之一——Jieba,包括中文分词、添加自定义词典及词性标注等内容。知

系统 2019-09-27 17:55:18 2842

Python

python字符串各种颜色输出

\033[1;31;40m#1是显示方式(可选),31是字体颜色,40m是字体背景颜色;\033[0m#恢复终端默认颜色,即取消颜色设置;#!/usr/bin/envpython#-*-coding:utf-8-*-#字体颜色print"=====字体颜色======"foriinrange(31,38):print"\033[%s;40mHelloworld!\033[0m"%i#背景颜色print"=====背景颜色======"foriinrange

系统 2019-09-27 17:57:09 2839

Python

python 正则表达式解决包含且不包含某字符串的问题

本测试使用python的re.compile与re.search作为方法测试包含error不包含abc的实例python简单正则里只介绍到了不包含某字符的正则:[^1-9a-z],[^abc]也只能完成不匹配a、b、c三个字母的功能,但是这个并不能实现不匹配"abc“字符串的功能这里要用到正则表达式中的断言知识:(?=X)零宽度正先行断言。仅当子表达式X在此位置的右侧匹配时才继续匹配。例如,/w+(?=/d)与后跟数字的单词匹配,而不与该数字匹配。此构造不

系统 2019-09-27 17:56:55 2838

Python

[Python知识图谱] 三.Jieba工具中文分词、添加自定义词典及词性标注

本系列文章主要结合Python语言实现知识图谱构建相关工程,具有一定创新性和实用性,非常希望各位博友交流讨论,相互促进成长。前面两篇文章详细讲解了哈工大Pyltp工具,包括中文分词、词性标注、实体识别、依存句法分析和语义角色标注等。但是其中文分词效果不是很理想,如“贵州财经大学”总是切分成“贵州”、“财经”和“大学”,这是因为词典中这些词的权重较高。这篇文章主要介绍最经典的自然语言处理工具之一——Jieba,包括中文分词、添加自定义词典及词性标注等内容。知

系统 2019-09-27 17:55:18 2837