技术文档分享-数据科学小站技术文档分享

数据小站
数据科学成长之路
应用系列

数据可视化工具 rmarkdown的安装配置

rmarkdown是什么就不介绍了。直接在站点博客中记录内容,编写一些内容,涉及代码的部分还是比较麻烦。 Rmarkdown和jupyter的比较 Rmarkdown和jupyter的区别,rmarkdown是R语言中的拓展,jupyter...

机器学习

jieba结巴分词使用 python3中文分词

在中文的自然语言处理中,需要对中文进行分词。在python3的中文分词中,可以使用jieba来进行中文分词。 jieba分词是一款免费的中文分词工具,既然是免费的,就凑合用吧。和不同领域专业的分词工具,区别在于词库上。像医疗中的很多名词,显...

数学基础

常见的离散分布

退化分布、两点分布、离散均匀分布、二项分布、泊松分布、几何分布 两点分布 随机变量X取值只有两个x1,x2, 当 x1 x2为0 和1时, 为0-1分布记做:X~0-1(p) 或 X~B(1,p) 离散均匀分布 随机变量X的取值,在x1&#...

数学基础

线性代数中的内容回顾

朗斯基行列式–判断函数之间的线性相关性 函数也可以组成一个线性空间,符合线性空间的八条法则。可以通过朗斯基行列式,可以用来判别函数之间的线性相关性。 如果有n个函数f1(x)…..fn(x),要判断这n个函数之间的相...

python

pandas时间序列

pandas处理时间序列对象,主要是操作 DatetimeIndex和PeriodIndex 对象。 pandas时间戳序列 :DatetimeIndex对象 pandas时期对象 :PeriodIndex对象 DatetimeIndex

数学基础

数学建模分析中的一般方法

先列出数据建模分析应用中的一般名词吧,然后在逐个解析: 假设检验、方差分析、最优化模型,多元统计、时间序列分析、层次分析。 数学建模主用从数学角度,研究工业中出现的问题,针对每一类问题设计相应的模型,通过对模型的求解,来解决工业中实际的问题...

python

python3读取pdf内容

pdf文档解析库pdfminer.six 在python3环境下要对pdf文档进行解析,需要使用pdfminer.six库,通过pip install pdfminer.six进行安装。 在目前,存在pdfminer和pdfminer.si...

linux

linux下的软件服务安装管理

在centos7下,为系统装一个服务有两种方式,一种是通过系统提供的rpm/yum自动安装,一种是通过服务的官网提供的安装包进行安装。 rpm/yum 服务的安装及管理 yum -y install 包名: 可以通过yum方式默认安装当前y...

微积分

等价替换公式、导数公式

基本初等函数 幂函数、指数函数、对数函数、三角反三角函数,通过基本初等函数有限次的复合运算的函数都是初等函数。 初等函数的性质,初等函数在其定义域内,都是连续的。 极限等价无穷小的替换公式 常用的等价无穷小替换公式:x趋近于0点时, 无穷小...