数据小站
数据科学成长之路

数学建模分析中的一般方法

先列出数据建模分析应用中的一般名词吧,然后在逐个解析:

假设检验、方差分析、最优化模型,多元统计、时间序列分析、层次分析。

数学建模主用从数学角度,研究工业中出现的问题,针对每一类问题设计相应的模型,通过对模型的求解,来解决工业中实际的问题。

机器学习和数学建模、统计学在大部分内容上基本一致,在基础的理论上是可以通用的。机器学习还可以看做是统计学在计算机上的实现。这篇文章就先只从数学的角度研究工业中的一些问题,只关注数学问题。

最优化问题

最优化模型用来解决最优化问题。最优化问题解决的是在现有的资源下或者客观的约束条件下,设计最优化模型,通过模型计算出如何分配,通过合理分配资源使得特定的指标达到最优化。

常用在线下规划问题中,如运输调度、规划之类等等,最优化的问题是运筹学中的一部分内容。

最优化问题的数据元素:决策变量、约束条件、目标函数。

最优化问题的一般思路:最优化问题需要研究问题场景后,合理设置决策变量,设计目标函数模型,通过问题的约束条件,求解出变量值。

最优化问题的一般术语

决策变量、约束条件、目标函数、可行域、可行解、最优解、全局最优解、局部最优解、最优值

可行域:在满足约束条件下可选择的范围
可行解: 在满足约束条件下,所有的目标值,可行域上的所有解
最优解: 让目标函数达到最优的解
全局最优解 : 在整个可行域上达到最优的解
局部最优解 : 在某个区间上达到最优的解,局部的极值
最优值 :最优解对应的模板函数值

最优化问题的分类:
按约束条件分类:无约束优化、有约束优化
按变量分:连续优化、组合优化
按求解分:目标规划、组合规划、动态规划、网络优化
按参数分:确定性规划、随机性规划
按目标分:单目标规划、多目标规划

在工业中,最优化问题解决的是资源调度、目标规划,如一家电商企业在全国各地有不同的仓储,全国各地的用户买的商品,发货时如何在各个仓库中合理分配,使得调度时间、仓库出货压力、物流里程等达到最优化。

在机器学习中,机器学习的一般思路,也是通过设计模型,求解模型极值。求解极值的过程,也是将一般模型,转换为凸优化问题。一旦完成优化,就能通过对损失函数的求解,计算出参数。机器学习中的凸优化问题后续再展开描述。

最优化问题:运输问题的求解建模

一般的运输问题,商品有多个产地,有多个销售地。每个产地的产量不同,每个销售点的销量也不同。不同产地与销售点之间,单位货运成本也不一样。一般运输问题的求解,就是解决如何分配不同产地与销售点之间的商品分配,使得总运费最小。又分为产销平衡、产大于销、销大于产问题。

一般的运输问题

一般运输问题的模型,就是 每个产地, 发往每个销售地点货运的成本,累加求和,求出所有情况下的最小成本。
约束条件是,每个产地的产量有限制,每个销售点的销量有限制,货运数量不能为负
一般求解思路是,建立模型后,循环遍历所有情况,在约束条件满足的情况下,取出最小值

一般运输问题的解决模型

在运输问题下,还会有转运的情况。产地的商品需要先统一运送到不同的仓库,再由各个仓库发往销售地。

最优化的其他问题,下料问题、指派问题、目标规划、装箱问题、生产问题、非线性规划、多目标规划..

多元统计分析模型

多元统计的问题,有多元线性回归、聚类分析、判别分析、主成分分析、因子分析等等。判别分析在机器学习中,对于的就是分类问题。

多元线性回归模型

多元回归模型是建立在一系列假设上,模型假设:
1.变量是确定性变量,非随机性变量
2.变量之间不相关,即不存在多重共线性
3.随机误差项和变量不相关,服从正态分布

多元线下回归模,可以直接通过最小二乘求理论解。在机器学习中,使用的是梯度下降的方式求近似解。

回归的显著性检验标准:用来检验模型是否可以真实用来预测、是否真实可用
1.拟合优度检验:R2 = SSR/SST

2.F检验,显著性检验:检验预测值y与变量x1,…xn之间整体的线性关系 3.t检验:通过F检验后,还需要检验每个变量x和因变量y之间的影响关系,并不是所有的x都重要。

聚类分析

贝叶斯分类

贝叶斯判别分析的基本原理是,当样本发送变化时,计算样本变化的前提下,样本在各个类别的概率,取条件概率最大的作为分类。

主成分分析

因子分析

因子分析也是一种降维思想,思路是从根据变量之间的相关性,将变量之间相关性高的分为一组,每一组变量代表一个基本结构。

时间序列分析

平稳性时间序列

平稳时序分析的三种常用模型:AR、MA、ARMA模型

平稳时间序列的统计性质,不会随着时间推移而改变。平稳时序的分布函数和时序无关,在工业应用中主用考察宽性:
1.平方的期望有限
2.Xt的期望为常数
3.自协方差函数相等

宽平稳序列性质

平稳性检验:时序图、自相关图

时序图:

自相关图:计算延迟期数不为0的各期自相关系数。随着期数推移自相关会衰减至0。

纯随机性检验:

AR模型:自回归模型

AR模型的基本模型原理是,xt的值,与xt的前n项成线性相关性。

AR自回归模型

AR模型的特点是 自相关系数为拖尾、偏自相关系数为截尾

MA模型:移动平均模型

AM移动平均的模型:是xt的值与xt的前n项的随机扰动加权。

MR移动平均模型

MA模型的特点是 自相关系数为截尾、偏自相关系数为拖尾。

ARMA模型:自回归移动平均模型

ARMA是将AR和MA结合在一起设计的模型。

ARMA模型

ARMA的自相关系数、偏自相关系数都是拖尾。

时序数列分析的建模步骤

1.时间平稳性、随机性检验:平稳性与白噪声检验
2.模型识别与优化:识别哪个模型最优
3.显著性检验:对残差的白噪声检验

模糊数学

赞(0) 打赏
未经允许不得转载:技术文档分享 » 数学建模分析中的一般方法

评论 抢沙发