Ⅰ 数学建模数据处理方法
①根据某些特定的标准剔除过多的数据,比如:spss,SAS,EXCEL;
②对余下的数据进行处理,;
③数据过多的时候,把相类似的数据看作是一个数据群,再基于这些群进行研究;
④可以尝试一下SPSs里面的聚类分析之类的功能。
数学建模将各种知识综合应用于解决实际问题中,是培养和提高学生应用所学知识分析问题、解决问题的能力的必备手段之一。
数学建模是使用数学模型解决实际问题。
Ⅱ 数学分析模型(一):数据的无量纲处理方法及示例(附完整代码)
在对实际问题建模过程中,特别是在建立指标评价体系时,常常会面临不同类型的数据处理及融合。而各个指标之间由于计量单位和数量级的不尽相同,从而使得各指标间不具有可比性。在数据分析之前,通常需要先将数据标准化,利用标准化后的数据进行分析。数据标准化处理主要包括同趋化处理和无量纲化处理两个方面。数据的同趋化处理主要解决不同性质的数据问题,对不同性质指标直接累加不能正确反应不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对评价体系的作用力同趋化。数据无量纲化主要解决数据的不可比性,在此处主要介绍几种数据的无量纲化的处理方式。
可以选择如下的三种方式:
即每一个变量除以该变量取值的全距,标准化后的每个变量的取值范围限于[-1,1]。
即每一个变量与变量最小值之差除以该变量取值的全距,标准化后各变量的取值范围限于[0,1]。
,即每一个变量值除以该变量取值的最大值,标准化后使变量的最大取值为1。
采用极值化方法对变量数据无量纲化是通过变量取值的最大值和最小值将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级的影响。由于极值化方法对变量无量纲化过程中仅仅对该变量的最大值和最小值这两个极端值有关,而与其他取值无关,这使得该方法在改变各变量权重时过分依赖两个极端取值。
来计算,即每一个变量值与其平均值之差除以该变量的标准差,无量纲化后各变量的平均值为0,标准差为1,从而消除量纲和数量级的影响。虽然该方法在无量纲化过程中利用了所有的数据信息,但是该方法在无量纲化后不仅使得转换后的各变量均值相同,且标准差也相同,即无量纲化的同时还消除了各变量在变异程度上的差异。
,该方法在消除量纲和数量级影响的同时,保留了各变量取值差异程度上的信息。
(4)标准差化方法
。该方法是标准化方法的基础上的一种变形,两者的差别仅在无量纲化后各变量的均值上,标准化方法处理后各变量的均值为0,而标准差化方法处理后各变量均值为原始变量均值与标准差的比值。
综上所述,针对不同类型的数据,可以选择相应的无量纲化方法。如下的示例就是一个典型的评价体系中无量纲化的范例。
近年来我国淡水湖水质富营养化的污染日益严重,如何对湖泊水质的富营养化进行综合评价与治理是摆在我们面前的任务,下面两个表格分别为我国5个湖泊的实测数据和湖泊水质评价标准。
表1 全国五个主要湖泊评价参数的实测数据
表2 湖泊水质评价标准
(1)试用以上数据,分析总磷,耗氧量,透明度,总氨这4个指标对湖泊水质评价富营养化的作用。
(2)对这5个湖泊的水质综合评价,确定水质等级。
在进行综合评价之前,首先要对评价的指标进行分析。通常评价指标分成效益型,成本型和固定型指标。效益型指标是指那些数值越大影响力越大的统计指标(也称正向型指标);成本型指标是指数值越小越好的指标(也称逆向型指标);而固定型指标是指数值越接近于某个常数越好的指标(也称适度型指标)。如果每个评价指标的属性不一样,则在综合评价时就容易发生偏差,必须先对各评价指标统一属性。
(ⅰ)建立无量纲化实测数据矩阵和评价标准矩阵,其中实测数据矩阵和等级标准矩阵如下,
然后建立无量纲化实测数据矩阵和无量纲化等级标准矩阵,其中
得到
(ⅱ)计算各评价指标的权重
计算矩阵B的各行向量的均值和标准差,
最后对变异系数归一化得到各指标的权重为
(ⅲ)建立各湖泊水质的综合评价模型
通常可以利用向量之间的距离来衡量两个向量之间的接近程度,在Matlab中,有以下的函数命令来计算向量之间的距离;
dist(w,p): 计算中的每个行向量和中每个列向量之间的欧式距离;
mandist(w,p): 绝对值距离。
计算中各行向量到中各列向量之间的欧氏距离,
,则第个湖泊属于第级。
这说明杭州西湖,武汉东湖都属于极富营养水质,青海湖属于中营养水质,而巢湖和滇池属于富营养水质。
,则第个湖泊属于第级。
其评价结果与利用欧氏距离得到的评价结果完全一样。
所以,从上面的计算可以看出,尽管欧氏距离和绝对值距离的意义完全不一样,但对湖泊水质的评价等级是一样的,这表明了方法的稳定性。
各位老铁养成习惯,看完点个赞呗,随便也来个关注!!!
各位老铁养成习惯,看完点个赞呗,随便也来个关注!!!
各位老铁养成习惯,看完点个赞呗,随便也来个关注!!!
Ⅲ 数学建模常用模型有哪些
1. 蒙特卡洛算法:这种算法又称为随机性模拟算法,主要通过计算机仿真来解决问题。同时,它也可以用于验证模型的正确性,是数学建模比赛中经常使用的方法。
2. 数据拟合、参数估计、插值等数据处理算法:在数学建模比赛中,经常会遇到需要处理大量数据的情况。这些算法是处理数据的关键,通常使用Matlab作为工具。
3. 线性规划、整数规划、多元规划、二次规划等规划类问题:建模竞赛中的许多问题都属于最优化问题,这些问题往往可以通过数学规划算法来求解,常用的工具有Lindo、Lingo等。
4. 图论算法:图论算法包括多种类型,如最短路径、网络流、二分图等。涉及图论的问题可以使用这些算法来解决,需要认真准备。
5. 动态规划、回溯搜索、分治算法、分支定界等计算机算法:这些算法在算法设计中应用广泛,很多场合在数学建模竞赛中也会用到。
6. 最优化含混理论的三大非经典算法:模拟退火法、神经网络、遗传算法:这些算法用于解决一些较困难的最优化问题,对于某些问题非常有帮助,但算法实现较为复杂,需要谨慎使用。
7. 网格算法和穷举法:这两种算法都是暴力搜索最优解的方法,在许多数学建模竞赛题目中有所应用。当重点讨论模型本身而忽视算法时,可以使用这种暴力方法,建议使用高级编程语言实现。
8. 连续离散化方法:许多实际问题涉及连续数据,但计算机只能处理离散数据。因此,将连续数据离散化,用差分代替微分、用求和代替积分等思想非常重要。
9. 数值分析算法:如果在比赛中使用高级编程语言,那么像方程组求解、矩阵运算、函数积分等数值分析算法就需要调用外部库函数。
10. 图像处理算法:数学建模竞赛中与图形相关的问题以及论文中的图片处理,通常使用Matlab进行处理。
数学建模的作用:在应用数学解决实际问题时,建立数学模型是关键的一步。建模过程将复杂的实际问题简化为数学结构,涉及数据收集、问题分析和数学方法的应用。这一过程需要扎实的数学基础、洞察力和想象力,以及对实际问题的兴趣和广泛知识。数学建模是数学与实际问题之间的桥梁,是数学在各领域应用的基础,也是数学科技转化的主要途径。随着科技的发展,数学建模的重要性日益受到重视,已成为科技工作者必备的能力之一。
参考资料:http://ke..com/view/133261.htm#12_1