❶ 基于回归分析的海洋地质调查研究及实例应用
梁广1,2邵长高1,2
(1.广州海洋地质调查局 广州 510760;2.国土资源部海底矿产资源重点实验室 广州 510760)
第一作者简介:梁广(1972—),男,工程师,主要从事网络管理和数据管理工作,E-mail:[email protected]。
摘要 近年来资源勘探已经覆盖大部分陆地区域,越来越多的国家把目光投向海洋。海洋作为一个巨大的能源和资源宝库在国民经济、军事战略等的重要性也日益显现。各个国家竞相制定海洋科技开发规划、战略计划,优先发展海洋新技术[1]。如何有效的从海量海洋地质调查数据中获取有用信息是海洋新技术研究中的重要研究内容。论文针对海洋地质调查数据研究技术应用需求,引入了回归分析模型到海洋地质调查数据库中,详细介绍了回归分析的技术方法和在海洋地质调查数据库研究中的应用优势,为海洋科学研究提供了技术支持。
关键词 海洋地质 回归分析 数据库
1 前言
随着陆地资源的消耗和人类对能源越来越强烈的需求,海洋作为一个尚待大规模开发的能源和资源宝库引起各国越来越多的关注。我国作为世界上最大的发展中国家对能源的需求也在大幅增加,近年来我国石油进口数量急剧增长,据估计到2020年我国石油进口依存度将达到60%。党和国家领导人多次提出“资源、能源、特别是油气资源,已成为我国经济和社会发展的重要因素,解决后备能源问题是保证国家经济安全的大事”。随着我国国土资源大调查和海洋地质专项调查的开展,大量的海洋地质数据被收集和积累,并建立了多个满足各自业务需求的信息系统和数据源[2]。如何有效的从海量海洋地质调查数据中获取有用信息是海洋新技术研究中的重要研究内容。论文针对海洋地质调查数据研究技术应用手段的需求,引入了回归分析技术到海洋地质调查数据库中,详细介绍了回归分析的技术方法和在海洋地质调查数据库研究中的应用优势,为海洋科学研究提供了技术支持。
2 回归分析概述
2.1 概述
回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析[3]。回归分析预测法可以从各数据之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测方法,通过对与预测对象(y)有联系的多个因素X1,X2,……,Xk建立回归模型。求出的回归模型是否合理,是否符合变量之间的客观规律性,引入相关因素是否有效,变量之间是否存在线性相关关系,模型能否付诸应用,这要通过检验决定。本文给出了两方面的检验:一方面为实际意义检验。即利用理论所拟定的期望值与实际结果相比较是否相符。另一方面为统计检验:分别为拟合优度检验(R平方检验)、方程显着性检验(F检验)、变量显着性检验(t检验)[4]。论文主要介绍一元线性回归分析在海洋地质调查数据库中的应用。
2.2 一元线形回归分析模型
线性回归分析可以描述两个要素之间的回归关系。线性回归分析公式为:yi=a+bxi+εi.其中a和b为参数.εi是误差.我们定义Q(a,b)a为总误差。则:
南海地质研究(2014)
对公式两边的a和b求导得:
南海地质研究(2014)
南海地质研究(2014)
x表示x的平均值.y表示y的平均值.
关系系数R2求值方法为[5]:
南海地质研究(2014)
2.3 多元线形回归分析模型
研究对象y受多个因素x1,x2,x3,…xn的影响,假定各个影响因素与y的关系是线性的,则可建立多元线性回归模型:
y=β0+β1x1+β2x2+…+βkxk+ε
式中:x1,x2,……,xk代表影响因子;ε 为随机误差;y 代表所研究的对象,即预测目标[3]。
2.4 统计检验
统计检验是运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验。这主要包括拟合优度检验、方程显着性检验、变量显着性检验,即常用的R2检验、F检验和t检验。
2.4.1 拟合优度检验(检验):
拟合优度检验就是检验回归方程对样本观测值的拟合程度。又称为复相关系数检验法,它是通过对总变差(总离差)的分解得到。
南海地质研究(2014)
其中
南海地质研究(2014)
总变差平方和S总是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;残差平方和S残是总变差平方和中未被回归方程解释的部分,由解释变量x1,x2……,xk中未包含的一切因素对被解释变量y的影响而造成的;回归平方和S回是总变差平方和中由回归方程解释的部分。对于一个好的回归模型,它应该较好地拟合样本观测值,S总中S残越小越好。于是可以用:
南海地质研究(2014)
求得[4]。
2.4.2 方程显着性检验(F 检验):
对于多元线性回归方程,方程显着性检验就是对总体的线性关系是否显着成立作出推断,即检验被解释变量y与所有解释变量X1,X2,……,Xk之间的线性关系是否显着,
南海地质研究(2014)
即F统计量服从以(k,n-k-1)为自由度的F分布。首先根据样本观测值及回归值计算出统计量F,于是在给定的显着性水平a下,若F>Fa(k,n-k-1),则拒绝H0,判定被解释变量y与所有解释变量x1,x2,……,xk之间的回归效果显着,即确实存在线性关系;反之,则不显着[4]。
2.4.3 变量显着性检验(t检验):
对于多元回归模型,方程的显着性并不意味每个解释变量对被解释变量y的影响都是重要的。如果某个解释变量并不重要,则应该从方程中把它剔除,重新建立更为简单的方程。所以必须对每个解释变量进行显着性检验。
在给定的显着性水平a下,若|ti|>ta/2(n-k-1),则拒绝H0,说明解释变量xi对被解释变量y有显着影响,即xi是影响y的主要因素;反之,接受H0,说明解释变量xi对被解释变量y无显着影响,则应删除该因素[4]。
3 应用实例
论文利用线形回归分析模型对南海海域海洋沉积物温度进行了分析,其中散点图显示如图1所示,回归分析结果见表1。
图1 水深与沉积物温度散点图
Fig.1 Water depth vs.sediment temperature
表1 水深沉积物温度回归分析结果Tab.1 The regression analysis result for Water depth vs.sediment temperature
读取回归结果如下:
截距:a=17.56;斜率:b=-0.0014;相关系数:R=0.276;测定系数:R2=0.076;F值:F=89.54。
建立回归模型,并对结果进行检验
模型为:
F值的计算公式和结果为:
南海地质研究(2014)
其中P<0.0001。回归结果证明,沉积物温度与海水深度有着密切的关系,但是通过散点图显示,并不是温度越深沉积物温度越低。而是受到其他例如海底热流,海洋环流等因素的影响。
4 结语
本文介绍了回归分析在海洋地质调查研究中的应用,同时提供了回归分析的技术原理及实现方法,并通过对南海沉积物与海水深度关系模型进行了应用分析,回归结果显示了两者具有密切但是存在不确定性的关系。实验结果得到有效的应用。
参考文献
[1]单宝强,毛永强.2005.GIS中的坐标系定义与转换[J].黑龙江国土资源,11,38-39
[2]苏国辉,孙记红,等.2011.海洋地质数据集成中的关键问题和方案[J].海洋地质前沿,11(27):51
[3]网络.回归分析.http://ke..com/view/145440.htm
[4]沈聪.2009.基于EXCEL的回归分析在足迹分析上的应用[M].辽宁警官高等专科学校本科毕业论文
[5]Cottrell A.Regression Analysis:Basic Concepts.http://www.wfu.e/~cottrell/ecn215/regress.pdf
The Marine Geological Survey Based on Regression Analysis
Liang Guang1,2,Shao Changgao1,2
(1.Guangzhou Marine Geological Survey,Guangzhou,510760;2.Key Laboratory of Marine Mineral Reasources,MLR,Guangzhou,510760)
Abstract:The new resources survey had covered most of the continental area at present.So,the ocean resources have attracted more and more attention now as it is a huge resource and energy reservoir that had a profound meaning to national economy and military strategy.The energy competition made manly countries developed new technology project and put the new ocean technology as the primary study area.However,how to abstract useful information from marine geological survey data is one of the most important study technologies.This paper focuses on the study of the deficit of marine database technology and introces regression analysis model and the application advantage of it.The purpose of this paper is to provide the technology support for marine study.Key word:Marine geology;Regression analysis model;Database
❷ 什么是回归分析,运用回归分析有什么作用
回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多重线性回归分析。
(2)应用回归分析方法进行数据统计分析的研究扩展阅读:
回归分析步骤
1、确定变量
明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。
2、建立预测模型
依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。
3、进行相关分析
回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。
4、计算预测误差
回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
5、确定预测值
利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
❸ 缁熻″︿负浠涔堣佽繘琛屽洖褰掑垎鏋锲炲綊鍒嗘瀽鍒嗙殑绉岖被链夊摢浜
缁熻″︿腑杩涜屽洖褰掑垎鏋愭湁浠ヤ笅鍑犱釜涓昏佺洰镄勶细
1銆佹帰绌跺彉閲忎箣闂寸殑鍏崇郴锛氩洖褰掑垎鏋愮敤浜庢帰绌惰嚜鍙橀噺涓庡洜鍙橀噺涔嬮棿镄勫叧绯汇傚畠鍙浠ュ府锷╂垜浠浜呜В鍙橀噺涔嬮棿镄勭浉浜掍綔鐢ㄥ拰褰卞搷绋嫔害锛屼互鍙婂畠浠濡备綍闅忕潃鍏朵粬鍙橀噺镄勫彉鍖栬屽彉鍖栥
2銆侀勬祴鍜岄勬祴寤烘ā锛氶氲繃寤虹珛锲炲綊妯″瀷锛屾垜浠鍙浠ヤ娇鐢ㄥ凡鐭ョ殑镊鍙橀噺鍊兼潵棰勬祴链鐭ョ殑锲犲彉閲忓笺傝繖瀵逛簬棰勬祴鍜屽埗瀹氩喅绛栭潪甯告湁鐢锛屼緥濡傛牴鎹骞垮憡鎶曞叆𨱒ラ勬祴阌鍞棰濄
3銆佹带鍒舵贩𨱒傚洜绱狅细鍦ㄨ傚疗鏁版嵁镞讹纴鍙鑳藉瓨鍦ㄥ叾浠栨湭钥冭槛镄勫洜绱犲瑰彉閲忎箣闂村叧绯荤殑褰卞搷銆傚洖褰掑垎鏋愬彲浠ュ府锷╂垜浠灏呜繖浜涙贩𨱒傚洜绱犳带鍒跺湪妯″瀷涓锛屼互镟村嗳纭鍦拌瘎浼拌嚜鍙橀噺涓庡洜鍙橀噺涔嬮棿镄勫叧绯汇
4銆佸亣璁炬楠岋细锲炲綊鍒嗘瀽鍙浠ョ敤浜庢楠岀爷绌朵腑镄勫亣璁俱傞氲繃姣旇缉镊鍙橀噺镄勭郴鏁颁笌闆剁殑锅囱惧硷纴鎴戜滑鍙浠ョ‘瀹氲嚜鍙橀噺鏄钖﹀瑰洜鍙橀噺链夋樉镢楀奖鍝嶃
锲炲綊鍒嗘瀽链夊氱岖被鍨嬶纴鍏朵腑涓浜涘父瑙佺殑鍖呮嫭锛
1銆佺亩鍗旷嚎镐у洖褰掞细鐢ㄤ簬镰旂┒涓涓镊鍙橀噺鍜屼竴涓锲犲彉閲忎箣闂寸殑鍏崇郴銆
2銆佸氩厓绾挎у洖褰掞细鐢ㄤ簬镰旂┒澶氢釜镊鍙橀噺涓庝竴涓锲犲彉閲忎箣闂寸殑鍏崇郴銆
3銆侀昏緫锲炲綊锛氱敤浜庣爷绌惰嚜鍙橀噺瀵逛簩鍒嗙被鎴栧氩垎绫荤殑褰卞搷銆
4銆佸氶”寮忓洖褰掞细鐢ㄤ簬镰旂┒闱炵嚎镐у叧绯荤殑锲炲綊妯″瀷銆
5銆侀潪鍙傛暟锲炲綊锛氱敤浜庣爷绌惰嚜鍙橀噺鍜屽洜鍙橀噺涔嬮棿镄勫叧绯伙纴钥屼笉渚濊禆浜庣壒瀹氱殑鍑芥暟褰㈠纺銆
杩椤彧鏄锲炲綊鍒嗘瀽镄勪竴灏忛儴鍒嗭纴杩樻湁鍏朵粬绫诲瀷镄勫洖褰掓柟娉曞拰鎶链锛屾牴鎹鍏蜂綋闂棰桦拰鏁版嵁绫诲瀷镄勪笉钖岋纴鍙浠ラ夋嫨阃傚悎镄勫洖褰掓ā鍨嬫潵杩涜屽垎鏋愩
❹ 鏁版嵁鍒嗘瀽锛氲В璇讳竴鍏幂嚎镐у洖褰掑垎鏋
锲炲綊鍒嗘瀽鏄涓绉嶉吨瑕佺殑缁熻″︽暟鎹鍒嗘瀽鏂规硶锛屽瑰叿链夊洜鏋滃叧绯荤殑褰卞搷锲犵礌锛堣嚜鍙橀噺锛夊拰棰勬祴瀵硅薄锛埚洜鍙橀噺锛夋墍杩涜岀殑鏁扮悊缁熻″垎鏋愬勭悊銆
锲炲綊鍒嗘瀽镄勭洰镄勶细
1.棰勬祴钬斺旈勬祴链𨱒ョ殑璧板娍瓒嫔娍
2.锲犲瓙鍒嗘瀽钬斺旂爷绌跺摢涓锲犵礌鏄链涓哄奖鍝嶈蛋钖戠殑锲犲瓙
浠涔堟槸涓鍏幂嚎镐у洖褰掞细
鍦ㄥ洖褰掑垎鏋愪腑锛屽彧鍖呮嫭涓涓镊鍙橀噺鍜屼竴涓锲犲彉閲忥纴涓斾簩钥呯殑鍏崇郴鍙鐢ㄤ竴𨱒$洿绾胯繎浼艰〃绀猴纴杩欑嶅洖褰掑垎鏋愮О涓轰竴鍏幂嚎镐у洖褰掑垎鏋愩
涓句緥璇存槑锛
濡傚浘镓绀猴纴链変竴涓鍏鍙革纴浠栦滑姣忎釜链堢殑鎶曞叆骞垮憡璐圭敤鍜屼骇鍑虹殑阌鍞棰濆备笅锲炬墍绀猴纴鎶婃暟鎹缁桦埗鍦ㄨ薄闄愪笂锛屽彲浠ュ缑鍒颁竴涓鏁g偣锲撅纴鍒╃敤excel鍙浠ュ埗浣滀竴𨱒℃嫙钖堢洿绾裤
濡备綍璇勪环锲炲綊绾挎嫙钖堢▼搴︾殑濂藉潖锛
鐢诲嚭镄勬嫙钖堢洿绾垮彧鏄涓涓杩戜技锛屽洜涓鸿偗瀹氩緢澶氱殑镣归兘娌℃湁钀藉湪鐩寸嚎涓婏纴R镄勫钩鏂癸纴涔熺О浣滃垽瀹氱郴鏁帮纴鐢ㄦ潵鍒ゆ柇锲炲綊鏂圭▼镄勬嫙钖堢▼搴︺
R镄勫钩鏂瑰彇鍊煎湪0-1涔嬮棿锛岃秺鎺ヨ繎1璇存槑𨰾熷悎绋嫔害瓒婇珮锛屾暟鎹鍏宠仈绯昏秺濂姐
鐩稿叧绯绘暟璇存槑锛
褰揜=1锛岃存槑X鍜孻瀹屽叏姝g浉鍏筹纴鍗冲彲浠ョ敤涓𨱒$洿绾匡纴鎶婃墍链夋牱链镣癸纸x,y锛夐兘涓茶捣𨱒ワ纴涓旀枩鐜囦负姝o绂
褰揜=-1锛岃存槑瀹屽叏璐熺浉鍏筹纴鍙婂彲浠ョ敤涓𨱒℃枩鐜囦负璐熺殑鐩寸嚎鎶婃墍链夌偣涓茶捣𨱒ワ绂
EXCEL镎崭綔鏂规硶
褰曞叆涓ゅ垪鏁板硷纴妗嗛夋暟鍊硷纴阃夋嫨鍒朵綔锲捐〃钬斺旈夋嫨鏁g偣锲撅纴镣瑰嚮锲捐〃鍐呯殑鍦嗙偣锛屽彸阌娣诲姞𨰾熷悎鐩寸嚎锛屽嵆鍙缁桦埗锛岃缮鍙浠ユ坊锷燫镄勫钩鏂瑰拰鏂灭巼锛
❺ 浠涔堟槸鏁版嵁锲炲綊鍒嗘瀽锛
鏁版嵁锲炲綊鍒嗘瀽镄勭洰镄勫拰镒忎箟鏄灏嗕竴绯诲垪褰卞搷锲犵礌鍜岀粨鏋滆繘琛屼竴涓𨰾熷悎锛屾嫙钖埚嚭涓涓鏂圭▼锛岀劧钖庨氲繃灏呜繖涓鏂圭▼搴旂敤鍒板叾浠栧悓绫讳簨浠朵腑锛屽彲浠ヨ繘琛岄勬祴銆
鍦ㄧ粺璁″︿腑锛屽洖褰掑垎鏋愭寚镄勬槸纭瀹氢袱绉嶆垨涓ょ崭互涓婂彉閲忛棿鐩镐簰渚濊禆镄勫畾閲忓叧绯荤殑涓绉岖粺璁″垎鏋愭柟娉曘傚洖褰掑垎鏋愭寜镦ф秹鍙婄殑鍙橀噺镄勫氩皯锛屽垎涓轰竴鍏冨洖褰掑拰澶氩厓锲炲綊鍒嗘瀽锛涙寜镦у洜鍙橀噺镄勫氩皯锛屽彲鍒嗕负绠鍗曞洖褰掑垎鏋愬拰澶氶吨锲炲綊鍒嗘瀽锛涙寜镦ц嚜鍙橀噺鍜屽洜鍙橀噺涔嬮棿镄勫叧绯荤被鍨嬶纴鍙鍒嗕负绾挎у洖褰掑垎鏋愬拰闱炵嚎镐у洖褰掑垎鏋愩
镓╁𪾢璧勬枡锛
锲炲綊鍒嗘瀽镰旂┒镄勪富瑕侀梾棰樻槸锛
锛1锛夌‘瀹歒涓岭闂寸殑瀹氶噺鍏崇郴琛ㄨ揪寮忥纴杩欑嶈〃杈惧纺绉颁负锲炲綊鏂圭▼锛
锛2锛夊规眰寰楃殑锲炲綊鏂圭▼镄勫彲淇″害杩涜屾楠岋绂
锛3锛夊垽鏂镊鍙橀噺X瀵瑰洜鍙橀噺Y链夋棤褰卞搷锛
锛4锛夊埄鐢ㄦ墍姹傚缑镄勫洖褰掓柟绋嬭繘琛岄勬祴鍜屾带鍒躲