導航:首頁 > 研究方法 > 不存在線性趨勢可能的分析方法

不存在線性趨勢可能的分析方法

發布時間:2023-08-28 13:55:33

㈠ 趨勢分析法常見的有哪幾類 回歸分析法

趨勢分析法總體上分四大類:
(一)縱向分析法;
(二)橫向分析法;
(三)標准分析法;
(四)綜合分析法。

此外,趨勢分析法還有一種趨勢預測分析。趨勢預測分析運用回歸分析法、指數平滑法等方法來對財務報表的數據進行分析預測,分析其發展趨勢,並預測出可能的發展結果。

趨勢線性方程是作趨勢分析時,預測銷售和收益所普遍採用的一種方法。公式表示為:y=a+bx.其中:a和b為常數,x表示時期系數的值,x是由分配確定,並要使∑x=0。為了使∑x=0。當時期數為偶數或奇數時,值的分配稍有不同。

回歸分析法

回歸分析法是一種統計學上分析數據的方法,目的在於了解兩個或多個變數間是否相關、相關方向與強度,並建立數學模型以便觀察特定變數來預測研究者感興趣的變數。

回歸分析中,當研究的因果關系只涉及因變數和一個自變數時,叫做一元回歸分析;當研究的因果關系涉及因變數和兩個或兩個以上自變數時,叫做多元回歸分析。

此外,回歸分析中,又依據描述自變數與因變數之間因果關系的函數表達式是線性的還是非線性的,分為線性回歸分析和非線性回歸分析。

回歸分析法預測是利用回歸分析方法,根據一個或一組自變數的變動情況預測與其有相關關系的某隨機變數的未來值。進行回歸分析需要建立描述變數間相關關系的回歸方程。

根據自變數的個數,可以是一元回歸,也可以是多元回歸。根據所研究問題的性質,可以是線性回歸,也可以是非線性回歸。非線性回歸方程一般可以通過數學方法為線性回歸方程進行處理。

㈡ 趨勢分析法

趨勢分析法與滑動窗口平均法是目前重磁資料數據處理中常用的方法,參數選擇恰當時,可以獲得比較理想的分場效果。趨勢分析法的原理與異常平滑有相似之處,只不過這里是以一個一定階次的數學曲面來代表測區內異常變化的趨勢,並以此趨勢作為區域場來看待,從布格重力異常中減去這一區域異常,即獲得測區內的局部異常。

該方法是選用一個m階(沿測區x、y方向是一樣的)多項式來描述全測區的區域異常,m階多項式的一般形式為

地球物理勘探概論

式中:a0,a1,…,aM-1為M個待定系數。若多項式的階數為m,則

+1),

即為趨勢值(區域異常)。顯然,一階方程代表一個平面,二階方程代表一個二次曲面,高階方程則表示了一個高階曲面。

下面我們以二次曲面擬合區域異常為例來說明方法的原理。設趨勢面為

地球物理勘探概論

aj(j=0,1,2,…,5)為六個待定系數。在測區中按一定網格共選取n個測點,其坐標為(xi,yi),相應點的布格異常值為gi(i=1,2,…,n)。要使二次曲面能與重力異常的變化在最小二乘意義下得到最佳擬合,系數aj應滿足:

地球物理勘探概論

根據多元函數求極值法,則式(2-8-3)成立的條件是

地球物理勘探概論

於是可以得到一個包含待定系數aj的線性方程組,其矩陣形式為

地球物理勘探概論

式中:

地球物理勘探概論

當det(ATA)≠0時,可求得各系數aj,再利用式(2-8-3)便可計算出各網格點上的趨勢值

可以看出,在做趨勢分析時,坐標系是固定而非滑動的,因而必須求出所有的待定系數。多項式階次的選擇,應視區域異常的復雜程度來定,階次偏高,會造成趨勢值受局部異常的影響較大,造成最後的局部異常幅值被削弱。對重力異常的處理來說,一般選用2~3階為宜,復雜地區也只取4~5階;趨勢分析法同樣也會在分場時出現虛假異常問題,必要時可採用多次迭代的辦法予以消除。

㈢ 貝葉斯分析基礎——可信度、模型和參數

Doing Bayesian Data Analysis 學習筆記

假設某一天我們出門之後發現外面路面是濕的,並且我們想知道是什麼原因導致這樣的現象。導致路面濕的可能性有很多,比如之前下過雨,有灑水車路過,有人把自己喝的水撒掉了等等。如果到這個時候除了路面濕這個現象,其他的所有信息我們都不知道,那麼我們就會基於先前的知識來給各種可能性分配一個可信度。比如說這個地區幾十年沒有下過雨,我們就知道這個地方下雨的可能性不太大;或者我們知道每天這個時間點之前一段時間灑水車會經過,灑水車導致路面濕的可能性就相對較大。這種基於先前知識產生的對各種可能性的認識就是先驗信念。

我們繼續在路邊走,突然發現了一些新的證據:路面上只有灑水車能夠灑到的地方是濕的,其他地方比如人行道是乾的,這個時候我們就會重新調整我們的信念,我們會給各種可能的原因重新分配可信度,比如說下雨導致路面濕的概率會更低,而灑水車導致路面濕的概率會增加。

貝葉斯推論就是在各種可能性之間重新分配 可信度 ( 概率 )的過程,我們基於先驗信念,結合我們獲得的證據調整我們的信念,並獲得我們對各種可能性的概率的新的信念,也叫後驗分布。如果我們又收集到了新的證據,那麼先前的後驗分布就會變成先驗,我們再基於這個新的先驗調整我們的信念。

科學研究中所有測試都是帶有隨機性的,即使我們非常嚴格的控制各種無關變數的影響,但是依舊存在很多無關因素干擾測量結果。因此,數據和潛在的原因之間的關系具有概率性質,有可能是由於某種潛在的原因導致我們觀測到這樣的數據,但是也有可能是由於隨機因素導致我們觀察到這樣的數據結果。

以一個新葯葯效測試為例,假設我們想要檢測一種新葯能否有效降低血壓,所以我們將被試隨機分為兩組,實驗組服用葯品,控制組服用安慰劑,並且採用雙盲程序。每天我們都會在固定時間點測試被試的血壓水平,我們可以想像到,一個被試的血壓水平在一天中也會受到很多因素的影響, 比如說運動、焦慮、飲食等。更何況,血壓是通過測量佩戴一個加壓的血壓儀之後的血流的聲音來計算得到的,這個測量過程本身就存在誤差。血壓值也存在比較大的個體差異,所以我們最終得到的數據可能會比較混亂,控制組和實驗組的測量結果均存在較大的變異(方差較大);兩個組的結果分布也可能會存在重疊部分,實驗組的某些個體血壓可能會高於控制組。基於這兩組分散的且相互重疊的數據結果,我們想要推論控制組和實驗組有多大的差異,並且我們能否確定這個差異是真實存在的。 但問題的關鍵在於,控制組和實驗組的差異測量結果是帶有隨機性的,也就是說我們的數據是有噪音的。

所有的科學數據都帶有某種程度的噪音,而數據分析就是根據攜帶噪音的數據推斷潛在的趨勢。貝葉斯推論不能完全排除其他可能性,但是我們可以 通過數據逐漸調整不同可能性的可信度 。可信度的分布最初反映的是關於可能性的先驗知識,這個分布是一個比較模糊的分布;但是當獲得一批數據後,不同可能性的可信度重新分配,與數據一致的可能性的可信度增加,與數據不匹配的可能性的可信度降低。

貝葉斯統計推論是一個在各種可能性間不斷分配可信度的過程,這里所說的可能性實際上就是描述性模型的參數值。

在降壓葯的例子中,我們想要確定降壓葯是否能夠有效地降低血壓水平,就要對比實驗組和控制組的血壓差異。最終我們可能會選擇兩個組在操作前後血壓變化的平均值的差值作為這組數據的描述性模型:

上式中 代表A情況下所有被試血壓的平均值, 能夠有效反映降壓葯是否有效,如果 比較大(大於零),則說明降壓葯確實能夠有效降低血壓。
但是由於各種無關因素的影響,導致我們並沒有100%的把握說我們最後的測量結果就恰好等於實際的 ,所以我們就只能基於我們的測量結果進行推斷,給每一個可能的 分配一個可信度。

一般情況下,數據分析都是從數據的某個或某些描述性統計量出發的,這些描述性統計量(比如平均值)是能夠描述數據特徵的數學公式。這些公式是能夠計算出具體數值的,比如說平均值為3,這個值就叫做參數值。例如我們用一個正態分布來描述數據,則平均值和標准差兩個參數就能夠確定數據的特徵,平均值決定正態分布的位置,而標准差決定正態分布的寬度。

在選擇描述數據的數學模型的時候,首先要滿足兩個要求:

數據的數學模型並不等同於數據的產生過程。 比如說一個服從均值為10、標准差為5的正態分布的數據,只能說數據的表現形式為該正態分布,但是數據的一個物理產生過程卻不一定與正態分布有關。

實例:
假設我們現在想要探究人們身高和體重之間的關聯,基於日常經驗我們猜想人的身高越高,體重也越大,但是我們想知道體重隨著身高的具體數量變化關系是怎樣的,並且當身高增加時,我們有多大的把握確定體重的確按照這樣的數量關系增加?

第一步是確定研究相關的數據 。假設我們現在能夠收集到57個成年人的身高和體重數據,57個成人年從研究總體中隨機抽樣。身高的單位為英寸,體重為磅,均為連續變數。在這個例子中我們想要用身高來預測體重。

第二步是確定數據的描述性模型 ,這個模型與我們的研究目的相對應。在這個例子中,我們假設身高和體重成正比,記體重為 ,身高的預測值為 ,則有:

系數 代表身高增加1英寸時的體重增加量,基線 代表人的身高為0時的體重量,事實上由於人的身高下限高於0,所以不必嚴格限制 。
這個模型還並不完整,我們哈需要描述真實體重的隨機誤差,為了簡便,我們假設體重真實值 服從以預測值 為均值、以 為標准差的正態分布:

整個模型有三個參數:斜率 、截距 、噪音的標准差 。三個參數都是具有意義的,斜率參數代表高度增長一英寸對應的體重增長值,標准差參數反映體重圍繞著預測值的分散程度(變異程度)。

第三步是確定參數的先驗分布。 我們可以依據先前的研究結果來生成參數的先驗分布,或者我們可以依據一些得到較多人認可的實踐經驗來生成先驗分布。在這個例子中,我們採用比較模糊的、不蘊含信息量的先驗,斜率和截距的所有可能取值的先驗可信度相同,且可能取值的范圍均以0為中心,噪音參數的先驗分布為0到一個比較大的值的均勻分布。這種模糊的先驗分布暗示其對後驗分布並沒有任何有方向的影響。

第四步是得到後驗分布。 貝葉斯推論會針對眾多的參數值重新分配可信度,最終得到的後驗分布與實驗數據具有一致性。下圖展示了參數 的後驗分布,注意下圖展示的並不是實驗數據的分布,而是參數的分布。可以看出,可信度最高的斜率參數大約為4.1。下圖同樣展示了估計的參數值的不確定性,一種描述不確定性的方法是計算置信度最高的、包含分布95%的參數值的跨度,即下圖中的黑色橫線所表示的區間。這個區間稱為最大密度區間( highest density interval , HDI)。95%HDI裡面的參數值比之外的參數值具有更高的可信度,基於57對數據的95%HDI為 ,如果樣本量增加,斜率的估計將會更加准確,即HDI會更窄。

第五步是對模型進行檢驗, 即檢驗可信度最高的一些參數能夠足夠好地描述數據。這一項工作也叫後驗預測檢驗(posterior predictive check)。由於系統誤差的定義方法有很多,所以用來檢驗模型是否系統性的偏離數據的方法也有很多。
如果檢驗結果發現真實數據系統性的偏離模型的預測,那麼我們就應該考慮其他模型。在這個例子中,如果數據表現出非線性趨勢,那麼就應該選擇非線性模型來描述數據。

閱讀全文

與不存在線性趨勢可能的分析方法相關的資料

熱點內容
瓊脂的使用方法 瀏覽:452
蘋果6桌面快捷鍵怎麼設置在哪裡設置方法 瀏覽:205
復習是什麼教學方法 瀏覽:707
考核的教學方法 瀏覽:914
數字手機解鎖方法大全 瀏覽:349
用什麼方法做減法 瀏覽:2
高中遇到困難和解決的方法 瀏覽:739
防爆膜問題及解決方法 瀏覽:868
偏癱患者喙肱肌鍛煉方法 瀏覽:953
如何判定因式分解用哪種方法 瀏覽:699
羽悅草本使用方法 瀏覽:881
企業訂單銷量優化的方法有哪些 瀏覽:764
工業企業成本計算方法 瀏覽:182
大學學習過程中的問題及解決方法 瀏覽:621
如何散步是正確方法 瀏覽:852
卡西歐相機使用方法 瀏覽:707
重慶學校甲醛檢測的方法 瀏覽:973
跑工地的常用方法 瀏覽:492
2x13簡便計算方法 瀏覽:363
免洗噴霧使用方法 瀏覽:790