⑴ 數據處理最基本的四種方法
數據處理最基本的四種方法列表法、作圖法、逐差法、最小二乘法。
數據處理過程:
數據處理的過程大致分為數據的准備、處理和輸出3個階段。在數據准備階段,將數據離線輸入到穿孔卡片、穿孔紙帶、磁帶或磁碟。這個階段也可以跡空稱為數稿州緩據的錄入階段。數據錄入以後,就要由計算機對數據進行處理,為此鍵模預先要由用戶編製程序並把程序輸入到計算機中,計算機是按程序的指示和要求對數據進行處理的。
數據處理系統已廣泛地用於各種企業和事業,內容涉及薪金支付,票據收發、信貸和庫存管理、生產調度、計劃管理、銷售分析等。它能產生操作報告、金融分析報告和統計報告等。數據處理技術涉及到文卷系統、資料庫管理系統、分布式數據處理系統等方面的技術。
⑵ 論文數據處理方法
論文數據處理方法
論文數據處理方法,相信絕大部分的小夥伴都寫過畢業論文吧,當然也會有正准備要寫畢業論文的小夥伴要寫畢業論文了,那麼論文數據處理方法大家都知道是什麼嗎?接下來讓我們一起來看看吧。
一是列表法。列表法就是將一組實驗數據和計算的中間數據依據一定的形式和順序列成表格。列表法可以簡單明確地表示出物理量之間的對應關系,便於分析和發現資料的規律性,也有助於檢查和發現實驗中的問題,這就是列表法的優點。設計記錄表格時要滿足以下幾點:
1、表格設計要合理,以利於記錄、檢查、運算和分析。
2、表格中涉及的各物理量,其符號、單位及量值的數量級均要表示清楚。但不要把單位寫在數字後。
3、表中數據要正確反映測量結果的有效數字和不確定度。列入表中的除原始數據外,計算過程中的一些中間結果和最後結果也可以列入表中。
此外,表格要加上必要的說明。通常情況下,實驗室所給的數據或查得的單項數據應列在表格的上部,說明寫在表格的下部。
二是作圖法。作圖法是在坐標紙上用圖線表示物理量之間的關系,揭示物理量之間的聯系。作圖法既有簡明、形象、直觀、便於比較研究實驗結果等優點,它是一種最常用的數據處理方法。作圖法的基本規則是:
1、根據函數關系選擇適當的坐標紙(如直角坐標紙,單對數坐標紙,雙對數坐標紙,極坐標紙等)和比例,畫出坐標軸,標明物理量符號、單位和刻度值,並寫明測試條件。
2、坐標的原點不一定是變數的零點,可根據測試范圍加以選擇。,坐標分格最好使最低數字的一個單位可靠數與坐標最小分度相當。縱橫坐標比例要恰當,以使圖線居中。
3、描點和連線。根據測量數據,用直尺和筆尖使其函數對應的實驗點准確地落在相應的位置。一張圖紙上畫上幾條實驗曲線時,每條圖線應用不同的.標記符號標出,以免混淆。連線時,要顧及到數據點,使曲線呈光滑曲線(含直線),並使數據點均勻分布在曲線(直線)的兩側,且盡量貼近曲線。個別偏離過大的點要重新審核,屬過失誤差的應剔去。
4、標明圖名,即做好實驗圖線後,應在圖紙下方或空白的明顯位置處,寫上圖的名稱、作者和作圖日期,有時還要附上簡單的說明,如實驗條件等,使讀者一目瞭然。作圖時,一般將縱軸代表的物理量寫在前面,橫軸代表的物理量寫在後面,中間用「~」聯接。
實驗數據的處理離不開繪製成表,列表法和作圖法還是有一定區別的。科研工作者在處理數據時,要注意根據實驗數據的特點,選擇是用列表法還是作圖法。
1、 基本描述統計
頻數分析是用於分析定類數據的選擇頻數和百分比分布。
描述分析用於描述定量數據的集中趨勢、波動程度和分布形狀。如要計算數據的平均值、中位數等,可使用描述分析。
分類匯總用於交叉研究,展示兩個或更多變數的交叉信息,可將不同組別下的數據進行匯總統計。
2、 信度分析
信度分析的方法主要有以下三種:Cronbach α信度系數法、折半信度法、重測信度法。
Cronbach α信度系數法為最常使用的方法,即通過Cronbach α信度系數測量測驗或量表的信度是否達標。
折半信度是將所有量表題項分為兩半,計算兩部分各自的信度以及相關系數,進而估計整個量表的信度的測量方法。可在信度分析中選擇使用折半系數或是Cronbach α系數。
重測信度是指同一批樣本,在不同時間點做了兩次相同的問題,然後計算兩次回答的相關系數,通過相關系數去研究信度水平。
3、 效度分析
效度有很多種,可分為四種類型:內容效度、結構效度、區分效度、聚合效度。具體區別如下表所示:
4、 差異關系研究
T檢驗可分析X為定類數據,Y為定量數據之間的關系情況,針對T檢驗,X只能為2個類別。
當組別多於2組,且數據類型為X為定類數據,Y為定量數據,可使用方差分析。
如果要分析定類數據和定類數據之間的關系情況,可使用交叉卡方分析。
如果研究定類數據與定量數據關系情況,且數據不正態或者方差不齊時,可使用非參數檢驗。
5、 影響關系研究
相關分析用於研究定量數據之間的關系情況,可以分析包括是否有關系,以及關系緊密程度等。分析時可以不區分XY,但分析數據均要為定量數據。
回歸分析通常指的是線性回歸分析,一般可在相關分析後進行,用於研究影響關系情況,其中X通常為定量數據(也可以是定類數據,需要設置成啞變數),Y一定為定量數據。
回歸分析通常分析Y只有一個,如果想研究多個自變數與多個因變數的影響關系情況,可選擇路徑分析。
⑶ 數據處理方法有哪些
數據處理方法有:
1、標准化:標准化是數據預處理的一種,目的的去除量綱或方差對分析結果的影響。作用:消除樣本量綱的影響;消除樣本方差的影響。主要用於數據預處理。
2、匯總:匯總是一悄渣個經常用於減小數據集大小的任務。匯總是一個經常用於減小數據集大小的任務。執乎運枝行匯總之前,應該花一些時間來清理數據,尤其要關注缺失值。
3、追加:追加節點將結構類似的歲敏表,選取一個主表,將另外的表追加在主表後面(相當於增加行記錄)。注意:要追加文件,欄位測量級別必須相似。例如,名義欄位無法附加測量級別為連續的欄位,即欄位類型的相同。
4、導出:用戶可以修改數據值並從現有數據中派生出新欄位。可以根據一個或多個現有欄位按6種方式創建出一個或者多個相同的新欄位。
5、分區:分區節點用於生成分區欄位,將數據分割為單獨的子集或樣本,以供模型構建的訓練、測試和驗證階段使用。通過用某個樣本生成模型並用另一個樣本對模型進行測試,可以預判此模型對類似於當前數據的大型數據集的擬合優劣。
⑷ 實驗數據處理方法
數據處理是物理實驗報告的重要組成部分,其包含的內容十分豐富,例如數據的記錄、函數圖線的描繪,從實驗數據中提取測量結果的不確定度信息,驗證和尋找物理規律等。
3、最小二乘法
用作圖法處理實驗數據獲得直線的斜率和截距等重要參數雖然 簡單明了,但是存在相當大的主觀成分,結果也往往因人而異。最小二乘法則是一種比較精確的直線擬合方法。它的依據是:對於等精度測量若存在一條最佳擬合直 線,那麼各測量值與這條直線上的對應點值之差的平方和應為極小。這里只考慮最簡單的直線擬合孝慎問題。假定每個數據點的測量都是等精度的,而且x的測量誤差很小,可忽略,只有y的測量存在測量誤差。
⑸ 常用的數據處理方法
前面所述的各種放射性測量方法,包括航空γ能譜測量,地面γ能譜測量和氡及其子體的各種測量方法,都已用在石油放射性勘查工作之中。數據處理工作量大的是航空γ能譜測量。
(一)數據的光滑
為了減少測量數據的統計漲落影響及地面偶然因素的影響,對原始測量數據進行光滑處理。消除隨機影響。
放射性測量數據光滑,最常用的光滑方法是多項式擬合移動法。在要光滑測量曲線上任取一點,並在該點兩邊各取m個點,共有2m+1點;用一個以該點為中心的q階多項式對這一曲線段作最小二乘擬合,則該多項式在中心點的值,即為平滑後該點的值。用此法逐點處理,即得光滑後的曲線,光滑計算公式(公式推導略)為
核輻射場與放射性勘查
式中:yi+j、yi為第i點光滑前後的值;Am,j為系數;Nm,p為規范化常數。
五點光滑的二次多項式的具體光滑公式為
核輻射場與放射性勘查
如果一次光滑不夠理想,可以重復進行1~2次,但不宜過多重復使用。
光滑方法,還有傅里葉變換法,以及多點平均值法,多點加權平均值法等。
使用哪種方法選定之後,一般都通過編程存入計算機,進行自動化處理。
圖7-21 是美國東得克薩斯州一個油田上的航空γ放射性異常中的兩條剖面圖(A-B和B-C)。經過光滑處理後,低值連續,清晰明顯,與油田對應的位置較好。說明四個油藏都在鈾(w(U))和鉀(w(K))的低值位置。
圖7-2-1 美國東得克薩斯油田航空γ放射性異常剖面圖
(二)趨勢面分析方法
趨勢分析主要反映測量變數在大范圍(區域)連續變化的趨勢。在原始數據中常含有許多隨機誤差和局部點異常,直觀反映是測量曲線上下跳動或小范圍突變。使用趨勢分析處理是為了得到研究區域輻射場的總體分布趨勢。
趨勢面分析,實質上是利用多元回歸分析,進行空間數據擬合。根據計算方法不同,又可分為圖解法趨勢面分析和數學計演算法趨勢面分析。圖解法趨勢面分析的基本思路是對觀測數據採用二維方塊取平均值法,或滑動平均值法計算趨勢值。方塊平均值法是對每一方塊內的數據取平均值,作為該方塊重心點的趨勢值。滑動平均值法是設想一個方框,放在測區數據分布的平面圖上,把落在方框內的測點數據取平均值,記在方框中心上,最後得到趨勢面等值圖。一般講做一次是不夠的,需要如此重復3~9次。一般都有專門程序可供使用(不作詳述)。如圖7-1-14(a)為原始數據等值圖,中間有許多呈點狀高值或低值分布,經過四次趨勢面分析之後可以清楚地看出三個低值異常區。
計演算法趨勢面分析是選定一個數學函數,對觀測數據進行擬合,給出一個曲線。擬合函數常用的有多項式函數,傅里葉級數,三角函數以及指數函數的多項式函數等。目前以二維多項式函數應用最多。
(三)岩性影響及其校正分析
不同岩石、不同土壤中放射性核素含量是有差別,有的相差還比較大,有的相差甚至超過10%~20%。這是油田放射性測量的主要影響因素。
一個測區可能出現不同土壤分布,把不同放射性水平的土壤上測量結果校正到同一水平(叫歸一化方法)是非常重要的工作,主要有下面三種方法。
1.確定土壤核素含量的歸一化方法
利用γ能譜測量資料,根據測區地質圖或土壤分布圖,分別統計總道的總計數率和鈾、釷、鉀含量的平均值。然後進行逐點校正,即逐點減去同類土壤的平均值,其剩餘值即為異常值。
ΔIij=Iij-Ii(i=1,2,3,…,n,為土壤類型)(7-2-3)
核輻射場與放射性勘查
核輻射場與放射性勘查
核輻射場與放射性勘查
式中:Ii、wij(U)、wij(Th)、wij(K)分別為第i類土壤中測點j的總計數和鈾、釷、鉀含量。
這個方法的缺點是計算工作量較大。
2.用釷歸一化校正鈾、鉀含量
表7-2-2 幾種岩石的釷、鈾、鉀含量
對自然界各種岩石中的釷、鈾、鉀含量的相關性研究(D.F.Saundr,1987),發現它們的含量具有很好的相關性(表7-2-2);而且隨岩性不同含量確有相應的增加或減小,據此可以利用釷的含量計算鈾和鉀的含量。釷有很好的化學穩定性,釷在地表環境條件下基本不流失。因此,利用釷含量計算出來的鈾、鉀含量,應當是與油藏存在引起的鈾、鉀異常無關的正常值。用每點實測的鈾、鉀,減去計算的正常值,那麼每個測點的鈾、鉀剩餘值(差值)應當是油氣藏引起的異常值。這樣就校正了岩性(土壤)變化的影響。
對於航空γ能譜測量的總道計數率,也同樣可以用釷含量(或計數率)歸一化校正總道計數率,效果也非常好。
具體方法如下。
1)對鈾、鉀的歸一化校正。
2)根據航空γ能譜測量或地面γ能譜測量數據,按測線計算鈾、釷、鉀含量。根據岩石(土壤)中釷與鈾,釷與鉀的相關關系(表7-2-1),認為鈾和釷存在線性關系,鉀和釷存在對數線性關系,於是建立相應的擬合關系式。
w點i(U)=A+Bwi(Th) (7-2-7)
w點i(K)=A′+B′lgwi(Th) (7-2-8)
式中:A、B、A′、B′為回歸系數(對每個測區得到一組常數);wi(Th)為測點i實測的釷含量;w點i(U)、w點i(K)為i點由釷含量計算的鈾、鉀含量。
計算每個測點的鈾、鉀剩餘值:
Δwi(U)=wi(U)-w點i(U)(7-2-9)
Δwi(K)=wi(K)-w點i(K)(7-2-10)
式中:wi(U)、wi(K)為測點i的實測值。剩餘值Δwi(U)和Δwi(K)為油藏引起的異常值。
南陽-泌陽航空γ能譜測區,測得的釷、鈾、鉀含量,按釷含量分間隔,計算其平均值,列於表7-2-3。根據此表中數據,由(7-2-7)和(7-2-8)式得:
w算i(U)=1.53+0.03 wi(Th)
w算i(K)=0.82+0.56 lgwi(Th)
表7-2-3 南陽—泌陽航空γ能譜計算的釷、鈾、鉀
3)對總道γ計數率的歸一化校正。釷比較穩定,可以認為與油氣藏形成的放射性異常無關。經研究得知,原岩的總道計數率(I點i)與釷含量的對數值存在近似的線性關系,即
I點i=AT+BTlgwi(Th) (7-2-11)
根據γ能譜實測數據求得實測i點的總道計數率(Ii)與I點i的差值:
ΔIi=Ii-I點i
即為消除岩性影響的,由油氣藏引起的γ總計數率異常值。
圖7-2-2 釷歸一化校正岩性影響的結果
(雙河油田,1100和11010測線剖面)
圖7-2-2為任丘雙河油田,兩條測線(1100線和11010線)。用釷歸一化法,消除岩性影響的結果。油田邊界高值和油田上方低值,除鉀11010線外都比較明顯清晰。與已知油田邊界基本一致。
⑹ 數據處理的常用方法有
1、列表法:是將實驗所獲得的數據用表格的形式進行排列的數據處理方法。列表法的作用有兩種:一是記錄實驗數據,二是能顯示出物理量間的對應關系。
2、圖示法:是用圖象來表示物理規律的一種實驗數據處理方法。一般來講,一個物理規律可以用三種方式來表述:文字表述、解析函數關系表述、圖象表示。
3、圖解法:是在圖示法的基礎上,利用已經作好的圖線,定量地求出待測量或某些參數或經驗公式的方法。
4、逐差法:由於隨機誤差具有抵償性,對於多次測量的結果,常用平均值來估計最佳值,以消除隨機誤差的影響。
5、最小二乘法:通過實驗獲得測量數據後,可確定假定函數關系中的各項系數,這一過程就是求取有關物理量之間關系的經驗公式。從幾何上看,就是要選擇一條曲線,使之與所獲得的實驗數據更好地吻合。
⑺ Python氣象數據處理與繪圖(2):常用數據計算方法
對於氣象繪圖來講,第一步是對數據的處理,通過各類公式,或者統計方法將原始數據處理為目標數據。
按照氣象統計課程的內容,我給出了一些常用到的統計方法的對應函數:
在計算氣候態,區域平均時均要使用到求均值函數,對應NCL中的dim_average函數,在python中通常使用np.mean()函數
numpy.mean(a, axis, dtype)
假設a為[time,lat,lon]的數據,那麼
需要特別注意的是,氣象數旅野埋據中常有缺測,在NCL中,使用求均值函數會自動略過,而在python中,當任意一數與缺測(np.nan)計算的結果均為np.nan,比如求[1,2,3,4,np.nan]的平均值,結果為np.nan
因此,當數據存在缺測數據時,通常使用np.nanmean()函數,用法同上,此時[1,2,3,4,np.nan]的平脊態均值為(1+2+3+4)/4 = 2.5
同樣的,求某數組最大最小值時也有np.nanmax(), np.nanmin()函數來補充np.max(), np.min()的不足。
其他很多np的計算函數也可以通過在前邊加『nan』來使用。
另外,
也可以直接將a中缺失值全部填充為0。
np.std(a, axis, dtype)
用法同np.mean()
在NCL中有直接求數據標准化的函數dim_standardize()
其實也就是一行的事,根據需要指定維度即可。
皮爾遜相關系數:
相關可以說是氣象科研中最常用的方法之一了,numpy函數中的np.corrcoef(x, y)就可以實現相關計算。但是在這里我推薦scipy.stats中的函數來計算相關系數:
這個函數缺點和有點拆螞都很明顯,優點是可以直接返回相關系數R及其P值,這避免了我們進一步計算置信度。而缺點則是該函數只支持兩個一維數組的計算,也就是說當我們需要計算一個場和一個序列的相關時,我們需要循環來實現。
其中a[time,lat,lon],b[time]
(NCL中為regcoef()函數)
同樣推薦Scipy庫中的stats.linregress(x,y)函數:
slop: 回歸斜率
intercept:回歸截距
r_value: 相關系數
p_value: P值
std_err: 估計標准誤差
直接可以輸出P值,同樣省去了做置信度檢驗的過程,遺憾的是仍需同相關系數一樣循環計算。
⑻ 如何使用excel函數數據處理
Excel中數據處理的方法很多,比如利用公式計算數據或者利用數據透視表分析數據等等,這里講解最基本的數據處理方法,利用公式對數據進行運算。
軟體版本:Office2013
方法如下:
1.直接運用運算符號進行數據運算,對A列數據求和,可以直接將數據相加:
⑼ 數據處理方式
什麼是大數據:大數據(big data),指無法在一定時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性),網路隨便找找都有。
大數據處理流程:
1.是數據採集,搭建數據倉庫,數據採集就是把數據通過前端埋點,介面日誌調用流數據,資料庫抓取,客戶自己上傳數據,把這些信息基礎數據把各種維度保存起來,感覺有些數據沒用(剛開始做只想著功能,有些數據沒採集, 後來被老大訓了一頓)。
2.數據清洗/預處理:就是把收到數據簡單處理,比如把ip轉換成地址,過濾掉臟數據等。
3.有了數據之後就可以對數據進行加工處理,數據處理的方式很多,總體分為離線處理,實時處理,離線處理就是每天定時處理,常用的有阿里的maxComputer,hive,MapRece,離線處理主要用storm,spark,hadoop,通過一些數據處理框架,可以吧數據計算成各種KPI,在這里需要注意一下,不要只想著功能,主要是把各種數據維度建起來,基本數據做全,還要可復用,後期就可以把各種kpi隨意組合展示出來。
4.數據展現,數據做出來沒用,要可視化,做到MVP,就是快速做出來一個效果,不合適及時調整,這點有點類似於Scrum敏捷開發,數據展示的可以用datav,神策等,前端好的可以忽略,自己來畫頁面。
數據採集:
1.批數據採集,就是每天定時去資料庫抓取數據快照,我們用的maxComputer,可以根據需求,設置每天去資料庫備份一次快照,如何備份,如何設置數據源,如何設置出錯,在maxComputer都有文檔介紹,使用maxComputer需要注冊阿里雲服務
2.實時介面調用數據採集,可以用logHub,dataHub,流數據處理技術,DataHub具有高可用,低延遲,高可擴展,高吞吐的特點。
高吞吐:最高支持單主題(Topic)每日T級別的數據量寫入,每個分片(Shard)支持最高每日8000萬Record級別的寫入量。
實時性:通過DataHub ,您可以實時的收集各種方式生成的數據並進行實時的處理,
設計思路:首先寫一個sdk把公司所有後台服務調用介面調用情況記錄下來,開辟線程池,把記錄下來的數據不停的往dataHub,logHub存儲,前提是設置好接收數據的dataHub表結構
3.前台數據埋點,這些就要根據業務需求來設置了,也是通過流數據傳輸到數據倉庫,如上述第二步。
數據處理:
數據採集完成就可以對數據進行加工處理,可分為離線批處理,實時處理。
1.離線批處理maxComputer,這是阿里提供的一項大數據處理服務,是一種快速,完全託管的TB/PB級數據倉庫解決方案,編寫數據處理腳本,設置任務執行時間,任務執行條件,就可以按照你的要求,每天產生你需要數據
2.實時處理:採用storm/spark,目前接觸的只有storm,strom基本概念網上一大把,在這里講一下大概處理過程,首先設置要讀取得數據源,只要啟動storm就會不停息的讀取數據源。Spout,用來讀取數據。Tuple:一次消息傳遞的基本單元,理解為一組消息就是一個Tuple。stream,用來傳輸流,Tuple的集合。Bolt:接受數據然後執行處理的組件,用戶可以在其中執行自己想要的操作。可以在里邊寫業務邏輯,storm不會保存結果,需要自己寫代碼保存,把這些合並起來就是一個拓撲,總體來說就是把拓撲提交到伺服器啟動後,他會不停讀取數據源,然後通過stream把數據流動,通過自己寫的Bolt代碼進行數據處理,然後保存到任意地方,關於如何安裝部署storm,如何設置數據源,網上都有教程,這里不多說。
數據展現:做了上述那麼多,終於可以直觀的展示了,由於前端技術不行,借用了第三方展示平台datav,datav支持兩種數據讀取模式,第一種,直接讀取資料庫,把你計算好的數據,通過sql查出,需要配置數據源,讀取數據之後按照給定的格式,進行格式化就可以展現出來
@jiaoready @jiaoready 第二種採用介面的形式,可以直接採用api,在數據區域配置為api,填寫介面地址,需要的參數即可,這里就不多說了。
⑽ 常用的數據處理方法
前面所述的各種放射性測量方法,包括航空γ能譜測量,地面γ能譜測量和氡及其子體的各種測量方法,都已用在石油放射性勘查工作之中。數據處理工作量大的是航空γ能譜測量。
(一)數據的光滑
為了減少測量數據的統計漲落影響及地面偶然因素的影響,對原始測量數據進行光滑處理。消除隨機影響。
放射性測量數據光滑,最常用的光滑方法是多項式擬合移動法。在要光滑測量曲線上任取一點,並在該點兩邊各取m個點,共有2m+1點;用一個以該點為中心的q階多項式對這一曲線段作最小二乘擬合,則該多項式在中心點的值,即為平滑後該點的值。用此法逐點處理,即得光滑後的曲線,光滑計算公式(公式推導略)為
核輻射場與放射性勘查
式中:yi+j、為第i點光滑前後的值;為系數;為規范化常數。
五點光滑的二次多項式的具體光滑公式為
核輻射場與放射性勘查
如果一次光滑不夠理想,可以重復進行1~2次,但不宜過多重復使用。
光滑方法,還有傅里葉變換法,以及多點平均值法,多點加權平均值法等。
使用那種方法選定之後,一般都通過編程存入計算機,進行自動化處理。
圖7-2-1是美國東得克薩斯州一個油田上的航空γ放射性異常中的兩條剖面圖(A-B和B-C)。經過光滑處理後,低值連續,清晰明顯,與油田對應的位置較好。說明四個油藏都在鈾(w(U))和鉀(w(K))的低值位置。
圖7-2-1 美國東得克薩斯油田航空γ放射性異常剖面圖
(二)趨勢面分析方法
趨勢分析主要反映測量變數在大范圍(區域)連續變化的趨勢。在原始數據中常含有許多隨機誤差和局部點異常,直觀反映是測量曲線上下跳動或小范圍突變。使用趨勢分析處理是為了得到研究區域輻射場的總體分布趨勢。
趨勢面分析,實質上是利用多元回歸分析,進行空間數據擬合。根據計算方法不同,又可分為圖解法趨勢面分析和數學計演算法趨勢面分析。圖解法趨勢面分析的基本思路是對觀測數據採用二維方塊取平均值法,或滑動平均值法計算趨勢值。方塊平均值法是對每一方塊內的數據取平均值,作為該方塊重心點的趨勢值。滑動平均值法是設想一個方框,放在測區數據分布的平面圖上,把落在方框內的測點數據取平均值,記在方框中心上,最後得到趨勢面等值圖。一般講做一次是不夠的,需要如此重復3~9次。一般都有專門程序可供使用(不作詳述)。如圖7-1-14(a)為原始數據等值圖,中間有許多呈點狀高值或低值分布,經過四次趨勢面分析之後可以清楚地看出三個低值異常區。
計演算法趨勢面分析是選定一個數學函數,對觀測數據進行擬合,給出一個曲線。擬合函數常用的有多項式函數,傅里葉級數,三角函數以及指數函數的多項式函數等。目前以二維多項式函數應用最多。
(三)岩性影響及其校正分析
不同岩石、不同土壤中放射性核素含量是有差別,有的相差還比較大,有的相差甚至超過10%~20%。這是油田放射性測量的主要影響因素。
一個測區可能出現不同土壤分布,把不同放射性水平的土壤上測量結果校正到同一水平(叫歸一化方法)是非常重要的工作,主要有下面三種方法。
1.確定土壤核素含量的歸一化方法
利用γ能譜測量資料,根據測區地質圖或土壤分布圖,分別統計總道的總計數率和鈾、釷、鉀含量的平均值。然後進行逐點校正,即逐點減去同類土壤的平均值,其剩餘值即為異常值。
核輻射場與放射性勘查
式中:分別為第 i類土壤中測點 j的總計數和鈾、釷、鉀含量。分別為i類土壤的平均總計數和鈾、釷、鉀的平均值。分別為扣除各類土壤平均值後的剩餘值,即為各測點不同土壤校正後的歸一化的油田的放射性異常。根據需要可以用來繪制平面剖面圖或等值線圖,即為經過不同岩性(土壤)校正後的油田放射性異常圖。
這個方法的缺點是計算工作量較大。
2.用釷歸一化校正鈾、鉀含量
對自然界各種岩石中的釷、鈾、鉀含量的相關性研究(D.F.Saundr,1987),發現它們的含量具有很好的相關性(表7-2-2);而且隨岩性不同含量確有相應的增加或減小,據此可以利用釷的含量計算鈾和鉀的含量。釷有很好的化學穩定性,釷在地表環境條件下基本不流失。因此,利用釷含量計算出來的鈾、鉀含量,應當是與油藏存在引起的鈾、鉀
表7-2-2 幾種岩石的釷、鈾、鉀含量
異常無關的正常值。用每點實測的鈾、鉀,減去計算的正常值,那麼每個測點的鈾、鉀剩餘值(差值)應當是油氣藏引起的異常值。這樣就校正了岩性(土壤)變化的影響。
對於航空γ能譜測量的總道計數率,也同樣可以用釷含量(或計數率)歸一化校正總道計數率,效果也非常好。
具體方法如下。
1)對鈾、鉀的歸一化校正。
2)根據航空γ能譜測量或地面γ能譜測量數據,按測線計算鈾、釷、鉀含量。根據岩石(土壤)中釷與鈾,釷與鉀的相關關系(表7-2-1),認為鈾和釷存在線性關系,鉀和釷存在對數線性關系,於是建立相應的擬合關系式。
核輻射場與放射性勘查
式中:A、B、A′、B′為回歸系數(對每個測區得到一組常數);wi(Th)為測點i實測的釷含量;w點i(U)、w點i(K)為i點由釷含量計算的鈾、鉀含量。
計算每個測點的鈾、鉀剩餘值:
核輻射場與放射性勘查
式中:wi(U)、wi(K)為測點i的實測值。剩餘值Δwi(U)和Δwi(K)為油藏引起的異常值。
南陽-泌陽航空γ能譜測區,測得的釷、鈾、鉀含量,按釷含量分間隔,計算其平均值,列於表7-2-3。根據此表中數據,由(7-2-7)和(7-2-8)式得:
核輻射場與放射性勘查
表7-2-3 南陽-泌陽航空γ能譜計算的釷、鈾、鉀
3)對總道γ計數率的歸一化校正。釷比較穩定,可以認為與油氣藏形成的放射性異常無關。經研究得知,原岩的總道計數率(I點i)與釷含量的對數值存在近似的線性關系,即
核輻射場與放射性勘查
根據γ能譜實測數據求得實測i點的總道計數率(Ii)與I點i的差值:
核輻射場與放射性勘查
即為消除岩性影響的,由油氣藏引起的γ總計數率異常值。
圖7-2-2 釷歸一化校正岩性影響的結果
圖7-2-2為任丘雙河油田,兩條測線(1100線和11010線)。用釷歸一化法,消除岩性影響的結果。油田邊界高值和油田上方低值,除鉀11010線外都比較明顯清晰。與已知油田邊界基本一致。