① 常用的數據處理方法
前面所述的各種放射性測量方法,包括航空γ能譜測量,地面γ能譜測量和氡及其子體的各種測量方法,都已用在石油放射性勘查工作之中。數據處理工作量大的是航空γ能譜測量。
(一)數據的光滑
為了減少測量數據的統計漲落影響及地面偶然因素的影響,對原始測量數據進行光滑處理。消除隨機影響。
放射性測量數據光滑,最常用的光滑方法是多項式擬合移動法。在要光滑測量曲線上任取一點,並在該點兩邊各取m個點,共有2m+1點;用一個以該點為中心的q階多項式對這一曲線段作最小二乘擬合,則該多項式在中心點的值,即為平滑後該點的值。用此法逐點處理,即得光滑後的曲線,光滑計算公式(公式推導略)為
核輻射場與放射性勘查
式中:yi+j、為第i點光滑前後的值;為系數;為規范化常數。
五點光滑的二次多項式的具體光滑公式為
核輻射場與放射性勘查
如果一次光滑不夠理想,可以重復進行1~2次,但不宜過多重復使用。
光滑方法,還有傅里葉變換法,以及多點平均值法,多點加權平均值法等。
使用那種方法選定之後,一般都通過編程存入計算機,進行自動化處理。
圖7-2-1是美國東得克薩斯州一個油田上的航空γ放射性異常中的兩條剖面圖(A-B和B-C)。經過光滑處理後,低值連續,清晰明顯,與油田對應的位置較好。說明四個油藏都在鈾(w(U))和鉀(w(K))的低值位置。
圖7-2-1 美國東得克薩斯油田航空γ放射性異常剖面圖
(二)趨勢面分析方法
趨勢分析主要反映測量變數在大范圍(區域)連續變化的趨勢。在原始數據中常含有許多隨機誤差和局部點異常,直觀反映是測量曲線上下跳動或小范圍突變。使用趨勢分析處理是為了得到研究區域輻射場的總體分布趨勢。
趨勢面分析,實質上是利用多元回歸分析,進行空間數據擬合。根據計算方法不同,又可分為圖解法趨勢面分析和數學計演算法趨勢面分析。圖解法趨勢面分析的基本思路是對觀測數據採用二維方塊取平均值法,或滑動平均值法計算趨勢值。方塊平均值法是對每一方塊內的數據取平均值,作為該方塊重心點的趨勢值。滑動平均值法是設想一個方框,放在測區數據分布的平面圖上,把落在方框內的測點數據取平均值,記在方框中心上,最後得到趨勢面等值圖。一般講做一次是不夠的,需要如此重復3~9次。一般都有專門程序可供使用(不作詳述)。如圖7-1-14(a)為原始數據等值圖,中間有許多呈點狀高值或低值分布,經過四次趨勢面分析之後可以清楚地看出三個低值異常區。
計演算法趨勢面分析是選定一個數學函數,對觀測數據進行擬合,給出一個曲線。擬合函數常用的有多項式函數,傅里葉級數,三角函數以及指數函數的多項式函數等。目前以二維多項式函數應用最多。
(三)岩性影響及其校正分析
不同岩石、不同土壤中放射性核素含量是有差別,有的相差還比較大,有的相差甚至超過10%~20%。這是油田放射性測量的主要影響因素。
一個測區可能出現不同土壤分布,把不同放射性水平的土壤上測量結果校正到同一水平(叫歸一化方法)是非常重要的工作,主要有下面三種方法。
1.確定土壤核素含量的歸一化方法
利用γ能譜測量資料,根據測區地質圖或土壤分布圖,分別統計總道的總計數率和鈾、釷、鉀含量的平均值。然後進行逐點校正,即逐點減去同類土壤的平均值,其剩餘值即為異常值。
核輻射場與放射性勘查
式中:分別為第 i類土壤中測點 j的總計數和鈾、釷、鉀含量。分別為i類土壤的平均總計數和鈾、釷、鉀的平均值。分別為扣除各類土壤平均值後的剩餘值,即為各測點不同土壤校正後的歸一化的油田的放射性異常。根據需要可以用來繪制平面剖面圖或等值線圖,即為經過不同岩性(土壤)校正後的油田放射性異常圖。
這個方法的缺點是計算工作量較大。
2.用釷歸一化校正鈾、鉀含量
對自然界各種岩石中的釷、鈾、鉀含量的相關性研究(D.F.Saundr,1987),發現它們的含量具有很好的相關性(表7-2-2);而且隨岩性不同含量確有相應的增加或減小,據此可以利用釷的含量計算鈾和鉀的含量。釷有很好的化學穩定性,釷在地表環境條件下基本不流失。因此,利用釷含量計算出來的鈾、鉀含量,應當是與油藏存在引起的鈾、鉀
表7-2-2 幾種岩石的釷、鈾、鉀含量
異常無關的正常值。用每點實測的鈾、鉀,減去計算的正常值,那麼每個測點的鈾、鉀剩餘值(差值)應當是油氣藏引起的異常值。這樣就校正了岩性(土壤)變化的影響。
對於航空γ能譜測量的總道計數率,也同樣可以用釷含量(或計數率)歸一化校正總道計數率,效果也非常好。
具體方法如下。
1)對鈾、鉀的歸一化校正。
2)根據航空γ能譜測量或地面γ能譜測量數據,按測線計算鈾、釷、鉀含量。根據岩石(土壤)中釷與鈾,釷與鉀的相關關系(表7-2-1),認為鈾和釷存在線性關系,鉀和釷存在對數線性關系,於是建立相應的擬合關系式。
核輻射場與放射性勘查
式中:A、B、A′、B′為回歸系數(對每個測區得到一組常數);wi(Th)為測點i實測的釷含量;w點i(U)、w點i(K)為i點由釷含量計算的鈾、鉀含量。
計算每個測點的鈾、鉀剩餘值:
核輻射場與放射性勘查
式中:wi(U)、wi(K)為測點i的實測值。剩餘值Δwi(U)和Δwi(K)為油藏引起的異常值。
南陽-泌陽航空γ能譜測區,測得的釷、鈾、鉀含量,按釷含量分間隔,計算其平均值,列於表7-2-3。根據此表中數據,由(7-2-7)和(7-2-8)式得:
核輻射場與放射性勘查
表7-2-3 南陽-泌陽航空γ能譜計算的釷、鈾、鉀
3)對總道γ計數率的歸一化校正。釷比較穩定,可以認為與油氣藏形成的放射性異常無關。經研究得知,原岩的總道計數率(I點i)與釷含量的對數值存在近似的線性關系,即
核輻射場與放射性勘查
根據γ能譜實測數據求得實測i點的總道計數率(Ii)與I點i的差值:
核輻射場與放射性勘查
即為消除岩性影響的,由油氣藏引起的γ總計數率異常值。
圖7-2-2 釷歸一化校正岩性影響的結果
圖7-2-2為任丘雙河油田,兩條測線(1100線和11010線)。用釷歸一化法,消除岩性影響的結果。油田邊界高值和油田上方低值,除鉀11010線外都比較明顯清晰。與已知油田邊界基本一致。
② 計算機處理數據分析分類方法有哪些
1.按信息的形式和處理方式可分類:
(1)電子數字計算機:所有信息以二進制數表示。
(2)電子模擬計算機:內部信息形式為連續變化的模擬電壓,基本運算部件為運算放大器。
(3)混合式電子計算機:既有數字量又能表示模擬量,設計比較困難。
2.按使用可分類為:
(1)通用機:適用於各種應用場合,功能齊全、通用性好的計算機。
(2)專用機:為解決某種特定問題專門設計的計算機,如工業控制機、銀行專用機、超級市場收銀機(POS)等。
3.按計算機系統的規模和處理性能分類為:
所謂計算機系統規模主要指計算機的速度、容量和功能。一般可分巨型機、大型機、中小型機、微型機和工作站等。其中工作站(Workstation)是介於小型機和微型機之間的面向工程的計算機系統。
③ 如何進行數據處理和分析
首先數據量很小的稱不上數據的分析,智能算是統計整理,真正的數據處理和分析工作肯定是對數量大的而言的,這一般藉助相關的工具,
比如企業在數據處理和分析上的需求就比較多,他們會一般應用一些業務系統,但現在一般部署FineBI之類的商業智能來深度處理啦,數據的處理方面肯定依靠軟體,分析工作一部分靠工具,一部分靠人員的經驗和專業素養。
④ 常用數據分析處理方法有哪些
1、漏斗分析法
漏斗分析法能夠科學反映用戶行為狀態,以及從起點到終點各階段用戶轉化率情況,是一種重要的分析模型。漏斗分析模型已經廣泛應用於網站和APP的用戶行為分析中,例如流量監控、CRM系統、SEO優化、產品營銷和銷售等日常數據運營與數據分析工作中。
2、留存分析法
留存分析法是一種用來分析用戶參與情況和活躍程度的分析模型,考察進行初始行為的用戶中,有多少人會進行後續行為。從用戶的角度來說,留存率越高就說明這個產品對用戶的核心需求也把握的越好,轉化成產品的活躍用戶也會更多,最終能幫助公司更好的盈利。
3、分組分析法
分組分析法是根據數據分析對象的特徵,按照一定的標志(指標),把數據分析對象劃分為不同的部分和類型來進行研究,以揭示其內在的聯系和規律性。
4、矩陣分析法
矩陣分析法是指根據事物(如產品、服務等)的兩個重要屬性(指標)作為分析的依據,進行分類關聯分析,找出解決問題的一種分析方法,也稱為矩陣關聯分析法,簡稱矩陣分析法。
⑤ 數據處理與分析的步驟是怎麼樣
第一步:確定客戶的數據需求
比較典型的場景是我們需要針對企業的數據進行分析,比如公司通常會有銷售數據、用戶數據、運營數據、產品生產數據……需要從這些數據里獲得哪些有用的信息,對策略的制定進行指導呢?又比如需要做的是一份市場調研或者行業分析,那麼需要知道獲得關於這個行業的哪些信息。
第二步:根據客戶需求進行數據採集
採集來自網路爬蟲、結構化數據、本地數據、物聯網設備、人工錄入五個數據源的數據,為客戶提供定製化數據採集。目的是根據客戶的需求,定製數據採集,構建單一數據源。
第三步:數據預處理
現實世界中數據大體上都是不完整,不一致的臟數據,無法直接進行數據分析,或分析結果差強人意。數據預處理有多種方法:數據清理,數據集成,數據變換,數據歸約等。把這些影響分析的數據處理好,才能獲得更加精確地分析結果。
第四步:數據分析與建模
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便採取適當行動。
數據模型是對信息系統中客觀事物及其聯系的數據描述,它是復雜的數據關系之間的一個整體邏輯結構圖。數據模型不但提供了整個組織藉以收集數據的基礎,它還與組織中其他模型一起,精確恰當地記錄業務需求,並支持信息系統不斷地發展和完善,以滿足不斷變化的業務需求。
第五步:數據可視化及數據報告的撰寫
分析結果最直接的結果是統計量的描述和統計量的展示。數據分析報告不僅是分析結果的直接呈現,還是對相關情況的一個全面的認識。
⑥ 數據處理一般包括什麼、什麼、什麼、和分析數據等過程。
由識別信息需求、收集數據、分析數據、評價並改進數據分析的有效性組成。
1、識別需求
確保數據分析過程有效性的首要條件,可以為收集數據、分析數據提供清晰的目標。識別信息需求是管理者的職責管理者應根據決策和過程式控制制的需求,提出對信息的需求。就過程式控制制而言,管理者應識別需求要利用那些信息支持評審過程輸入、過程輸出、資源配置的合理性、過程活動的優化方案和過程異常變異的發現。
2、收集數據
有目的的收集數據,是確保數據分析過程有效的基礎。組織需要對收集數據的內容、渠道、方法進行策劃。
策劃時應考慮:將識別的需求轉化為具體的要求,如評價供方時,需要收集的數據可能包括其過程能力、測量系統不確定度等相關數據;明確由誰在何時何處,通過何種渠道和方法收集數據;記錄表應便於使用;採取有效措施,防止數據丟失和虛假數據對系統的干擾。
3、分析數據
分析數據是將收集的數據通過加工、整理和分析、使其轉化為信息,通常用方法有:老七種工具,即排列圖、因果圖、分層法、調查表、散步圖、直方圖、控制圖;新七種工具,即關聯圖、系統圖、矩陣圖、KJ法、計劃評審技術、PDPC法、矩陣數據圖。
4、過程改進
組織的管理者應在適當時,通過對以下問題的分析,評估其有效性:
提供決策的信息是否充分、可信,是否存在因信息不足、失准、滯後而導致決策失誤的問題;信息對持續改進質量管理體系、過程、產品所發揮的作用是否與期望值一致,是否在產品實現過程中有效運用數據分析。
收集數據的目的是否明確,收集的數據是否真實和充分,信息渠道是否暢通;數據分析方法是否合理,是否將風險控制在可接受的范圍;數據分析所需資源是否得到保障。
(6)數據處理及分析方法擴展閱讀
數據處理中,通常計算比較簡單,且數據處理業務中的加工計算因業務的不同而不同,需要根據業務的需要來編寫應用程序加以解決。
而數據管理則比較復雜,由於可利用的數據呈爆炸性增長,且數據的種類繁雜,從數據管理角度而言,不僅要使用數據,而且要有效地管理數據。因此需要一個通用的、使用方便且高效的管理軟體,把數據有效地管理起來。
數據處理與數據管理是相聯系的,數據管理技術的優劣將對數據處理的效率產生直接影響。而資料庫技術就是針對該需求目標進行研究並發展和完善起來的計算機應用的一個分支。
⑦ 數據處理分析方法
以下是數據分析員必備的9種數據分析思維模式:
1. 分類
2. 回歸3. 聚類4. 相似匹配5. 頻繁項集6. 統計描述7. 鏈接預測8. 數據壓縮9. 因果分析