① 常用的数据处理方法
前面所述的各种放射性测量方法,包括航空γ能谱测量,地面γ能谱测量和氡及其子体的各种测量方法,都已用在石油放射性勘查工作之中。数据处理工作量大的是航空γ能谱测量。
(一)数据的光滑
为了减少测量数据的统计涨落影响及地面偶然因素的影响,对原始测量数据进行光滑处理。消除随机影响。
放射性测量数据光滑,最常用的光滑方法是多项式拟合移动法。在要光滑测量曲线上任取一点,并在该点两边各取m个点,共有2m+1点;用一个以该点为中心的q阶多项式对这一曲线段作最小二乘拟合,则该多项式在中心点的值,即为平滑后该点的值。用此法逐点处理,即得光滑后的曲线,光滑计算公式(公式推导略)为
核辐射场与放射性勘查
式中:yi+j、为第i点光滑前后的值;为系数;为规范化常数。
五点光滑的二次多项式的具体光滑公式为
核辐射场与放射性勘查
如果一次光滑不够理想,可以重复进行1~2次,但不宜过多重复使用。
光滑方法,还有傅里叶变换法,以及多点平均值法,多点加权平均值法等。
使用那种方法选定之后,一般都通过编程存入计算机,进行自动化处理。
图7-2-1是美国东得克萨斯州一个油田上的航空γ放射性异常中的两条剖面图(A-B和B-C)。经过光滑处理后,低值连续,清晰明显,与油田对应的位置较好。说明四个油藏都在铀(w(U))和钾(w(K))的低值位置。
图7-2-1 美国东得克萨斯油田航空γ放射性异常剖面图
(二)趋势面分析方法
趋势分析主要反映测量变量在大范围(区域)连续变化的趋势。在原始数据中常含有许多随机误差和局部点异常,直观反映是测量曲线上下跳动或小范围突变。使用趋势分析处理是为了得到研究区域辐射场的总体分布趋势。
趋势面分析,实质上是利用多元回归分析,进行空间数据拟合。根据计算方法不同,又可分为图解法趋势面分析和数学计算法趋势面分析。图解法趋势面分析的基本思路是对观测数据采用二维方块取平均值法,或滑动平均值法计算趋势值。方块平均值法是对每一方块内的数据取平均值,作为该方块重心点的趋势值。滑动平均值法是设想一个方框,放在测区数据分布的平面图上,把落在方框内的测点数据取平均值,记在方框中心上,最后得到趋势面等值图。一般讲做一次是不够的,需要如此重复3~9次。一般都有专门程序可供使用(不作详述)。如图7-1-14(a)为原始数据等值图,中间有许多呈点状高值或低值分布,经过四次趋势面分析之后可以清楚地看出三个低值异常区。
计算法趋势面分析是选定一个数学函数,对观测数据进行拟合,给出一个曲线。拟合函数常用的有多项式函数,傅里叶级数,三角函数以及指数函数的多项式函数等。目前以二维多项式函数应用最多。
(三)岩性影响及其校正分析
不同岩石、不同土壤中放射性核素含量是有差别,有的相差还比较大,有的相差甚至超过10%~20%。这是油田放射性测量的主要影响因素。
一个测区可能出现不同土壤分布,把不同放射性水平的土壤上测量结果校正到同一水平(叫归一化方法)是非常重要的工作,主要有下面三种方法。
1.确定土壤核素含量的归一化方法
利用γ能谱测量资料,根据测区地质图或土壤分布图,分别统计总道的总计数率和铀、钍、钾含量的平均值。然后进行逐点校正,即逐点减去同类土壤的平均值,其剩余值即为异常值。
核辐射场与放射性勘查
式中:分别为第 i类土壤中测点 j的总计数和铀、钍、钾含量。分别为i类土壤的平均总计数和铀、钍、钾的平均值。分别为扣除各类土壤平均值后的剩余值,即为各测点不同土壤校正后的归一化的油田的放射性异常。根据需要可以用来绘制平面剖面图或等值线图,即为经过不同岩性(土壤)校正后的油田放射性异常图。
这个方法的缺点是计算工作量较大。
2.用钍归一化校正铀、钾含量
对自然界各种岩石中的钍、铀、钾含量的相关性研究(D.F.Saundr,1987),发现它们的含量具有很好的相关性(表7-2-2);而且随岩性不同含量确有相应的增加或减小,据此可以利用钍的含量计算铀和钾的含量。钍有很好的化学稳定性,钍在地表环境条件下基本不流失。因此,利用钍含量计算出来的铀、钾含量,应当是与油藏存在引起的铀、钾
表7-2-2 几种岩石的钍、铀、钾含量
异常无关的正常值。用每点实测的铀、钾,减去计算的正常值,那么每个测点的铀、钾剩余值(差值)应当是油气藏引起的异常值。这样就校正了岩性(土壤)变化的影响。
对于航空γ能谱测量的总道计数率,也同样可以用钍含量(或计数率)归一化校正总道计数率,效果也非常好。
具体方法如下。
1)对铀、钾的归一化校正。
2)根据航空γ能谱测量或地面γ能谱测量数据,按测线计算铀、钍、钾含量。根据岩石(土壤)中钍与铀,钍与钾的相关关系(表7-2-1),认为铀和钍存在线性关系,钾和钍存在对数线性关系,于是建立相应的拟合关系式。
核辐射场与放射性勘查
式中:A、B、A′、B′为回归系数(对每个测区得到一组常数);wi(Th)为测点i实测的钍含量;w点i(U)、w点i(K)为i点由钍含量计算的铀、钾含量。
计算每个测点的铀、钾剩余值:
核辐射场与放射性勘查
式中:wi(U)、wi(K)为测点i的实测值。剩余值Δwi(U)和Δwi(K)为油藏引起的异常值。
南阳-泌阳航空γ能谱测区,测得的钍、铀、钾含量,按钍含量分间隔,计算其平均值,列于表7-2-3。根据此表中数据,由(7-2-7)和(7-2-8)式得:
核辐射场与放射性勘查
表7-2-3 南阳-泌阳航空γ能谱计算的钍、铀、钾
3)对总道γ计数率的归一化校正。钍比较稳定,可以认为与油气藏形成的放射性异常无关。经研究得知,原岩的总道计数率(I点i)与钍含量的对数值存在近似的线性关系,即
核辐射场与放射性勘查
根据γ能谱实测数据求得实测i点的总道计数率(Ii)与I点i的差值:
核辐射场与放射性勘查
即为消除岩性影响的,由油气藏引起的γ总计数率异常值。
图7-2-2 钍归一化校正岩性影响的结果
图7-2-2为任丘双河油田,两条测线(1100线和11010线)。用钍归一化法,消除岩性影响的结果。油田边界高值和油田上方低值,除钾11010线外都比较明显清晰。与已知油田边界基本一致。
② 计算机处理数据分析分类方法有哪些
1.按信息的形式和处理方式可分类:
(1)电子数字计算机:所有信息以二进制数表示。
(2)电子模拟计算机:内部信息形式为连续变化的模拟电压,基本运算部件为运算放大器。
(3)混合式电子计算机:既有数字量又能表示模拟量,设计比较困难。
2.按使用可分类为:
(1)通用机:适用于各种应用场合,功能齐全、通用性好的计算机。
(2)专用机:为解决某种特定问题专门设计的计算机,如工业控制机、银行专用机、超级市场收银机(POS)等。
3.按计算机系统的规模和处理性能分类为:
所谓计算机系统规模主要指计算机的速度、容量和功能。一般可分巨型机、大型机、中小型机、微型机和工作站等。其中工作站(Workstation)是介于小型机和微型机之间的面向工程的计算机系统。
③ 如何进行数据处理和分析
首先数据量很小的称不上数据的分析,智能算是统计整理,真正的数据处理和分析工作肯定是对数量大的而言的,这一般借助相关的工具,
比如企业在数据处理和分析上的需求就比较多,他们会一般应用一些业务系统,但现在一般部署FineBI之类的商业智能来深度处理啦,数据的处理方面肯定依靠软件,分析工作一部分靠工具,一部分靠人员的经验和专业素养。
④ 常用数据分析处理方法有哪些
1、漏斗分析法
漏斗分析法能够科学反映用户行为状态,以及从起点到终点各阶段用户转化率情况,是一种重要的分析模型。漏斗分析模型已经广泛应用于网站和APP的用户行为分析中,例如流量监控、CRM系统、SEO优化、产品营销和销售等日常数据运营与数据分析工作中。
2、留存分析法
留存分析法是一种用来分析用户参与情况和活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。从用户的角度来说,留存率越高就说明这个产品对用户的核心需求也把握的越好,转化成产品的活跃用户也会更多,最终能帮助公司更好的盈利。
3、分组分析法
分组分析法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。
4、矩阵分析法
矩阵分析法是指根据事物(如产品、服务等)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析法,简称矩阵分析法。
⑤ 数据处理与分析的步骤是怎么样
第一步:确定客户的数据需求
比较典型的场景是我们需要针对企业的数据进行分析,比如公司通常会有销售数据、用户数据、运营数据、产品生产数据……需要从这些数据里获得哪些有用的信息,对策略的制定进行指导呢?又比如需要做的是一份市场调研或者行业分析,那么需要知道获得关于这个行业的哪些信息。
第二步:根据客户需求进行数据采集
采集来自网络爬虫、结构化数据、本地数据、物联网设备、人工录入五个数据源的数据,为客户提供定制化数据采集。目的是根据客户的需求,定制数据采集,构建单一数据源。
第三步:数据预处理
现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据分析,或分析结果差强人意。数据预处理有多种方法:数据清理,数据集成,数据变换,数据归约等。把这些影响分析的数据处理好,才能获得更加精确地分析结果。
第四步:数据分析与建模
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
数据模型是对信息系统中客观事物及其联系的数据描述,它是复杂的数据关系之间的一个整体逻辑结构图。数据模型不但提供了整个组织借以收集数据的基础,它还与组织中其他模型一起,精确恰当地记录业务需求,并支持信息系统不断地发展和完善,以满足不断变化的业务需求。
第五步:数据可视化及数据报告的撰写
分析结果最直接的结果是统计量的描述和统计量的展示。数据分析报告不仅是分析结果的直接呈现,还是对相关情况的一个全面的认识。
⑥ 数据处理一般包括什么、什么、什么、和分析数据等过程。
由识别信息需求、收集数据、分析数据、评价并改进数据分析的有效性组成。
1、识别需求
确保数据分析过程有效性的首要条件,可以为收集数据、分析数据提供清晰的目标。识别信息需求是管理者的职责管理者应根据决策和过程控制的需求,提出对信息的需求。就过程控制而言,管理者应识别需求要利用那些信息支持评审过程输入、过程输出、资源配置的合理性、过程活动的优化方案和过程异常变异的发现。
2、收集数据
有目的的收集数据,是确保数据分析过程有效的基础。组织需要对收集数据的内容、渠道、方法进行策划。
策划时应考虑:将识别的需求转化为具体的要求,如评价供方时,需要收集的数据可能包括其过程能力、测量系统不确定度等相关数据;明确由谁在何时何处,通过何种渠道和方法收集数据;记录表应便于使用;采取有效措施,防止数据丢失和虚假数据对系统的干扰。
3、分析数据
分析数据是将收集的数据通过加工、整理和分析、使其转化为信息,通常用方法有:老七种工具,即排列图、因果图、分层法、调查表、散步图、直方图、控制图;新七种工具,即关联图、系统图、矩阵图、KJ法、计划评审技术、PDPC法、矩阵数据图。
4、过程改进
组织的管理者应在适当时,通过对以下问题的分析,评估其有效性:
提供决策的信息是否充分、可信,是否存在因信息不足、失准、滞后而导致决策失误的问题;信息对持续改进质量管理体系、过程、产品所发挥的作用是否与期望值一致,是否在产品实现过程中有效运用数据分析。
收集数据的目的是否明确,收集的数据是否真实和充分,信息渠道是否畅通;数据分析方法是否合理,是否将风险控制在可接受的范围;数据分析所需资源是否得到保障。
(6)数据处理及分析方法扩展阅读
数据处理中,通常计算比较简单,且数据处理业务中的加工计算因业务的不同而不同,需要根据业务的需要来编写应用程序加以解决。
而数据管理则比较复杂,由于可利用的数据呈爆炸性增长,且数据的种类繁杂,从数据管理角度而言,不仅要使用数据,而且要有效地管理数据。因此需要一个通用的、使用方便且高效的管理软件,把数据有效地管理起来。
数据处理与数据管理是相联系的,数据管理技术的优劣将对数据处理的效率产生直接影响。而数据库技术就是针对该需求目标进行研究并发展和完善起来的计算机应用的一个分支。
⑦ 数据处理分析方法
以下是数据分析员必备的9种数据分析思维模式:
1. 分类
2. 回归3. 聚类4. 相似匹配5. 频繁项集6. 统计描述7. 链接预测8. 数据压缩9. 因果分析