导航:首页 > 研究方法 > 常用概率分析方法干货

常用概率分析方法干货

发布时间:2022-12-19 01:36:06

㈠ 常用的概率抽样方法有哪些,各自的含义如何

1、简单随机抽样

有放回简单随机抽样从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到抽满n个单位为止。

单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。

2、不放回简单随机抽样

从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚未被抽入样本的单元中等概率的抽取下一个单元,直到抽取n个单元为止。

每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低的抽样误差。

3、分层抽样

先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。

4、系统抽样

系统抽样指先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。最简单的系统抽样是等距抽样。

5、整群抽样

整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。

(1)常用概率分析方法干货扩展阅读

概率抽样包括以下几个方面的优点:调查者可获得被抽取的不同年龄、不同层次的人们的信息; 能估算出抽样误差; 调查结果可以用来推断总体。

例如,在一项使用概率抽样法的调查中,如果有 5 %的被访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体情况。

另一方面,概率抽样也有一些弊病:在大多数案例中,同样规模的概率抽样的费用要比非概率抽样高;概率抽样比非概率抽样需要更多时间策划和实施;必须遵守的抽样计划执行程序会大量增加收集资料的时间。

㈡ 九大常用数据分析方法 带大家了解一下这些干货吧

1、直接评判法

直接评判法即根据经验直接判断数据的好坏并给予评判,通常用于内部过往运营状况评估,如评估近期阅读量是否过低,评判近期销售量是否异常,评估当日文章推送量是否正常。

直接评判法有两个必要的条件:一是运营者有一定的新媒体运营经验,能够对跳出率,阅读量等有正确的评估;二是经过加工处理的数据足够直观,可以直接代表某项数据的优缺点。

2、对比分析法

对比分析法,是将两个或两个以上的数据进行对比,分析差异进而揭示这些数据所代表的规律。

对比分析法包括横向比较及纵向比较。横向比较即同一时间下不同总体指标的对比,如今日头条同领域作者文章阅读量对比,粉丝数对比等;纵向比较不同时间条件下同一总体指标的对比,如本月文章阅读量与上月阅读量进行对比,本月粉丝增长数与上月增长数进行对比等。

通过对比分析,可以直接观察到目前的运营水平,一方面找到当前已经处于优秀水平的方面,后续予以保持;另一方面及时发现当前的薄弱环节,重点突破。

3、分组分析法

分组分析法是指通过一定的指标,将对象统计分组并计算和分析,以便于深入了解所要分析对象的不同特征,性质及相互关系的方法。

分组分析法遵循相互独立,完全穷尽的枚举分析法原则。所谓相互独立,即分组之间不能有交叉,组别之间具有明显的差异性,每个数据只能归属于某一组;所谓完全穷尽,即分组中不要遗漏任何数据,保持完整性,各组的空间足以容纳总体的所有数据。

4、结构分析法

结构分析法是在统计分组的基础上,将组内数据与总体数据之间进行对比的分析方法。结构分析法分析各组部分占总体的比例,属于相对指标。

例如,新媒体运营团队可以统计粉丝所在的地域分布,统计出各个地方粉丝的占比情况,此情景便属于结构分析法。

5、平均分析法

例如,在分析今日头条的文章阅读量时,借助Excel导出的数据可以快速找到阅读量大于平均值的文章,接下来可以继续挖掘这些文章的标题,排版,配图等规律,便于后续内容质量的提升。

6、矩阵分析法

矩阵分析法是一种定量分析问题的方法,它是指以数据两个重要指标作为分析依据,并将这两个指标作为横,纵坐标轴,构成四个象限,从而找出解决问题的办法,为运营者提供数据参考。

例如,某餐饮企业的大众点评评价分析,可以借助四个象限“紧急且重要,重要但不紧急,紧急但不重要,不紧急也不重要”进行矩阵分析,并重点处理“紧急且重要”的事项。

7、漏斗图分析法

漏斗图分析法因展现形式如漏斗,故而得名。漏斗图可以对文章阅读量,产品购买量等情况进行逐层分析,展示整个关键路径中每步的转化情况。

重要强调的是,单一的漏斗图难以衡量各个环节的好坏,运营者可以结合本节介绍的“对比分析法”,对同一环节不同时间对比,评估运营效果。

8、雷达图分析法

雷达图常用于指数分析,即通过对新媒体账号的内容质量,领域专注等不同维度的计算而得出的客观评分结果。分数越高,代表账号的质量越好。可以利用雷达图进行分析的指数,包括今日头条指数,大鱼号星级指数,百家号指数等。

9、回归分析法

回归分析法是通过研究事物发展变化的因果关系来预测事物发展走向,它是研究变量间相互关系的一种定量预测方法,又称回归模型预测法或因果法。

例如,将今日头条粉丝数据导出到Excel表格,对累计粉丝数进行一元线性分析,就可以尝试预测某个时间的粉丝量。

㈢ 9种常用的数据分析方法(实用干货,强烈建议收藏)

所谓公式拆解法就是针对某个指标,用公式层层分解该指标的影响因素。
举例:分析某产品的销售额较低的原因,用公式法分解

对比法就是用两组或两组以上的数据进行比较,是最通用的方法。

我们知道孤立的数据没有意义,有对比才有差异。比如在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等。对比法可以发现数据变化规律,使用频繁,经常和其他方法搭配使用。

下图的AB公司销售额对比,虽然A公司销售额总体上涨且高于B公司,但是B公司的增速迅猛,高于A公司,即使后期增速下降了,最后的销售额还是赶超。

A/Btest,是将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。A/Btest的流程如下:

(1)现状分析并建立假设:分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了

(2)设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。

(3)设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。

(4)分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。

(5)采集并分析数据:收集实验数据,进行有效性和效果判断:统计显着性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显着性不能达到95%甚至90%,则需要决定是否中止试验。

(6)最后:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。
流程图如下:

通过对两种及以上维度的划分,运用坐标的方式表达出想要的价值。由价值直接转变为策略,从而进行一些落地的推动。象限法是一种策略驱动的思维,常与产品分析、市场分析、客户管理、商品管理等。比如,下图是一个广告点击的四象限分布,X轴从左到右表示从低到高,Y轴从下到上表示从低到高。

高点击率高转化的广告,说明人群相对精准,是一个高效率的广告。高点击率低转化的广告,说明点击进来的人大多被广告吸引了,转化低说明广告内容针对的人群和产品实际受众有些不符。高转化低点击的广告,说明广告内容针对的人群和产品实际受众符合程度较高,但需要优化广告内容,吸引更多人点击。低点击率低转化的广告,可以放弃了。还有经典的RFM模型,把客户按最近一次消费(Recency)、消费频率(Frequency)、消费金额 (Monetary)三个维度分成八个象限。

通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;

(2)建立分组优化策略
针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。

帕累托法则,源于经典的二八法则。比如在个人财富上可以说世界上20%的人掌握着80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。

一般地,会用在产品分类上,去测量并构建ABC模型。比如某零售企业有500个SKU以及这些SKU对应的销售额,那么哪些SKU是重要的呢,这就是在业务运营中分清主次的问题。

常见的做法是将产品SKU作为维度,并将对应的销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算截止当前产品SKU的销售额累计合计占总销售额的百分比。

百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。以上百分比也可以根据自己的实际情况调整。

ABC分析模型,不光可以用来划分产品和销售额,还可以划分客户及客户交易额等。比如给企业贡献80%利润的客户是哪些,占比多少。假设有20%,那么在资源有限的情况下,就知道要重点维护这20%类客户。

漏斗法即是漏斗图,有点像倒金字塔,是一个流程化的思考方式,常用于像新用户的开发、购物转化率这些有变化和一定流程的分析中。

上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。相邻环节的转化率则就是指用数据指标来量化每一个步骤的表现。所以整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。

整体漏斗模型的核心思想其实可以归为分解和量化。比如分析电商的转化,我们要做的就是监控每个层级上的用户转化,寻找每个层级的可优化点。对于没有按照流程操作的用户,专门绘制他们的转化模型,缩短路径提升用户体验。

还有经典的黑客增长模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用户获取、用户激活、用户留存、用户收益以及用户传播。这是产品运营中比较常见的一个模型,结合产品本身的特点以及产品的生命周期位置,来关注不同的数据指标,最终制定不同的运营策略。

从下面这幅AARRR模型图中,能够比较明显的看出来整个用户的生命周期是呈现逐渐递减趋势的。通过拆解和量化整个用户生命周期各环节,可以进行数据的横向和纵向对比,从而发现对应的问题,最终进行不断的优化迭代。

用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测,可以用来衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,其最终目的是达成业务目标,引导用户更高效地完成产品的最优路径,最终促使用户付费。如何进行用户行为路径分析?

(1)计算用户使用网站或APP时的每个第一步,然后依次计算每一步的流向和转化,通过数据,真实地再现用户从打开APP到离开的整个过程。
(2)查看用户在使用产品时的路径分布情况。例如:在访问了某个电商产品首页的用户后,有多大比例的用户进行了搜索,有多大比例的用户访问了分类页,有多大比例的用户直接访问的商品详情页。
(3)进行路径优化分析。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失。
(4)通过路径识别用户行为特征。例如:分析用户是用完即走的目标导向型,还是无目的浏览型。
(5)对用户进行细分。通常按照APP的使用目的来对用户进行分类。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析。

以电商为例,买家从登录网站/APP到支付成功要经过首页浏览、搜索商品、加入购物车、提交订单、支付订单等过程。而在用户真实的选购过程是一个交缠反复的过程,例如提交订单后,用户可能会返回首页继续搜索商品,也可能去取消订单,每一个路径背后都有不同的动机。与其他分析模型配合进行深入分析后,能为找到快速用户动机,从而引领用户走向最优路径或者期望中的路径。
用户行为路径图示例:

用户留存指的是新会员/用户在经过一定时间之后,仍然具有访问、登录、使用或转化等特定属性和行为,留存用户占当时新用户的比例就是留存率。留存率按照不同的周期分为三类,以登录行为认定的留存为例:
第一种 日留存,日留存又可以细分为以下几种:
(1)次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数
(2)第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数
(3)第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数
(4)第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数
(5)第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数

第二种 周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。

第三种 月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。下面以月留存为例生成的月用户留存曲线:

聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。

常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。以最为常见的K-means为例,如下图:

可以看到,数据可以被分到红蓝绿三个不同的簇(cluster)中,每个簇应有其特有的性质。显然,聚类分析是一种无监督学习,是在缺乏标签的前提下的一种分类模型。当我们对数据进行聚类后并得到簇后,一般会单独对每个簇进行深入分析,从而得到更加细致的结果。

㈣ 概率分析的含义是什么其步骤是怎样的请举例

概率分析又称风险分析,是通过研究各种不确定性因素发生不同变动幅度的概率分布及其对项目经济效益指标的影响,对项目可行性和风险性以及方案优劣作出判断的一种不确定性分析法。概率分析常用于对大中型重要若干项目的评估和决策之中。
步聚

1、列出各种欲考虑的不确定因素。例如销售价格、销售量、投资和经营成本等,均可作为不确定因素。需要注意的是,所选取的几个不确定因素应是互相独立的。

2、设想各各不确定因素可能发生的情况,即其数值发生变化的几种情况。

3、分别确定各种可能发生情况产生的可能性,即概率。各不确定因素的各种可能发生情况出现的概率之和必须等于1。

4、计算目标值的期望值。

可根据方案的具体情况选择适当的方法。假若采用净现值为目标值,则一种方法是,将各年净现金流量所包含的各不确定因素在各可能情况下的数值与其概率分别相乘后再相加,得到各年净现金流量的期望值,然后求得净现值的期望值。另一种方法是直接计算净现值的期望值。

5、求出目标值大于或等于零的累计概率。

对于单个方案的概率分析应求出净现值大于或等于零的概率,由该概率值的大小可以估计方案承受风险的程度,该概率值越接近1,说明技术方案的风险越小,反之,方案的风险越大。可以列表求得净现值大于或等于零的概率

概率分析是根据不确定因素在一定范围内的随机变动,分析并确定这种变动的概率分布,从而计算出其期望值及标准偏差为项目的风险决策提供依据的一种分析方法。

案例网页链接

㈤ 常见的8个概率分布公式和可视化

概率和统计知识是数据科学和机器学习的核心; 我们需要统计和概率知识来有效地收集、审查、分析数据。

现实世界中有几个现象实例被认为是统计性质的(即天气数据、销售数据、财务数据等)。 这意味着在某些情况下,我们已经能够开发出方法来帮助我们通过可以描述数据特征的数学函数来模拟自然。

“概率分布是一个数学函数,它给出了实验中不同可能结果的发生概率。”

了解数据的分布有助于更好地模拟我们周围的世界。 它可以帮助我们确定各种结果的可能性,或估计事件的可变性。 所有这些都使得了解不同的概率分布在数据科学和机器学习中非常有价值。

在本文中,我们将介绍一些常见的分布并通过Python 代码进行可视化以直观地显示它们。

最直接的分布是均匀分布。 均匀分布是一种概率分布,其中所有结果的可能性均等。 例如,如果我们掷一个公平的骰子,落在任何数字上的概率是 1/6。 这是一个离散的均匀分布。

但是并不是所有的均匀分布都是离散的——它们也可以是连续的。 它们可以在指定范围内取任何实际值。 a 和 b 之间连续均匀分布的概率密度函数 (PDF) 如下:

让我们看看如何在 Python 中对它们进行编码:

高斯分布可能是最常听到也熟悉的分布。 它有几个名字:有人称它为钟形曲线,因为它的概率图看起来像一个钟形,有人称它为高斯分布,因为首先描述它的德国数学家卡尔·高斯命名,还有一些人称它为正态分布,因为早期的统计学家 注意到它一遍又一遍地再次发生。

正态分布的概率密度函数如下:

σ 是标准偏差,μ 是分布的平均值。 要注意的是,在正态分布中,均值、众数和中位数都是相等的。

当我们绘制正态分布的随机变量时,曲线围绕均值对称——一半的值在中心的左侧,一半在中心的右侧。 并且,曲线下的总面积为 1。

对于正态分布来说。 经验规则告诉我们数据的百分比落在平均值的一定数量的标准偏差内。 这些百分比是:

68% 的数据落在平均值的一个标准差内。

95% 的数据落在平均值的两个标准差内。

99.7% 的数据落在平均值的三个标准差范围内。

对数正态分布是对数呈正态分布的随机变量的连续概率分布。 因此,如果随机变量 X 是对数正态分布的,则 Y = ln(X) 具有正态分布。

这是对数正态分布的 PDF:

对数正态分布的随机变量只取正实数值。 因此,对数正态分布会创建右偏曲线。

让我们在 Python 中绘制它:

泊松分布以法国数学家西蒙·丹尼斯·泊松的名字命名。 这是一个离散的概率分布,这意味着它计算具有有限结果的事件——换句话说,它是一个计数分布。 因此,泊松分布用于显示事件在指定时期内可能发生的次数。

如果一个事件在时间上以固定的速率发生,那么及时观察到事件的数量(n)的概率可以用泊松分布来描述。 例如,顾客可能以每分钟 3 次的平均速度到达咖啡馆。 我们可以使用泊松分布来计算 9 个客户在 2 分钟内到达的概率。

下面是概率质量函数公式:

λ 是一个时间单位的事件率——在我们的例子中,它是 3。k 是出现的次数——在我们的例子中,它是 9。这里可以使用 Scipy 来完成概率的计算。

泊松分布的曲线类似于正态分布,λ 表示峰值。

指数分布是泊松点过程中事件之间时间的概率分布。指数分布的概率密度函数如下:

λ 是速率参数,x 是随机变量。

可以将二项分布视为实验中成功或失败的概率。 有些人也可能将其描述为抛硬币概率。

参数为 n 和 p 的二项式分布是在 n 个独立实验序列中成功次数的离散概率分布,每个实验都问一个是 - 否问题,每个实验都有自己的布尔值结果:成功或失败。

本质上,二项分布测量两个事件的概率。 一个事件发生的概率为 p,另一事件发生的概率为 1-p。

这是二项分布的公式:

可视化代码如下:

学生 t 分布(或简称 t 分布)是在样本量较小且总体标准差未知的情况下估计正态分布总体的均值时出现的连续概率分布族的任何成员。 它是由英国统计学家威廉·西利·戈塞特(William Sealy Gosset)以笔名“student”开发的。

PDF如下:

n 是称为“自由度”的参数,有时可以看到它被称为“d.o.f.” 对于较高的 n 值,t 分布更接近正态分布。

卡方分布是伽马分布的一个特例; 对于 k 个自由度,卡方分布是一些独立的标准正态随机变量的 k 的平方和。

PDF如下:

这是一种流行的概率分布,常用于假设检验和置信区间的构建。

让我们在 Python 中绘制一些示例图:

掌握统计学和概率对于数据科学至关重要。 在本文展示了一些常见且常用的分布,希望对你有所帮助。

作者:Kurtis Pykes

㈥ 初中概率知识点总结

初中概率知识点总结

初中的概率其实并不是十分的难,我们应该要及时进行梳理。下面是我推荐给大家的初中概率知识点总结,希望大家有所收获。

初中概率知识点总结

一、概率的意义与表示方法

1、概率的意义

一般地,在大量重复试验中,如果事件 A 发生的频率会稳定在某个常数 p 附近,那么这个常数 p 就叫做事件 A 的概率。

2、事件和概率的表示方法

一般地,事件用英文大写字母 A,B,C, …,表示事件 A 的概率 p,可记为 P(A)=P。

二、确定事件和随机事件的概率之间的关系

1、确定事件概率

(1)当 A 是必然发生的事件时,P(A)=1

(2)当 A 是不可能发生的事件时,P(A)=0

2、确定事件和随机事件的概率之间的关系

三、古典概型

1、古典概型的定义

某个试验若具有:①在一次试验中,可能出现的结构有有限多个;②在一次试验中,各种结果发生的可能性相等。我们把具有这两个特点的试验称为古典概型。

2、古典概型的概率的求法

一般地,如果在一次试验中,有 n 种可能的`结果,并且它们发生的可能性都相等,事件 A 包含其中的 m中结果,那么事件 A 发生的概率为

四、列表法求概率

1、列表法

用列出表格的方法来分析和求解某些事件的概率的方法叫做列表法。

2、列表法的应用场合

当一次试验要设计两个因素, 并且可能出现的结果数目较多时,为不重不漏地列出所有可能的结果,通常采用列表法。

五、树状图法求概率

1、树状图法

就是通过列树状图列出某事件的所有可能的结果,求出其概率的方法叫做树状图法。

2、运用树状图法求概率的条件

当一次试验要设计三个或更多的因素时,用列表法就不方便了,为了不重不漏地列出所有可能的结果 ,通常采用树状图法求概率。

六、利用频率估计概率

1、利用频率估计概率

在同样条件下,做大量的重复试验,利用一个随机事件发生的频率逐渐稳定到某个常数,可以估计这个事件发生的概率。

2、在统计学中,常用较为简单的试验方法代替实际操作中复杂的试验来完成概率估计,这样的试验称为模拟实验。

3、随机数

在随机事件中,需要用大量重复试验产生一串随机的数据来开展统计工作。把这些随机产生的数据称为随机数。

;

㈦ 什么是概率树分析法

概率分析(Probit Analysis) 概率分析又称风险分析, 是通过研究各种不确定性因素发生不同变动幅度的概率分布及其对项 目 经济效益指标 的影响, 对项目可行性和风险性以及方案优劣作出判断的一种不确定性分析法 。概率分析常用于对大中型重要若干 项目 的评估和决策之中。

满意请采纳

㈧ 概率分析法的原理

场地的地震危险性概率分析,一般有四个步骤,即潜在震源模型的建立、不同潜在震源的地震平均年发生率的计算、确定地面运动的衰减规律和地震对场地的影响(图2-4-1)。

图2-4-1 地震危险性概率分析步骤

(a)潜在震源模型;(b)重现关系;(c)不同震级(M1,M2、M3)的衰减曲线(A 表示峰值加速度,I表示地震烈度,R 表示震中距);(d)场地峰值加速度超越概率曲线

1.潜在震源模型的建立

根据现有地质、构造、地貌和历史地震记录资料,并综合专家意见,勾划各种类型的潜在震源。通常假定在震源内地震活动是均匀的。

由于地区的不同和占有资料的差异,潜在震源模型的建立可采用两种方法:活动断层法和构造区法。

(1)活动断层法

地震集中的板块边缘或断层的地区,可用此法。建立的潜在震源模型可分为如下三类(图2-4-1(a)。

1)点源:历史上地震集中在某一区域内,无明显的断层存在,如火山地震就是点震源的例子。

2)线源:构造断裂显露于地表,历史地震集中在已知断层周围,震源深度一般在5~35km。

3)面源:历史上地震发生在某一区域,该地区的已知断裂与地震无明显相关,或该地区散布很多小断层。

(2)构造区法

在覆盖层较厚、地震和断层活动性很弱的地区,因缺乏地质资料和历史地震记录,这时可用构造区法,并假设在构造区内地震的活动性是均匀的。由于资料的缺乏和没有一个通用的勾划构造区的方法,专家的主观意见往往起着主导作用,但专家的意见有时会有很大的分歧,这时宜加以综合。构造区一般较大,场地往往位于构造区内,对场地来说,有可能发生近场地震。

2.计算不同震源的地震平均年发生率

利用历史地震记录,对每个潜在震源区可用Gutenberg和Richter(1941)提出的地震重现关系来计算地震平均年发生率。重现关系是:

地球物理勘探及地球化学勘探方法在城市建设中的应用

式中Nmi为在历史地震记录期间,大于、等于震级mi的地震次数;m0为有工程意义的最小地震的震级,为最大可能地震的震级,α、β为回归系数,用最小二乘法求得:

地球物理勘探及地球化学勘探方法在城市建设中的应用

mi为震级(I=1,2,…n)。

重现关系曲线在半对数纸上为一直线(图2-4-1(b)。

如果记录年限为T,则大于、等于有工程意义的最小地震震级m0的地震平均年发生率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

震级大于、等于mi的地震平均年发生率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

震级等于mi的地震平均年发生率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

地震平均年发生率反映了潜在震源区内地震活动性的统计分布特征。

因为Gutenberg和Richter提出的公式(2-4-1)有时会出现最大地震的年发生率大于次大地震的年发生率的不合理现象,这时可用Cornell提出的改进了的震级密度分布公式:

地球物理勘探及地球化学勘探方法在城市建设中的应用

如果把震级范围(mu—m0)分成n级,每级增量为

,则震级mi的平均年发生率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

式(2-4-7)中β由下式计算

地球物理勘探及地球化学勘探方法在城市建设中的应用

式中

为平均震级,

地球物理勘探及地球化学勘探方法在城市建设中的应用

其中ki是震级为mi时的地震次数。

式(2-4-8)中,大于、等于有工程意义的最小地震震级m0的地震平均年发生率λ≥m0。可用记录到的地震总次数除以记录年限而得到,即

地球物理勘探及地球化学勘探方法在城市建设中的应用

如果历史地震记录较短,显然由少量数据来估计平均年发生率是不可靠的。这时可利用地质和地球物理方法的资料,用贝叶斯原理来改进对地震平均年发生率的估计。

3.地面运动的衰减规律

潜在震源区确定之后,则需研究地震影响随传播路径的衰减规律。大家知道,地震时震源产生的地运动,以体波和面波形式向四周传播,随着传播距离的增大,运动强度逐渐衰减。衰减的方式和大小与很多因素有关,如地震震级的大小、断裂类型、传递路径、震源与场地的距离和场地土质条件等。目前,估计衰减规律的方法有两种,即按阻尼弹性及非弹性介质中波的传播理论的方法和按仪器观测的数据进行回归分析的经验方法。在实际应用中,基本上用经验方法。

衰减规律用地震动参数(如峰值加速度

峰值加速度在不同文献中有不同的称呼,如峰值加速度、加速度峰值、加速度最大值。)或地震烈度表示,衰减规律实质上反映了地震影响的分布规律。对于有强震记录的地区,由地震动参数来表示衰减公式,其一般形式为

地球物理勘探及地球化学勘探方法在城市建设中的应用

式中,α为峰值加速度(cm/s2),b1、b2、b3、b4为随潜在震源及场地地质条件而异的参数,d为场地的震中距(km)。

由不同研究者得出的衰减公式不下几十种,表2-4-1给出几个例子。

表2-4-1 衰减公式

(据胡聿贤等,1987)

对于没有或缺乏强震记录仅有等震图的地区,衰减公式用地震烈度表示,其一般形式为

Is=I0+C1+C2d+C3Ind

式中,Is为场地烈度;I0为震中烈度,d为震中距,C1、C2、C3为回归系数。

场地烈度与峰值加速度的关系,有下面几种形式:

Inα=f(Is)=C1+C2Is

Inα=f(Is,d)=C1+C2Is+C3Ind

Inα=f(IS,M)=C1+C2Is+C3M

lnα=f(M,d,s)=C1+C2Is+C3Ind+C4S

式中,S为场地土的影响,对于基岩,S=1,其他土壤,S=0;系数Ci(i=1,2,3,4)均由观测数据通过回归分析而得到,M为震级。

在缺乏观测数据的情况下,可用表2-4-2给出的IS-α近似对应关系,由场地烈度估计场地的峰值加速度。

表2-4-2 场地烈度与峰值加速度对应关系表

(据胡聿贤等,1987)

4.计算地震对场地的影响

通常用峰值加速度来表示地震对场地的影响。在场地周围各潜在震源的影响下,由场地内出现不同峰值加速度的平均年发生率来计算场地在使用期内超过某峰值加速度的概率(危险率或风险率)。对较大区域,则作出给定危险率条件下的等峰值加速度图,即地震小区划图。

(1)不同震级和震中距与场地的地震年发生率

设已知场地周围有潜在震源k个(k=1、2,…,l),震级范围为m0≤mi≤mu(i=1,2,…,n),场地到潜在震源在地面投影的距离(震中距)为d≤dj≤du(j=1,2,…,p)。m=

设图2-4-1(a)中,面源为k,震中距为dj,则震级为mi的年发生率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

式中,λijk为潜在震源k震级mi的年发生率,Sk为潜在震源k的面积(或长度),Sjk为以场地为圆心,以

为半径的两个圆弧所切割的潜在震源k的面积。

对不同i及j的重复计算,则可得到潜在震源k对场地的地震年发生率。将算得的地震年发生率看成一个整体,则可排成一个矩阵[λij]k,即

地球物理勘探及地球化学勘探方法在城市建设中的应用

对每个潜在震源重复上述计算,则可得所有震源对场地地震活动的总影响,即离场地距离为dj,震级为mi的地震年发生率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

(2)场地不同峰值加速度的平均年发生率

由衰减公式(2-4-12)计算震中距为dj、震级为mi引起的峰值加速度。对于不同i和j重复计算,可得峰值加度速矩阵[α],即

地球物理勘探及地球化学勘探方法在城市建设中的应用

分析衰减公式(2-4-12)可知,矩阵[α]中的元素,其大小是从左下角往右上角逐渐增大的。利用矩阵[λij]k和矩阵[α]可计算出场地不同峰值加速度的年发生率,作出峰值加速度超越年发生率曲线。具体做法是:先给定某一峰值加速度值α;然后在矩阵[α]中划出大于、等于α的所有元素,最后,在潜在震源对场地的影响矩阵[λij]k中找出与大于、等于α元素相对应的元素;把找出的元素总和起来,即为场地出现大于、等于峰值加速度α的年平均发生率A≥α,并可作出峰值加速度超越年发生率(λ≥α)-α曲线(图2-4-3)。

(3)峰值加速度的重现期

工程上常用重现期表示随机荷载的大小,如“百年一遇的洪水”等,100年就是重现期,它的倒数就是该洪水的年发生率。同理,定义某峰值加速度值αr的重现期为:

地球物理勘探及地球化学勘探方法在城市建设中的应用

(4)使用期超越概率(危险率或风险率)

若工程设施的使用期为T,地震过程是均匀泊松过程,则在使用期T 内,不发生峰值加速度α≥αr的概率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

则超越概率为

地球物理勘探及地球化学勘探方法在城市建设中的应用

如果αr值为工程设施所能承受的最大峰值加速度,超过αr值,设施就会遭到破坏,则式(2-4-16)就是可靠度,即

地球物理勘探及地球化学勘探方法在城市建设中的应用

而式(2-4-18)给出破坏概率(危险率),即

地球物理勘探及地球化学勘探方法在城市建设中的应用

在工程设计中,往往要保证结构的可靠度(即限制结构的破坏概率),反过来确定设计峰值加速度的重现期。表2-4-3给出了风险率F、使用期T和峰值加速重现期及其之间的关系。例如,当使用期T=50年,要求风险率F=10%,由表则可查出确定设计峰值加速度的重现期为Ta=475年,即峰值加速度的年发生率为A≥α≈1/500,再由(λ≥a)-α曲线查得结构物设计时500年一遇的峰值加速值αr

表2-4-3 风险率、使用期和峰值加速度呈现期关系表

(据胡聿贤等,1987)

(5)等峰值加速度图的绘制

为表示在给定使用期和风险率条件下较大地区的地震危险性,可把该地区分成很多小网格,对每一个小网格按给定的F和T,求得相应的峰值加速度值,则可得某一地区的有一定使用期和风险率的等峰值加速度图,供规划、设计部门使用。

㈨ 常用的两种概率分析方法

1、用笔和纸算
2、第一种方法和第二种方法

阅读全文

与常用概率分析方法干货相关的资料

热点内容
工业cod检测方法 浏览:295
星辰变的种植方法 浏览:602
商品组合需求预测有哪些方法 浏览:962
卷发精油的使用方法 浏览:573
快速识字方法 浏览:185
华为大疆手机云台使用方法 浏览:499
小学语文有效教学方法之探析 浏览:559
和田玉白玉项链的鉴别方法 浏览:679
露娜洁面仪mini2使用方法 浏览:916
阉鸡快速止血的方法 浏览:878
苹果微信清理缓存在哪里设置方法 浏览:748
金钢窗安装方法 浏览:124
测排卵什么方法最准确 浏览:851
抒情方法有哪些 浏览:432
青岛梅毒治疗最好的方法 浏览:998
脸上汗斑的治疗方法 浏览:61
好的教育方法的视频 浏览:59
快速上枕头荷叶边方法 浏览:738
手机拍照的视频在哪里设置方法 浏览:935
什么方法治口臭 浏览:174