1、簡單隨機抽樣
有放回簡單隨機抽樣從總體中隨機抽出一個樣本單位,記錄觀測結果後,將其放回到總體中去,再抽取第二個,如此類推,一直到抽滿n個單位為止。
單位有被重復抽中的可能,容易造成信息重疊而影響估計的效率,較少採用。
2、不放回簡單隨機抽樣
從包含N個單元的總體中逐個隨機抽取單元並無放回,每次都在所有尚未被抽入樣本的單元中等概率的抽取下一個單元,直到抽取n個單元為止。
每個單位最多隻能被抽中一次,不會由於樣本單位被重復抽中而提供重疊信息,比放回抽樣有更低的抽樣誤差。
3、分層抽樣
先按照某種規則把總體分為不同的層,然後在不同的層內獨立、隨機的抽取樣本,這樣所得到的樣本稱為分層樣本。如果每層中的抽樣都是簡單隨機抽樣,則稱為分層隨機抽樣。
4、系統抽樣
系統抽樣指先將總體中的所有單元按一定順序排列,在規定范圍內隨機抽取一個初始單元,然後按事先規定的規則抽取其他樣本單元。最簡單的系統抽樣是等距抽樣。
5、整群抽樣
整群抽樣是將總體中所有的基本單位按照一定規則劃分為互不重疊的群,抽樣時直接抽取群,對抽中的群調查其全部的基本單位,對沒有抽中的群則不進行調查。
(1)常用概率分析方法干貨擴展閱讀
概率抽樣包括以下幾個方面的優點:調查者可獲得被抽取的不同年齡、不同層次的人們的信息; 能估算出抽樣誤差; 調查結果可以用來推斷總體。
例如,在一項使用概率抽樣法的調查中,如果有 5 %的被訪者給出了某種特定回答,那麼,調查者就可以以此百分比再結合抽樣誤差,推及總體情況。
另一方面,概率抽樣也有一些弊病:在大多數案例中,同樣規模的概率抽樣的費用要比非概率抽樣高;概率抽樣比非概率抽樣需要更多時間策劃和實施;必須遵守的抽樣計劃執行程序會大量增加收集資料的時間。
㈡ 九大常用數據分析方法 帶大家了解一下這些干貨吧
1、直接評判法
直接評判法即根據經驗直接判斷數據的好壞並給予評判,通常用於內部過往運營狀況評估,如評估近期閱讀量是否過低,評判近期銷售量是否異常,評估當日文章推送量是否正常。
直接評判法有兩個必要的條件:一是運營者有一定的新媒體運營經驗,能夠對跳出率,閱讀量等有正確的評估;二是經過加工處理的數據足夠直觀,可以直接代表某項數據的優缺點。
2、對比分析法
對比分析法,是將兩個或兩個以上的數據進行對比,分析差異進而揭示這些數據所代表的規律。
對比分析法包括橫向比較及縱向比較。橫向比較即同一時間下不同總體指標的對比,如今日頭條同領域作者文章閱讀量對比,粉絲數對比等;縱向比較不同時間條件下同一總體指標的對比,如本月文章閱讀量與上月閱讀量進行對比,本月粉絲增長數與上月增長數進行對比等。
通過對比分析,可以直接觀察到目前的運營水平,一方面找到當前已經處於優秀水平的方面,後續予以保持;另一方面及時發現當前的薄弱環節,重點突破。
3、分組分析法
分組分析法是指通過一定的指標,將對象統計分組並計算和分析,以便於深入了解所要分析對象的不同特徵,性質及相互關系的方法。
分組分析法遵循相互獨立,完全窮盡的枚舉分析法原則。所謂相互獨立,即分組之間不能有交叉,組別之間具有明顯的差異性,每個數據只能歸屬於某一組;所謂完全窮盡,即分組中不要遺漏任何數據,保持完整性,各組的空間足以容納總體的所有數據。
4、結構分析法
結構分析法是在統計分組的基礎上,將組內數據與總體數據之間進行對比的分析方法。結構分析法分析各組部分佔總體的比例,屬於相對指標。
例如,新媒體運營團隊可以統計粉絲所在的地域分布,統計出各個地方粉絲的佔比情況,此情景便屬於結構分析法。
5、平均分析法
例如,在分析今日頭條的文章閱讀量時,藉助Excel導出的數據可以快速找到閱讀量大於平均值的文章,接下來可以繼續挖掘這些文章的標題,排版,配圖等規律,便於後續內容質量的提升。
6、矩陣分析法
矩陣分析法是一種定量分析問題的方法,它是指以數據兩個重要指標作為分析依據,並將這兩個指標作為橫,縱坐標軸,構成四個象限,從而找出解決問題的辦法,為運營者提供數據參考。
例如,某餐飲企業的大眾點評評價分析,可以藉助四個象限「緊急且重要,重要但不緊急,緊急但不重要,不緊急也不重要」進行矩陣分析,並重點處理「緊急且重要」的事項。
7、漏斗圖分析法
漏斗圖分析法因展現形式如漏斗,故而得名。漏斗圖可以對文章閱讀量,產品購買量等情況進行逐層分析,展示整個關鍵路徑中每步的轉化情況。
重要強調的是,單一的漏斗圖難以衡量各個環節的好壞,運營者可以結合本節介紹的「對比分析法」,對同一環節不同時間對比,評估運營效果。
8、雷達圖分析法
雷達圖常用於指數分析,即通過對新媒體賬號的內容質量,領域專注等不同維度的計算而得出的客觀評分結果。分數越高,代表賬號的質量越好。可以利用雷達圖進行分析的指數,包括今日頭條指數,大魚號星級指數,百家號指數等。
9、回歸分析法
回歸分析法是通過研究事物發展變化的因果關系來預測事物發展走向,它是研究變數間相互關系的一種定量預測方法,又稱回歸模型預測法或因果法。
例如,將今日頭條粉絲數據導出到Excel表格,對累計粉絲數進行一元線性分析,就可以嘗試預測某個時間的粉絲量。
㈢ 9種常用的數據分析方法(實用干貨,強烈建議收藏)
所謂公式拆解法就是針對某個指標,用公式層層分解該指標的影響因素。
舉例:分析某產品的銷售額較低的原因,用公式法分解
對比法就是用兩組或兩組以上的數據進行比較,是最通用的方法。
我們知道孤立的數據沒有意義,有對比才有差異。比如在時間維度上的同比和環比、增長率、定基比,與競爭對手的對比、類別之間的對比、特徵和屬性對比等。對比法可以發現數據變化規律,使用頻繁,經常和其他方法搭配使用。
下圖的AB公司銷售額對比,雖然A公司銷售額總體上漲且高於B公司,但是B公司的增速迅猛,高於A公司,即使後期增速下降了,最後的銷售額還是趕超。
A/Btest,是將Web或App界面或流程的兩個或多個版本,在同一時間維度,分別讓類似訪客群組來訪問,收集各群組的用戶體驗數據和業務數據,最後分析評估出最好版本正式採用。A/Btest的流程如下:
(1)現狀分析並建立假設:分析業務數據,確定當前最關鍵的改進點,作出優化改進的假設,提出優化建議;比如說我們發現用戶的轉化率不高,我們假設是因為推廣的著陸頁面帶來的轉化率太低,下面就要想辦法來進行改進了
(2)設定目標,制定方案:設置主要目標,用來衡量各優化版本的優劣;設置輔助目標,用來評估優化版本對其他方面的影響。
(3)設計與開發:製作2個或多個優化版本的設計原型並完成技術實現。
(4)分配流量:確定每個線上測試版本的分流比例,初始階段,優化方案的流量設置可以較小,根據情況逐漸增加流量。
(5)採集並分析數據:收集實驗數據,進行有效性和效果判斷:統計顯著性達到95%或以上並且維持一段時間,實驗可以結束;如果在95%以下,則可能需要延長測試時間;如果很長時間統計顯著性不能達到95%甚至90%,則需要決定是否中止試驗。
(6)最後:根據試驗結果確定發布新版本、調整分流比例繼續測試或者在試驗效果未達成的情況下繼續優化迭代方案重新開發上線試驗。
流程圖如下:
通過對兩種及以上維度的劃分,運用坐標的方式表達出想要的價值。由價值直接轉變為策略,從而進行一些落地的推動。象限法是一種策略驅動的思維,常與產品分析、市場分析、客戶管理、商品管理等。比如,下圖是一個廣告點擊的四象限分布,X軸從左到右表示從低到高,Y軸從下到上表示從低到高。
高點擊率高轉化的廣告,說明人群相對精準,是一個高效率的廣告。高點擊率低轉化的廣告,說明點擊進來的人大多被廣告吸引了,轉化低說明廣告內容針對的人群和產品實際受眾有些不符。高轉化低點擊的廣告,說明廣告內容針對的人群和產品實際受眾符合程度較高,但需要優化廣告內容,吸引更多人點擊。低點擊率低轉化的廣告,可以放棄了。還有經典的RFM模型,把客戶按最近一次消費(Recency)、消費頻率(Frequency)、消費金額 (Monetary)三個維度分成八個象限。
通過象限分析法,將有相同特徵的事件進行歸因分析,總結其中的共性原因。例如上面廣告的案例中,第一象限的事件可以提煉出有效的推廣渠道與推廣策略,第三和第四象限可以排除一些無效的推廣渠道;
(2)建立分組優化策略
針對投放的象限分析法可以針對不同象限建立優化策略,例如RFM客戶管理模型中按照象限將客戶分為重點發展客戶、重點保持客戶、一般發展客戶、一般保持客戶等不同類型。給重點發展客戶傾斜更多的資源,比如VIP服務、個性化服務、附加銷售等。給潛力客戶銷售價值更高的產品,或一些優惠措施來吸引他們回歸。
帕累托法則,源於經典的二八法則。比如在個人財富上可以說世界上20%的人掌握著80%的財富。而在數據分析中,則可以理解為20%的數據產生了80%的效果需要圍繞這20%的數據進行挖掘。往往在使用二八法則的時候和排名有關系,排在前20%的才算是有效數據。二八法是抓重點分析,適用於任何行業。找到重點,發現其特徵,然後可以思考如何讓其餘的80%向這20%轉化,提高效果。
一般地,會用在產品分類上,去測量並構建ABC模型。比如某零售企業有500個SKU以及這些SKU對應的銷售額,那麼哪些SKU是重要的呢,這就是在業務運營中分清主次的問題。
常見的做法是將產品SKU作為維度,並將對應的銷售額作為基礎度量指標,將這些銷售額指標從大到小排列,並計算截止當前產品SKU的銷售額累計合計占總銷售額的百分比。
百分比在 70%(含)以內,劃分為 A 類。百分比在 70~90%(含)以內,劃分為 B 類。百分比在 90~100%(含)以內,劃分為 C 類。以上百分比也可以根據自己的實際情況調整。
ABC分析模型,不光可以用來劃分產品和銷售額,還可以劃分客戶及客戶交易額等。比如給企業貢獻80%利潤的客戶是哪些,佔比多少。假設有20%,那麼在資源有限的情況下,就知道要重點維護這20%類客戶。
漏鬥法即是漏斗圖,有點像倒金字塔,是一個流程化的思考方式,常用於像新用戶的開發、購物轉化率這些有變化和一定流程的分析中。
上圖是經典的營銷漏斗,形象展示了從獲取用戶到最終轉化成購買這整個流程中的一個個子環節。相鄰環節的轉化率則就是指用數據指標來量化每一個步驟的表現。所以整個漏斗模型就是先將整個購買流程拆分成一個個步驟,然後用轉化率來衡量每一個步驟的表現,最後通過異常的數據指標找出有問題的環節,從而解決問題,優化該步驟,最終達到提升整體購買轉化率的目的。
整體漏斗模型的核心思想其實可以歸為分解和量化。比如分析電商的轉化,我們要做的就是監控每個層級上的用戶轉化,尋找每個層級的可優化點。對於沒有按照流程操作的用戶,專門繪制他們的轉化模型,縮短路徑提升用戶體驗。
還有經典的黑客增長模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用戶獲取、用戶激活、用戶留存、用戶收益以及用戶傳播。這是產品運營中比較常見的一個模型,結合產品本身的特點以及產品的生命周期位置,來關注不同的數據指標,最終制定不同的運營策略。
從下面這幅AARRR模型圖中,能夠比較明顯的看出來整個用戶的生命周期是呈現逐漸遞減趨勢的。通過拆解和量化整個用戶生命周期各環節,可以進行數據的橫向和縱向對比,從而發現對應的問題,最終進行不斷的優化迭代。
用戶路徑分析追蹤用戶從某個開始事件直到結束事件的行為路徑,即對用戶流向進行監測,可以用來衡量網站優化的效果或營銷推廣的效果,以及了解用戶行為偏好,其最終目的是達成業務目標,引導用戶更高效地完成產品的最優路徑,最終促使用戶付費。如何進行用戶行為路徑分析?
(1)計算用戶使用網站或APP時的每個第一步,然後依次計算每一步的流向和轉化,通過數據,真實地再現用戶從打開APP到離開的整個過程。
(2)查看用戶在使用產品時的路徑分布情況。例如:在訪問了某個電商產品首頁的用戶後,有多大比例的用戶進行了搜索,有多大比例的用戶訪問了分類頁,有多大比例的用戶直接訪問的商品詳情頁。
(3)進行路徑優化分析。例如:哪條路徑是用戶最多訪問的;走到哪一步時,用戶最容易流失。
(4)通過路徑識別用戶行為特徵。例如:分析用戶是用完即走的目標導向型,還是無目的瀏覽型。
(5)對用戶進行細分。通常按照APP的使用目的來對用戶進行分類。如汽車APP的用戶可以細分為關注型、意向型、購買型用戶,並對每類用戶進行不同訪問任務的路徑分析,比如意向型的用戶,他進行不同車型的比較都有哪些路徑,存在什麼問題。還有一種方法是利用演算法,基於用戶所有訪問路徑進行聚類分析,依據訪問路徑的相似性對用戶進行分類,再對每類用戶進行分析。
以電商為例,買家從登錄網站/APP到支付成功要經過首頁瀏覽、搜索商品、加入購物車、提交訂單、支付訂單等過程。而在用戶真實的選購過程是一個交纏反復的過程,例如提交訂單後,用戶可能會返回首頁繼續搜索商品,也可能去取消訂單,每一個路徑背後都有不同的動機。與其他分析模型配合進行深入分析後,能為找到快速用戶動機,從而引領用戶走向最優路徑或者期望中的路徑。
用戶行為路徑圖示例:
用戶留存指的是新會員/用戶在經過一定時間之後,仍然具有訪問、登錄、使用或轉化等特定屬性和行為,留存用戶占當時新用戶的比例就是留存率。留存率按照不同的周期分為三類,以登錄行為認定的留存為例:
第一種 日留存,日留存又可以細分為以下幾種:
(1)次日留存率:(當天新增的用戶中,第2天還登錄的用戶數)/第一天新增總用戶數
(2)第3日留存率:(第一天新增用戶中,第3天還有登錄的用戶數)/第一天新增總用戶數
(3)第7日留存率:(第一天新增用戶中,第7天還有登錄的用戶數)/第一天新增總用戶數
(4)第14日留存率:(第一天新增用戶中,第14天還有登錄的用戶數)/第一天新增總用戶數
(5)第30日留存率:(第一天新增用戶中,第30天還有登錄的用戶數)/第一天新增總用戶數
第二種 周留存,以周度為單位的留存率,指的是每個周相對於第一個周的新增用戶中,仍然還有登錄的用戶數。
第三種 月留存,以月度為單位的留存率,指的是每個月相對於第一個周的新增用戶中,仍然還有登錄的用戶數。留存率是針對新用戶的,其結果是一個矩陣式半面報告(只有一半有數據),每個數據記錄行是日期、列為對應的不同時間周期下的留存率。正常情況下,留存率會隨著時間周期的推移而逐漸降低。下面以月留存為例生成的月用戶留存曲線:
聚類分析屬於探索性的數據分析方法。通常,我們利用聚類分析將看似無序的對象進行分組、歸類,以達到更好地理解研究對象的目的。聚類結果要求組內對象相似性較高,組間對象相似性較低。在用戶研究中,很多問題可以藉助聚類分析來解決,比如,網站的信息分類問題、網頁的點擊行為關聯性問題以及用戶分類問題等等。其中,用戶分類是最常見的情況。
常見的聚類方法有不少,比如K均值(K-Means),譜聚類(Spectral Clustering),層次聚類(Hierarchical Clustering)。以最為常見的K-means為例,如下圖:
可以看到,數據可以被分到紅藍綠三個不同的簇(cluster)中,每個簇應有其特有的性質。顯然,聚類分析是一種無監督學習,是在缺乏標簽的前提下的一種分類模型。當我們對數據進行聚類後並得到簇後,一般會單獨對每個簇進行深入分析,從而得到更加細致的結果。
㈣ 概率分析的含義是什麼其步驟是怎樣的請舉例
概率分析又稱風險分析,是通過研究各種不確定性因素發生不同變動幅度的概率分布及其對項目經濟效益指標的影響,對項目可行性和風險性以及方案優劣作出判斷的一種不確定性分析法。概率分析常用於對大中型重要若干項目的評估和決策之中。
步聚
1、列出各種欲考慮的不確定因素。例如銷售價格、銷售量、投資和經營成本等,均可作為不確定因素。需要注意的是,所選取的幾個不確定因素應是互相獨立的。
2、設想各各不確定因素可能發生的情況,即其數值發生變化的幾種情況。
3、分別確定各種可能發生情況產生的可能性,即概率。各不確定因素的各種可能發生情況出現的概率之和必須等於1。
4、計算目標值的期望值。
可根據方案的具體情況選擇適當的方法。假若採用凈現值為目標值,則一種方法是,將各年凈現金流量所包含的各不確定因素在各可能情況下的數值與其概率分別相乘後再相加,得到各年凈現金流量的期望值,然後求得凈現值的期望值。另一種方法是直接計算凈現值的期望值。
5、求出目標值大於或等於零的累計概率。
對於單個方案的概率分析應求出凈現值大於或等於零的概率,由該概率值的大小可以估計方案承受風險的程度,該概率值越接近1,說明技術方案的風險越小,反之,方案的風險越大。可以列表求得凈現值大於或等於零的概率
概率分析是根據不確定因素在一定范圍內的隨機變動,分析並確定這種變動的概率分布,從而計算出其期望值及標准偏差為項目的風險決策提供依據的一種分析方法。
案例網頁鏈接
㈤ 常見的8個概率分布公式和可視化
概率和統計知識是數據科學和機器學習的核心; 我們需要統計和概率知識來有效地收集、審查、分析數據。
現實世界中有幾個現象實例被認為是統計性質的(即天氣數據、銷售數據、財務數據等)。 這意味著在某些情況下,我們已經能夠開發出方法來幫助我們通過可以描述數據特徵的數學函數來模擬自然。
「概率分布是一個數學函數,它給出了實驗中不同可能結果的發生概率。」
了解數據的分布有助於更好地模擬我們周圍的世界。 它可以幫助我們確定各種結果的可能性,或估計事件的可變性。 所有這些都使得了解不同的概率分布在數據科學和機器學習中非常有價值。
在本文中,我們將介紹一些常見的分布並通過Python 代碼進行可視化以直觀地顯示它們。
最直接的分布是均勻分布。 均勻分布是一種概率分布,其中所有結果的可能性均等。 例如,如果我們擲一個公平的骰子,落在任何數字上的概率是 1/6。 這是一個離散的均勻分布。
但是並不是所有的均勻分布都是離散的——它們也可以是連續的。 它們可以在指定范圍內取任何實際值。 a 和 b 之間連續均勻分布的概率密度函數 (PDF) 如下:
讓我們看看如何在 Python 中對它們進行編碼:
高斯分布可能是最常聽到也熟悉的分布。 它有幾個名字:有人稱它為鍾形曲線,因為它的概率圖看起來像一個鍾形,有人稱它為高斯分布,因為首先描述它的德國數學家卡爾·高斯命名,還有一些人稱它為正態分布,因為早期的統計學家 注意到它一遍又一遍地再次發生。
正態分布的概率密度函數如下:
σ 是標准偏差,μ 是分布的平均值。 要注意的是,在正態分布中,均值、眾數和中位數都是相等的。
當我們繪制正態分布的隨機變數時,曲線圍繞均值對稱——一半的值在中心的左側,一半在中心的右側。 並且,曲線下的總面積為 1。
對於正態分布來說。 經驗規則告訴我們數據的百分比落在平均值的一定數量的標准偏差內。 這些百分比是:
68% 的數據落在平均值的一個標准差內。
95% 的數據落在平均值的兩個標准差內。
99.7% 的數據落在平均值的三個標准差范圍內。
對數正態分布是對數呈正態分布的隨機變數的連續概率分布。 因此,如果隨機變數 X 是對數正態分布的,則 Y = ln(X) 具有正態分布。
這是對數正態分布的 PDF:
對數正態分布的隨機變數只取正實數值。 因此,對數正態分布會創建右偏曲線。
讓我們在 Python 中繪制它:
泊松分布以法國數學家西蒙·丹尼斯·泊松的名字命名。 這是一個離散的概率分布,這意味著它計算具有有限結果的事件——換句話說,它是一個計數分布。 因此,泊松分布用於顯示事件在指定時期內可能發生的次數。
如果一個事件在時間上以固定的速率發生,那麼及時觀察到事件的數量(n)的概率可以用泊松分布來描述。 例如,顧客可能以每分鍾 3 次的平均速度到達咖啡館。 我們可以使用泊松分布來計算 9 個客戶在 2 分鍾內到達的概率。
下面是概率質量函數公式:
λ 是一個時間單位的事件率——在我們的例子中,它是 3。k 是出現的次數——在我們的例子中,它是 9。這里可以使用 Scipy 來完成概率的計算。
泊松分布的曲線類似於正態分布,λ 表示峰值。
指數分布是泊松點過程中事件之間時間的概率分布。指數分布的概率密度函數如下:
λ 是速率參數,x 是隨機變數。
可以將二項分布視為實驗中成功或失敗的概率。 有些人也可能將其描述為拋硬幣概率。
參數為 n 和 p 的二項式分布是在 n 個獨立實驗序列中成功次數的離散概率分布,每個實驗都問一個是 - 否問題,每個實驗都有自己的布爾值結果:成功或失敗。
本質上,二項分布測量兩個事件的概率。 一個事件發生的概率為 p,另一事件發生的概率為 1-p。
這是二項分布的公式:
可視化代碼如下:
學生 t 分布(或簡稱 t 分布)是在樣本量較小且總體標准差未知的情況下估計正態分布總體的均值時出現的連續概率分布族的任何成員。 它是由英國統計學家威廉·西利·戈塞特(William Sealy Gosset)以筆名「student」開發的。
PDF如下:
n 是稱為「自由度」的參數,有時可以看到它被稱為「d.o.f.」 對於較高的 n 值,t 分布更接近正態分布。
卡方分布是伽馬分布的一個特例; 對於 k 個自由度,卡方分布是一些獨立的標准正態隨機變數的 k 的平方和。
PDF如下:
這是一種流行的概率分布,常用於假設檢驗和置信區間的構建。
讓我們在 Python 中繪制一些示例圖:
掌握統計學和概率對於數據科學至關重要。 在本文展示了一些常見且常用的分布,希望對你有所幫助。
作者:Kurtis Pykes
㈥ 初中概率知識點總結
初中概率知識點總結
初中的概率其實並不是十分的難,我們應該要及時進行梳理。下面是我推薦給大家的初中概率知識點總結,希望大家有所收獲。
一、概率的意義與表示方法
1、概率的意義
一般地,在大量重復試驗中,如果事件 A 發生的頻率會穩定在某個常數 p 附近,那麼這個常數 p 就叫做事件 A 的概率。
2、事件和概率的表示方法
一般地,事件用英文大寫字母 A,B,C, …,表示事件 A 的概率 p,可記為 P(A)=P。
二、確定事件和隨機事件的概率之間的關系
1、確定事件概率
(1)當 A 是必然發生的事件時,P(A)=1
(2)當 A 是不可能發生的事件時,P(A)=0
2、確定事件和隨機事件的概率之間的關系
三、古典概型
1、古典概型的定義
某個試驗若具有:①在一次試驗中,可能出現的結構有有限多個;②在一次試驗中,各種結果發生的可能性相等。我們把具有這兩個特點的試驗稱為古典概型。
2、古典概型的概率的求法
一般地,如果在一次試驗中,有 n 種可能的`結果,並且它們發生的可能性都相等,事件 A 包含其中的 m中結果,那麼事件 A 發生的概率為
四、列表法求概率
1、列表法
用列出表格的方法來分析和求解某些事件的概率的方法叫做列表法。
2、列表法的應用場合
當一次試驗要設計兩個因素, 並且可能出現的結果數目較多時,為不重不漏地列出所有可能的結果,通常採用列表法。
五、樹狀圖法求概率
1、樹狀圖法
就是通過列樹狀圖列出某事件的所有可能的結果,求出其概率的方法叫做樹狀圖法。
2、運用樹狀圖法求概率的條件
當一次試驗要設計三個或更多的因素時,用列表法就不方便了,為了不重不漏地列出所有可能的結果 ,通常採用樹狀圖法求概率。
六、利用頻率估計概率
1、利用頻率估計概率
在同樣條件下,做大量的重復試驗,利用一個隨機事件發生的頻率逐漸穩定到某個常數,可以估計這個事件發生的概率。
2、在統計學中,常用較為簡單的試驗方法代替實際操作中復雜的試驗來完成概率估計,這樣的試驗稱為模擬實驗。
3、隨機數
在隨機事件中,需要用大量重復試驗產生一串隨機的數據來開展統計工作。把這些隨機產生的數據稱為隨機數。
;㈦ 什麼是概率樹分析法
概率分析(Probit Analysis) 概率分析又稱風險分析, 是通過研究各種不確定性因素發生不同變動幅度的概率分布及其對項 目 經濟效益指標 的影響, 對項目可行性和風險性以及方案優劣作出判斷的一種不確定性分析法 。概率分析常用於對大中型重要若干 項目 的評估和決策之中。
滿意請採納
㈧ 概率分析法的原理
場地的地震危險性概率分析,一般有四個步驟,即潛在震源模型的建立、不同潛在震源的地震平均年發生率的計算、確定地面運動的衰減規律和地震對場地的影響(圖2-4-1)。
圖2-4-1 地震危險性概率分析步驟
(a)潛在震源模型;(b)重現關系;(c)不同震級(M1,M2、M3)的衰減曲線(A 表示峰值加速度,I表示地震烈度,R 表示震中距);(d)場地峰值加速度超越概率曲線
1.潛在震源模型的建立
根據現有地質、構造、地貌和歷史地震記錄資料,並綜合專家意見,勾劃各種類型的潛在震源。通常假定在震源內地震活動是均勻的。
由於地區的不同和佔有資料的差異,潛在震源模型的建立可採用兩種方法:活動斷層法和構造區法。
(1)活動斷層法
地震集中的板塊邊緣或斷層的地區,可用此法。建立的潛在震源模型可分為如下三類(圖2-4-1(a)。
1)點源:歷史上地震集中在某一區域內,無明顯的斷層存在,如火山地震就是點震源的例子。
2)線源:構造斷裂顯露於地表,歷史地震集中在已知斷層周圍,震源深度一般在5~35km。
3)面源:歷史上地震發生在某一區域,該地區的已知斷裂與地震無明顯相關,或該地區散布很多小斷層。
(2)構造區法
在覆蓋層較厚、地震和斷層活動性很弱的地區,因缺乏地質資料和歷史地震記錄,這時可用構造區法,並假設在構造區內地震的活動性是均勻的。由於資料的缺乏和沒有一個通用的勾劃構造區的方法,專家的主觀意見往往起著主導作用,但專家的意見有時會有很大的分歧,這時宜加以綜合。構造區一般較大,場地往往位於構造區內,對場地來說,有可能發生近場地震。
2.計算不同震源的地震平均年發生率
利用歷史地震記錄,對每個潛在震源區可用Gutenberg和Richter(1941)提出的地震重現關系來計算地震平均年發生率。重現關系是:
地球物理勘探及地球化學勘探方法在城市建設中的應用
式中Nmi為在歷史地震記錄期間,大於、等於震級mi的地震次數;m0為有工程意義的最小地震的震級,為最大可能地震的震級,α、β為回歸系數,用最小二乘法求得:
地球物理勘探及地球化學勘探方法在城市建設中的應用
mi為震級(I=1,2,…n)。
重現關系曲線在半對數紙上為一直線(圖2-4-1(b)。
如果記錄年限為T,則大於、等於有工程意義的最小地震震級m0的地震平均年發生率為
地球物理勘探及地球化學勘探方法在城市建設中的應用
震級大於、等於mi的地震平均年發生率為
地球物理勘探及地球化學勘探方法在城市建設中的應用
震級等於mi的地震平均年發生率為
地球物理勘探及地球化學勘探方法在城市建設中的應用
地震平均年發生率反映了潛在震源區內地震活動性的統計分布特徵。
因為Gutenberg和Richter提出的公式(2-4-1)有時會出現最大地震的年發生率大於次大地震的年發生率的不合理現象,這時可用Cornell提出的改進了的震級密度分布公式:
地球物理勘探及地球化學勘探方法在城市建設中的應用
如果把震級范圍(mu—m0)分成n級,每級增量為
地球物理勘探及地球化學勘探方法在城市建設中的應用
式(2-4-7)中β由下式計算
地球物理勘探及地球化學勘探方法在城市建設中的應用
式中
地球物理勘探及地球化學勘探方法在城市建設中的應用
其中ki是震級為mi時的地震次數。
式(2-4-8)中,大於、等於有工程意義的最小地震震級m0的地震平均年發生率λ≥m0。可用記錄到的地震總次數除以記錄年限而得到,即
地球物理勘探及地球化學勘探方法在城市建設中的應用
如果歷史地震記錄較短,顯然由少量數據來估計平均年發生率是不可靠的。這時可利用地質和地球物理方法的資料,用貝葉斯原理來改進對地震平均年發生率的估計。
3.地面運動的衰減規律
潛在震源區確定之後,則需研究地震影響隨傳播路徑的衰減規律。大家知道,地震時震源產生的地運動,以體波和面波形式向四周傳播,隨著傳播距離的增大,運動強度逐漸衰減。衰減的方式和大小與很多因素有關,如地震震級的大小、斷裂類型、傳遞路徑、震源與場地的距離和場地土質條件等。目前,估計衰減規律的方法有兩種,即按阻尼彈性及非彈性介質中波的傳播理論的方法和按儀器觀測的數據進行回歸分析的經驗方法。在實際應用中,基本上用經驗方法。
衰減規律用地震動參數(如峰值加速度 峰值加速度在不同文獻中有不同的稱呼,如峰值加速度、加速度峰值、加速度最大值。
地球物理勘探及地球化學勘探方法在城市建設中的應用
式中,α為峰值加速度(cm/s2),b1、b2、b3、b4為隨潛在震源及場地地質條件而異的參數,d為場地的震中距(km)。
由不同研究者得出的衰減公式不下幾十種,表2-4-1給出幾個例子。
表2-4-1 衰減公式
(據胡聿賢等,1987)
對於沒有或缺乏強震記錄僅有等震圖的地區,衰減公式用地震烈度表示,其一般形式為
Is=I0+C1+C2d+C3Ind
式中,Is為場地烈度;I0為震中烈度,d為震中距,C1、C2、C3為回歸系數。
場地烈度與峰值加速度的關系,有下面幾種形式:
Inα=f(Is)=C1+C2Is
Inα=f(Is,d)=C1+C2Is+C3Ind
Inα=f(IS,M)=C1+C2Is+C3M
lnα=f(M,d,s)=C1+C2Is+C3Ind+C4S
式中,S為場地土的影響,對於基岩,S=1,其他土壤,S=0;系數Ci(i=1,2,3,4)均由觀測數據通過回歸分析而得到,M為震級。
在缺乏觀測數據的情況下,可用表2-4-2給出的IS-α近似對應關系,由場地烈度估計場地的峰值加速度。
表2-4-2 場地烈度與峰值加速度對應關系表
(據胡聿賢等,1987)
4.計算地震對場地的影響
通常用峰值加速度來表示地震對場地的影響。在場地周圍各潛在震源的影響下,由場地內出現不同峰值加速度的平均年發生率來計算場地在使用期內超過某峰值加速度的概率(危險率或風險率)。對較大區域,則作出給定危險率條件下的等峰值加速度圖,即地震小區劃圖。
(1)不同震級和震中距與場地的地震年發生率
設已知場地周圍有潛在震源k個(k=1、2,…,l),震級范圍為m0≤mi≤mu(i=1,2,…,n),場地到潛在震源在地面投影的距離(震中距)為d≤dj≤du(j=1,2,…,p)。m=
設圖2-4-1(a)中,面源為k,震中距為dj,則震級為mi的年發生率為
地球物理勘探及地球化學勘探方法在城市建設中的應用
式中,λijk為潛在震源k震級mi的年發生率,Sk為潛在震源k的面積(或長度),Sjk為以場地為圓心,以
對不同i及j的重復計算,則可得到潛在震源k對場地的地震年發生率。將算得的地震年發生率看成一個整體,則可排成一個矩陣[λij]k,即
地球物理勘探及地球化學勘探方法在城市建設中的應用
對每個潛在震源重復上述計算,則可得所有震源對場地地震活動的總影響,即離場地距離為dj,震級為mi的地震年發生率為
地球物理勘探及地球化學勘探方法在城市建設中的應用
(2)場地不同峰值加速度的平均年發生率
由衰減公式(2-4-12)計算震中距為dj、震級為mi引起的峰值加速度。對於不同i和j重復計算,可得峰值加度速矩陣[α],即
地球物理勘探及地球化學勘探方法在城市建設中的應用
分析衰減公式(2-4-12)可知,矩陣[α]中的元素,其大小是從左下角往右上角逐漸增大的。利用矩陣[λij]k和矩陣[α]可計算出場地不同峰值加速度的年發生率,作出峰值加速度超越年發生率曲線。具體做法是:先給定某一峰值加速度值α;然後在矩陣[α]中劃出大於、等於α的所有元素,最後,在潛在震源對場地的影響矩陣[λij]k中找出與大於、等於α元素相對應的元素;把找出的元素總和起來,即為場地出現大於、等於峰值加速度α的年平均發生率A≥α,並可作出峰值加速度超越年發生率(λ≥α)-α曲線(圖2-4-3)。
(3)峰值加速度的重現期
工程上常用重現期表示隨機荷載的大小,如「百年一遇的洪水」等,100年就是重現期,它的倒數就是該洪水的年發生率。同理,定義某峰值加速度值αr的重現期為:
地球物理勘探及地球化學勘探方法在城市建設中的應用
(4)使用期超越概率(危險率或風險率)
若工程設施的使用期為T,地震過程是均勻泊松過程,則在使用期T 內,不發生峰值加速度α≥αr的概率為
地球物理勘探及地球化學勘探方法在城市建設中的應用
則超越概率為
地球物理勘探及地球化學勘探方法在城市建設中的應用
如果αr值為工程設施所能承受的最大峰值加速度,超過αr值,設施就會遭到破壞,則式(2-4-16)就是可靠度,即
地球物理勘探及地球化學勘探方法在城市建設中的應用
而式(2-4-18)給出破壞概率(危險率),即
地球物理勘探及地球化學勘探方法在城市建設中的應用
在工程設計中,往往要保證結構的可靠度(即限制結構的破壞概率),反過來確定設計峰值加速度的重現期。表2-4-3給出了風險率F、使用期T和峰值加速重現期及其之間的關系。例如,當使用期T=50年,要求風險率F=10%,由表則可查出確定設計峰值加速度的重現期為Ta=475年,即峰值加速度的年發生率為A≥α≈1/500,再由(λ≥a)-α曲線查得結構物設計時500年一遇的峰值加速值αr。
表2-4-3 風險率、使用期和峰值加速度呈現期關系表
(據胡聿賢等,1987)
(5)等峰值加速度圖的繪制
為表示在給定使用期和風險率條件下較大地區的地震危險性,可把該地區分成很多小網格,對每一個小網格按給定的F和T,求得相應的峰值加速度值,則可得某一地區的有一定使用期和風險率的等峰值加速度圖,供規劃、設計部門使用。
㈨ 常用的兩種概率分析方法
1、用筆和紙算
2、第一種方法和第二種方法