導航:首頁 > 安裝方法 > 決策樹的繪制實驗方法與步驟

決策樹的繪制實驗方法與步驟

發布時間:2023-01-14 10:42:31

㈠ 決策樹法(一)

姓名:王映中 學號:20181214025 學院:廣研院

轉自 https://blog.csdn.net/weixin_42327752/article/details/117806076

【嵌牛導讀】決策樹(decision tree)是一種基本的分類與回歸方法。決策樹學習通常包括3個步驟:特徵選擇、決策樹的生成和決策樹的修剪。些決策樹學習的思想主要來源於由Quinlan在1986年提出的ID3演算法和1993年提出的C4.5演算法,以及由Breiman等人在1984年提出的CART演算法。

【嵌牛鼻子】決策樹模型與學習

【嵌牛提問】如何建立決策樹模型?

【嵌牛正文】

1 決策樹模型與學習

決策樹解決分類問題的一般方法

1.1 決策樹模型

定義:分類決策樹模型是一種描述對實例進行分類的樹形結構。決策樹由結點(node)和有向邊(directed edge)組成。結點有兩種類型:內部結點(internal node)和葉結點(leaf node)。內部結點表示一個特徵或屬性,葉結點表示一個類。

1.2 決策樹與if-then規則

可以將決策樹看成一個if-then規則的集合。將決策樹轉換成if-then規則的過程是這樣的:由決策樹的根結點到葉結點的每一條路徑構建一條規則;路徑上內部結點的特徵對應著規則的條件,而葉結點的類對應著規則的結論。

    決策樹的路徑或其對應的if-then規則集合具有一個重要的性質:互斥並且完備。這就是說,每一個實例都被一條路徑或一條規則所覆蓋,而且只被一條路徑或一條規則所覆蓋。這里所謂覆蓋是指實例的特徵與路徑上的特徵一致或實例滿足規則的條件。

1.3 決策樹與條件概率分布

1.4 決策樹學習

決策樹學習本質上是從訓練數據集中歸納出一組分類規則,與訓練數據集不相矛盾的決策樹(即能對訓練數據進行正確分類的決策樹)可能有多個,也可能一個也沒有。從另一個角度看,決策樹學習是由訓練數據集估計條件概率模型。基於特徵空間劃分的類的條件概率模型有無窮多個。我們選擇的條件概率模型應該不僅對訓練數據有很好的擬合,而且對未知數據有很好的預測。

    決策樹的損失函數是正則化的極大似然函數。當損失函數確定以後,學習問題就變為在損失函數意義下選擇最優決策樹的問題。因為從所有可能的決策樹中選取最優決策樹是NP完全問題,所以現實中決策樹學習演算法通常採用啟發式方法,近似求解這一最優化問題。這樣得到的決策樹是次最優(sub-optimal)的。

    決策樹學習的演算法通常是一個遞歸地選擇最優特徵,並根據該特徵對訓練數據進行分割,使得對各個子數據集有一個最好的分類的過程。這一過程對應著對特徵空間的劃分,也對應著決策樹的構建。開始,構建根結點,將所有訓練數據都放在根結點。選擇一個最優特徵,按照這一特徵將訓練數據集分割成子集,使得各個子集有一個在當前條件下最好的分類。如果這些子集已經能夠被基本正確分類,那麼構建葉結點,並將這些子集分到所對應的葉結點中去;如果還有子集不能被基本正確分類,那麼就對這些子集選擇新的最優特徵,繼續對其進行分割,構建相應的結點。如此遞歸地進行下去,直至所有訓練數據子集被基本正確分類,或者沒有合適的特徵為止。最後每個子集都被分到葉結點上,即都有了明確的類。這就生成了一棵決策樹。

    以上方法生成的決策樹可能對訓練數據有很好的分類能力,但對未知的測試數據卻未必有很好的分類能力,即可能發生過擬合現象。我們需要對已生成的樹自下而上進行剪枝,將樹變得更簡單,從而使它具有更好的泛化能力。具體地,就是去掉過於細分的葉結點,使其回退到父結點,甚至更高的結點,然後將父結點或更高的結點改為新的葉結點。

決策樹學習演算法包含特徵選擇、決策樹的生成與決策樹的剪枝過程。決策樹學習演算法包含特徵選擇、決策樹的生成與決策樹的剪枝過程。

    決策樹學習常用的演算法有ID3、C4.5與CART,下面結合這些演算法分別敘述決策樹學習的特徵選擇、決策樹的生成和剪枝過程。

㈡ 決策樹決策表如何繪制

根據題目,先將收件距離分為大於1000和小於或等於1000兩種,這就是決策樹的第一層的兩個分支。如收費標准——L≤1000 ——L>1000; 然後,題目告知,在1000公里以內,普通郵件2元/公斤;掛號3元/公斤,這就是第一個分支上的兩個更細的分支;也就是說L≤1000裡面又可以有兩個分支,一個是掛號,一個是普通(暫時先不分,大家看明白,下面我會把整個圖畫出來的); 第三,可以看到大於1000公里的,普通郵件2.5元/公斤;掛號3.5元/公斤。這是大於1000公里的兩個分支。 第四,到這里,還沒有完,因為可以看到題目的最後一句,就是在超過1000公里以外的郵件,還有一個分支,就是重量部分的,超過30公斤,要加收0.5元,當然,另一個條件就是不超過的不加,這就需要在大於1000公里的分出的兩個分支裡面又要分出兩個分支。 題目分析完了之後,我們開始繪圖。(因為我對WORD文檔的很多使用還不是特別熟練,呵呵,只能是粗略的繪一張草圖,大家克服一下,看明白就可以了)。第一層兩個分支收費標准——L≤1000 ——L>1000 第二層分支L≤1000——掛號 3W ——普通 2W L>1000 ——掛號 ——普通 由於在大於1000裡面還分超過30公斤和不超過30公斤的,所以,暫時我們還不給它定價,等到第三層的分支里再定價; 第三層分支L>1000——掛號——W >30 3.5×30+4(W-30) ——W≤30 3.5W ——普通——W >30 2.5×30+4(W-30) ——W≤30 2.5W 再把整個圖復合一下,就成為下面這樣的一個完整的:收費標准——L≤1000——掛號 3W ——普通 2W ——L> 1000——掛號 ——W >30 3.5×30+4(W-30) ——W≤30 3.5W ——普通 ——W >30 2.5×30+3(W-30) ——W≤30 2.5W 然後,大家自己再用大括弧連一下就可以了,應該能看明白了。 下面是決策表;決策表基本是根據決策樹來畫的,現在我們可以看出,我們總共有6個組合,條件有3個,行動的結果有6個,這就確定了決策表的列與行,6個組合構成了決策表的列,3個條件和6個行動結果構成了決策表的9個行,於是,一個決策表的大致輪廓就出來了: 條件和行動 組合 1 2 3 4 5 6 距離是否大於1000 Y Y Y Y N N 是否掛號 Y Y N N Y N 重量是否大於30 Y N Y N F=2W √ F=3W √ F=2.5W √ F=3.5W √ F=2.5×30+3(W-30) √ F= 3.5×30+4(W-30) √ 我想要說明的是,其中的W代表的是你包裹的重量,在決策表中上面三行是條件,下面六行是結果,這個是根據決策表的條件一個一個對照來了,Y代表是,N代表否,不要想當然的往裡添,在條件都符合的情況下畫勾,這樣,一個決策表就做出來了.

㈢ 如何畫決策樹

畫決策樹的步驟如下:

A、先畫一個方框作為出發點,又稱決策節點;
B、從出發點向右引出若干條直線,這些直線叫做方案枝;
C、在每個方案枝的末端畫一個圓圈,這個圓圈稱為概率分叉點,或自然狀態點;
D、從自然狀態點引出代表各自然狀態的分枝,稱為概率分枝;
E、如果問題只需要一級決策,則概率分枝末端畫三角形,表示終點。


例題)
假設有一項工程,施工管理人員需要決定下月是否開工。如果開工後天氣好,則可為國家創收4萬元,若開工後天氣壞,將給國家造成損失1萬元,不開工則損失1000元。根據過去的統計資料,下月天氣好的概率是0.3,天氣壞的概率是0.7。請做出決策。現採用決策樹方法進行決策
【解】第一步:將題意表格化

㈣ 決策樹的畫法

機器學習中,決策樹是一個預測模型;他代表的是對象屬性與對象值之間的一種映射關系。樹中每個節點表示某個對象,而每個分叉路徑則代表的某個可能的屬性值,而每個葉結點則對應從根節點到該葉節點所經歷的路徑所表示的對象的值。決策樹僅有單一輸出,若欲有復數輸出,可以建立獨立的決策樹以處理不同輸出。數據挖掘中決策樹是一種經常要用到的技術,可以用於分析數據,同樣也可以用來作預測。
從數據產生決策樹的機器學習技術叫做決策樹學習, 通俗說就是決策樹。
一個決策樹包含三種類型的節點: 決策節點:通常用矩形框來表示 機會節點:通常用圓圈來表示 終結點:通常用三角形來表示
決策樹學習也是資料探勘中一個普通的方法。在這里,每個決策樹都表述了一種樹型結構,它由它的分支來對該類型的對象依靠屬性進行分類。每個決策樹可以依靠對源資料庫的分割進行數據測試。這個過程可以遞歸式的對樹進行修剪。 當不能再進行分割或一個單獨的類可以被應用於某一分支時,遞歸過程就完成了。另外,隨機森林分類器將許多決策樹結合起來以提升分類的正確率。
決策樹同時也可以依靠計算條件概率來構造。
決策樹如果依靠數學的計算方法可以取得更加理想的效果。 資料庫已如下所示:
(x, y) = (x1, x2, x3…, xk, y)
相關的變數 Y 表示我們嘗試去理解,分類或者更一般化的結果。 其他的變數x1, x2, x3 等則是幫助我們達到目的的變數。

怎麼用決策樹進行做題啊

(二)決策樹法
決策樹法是把方案的一系列因素按它們的相互關系用樹狀結構表示出來,再按一定程序進行優選和決策的方法。
優點是:
(1)便於有次序、有步驟、直觀而又周密地考慮問題;
(2)便於集體討論和決策;
(3)便於處理復雜問題的決策。
運用決策樹決策的步驟:
(1)繪制決策樹圖;
(2)預計可能事件(可能出現的自然狀態)及其發生的概率;
(3)計算各策略方案的損益期望值;
(4)比較各策略方案的損益期望值,進行擇優決策。若決策目標是效益,應取期望值大的方案;若決策目標是費用或損失,應取期望值小的方案。
用決策樹法決策時,決策問題應具備四個條件:
(1) 存在明確的目標;
(2) 有兩個或兩個以上的可供選擇的方案;
(3) 每種方案存在著決策者不可控制的兩種或兩種以上的自然狀態;
(3) 不同方案在不同自然狀態下的期望值可以計算出來。

㈥ 決策樹法的步驟

(1)繪制決策樹圖。從左到右的順序畫決策樹,此過程本身就是對決策問題的再分析過程。
(2)按從右到左的順序計算各方案的期望
值,並將結果寫在相應方案節點上方。期望值的計算是從右到左沿著決策樹的反方向進行計算的。
(3)對比各方案的期望值的大小,進行剪枝優選。在捨去備選方案枝上,用「=」記號隔斷。

㈦ 管理學決策樹怎麼畫

管理學決策樹畫法如下:

第一步:點擊下載「億圖圖示」軟體,也可以訪問億圖圖示在線網頁版。然後啟動軟體,開作圖。

第二步:新建一個「決策樹」。依次點擊「管理-咨詢」-「項目管理」-「決策樹」。這樣我們需要的決策樹模板就會在下方,然後選擇一個模板,點擊使用。

第三步:首先打開畫布左側的符號庫,可以看到很多專業的決策樹符號,然後對想用的符號進行拖拽和使用,也可以修改模板的繪圖形狀打造個性化的決策樹。

2、計算機演算法決策樹可以說時計算機的比較基礎的演算法了。決策樹既可以做分類演算法也可以做回歸演算法,適合程序員學習聯系計算機的代碼書寫。

㈧ 決策樹分析方法的基本步驟 快速找到最佳方案

基本步驟:從左到右順序畫一個決策樹,這是一個決策問題的重新分析過程。從右到左計算每個方案的期望值,並將結果寫在對應的方案節點上方。的期望值是沿著決策樹的相反方向從右到左計算的。比較各方案的期望值,砍掉期望值低的方案(即次優方案),留下最後一個方案作為最佳方案。

特徵選擇:特徵選擇決定了使用哪些特徵進行判斷。在訓練數據集中,每個樣本可能有很多屬性,不同的屬性有不同的作用。因此,特徵選擇的作用就是篩選出與分類結果相關性高的特徵,即分類能力強的特徵。特徵選擇常用的准則是:信息增益。

決策樹的生成:選擇一個特徵後,從根節點觸發,為每個節點計算所有特徵的信息增益,選擇信息增益最大的特徵作為節點特徵,根據該特徵的不同值建立子節點;對每個子節點使用相同的方法來生成新的子節點,直到信息增益很小或者沒有特徵可供選擇。

決策樹的剪枝:剪枝的主要目的是通過主動去除部分分支來對抗「過擬合」,降低過擬合的風險。

決策樹方法的優點:

1.決策樹列出了決策問題的所有可行解和各種可能的自然狀態,以及各種狀態下每個可行方法的期望值。

2.可以直觀地展示整個決策問題在不同階段的時間和決策順序的決策過程。

3.應用於復雜的多階段決策時,階段明顯,層次清晰,便於決策主體集體研究,能夠慎重考慮各種因素,有利於做出正確決策。

㈨ 決策樹分析方法的基本步驟

決策樹分析方法的基本步驟

1.繪制決策樹圖。從左到右的順序畫決策樹,此過程本身就是對決策問題的再分析過程。

2.按從右到左的順序計算各方案的期望值,並將結果寫在相應方案節點上方。期望值的計算是從右到左沿著決策樹的反方向進行計算的。

3.對比各方案的期望值的大小,將期望值小的方案(即劣等方案)剪掉,所剩的最後方案為最佳方案。

決策樹(簡稱DT)利用概率論的原理,並且利用一種樹形圖作為分析工具。其基本原理是用決策點代表決策問題,用方案分枝代表可供選擇的方案,用概率分枝代表方案可能出現的各種結果,經過對各種方案在各種結果條件下損益值的計算比較,為決策者提供決策依據。

缺點:

1) 對連續性的欄位比較難預測;

2) 對有時間順序的數據,需要很多預處理的工作;

3) 當類別太多時,錯誤可能就會增加的比較快;

4) 一般的演算法分類的時候,只是根據一個欄位來分類。

㈩ 決策樹怎麼畫

決策樹是一種幫助企業管理者更有效地進行分析的決策工具。一些簡單的情況,用Word或者簡單的工具就可以完成,Word操作有點困難;用億圖圖示軟體工具對相對復雜的情況都能輕松畫出,會讓你更好的分析和判斷,希望對你有幫助!

閱讀全文

與決策樹的繪制實驗方法與步驟相關的資料

熱點內容
高壓電路測量方法 瀏覽:827
挖雪洞的方法視頻 瀏覽:162
燒疹子怎麼治療方法 瀏覽:182
建築防火膠檢測方法 瀏覽:266
往復泵通常用的方法來調節流量 瀏覽:537
小腿酸沉怎麼治療方法 瀏覽:923
雲南正規進口鮮燉燕窩的食用方法 瀏覽:977
悅翔v5倒車異響解決方法 瀏覽:489
森威m40使用方法 瀏覽:250
一套完整的手關節鍛煉方法 瀏覽:551
海螺七種植方法 瀏覽:275
治療手足癬有效的方法 瀏覽:486
洗衣機牆排管安裝方法 瀏覽:979
手機截屏菜單鍵在哪裡設置方法 瀏覽:680
網路性能分析方法 瀏覽:129
早期白癜風治療最佳方法 瀏覽:342
鹵鴨子的方法及步驟 瀏覽:77
最先進的土地測量方法 瀏覽:985
8個月寶寶退熱貼的正確使用方法 瀏覽:288
膝蓋疼的食物治療方法 瀏覽:667