數據挖掘最常見的十種方法:
1、基於歷史的MBR分析(Memory-Based Reasoning;MBR)
基於歷史的MBR分析方法最主要的概念是用已知的案例(case)來預測未來案例的一些屬性(attribute),通常找尋最相似的案例來做比較。
2、購物籃分析(Market Basket Analysis)
購物籃分析最主要的目的在於找出什麼樣的東西應該放在一起?商業上的應用在藉由顧客的購買行為來了解是什麼樣的顧客以及這些顧客為什麼買這些產品,找出相 關的聯想(association)規則,企業藉由這些規則的挖掘獲得利益與建立競爭優勢。舉例來說,零售店可藉由此分析改變置物架上的商品排列或是設計 吸引客戶的商業套餐等等。
3、決策樹(Decision Trees)
決策樹在解決歸類與預測上有著極強的能力,它以法則的方式表達,而這些法則則以一連串的問題表示出來,經由不斷詢問問題最終能導出所需的結果。典型的決策 樹頂端是一個樹根,底部有許多的樹葉,它將紀錄分解成不同的子集,每個子集中的欄位可能都包含一個簡單的法則。此外,決策樹可能有著不同的外型,例如二元 樹、三元樹或混和的決策樹型態。
4、遺傳演算法(Genetic Algorithm)
遺傳演算法學習細胞演化的過程,細胞間可經由不斷的選擇、復制、交配、突變產生更佳的新細胞。基因演算法的運作方式也很類似,它必須預先建立好一個模式,再經 由一連串類似產生新細胞過程的運作,利用適合函數(fitness function)決定所產生的後代是否與這個模式吻合,最後僅有最吻合的結果能夠存活,這個程序一直運作直到此函數收斂到最佳解。基因演算法在群集 (cluster)問題上有不錯的表現,一般可用來輔助記憶基礎推理法與類神經網路的應用。
5、聚類分析(Cluster Detection)
這個技術涵蓋范圍相當廣泛,包含基因演算法、類神經網路、統計學中的群集分析都有這個功能。它的目標為找出數據中以前未知的相似群體,在許許多多的分析中,剛開始都運用到群集偵測技術,以作為研究的開端。
6、連接分析(Link Analysis)
連接分析是以數學中之圖形理論(graph theory)為基礎,藉由記錄之間的關系發展出一個模式,它是以關系為主體,由人與人、物與物或是人與物的關系發展出相當多的應用。例如電信服務業可藉 連結分析收集到顧客使用電話的時間與頻率,進而推斷顧客使用偏好為何,提出有利於公司的方案。除了電信業之外,愈來愈多的營銷業者亦利用連結分析做有利於 企業的研究。
7、OLAP分析(On-Line Analytic Processing;OLAP)
嚴格說起來,OLAP分析並不算特別的一個數據挖掘技術,但是透過在線分析處理工具,使用者能更清楚的了解數據所隱藏的潛在意涵。如同一些視覺處理技術一般,透過圖表或圖形等方式顯現,對一般人而言,感覺會更友善。這樣的工具亦能輔助將數據轉變成信息的目標。
8、神經網路(Neural Networks)
神經網路是以重復學習的方法,將一串例子交與學習,使其歸納出一足以區分的樣式。若面對新的例證,神經網路即可根據其過去學習的成果歸納後,推導出新的結果,乃屬於機器學習的一種。數據挖掘的相關問題也可采類神經學習的方式,其學習效果十分正確並可做預測功能。
9、判別分析(Discriminant Analysis)
當所遭遇問題它的因變數為定性(categorical),而自變數(預測變數)為定量(metric)時,判別分析為一非常適當之技術,通常應用在解決 分類的問題上面。若因變數由兩個群體所構成,稱之為雙群體 —判別分析 (Two-Group Discriminant Analysis);若由多個群體構成,則稱之為多元判別分析(Multiple Discriminant Analysis;MDA)。
10、羅吉斯回歸分析(Logistic Analysis)
當判別分析中群體不符合正態分布假設時,羅吉斯回歸分析是一個很好的替代方法。羅吉斯回歸分析並非預測事件(event)是否發生,而是預測該事件的機 率。它將自變數與因變數的關系假定是S行的形狀,當自變數很小時,機率值接近為零;當自變數值慢慢增加時,機率值沿著曲線增加,增加到一定程度時,曲線協 率開始減小,故機率值介於0與1之間。
2. 貝殼掘金怎麼玩
登錄掘金首頁後,點擊「+」按鈕分享他人文章。最後在發現頁面,點擊「編輯」按鈕可以發布沸點。貝殼掘金app是一個綜合性商品訂購平台,實行從預訂到補款提貨的極簡流程,簡單的頁面豐富的信息量深受客戶的信賴,幫助客戶及時了解最新產品信息。
掌握最新行業資訊。自成立以來,商城始終秉承 「以客戶為中心」 的經營理念,創新的經營模式,以堅守價格優勢,顛覆傳統模式的特點進入市場,並致力於向客戶提供最便捷的信息獲取方式和全方位的B2C交易平台。