1. 對數據進行分組時,有沒有什麼好的方法(公式)確定組數
組數k的確定,一般建議是5~15組,如果數據有50~1000個的話。
組數k的計算, 一般是使用Sturger 公式, K=1+3.3log(N), 其中N是數據樣本數;或者用改進的Sturger公式, K=1+3.3log(N^2/100)。
第二個(改進的Sturger公式)更好一些。也就是,如果樣本數是200,那麼分組數10組是比較合理的。
定義
數據分類就是把具有某種共同屬性或特徵的數據歸並在一起,通過其類別的屬性或特徵來對數據進行區別。
為了實現數據共享和提高處理效率,必須遵循約定的分類原則和方法,按照信息的內涵、性質及管理的要求,將系統內所有信息按一定的結構體系分為不同的集合,從而使得每個信息在相應的分類體系中都有一個對應位置。
換句話說,就是相同內容、相同性質的信息以及要求統一管理的信息集合在一起,而把相異的和需要分別管理的信息區分開來,然後確定各個集合之間的關系,形成一個有條理的分類系統。