建議可以參考以下案例,使用SPSSAU系統快速進行分析。
1、背景
當前有8個裁判對300名選手打分,最低分為1分,最高分為10分;希望對8個裁判進行聚類,以識別出裁判的風格型別。總共8個裁判共有8列資料,並且共有300行。由於打分全部均是從1到10分,8列資料的單位均一樣,因此在分析之前不需要進行標準化資料(當然進行標準化處理也沒有問題)。
2、操作步驟
本案例中總共涉及8個標題,SPSSAU操作截圖如下:
SPSSAU會預設聚類為3類並且呈現表格結果,如果希望更多的類別個數,可自行進行設定。
3、SPSSAU輸出結果
SPSSAU會首先輸出聚類項的基本描述情況,接著輸出每項的聚類類別歸屬情況;並且輸出樹狀圖,如下所述:
聚類項描述分析
上表格展示總共8個分析項(即8個裁判資料)的基本情況,包括均值,最大或者最小值,中位數等,以便對於基礎資料有個概括性瞭解。整體上看,8個裁判的打分基本平均在8分以上。
SPSSAU:智慧化分析
聚類類別分佈表
總共聚類為3個類別,以及具體分析項的對應關係情況。在上表格中展示出來,上表格可以看出:裁判8單獨作為一類;裁判5,3,7這三個聚為一類;以及裁判1,6,2,4作為一類。
聚類類別與分析項上的對應關係可以在上表格中得到,同時也可以檢視聚類樹狀圖得出更多資訊。至於聚類類別分別應該叫做什麼名字,這個需要結合對應有關係情況,自己單獨進行命名。
上圖為聚類樹狀圖的展示,聚類樹狀圖是將聚類的具體過程用圖示法手法進行展示;最上面一行的數字僅僅是一個刻度單位,代表相對距離大小;一個結點表示一次聚焦過程。
樹狀圖的解讀上,建議單獨畫一條垂直線,然後對應檢視分成幾個類別,以及每個類別與分析項的對應關係。比如下圖中,紅色垂直線最終會拆分成3個類別:第1個類別對應裁判8;第2個類別對應裁判5,3,7;第3個類別對應裁判1,6,2,4。
當然在分析時也可以考慮分成2個類別,此時只需要對應將垂直線移動即可:
上圖展示出僅分為2個類別時的情況;如果聚類成2個類別;此時裁判8單獨作為一個類別;裁判5,4,7,1,6,2,4會單獨聚為一類。
如果是聚為四類;從上圖可看出,明顯的已經不再合適。原因在於垂直線不好區分成四類。也即說明有2個類別本應該在一起更合適(上圖中的裁判1與6/2/4);但是如果分成4類,此時裁判1會單獨成一類。所以畫垂直線無法區分出類別。
因而綜合分析來看,最終聚類為3個類別最為適合。
建議可以參考以下案例,使用SPSSAU系統快速進行分析。
1、背景
當前有8個裁判對300名選手打分,最低分為1分,最高分為10分;希望對8個裁判進行聚類,以識別出裁判的風格型別。總共8個裁判共有8列資料,並且共有300行。由於打分全部均是從1到10分,8列資料的單位均一樣,因此在分析之前不需要進行標準化資料(當然進行標準化處理也沒有問題)。
2、操作步驟
本案例中總共涉及8個標題,SPSSAU操作截圖如下:
SPSSAU會預設聚類為3類並且呈現表格結果,如果希望更多的類別個數,可自行進行設定。
3、SPSSAU輸出結果
SPSSAU會首先輸出聚類項的基本描述情況,接著輸出每項的聚類類別歸屬情況;並且輸出樹狀圖,如下所述:
聚類項描述分析
上表格展示總共8個分析項(即8個裁判資料)的基本情況,包括均值,最大或者最小值,中位數等,以便對於基礎資料有個概括性瞭解。整體上看,8個裁判的打分基本平均在8分以上。
SPSSAU:智慧化分析
聚類類別分佈表
總共聚類為3個類別,以及具體分析項的對應關係情況。在上表格中展示出來,上表格可以看出:裁判8單獨作為一類;裁判5,3,7這三個聚為一類;以及裁判1,6,2,4作為一類。
聚類類別與分析項上的對應關係可以在上表格中得到,同時也可以檢視聚類樹狀圖得出更多資訊。至於聚類類別分別應該叫做什麼名字,這個需要結合對應有關係情況,自己單獨進行命名。
上圖為聚類樹狀圖的展示,聚類樹狀圖是將聚類的具體過程用圖示法手法進行展示;最上面一行的數字僅僅是一個刻度單位,代表相對距離大小;一個結點表示一次聚焦過程。
樹狀圖的解讀上,建議單獨畫一條垂直線,然後對應檢視分成幾個類別,以及每個類別與分析項的對應關係。比如下圖中,紅色垂直線最終會拆分成3個類別:第1個類別對應裁判8;第2個類別對應裁判5,3,7;第3個類別對應裁判1,6,2,4。
當然在分析時也可以考慮分成2個類別,此時只需要對應將垂直線移動即可:
上圖展示出僅分為2個類別時的情況;如果聚類成2個類別;此時裁判8單獨作為一個類別;裁判5,4,7,1,6,2,4會單獨聚為一類。
如果是聚為四類;從上圖可看出,明顯的已經不再合適。原因在於垂直線不好區分成四類。也即說明有2個類別本應該在一起更合適(上圖中的裁判1與6/2/4);但是如果分成4類,此時裁判1會單獨成一類。所以畫垂直線無法區分出類別。
因而綜合分析來看,最終聚類為3個類別最為適合。