首頁>Club>
6
回覆列表
  • 1 # 郭恆369

    一、概念:(分析-分類-K均值聚類)

    1、此過程使用可以處理大量個案的算法,根據選定的特徵嘗試對相對均一的個案組進行標識。不過,該算法要求您指定聚類的個數。如果知道,您可以指定初始聚類中心。您可以選擇對個案分類的兩種方法之一,要麼迭代地更新聚類中心,要麼只進行分類。可以保存聚類成員、距離信息和最終聚類中心。還可以選擇指定一個變量,使用該變量的值來標記個案輸出。您還可以請求分析方差F統計量。

    二、聚類中心(分析-分類-K均值聚類)

    為獲得最佳有效性,可取一個個案樣本並選擇迭代和分類方法確定聚類中心。選擇最終聚類中心另存為。然後恢復整個數據文件並選擇僅分類作為方法,並選擇讀取初始聚類中心來源以使用該樣本估計的中心對整個文件分類。您可以寫入和讀取文件或數據集。可以在同一會話中繼續使用數據集,但不會將其另存為文件,除非在會話結束之前明確將其保存為文件。數據集名稱必須符合變量命名規則。

    三、迭代(分析-分類-K均值聚類-迭代)

    注意:只有在您從“K均值聚類分析”對話框中選擇了迭代和分類方法的情況下,這些選項才可用。◎最大迭代次數。限制K均值算法中的迭代次數。即使尚未滿足收斂準則,達到迭代次數之後迭代也會停止。此數字必須在1到999之間。◎收斂性標準。確定迭代何時停止。它表示初始聚類中心之間的最小距離的比例,因此必須大於0且小於等於1。例如,如果準則等於0.02,則當完整的迭代無法將任何聚類中心移動任意初始聚類中心之間最小距離的2%時,迭代停止。◎使用運行均值。允許您請求在分配了每個個案之後更新聚類中心。如果不選擇此選項,則會在分配了所有個案之後計算新的聚類中心。

    四、保存(分析-分類-K均值聚類-保存)

    1、聚類成員。創建指示每個個案最終聚類成員的新變量。新變量的值範圍是從1到聚類數。

    2、與聚類中心的距離。創建指示每個個案與其分類中心之間的歐式距離的新變量。

    五、選項:(分析-分類-K均值聚類-選項)

    統計量。您可以選擇以下統計量:初始聚類中心、ANOVA表以及每個個案的聚類信息。◎初始聚類中心.每個聚類的變量均值的第一個估計值。默認情況下,從數據中選擇與聚類數相等的分布良好的多個個案。初始聚類中心用於第一輪分類,然後再更新。◎ANOVA表.顯示方差分析表,該表包含每個聚類變量的一元F檢驗。F檢驗只是描述性的,不應解釋生成的概率。如果所有個案均分配到單獨一個聚類,則ANOVA表不顯示。◎每個個案的聚類信息.顯示每個個案的最終聚類分配,以及該個案和用來對個案分類的聚類中心之間的Euclidean距離。還顯示最終聚類中心之間的歐氏距離。

  • 中秋節和大豐收的關聯?
  • 做人別坑人的說說?