回覆列表
  • 1 # spssau

    在與SPSSAU(網頁版本SPSS)使用者溝透過程中發現,非常的使用者均是“新手”,沒有資料分析的思維和概念。很多使用者完全沒有進行過資料分析,也不知道如何學習,部分使用者有學習過統計學相關課程,但依舊不會進行資料分析。

    結合SPSSAU的設計理念,建議使用者學習資料分析的路徑如下共三步曲。

    第一步:資料型別的識別

    資料型別是一切研究的基石,也是資料研究思維的最基本且最關鍵的思維。不同學科,不同課程,不同領域時,對於資料型別的定義基本一樣,但稱呼並不完全一樣。首先介紹下SPSSAU裡面的資料型別,共兩類,分別是定類和定量資料。

    定類資料即是分類的意思,可以計算百分比;定量資料是指數字可以對比大小,因而可以進行平均值計算。如果有的資料同時可以計算百分比,也可以計算平均值,此時就結合實際研究情況,將其似著定類或者定量資料即可。比如學歷,通常情況下時看作定類資料,但數字越大也可以說成是學歷越高,所以有的研究方法時把學歷看作是定量資料。具體研究時均是結合實際處理,這也是資料分析的有趣之處。

    SPSSAU將資料分為兩類,但在其它領域,或者學科時,資料型別的劃分並不完全相同,而且稱呼均不統一。這也給研究人員帶來一定困惑,下表列出不同稱呼時與SPSSAU資料型別的對應關係。

    稱呼各不相同,但實際意義均一致,只需要理解一句話即“算百分比時叫定類資料,算平均值時叫定量資料”。

    第二步:研究方法的選擇

    資料型別確認後,此時即可理解資料分析方法的選擇。SPSSAU的設計理念時,區分資料型別的同時,還區分X和Y。比如性別和是否吸菸的關係,X是性別,Y為是否吸菸。X和Y均為定類資料。此時則應該選擇“交叉卡方”分析。

    SPSSAU當前共提供近60類研究方法,具體需要研究者結合資料型別,研究目的進行選擇。

    第一步即選對研究方法,即資料型別的識別。具體可參考“分析方法選擇”文件。第二步即結合研究目的,常見的研究目的包括:資料基本描述、影響關係研究、差異關係研究及其它關係。下表格列出研究目的與研究方法的對應關係。

    上表中列出資料基本描述使用到的研究方法:最常見的為頻數和描述分析,分別針對定類資料計算百分比,定量資料計算平均值。除此之外,正態性檢驗或者正態圖可以檢視定量資料的正態性特質,箱盒圖可以檢視定量資料的分佈、異常離群值情況;詞雲可以檢視定類資料的分佈特徵情況。

    上表中列出常見的關係研究涉及方法;相關分析是比較基礎的關係研究,以及可以使用散點圖直觀展示資料關係情況。迴歸分析研究X對於Y的影響關係,並且Y為定量;同時還有兩個方法即逐步迴歸,分層迴歸;其實質上均是迴歸;逐步迴歸是指讓軟體自己找出對於Y有影響的X;分層迴歸是指一次性執行多個迴歸。

    Logistic迴歸分析時Y均為定類資料,並且可拆分為二元logistic迴歸,多分類logistic迴歸。區別在於二元Logistic迴歸時,Y僅包括0和1兩個數字;多分類logistic迴歸時,Y包括的數字超出2個。

    上表中列出常見的差異關係研究方法。結合資料型別即可選擇出對應的研究方法。方差和T檢驗的區別在於,如果X的個數僅為2個則可以使用T檢驗,如果X的個數超出2個只能使用方差分析。

    方差分析更深入的研究時,會涉及方差齊性檢驗,正態性檢驗等;如果不滿足條件則使用非引數檢驗較好。而且再進一步的深入分析時,可以在方差分析後,進行事後多重比較進一步研究。

    雙因素方差通常用於實驗研究,2個X對於Y的影響情況。如果研究中有多個X,此時稱作多因素方差(也稱多元方差);後續SPSSAU會進行提供等。

    聚類分析是將樣本分類,因子分析與主成分分析的功能類似,可用於資料資訊濃縮,也可以計算權重,同時還可以利用“綜合得分”計算競爭力等。同時還有熵值法,可用於權重計算。

    如果研究資料為問卷,則可能涉及到信度和效度研究,記住此兩種方法僅針對量表資料。同時對於量表資料可使用專案分析,瞭解量表的區分性情況,刪除掉不合理量表項等。同時如果研究中涉及多選題,則有對應五個研究方法可以使用,包括單獨的多選題分析,單選與多選的交叉關係研究,多選與單選的交叉關係研究,多選和多選的交叉關係研究等。多選題的分析有時也稱作多重響應。

    第三步:研究注意事項

    綜上所述,如果可以區分資料型別,並且瞭解研究目的,則可以選擇出科學的研究方法進行研究。具體每個研究方法具體的內容,直接使用SPSSAU的智慧分析即可,當然也建議參閱每個方法對應的幫助手冊,裡面會有更詳細的說明和例子,注意事項等。

    除開上述的研究方法選擇之外,SPSSAU同時還提供以下幾點建議,希望可以幫助到使用者快速掌握資料分析。

    資料正態性特質:很多研究方法都是基於正態性這一前提,如果不滿足時則可能使用其它方法。建議可使用正態圖探索資料的正態性情況,使用箱盒圖探索定量資料的分佈情況;資料編碼、生成變數等資料處理功能的使用。很多研究方法使用之前,是需要進行資料處理。比如問卷研究中1個維度對應5個量表題,此時可以使用生成變數的平均值功能先得到一個概括性的變數。也或者有的研究方法需要進行資料標準化處理等。

  • 中秋節和大豐收的關聯?
  • 有什麼可以清肺化痰、潤喉的菜譜?