-
1 # spssau
-
2 # 民眾關注
SPSS分析調查問卷資料的方法當我們的調查問卷在把調查資料拿回來後,我們該做的工作就是用相關的統計軟體進行處理,在此,我們以spss為處理軟體,來簡要說明一下問卷的處理過程,它的過程大致可分為四個過程:定義變數﹑資料錄入﹑統計分析和結果儲存.下面將從這四個方面來對問卷的處理做詳細的介紹.Spss處理:第一步:定義變數大多數情況下我們需要從頭定義變數,在開啟SPSS後,我們可以看到和excel相似的介面,在介面的左下方可以看到Data View, Variable View兩個標籤,只需單擊左下方的Variable View標籤就可以切換到變數定義介面開始定義新變數。在表格上方可以看到一個變數要設定如下幾項:name(變數名)、type(變數型別)、width(變數值的寬度)、decimals(小數位) 、label(變數標籤) 、Values(定義具體變數值的標籤)、Missing(定義變數缺失值)、Colomns(定義顯示列寬)、Align(定義顯示對齊方式)、Measure(定義變數型別是連續、有序分類還是無序分類).我們知道在spss中,我們可以把一份問卷上面的每一個問題設為一個變數,這樣一份問卷有多少個問題就要有多少個變數與之對應,每一個問題的答案即為變數的取值.現在我們以問卷第一個問題為例來說明變數的設定.為了便於說明,可假設此題為:1.請問你的年齡屬於下面哪一個年齡段( )?A:20—29 B:30—39 C:40—49 D:50--59那麼我們的變數設定可如下: name即變數名為1,type即型別可根據答案的型別設定,答案我們可以用1、2、3、4來代替A、B、C、D,所以我們選擇數字型的,即選擇Numeric, width寬度為4,decimals即小數位數位為0(因為答案沒有小數點),label即變數標籤為“年齡段查詢”。Values用於定義具體變數值的標籤,單擊Value框右半部的省略號,會彈出變數值標籤對話方塊,在第一個文字框裡輸入1,第二個輸入20—29,然後單擊新增即可.同樣道理我們可做如下設定,即1=20—29、2=30—39、3=40—49、4=50--59;Missing,用於定義變數缺失值, 單擊missing框右側的省略號,會彈出缺失值對話方塊, 介面上有一列三個單選鈕,預設值為最上方的“無缺失值”;第二項為“不連續缺失值”,最多可以定義3個值;最後一項為“缺失值範圍加可選的一個缺失值”,在此我們不設定預設值,所以選中第一項如圖;Colomns,定義顯示列寬,可自己根據實際情況設定;Align,定義顯示對齊方式,有居左、居右、居中三種方式;Measure,定義變數型別是連續、有序分類還是無序分類。以上為問卷中常見的單項選擇題型的變數設定,下面將對一些特殊情況的變數設定也作一下說明.1.開放式題型的設定:諸如你所在的省份是_____這樣的填空題即為開放題,設定這些變數的時候只需要將Value 、Missing兩項不設定即可.2.多選題的變數設定:這類題型的設定有兩種方法即多重二分法和多重分類法,在這裡我們只對多重二分法進行介紹.這種方法的基本思想是把該題每一個選項設定成一個變數,然後將每一個選項拆分為兩個選項項,即選中該項和不選中該項.現在舉例來說明在spss中的具體操作.比如如下一例:請問您通常獲取新聞的方式有哪些( )1 報紙 2 雜誌 3 電視 4 收音機 5 網路在spss中設定變數時可為此題設定五個變數,假如此題為問卷第三題,那麼變數名分別為3_1、3_2、3_3、3_4、3_5,然後每一個選項有兩個選項選中和不選中,只需在Value一項中為每一個變數設定成1=選中此項、0=不選中此項即可.使用該視窗,我們可以把一個問卷中的所有問題作為變數在這個視窗中一次定義。到此,我們的定義變數的工作就基本上可以結束了.下面我們要作就是資料的錄入了.首先,我們要回到資料錄入視窗,這很簡單,只要我們點選軟體左下方的Data View標籤就可以了.第二步:資料錄入Spss資料錄入有很多方式,大致有一下幾種:1.讀取SPSS格式的資料2.讀取Excel等格式的資料3.讀取文字資料(Fixed和Delimiter)4.讀取資料庫格式資料(分如下兩步)(1)配置ODBC (2)在SPSS中透過ODBC和資料庫進行但是對於問卷的資料錄入其實很簡單,只要在spss的資料錄入視窗中直接輸入就可以了,只是在這裡有幾點注意的事項需要說明一下.1. 在資料錄入視窗,我們可以看到有一個表格,這個表格中的每一行代表一份問卷,我們也稱為一個個案.2. 在資料錄入視窗中,我們可以看到表格上方出現了1、2、3、4、5…….的標籤名,這其實是我們在第一步定義變數中,我們為問卷的每一個問題取的變數名,即1代表第一題,2代表第二題.以次類推.我們只需要在變數名下面輸入對應問題的答案即可完成問卷的資料錄入.比如上述年齡段查詢的例題,如果問卷上勾選了A答案,我們在1下面輸入1就行了(不要忘記我們通常是用1、2、3、4來代替A、B、C、D的).3.我們知道一行代表一份問卷,所以有幾分問卷,就要有幾行的資料.在資料錄入完成後,我們要做的就是我們的關鍵部分,即問卷的統計分析了,因為這時我們已經把問卷中的資料錄入我們的軟體中了.第三步:統計分析有了資料,可以利用SPSS的各種分析方法進行分析,但選擇何種統計分析方法,即呼叫哪個統計分析過程,是得到正確分析結果的關鍵。這要根據我們的問卷調查的目的和我們想要什麼樣的結果來選擇.SPSS有數值分析和作圖分析兩類方法.1.作圖分析:在SPSS中,除了生存分析所用的生存曲線圖被整合到Analyze選單中外,其他的統計繪圖功能均放置在graph選單中。該選單具體分為以下幾部分::(1)Gallery:相當於一個自學嚮導,將統計繪圖功能做了簡單的介紹,初學者可以透過它對SPSS的繪圖能力有一個大致的瞭解。(2)Interactive:互動式統計圖。(3)Map:統計地圖。(4)下方的其他選單項是我們最為常用的普通統計圖,具體來說有:條圖散點圖線圖直方圖餅圖面積圖箱式圖正態Q-Q圖正態P-P圖質量控制圖Pareto圖自迴歸曲線圖高低圖互動相關圖序列圖頻譜圖誤差線圖作圖分析簡單易懂,一目瞭然,我們可根據需要來選擇我們需要作的圖形,一般來講,我們較常用的有條圖,直方圖,正態圖,散點圖,餅圖等等,具體操作很簡單,大家可參閱相關書籍,作圖分析更多情況下是和數值分析相結合來對試卷進行分析的,這樣的效果更好.2.數值分析:SPSS 數值統計分析過程均在Analyze選單中,包括:(1)、Reports和Descriptive Statistics:又稱為基本統計分析.基本統計分析是進行其他更深入的統計分析的前提,透過基本統計分析,使用者可以對分析資料的總體特徵有比較準確的把握,從而選擇更為深入的分析方法對分析物件進行研究。Reports和Descriptive Statistics命令項中包括的功能是對單變數的描述統計分析。Descriptive Statistics包括的統計功能有:Frequencies(頻數分析):作用:瞭解變數的取值分佈情況Descriptives(描述統計量分析):功能:瞭解資料的基本統計特徵和對指定的變數值進行標準化處理Explore(探索分析):功能:考察資料的奇異性和分佈特徵Crosstabs(交叉分析):功能:分析事物(變數)之間的相互影響和關係Reports包括的統計功能有:OLAP Cubes(OLAP報告摘要表):功能: 以分組變數為基礎,計算各組的總計、均值和其他統計量。而輸出的報告摘要則是指每個組中所包含的各種變數的統計資訊。Case Summaries(觀測量列表):察看或列印所需要的變數值Report Summaries in Row:行形式輸出報告Report Summaries in Columns:列形式輸出報告(2)、Compare Means(均值比較與檢驗):能否用樣本均值估計總體均值?兩個變數均值接近的樣本是否來自均值相同的總體?換句話說,兩組樣本某變數均值不同,其差異是否具有統計意義?能否說明總體差異?這是各種研究工作中經常提出的問題。這就要進行均值比較。以下是進行均值比較及檢驗的過程:MEANS過程:不同水平下(不同組)的描述統計量,如男女的平均工資,各工種的平均工資。目的在於比較。術語:水平數(指分類變數的值數,如sex變數有2個值,稱為有兩個水平)、單元Cell(指因變數按分類變數值所分的組)、水平組合T test 過程:對樣本進行T檢驗的過程單一樣本的T檢驗:檢驗單個變數的均值是否與給定的常數之間存在差異。獨立樣本的T檢驗:檢驗兩組不相關的樣本是否來自具有相同均值的總體(均值是否相同,如男女的平均收入是否相同,是否有顯著性差異)配對T檢驗:檢驗兩組相關的樣本是否來自具有相同均值的總體(前後比較,如訓練效果,治療效果)one-Way ANOVA:一元(單因素)方差分析,用於檢驗幾個(三個或三個以上)獨立的組,是否來自均值相同的總體。(3)、ANOVA Models(方差分析):方差分析是檢驗多組樣本均值間的差異是否具有統計意義的一種方法。例如:醫學界研究幾種藥物對某種疾病的療效;農業研究土壤、肥料、日照時間等因素對某種農作物產量的影響;不同飼料對牲畜體重增長的效果等,都可以使用方差分析方法去解決(4)、Correlate(相關分析):它是研究變數間密切程度的一種常用統計方法,常用的相關分析有以下幾種:1、線性相關分析:研究兩個變數間線性關係的程度。用相關係數r來描述。2、偏相關分析:它描述的是當控制了一個或幾個另外的變數的影響條件下兩個變數間的相關性,如控制年齡和工作經驗的影響,估計工資收入與受教育水平之間的相關關係3、相似性測度:兩個或若干個變數、兩個或兩組觀測量之間的關係有時也可以用相似性或不相似性來描述。相似性測度用大值表示很相似,而不相似性用距離或不相似性來描述,大值表示相差甚遠(5)、Regression(迴歸分析):功能:尋求有關聯(相關)的變數之間的關係在迴歸過程中包括:Liner:線性迴歸;Curve Estimation:曲線估計;Binary Logistic:二分變數邏輯迴歸;Multinomial Logistic:多分變數邏輯迴歸;Ordinal 序迴歸;Probit:機率單位迴歸;Nonlinear:非線性迴歸;Weight Estimation:加權估計;2-Stage Least squares:二段最小平方法;Optimal Scaling最優編碼迴歸;其中最常用的為前面三個.(6)、Nonparametric Tests(非引數檢驗):是指在總體不服從正態分佈且分佈情況不明時,用來檢驗資料資料是否來自同一個總體假設的一類檢驗方法。由於這些方法一般不涉及總體引數故得名。非引數檢驗的過程有以下幾個:1.Chi-Square test 卡方檢驗2.Binomial test 二項分佈檢驗3.Runs test 遊程檢驗4.1-Sample Kolmogorov-Smirnov test 一個樣本柯爾莫哥洛夫-斯米諾夫檢驗5.2 independent Samples Test 兩個獨立樣本檢驗6.K independent Samples Test K個獨立樣本檢驗7.2 related Samples Test 兩個相關樣本檢驗8.K related Samples Test 兩個相關樣本檢驗(7)、Data Reduction(因子分析)(8)、Classify(聚類與判別)等等以上就是數值統計分析Analyze選單下幾項用於分析的數值統計分析方法的簡介,在我們的變數定義以及資料錄入完成後,我們就可以根據我們的需要在以上幾種分析方法中選擇若干種對我們的問卷資料進行統計分析,來得到我們想要的結果.第四步:結果儲存我們的spss軟體會把我們統計分析的多有結果儲存在一個視窗中即結果輸出視窗(output),由於spss軟體支援複製和貼上功能,這樣我們就可以把我們想要的結果複製﹑貼上到我們的報告中,當然我們也可以在選單中執行file->save來儲存我們的結果,一般情況下,我們建議儲存我們的資料,結果可不儲存.因為只要有了資料,如果我們想要結果的,我們可以隨時利用資料得到結果.總結:以上便是spss處理問卷的四個步驟,四個步驟結束後,我們需要spss軟體做的工作基本上也就結束了,接下來的任務就是寫我們的統計報告了.值得一提的是.spss是一款在社會統計學應用非常廣泛的統計類軟體,學好它將對我們以後的工作學習產生很大的意義和作用.SPSS的問卷分析中一份問卷是一個案,首先要根據問卷問題的不同定義變數。定義變數值得注意的兩點:一區分變數的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal是指定類;二 注意定義不同的資料型別Type各色各樣的問卷題目的型別大致可以分為單選、多選、排序、開放題目四種類型,他們的變數的定義和處理的方法各有不同,我們詳細舉例介紹如下:1 單選題:答案只能有一個選項例一 當前貴組織機構是否設有面向組織的職業生涯規劃系統?A有 B 正在開創 C沒有 D曾經有過但已中斷編碼:只定義一個變數,Value值1、2、3、4分別代表A、B、C、D 四個選項。錄入:錄入選項對應值,如選C則錄入32 多選題:答案可以有多個選項,其中又有項數不定多選和項數定多選。(1)方法一(二分法):例二 貴處的職業生涯規劃系統工作涵蓋哪些組群?畫鉤時請把所有提示考慮在內。A月薪員工 B日薪員工 C鐘點工編碼:把每一個相應選項定義為一個變數,每一個變數Value值均如下定義:“0” 未選,“1” 選。錄入:被調查者選了的選項錄入1、沒選錄入0,如選擇被調查者選AC,則三個變數分別錄入為1、0、1。(2)方法二:例三 你認為開展保持黨員先進性教育活動的最重要的目標是那三項:1( ) 2 ( ) 3( )A、提高黨員素質 B、加強基層組織 C、堅持發揚民主D、激發創業熱情 E、服務人民群眾 F、促進各項工作編碼:定義三個變數分別代表題目中的1、2、3三個括號,三個變數Value值均同樣的以對應的選項定義,即:“1” A,“2”B,“3” C,“4” D,“5” E,“6” F錄入:錄入的數值1、2、3、4、5、6分別代表選項ABCDEF,相應錄入到每個括號對應的變數下。如被調查者三個括號分別選ACF,則在三個變數下分別錄入1、3、6。注:能用方法二編碼的多選題也能用方法編碼,但是項數不定的多選只能用二分法,即方法一是多選題一般處理方法。3 排序題: 對選項重要性進行排序例四 您購買商品時在 ①品牌 ②流行 ③質量 ④實用 ⑤價格 中對它們的關注程度先後順序是(請填代號重新排列)第一位 第二位 第三位 第四位 第五位編碼:定義五個變數,分別可以代表第一位 第五位,每個變數的Value都做如下定義:“1” 品牌,“2” 流行,“3” 質量,“4” 實用,“5” 價格錄入:錄入的數字1、2、3、4、5分別代表五個選項,如被調查者把質量排在第一位則在代表第一位的變數下輸入“3“。4 選擇排序題:例五 把例三中的問題改為“你認為開展保持黨員先進性教育活動的最重的目標是那三項,並按重要性從高到低排序”,選項不變。編碼:以ABCDEF6個選項分別對應定義6個變數,每個變數的Value都做同樣的如下定義:“1” 未選,“2” 排第一,“3” 排第二,“4” 排第三。錄入:以變數的Value值錄入。比如三個括號裡分別選的是 ECF,則該題的6個變數的值應該分別錄入:1(代表A選項未選)、1、 3(代表C選項排在第二)、1、2、4。注:該方法是對多選題和排序題的方法結合的一種方法,對一般排序題(例四)也同樣適用,只是兩者用的分析方法不同(例四用頻數分析、例五用描述分析),輸出結果從不同的側面反映問題的重要性(前一種方法從位次從變數的頻數看排序,後一種方法從變量出發看排序)。5 開放性數值題和量表題:這類題目要求被調查者自己填入數值,或者打分例六 你的年齡(實歲):______編碼:一個變數,不定義Value值錄入:即錄入被調查者實際填入的數值。6開放性文字題:如果可能的話可以按照含義相似的答案進行編碼,轉換成為封閉式選項進行分析。如果答案內容較為豐富、不容易歸類的,應對這類問題直接做定性分析。三 問卷一般性分析下面具體介紹SPSS中問卷的一般處理方法,操作以版本spss13.0為例,以下提到的選單項均在Analyze主選單下1頻數分析:Frequencies過程可以做單變數的頻數分佈表;顯示資料檔案中由使用者指定的變數的特定值發生的頻數;獲得某些描述統計量和描述數值範圍的統計量。適用範圍:單選題(例一),排序題(例四),多選題的方法二(例三)頻數分析也是問卷分析中最常用的方法。實現: Descriptive statistics……Frequencies2 描述分析:Descriptives:過程可以計算單變數的描述統計量。這些述統計量有平均值、算術和、標準差,最大值、最小值、方差、範圍和平均數標準誤等。適用範圍:選擇並排序題(例五)、開放性數值題(例六)。實現: Descriptive statistics……Descriptives,需要的統計量點選按鈕Statistics…中選擇3 多重反應下的頻次分析:適用範圍:多選題的二分法(例二)實現:第一步在Multiple Response……Define Sets把一道多選問題中定義了的所有變數集合在一起,給新的集合變數取名,在Dichotomies Counted value中輸入1。第二步在Multiple Response……Frequencies中做頻數分析。4 交叉頻數分析:解決對多變數的各水平組合的頻數分析的問題適用範圍:,適用於由兩個或兩個以上變數進行交叉分類形成的列聯表,對變數之間的關聯性進行分析。比如要知道不同工作性質的人上班使用交通工具的情況,可以透過交叉分析得到一個二維頻數表則一目瞭然。實現:第一步根據分析的目的來確定交叉分析的選項,確定控制變數和解釋變數(如上例中不同工作性質的人是控制變數,使用交通工具是解釋變數)。第二步選擇Descriptive statistics……Crosstabs四 簡單圖形描述介紹在做上述頻數分析、描述分析等分析時就可以直接做出圖形,簡單方便,同時也可以另外作圖。SPSS的作圖功能在選單Graphs下,功能強大,圖形清晰優美。現在把常用圖簡單介紹如下1餅圖:又稱圓圖,是以圓的面積代表被研究物件的總體,按各構成部分佔總體比重的大小把圓面積分割成若干扇形,用以表示現象的部分對總體的比例關係的統計圖。頻數分析的結果宜用餅圖表示。2曲線圖:是用線段的升降來說明資料變動情況的一種統計圖。它主要表示現象在時間上的變化趨勢、現象的分配情況和2個現象的依存關係等。3面積圖:用線段下的陰影面積來強調現象變化的統計圖。4條形圖:利用相同寬度條形的長短或高低表現統計資料大小及變化的統計圖。五 問卷深入分析除了以上簡單的分析,spss強大的功能還可以對問卷進行深入分析,比如常用的有聚類分析、交叉分析、因子分析、均值比分析(引數檢驗)、相關分析、迴歸分析等。因為涉及到很專業的統計知識,下面只將個人覺得比較有用的方法的適用範圍和分析目的簡單做介紹:1聚類分析樣本聚類,可以將被調查者分類,並按照這些屬性計算各類的比例,以便明確研究所關心的群體。比如按消費特徵對被調查者的進行聚類。2 相關分析相關分析是針對兩變數或者多變數之間是否存在相關關係的分析方法,要根據變數不同特徵選擇不同的相關性的度量方式。問卷分析中的多數用的變數都屬於分類變數,要採用斯皮爾曼相關係數。其中可以用卡方檢驗,其是對兩變數之間是否具有顯著性影響的分析方法3均值的比較與檢驗(1)Means過程:對指定變數綜合描述分析,分組計算計算均值再比較。比如可以按性別變數分為男和女來研究二者收入是否存在差距。(2)T 檢驗:獨立樣本t檢驗用於不相關的樣本是否開來自具有相同均值的總體的檢驗。比如,研究購買該產品的顧客和不購買的顧客的收入是否有明顯差異。如果樣本不獨立則要用配對t檢驗。比如研究參加職業培訓後 工作效率是否提高。4 迴歸分析問卷分析中的迴歸分析常採用的是用離散迴歸模型,一般是邏輯斯蒂模型,解釋一個變數對另一變數的影響具體有多大。比如,研究對某商品的消費受收入的影響程度。
回覆列表
在設計時就需要考慮到統計方便,才能便於統計分析。
從問卷設計思路出發,常見的研究目的有影響關係研究、現狀政策類研究等。
影響關係類研究最為常見,研究影響關係時,通常會先畫出模型結構框架,一個框架表述整體研究結構思路情況,研究框架為核心。
這類分析思路傾重於關係,並且是影響關係的研究。比如各種因素對員工薪酬滿意度的影響關係研究,員工離職傾向影響關係研究,消費者重複購買意願影響關係研究等。此類分析思路框架大部分題項應該為量表題,小量題項為非量表題。
具體研究內容上:
1. 首先對收集資料進行基本的頻數分析,比如統計性別,年齡,學歷的分佈情況如何等。
2. 如果研究中涉及樣本的特徵情況,比如基本行為,或者認知態度相關性,也可使用頻數分析進行彙總,進一步瞭解清楚樣本特徵情況。
3. 影響關係研究時,問卷中通常會涉及非常多的量表題,如果量表題具體應該分成多少個維度,並不完全確定,此時可使用因子分析進行濃縮,得出幾個維度(因子),並且找到維度與題項的對應關係情況。( 備註:一個維度由多個標題項表示,想將多個標題項概括成一個整體,此時需要使用SPSSAU中“生成變數”的“平均值”功能即可)
4. 資料的可靠性,是否有信度,是最基礎的,一般放在樣本基本特徵背景情況之後,原因在於首先得知道是一群什麼樣的樣本人群在回答問題。同時信度僅針對量表類資料進行研究,無法針對比如性別,年齡之類的背景資訊項進行分析。
5. 除開資料可信,還需要研究量表題項具有可靠性。先有資料可靠,再分析有效,這是常見的結構,效度分析和信度分析也可互換位置。
6. 資料可靠,並且研究量表有效之後,接著需要對具體維度(量表題項等)進行描述分析,研究樣本人群對於量表項的基本態度情況。
7. 完成量表題項,各維度的描述性分析之後,再使用相關分析去研究關係情況,為迴歸分析作準備。
8. 在資料有著相關的前提之下,再研究迴歸影響關係才具有意義。因而回歸分析需要放在相關分析之後。並且通常情況下需要使用迴歸分析去驗證假設。
9. 有可能還需要對比不同人群,比如性別,年齡等不同群體,他們對於量表題項的態度差異情況,因而一般可使用方差分析,或者T檢驗等進行分析。如果說想研究不同背景人群(比如性別,年齡)對於樣本行為上的差異性,建議可使用交叉卡方分析等,同時如果涉及多選題的交叉分析等,也對應選擇需要的方法即可。
現狀政策類研究
現狀政策類研究非常普遍,分析思路傾重於現狀及基本態度,和差異對比研究,瞭解群體的基本認知,態度,觀點意見或者行為等。通常情況下現狀政策類研究更多是非量表題項,此類研究框架的核心在於“分組”。第一件事情為“分組”;比如有30個題,那此此30個題項可以分別歸納為幾個方面呢?比如基本背景,認知,態度,行為,原因等五個方面。第二件事情是將“分組”分別作為一個部分進行分析。第三件事情是分組題項與分組題項之間進行交叉。社會學類、媒體等相關專業會使用此分析框架進行相關研究,以及企業問卷研究較適用於此類分析思路框架。
具體研究內容上:
1. 首先對收集資料進行基本的頻數分析,比如統計性別,年齡,學歷的分佈情況如何等
2. 分別針對“分組”進行分析,每個“分組”作為一個部分進行分析。
3. 差異關係研究:比如基本背景分別與“認知”,“態度”,“行為”,“原因”上的差異性(通常是使用交叉分析,當然涉及多選題時,應該選擇對應多選題應該使用的交叉方法)
4. 如果說希望研究影響關係,比如研究“認知”(X),“態度” (X)分別對於“行為” (Y)的影響關係,此時可考慮使用二元logit迴歸分析。