畢業大半年了,現在還清晰的記得當時畢業論文不會用SPSS的痛苦,每天掙扎把度娘、知乎、知網

、優酷、某寶等各大網站都逛了個遍,依然沒有找到用SPSS完整的分析一份問卷的流程,幾乎都是零零散散的一些知識,又或是幾十個視頻的解說卻總是聽不到自己想聽的部分,眼看論文上交時間到卻毫無頭緒的緊張感使自己完全靜不下心從頭學到尾。從一個完全是SPSS小白到基本能完整分析一份問卷數據(當然也僅僅是單因素的分析,多元分析並未接觸,這篇文章主要希望能幫助之前從未接觸過SPSS卻因論文不得不用的小夥伴)。

實證分析主要包括描述性分析、信度效度分析、相關分析、假設檢驗(回歸分析)。在分析之前我們首先要懂得SPSS的分析原理。學過高數的基本都知道假設檢驗的原理,SPSS軟體的基本原理就是假設檢驗,即先假設H0:A對B沒有影響條件成立,分析得出的結果P(sig.)<0.001/0.01/0.05,則假設不成立,即A對B具有顯著性影響。

用SPSS分析的問卷必須是李克特五級量表或七級量表,生手建議設計五級單因素的量表。問卷數據收集完成後,首先要剔除無效問卷(所有問題答案全選一種選項的或存在矛盾的答案等問卷),保證數據的準確性。分析步驟如下:

  1. 錄入問題及數據

打開SPSS軟體,在變數視圖界面內輸入問題及設置值,一般設置值為1非常不同意,2不同意,3不一定,4同意,5非常同意。同理輸完一篇問卷即可。如下圖:

二、描述性分析

描述性分析主要是對被調查者的基本信息進行描述,如性別、學歷、年齡、工作年限、居住地等等,這類問題一般放置在一份問卷的開頭(也有放置在結尾,個人設計問卷時比較喜歡放置於開頭)。描述性分析主要對問卷的均值、標準差進行分析,均值相同時,比較標準差,標準差越小,表示越穩定。

步驟如下圖:1、點擊分析-----描述統計----描述----選擇變數----點擊選項----選擇你需要描述的項(平均值、方差…..)。

2、分析----描述統計----頻率---選擇項,則可以得出頻率頻數。

最後將自己需要的數據進行匯總了列成表格或圖表(餅圖/柱形圖等)的表示,圖表的項有頻數、頻率、均值、標準值等,並輔以文字說明,使結果一目了然。(註:以下圖表及數據僅作為案例解釋說明,數據不具有準確性和真實性)

二、信度分析

信度分析主要是通過SPSS分析驗證設計的問卷是否可靠,問卷題目之間是否具有良好的相關性進行分析,被調查者的答案是否存在矛盾,是否可靠等等。

問卷分析的步驟如下:點擊分析----標度----可靠性分析-----選擇項----確定即可

得出的結果如下:

結果分析:一般來說,問卷是否可靠主要看Alpha(a係數),a<0.7則表示設計的問卷信度不可靠,0.7<a<0.8則說明問卷具有一定的可靠性,0.8<a<0.9則說明問卷信度很好。上面的項數則是選擇分析的問卷題目的數目。

在進行下面分析時先說一下問卷的設計。實證分析的論文中比較簡單的模型大概可能是:研究對象的影響因素(自變數)會影響研究對象的效果(因變數),A H B ; 即論文假設H為自變數A對因變數B會產生一定的影響。一般可以找出四五個影響因素設計為自變數,每一個影響因素可以設計3—7個問題進行調查。所以在進行可靠性分析的時候可以對每一個影響因素(自變數)的題目數(項數)分析一次,看是否每一個自變數的設計的問題都具有較好的信度。(若某一因素項數信度不夠好,首先可以通過調整題目中的表達措詞、修改或增加關鍵詞來提高信度,若某道題目修改調整後信度仍然過低則可以刪除這一道題目達到提高整篇文章的信度)。

三、效度分析和因子分析

通俗來說,效度分析是檢驗問卷題目與研究目的是否相一致,即不能研究顧客對某產品的滿意度,問卷設計的問題則是調查某產品的市場覆蓋率。一般分為內容效度和結構效度,內容效度是指題項與所測變數的適合性和邏輯相符性(我們在設計問卷時一般都要參考或引用前人的問卷,因此內容效度不存在問題,當然如果設計的一份全新的問卷則需要重點分析內容效度)。結構效度是指題項衡量所測變數的能力,實證分析一般著重分析結構效度,可以通過進行探索性因素分析(Exploratory factor analysis,EFA)檢驗來證明量表的結構有效性。

分析步驟如下:分析----降維----因子----將左邊所有變數選到右邊變數框中----描述---選擇初始解和KMO---點擊繼續-----提取-----在提取里選擇主成份和碎石圖---繼續----旋轉----選擇最大方差法。如下圖:

得出結果如下:

結果分析:效度分析結果主要看KMO值和sig.(顯著性),若KMO>0.7,則說明問卷中設計的自變數之間具有一定的聯繫,問卷是有效的;sig.<0.001說明該問卷符合做因子分析,下一步則可以進行因子分析(EFA)。

因子分析結果如下(僅抽取部分比較重要的圖解釋):

看碎石圖的關鍵就是找拐點,也就是找圖中陡坡和緩坡的臨界點(特徵值明顯較大的因子),趨於平緩前的點有幾個則說明這份問卷可以分為幾個因子(當然還要結合特徵值、總方差解釋等圖考察)。如上圖看出從第7個點開始趨於平緩,即前面有6個點屬於陡坡上的點,初步可以說明這份問卷設計的因素可以分為6個因子。

旋轉後的成分矩陣的作用是知道那幾道題可以歸為一個因子,上面截取一部分作為說明(左側的數字為問卷中的題項,題目內容已刪除)。上圖可以看到一共6個成分因子,其中問卷題目5、6、7、8、9、10、26可以第一個因子(成分1對下的數字0.769、0.571、0.714…….均大於0.5,即各個測量題項的最大因素負荷均大於0.5,且交叉載荷均小於0.4則可作為一個因子);同理題目27、28則可以作為一個因子,成為4對下的數字為0.797、0.793…….。

總方差解釋圖主要看累計百分比的項。如上圖6個因子在整份問卷中的總解釋能力(累計百分比)達到了72.938%(總解釋能力>50%可以說明篩選出來的因子有良好的代表性,當然實際操作中一般>80%的問卷因子解釋能力比較好)。所以整份問卷基本可以提取出6個因子作為主要變數,其餘的為次要變數。

通過上面三個圖的分析,可以確定這一份問卷一共可以提取出6個因子(6個自變數)。

五、相關分析

在進行相關分析前首先要取各個因子的平均值(如上面7道題目作為因子1,因子1的平均值就是取7道題目的維度平均。得出6個因子的維度平均值後進行相關分析。

步驟如下:分析----相關----雙變數-----將左邊的變數選到右邊-----在皮爾遜和雙變數前打勾----確定。如下圖

得出的結果如下:

上圖中,假設前面兩個為因子1、因子2(自變數),第三個為因變數。相關性是檢驗自變數與因變數的關係。可以看出因子1與因變數的相關係數為0.779,且sig.<0.001,說明自變數(因子1)與因變數呈正相關。(相關係數的取值範圍介於-1~1之間,絕對值越大,表明變數之間的相關越為緊密)。

六、回歸分析

回歸分析需要看的圖有模型摘要圖、ANOVA、係數圖等等

步驟如下:分析----回歸----線性-----選擇自變數和因變數----點擊統計----選擇德、共線性等(看自己需要知道什麼就選什麼,不一定要選共線性診斷等)---繼續----圖----選擇XY變數-----繼續---保存----繼續---確定。如下圖:

得出結果為:

模型摘要圖主要看R方和德賓值(D-W),調整後的R方為0.684說明自變數對因變數的可解釋程度為68.4%(R方代表的是自變數對因變數的解釋能力,R方與調整後的R方越接近說明數據越穩定)。D-W值是檢驗自變數之間是否存在自相關,上圖中D-W>2表示問卷中的幾個自變數無自相關性,(D-W值的範圍記得不是很清楚了,見諒…..)。

即方差分析表,ANOVA表的一個作用就是驗證假設(A對B不產生影響)是否成立,一般只看sig.值即可,上圖sig.<0.01,說明拒絕原假設,至少有一個對因變數產生顯著性影響。

下一步看係數表,係數表則說明有幾個自變數對因變數產生顯著性影響。如下圖:

上圖中回歸係數b是通過樣本及回歸模型通過SPSS計算得出的,是反映當自變數x的變動引起因變數y變動的量。主要看顯著性,因子1、2、3的sig.<0.05,說明3個因子均對因變數產生顯著性影響。

從上面可以看出,相關性分析是檢驗自變數與因變數之間是否具有相關性(正向或反向相關),回歸分析則說明了自變數對因變數是否具有顯著性影響。

當然上面提到的步驟和圖大部分是我感覺論文需要用的,還有很多像散點圖等一些小細節很多也沒有寫,一個是因為篇幅有限,一個也是因為時間也過去大半年了,有很多也記得不是很清楚了,上面寫的內容基本是我去年寫論文後學到的,很多都是個人的理解,僅供參考。希望大家畢業季順利!

推薦閱讀:

相关文章