SPSS 全稱為「社會(huì)科學(xué)統(tǒng)計(jì)軟件包」,是 IBM 公司推出的一系列用于統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測(cè)分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱。
圖中我們看到 SPSS 有 23 個(gè)方法模塊,雖然我們不能每個(gè)模塊都能用到,但作為一個(gè)科研工作者,其中的某些功能是必須要掌握的。
圖一:SPSS 的 23 個(gè)模塊
下面列出幾個(gè)典型的例子供大家在做數(shù)據(jù)中作為參考:
圖二:醫(yī)學(xué)中 SPSS 用到的模塊
一、描述性研究
圖三:SPSS描述性研究
描述性分析主要是對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性描述,主要用于描述變量的基本特征。描述性分析對(duì)于數(shù)據(jù)分析來(lái)說是一項(xiàng)基礎(chǔ)性的工作,目的要于熟悉數(shù)據(jù)源,把握數(shù)據(jù)的整體性分布情況。
SPSS 中的描述性分析過程可以生成相關(guān)的描述性統(tǒng)計(jì)量,如均值、方差、標(biāo)準(zhǔn)差、全距、峰度和偏度等,同時(shí)描述性分析過程還能將原始數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)Z分值并作為變量?jī)?chǔ)存。
基本輸出的統(tǒng)計(jì)量主要有以下幾個(gè)方面:
(一) 表示集中趨勢(shì)的統(tǒng)計(jì)量:均值,中位數(shù),眾數(shù),百分位數(shù);
(二)表示離中趨勢(shì)的統(tǒng)計(jì)量:方差與標(biāo)準(zhǔn)差,均值標(biāo)準(zhǔn)誤差,極差或范圍,最大值,最小值,變異系數(shù);
(三)表示分布形態(tài)的統(tǒng)計(jì)量:偏度,峰度;
(四)其他相關(guān)統(tǒng)計(jì)量:Z 標(biāo)準(zhǔn)化得分(注:Z 標(biāo)準(zhǔn)化得分是某一數(shù)據(jù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位的測(cè)量值,在統(tǒng)計(jì)分析中起著十分重要的作用)。
具體實(shí)際操作如下:
1.打開數(shù)據(jù)源,如下圖所示:
2.在菜單欄中依次選擇「分析-描述統(tǒng)計(jì)-描述」命令,得到結(jié)果如下圖:
3.點(diǎn)擊對(duì)話框中的「選項(xiàng)」:
4.因?yàn)楝F(xiàn)在是屬于熟悉 SPSS 的階段,可嘗試全部勾選:
5.返回到描述性對(duì)話框,勾選左下方的「將標(biāo)準(zhǔn)化得分另存為變量」,最后按「確定」,得到結(jié)果如下圖:
6.返回?cái)?shù)據(jù)源表,可看到已生成 Z 標(biāo)準(zhǔn)化得分:
其中,標(biāo)準(zhǔn)化得分大于零,說明原數(shù)據(jù)比平均分高;若標(biāo)準(zhǔn)化得分小于零,說明原數(shù)據(jù)比平均分小。如第一個(gè)數(shù)值為 -3.08124,則說明,該學(xué)生該科得分比整個(gè)平均分要低大約 3 個(gè)標(biāo)準(zhǔn)差。
二、T 檢驗(yàn)
圖四:SPSS 中 T 檢驗(yàn)
(1)單樣本 T 檢驗(yàn)
單樣本 T 檢驗(yàn)的目的是利用來(lái)自總體的樣本數(shù)據(jù),推斷該總體的均值是否與制定的檢驗(yàn)值之間存在顯著性差異。它是對(duì)總體均值的假設(shè)檢驗(yàn)。
SPSS軟件操作流程:
1.Analyze > Compare Means > One-Sample T Test
2.在打開的 one-sample T Testp 窗口中,檢驗(yàn)變量(Test Variable)選擇血紅蛋白 x, 檢驗(yàn)值(Test Value)中輸入 14.02, 點(diǎn)擊 OK。輸出結(jié)果。
(2)獨(dú)立樣本 T 檢驗(yàn)
獨(dú)立樣本 T 檢驗(yàn)是用于兩個(gè)獨(dú)立樣本均值的比較。兩個(gè)樣本必須獨(dú)立且服從正態(tài)分布。
按照Analyze>Compare Means>Independent-Sample T Test操作打開Independent-Samples T Test窗口。
2.檢驗(yàn)變量中選擇 PreWeight, 檢驗(yàn)值為 group(0 1)。點(diǎn)擊 OK,輸出結(jié)果。
注意:Levene's test 用于確定方差齊性,注意根據(jù)該結(jié)果判斷哪一行數(shù)據(jù)為最終結(jié)論。如果分組在 3 組或 3 組以上的均值比較可以應(yīng)用單因素 ANOVA。
三、方差分析
圖五:SPSS 的方差分析
1.首先打開 SPSS,其次點(diǎn)擊「變量視圖」:
2.給變量命名:
3.點(diǎn)擊數(shù)據(jù)視圖,再點(diǎn)擊「肝」一列變量,導(dǎo)入數(shù)據(jù),點(diǎn)擊「組別」這組變量,輸入對(duì)應(yīng)的濃度(不同濃度代表不同組別):
4.點(diǎn)擊「變量視圖」,點(diǎn)擊組別這一組的「值」,給各組命名,然后點(diǎn)擊方形圖標(biāo):
5.在彈出的對(duì)話框中,點(diǎn)擊「值」,輸入剛才組別變量中寫的那些濃度值一個(gè),其次點(diǎn)擊「標(biāo)簽」給其命名:
6.等到所有添加后,依照樣板數(shù)據(jù),輸入不同組的名字和濃度:
7.點(diǎn)擊「分析」,再點(diǎn)擊「比較均值」,在下拉菜單中點(diǎn)擊「單因素 ANOVA」
8.在新的對(duì)話框中,依據(jù)樣板數(shù)據(jù),添加「因變量列表」,添加「因子」,然后選擇分析方式:
9.勾選上需要的比較方法,點(diǎn)擊繼續(xù):
10.最后,分析結(jié)果就出來(lái)了:
四、線性回歸
圖六:SPSS 線性回歸
在回歸分析中,只有一個(gè)自變量的回歸分析,稱為一元回歸;多于一個(gè)自變量的回歸分析,稱為多元回歸。在做線性回歸分析之前需要先做散點(diǎn)圖,如果散點(diǎn)圖不呈現(xiàn)線性關(guān)系,則不能做線性回歸。
(1)問題與數(shù)據(jù)
某地方病研究所調(diào)查了 8 名正常兒童的尿肌酐含量(mmol/24h),請(qǐng)估計(jì)尿肌酐含量(Y)對(duì)其年齡(X)的直線回歸方程。
(2)SPSS操作
1.數(shù)據(jù)錄入 SPSS:
2.做散點(diǎn)圖,判斷是否為線性關(guān)系:
3.將自變量年齡(X)放入 X 軸;將因變量尿肌酐含量(Y)放入 Y 軸;其它默認(rèn)選項(xiàng)后,點(diǎn)擊確定:
4.從圖上判斷變量之間大致呈線性關(guān)系,可以繼續(xù)做回歸:
5.將年齡放入自變量,尿肌酐含量放入因變量,點(diǎn)擊確定:
6.結(jié)果分析:
(3)結(jié)果解讀
① R 方(0.778)是回歸方程的決定系數(shù),表示Y變異的 77.8% 可以由X的變異來(lái)解釋。
②對(duì)回歸方程進(jìn)行方差分析:F=20.968,P=0.004。可以認(rèn)為年齡和尿肌酐含量有直線關(guān)系。
③對(duì)回歸系數(shù)進(jìn)行 T 檢驗(yàn):Constant(回歸方程的截距)與0之間的差別有統(tǒng)計(jì)學(xué)意義(t=5.595,P=0.001),斜率與0之間的差別有統(tǒng)計(jì)學(xué)意義(t=4.579,P=0.004)。
因此,建立回歸方程為=1.662+0.139X,X 為兒童年齡,Y 為尿肌酐含量。
因此,建立回歸方程為=1.662+0.139X,X 為兒童年齡,Y 為尿肌酐含量。題圖來(lái)源:丁香通
聯(lián)系客服