PENGANTAR SPSS
Saptawati Bardosono
Pendahuluan
Pada saat merancang usulan penelitian, maka pengolahan datanya sudah harus
direncanakan pula:
1) Teknik pengolahan data meliputi: editing,
coding, entry dan cleaning serta analisis
2) Tabel, grafik atau ringkasan angka2 yang
Editing
Dilakukan pemeriksaan seluruh kuesioner atau seluruh formulir isian setelah data terkumpul, apakah:
1) Dapat dibaca
2) Semua pertanyaan terisi (lengkap)
3) Terdapat ketidakserasian antara jawaban yang
satu dengan yang lainnya (konsisten)
4) Terdapat kesalahan2 lain yang dapat mengganggu
Editing
Kegiatan editing dapat dilakukan dengan cara:
1) Editing lapangan, dimana supervisor
mengadakan pengecekan ulang terhadap beberapa pertanyaan penting biasanya
kepada 10% responden segera setelah data terkumpul semuanya
2) Editing menyeluruh, dilakukan secara
Editing
Yang sering terjadi misalnya
1) Jawaban tidak tepat dikolom yang tersedia 2) Salah menulis jawaban pertanyaan, misalnya
data kelamin diisi di kolom jawaban umur
3) Umur diisi 25 tahun tetapi di jumlah anak
diisi 10
Skala dan Sifat Data
Sifat Nominal (seks) Ordinal (pendidikan) Interval (suhu) Rasio (BB) Klasifikasi + + + + Urutan susunan - + + + Jarak - - + +Koding
Memberi angka2 atau kode2 tertentu yang telah
disepakati terhadap jawaban2 pertanyaan dalam kuesioner, sehingga memudahkan pada saat
memasukkan data ke komputer Misalnya untuk variabel pendidikan:
1) Tidak sekolah
2) SD
3) SMP
Koding
Persyaratan dalam koding:
1) Kesesuaian, variabel harus sesuai dengan tujuan
2) Klasifikasi, perlu dibuat kategorisasi untuk
pengelompokkan jawaban sesuai rujukan/ alasan tertentu, misal: pendapatan
3) Jawaban tidak mendua, pilihan jawaban yang
tersedia harus jelas definisi operasionalnya
Data Entry
Menyiapkan lembar kerja yang berisi variabel2 dalam kuesioner secara lengkap (program SPSS, Stata, Epi-Info, dll)
Masukkan data jawaban kuesioner sesuai kode yang telah ditentukan untuk masing-masing variable sehingga menjadi suatu data dasar Siapkan file khusus untuk menyimpan data
dasar tersebut yang tidak boleh dianalisis. Untuk melakukan analisis data maka
Data Cleaning
Merupakan analisis data awal, dimana dilakukan penggolongan, pengurutan dan
penyederhanaan data, sehingga mudah dibaca dan diinterpretasi
Untuk data nominal dan ordinal, dibuat tabulasi distribusi frekuensi untuk setiap variabel Untuk data interval/rasio, dianalisis nilai
Data Cleaning
Tabel distribusi frekuensi untuk:
1) Deskripsi ciri-ciri atau karakteristik dari
suatu variabel
2) Mempelajari distribusi dari variabel pokok 3) Memilih klasifikasi2 pokok untuk tabulasi
Data Cleaning
Tabel silang, yaitu teknik untuk membandingkan atau melihat hubungan antara dua variabel atau lebih:
1) Dihitung persentase responden untuk setiap
kelompok
2) Variabel bebas pada baris (faktor risiko)
3) Variabel terikat pada kolom (penyakit)
Selanjutnya, data siap dianalisis untuk membuktikan hipotesis penelitian dengan analisis statistik
SPSS
(statistical program for social sciences)
Tampilan layar SPSS ada 2:
Sebagai lembar kerja seperti Excel, dBase
= data view
Sebagai definisi operasional
= variable view
Data view
Variabel Variabel Variabel dst 1
2 dst
Variabel view
Name Type Width Decimals Label Values dst
1
2
Penggunaan SPSS
Menyiapkan sarana untuk data entry
(penyusunan lembar kerja)
Membantu data cleaning (analisis awal) Analisis statistik untuk membuktikan
hipotesis
Latihan Penggunaan SPSS
1. Menyiapkan sarana untuk data entry
(penyusunan lembar kerja)
2. Membantu data cleaning (analisis awal) 3. Analisis statistik untuk membuktikan
hipotesis
Menyiapkan sarana untuk data entry
(penyusunan lembar kerja)
Data latihan – dietstudy:
File – open – data – pilih file - open Lihat data view: jumlah kasus
Lihat variabel view: jumlah variabel
Menyiapkan sarana untuk data entry:
penyusunan lembar kerja
Menyiapkan data dasar – latihan membuat data dasar:
Lokasi penelitian
Tanggal pengambilan data Nama ibu
Tanggal lahir Berat badan Tinggi badan
Tingkat pendidikan ibu Jenis pekerjaan ibu
Pengetahuan ibu tentang gizi seimbang
Analisis data:
data cleaning
Analisis univariat (deskriptif, frekuensi,
explore)
Uji normalitas data (KS, histogram) Analisis bivariat (crosstab)
Cara penyajian data:
Data nominal/ordinal distribusi frekuensi (proporsi):
analyze – pilih descriptive statistics – pilih frequencies – masukkan variabel kategorik dalam variable (agegroup) – aktifkan display frequency table –pilih OK.
age grouping 5 31.3 31.3 31.3 6 37.5 37.5 68.8 5 31.3 31.3 100.0 16 100.0 100.0 <50 50-60 >60 Total Valid
Frequency Percent Valid Percent
Cumulative Percent
Cara penyajian data:
Data interval/rasio:
Distribusi normal: mean ± SD
Distribusi normal?
1. Signifikansi KS >0,05 2. Signifikansi SW >0,05
3. Nilai kerampingan dan kemiringan 4. Histogram dalam area kurva normal
Nilai kemiringan dan
kerampingan
Nilai kemiringan (skewness) dan nilai
kerampingan (kurtosis) digunakan untuk menentukan distribusi normal/simetris dari data bergantung dari bentuk kurva distribusi data
Nilai kemiringan dan
kerampingan
Distribusi normal/ Miring (skew) ke Miring (skew) ke
Nilai kemiringan dan
kerampingan
Contoh:
Bila diketahui skewness -0,316 dan standard error
skewness 0,254 maka rasio skewness = -0,316/0,254 = -1,244
Dengan kurtosis 0,284 dan standard error kurtosis 0,503 maka rasio kurtosis = 0,284/0,503 = 0,564
Sehingga rasio skewness dan kurtosis keduanya berada di antara interval angka -2 dan +2 atau distribusi data
Histogram
0 4 8 12 C o u n tHistogram:
Bentuk kurva simetris
Mean = median = mode
Uji normalitas data:
analyze – pilih descriptive statistics – pilih
explore – masukkan variabel rasio dalam dependent list (wgt0) – pada pilihan
display pilih plots – klik plots – pilih
normality plots with test (non-aktifkan yang lainnya) – pilih continue – pilih OK.
Uji Kolmogorov-Smirnov (KS) dan
Shapiro-Wilk (SW)
Tests of Normality .156 16 .200* .938 16 .320 Statistic df Sig. Statistic df Sig. Kolmogorov-Smirnova Shapiro-Wilk CholesterolPenyajian data numerik:
Descriptives 198.38 8.368 180.54 216.21 197.75 198.50 1120.383 33.472 151 257 106 62.75 Mean Lower Bound Upper Bound 95% ConfidenceInterval for Mean
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Cholesterol Statistic Std. Error
Analisis data:
data cleaning
Analisis bivariat (crosstab)
Analyze – pilih descriptive statistics – pilih
crosstab – pada row masukkan data
kategorik variabel bebas (gender) – pada column(s) masukkan data kategorik
variabel terikat (cholstat)– pada display aktifkan clustered bar chart - pilih OK.
Gender Female Male C o u n t 8 7 6 5 4 3 2 1 final cholesterol st normal
high Gender * final cholesterol status Crosstabulation
2 7 9 22.2% 77.8% 100.0% 22.2% 100.0% 56.3% 12.5% 43.8% 56.3% 7 0 7 100.0% .0% 100.0% 77.8% .0% 43.8% 43.8% .0% 43.8% 9 7 16 Count % within Gender % within final cholesterol status % of Total Count % within Gender % within final cholesterol status % of Total Count % within Gender Male Female Gender Total normal high final cholesterol status
Analisis data:
untuk membuktikan hipotesis
Analisis bivariat crosstab, korelasi, uji T
dua sampel bebas dan berpasangan)
Analisis multivariat (ANOVA, regresi
Analisis data:
untuk membuktikan hipotesis
Analisis bivariat crosstab:
Analyze – pilih crosstab – pada row
masukkan variabel bebas (gender) – pada column(s) masukkan variabel terikat
(cholstat) – pilih statistics – klik continue – OK. Perhatikan hasilnya.
Chi-Square Tests 9.679b 1 .002 6.777 1 .009 12.395 1 .000 .003 .003 9.074 1 .003 16 Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided)
Computed only for a 2x2 table a.
3 cells (75.0%) have expected count less than 5. The minimum expected count is b.
age grouping * final cholesterol status Crosstabulation 4 1 5 80.0% 20.0% 100.0% 44.4% 14.3% 31.3% 25.0% 6.3% 31.3% 2 4 6 33.3% 66.7% 100.0% 22.2% 57.1% 37.5% 12.5% 25.0% 37.5% 3 2 5 60.0% 40.0% 100.0% 33.3% 28.6% 31.3% 18.8% 12.5% 31.3% 9 7 16 56.3% 43.8% 100.0% 100.0% 100.0% 100.0% Count
% within age grouping % within final
cholesterol status % of Total
Count
% within age grouping % within final
cholesterol status % of Total
Count
% within age grouping % within final
cholesterol status % of Total
Count
% within age grouping % within final <50 50-60 >60 age grouping Total normal high final cholesterol status
Uji KS 2 sampel tidak berpasangan Chi-Square Tests 2.455a 2 .293 2.558 2 .278 .381 1 .537 16 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Value df Asymp. Sig. (2-sided)
6 cells (100.0%) have expected count less than 5. The minimum expected count is 2.19.
Analyze – non-parametric tests – 2
independent samples – aktifkan KS – test variable: agegroup – grouping: cholstat - OK Test Statisticsa .302 .302 -.048 .598 .866 Absolute Positive Negative Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)
Analisis data:
untuk membuktikan hipotesis
Korelasi:
Analyze – pilih correlate – pilih bivariate –
masukkan dua variabel numerik – pilih Pearson – pilih two tailed – aktifkan flag significant correlation – pilih option –
Analisis data:
untuk membuktikan hipotesis
Korelasi:
Analyze – pilih correlate – pilih bivariate –
masukkan dua variabel numerik – pilih
Spearman – pilih two tailed – aktifkan flag significant correlation – pilih option –
Correlations 1 .996** . .000 16 16 .996** 1 .000 . 16 16 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Cholesterol Final cholesterol Cholesterol Final cholesterol
Correlation is significant at the 0.01 level (2-tailed). **. Correlations 1.000 .987** . .000 16 16 Correlation Coefficient Sig. (2-tailed) N Cholesterol Spearman's rho Cholesterol Final cholesterol
Persamaan regresi:
Graph – interactive – scatter plot – sumbu
X = variabel bebas (wgt0) – sumbu Y = variabel terikat (wgt3) – fit – regression – include constant in equation – fit lines for total - OK
Linear Regression 150 175 200 225 250 F ina l c h ol es te rol Final cholesterol = -7.54 + 1.00 * w gt0 R-Square = 0.99
Analisis data:
untuk membuktikan hipotesis
Uji T dua sampel bebas:
Analyze – pilih compare means – pilih
independent samples t-test – pada test
variable(s) pilih variabel numerik (wgt0) – pada grouping variable masukkan variabel 2 kategorik (gender) – pada define group masukkan 1 untuk group 0 dan 2 untuk group 1 – pilih continue – pada option aktifkan tingkat kepercayaan 95% dan exclude cases analysis by analysis – pilih
Group Statistics 9 223.78 18.754 6.251 7 165.71 10.935 4.133 Gender Male Female Cholesterol N Mean Std. Deviation Std. Error Mean
Independent Samples Test
1.521 .238 7.255 7.748 14 13.168 .000 .000 58.06 58.06 F Sig. Levene's Test for
Equality of Variances t df
Sig. (2-tailed) Mean Difference t-test for Equality of
Means Equal variances assumed Equal variances not assumed Cholesterol
Non-parametrik – Mann Whitney:
Analyze – non-parametric tests – 2 independent
samples - pada test variable(s) pilih variabel numerik (wgt0) – pada grouping variable
masukkan variabel 2 kategorik (gender) – pada define group masukkan 1 untuk group 0 dan 2 untuk group 1 – pilih continue – pada test type aktifkan Mann Whitney –OK. Perhatikan
Ranks 9 12.00 108.00 7 4.00 28.00 16 Gender Male Female Total Cholesterol
N Mean Rank Sum of Ranks
Test Statisticsb .000 28.000 -3.339 .001 .000a Mann-Whitney U Wilcoxon W Z
Asymp. Sig. (2-tailed) Exact Sig. [2*(1-tailed Sig.)]
Analisis data:
untuk membuktikan hipotesis
Uji T dua sampel berpasangan):
Analyze – pilih compare means – pilih paired
samples t-test – pada paired variable(s)
masukkan variabel numerik sebelum intervensi (wgt0) dan variabel numerik sesudah intervensi (wgt4) - pada option aktifkan tingkat
kepercayaan 95% dan exclude cases analysis by analysis – pilih continue dan OK. Perhatikan
Paired Samples Statistics 198.38 16 33.472 8.368 190.31 16 33.508 8.377 Cholesterol Final cholesterol Pair 1 Mean N Std. Deviation Std. Error Mean
Paired Samples Test
8.06 2.886 .722 6.52 9.60 Mean Std. Deviation Std. Error Mean Lower Upper 95% Confidence Interval of the Difference Paired Differences Cholesterol -Final cholesterol Pair 1
Analisis data:
untuk membuktikan hipotesis
Uji T dua sampel berpasangan):
Analyze – pilih non-parametric tests – pilih
2 related samples – pilih variabel numerik wgt0 dan variabel numerik wgt4 - dan OK. Perhatikan hasilnya
Ranks 16a 8.50 136.00 0b .00 .00 0c 16 Negative Ranks Positive Ranks Ties Total Final cholesterol - Cholesterol
N Mean Rank Sum of Ranks
Final cholesterol < Cholesterol a.
Final cholesterol > Cholesterol b.
Final cholesterol = Cholesterol c.
Test Statisticsb
-3.526a .000 Z
Asymp. Sig. (2-tailed)
Final cholesterol
Analisis data:
untuk membuktikan hipotesis
Analisis multivariat (ANOVA):
Analyze – pilih compare means – pilih one-way
anova – pada dependent list pilih variabel
numerik (wgt0) – pada faktor pilih variabel lebih 2 kategorik (agegroup) – pada option aktifkan descriptive dan homogeneity of variance – pilih continue – pada post-hoc pilih bonferroni – pilih
Descriptives Cholesterol 5 187.40 29.433 13.163 150.85 223.95 158 233 6 215.50 37.212 15.192 176.45 254.55 151 257 5 188.80 29.987 13.410 151.57 226.03 157 222 16 198.38 33.472 8.368 180.54 216.21 151 257 <50 50-60 >60 Total
N Mean Std. Deviation Std. Error Lower Bound Upper Bound 95% Confidence Interval for
Mean Minimum Maximum ANOVA Cholesterol 2820.250 2 1410.125 1.311 .303 13985.500 13 1075.808 16805.750 15 Between Groups Within Groups Total Sum of
Multiple Comparisons
Dependent Variable: Cholesterol Bonferroni -28.10 19.861 .542 -82.64 26.44 -1.40 20.744 1.000 -58.36 55.56 28.10 19.861 .542 -26.44 82.64 26.70 19.861 .605 -27.84 81.24 1.40 20.744 1.000 -55.56 58.36 -26.70 19.861 .605 -81.24 27.84 (J) age grouping 50-60 >60 <50 >60 <50 50-60 (I) age grouping
<50 50-60 >60
Mean Difference
(I-J) Std. Error Sig. Lower Bound Upper Bound 95% Confidence Interval
Uji Kruskal-Wallis:
Analyze – non-parametric tests – k
independent samples – test variable: wgt0 – grouping: agegroup – define: minimum (1) dan maximum (3) – continue - OK
Test Statisticsa,b 2.152 2 .341 Chi-Square df Asymp. Sig. Cholesterol
Kruskal Wallis Test a. Ranks 5 7.20 6 10.75 5 7.10 16 age grouping <50 50-60 >60 Total Cholesterol N Mean Rank
REGRESI BERGANDA
Memprediksi besar variabel dependen
dengan menggunakan data variabel bebas yang sudah diketahui besarnya
REGRESI BERGANDA
Analyze – regression – linear:
Dependent : WGT4
Independent(s): WGT0, TG0, AGE
Case labels: gender
Method: enter
REGRESI BERGANDA
Variables Entered/Removedb Cholestero l, Age in years, Triglycerid ea . Enter Model 1 Variables Entered Variables Removed MethodAll requested variables entered. a.
REGRESI BERGANDA
Model Summary .997a .994 .992 2.953 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), Cholesterol, Age in years,Triglyceride a.
REGRESI BERGANDA
ANOVAb 16736.790 3 5578.930 639.737 .000a 104.648 12 8.721 16841.438 15 Regression Residual Total Model 1 Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Cholesterol, Age in years, Triglyceride a.
Dependent Variable: Final cholesterol b.
REGRESI BERGANDA
Coefficientsa 3.375 8.574 .394 .701 -.164 .111 -.034 -1.477 .165 -.010 .027 -.009 -.373 .716 .995 .024 .994 42.243 .000 (Constant) Age in years Triglyceride Cholesterol Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig.Dependent Variable: Final cholesterol a.
REGRESI BERGANDA
Residuals Statisticsa 142.66 249.33 190.31 33.403 16 -5.05 4.88 .00 2.641 16 -1.426 1.767 .000 1.000 16 -1.712 1.652 .000 .894 16 Predicted Value Residual Std. Predicted Value Std. ResidualMinimum Maximum Mean Std. Deviation N
Dependent Variable: Final cholesterol a.
REGRESI BERGANDA
Variables Entered/Removedb Cholestero la . Enter Model 1 Variables Entered Variables Removed MethodAll requested variables entered. a.
Dependent Variable: Final cholesterol b. Model Summaryb .996a .993 .992 2.986 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), Cholesterol
REGRESI BERGANDA
ANOVAb 16716.618 1 16716.618 1874.976 .000a 124.819 14 8.916 16841.438 15 Regression Residual Total Model 1 Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Cholesterol a.
Dependent Variable: Final cholesterol b.
REGRESI BERGANDA
Coefficientsa -7.536 4.630 -1.628 .126 .997 .023 .996 43.301 .000 (Constant) Cholesterol Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig.Dependent Variable: Final cholesterol a.
Persamaan regresi:
Kadar kolesterol akhir = -7,536 + 0,997 kadar kolesterol awal
Correlations 1 .996** . .000 16 16 .996** 1 .000 . 16 16 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Cholesterol Final cholesterol Cholesterol Final cholesterol
Correlation is significant at the 0.01 level (2-tailed). **. Linear Regression 175 200 225 250 F in al c h o le st er o l Final cholesterol = -7.54 + 1.00 * w gt0 R-Square = 0.99
Uji regresi logistik binari
Ingin memprediksi variabel dependen
yang berskala binari (ya=1 dan tidak=0) dengan menggunakan data variabel
independen yang sudah diketahui besarnya
Uji regresi logistik binari
Buka SPSS: file – data –dietstudy
Analyze – Regression – Binary logistic:
Dependent: cholst0 (status kadar kolesterol
awal, 1=tinggi, 0=normal)
Covariates: age dan TG0
Uji regresi logistik binari
Case Processing Summary
16 100.0 0 .0 16 100.0 0 .0 16 100.0 Unweighted Casesa Included in Analysis Missing Cases Total Selected Cases Unselected Cases Total N Percent
If weight is in effect, see classification table for the total number of cases.
Uji regresi logistik binari
Omnibus Tests of Model Coefficients
1.902 2 .386 1.902 2 .386 1.902 2 .386 Step Block Model Step 1 Chi-square df Sig.
Uji regresi logistik binari
Model Summary 20.028 .112 .150 Step 1 -2 Log likelihoodCox & Snell R Square
Nagelkerke R Square
Hosmer and Lemeshow Test
9.129 6 .166
Step 1
Uji regresi logistik binari
Contingency Table for Hosmer and Lemeshow Test
2 1.570 0 .430 2 2 1.516 0 .484 2 1 1.453 1 .547 2 0 1.118 2 .882 2 0 1.024 2 .976 2 2 .920 0 1.080 2 1 .787 1 1.213 2 1 2 3 4 5 6 7 Step 1 Observed Expected cholesterol status = normal Observed Expected cholesterol status = high Total
Uji regresi logistik binari
Classification Tablea 5 4 55.6 4 3 42.9 50.0 Observed normal high cholesterol status Overall Percentage Step 1 normal highcholesterol status Percentage Correct Predicted
The cut value is .500 a.
Uji regresi logistik binari
Variables in the Equation.042 .079 .277 1 .598 1.043 .025 .020 1.527 1 .217 1.025 -5.970 5.416 1.215 1 .270 .003 AGE TG0 Constant Step 1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, TG0. a.
Penafsiran dan prediksi:
Analisis data:
untuk penyajian data
Hasil analisis statistik Diagram batang (bar) Histogram
Boxplot
Scatterplot Pie chart dll
Bars show counts 20 40 60 C o u n t
0 4 8 12 C o u n t
10.00 11.00 12.00 13.00 14.00 lo b in c o n ce n tr at io n a ft er in te rv en tio n
Linear Regression 40.00 50.00 60.00 70.00 80.00 90.00 150.00 160.00 170.00 h eigh t he ight = 141.89 + 0.23 * w eight_2 R-Square = 0.21
SD SLTP SMU Akademi Perguruan Tinggi last education
Pies show percents
16.67%
20.00%
50.00% 7.78%