PENGANTAR SPSS. Saptawati Bardosono

(1)

PENGANTAR SPSS

Saptawati Bardosono

(2)

Pendahuluan

Pada saat merancang usulan penelitian, maka pengolahan datanya sudah harus

direncanakan pula:

1) Teknik pengolahan data meliputi: editing,

coding, entry dan cleaning serta analisis

2) Tabel, grafik atau ringkasan angka2 yang

(3)

Editing

Dilakukan pemeriksaan seluruh kuesioner atau seluruh formulir isian setelah data terkumpul, apakah:

1) Dapat dibaca

2) Semua pertanyaan terisi (lengkap)

3) Terdapat ketidakserasian antara jawaban yang

satu dengan yang lainnya (konsisten)

4) Terdapat kesalahan2 lain yang dapat mengganggu

(4)

Editing

Kegiatan editing dapat dilakukan dengan cara:

1) Editing lapangan, dimana supervisor

mengadakan pengecekan ulang terhadap beberapa pertanyaan penting biasanya

kepada 10% responden segera setelah data terkumpul semuanya

2) Editing menyeluruh, dilakukan secara

(5)

Editing

Yang sering terjadi misalnya

1) Jawaban tidak tepat dikolom yang tersedia 2) Salah menulis jawaban pertanyaan, misalnya

data kelamin diisi di kolom jawaban umur

3) Umur diisi 25 tahun tetapi di jumlah anak

diisi 10

(6)

Skala dan Sifat Data

Sifat Nominal (seks) Ordinal (pendidikan) Interval (suhu) Rasio (BB) Klasifikasi + + + + Urutan susunan - + + + Jarak - - + +

(7)

Koding

Memberi angka2 atau kode2 tertentu yang telah

disepakati terhadap jawaban2 pertanyaan dalam kuesioner, sehingga memudahkan pada saat

memasukkan data ke komputer Misalnya untuk variabel pendidikan:

1) Tidak sekolah

2) SD

3) SMP

(8)

Koding

Persyaratan dalam koding:

1) Kesesuaian, variabel harus sesuai dengan tujuan

2) Klasifikasi, perlu dibuat kategorisasi untuk

pengelompokkan jawaban sesuai rujukan/ alasan tertentu, misal: pendapatan

3) Jawaban tidak mendua, pilihan jawaban yang

tersedia harus jelas definisi operasionalnya

(9)

Data Entry

Menyiapkan lembar kerja yang berisi variabel2 dalam kuesioner secara lengkap (program SPSS, Stata, Epi-Info, dll)

Masukkan data jawaban kuesioner sesuai kode yang telah ditentukan untuk masing-masing variable sehingga menjadi suatu data dasar Siapkan file khusus untuk menyimpan data

dasar tersebut yang tidak boleh dianalisis. Untuk melakukan analisis data maka

(10)

Data Cleaning

Merupakan analisis data awal, dimana dilakukan penggolongan, pengurutan dan

penyederhanaan data, sehingga mudah dibaca dan diinterpretasi

Untuk data nominal dan ordinal, dibuat tabulasi distribusi frekuensi untuk setiap variabel Untuk data interval/rasio, dianalisis nilai

(11)

Data Cleaning

Tabel distribusi frekuensi untuk:

1) Deskripsi ciri-ciri atau karakteristik dari

suatu variabel

2) Mempelajari distribusi dari variabel pokok 3) Memilih klasifikasi2 pokok untuk tabulasi

(12)

Data Cleaning

Tabel silang, yaitu teknik untuk membandingkan atau melihat hubungan antara dua variabel atau lebih:

1) Dihitung persentase responden untuk setiap

kelompok

2) Variabel bebas pada baris (faktor risiko)

3) Variabel terikat pada kolom (penyakit)

Selanjutnya, data siap dianalisis untuk membuktikan hipotesis penelitian dengan analisis statistik

(13)

SPSS

(statistical program for social sciences)

Tampilan layar SPSS ada 2:

 Sebagai lembar kerja seperti Excel, dBase

= data view

 Sebagai definisi operasional

= variable view

(14)

Data view

Variabel Variabel Variabel dst 1

2 dst

(15)

Variabel view

Name Type Width Decimals Label Values dst

1

2

(16)

Penggunaan SPSS

 Menyiapkan sarana untuk data entry

(penyusunan lembar kerja)

 Membantu data cleaning (analisis awal)  Analisis statistik untuk membuktikan

hipotesis

(17)

Latihan Penggunaan SPSS

1. Menyiapkan sarana untuk data entry

(penyusunan lembar kerja)

2. Membantu data cleaning (analisis awal) 3. Analisis statistik untuk membuktikan

hipotesis

(18)

Menyiapkan sarana untuk data entry

(penyusunan lembar kerja)

Data latihan – dietstudy:

 File – open – data – pilih file - open  Lihat data view: jumlah kasus

 Lihat variabel view: jumlah variabel

(19)

Menyiapkan sarana untuk data entry:

penyusunan lembar kerja

 Menyiapkan data dasar – latihan membuat data dasar:

 _{Lokasi penelitian}

 _{Tanggal pengambilan data}  _{Nama ibu}

 _{Tanggal lahir}  _{Berat badan}  _{Tinggi badan}

 _{Tingkat pendidikan ibu}  _{Jenis pekerjaan ibu}

 _{Pengetahuan ibu tentang gizi seimbang}

(20)

Analisis data:

data cleaning

 Analisis univariat (deskriptif, frekuensi,

explore)

 Uji normalitas data (KS, histogram)  Analisis bivariat (crosstab)

(21)

Cara penyajian data:

 Data nominal/ordinal distribusi frekuensi (proporsi):

analyze – pilih descriptive statistics – pilih frequencies – masukkan variabel kategorik dalam variable (agegroup) – aktifkan display frequency table –pilih OK.

age grouping 5 31.3 31.3 31.3 6 37.5 37.5 68.8 5 31.3 31.3 100.0 16 100.0 100.0 <50 50-60 >60 Total Valid

Frequency Percent Valid Percent

Cumulative Percent

(22)

Cara penyajian data:

 Data interval/rasio:

Distribusi normal: mean ± SD

(23)

Distribusi normal?

1. Signifikansi KS >0,05 2. Signifikansi SW >0,05

3. Nilai kerampingan dan kemiringan 4. Histogram dalam area kurva normal

(24)

Nilai kemiringan dan

kerampingan

Nilai kemiringan (skewness) dan nilai

kerampingan (kurtosis) digunakan untuk menentukan distribusi normal/simetris dari data bergantung dari bentuk kurva distribusi data

(25)

Nilai kemiringan dan

kerampingan

Distribusi normal/ Miring (skew) ke Miring (skew) ke

(26)

Nilai kemiringan dan

kerampingan

Contoh:

Bila diketahui skewness -0,316 dan standard error

skewness 0,254 maka rasio skewness = -0,316/0,254 = -1,244

Dengan kurtosis 0,284 dan standard error kurtosis 0,503 maka rasio kurtosis = 0,284/0,503 = 0,564

Sehingga rasio skewness dan kurtosis keduanya berada di antara interval angka -2 dan +2 atau distribusi data

(27)

Histogram

0 4 8 12 C o u n t

(28)

Histogram:

 Bentuk kurva simetris

 Mean = median = mode

(29)

Uji normalitas data:

 analyze – pilih descriptive statistics – pilih

explore – masukkan variabel rasio dalam dependent list (wgt0) – pada pilihan

display pilih plots – klik plots – pilih

normality plots with test (non-aktifkan yang lainnya) – pilih continue – pilih OK.

(30)

Uji Kolmogorov-Smirnov (KS) dan

Shapiro-Wilk (SW)

Tests of Normality .156 16 .200* .938 16 .320 Statistic df Sig. Statistic df Sig. Kolmogorov-Smirnova Shapiro-Wilk Cholesterol

(31)

Penyajian data numerik:

Descriptives 198.38 8.368 180.54 216.21 197.75 198.50 1120.383 33.472 151 257 106 62.75 Mean Lower Bound Upper Bound 95% Confidence

Interval for Mean

5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Cholesterol Statistic Std. Error

(32)

Analisis data:

data cleaning

Analisis bivariat (crosstab)

 Analyze – pilih descriptive statistics – pilih

crosstab – pada row masukkan data

kategorik variabel bebas (gender) – pada column(s) masukkan data kategorik

variabel terikat (cholstat)– pada display aktifkan clustered bar chart - pilih OK.

(33)

Gender Female Male C o u n t 8 7 6 5 4 3 2 1 final cholesterol st normal

high Gender * final cholesterol status Crosstabulation

2 7 9 22.2% 77.8% 100.0% 22.2% 100.0% 56.3% 12.5% 43.8% 56.3% 7 0 7 100.0% .0% 100.0% 77.8% .0% 43.8% 43.8% .0% 43.8% 9 7 16 Count % within Gender % within final cholesterol status % of Total Count % within Gender % within final cholesterol status % of Total Count % within Gender Male Female Gender Total normal high final cholesterol status

(34)

Analisis data:

untuk membuktikan hipotesis

 Analisis bivariat crosstab, korelasi, uji T

dua sampel bebas dan berpasangan)

 Analisis multivariat (ANOVA, regresi

(35)

Analisis data:

untuk membuktikan hipotesis

Analisis bivariat crosstab:

 Analyze – pilih crosstab – pada row

masukkan variabel bebas (gender) – pada column(s) masukkan variabel terikat

(cholstat) – pilih statistics – klik continue – OK. Perhatikan hasilnya.

(36)

Chi-Square Tests 9.679b 1 .002 6.777 1 .009 12.395 1 .000 .003 .003 9.074 1 .003 16 Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided)

Computed only for a 2x2 table a.

3 cells (75.0%) have expected count less than 5. The minimum expected count is b.

(37)

age grouping * final cholesterol status Crosstabulation 4 1 5 80.0% 20.0% 100.0% 44.4% 14.3% 31.3% 25.0% 6.3% 31.3% 2 4 6 33.3% 66.7% 100.0% 22.2% 57.1% 37.5% 12.5% 25.0% 37.5% 3 2 5 60.0% 40.0% 100.0% 33.3% 28.6% 31.3% 18.8% 12.5% 31.3% 9 7 16 56.3% 43.8% 100.0% 100.0% 100.0% 100.0% Count

% within age grouping % within final

cholesterol status % of Total

Count

% within age grouping % within final <50 50-60 >60 age grouping Total normal high final cholesterol status

(38)

 Uji KS 2 sampel tidak berpasangan Chi-Square Tests 2.455a 2 .293 2.558 2 .278 .381 1 .537 16 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Value df Asymp. Sig. (2-sided)

6 cells (100.0%) have expected count less than 5. The minimum expected count is 2.19.

(39)

 Analyze – non-parametric tests – 2

independent samples – aktifkan KS – test variable: agegroup – grouping: cholstat - OK Test Statisticsa .302 .302 -.048 .598 .866 Absolute Positive Negative Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)

(40)

Analisis data:

untuk membuktikan hipotesis

Korelasi:

 Analyze – pilih correlate – pilih bivariate –

masukkan dua variabel numerik – pilih Pearson – pilih two tailed – aktifkan flag significant correlation – pilih option –

(41)

Analisis data:

untuk membuktikan hipotesis

Korelasi:

 Analyze – pilih correlate – pilih bivariate –

masukkan dua variabel numerik – pilih

Spearman – pilih two tailed – aktifkan flag significant correlation – pilih option –

(42)

Correlations 1 .996** . .000 16 16 .996** 1 .000 . 16 16 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Cholesterol Final cholesterol Cholesterol Final cholesterol

Correlation is significant at the 0.01 level (2-tailed). **. Correlations 1.000 .987** . .000 16 16 Correlation Coefficient Sig. (2-tailed) N Cholesterol Spearman's rho Cholesterol Final cholesterol

(43)

Persamaan regresi:

 Graph – interactive – scatter plot – sumbu

X = variabel bebas (wgt0) – sumbu Y = variabel terikat (wgt3) – fit – regression – include constant in equation – fit lines for total - OK

(44)

Linear Regression 150 175 200 225 250 F ina l c h ol es te rol               Final cholesterol = -7.54 + 1.00 * w gt0 R-Square = 0.99

(45)

Analisis data:

untuk membuktikan hipotesis

Uji T dua sampel bebas:

 Analyze – pilih compare means – pilih

independent samples t-test – pada test

variable(s) pilih variabel numerik (wgt0) – pada grouping variable masukkan variabel 2 kategorik (gender) – pada define group masukkan 1 untuk group 0 dan 2 untuk group 1 – pilih continue – pada option aktifkan tingkat kepercayaan 95% dan exclude cases analysis by analysis – pilih

(46)

Group Statistics 9 223.78 18.754 6.251 7 165.71 10.935 4.133 Gender Male Female Cholesterol N Mean Std. Deviation Std. Error Mean

Independent Samples Test

1.521 .238 7.255 7.748 14 13.168 .000 .000 58.06 58.06 F Sig. Levene's Test for

Equality of Variances t df

Sig. (2-tailed) Mean Difference t-test for Equality of

Means Equal variances assumed Equal variances not assumed Cholesterol

(47)

Non-parametrik – Mann Whitney:

 Analyze – non-parametric tests – 2 independent

samples - pada test variable(s) pilih variabel numerik (wgt0) – pada grouping variable

masukkan variabel 2 kategorik (gender) – pada define group masukkan 1 untuk group 0 dan 2 untuk group 1 – pilih continue – pada test type aktifkan Mann Whitney –OK. Perhatikan

(48)

Ranks 9 12.00 108.00 7 4.00 28.00 16 Gender Male Female Total Cholesterol

N Mean Rank Sum of Ranks

Test Statisticsb .000 28.000 -3.339 .001 .000a Mann-Whitney U Wilcoxon W Z

Asymp. Sig. (2-tailed) Exact Sig. [2*(1-tailed Sig.)]

(49)

Analisis data:

untuk membuktikan hipotesis

Uji T dua sampel berpasangan):

 Analyze – pilih compare means – pilih paired

samples t-test – pada paired variable(s)

masukkan variabel numerik sebelum intervensi (wgt0) dan variabel numerik sesudah intervensi (wgt4) - pada option aktifkan tingkat

kepercayaan 95% dan exclude cases analysis by analysis – pilih continue dan OK. Perhatikan

(50)

Paired Samples Statistics 198.38 16 33.472 8.368 190.31 16 33.508 8.377 Cholesterol Final cholesterol Pair 1 Mean N Std. Deviation Std. Error Mean

Paired Samples Test

8.06 2.886 .722 6.52 9.60 Mean Std. Deviation Std. Error Mean Lower Upper 95% Confidence Interval of the Difference Paired Differences Cholesterol -Final cholesterol Pair 1

(51)

Analisis data:

untuk membuktikan hipotesis

Uji T dua sampel berpasangan):

 Analyze – pilih non-parametric tests – pilih

2 related samples – pilih variabel numerik wgt0 dan variabel numerik wgt4 - dan OK. Perhatikan hasilnya

(52)

Ranks 16a 8.50 136.00 0b .00 .00 0c 16 Negative Ranks Positive Ranks Ties Total Final cholesterol - Cholesterol

N Mean Rank Sum of Ranks

Final cholesterol < Cholesterol a.

Final cholesterol > Cholesterol b.

Final cholesterol = Cholesterol c.

Test Statisticsb

-3.526a .000 Z

Asymp. Sig. (2-tailed)

Final cholesterol

(53)

Analisis data:

untuk membuktikan hipotesis

Analisis multivariat (ANOVA):

 Analyze – pilih compare means – pilih one-way

anova – pada dependent list pilih variabel

numerik (wgt0) – pada faktor pilih variabel lebih 2 kategorik (agegroup) – pada option aktifkan descriptive dan homogeneity of variance – pilih continue – pada post-hoc pilih bonferroni – pilih

(54)

Descriptives Cholesterol 5 187.40 29.433 13.163 150.85 223.95 158 233 6 215.50 37.212 15.192 176.45 254.55 151 257 5 188.80 29.987 13.410 151.57 226.03 157 222 16 198.38 33.472 8.368 180.54 216.21 151 257 <50 50-60 >60 Total

N Mean Std. Deviation Std. Error Lower Bound Upper Bound 95% Confidence Interval for

Mean Minimum Maximum ANOVA Cholesterol 2820.250 2 1410.125 1.311 .303 13985.500 13 1075.808 16805.750 15 Between Groups Within Groups Total Sum of

(55)

Multiple Comparisons

Dependent Variable: Cholesterol Bonferroni -28.10 19.861 .542 -82.64 26.44 -1.40 20.744 1.000 -58.36 55.56 28.10 19.861 .542 -26.44 82.64 26.70 19.861 .605 -27.84 81.24 1.40 20.744 1.000 -55.56 58.36 -26.70 19.861 .605 -81.24 27.84 (J) age grouping 50-60 >60 <50 >60 <50 50-60 (I) age grouping

<50 50-60 >60

Mean Difference

(I-J) Std. Error Sig. Lower Bound Upper Bound 95% Confidence Interval

(56)

Uji Kruskal-Wallis:

 Analyze – non-parametric tests – k

independent samples – test variable: wgt0 – grouping: agegroup – define: minimum (1) dan maximum (3) – continue - OK

(57)

Test Statisticsa,b 2.152 2 .341 Chi-Square df Asymp. Sig. Cholesterol

Kruskal Wallis Test a. Ranks 5 7.20 6 10.75 5 7.10 16 age grouping <50 50-60 >60 Total Cholesterol N Mean Rank

(58)

REGRESI BERGANDA

 Memprediksi besar variabel dependen

dengan menggunakan data variabel bebas yang sudah diketahui besarnya

(59)

REGRESI BERGANDA

 Analyze – regression – linear:

Dependent : WGT4

Independent(s): WGT0, TG0, AGE

Case labels: gender

_{Method: enter}

(60)

REGRESI BERGANDA

Variables Entered/Removedb Cholestero l, Age in years, Triglycerid ea . Enter Model 1 Variables Entered Variables Removed Method

All requested variables entered. a.

(61)

REGRESI BERGANDA

Model Summary .997a .994 .992 2.953 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), Cholesterol, Age in years,

Triglyceride a.

(62)

REGRESI BERGANDA

ANOVAb 16736.790 3 5578.930 639.737 .000a 104.648 12 8.721 16841.438 15 Regression Residual Total Model 1 Sum of

Squares df Mean Square F Sig.

Predictors: (Constant), Cholesterol, Age in years, Triglyceride a.

Dependent Variable: Final cholesterol b.

(63)

REGRESI BERGANDA

Coefficientsa 3.375 8.574 .394 .701 -.164 .111 -.034 -1.477 .165 -.010 .027 -.009 -.373 .716 .995 .024 .994 42.243 .000 (Constant) Age in years Triglyceride Cholesterol Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig.

Dependent Variable: Final cholesterol a.

(64)

REGRESI BERGANDA

Residuals Statisticsa 142.66 249.33 190.31 33.403 16 -5.05 4.88 .00 2.641 16 -1.426 1.767 .000 1.000 16 -1.712 1.652 .000 .894 16 Predicted Value Residual Std. Predicted Value Std. Residual

Minimum Maximum Mean Std. Deviation N

(65)

REGRESI BERGANDA

Variables Entered/Removedb Cholestero la . Enter Model 1 Variables Entered Variables Removed Method

All requested variables entered. a.

Dependent Variable: Final cholesterol b. Model Summaryb .996a .993 .992 2.986 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), Cholesterol

(66)

REGRESI BERGANDA

ANOVAb 16716.618 1 16716.618 1874.976 .000a 124.819 14 8.916 16841.438 15 Regression Residual Total Model 1 Sum of

Squares df Mean Square F Sig.

Predictors: (Constant), Cholesterol a.

Dependent Variable: Final cholesterol b.

(67)

REGRESI BERGANDA

Coefficientsa -7.536 4.630 -1.628 .126 .997 .023 .996 43.301 .000 (Constant) Cholesterol Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig.

Persamaan regresi:

Kadar kolesterol akhir = -7,536 + 0,997 kadar kolesterol awal

(68)

Correlations 1 .996** . .000 16 16 .996** 1 .000 . 16 16 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Cholesterol Final cholesterol Cholesterol Final cholesterol

Correlation is significant at the 0.01 level (2-tailed). **. Linear Regression 175 200 225 250 F in al c h o le st er o l            Final cholesterol = -7.54 + 1.00 * w gt0 R-Square = 0.99

(69)

Uji regresi logistik binari

 Ingin memprediksi variabel dependen

yang berskala binari (ya=1 dan tidak=0) dengan menggunakan data variabel

independen yang sudah diketahui besarnya

(70)

Uji regresi logistik binari

 Buka SPSS: file – data –dietstudy

 Analyze – Regression – Binary logistic:

Dependent: cholst0 (status kadar kolesterol

awal, 1=tinggi, 0=normal)

Covariates: age dan TG0

(71)

Uji regresi logistik binari

Case Processing Summary

16 100.0 0 .0 16 100.0 0 .0 16 100.0 Unweighted Casesa Included in Analysis Missing Cases Total Selected Cases Unselected Cases Total N Percent

If weight is in effect, see classification table for the total number of cases.

(72)

Uji regresi logistik binari

Omnibus Tests of Model Coefficients

1.902 2 .386 1.902 2 .386 1.902 2 .386 Step Block Model Step 1 Chi-square df Sig.

(73)

Uji regresi logistik binari

Model Summary 20.028 .112 .150 Step 1 -2 Log likelihood

Cox & Snell R Square

Nagelkerke R Square

Hosmer and Lemeshow Test

9.129 6 .166

Step 1

(74)

Uji regresi logistik binari

Contingency Table for Hosmer and Lemeshow Test

2 1.570 0 .430 2 2 1.516 0 .484 2 1 1.453 1 .547 2 0 1.118 2 .882 2 0 1.024 2 .976 2 2 .920 0 1.080 2 1 .787 1 1.213 2 1 2 3 4 5 6 7 Step 1 Observed Expected cholesterol status = normal Observed Expected cholesterol status = high Total

(75)

Uji regresi logistik binari

Classification Tablea 5 4 55.6 4 3 42.9 50.0 Observed normal high cholesterol status Overall Percentage Step 1 normal high

cholesterol status _Percentage Correct Predicted

The cut value is .500 a.

(76)

Uji regresi logistik binari

Variables in the Equation

.042 .079 .277 1 .598 1.043 .025 .020 1.527 1 .217 1.025 -5.970 5.416 1.215 1 .270 .003 AGE TG0 Constant Step 1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, TG0. a.

Penafsiran dan prediksi:

(77)

Analisis data:

untuk penyajian data

 Hasil analisis statistik  Diagram batang (bar)  Histogram

 Boxplot

 Scatterplot  Pie chart  dll

(78)

Bars show counts 20 40 60 C o u n t

(79)

0 4 8 12 C o u n t

(80)

10.00 11.00 12.00 13.00 14.00 lo b in c o n ce n tr at io n a ft er in te rv en tio n

(81)

Linear Regression 40.00 50.00 60.00 70.00 80.00 90.00 150.00 160.00 170.00 h eigh t                                                                                           he ight = 141.89 + 0.23 * w eight_2 R-Square = 0.21

(82)

SD SLTP SMU Akademi Perguruan Tinggi last education

Pies show percents

16.67%

20.00%

50.00% 7.78%