• Tidak ada hasil yang ditemukan

Bagian 5 Korelasi & Regresi Linear

5.1 Korelasi

Bagian 5 Korelasi & Regresi Linear

2) Spearman rank Correlation

Variabel X dan Y adalah variabel numerik akan tetapi data dari kedua atau salah satu dari variabel tersebut tidak berdistribusi normal atau keduanya merupakan variabel ordinal.

3) Kendall

Variabel X dan Y berskala pengukuran ordinal.

4 Scater Plot

Bila X dan Y adalah variabel yang akan dianalisis hubungannya, maka Scatter Plot variabel X dan Y adalah grafik koordinat (X,Y) dari setiap sampel. Dari Scatter plot tersebut akan dapat dilihat kuat dan arah hubungan dari kedua variabel tersebut. Bila semua koordinat (X,Y) terletak pada satu garis lurus, maka hubungan kedua variabel tersebut dinyatakan sempurna. Sebaliknya, bila koordinat (X,Y) menyebar disemua area grafik dan tidak menunjukan bentuk tertentu, maka kedua variabel tersebut dinyatakan tidak ada hubungan. Kalau koordinat (X,Y) menyebar dalam bentuk elip maka kedua variabel tersebut dinyatakan memiliki hubungan yang tidak sempurna.

Arah hubungan kedua variabel X dan Y bisa positif atau searah dan bisa negatif atau berlawanan arah. Kedua variabel dinyatakan memiliki hubungan serarah bila gambar menunjukan jika nilai X bertambah, nilai Y juga bertambah. Sebaliknya kedua variabel dikatakan memilki hubungan negatif bila scatter plot menunjukan bila nilai X bertambah akan diukuti oleh penurunan dari nilai Y. Berikut adalah contoh beberapa bentuk scatter plot.

14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00

X 17.50

15.00

12.50

10.00

7.50

5.00

Y

14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00

X 14.00

12.00

10.00

8.00

6.00

4.00

2.00

0.00

Y

Korelasi sempurna positif Korelasi sempurna negatif

5. Koefisien Korelasi

Apabila variabel X dan Y yang diteliti hubungannnya, maka kuat dan arah hubungan dari kedua variabel tersebut, selain dapat dilihat secara kasar dari scatter plot, juga dapat ditentukan dengan koefisien korelasi dari hubungan kedua variabel tersebut.

Koefisien korelasi diberi simbul ‘r’ memiliki rentang nilai absolutnya dari 0 sampai dengan 1. Nilai r = 0, berarti kedua variabel tersebut sama sekali tidak berhubungan atau nilai dari variabel yang satu sama sekali tidak berkaitan dengan nilai variabel yang lainnya. Bila nilai r antara 0,1 – 0,39 dinyatakan ada hubungan yang ringan, nilai r antara 0,4-0,69 disebut ada hubungan sedang, nilai r 0,7-0,99 dinyatakan ada hubungan yang kuat dan bila nilai r = 1 menunjukkan adanya hubungan yang sempurna antara kedua variabel tersebut. Hubungan sempurna artinya setiap kenaikan satu unit dari variabel yang pertama akan diikuti pula oleh meningkatnya satu unit dari variabel yang kedua dan scatter plotnya akan berbentuk sebuah garis lurus.

Arah hubungan dari kedua variabel tersebut ditentukan dari tanda +/- dari nilai r. Bila nilai r bertanda negatif maka kedua variabel tersebut dinyatakan memiliki hubungan negatif (berlawanan arah). Sebaliknya, bila nilai r bertanda positif maka kedua variabel tersebut memiliki hubungan positif (searah). Hubungan positif artinya arah

14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00

X 15.00

12.00

9.00

6.00

3.00

0.00

Y

14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00

X 14.00

12.00

10.00

8.00

6.00

4.00

2.00

0.00

Y

14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00

X 15.00

10.00

5.00

0.00

Y

Korelasi positif Korelasi negatif

Tidak ada korelasi

perubahan kedua nilai variabel tersebut searah. Bila nilai dari variabel yang satunya naik akan diikuti pula oleh naiknya nilai variabel yang satu lagi. Misalnya umur dan berat badan mempunyai hubungan positif artinya bila umur bertambah, maka berat badan juga bertambah. Sebaliknya, hubungan negatif berarti arah perubahan nilai kedua variabel tersebut berlawanan. Bila nilai variabel yang satu naik, akan diikuti oleh menurunnya nilai variabel yang lain. Misalnya hubungan antara bensin dalam tangki dengan jarak yang ditempuh. Makin jauh jarak yang ditempuh, makin berkurang jumlah bensin di dalam tangki.

6. Cara Menghitung Koefisien Korelasi (r)

Bila variabel yang akan dipelajari hubungannya adalah variabel X dan Y, maka koefisien korelasi hubungan dari kedua variabel tersebut dapat dihitung sebagai berikut:

Rumus:

( )

( )

{

∑ ∑

} {

()

}

∑ ∑ ∑

=

n Y Y n X X

n Y X r XY

/ /

/

2 2 2 2

Keterangan:

r = koefisien korelasi

ƩXY = jumlah hasil kali nilai var X dengan var Y ƩX = jumlah nilai var X

ƩY = jumlah nilai var Y

ƩX2 = jumlah nilai var X kwadrat ƩY2 = jumlah nilai var Y kwadrat n = jumlah sampel

7. Uji Hipotesa Koefisien Korelasi

Sangatlah tidak mungkin menentukan korelasi variabel X dan Y di populasi, maka pada banyak penelitian, penentuan korelasi X dan Y dilakukan pada sampel. Untuk menentukan apakah korelasi yang ditentukan dari sampel benar menggambarkan korelasi X dan Y di poluasi, maka perlu dilakukan uji hipotesis degan langkah berikut.

1) Menetapakan hipotesis untuk korelasi Hipotesis statistik sbb:

Ho: ρ = 0 (tidak ada hubungan) Ha: ρ # 0 (ada hubungan

Koefisien korelasi mempunyai distribusi menyerupai distribusi t, oleh karena itu, uji Hipotesa koefisien korelasi dilakukan dengan statistik uji “t” dengan derajat bebas df = n-2 dengan rumus sbb.

) 2 ) (

1 ( ) 2 (

) 1

( 2 2

=

= n

r r n

r t r

Keterangan:

t = nilai statistik t

r = koefisien korelasi sampel n = jumlah sampel

8. Cara Pengambilan kesimpulan

Ho diterima bila nilai p > 0,05 dan Ho ditolak bila nilai p ≤ 0,05.

Nilai p dapat dilihat pada tabel distribusi t dan pada semua program paket statsitik akan mencantumkan nilai p dari hasil uji pada tabel luaran (output) hasil analisnya.

Contoh Kasus: untuk bahan latihan, berikut adalah data sebuah penelitian cross- sectional karakteristik faktor risiko penderita CHD di Rumah Sakit X.

Tabel 1. Karakteristik faktor risiko CHD di Rumah Sakit X

No. Age Chol BMI No. Age Chol BMI

1 56 292 31.85 16 56 329 20.30

2 48 339 31.06 17 44 349 25.96

3 60 303 30.17 18 29 419 25.40

4 59 269 27.94 19 45 278 26.08

5 58 312 21.43 20 44 354 28.62

6 64 185 32.44 21 34 317 22.67

7 59 303 24.96 22 40 334 24.66

8 47 304 33.05 23 34 345 31.47

9 47 334 23.02 24 39 330 39.54

10 28 328 27.12 25 45 347 25.10

11 54 363 28.46 26 41 339 22.05

12 38 399 26.63 27 57 353 28.59

13 35 321 25.90 28 57 220 25.84

14 64 244 30.83 29 38 385 26.83

15 34 314 24.55 30 45 240 32.73

9 Prosedur Correlation

1) Rekamlah data di atas dengan cara seperti yang sudah dilakukan pada modul sebelumnya atau bukalah data dengan nama korelasi_regresi.dta.

2) Lakukan Uji Normalitas sesuai prosedur yang dipelajari pd Modul 2 atau ketik perintah pada command window: swilk Age cholesterol BMI maka akan muncul hasil sbb:

Kesimpulan: data umur, kolesterol dan BMI berdistribusi normal 3) Membuat Scatter Plot

Scatter Plot adalah grafik pencar yang menggambarkan hubungan variabel X dan Y.

Misalnya membuat Scatter plot antara variabel Umur dengan Kolesterol, caranya adalah: Pilih menu Graphic, kemudian klik Two-way graph (scatter, line etc), maka akan tampak kotak dialog sbb:

Kemudian klik Create maka akan muncul lagi box dialog sbb:

Pastikkan Basic Plot terpilih untuk membuat simple scatter plot kemudian masukkan variabel cholesterol ke Y variable dan Age ke X variable, kemudian klik Accept untuk kembali ke box dialog sebelumnya, maka akan tampak, sbb:

Muncul Plot 1 pada box Plot definitions yang menandakan kita sudah merancang scatter plot. Untuk menambahkan garis linier klik kembali Create maka akan tampil box dialog:

Untuk menampilkan garis linier prediction, pastikkan Fit plot dan linier prediction terpilih. Setelah itu masukkan variabel cholesterol ke Y variable dan

Age ke X variable, kemudian klik Accept untuk kembali ke box dialog sebelumnya, maka akan tampak, sbb:

Selanjutnya klik OK, maka akan muncul Graph sbb:

Hasil yang sama akan didapat dengan mengetik perintah:

twoway (scatter cholesterol Age) (lfit cholesterol Age)

Interpretasi: terdapat hubungan negatif antara umur dengan kolesterol darah pada penderita CHD.

4) Analisis korelasi

Oleh karena data ketiga variabel berdistribusi normal maka uji korelasi yang digunakan adalah uji korelasi Pearson. Prosedur Correlation dari uji korelasi Pearson adalah: Pilih Statistic, “Summaries, tables and tests” kemudian pilih

“Summarize and descriptive statistic”, selanjutnya klik “Pairwise Correlation”

maka akan muncul sbb:

.

Masukkan semua variabel yang ingin dikorelasikan pada box variables dan ingat centang Print significance level for each entry untuk menampilkan nilai p.

Selanjutnya klik OK makan akan muncul hasil sbb:

Hasil yang sama akan didapat bila mengetik perintah:

Pwcorr Age cholesterol BMI, sig 10. Interpretasi

Arah hubungan dilihat dari sign koefisien korelasi. Bila sign negatif, berarti hubungannnya negatif atau berlawanan arah. Sebaliknya, bila sign positif berarti ada hubungan positif atau searah. Kuat hubungan dilihat dari nilai absolut koefisien korelasi. Korelasi sempurna bila r = 1, kuat bila 0,7<r< 1, sedang bila0,4 <r <0,7, ringan bila 0<r<0,4, dan tidak ada hubungan bila r=0.

Signifikansi hubungan

Hubungan dinyatakan bermakna bila nilai p ≤ α dan sebaliknya dinyatakan tidak bermakna bila p > α. Dari hasil analisis di atas dapat disimpulkan bahwa umur berkorelasi negatif sedang dengan kolesterol (p = 0,0008), tetapi tidak berkorealsi dengan IMT (nilai p = 0,5510). Kolesterol berhubungan negatif sedang dengan umur (p = 001), tetapi tidak berkorelasi dengan IMT (p = 0,1709).

5.2 Regresi

Dalam dokumen MODUL MANAJEMEN DATA DAN STATISTIKA DASAR (Halaman 46-56)

Dokumen terkait