1
NILAI MAKSIMUM DARI KOEFISIEN KORELASI Hangga Mula Kurnia1*, Firdaus2, Sigit Sugiarto2
hanggamula@yahoo.com 1
Mahasiswa program Studi S1 Matematika 2
Dosen Jurusan Matematika FMIPA-UR Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Riau Kampus Binawidya Pekanbaru (28293), Indonesia
ABSTRACT
The strength and dependence between variables is a central problem that we want to know on a lot of research. At the time of perfectly correlation occurs sometimes in some cases the value of size is not reached
1
. In this article discusses the methods used to obtain the maximum value of the correlation measure. The method are simple method, using the Expectation, and model of Association.Keywords : Analysis Correlation, Contingency Table, Maximum Value, Technique Correlation of
Contingency Coefficient
1. PENDAHULUAN
Korelasi berarti hubungan timbal balik. Dua buah variabel dikatakan berkorelasi apabila setiap perubahan pada satu variabel selalu diikuti dengan perubahan variabel lain dan masing-masing perubahan terjadi secara proporsional. Sedangkan analisa korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi.
Kekuatan dan sifat ketergantungan antar variabel merupakan masalah pokok yang ingin diketahui pada banyak penelitian. Indeks yang mengkuantifikasi hubungan antar variabel disebut ukuran asosiasi [6]. Tak ada satu ukuran asosiasi pun yang mampu menggambarkan suatu model asosiasi dengan sempurna. Dalam aplikasinya, interpretasi tentang asosiasi sempurna, sedang, dan lemah berbeda antara satu ukuran asosiasi dan ukuran asosiasi lainnya, sekalipun memiliki persamaan rentang indeks (misalnya dari 0 sampai dengan 1). Apabila dikelompokkan, tingkatan nilai korelasi dapat dilihat pada tabel berikut [4]
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 2
Tabel 1.1 Tingkatan nilai koefisien korelasi Interval nilai r Tingkat hubungan
2 . 0 0 r Sangat rendah 4 . 0 2 . 0 r Rendah 6 . 0 4 . 0 r Sedang 8 . 0 6 . 0 r Kuat 1 8 . 0 r Sangat kuat
Dalam memilih indeks asosiasi perlu dipertimbangkan beberapa hal khusus, yaitu jenis data, hipotesis penelitian, serta sifat-sifat ukuran asosiasi. Tidak dianjurkan untuk menghitung semua indeks asosiasi tetapi kemudian hanya melaporkan indeks yang memberi gambaran hubungan yang paling mengesankan.
Ukuran kekuatan hubungan dua variabel berskala nominal yang sering dijumpai adalah pengembangan dari statistik chi square yang biasa dilambangkan dengan 2. Statistik ini sebenarnya bukan merupakan indeks yang akurat untuk mengukur hubungan antara variabel [6]. Akan tetapi karena uji independensi2
banyak dipakai sehingga para matematikawan terdorong untuk mengembangkan ukuran asosiasi berdasarkan statistik 2
. Untuk memperkecil pengaruh ukuran sampel, derajat bebas, dan untuk menjaga rentang besaran nilai koefisien asosiasi tidak melebihi 0 dan 1 maka statistik chi square mengalami berbagai macam modifikasi. Modifikasi tersebut yakni Koefisien Phi, Koefisien Kontingensi, dan Koefisien V Cramer [6].
2. ANALISA KORELASI DAN EKSPEKTASI BERSYARAT 2.1 Tabel Kontingensi
Tabel kontingensi merupakan barisan bilangan asli dalam bentuk matrik yang bilangan-bilangan tersebut mewakili jumlah atau frekuensi dari data yang diamati [5]. Banyak data hasil pengamatan yang dapat digolongkan ke dalam beberapa faktor, variabel, karakteristik, atau atribut terdiri dari beberapa klasifikasi, kategori, golongan atau mungkin tingkatan. Berdasarkan hasil pengamatan terhadap fenomena tersebut akan diselidiki mengenai asosiasi atau hubungan antara variabel itu.
Bentuk paling sederhana dari tabel kontingensi disebut juga dengan dikotomi yakni tabel kontingensi yang berukuran 22. Dalam bentuk umum, misalkan terdapat sampel acak berukuran f. Pada setiap pengamatan diduga terjadi karena adanya dua macam variabel, yaitu variabel A dan variabel B. variabel A terbagi atas c taraf atau tingkatan dan demikian juga dengan
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 3
variabel B terbagi atas r taraf [5]. Banyakya pengamatan yang terjadi karena taraf ke i pada variabel A ( i =1,2,3, . . c ) dan taraf ke j pada variabel B ( j =1,2,3, . . r ) akan dimisalkan dengan
fij. Hasilnya dapat dinyatakan dalam tabel kontingensi berukuran rc berikut ini : Tabel 2.1 Tabel kontingensi berukuran rc
Variabel B Variabel A Total A1 A2 Ac B1 f11 f12
f
c1f
1. B2 f21 f22 f
c2f
2. Br f1r f2r f
rcf
r. Totalf
.1f
.2 f
.c fJumlah dari baris ke i dinyatakan dengan :
ic i i i
f
f
f
f
.
1
2
c j ij f 1 (1)Jumlah dari kolom ke j dinyatakan dengan :
rj j j j f f f f. 1 2
r i ij f 1 (2) Demikian pula :
r i c j ij f f 1 1 ..
r i c j j i f f f 1 1 . . .. (3) 2.2 Uji StatistikTeknik uji chi square ( chi dibaca kai ) ditemukan oleh helmet pada tahun 1990 dan pertama kali diperkenalkan oleh Karl Pearson [7]. Oleh karena itu kebanyakan di dalam penggunaannya
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 4
sering dinamakan dengan Pearson Chi Square (2). Uji ini digunakan untuk menguji kebebasan antara dua variabel yang disusun dalam tabel rc atau menguji keselarasan di mana pengujian dilakukan untuk memeriksa ketergantungan dan homogenitas dari data sampel yang diambil untuk menunjang hipotesis yang menyatakan bahwa populasi asal sampel tersebut mengikuti distribusi yang telash ditetapkan.
Ada beberapa hal yang perlu diperhatikan dalam penggunaan 2pada tabel kontingensi, yaitu [7] :
1. 2 digunakan untuk menganalisa data yang berbentuk frekuensi,
2. Tidak dapat digunakan untuk menentukan besar atau kecilnya korelasi dari variabel-variabel yang dianalisa,
3. Pada dasarnya belum dapat menghasilkan kesimpulan yang memuaskan, 4. Cocok digunakan untuk data kategorik,data diskrit atau data nominal.
Terdapat dua keadaan ketika mengambil suatu keputusan yang salah, yakni apabila H0
benar terjadi kesalahan dengan menolak H0. Keadaan selanjutnya adalah kesalahan ketika
menerima H0 ketika H0 salah. Hal ini dijelaskan dalan definisi berikut
Definisi 2.2.1 [ 5:hal. 78]
Tipe kesalahan pertama adalah menolak suatu hipotesis nol yang benar. Definisi 2.2.2 [ 5:hal. 78]
Tipe kesalahan kedua adalah menerima suatu hipotesis nol yang salah. Untuk menghitung nilai statistik 2
data telebih dahulu diajukan hipotesis untuk mengetahui hubungan antara kedua variabel, maka hipotesis yang diuji berdasarkan data pada tabel 2.1, yaitu :
0
H
: tidak terdapat hubungan yang positif antara variabel A dan variabel B1
H
: terdapat hubungan positif yang signifikan antara variabel A dan variabel BPengujian secara eksak sulit untuk digunakan, maka akan dilakukan pengujian yang bersifat pendekatan. Untuk itu diperlukan frekuensi teoretis atau banyaknya gejala yang diharapkan terjadi ( eij ) [6], dengan rumus :
f f f eij i. .j (4)
. if
jumlah data pada baris ke i j
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 5
Nilai
f
i.dan f.j diperoleh dengan menggunakan (1) dan (2). Dengan demikian misalnya didapat nilai teoretis dari masing-masing data, yaitu :f f f e 1. .1 11 f f f e 1. .2 12 f f f e 2. .1 21 f f f e 2. .2 22 dan seterusnya …
jelas bahwa jumlah data pengamatan dinyatakan dengan :
c r
f
f
f
f
f
f
f
1.
2.
.
.1
.2
.Selanjutnya nilai statistik 2digunakan untuk menguji hipotesis yang diajukan sebelumnya berdasarkan data tabel kontingensi berukuran rc.Untuk menentukan 2tabel kontingensi berukuran rc digunakan rumus umum berikut [6] :
r i c j ij ij ij ht e e f 1 1 2 2
(5)
2 ht
Chi Square hitungfij frekuensi yang diamati
eij frekuensi yang diperoleh (hasil dari rumus (4))
i1,2,,r j 1,2,,c
Hasil dari penghitungan
ht2selanjutnya dibandingkan dengan
2tabel dengan derajat kebebasan (df) adalah
r1
c1
sehingga dapat diambil kesimpulan. Apabila harga
ht2 hitung sama atau lebih besar dari 2) 1 ( 1 (r c
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 6
diterima. Apabila harga
ht2 lebih kecil dibandingkan 2) 1 ( 1 (r c
tabel maka (H0)diterima dan (H1) ditolak [8].2.3 Ekspektasi Bersyarat
Definisi 2.3.1 Ekspektasi [2:hal. 61]
Misalkan X adalah variabel random dengan fungsi densitas f
x , maka ekspektasi dari X yang dinotasikan dengan E
X didefinisikan dengan :
n x x f x X E 1 ) ( ) ( jika X diskrit
xf x dx X E( ) ( ) jika X kontinuDefinisi 2.3.2 Ekspektasi bersyarat [2:hal. 180]
Misalkan X dan Y adalah variabel random distribusi gabungan, maka ekspektasi bersyarat X bila diketahui Y y yang dinotasikan dengan E(X y) didefinisikan dengan
xy f x y X E x
)( , jika X dan Y diskrit
X y xf
xy dxE
x
, jika X dan Y kontinu Teorema 2.3.3 [3:hal. 150]
Misalkan X dan Y variabel random kontinu, (i) Jika a konstanta maka E(a)a
(ii) Jika a konstanta maka E(aX)aE(X)
Bukti
Dari definisi 2.4.1 maka diperoleh
(i) E a
af x dxa
f x dxa ) ( ) ( ) ( □ (ii) E(aX)
axf(x)dxa
xf(x)dxaE(X) □ 2.4 Teknik Korelasi Koefisien KontingensiDalam memilih teknik korelasi perlu diperhatikan jenis data yang diteliti karena setiap jenis data berbeda teknik korelasi yang dipakai. Berikut ini pemakaian teknik korelasi berdasarkan jenis data yang diteliti
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 7
Tabel 2.5 Pemakaian teknik korelasi berdasarkan jenis data yang diteliti jenis data teknik korelasi
Nominal teknik korelasi koefisien kontingensi Ordinal teknik korelasi Spearman Rank teknik korelasi Kendall Tau Interval/Rasio teknik korelasi Produk momen
teknik korelasi Parsial teknik korelasi Ganda
Kegunaan teknik korelasi koefisien kontingensi adalah untuk mencari atau menghitung keeratan hubungan antara dua variabel yang mempunyai gejala ordinal (kategori), atau paling tidak berjenis nominal [7]. Koefisien kontingensi (C) disebut juga koefisien bersyarat.
Koefisien kontingensi memiliki pengertian yang sama dengan koefisien korelasi. Misalnya hasil penelitian dihasilkan dalam bentuk tabel rcdan jika C bernilai nol berarti tidak ada hubungan, akan tetapi batas atas C tidak bernilai satu tergantung atau sebagai fungsi banyaknya kategori (baris atau kolom). Untuk menghitung koefisien kontingensi digunakan rumus : f C 2 2 (6)
3. NILAI MAKSIMUM DARI KOEFISIEN KORELASI
Data yang diuji menggunakan 2belum dapat menghasilkan kesimpulan yang memuaskan maka dari itu perlu dilakukan uji lanjutan [9]. Hal ini karena pengujian menggunakan
2 tidak dapatmenentukan besar atau kecilnya korelasi dari variabel-variabel yang dianalisa. Maka dari itu dilakukan pengujian dengan menggunakan pengembangan dari uji
2 yakni koefisien kontingensi.Pada pengujian dengan menggunakan koefisien kontingensi, bentuk
2 yang dipakai mengalami modifikasi sehingga dapat disesuaikan dengan metode yang dibahas pada bab ini. Dengan menyederhanakan (5) apabila ditambah dengan f maka diperoleh
n i n j ij ij e f f 1 1 2 2
n i n j i j ij f f f f 1 1 . . 2 (7)Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 8
dengan menarik akar dari bentuk (6) maka diperoleh f C 2 2 2 (8)
kemudian subtitusi (7) ke (8) menjadi
n i n j i j ij n i n j i j ij f f f f f f f f f C 1 1 . . 2 1 1 . . 2 2
n i n j i j ij f f f 1 1 . . 2 1 1 (9)Nagres Abbasi [1] mengemukakan cara menentukan batas atas minimum dari bentuk
n i n j i j ij f f f 1 1 . . 2 (10)Pada skripsi ini dibahas metode yang dikemukakan Nagres Abbasi untuk menentukan batas atas minimum dari bentuk (10) pada tabel kontingensi berukuran nn.
3.1 Model Sederhana
Dalam penggunaan metode sederhana bisa dilakukan pada tabel kontingensi rcmaupun nn. Dengan menggunakan metode sederhana akan ditentukan nilai C dari tabel kontingensi berukuran nn, misalkan untuk n2.
Tabel 3.1 Tabel kontingensi berukuran22
B
Variabel
Variabel
A
Total
1 A A2 1 B f11 f12f
1. 2 B f21 f22f
2.Total
f
.1f
.2 fHangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 9 Misalkan 1 . 11 f f a , 2 . 12 f f b , . 1 11 f f p , dan . 2 21 f f q
dari permisalan nilai a, b, p, dan q terlihat bahwa 0a,b,p,q1 Dengan menguraikan bentuk (10)
2 1 2 1 . . 2 1 1 . . 2 i j i j ij n i n j i j ij f f f f f f
2 1 2 1 . . i j j ij i ij f f f f
2 1 .2 2 . 2 1 . 1 . 1 i i i i i i i f f f f f f f f 2 . 22 . 2 22 1 . 21 . 2 21 2 . 12 . 1 12 1 . 11 . 1 11 f f f f f f f f f f f f f f f f pa
1p
bq
1a
1b
1q
1 p q a b 1 pa2
1 1 . . 2
n i n j i j ijf
f
f
dengan mensubtitusikan nilai yang diperoleh ke bentuk (9) maka
2 1 2 1 . . 2 2 1 1 i j i j ij f f f C 2 1 2 1 1 2 1 CHangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 10
dengan menarik bentuk akar dari C diperoleh dua nilai koefisien kontingensi yakni 2 2 C dan 2 2
C . Data yang diteliti merupakan data yang berkorelasi positif sehingga
nilai yang diambil adalah nilai
2 2
C . Diperoleh koefisien kontingensi untuk tabel 3.1
707
.
0
C
. Nilai korelasi ini dikategorikan kuat karena nilainya berada dalam kategori ke empat pada tabel 2.1
0.6C0.8
.Untuk tabel kontingensi dengan ukuran tabel rc, (10) diuraikan menjadi
r i c j j ij i ij r i c j i j ij f f f f f f f 1 1 . . 1 1 . . 2
r i c ic i ic i i i i i i f f f f f f f f f f f f 1 .2 . . 2 . 2 1 . 1 . 1
c c c c c c r i c j i j ij f f f f f f f f f f f f f f f f f f f f f f f . 2 . 2 2 . 2 22 . 2 21 . 1 . 1 1 2 . 12 . 1 12 1 . 11 . 1 11 1 1 . . 2 c rc r rc r r r r r r f f f f f f f f f f f f . . 2 . 2 . 2 2 . 1 . 1 (11) 3.2 Menggunakan EkspektasiBatas atas minimum dari bentuk (10) juga dapat dihitung dengan menggunakan ekspektasi, yang dinyatakan dalam bentuk
n i n j j ij i ij n i n j i j ij f f f f f f f 1 1 . . 1 1 . . 2berdasarkan definisi ekspektasi bersyarat 2.4.2 maka dapat dinyatakan
n j i ij f f 1 . menjadi bentuk ekspektasi i A A B E , sehingga
n i j ij A A B n i n j j ij i ij f f E f f f f i 1 . 1 1 . .karena fij f.j maka nilai 1 . j ij f f
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 11
n i A A B n i j ij A A B i f E i f E 1 1 . ) 1( ,berdasarkan teorema 2.4.3 maka
ni 1
1 n
Dengan mensubtitusikan nilai yang diperoleh ke (9), maka untuk setiap tabel kontingensi berukuran nnnilai maksimum koefisien kontingensinya dapat dinyatakan dengan
n n
C 1 (12)
3.3 Model Asosiasi
Nilai minimum dari 2terjadi ketika dua variabel random yang diteliti saling bebas dan nilai maksimum dari 2dari kedua variabel berkorelasi sempurna. Hal ini dapat dilihat apabila nilai korelasinya mendekati satu. Pada kasus ini dua variabel kuantitas terdapat hubungan linier dengan peluang sama dengan satu. Dua variabel random dengan P
Y aXb
1. Tentunya pilihan nilai dari X dan Y harus sama. Model asosiasi ini pada faktor kualitas dinyatakan dengann f fjj
f jumlah data pada tabel kontingensi
n ukuran tabel kontingensi dengan syarat i j atau 1 . . j ij i ij f f f f (13) untuk i j1,2,3,,n apabila diuraikan (13) menjadi
1 . . . 3 . 3 3 . 2 . 2 2 . 1 . 1 1 2 . 12 . 1 12 1 . 11 . 1 11 n nn n nn n n n n n n n n n f f f f f f f f f f f f f f f f f f f f f f f f (14) untuk i j 0 . . j ij i ij f f f f (15)
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 12
apabila (15) diuraikan menjadi
0 . . . 3 . 3 3 . 2 . 2 2 . 1 . 1 1 2 . 12 . 1 12 1 . 11 . 1 11 n nn n nn n n n n n n n n n f f f f f f f f f f f f f f f f f f f f f f f f (16)
Maka nilai maksimum dari (10) dengan menggunakan model asosiasi adalah n. DAFTAR PUSTAKA
[1] Abbasi, Nagres. 2008. On Maximum Value of Correlation Coefficient. Department of
Statistics Payame Noor University. 34, 1655-1658.
[2] Bain, L.J and Engelhardt, Max. 1992. Introduction to Probability and matematical
Statistics. 2nd ed. Duxbury Press. Belmon, California.
[3] Bradlow Thomas, Eric. G.S.Hardie, Bruce & S.fader, Peter. 2002. Bayesian Inference for
the Negative Binomial Distribution via Polynomial Expansion. Journal of Computational
and Graphical Statistics. Vol.11. pp 189-201.
[4] Burhanuddin, Muhammad. 2012. Koefisien Korelasi, Signifikansi, dan Determinasi. 28 Juni 2012.
http://alvinburhani.wordpress.com/2012/06/28/koefisien-korelasi-signifikansi-determinasi/, 17 Desember 2012. Pk.10.30,
[5] Conover, W. J. 1980. Practical Nonparametric Statistic. John Wiley & Sons, New York. [6] Everit, B.S. 1992. The Analysis of Contingency Tables. Chapman & Hall. Second Edition,
London.
[7] Sarah, Mahdia. 2011. Pemodelan Regresi Nonparametrik dengan B-Spline dan Mars. http://repository.usu.ac.id/handle/123456789/29996, 23 Desember 2012. Pk 09.00, [8] Sudjana. 1996. Metoda Statistika. PT Tarsito. Bandung.
[9] Zuliana, S.U. 2009. Metode Statistika Lanjut. 42 hal.
http://images.dedi1968.multiply.multiplycontent.com/attachment/0/SNSPdgoKCEEAAC4 3Iic1/2.Lilliefors%26Tabel%2520Kategorik.pdf?key=dedi1968:journal:70&nmid=116333 237, 18 Juni 2012. Pk. 13.02,