NILAI MAKSIMUM DARI KOEFISIEN KORELASI. ABSTRACT 1. PENDAHULUAN

(1)

1

NILAI MAKSIMUM DARI KOEFISIEN KORELASI Hangga Mula Kurnia1*, Firdaus2, Sigit Sugiarto2

hanggamula@yahoo.com 1

Mahasiswa program Studi S1 Matematika 2

Dosen Jurusan Matematika FMIPA-UR Jurusan Matematika

Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Riau Kampus Binawidya Pekanbaru (28293), Indonesia

ABSTRACT

The strength and dependence between variables is a central problem that we want to know on a lot of research. At the time of perfectly correlation occurs sometimes in some cases the value of size is not reached



1

. In this article discusses the methods used to obtain the maximum value of the correlation measure. The method are simple method, using the Expectation, and model of Association.

Keywords : Analysis Correlation, Contingency Table, Maximum Value, Technique Correlation of

Contingency Coefficient

1. PENDAHULUAN

Korelasi berarti hubungan timbal balik. Dua buah variabel dikatakan berkorelasi apabila setiap perubahan pada satu variabel selalu diikuti dengan perubahan variabel lain dan masing-masing perubahan terjadi secara proporsional. Sedangkan analisa korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi.

Kekuatan dan sifat ketergantungan antar variabel merupakan masalah pokok yang ingin diketahui pada banyak penelitian. Indeks yang mengkuantifikasi hubungan antar variabel disebut ukuran asosiasi [6]. Tak ada satu ukuran asosiasi pun yang mampu menggambarkan suatu model asosiasi dengan sempurna. Dalam aplikasinya, interpretasi tentang asosiasi sempurna, sedang, dan lemah berbeda antara satu ukuran asosiasi dan ukuran asosiasi lainnya, sekalipun memiliki persamaan rentang indeks (misalnya dari 0 sampai dengan 1). Apabila dikelompokkan, tingkatan nilai korelasi dapat dilihat pada tabel berikut [4]

(2)

Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 2

Tabel 1.1 Tingkatan nilai koefisien korelasi Interval nilai r Tingkat hubungan

2 . 0 0 r  _{Sangat rendah} 4 . 0 2 . 0  r  _Rendah 6 . 0 4 . 0  r  _Sedang 8 . 0 6 . 0  r  _Kuat 1 8 . 0  r  _{Sangat kuat}

Dalam memilih indeks asosiasi perlu dipertimbangkan beberapa hal khusus, yaitu jenis data, hipotesis penelitian, serta sifat-sifat ukuran asosiasi. Tidak dianjurkan untuk menghitung semua indeks asosiasi tetapi kemudian hanya melaporkan indeks yang memberi gambaran hubungan yang paling mengesankan.

Ukuran kekuatan hubungan dua variabel berskala nominal yang sering dijumpai adalah pengembangan dari statistik chi square yang biasa dilambangkan dengan 2. Statistik ini sebenarnya bukan merupakan indeks yang akurat untuk mengukur hubungan antara variabel [6]. Akan tetapi karena uji independensi2

banyak dipakai sehingga para matematikawan terdorong untuk mengembangkan ukuran asosiasi berdasarkan statistik 2

. Untuk memperkecil pengaruh ukuran sampel, derajat bebas, dan untuk menjaga rentang besaran nilai koefisien asosiasi tidak melebihi 0 dan 1 maka statistik chi square mengalami berbagai macam modifikasi. Modifikasi tersebut yakni Koefisien Phi, Koefisien Kontingensi, dan Koefisien V Cramer [6].

2. ANALISA KORELASI DAN EKSPEKTASI BERSYARAT 2.1 Tabel Kontingensi

Tabel kontingensi merupakan barisan bilangan asli dalam bentuk matrik yang bilangan-bilangan tersebut mewakili jumlah atau frekuensi dari data yang diamati [5]. Banyak data hasil pengamatan yang dapat digolongkan ke dalam beberapa faktor, variabel, karakteristik, atau atribut terdiri dari beberapa klasifikasi, kategori, golongan atau mungkin tingkatan. Berdasarkan hasil pengamatan terhadap fenomena tersebut akan diselidiki mengenai asosiasi atau hubungan antara variabel itu.

Bentuk paling sederhana dari tabel kontingensi disebut juga dengan dikotomi yakni tabel kontingensi yang berukuran 22. Dalam bentuk umum, misalkan terdapat sampel acak berukuran f. Pada setiap pengamatan diduga terjadi karena adanya dua macam variabel, yaitu variabel A dan variabel B. variabel A terbagi atas c taraf atau tingkatan dan demikian juga dengan

(3)

variabel B terbagi atas r taraf [5]. Banyakya pengamatan yang terjadi karena taraf ke i pada variabel A ( i =1,2,3, . . c ) dan taraf ke j pada variabel B ( j =1,2,3, . . r ) akan dimisalkan dengan

fij. Hasilnya dapat dinyatakan dalam tabel kontingensi berukuran rc berikut ini : Tabel 2.1 Tabel kontingensi berukuran rc

Variabel B Variabel A Total A1 A2  Ac B1 f11 f12 

f

c1

f

1. B2 f21 f22 

f

c2

f

2.       Br f1r f2r 

f

rc

f

r. Total

f

.1

f

.2 _

f

.c f

Jumlah dari baris ke i dinyatakan dengan :

ic i i i

f

_.



₁



₂









  c j ij f 1 (1)

Jumlah dari kolom ke j dinyatakan dengan :

rj j j j f f f f_.  ₁  ₂ 



  r i ij f 1 ₍₂₎ Demikian pula :



   r i c j ij f f 1 1 ..



    r i c j j i f f f 1 1 . . .. (3) 2.2 Uji Statistik

Teknik uji chi square ( chi dibaca kai ) ditemukan oleh helmet pada tahun 1990 dan pertama kali diperkenalkan oleh Karl Pearson [7]. Oleh karena itu kebanyakan di dalam penggunaannya

(4)

sering dinamakan dengan Pearson Chi Square (2). Uji ini digunakan untuk menguji kebebasan antara dua variabel yang disusun dalam tabel rc atau menguji keselarasan di mana pengujian dilakukan untuk memeriksa ketergantungan dan homogenitas dari data sampel yang diambil untuk menunjang hipotesis yang menyatakan bahwa populasi asal sampel tersebut mengikuti distribusi yang telash ditetapkan.

Ada beberapa hal yang perlu diperhatikan dalam penggunaan 2pada tabel kontingensi, yaitu [7] :

1. 2 digunakan untuk menganalisa data yang berbentuk frekuensi,

2. Tidak dapat digunakan untuk menentukan besar atau kecilnya korelasi dari variabel-variabel yang dianalisa,

3. Pada dasarnya belum dapat menghasilkan kesimpulan yang memuaskan, 4. Cocok digunakan untuk data kategorik,data diskrit atau data nominal.

Terdapat dua keadaan ketika mengambil suatu keputusan yang salah, yakni apabila H0

benar terjadi kesalahan dengan menolak H0. Keadaan selanjutnya adalah kesalahan ketika

menerima H0 ketika H0 salah. Hal ini dijelaskan dalan definisi berikut

Definisi 2.2.1 [ 5:hal. 78]

Tipe kesalahan pertama adalah menolak suatu hipotesis nol yang benar. Definisi 2.2.2 [ 5:hal. 78]

Tipe kesalahan kedua adalah menerima suatu hipotesis nol yang salah. Untuk menghitung nilai statistik 2

data telebih dahulu diajukan hipotesis untuk mengetahui hubungan antara kedua variabel, maka hipotesis yang diuji berdasarkan data pada tabel 2.1, yaitu :

0

H

: tidak terdapat hubungan yang positif antara variabel A dan variabel B

1

H

: terdapat hubungan positif yang signifikan antara variabel A dan variabel B

Pengujian secara eksak sulit untuk digunakan, maka akan dilakukan pengujian yang bersifat pendekatan. Untuk itu diperlukan frekuensi teoretis atau banyaknya gejala yang diharapkan terjadi ( eij ) [6], dengan rumus :

f f f e_ij  i. .j (4)



. i

f

jumlah data pada baris ke i 

j

(5)

Nilai

f

_i_.dan f_._j diperoleh dengan menggunakan (1) dan (2). Dengan demikian misalnya didapat nilai teoretis dari masing-masing data, yaitu :

f f f e 1. .1 11   f f f e 1. .2 12   f f f e 2. .1 21   f f f e 2. .2 22   dan seterusnya …

jelas bahwa jumlah data pengamatan dinyatakan dengan :

c r

f



₁_.



₂_.







_.



_.₁



_.₂







_.

Selanjutnya nilai statistik 2digunakan untuk menguji hipotesis yang diajukan sebelumnya berdasarkan data tabel kontingensi berukuran rc.Untuk menentukan 2tabel kontingensi berukuran rc digunakan rumus umum berikut [6] :







    r i c j ij ij ij ht e e f 1 1 2 2



(5)



2 ht



Chi Square hitung

fij frekuensi yang diamati

eij frekuensi yang diperoleh (hasil dari rumus (4))

i1,2,,r j 1,2,,c

Hasil dari penghitungan



_ht2selanjutnya dibandingkan dengan



2tabel dengan derajat kebebasan (df) adalah



r1



c1



sehingga dapat diambil kesimpulan. Apabila harga



_ht2 hitung sama atau lebih besar dari 2

) 1 ( 1 (r c

(6)

diterima. Apabila harga



_ht2 lebih kecil dibandingkan 2

) 1 ( 1 (r c



tabel maka (H0)diterima dan (H1) ditolak [8].

2.3 Ekspektasi Bersyarat

Definisi 2.3.1 Ekspektasi [2:hal. 61]

Misalkan X adalah variabel random dengan fungsi densitas f

 

x , maka ekspektasi dari X yang dinotasikan dengan E

 

X didefinisikan dengan :



  n x x f x X E 1 ) ( ) ( jika X diskrit



    xf x dx X E( ) ( ) jika X kontinu

Definisi 2.3.2 Ekspektasi bersyarat [2:hal. 180]

Misalkan X dan Y adalah variabel random distribusi gabungan, maka ekspektasi bersyarat X bila diketahui Y  y yang dinotasikan dengan E(X y) didefinisikan dengan

 

xy f x y X E x



 )

( , jika X dan Y diskrit

 

X y xf

 

xy dx

E

x





 , jika X dan Y kontinu Teorema 2.3.3 [3:hal. 150]

Misalkan X dan Y variabel random kontinu, (i) Jika a konstanta maka E(a)a

(ii) Jika a konstanta maka E(aX)aE(X)

Bukti

Dari definisi 2.4.1 maka diperoleh

(i) E a 



af x dxa



f x dxa       ) ( ) ( ) ( □ (ii) E(aX)



axf(x)dxa



xf(x)dxaE(X)       □ 2.4 Teknik Korelasi Koefisien Kontingensi

Dalam memilih teknik korelasi perlu diperhatikan jenis data yang diteliti karena setiap jenis data berbeda teknik korelasi yang dipakai. Berikut ini pemakaian teknik korelasi berdasarkan jenis data yang diteliti

(7)

Tabel 2.5 Pemakaian teknik korelasi berdasarkan jenis data yang diteliti jenis data teknik korelasi

Nominal teknik korelasi koefisien kontingensi Ordinal teknik korelasi Spearman Rank teknik korelasi Kendall Tau Interval/Rasio teknik korelasi Produk momen

teknik korelasi Parsial teknik korelasi Ganda

Kegunaan teknik korelasi koefisien kontingensi adalah untuk mencari atau menghitung keeratan hubungan antara dua variabel yang mempunyai gejala ordinal (kategori), atau paling tidak berjenis nominal [7]. Koefisien kontingensi (C) disebut juga koefisien bersyarat.

Koefisien kontingensi memiliki pengertian yang sama dengan koefisien korelasi. Misalnya hasil penelitian dihasilkan dalam bentuk tabel rcdan jika C bernilai nol berarti tidak ada hubungan, akan tetapi batas atas C tidak bernilai satu tergantung atau sebagai fungsi banyaknya kategori (baris atau kolom). Untuk menghitung koefisien kontingensi digunakan rumus : f C   ₂ 2   (6)

3. NILAI MAKSIMUM DARI KOEFISIEN KORELASI

Data yang diuji menggunakan 2belum dapat menghasilkan kesimpulan yang memuaskan maka dari itu perlu dilakukan uji lanjutan [9]. Hal ini karena pengujian menggunakan



2 tidak dapat

menentukan besar atau kecilnya korelasi dari variabel-variabel yang dianalisa. Maka dari itu dilakukan pengujian dengan menggunakan pengembangan dari uji



2 yakni koefisien kontingensi.

Pada pengujian dengan menggunakan koefisien kontingensi, bentuk



2 yang dipakai mengalami modifikasi sehingga dapat disesuaikan dengan metode yang dibahas pada bab ini. Dengan menyederhanakan (5) apabila ditambah dengan f maka diperoleh



    n i n j ij ij e f f 1 1 2 2





   n i n j i j ij f f f f 1 1 . . 2 (7)

(8)

dengan menarik akar dari bentuk (6) maka diperoleh f C   ₂ 2 2   (8)

kemudian subtitusi (7) ke (8) menjadi



      n i n j i j ij n i n j i j ij f f f f f f f f f C 1 1 . . 2 1 1 . . 2 2



    n i n j i j ij f f f 1 1 . . 2 1 1 (9)

Nagres Abbasi [1] mengemukakan cara menentukan batas atas minimum dari bentuk



  n i n j i j ij f f f 1 1 . . 2 (10)

Pada skripsi ini dibahas metode yang dikemukakan Nagres Abbasi untuk menentukan batas atas minimum dari bentuk (10) pada tabel kontingensi berukuran nn.

3.1 Model Sederhana

Dalam penggunaan metode sederhana bisa dilakukan pada tabel kontingensi rcmaupun nn_. Dengan menggunakan metode sederhana akan ditentukan nilai C dari tabel kontingensi berukuran nn, misalkan untuk n2.

Tabel 3.1 Tabel kontingensi berukuran22

B

Variabel

A

Total

1 A A₂ 1 B f₁₁ f₁₂

f

1. 2 B f₂₁ f₂₂

f

2.

Total

f

.1

f

.2 f

(9)

Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi 9 Misalkan 1 . 11 f f a , 2 . 12 f f b , . 1 11 f f p , dan . 2 21 f f q

dari permisalan nilai a, b, p, dan q terlihat bahwa 0a,b,p,q1 Dengan menguraikan bentuk (10)



     2 1 2 1 . . 2 1 1 . . 2 i j i j ij n i n j i j ij f f f f f f



   2 1 2 1 . . i j j ij i ij f f f f



        2 1 .2 2 . 2 1 . 1 . 1 i i i i i i i f f f f f f f f _                2 . 22 . 2 22 1 . 21 . 2 21 2 . 12 . 1 12 1 . 11 . 1 11 f f f f f f f f f f f f f f f f  pa



1p



bq



1a

 

 1b



1q













1  p q a b 1   pa

2

1 1 . . 2





  n i n j i j ij

f

dengan mensubtitusikan nilai yang diperoleh ke bentuk (9) maka



    2 1 2 1 . . 2 2 1 1 i j i j ij f f f C 2 1 2 1 1   2 1  C

(10)

dengan menarik bentuk akar dari C diperoleh dua nilai koefisien kontingensi yakni 2 2  C dan 2 2  

C . Data yang diteliti merupakan data yang berkorelasi positif sehingga

nilai yang diambil adalah nilai

2 2 

C . Diperoleh koefisien kontingensi untuk tabel 3.1

707 .

0 

C

. Nilai korelasi ini dikategorikan kuat karena nilainya berada dalam kategori ke empat pada tabel 2.1



0.6C0.8



.

Untuk tabel kontingensi dengan ukuran tabel rc, (10) diuraikan menjadi



     r i c j j ij i ij r i c j i j ij f f f f f f f 1 1 . . 1 1 . . 2



            r i c ic i ic i i i i i i f f f f f f f f f f f f 1 .2 . . 2 . 2 1 . 1 . 1 _ _                    



  c c c c c c r i c j i j ij f f f f f f f f f f f f f f f f f f f f f f f . 2 . 2 2 . 2 22 . 2 21 . 1 . 1 1 2 . 12 . 1 12 1 . 11 . 1 11 1 1 . . 2             c rc r rc r r r r r r f f f f f f f f f f f f . . 2 . 2 . 2 2 . 1 . 1 _  (11) 3.2 Menggunakan Ekspektasi

Batas atas minimum dari bentuk (10) juga dapat dihitung dengan menggunakan ekspektasi, yang dinyatakan dalam bentuk



     n i n j j ij i ij n i n j i j ij f f f f f f f 1 1 . . 1 1 . . 2

berdasarkan definisi ekspektasi bersyarat 2.4.2 maka dapat dinyatakan



 n j i ij f f 1 . menjadi bentuk ekspektasi i A A B E _ , sehingga





             n i j ij A A B n i n j j ij i ij f f E f f f f i 1 . 1 1 . .

karena fij  f.j maka nilai 1 .  j ij f f

(11)



             n i A A B n i j ij A A B i _f E i f E 1 1 . ) 1

( ,berdasarkan teorema 2.4.3 maka



  n

i 1

1 n

Dengan mensubtitusikan nilai yang diperoleh ke (9), maka untuk setiap tabel kontingensi berukuran nnnilai maksimum koefisien kontingensinya dapat dinyatakan dengan

n n

C  1 (12)

3.3 Model Asosiasi

Nilai minimum dari 2terjadi ketika dua variabel random yang diteliti saling bebas dan nilai maksimum dari 2dari kedua variabel berkorelasi sempurna. Hal ini dapat dilihat apabila nilai korelasinya mendekati satu. Pada kasus ini dua variabel kuantitas terdapat hubungan linier dengan peluang sama dengan satu. Dua variabel random dengan P



Y aXb



1. Tentunya pilihan nilai dari X dan Y harus sama. Model asosiasi ini pada faktor kualitas dinyatakan dengan

n f f_jj  

f jumlah data pada tabel kontingensi 

n ukuran tabel kontingensi dengan syarat i j atau 1 . .  j ij i ij f f f f (13) untuk i j1,2,3,,n apabila diuraikan (13) menjadi

1 . . . 3 . 3 3 . 2 . 2 2 . 1 . 1 1 2 . 12 . 1 12 1 . 11 . 1 11          n nn n nn n n n n n n n n n f f f f f f f f f f f f f f f f f f f f f f f f    (14) untuk i j 0 . .  j ij i ij f f f f (15)

(12)

apabila (15) diuraikan menjadi

0 . . . 3 . 3 3 . 2 . 2 2 . 1 . 1 1 2 . 12 . 1 12 1 . 11 . 1 11          n nn n nn n n n n n n n n n f f f f f f f f f f f f f f f f f f f f f f f f    (16)

Maka nilai maksimum dari (10) dengan menggunakan model asosiasi adalah n. DAFTAR PUSTAKA

[1] Abbasi, Nagres. 2008. On Maximum Value of Correlation Coefficient. Department of

Statistics Payame Noor University. 34, 1655-1658.

[2] Bain, L.J and Engelhardt, Max. 1992. Introduction to Probability and matematical

Statistics. 2nd ed. Duxbury Press. Belmon, California.

[3] Bradlow Thomas, Eric. G.S.Hardie, Bruce & S.fader, Peter. 2002. Bayesian Inference for

the Negative Binomial Distribution via Polynomial Expansion. Journal of Computational

and Graphical Statistics. Vol.11. pp 189-201.

[4] Burhanuddin, Muhammad. 2012. Koefisien Korelasi, Signifikansi, dan Determinasi. 28 Juni 2012.

http://alvinburhani.wordpress.com/2012/06/28/koefisien-korelasi-signifikansi-determinasi/, 17 Desember 2012. Pk.10.30,

[5] Conover, W. J. 1980. Practical Nonparametric Statistic. John Wiley & Sons, New York. [6] Everit, B.S. 1992. The Analysis of Contingency Tables. Chapman & Hall. Second Edition,

London.

[7] Sarah, Mahdia. 2011. Pemodelan Regresi Nonparametrik dengan B-Spline dan Mars. http://repository.usu.ac.id/handle/123456789/29996, 23 Desember 2012. Pk 09.00, [8] Sudjana. 1996. Metoda Statistika. PT Tarsito. Bandung.

[9] Zuliana, S.U. 2009. Metode Statistika Lanjut. 42 hal.

http://images.dedi1968.multiply.multiplycontent.com/attachment/0/SNSPdgoKCEEAAC4 3Iic1/2.Lilliefors%26Tabel%2520Kategorik.pdf?key=dedi1968:journal:70&nmid=116333 237, 18 Juni 2012. Pk. 13.02,