BAB 2 LANDASAN TEORI

(1)

BAB 2

LANDASAN TEORI

Dalam bab 2 ini akan dijelaskan teori-teori yang berhubungan dengan penelitian ini yang dapat dijadikan sebagai landasan teori atau teori pendukung dalam penelitian ini.Landasan teori ini akan mempermudah pembahasan hasil penelitian pada bab 3. Adapun teori – teori tersebut adalah sebagai berikut.

2.1 Analisis Diskiminan

Menurut Johnson dan Wichern (2007), tujuan dari Analisis Diskriminan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam populasi atau kelompok yang diketahui. Dengan kata lain Analisis Diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih.

Suatu fungsi diskriminan layak untuk dibentuk bila terdapat perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena itu sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan nilai rataan dari kelompok-kelompok tersebut.

Dalam pengujian nilai rataan antar kelompok, asumsi yang harus dipenuhi adalah:

5. Variabel independen seharusnya berdistribusi normal multivariat (Multivariate Normality), jika data tidak berdistribusi normal,akan menyebabkan masalah pada ketepatan fungsi (model) diskriminan.

(2)

7. Tidak ada data yang sangat ekstrim (outlier) pada variabel independen, jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan.

8. Tidak ada korelasi yang kuat antar-variabel independen , jika dua variabel independen mempunyai korelasi yang kuat,dikatakan terjadi multikolinieritas, untuk mengetahui adanya multikolinieritas dapat dilakukan dengan melihat korelasi antar variabel independen (r) yaitu jika nilai r > 0.6 menunjukkan adanya multikolinieritas.

2.2 Uji Kenormalan Peubah Ganda

Menurut Johnson dan Wichern (2007), untuk menguji kenormalan peubah ganda (Multivariate Normality) adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan yaitu: ) ( )' ( 1 2 X X S X X d_i = _i− − _i − dimana : 2 i

d adalah nilai jarak kuadrat untuk setiap pengamatan ke- i

i

X adalah pengamatan yang ke-i, dengan i = 1, 2, ..., n −

X adalah rata-rata variabel bebas X

S-1 adalah kebalikan (inverse) matriks varians-kovarians gabungan S .

Kemudian d_i2 diurutkan dari yang paling kecil ke yang paling besar, selanjutnya dibuat plot 2

i

d dimana: i = urutan = 1, 2, ..., n . Bila hasil plot dapat didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda menyebar normal.

Pada artikel Analisis_Faktor & Diskriminan, dikatakan bahwa seringkali kenormalan ganda sulit diperoleh terutama bila sampel yang diambil relatif kecil. Bila hal ini terjadi, uji vektor nilai rataan (uji kesamaan rata-rata kelompok) tetap bisa

(3)

dilakukan selama asumsi kesamaan matriks varians kovarians grup dari semua variabel independen dipenuhi.

2.3 Uji Kesamaan Matriks Varians Kovarians

Untuk menguji kesamaan matriks varians kovarians kelompok I (S1) dan kelompok II

(S2) digunakan hipotesa :

H0 : S1 = S2 ,matriks varians kovarians kelompok adalah relatif sama

H1 : matriks varians kovarians kelompok adalah berbeda secara nyata.

Terima H0 , yang berarti matriks varians kovarians sama jika :

2 ) 1 ( ) 1 ( 2 1 ; 2 + − ≤ p p k hit α χ χ Dengan :       − − − =

∑

= = k i k i i i i hitung C V S S V 1 1 1 2 ln 2 1 ln 2 1 ) 1 ( 2 χ

k = banyaknya kelompok ( grup )

P = jumlah peubah pembeda (Y) dalam fungsi diskriminan = 1

S = matriks varians kovarians dalam kelompok gabungan.

Si = matriks varians kovarians kelompok ke-i.

i = 1,2, ... , k

ni = jumlah responden pada kelompok ke- i

dengan 1 − = _i i n V

∑

= = = _k i i i k i i V S V S 1 1

(4)

      − + − +             − =

∑

= = 6( 1)( 1) 1 3 2 1 1 2 1 1 1 k p p p V V C _k i i k i i

2.4 Uji Vektor Nilai Rataan (Uji Kesamaan Rata-Rata Kelompok )

Menguji apakah semua variabel independen (variabel bebas) berbeda secara nyata berdasarkan variabel dependen.Variabel bebas diuji dengan dua cara :

1. Dengan Uji F

Statistik uji yang digunakan untuk menguji kesamaan rata-rata antar kelompok adalah statistik F dengan hipotesa :

H0 : µ1 =µ2 =...=µk ,berarti rata-rata antar kelompok sama ( tidak ada perbedaan ) H1 : µ1 ≠µ2 ≠...≠µk ( sedikitnya ada dua rataan yang berbeda )

berarti ada perbedaan rata-rata antar kelompok.

α = Taraf nyata

Daerah kritis : tolak H0 , jika Fhit > Ftabel

Ftabel = Fα (db1; db2 )

db1 = k-1

db2 = (n-k ) = (n1-1)+(n2-1)

Apabila Fhit > F tabel ,maka tolak H0 , ini berarti bahwa terdapat perbedaan

vektor nilai rataan antar kelompok. Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka fungsi diskriminan layak disusun untuk mengelompokkan suatu objek .

(5)

Keputusan atas dasar Signifikansi uji F pada output SPSS dilihat angka Sig.

a. Jika Sig. > 0.05 maka H0 diterima berarti tidak ada perbedaan yang signifikan

antar grup ( rata - rata antar kelompok sama ).

b. Jika Sig. ≤ 0.05 maka H1 diterima , berarti ada perbedaan yang signifikan antar

grup .

2. Dengan angka Wilks’ Lambda

Angka Wilks’ Lambda berkisar 0 sampai 1 , yaitu :

a. Jika angka Wilks’ Lambda mendekati 0 , maka data tiap kelompok cenderung berbeda.

b. Jika angka Wilks’ Lambda mendekati 1 , maka data tiap kelompok cenderung sama (tidak berbeda ).

Wilk’s Lambda B W W + = Dimana :

W = Jumlah Kuadrat Galat ( JK dalam kelompok ) B = Jumlah Kuadrat Antar kelompok

Analisis varians ( uji F ) dan angka Wilk’s Lambda adalah untuk menguji rata-rata dari setiap variabel.

2.5 Fungsi Analisis Diskriminan

Fungsi diskriminan menentukan kedalam kelompok mana suatu objek (melalui karakteristiknya berupa data pengamatan) seharusnya dimasukkan atau dikategorikan, maka setidak-tidaknya ada dua kelompok (grup), oleh karena itu dapat ditinjau bagaimana fungsi diskriminan ini diperoleh apabila berhadapan dengan dua grup . Sebelumnya akan dijelaskan terlebih dahulu pengertian matriks varians kovarians.

(6)

Pada data pengamatan ke-i yang berukuran n ( i=1,2,... n ) yang terdiri atas j buah variat (variabel) yaitu X1, X2, ... , Xj . Data pengamatan tersebut dapat disajikan

dalam bentuk matriks berikut.

Tabel 2.5.1 Matriks Data Pengamatan

Variabel X1 X2 . . . Xj Data Pengamatan X11 X12 . . . X1j X21 X22 . . . X2j . . . . . . . . . Xn1 Xn2 . . . Xnj

Untuk variabel Xj yang dihitung adalah variansnya, diberi lambang Sjj , dengan

rumus : ) 1 ( ) ( 1 1 2 2 − − =

∑

= = n n X X n S n n n n nj nj jj

Semuanya ada j buah varians, yaitu S11 ,S22 , ... , Sjj yang masing-masing merupakan

varians untuk variabel X1, X2, ... , Xj . Untuk variabel Xi dan Xj dimana i ≠ j terdapat

kovarians, diberi lambang Sij yang dapat dihitung dengan rumus berikut.

) 1 ( ) )( ( . 1 1 1 − − =

∑

= = = n n X X X X n S n n n n nj ni n n nj ni ij

Semuanya ada ( j2 - j ) buah kovarians. Perlu dijelaskan bahwa untuk i = j maka Sij = Sji diberi lambang menjadi Sjj .

Varians dan kovarians ini disusun dalam sebuah matriks ,disebut dengan nama matriks varians-kovarians dengan lambang S , bentuknya sebagai berikut.

(7)

S           = 1 21 11 . . . j S S S 2 22 12 . . . j S S S . . . . . . . . . . . . . . . . . . jj j j S S S . . . 2 1          

Misalkan ada dua grup yang banyak variabelnya masing-masing j buah ,yaitu X11, X12, ... , X1j dalam grup I dan X21,X22, ... ,X2j dalam grup II . Perhatikan bahwa

Xij menyatakan variabel ke j dalam grup ke i , dengan i = grup I dan grup II. Variabel

dalam setiap grup dapat pula dituliskan dalam bentuk vektor kolom sebagai berikut.

                    = j X X X X 1 12 11 1 . . . dan                     = j X X X X 2 22 21 2 . . . j

X₁ menyatakan variabel X ke j dalam grup ke 1

j

X₂ menyatakan variabel X ke j dalam grupke 2

Dari setiap grup berukuran n1 dari grup ke-1 dan berukuran n2 dari grup ke-2 . Data

pengamatan akan berbentuk matriks yang bentuknya seperti berikut.

Tabel 2.5.2 Matriks Data Pengamatan dari Grup I

Variabel X11 X12 . . . X1j Data Pengamatan X111 X121 . . . X1j1 X112 X122 . . . X1j2 . . . . . . . . . X11n₁ X12n₁ . . . X1jn₁ Rata-rata − X 11 − X 12 . . . − X 1j

(8)

Tabel 2.5.3 Matriks Data Pengamatan dari Grup II Variabel X21 X22 . . . X2j Data Pengamatan X211 X221 . . . X2j1 X212 X222 . . . X2j2 . . . . . . . . . X21n₂ X22n₂ . . . X2jn₂ Rata-rata − X 21 − X 22 . . . − X 2j

Hasil pengamatan ini akan menghasilkan rata-rata untuk tiap variabel yang dalam bentuk vektor bisa ditulis :

                      = − − − − j X X X X 1 12 11 1 . . . _dan                       = − − − − j X X X X 2 22 21 2 . . . dimana :

X1jn menyatakan variabel X ke j dalam grup ke 1 yang berukuran n₁ 1

X2jn₂ menyatakan variabel X ke j dalam grup ke 2 yang berukuran n2

j X1

−

menyatakan rata-rata variabel ke j dalam grup ke 1

j X1

−

menyatakan rata-rata variabel ke j dalam grup ke 2

Dari masing-masing rata-rata dari grup I dan rata-rata dari grup II , selanjutnya akan dihitung varians dan kovariansnya. Varians kovarians tersebut disusun dalam matriks S1 dan S2 ,masing-masing dari grup ke-1 dan dari grup ke-2 , yaitu :

(9)

S1           = 1 21 11 . . . j S S S 2 22 12 . . . j S S S . . . . . . . . . . . . . . . . . . jj j j S S S . . . 2 1           dan S2           = 1 21 11 . . . j S S S 2 22 12 . . . j S S S . . . . . . . . . . . . . . . . . . jj j j S S S . . . 2 1          

dimana : S1 = matriks varians kovarians dari grup ke-1

S2 = matriks varians kovarians dari grup ke-2

Meskipun dalam S1 dan S2 digunakan Sij yang sama namun jelas besarnya

berlainan antara Sij dalam S1 dan Sij dalam S2 , kedua datanya juga berlainan , yaitu S1

diambil dari grup I dan S2 dari grup II .

Kedua buah matriks kovarians ini bisa dihitung matriks varians-kovarians gabungan , diberi lambang S dengan rumus :

2 ) 1 ( ) 1 ( 2 1 2 2 1 1 − + − + − = n n S n S n S

Matriks varians-kovarians gabungan ini mempunyai invers, yaitu S-1 .

Dengan adanya vektor rata-rata 1

−

X dan 2

−

X dan juga matriks varians-kovarians gabungan S bersama dengan persyaratan bahwa data variabel independen seharusnya berdistribusi normal multivariat ( bervariabel banyak ) disingkat multinormal, dan matriks varians-kovarians kedua grup relatif sama , maka rumus fungsi diskriminan untuk ini adalah :

Y = ' 2 1 ) ( − − − X X S-1 X

X adalah vektor pengamatan, yaitu X =

                    X X X . . . 2 1

(10)

Fungsi diskriminan ini dapat digunakan untuk membuat aturan klasifikasi yang kita cari berdasarkan salah satu dari kedua aturan dibawah ini :

ATURAN I : Jika Y > 2 1 ' 2 1 ) ( − − − X X S-1 ( 1 ₂) − − + X

X klasifikasi objek dengan data pengamatan X

dimasukkan ke dalam grup I .

Jika Y < 2 1 ' 2 1 ) ( − − − X X S-1 ( 1 ₂) − − + X

X suatu objek diklasifikasikan kedalam grup II .

ATURAN II :

Dengan menggunakan statistik W (Wald – Anderson) yaitu :

W = X' S-1 ( 1 ₂) − − − X X - 2 1 ' 2 1 ) ( − − − X X S-1 ( 1 ₂) − − + X X

Untuk memperoleh klasifikasi ini , jika W > 0 maka objek dengan pengamatan X dimasukkan kedalam grup I sedangkan dalam hal lainnya objek itu dimasukkan kedalam grup II .

2.6 Ketepatan Pengelompokan Fungsi Diskriminan

Tingkat akurasi pengelompokkan sangat menentukan baik atau tidaknya suatu pengelompokkan. Persentase ketepatan pengelompokan dapat dihitung dari matriks klasifikasi yang menunjukkan nilai sebenarnya (actual members) dan nilai prediksi (prediction members) dari setiap kelompok.

Hasil pengelompokan menurut fungsi diskriminan tidak selalu sama dengan pengelompokan awal. Besarnya kesalahan pengelompokan, dengan menganggap pengelompokan awal adalah benar, merupakan indikator tingkat akurasi dari fungsi diskriminan yang dihasilkan. Tabel berikut menunjukkan evaluasi tingkat akurasi

terhadap fungsi diskriminan dengan memperhatikan persentase ketepatan

(11)

Tabel 2.6.1 Evaluasi Terhadap Fungsi Diskriminan Pengelompokan Menurut

Fungsi Diskriminan Pengelompokan

Awal Kelompok I Kelompok II

Jumlah Kelompok I 11 n n₁₂ n₁_. Kelompok II 21 n n₂₂ n ₂_. Jumlah 1 . n n_.₂ n

Rumus persentase ketepatan pengelompokan = n

n

n )

( ₁₁+ ₂₂