• Tidak ada hasil yang ditemukan

∑( ̅ ̅) ( ̅ ̅) ̅ ̅ dengan ;

3. Mengklasifikasikan observasi baru berdasarkan persamaan diskriminan linier Fisher, alokasikan x ke kelompok j jika

̂ ̅ [ ̂ ( ̅)] ∑ [ ̂ ̅̅̅ ]

4. Menghitung nilai APER untuk semua data simulasi.

5. Membandingkan hasil kesalahan klasifikasi dari kedua metode, yaitu ADV dan ADF menggunakan APER untuk masing-masing metode.

2. Penerapan data kasus untuk metode ADV dengan tahapan analisis:

1. Membagi data kemiskinan menjadi dua, yaitu data training dan data testing dengan persentase masing-masing 70% dan 30%. Data training digunakan untuk membentuk fungsi diskriminan dan data testing digunakan untuk evaluasi kesalahan pengklasifikasian.

2. Melakukan proses pembentukan fungsi diskriminan dengan metode ADV seperti diagram alir tahapan metode ADV

3. Mengklasifikasikan objek berdasarkan fungsi diskriminan 4. Menghitung kesalahan klasifikasi berdasarkan nilai APER

HASIL DAN PEMBAHASAN

Pada bab ini dibahas mengenai kajian simulasi dan kajian terapan. Lang dan Wu (2008) menjelaskan bahwa metode ADV dapat mengklasifikasikan objek pada saat pangkat dari matriks data X lebih kecil dari banyak peubah p. Kondisi ini biasanya terjadi jika banyak objek n kecil dari peubah p. Pada kondisi ini metode ADF tidak dapat mengklasifikasikan objek karena matriks ragam peragamnya bersifat singular, sehingga tidak memiliki matriks kebalikan. Karena tujuan dari peneltian ini adalah membandingkan kinerja antara metode ADV dan ADF, maka data simulasi dibangkitkan pada saat pangkat dari matriks data X lebih besar dari banyak peubah p. Evaluasi dilakukan dengan cara melihat nilai APER. Metode yang menghasilkan nilai APER yang paling kecil adalah metode yang paling baik dalam pengklasifikasian.

11

Kajian Simulasi

Pada kajian simulasi ada 8 kelompok skenario simulasi. Masing-masing kelompok skenario simulasi terdiri dari 5 simulasi. Masing-masing simulasi dianalisis dengan metode ADV dan ADF dengan 100 kali ulangan. Metode ADV dan ADF menghasilkan 100 nilai APER. Selajutnya nilai APER masing-masing metode dirata-ratakan dan dibandingkan untuk melihat kinerja dari metode ADV dan ADF. Gambaran data hasil bangkitan untuk semua simulasi dengan banyak kelompok 3 dapat dilihat pada Tabel 3 dan banyak kelompok 8 tersaji pada Lampiran 14.

Tabel 3 Deskripsi data simulasi untuk banyak kelompok 3

Simu lasi

Nilai Tengah Setiap Kelompok Untuk Masing-Masing Peubah

Kelompok 1 Kelompok 2 Kelompok 3

x1 x2 x3 x1 x2 x3 x1 x2 x3 1 11.250 12.680 14.008 14.264 12.687 11.199 12.486 11.149 14.164 2 11.529 12.846 13.971 14.509 12.786 11.248 12.331 11.178 14.553 3 11.697 12.956 13.962 14.670 12.877 11.326 12.277 11.234 14.728 4 11.828 13.042 13.955 14.797 12.948 11.388 12.235 11.278 14.866 5 11.515 13.015 13.964 14.496 12.926 11.311 12.335 11.264 14.695 6 11.300 12.782 14.191 14.354 12.795 11.302 12.618 11.142 14.238 7 11.534 13.002 14.339 14.630 13.025 11.538 12.710 11.252 14.423 8 11.703 13.161 14.447 14.830 13.191 11.708 12.776 11.332 14.557 9 11.836 13.286 14.531 14.986 13.322 11.842 12.829 11.395 14.662 10 11.508 13.194 14.397 14.609 13.228 11.651 12.749 11.409 14.577 11 5.298 10.195 49.984 10.286 50.161 40.139 39.905 5.100 30.311 12 5.529 10.346 49.971 10.509 50.286 40.248 39.831 5.177 30.553 13 5.697 10.456 49.962 10.670 50.377 40.326 39.777 5.234 30.728 14 5.828 10.542 49.955 10.797 50.448 40.388 39.735 5.278 30.866 15 5.515 10.515 49.964 10.496 50.426 40.311 39.835 5.264 30.695 16 5.300 10.282 50.191 10.354 50.295 40.302 40.118 5.142 30.238 17 5.534 10.502 50.339 10.630 50.525 40.538 40.210 5.252 30.423 18 5.703 10.661 50.447 10.830 50.691 40.708 40.276 5.332 30.557 19 5.836 10.786 50.531 10.986 50.822 40.842 40.329 5.395 30.662 20 5.508 10.694 50.397 10.609 50.728 40.651 40.249 5.409 30.577

Berdasarkan deskripsi data simulasi pada Tabel 3 terlihat bahwa untuk kelompok skenario1,2,3,4 nilai tengah setiap kelompok mendekati nilai tengah masing-masing kelompok pada skenario simulasi yang dibentuk. Hal ini menunjukan bahwa simulasi yang dibentuk sudah sesuai.

Kelompok Skenario 1

Pada kelompok skenario 1 data dibangkitkan secara acak mengukuti normal ganda, banyak objek 50 untuk masing-masing kelompok dan banyak kelompok (k+1=3). banyak peubah bebas (p=3), µ untuk masing-masing kelompok berdekatan (µ1=(11,12.5,14) µ2=(14,12.5,11) µ3=(12.5,11,14)) dan

12

tidak ada korelasi antar peubah. Hasil analisis data untuk kelompok skenario 1 tersaji pada Gambar 2.

(1) S2=(1,1,1) (2) S2

=(√ √ √ )

(3) S2=(√ √ √ ) (4) S2

=(√ √ √ )

(5) S2=(√ √ √ )

Gambar 2 Nilai APER antara metode ADF dan metode ADV dengan berbagai nilai S2 pada kelompok skenario1

Gambar 2 memperlihatkan bahwa pada simulasi (1) dari 100 kali ulangan 63% nilai APER untuk metode ADF lebih kecil dari metode ADV, 28% nilai APER untuk metode ADV lebih kecil dari ADF, dan 9% memiliki kemampuan yang sama dalam pengklasifikasian. Rata-rata nilai APER untuk metode ADV 0.13 dan ADF 0.12. Simulasi (2) memperlihatkan bahwa sebanyak 24% nilai APER dari 100 kali ulangan metode ADV lebih kecil dalam pengklasifikasian dari ADF, 62% nilai APER metode ADF lebih kecil dari ADV, dan 14% memiliki kemampuan klasifikasi yang sama. Rata-rata nilai APER untuk metode ADV 0.30 dan ADF 0.29. Simulasi (3) menunjukan bahwa sebanyak 32% dari 100 kali ulangan nilai APER metode ADV lebih kecil dalam pengklasifikasian dari ADF, 61% ADF lebih kecil dari ADV, dan 7% memiliki kemampuan klasifikasi yang sama. Rata-rata nilai APER untuk metode ADV 0.37 dan ADF 0.36. Simulasi (4)

13 menunjukan bahwa sebanyak 35% dari 100 kali ulangan nilai APER metode ADV lebih kecil dalam pengklasifikasian dari ADF, 55% ADF lebih kecil dari ADV, dan 10% memiliki kemampuan klasifikasi yang sama. Rata-rata nilai APER untuk metode ADV 0.39 dan ADF 0.39. Begitu juga pada simulasi (5) S2=(3,7,5) dengan ulangan 100 kali, perbandingan nilai APER metode ADV 21% lebih kecil dari ADF, 73% nilai APER dengan metode ADF lebih kecil dari ADV, dan 6% memiliki kemampuan klasifikasi yang sama. Rata-rata nilai APER utnuk metode ADV 0.40 dan ADF 0.40. Dari kelima simulasi rata-rata kesalahan klasifikasi dari kedua metode hampir sama, sehingga dapat disimpulkan bahwa jika asumsi kenormalan dipenuhi dan peubah X tidak berkorelasi, maka metode ADF dan ADV memiliki kemampuan klasifikasi yang sama. Semakin besar ragam data nilai APER juga semakin besar. Nilai APER dari metode ADF dan metode ADV dengan berbagai nilai S2 dengan 100 kali ulangan pada kelompok skenario 2,3,4,5,6,7,dan 8 tersaji dalam bentuk gambar pada Lampiran 2,3,4,5,dan 6. Gambaran rata-rata hasil analisis data dari kedelapan kelompok skenario simulasi secara umum tersaji pada Tabel 4, Tabel 5, Tabel 6, dan gambaran rata-rata hasil analisis data dari kedelapan kelompok skenario untuk masing-masing simulasi secara lengkap tersaji pada Lampiran 7.

Tabel 4 Gambaran rata-rata APER dari semua rata-rata simulasi berdasarkan hubungan korelasi antar peubah

Hubungan Antar Peubah

Rata-rata dari rata-rata nilai APER untuk ADV

Rata-rata dari rata-rata nilai APER untuk ADF

Ada Korelasi 0.32 0.21

Tidal Ada Korelasi 0.35 0.30

Tabel 4 menunjukan rata-rata APER metode ADF (0.21) lebih kecil dari ADV (0.32) pada saat peubah berkorelasi. Jika peubah tidak ada korelasi rata-rata nilai APER kedua metode sama. Hal ini berarti metode ADF dan ADV memiliki kemampuan sama dalam klasifikasi.

Jika dilihat dari rata-rata APER untuk masing-masing skenario simulasi yang terdapat pada Lampiran 7. Pada saat peubah berkorelasi ADV dan ADF memiliki kemampuan klasifikasi yang sama jika nilai tengah berdekatan. Jika nilai tengah berjauhan maka ada 2 kemungkinan yaitu kedua metode dapat mengklasifikasikan dengan sempurna untuk banyak kelompok 3 dan metode ADF lebih baik dari ADV dalam pengklasifikasian untuk banyak kelompok 8.

Tabel 5 Gambaran rata-rata APER dari semua rata-rata simulasi berdasarkan jarak nilai tengah antar kelompok

Jarak nilai tengah antar kelompok

Rata-rata dari rata-rata nilai APER untuk ADV

Rata-rata dari rata-rata nilai APER untuk ADF

Dekat 0.53 0.47

14

Jarak nilai tengah antar kelompok mempengaruhi nilai kesalahan klasifikasi dari metode ADV dan ADF. Berdasarkan jarak nilai tengah antar kelompok dari kedelapan kelompok skenario simulasi disimpulkan metode ADF lebih baik dari ADV jika jarak nilai tengah antar kelompok berjauhan. Hal ini ditunjukan pada Tabel 5 bahwa rata-rata APER metode ADF (0.04) dan ADV (0.14). Rata-rata APER metode ADF (0.47) dan ADV (0.53) pada saat nilai tengah antar kelompok berdekatan. Oleh karena itu dapat disimpulkan pada saat nilai tengah antara kelompok dekat metode ADV dan ADF memiliki kemampuan klasifikasi yang sama. Lampiran 7 menunjukkan untuk masing-masing skenario jika jarak nilai tengah berjauhan maka ada terdapat 2 kesimpulan yang dapat kita ambil yaitu untuk banyak kelompok ada 3 maka ADV dan ADF dapat mengklasifikasikan objek dengan sempurna tanpa ada salah klasifikasi. Tetapi untuk banyak kelompok 8 ADF lebih baik dari ADV dalam pengklasifikasian.

Tabel 6 Gambaran rata-rata APER dari semua rata-rata simulasi berdasarkan keragaman data

Keragaman data Rata-rata dari rata-rata nilai APER untuk ADV

Rata-rata dari rata-rata nilai APER untuk ADF

1,1,1 0.26 0.18

10,10,10 0.39 0.24

30,30,30 0.33 0.27

60,60,60 0.35 0.30

3,7,5 0.33 0.27

Berdasarkan keragaman data kedelapan kelompok skenario simulasi memperlihatkan pola yaitu semakin besar nilai keragaman maka kesalahan klasifikasi juga akan meningkat. Tetapi kesalahan klasifikasi pada metode ADV dan ADF tidak jauh berbeda dalam pengklasifikasian. Oleh karena itu dapat disimpulkan bahwa metode ADV dan ADF mempunyai kemampuan yang sama dalam pengklasifikasian.

Dari rata-rata untuk masing-masing skenario simulasi yang terdapat pada Lampiran 7 dapat disimpulkan bahwa pada saat nilai tengah berdekatan untuk semua nilai ragam yang telah dicobakan ADV dan ADF memiliki kemampuan klasifikasi yang sama. Jika nilai tengah antara kelompok berjauhan ada 2 simpulan yang dapat kita ambil yaitu ADV dan ADF dapat mengklasifikasikan objek dengan sempurna untuk banyak kelompok 3 dan ADF lebih baik dari ADV dalam mengklasifikasikan objek untuk banyak kelompok 8.

Perbandingan persentase nilai APER antara metode ADV dan ADF dalam melakukan pengklasifikasian dari 100 kali ulangan data simulasi dapat dilihat pada Lampiran 15.

Pembentukan Model Diskriminan pada Kasus Terapan

Subbab ini membahas tentang penerapan metode ADV dan metode ADF pada pengklasifikasian Kabupaten/kota di Pulau Sumatera berdasarkan tingkat kemiskinan. Data persentase penduduk per-kabupaten/kota berdasarkan indikator

15 kesejahteraan masyarakat di Pulau Sumatera tersebut dapat dilihat pada Lampiran 8 dengan penentuan kelompok awal dari masing-masing kabupaten/kota dilakukan berdasarkan sebaran data. Gambar 3 menyajikan histogram dengan kurva normal dari tingkat kemiskinan kabupaten/kota di Pulau Sumatera.

Gambar 3 Histogram dan kurva normal data tingkat kemiskinan kabupaten/kota di Pulau Sumatera

Berdasarkan Gambar 3 peneliti akan membagi data menjadi 3 kelompok, dimana kelompok 1 adalah kabupaten/kota dengan tingkat kemiskinan kurang dari 7.5% adalah sebanyak 24 kabupaten/kota, kelompok 2 adalah kabupaten/kota dengan tingkat kemiskinan berkisar 7.5% sampai dengan 22.5% adalah sebanyak 112 kabupaten/kota dan kelompok 3 adalah kabupaten/kota dengan tingkat kemiskinan lebih dari 22.5% adalah sebanyak 15 kabupaten/kota. Secara lengkap tersaji pada Lampiran 8. Selain itu, Gambar 3 juga menjelaskan rata-rata tingkat kemiskinan kabupaten/kota di Sumatera adalah 13.85 dan standar deviasi 6.5.

Deskripsi data persentase per kabupaten/Kota berdasarkan indikator kesejahteraan masyarakat di Pulau Sumatera untuk masing-masing peubah pada setiap kelompok dapat dilihat pada Tabel 7.

Tabel 7 menjelaskan bahwa rata-rata peubah X1 untuk kelompok 1 pada data persentase penduduk per kabupaten/kota di Pulau Sumatera adalah 7.86 dengan standar deviasi sebesar 3.76, sampai dengan rata-rata dan standar deviasi peubah X19 untuk kelompok 3. Deskripsi data tingkat kemiskinan kabupaten/kota untuk masing-masing kelompok tersaji pada Tabel 8.

Tabel 8 menjelaskan bahwa rata-rata tingkat kemiskinan kabupaten/kota pada kelompok 1 berkisar 5.89, kelompok 2 dengan rata-rata 13.74, dan kelompok 3 berkisar 27.32.

16

Tabel 7 Deskripsi data persentase penduduk per-kabupaten/kota di Pulau Sumatera untuk masing-masing peubah pada setiap kelompok

Kelompok 1 Kelompok 2 Kelompok 3

Peubah Rata-rata Standar

deviasi Rata-rata Standar deviasi Rata-rata Standar deviasi X1 7.86 3.76 6.42 3.23 5.50 3.56 X2 64.80 5.09 68.73 7.57 67.54 7.54 X3 3.79 2.24 4.76 2.60 5.71 2.46 X4 28.21 12.72 37.32 12.13 44.88 9.29 X5 50.79 14.37 65.03 15.89 69.39 11.69 X6 17.48 4.98 20.51 6.80 25.55 7.24 X7 29.27 5.37 34.07 7.18 35.78 7.59 X8 83.98 15.46 81.16 14.08 80.36 12.83 X9 33.61 7.62 32.90 7.71 32.53 5.23 X10 18.63 4.73 18.92 5.31 20.41 3.75 X11 5.37 0.69 5.56 0.86 5.27 0.55 X12 66.29 8.62 72.70 8.91 74.57 8.14 X13 2.15 1.64 2.33 1.43 1.55 1.19 X14 92.34 4.77 94.91 2.82 95.86 2.82 X15 65.45 8.36 70.38 8.41 75.13 5.24 X16 54.82 14.14 50.54 12.42 60.13 8.23 X17 56.62 17.60 46.59 19.73 40.15 10.12 X18 16.80 12.14 28.10 18.99 33.76 16.64 X19 69.56 2.60 68.78 1.84 68.27 1.90

Tabel 8 Deskripsi data tingkat kemiskinan kabupaten/kota untuk masing-masing kelompok

Kelompok N Rata-rata Standar Deviasi Maksimal Minimal

1 24 5.897 1.249 7.33 2.47

2 112 13.742 3.849 21.68 7.60

3 15 27.324 5.497 42.46 22.62

Total 151

Kasus Terapan untuk Matriks X Berpangkat Penuh

Data terapan untuk matriks X berpangkat penuh diambil dari data kabupaten/kota untuk seluruh provinsi yang ada di Pulau Sumatera yang terdiri dari 151 kabupaten/kota. Data ini digunakan untuk pembentukan model diskriminan verteks dan diskriminan Fisher. Tahap pertama pembentukan model diskriminan adalah membagi data persentase penduduk per-kabupaten/kota berdasarkan indikator kesejahteraan masyarakat di Pulau Sumatera menjadi 2 data yaitu data training sebanyak 106 kabupaten/kota dan data testing sebanyak 45

17 kabupaten/kota. Data training digunakan untuk pembentukan fungsi diskriminan dan data testing digunakan untuk mengevaluasi model diskriminan.

Pembentukan Model Diskriminan Verteks

Metode ADV membentuk fungsi diskriminan dengan bentuk dan hasil analisis dapat dilihat pada Lampiran 9. ADV membentuk 2 fungsi diskriminan untuk membedakan 3 kelompok berdasarkan banyak objek 106 kabupaten/kota, banyak kelompok 3, dan besar lamda 0.009434. Dugaan koefisien yang dibentuk oleh ADV disajikan pada Lampiran 10 .

Berdasarkan dugaan koefisien pada Lampiran 10 didapatkan bentuk fungsi diskriminan pertama (Y1) dan fungsi diskriminan kedua (Y2) sebagai berikut: Y1= 0.094 + 0.109X1 + 0.073X2 - 0.036X3 + 0.018X4 - 0.073X5 - 0.015X6 - 0.021X7 - 0.043X8 – 0.031X9 + 0.027X10 + 0.049X11 - 0.053X12 + 0.015X13 – 0.008X14 - 0.115X15 + 0.009X16 - 0.004X17 - 0.061X18 - 0.026X19 Y2= -0.165 - 0.028X1 - 0.024X2 -0.029X3 + 0.027X4 - 0.002X5 + 0.009X6– 0.039X7 - 0.017X8 + 0.00007X9 + 0.013X10 + 0.004X11 - 0.035X12 -0.017X13 -0.006X14 - 0.043X15 + 0.021X16 + 0.009X17 - 0.041X18 - 0.028X19

Kebaikan model diskriminan untuk metode ADV dapat dilihat dari ketepatan klasifikasi masing-masing kelompok yang dapat dilihat pada Tabel 9. Tabel 9 Kebaikan model diskriminan untuk metode ADV untuk 106 data

training pada kasus matriks X berpangkat penuh

Klasifikasi Model

Kelompok 1 2 3 Banyak objek

Klasifikasi Sebenarnya

1 11 7 0 18

2 2 78 0 80

3 0 4 4 8

Banyak objek 13 89 4 106

Tabel 9 memperlihatkan bahwa banyak objek yang diklasifikasikan secara tepat oleh kedua model diskriminan untuk metode ADV adalah sebanyak 93 objek (88%), dan banyak objek yang salah klasifikasi sebanyak 13 objek (12%). Nilai persentase probabilita pengelompokan awal sebesar 17%. Evaluasi tingkat akurasi fungsi diskriminan dilakukan dengan memperhatikan persentase tepat pengklasifikasian dan probabilita pengelompokan awal. Model diskriminan dikatakan cukup baik karena persen tepat klasifikasi (88%) besar dari (1.25 kali persen probabilita pengelompokan awal) yaitu sebesar 21.2 %. Dari Lampiran 9 terlihat bahwa kesalahan klasifikasi (nilai APER) metode ADV sebesar 0.1226415. Hal ini menunjukan bahwa metode ADV memiliki kemampuan dalam mengklasifikasian objek dengan tepat pada kasus data training sebesar 0.877359.

Hubungan antara klasifikasi model dengan klasifikasi sebenarnya pada ADV dapat dilihat dari banyak pasangan konkordan 1320 dan diskordan 14, dengan nilai gamma 0.98. FDA memiliki pasangan konkordan dan diskordan sebanyak 1186, 24 dengan nilai gamma 0.96. Hal ini menunjukan bahwa

18

klasifikasi model dan klasifikasi sebenarnya untuk kedua metode memiliki korelasi yang kuat.

Setelah fungsi diskriminan terbentuk, selanjutnya dilakukan evaluasi pada metode ADV menggunakan 45 data testing dengan melihat besar kesalahan klasifikasi (nilai APER). Misalkan untuk objek pertama data testing (Kepulauan Mentawai) dengan klasifikasi awal adalah kelompok 2. Nilai untuk masing-masing peubah dan nilai standarisasi tersaji pada Tabel 10.

Tabel 10 Nilai peubah untuk objek pertama data testing (Kepulauan Mentawai)

Peubah Data Data yang dibakukan

X1 4.03 -0.7406 X2 74.21 0.7678 X3 2.81 -0.8151 X4 58.09 1.5555 X5 92.07 1.6070 X6 19.75 -0.0311 X7 35.00 0.0850 X8 44.50 -2.6026 X9 27.84 -0.6153 X10 21.46 0.4459 X11 4.35 -1.3929 X12 76.88 0.5630 X13 1.80 -0.2693 X14 87.92 -2.3020 X15 58.20 -1.3050 X16 45.37 -0.4802 X17 4.30 -2.1987 X18 75.00 2.6255 X19 68.45 -0.1243

Nilai masing-masing peubah disubtitusi ke dalam fungsi diskriminan pertama dan fungsi diskriminan kedua pada model diskriminan ADV untuk kasus n>p sehingga diperoleh nilai Y1=0.065385 dan Y2= -0.13688. Nilai titik simpul untuk 3 kelompok, jarak antara objek dengan titik simpul, dan dugaan klasifikasi dengan menggunakan persamaan (10) tersaji pada Tabel 11.

Tabel 11 Titik simpul, jarak antara objek dan titik simpul, dan dugaan klasifikasi

Kelompok ‖ ̂ ̂‖ 1 0.707 1.050287 0.707 2 0.258 0.850226 -0.965 3 -0.965 1.103459 0.258

19 Berdasarkan nilai jarak terkecil antara objek dan titik simpul pada Tabel 11 dari ketiga kelompok, Kepulauan Mentawai diklasifikasikan ke dalam kelompok 2. Hasil analisis klasifikasi untuk 45 data testing secara lengkap dapat disajikan pada Lampiran 11. Hasil klasifikasi metode ADV untuk semua data testing dapat dilihat pada Tabel 12.

Tabel 12 Hasil klasifikasi model diskriminan ADV untuk 45 data testing pada kasus matriks X berpangkat penuh

Klasifikasi Model Kelompok 1 2 3 Banyak objek Klasifikasi Sebenarnya 1 2 4 0 6 2 4 27 1 32 3 0 5 2 7 Banyak objek 6 36 3 45

Tabel 12 menjelaskan bahwa banyak objek yang diklasifikasikan secara tepat untuk kedua model diskriminan pada data testing adalah sebanyak 31 objek (68.9%) dan banyak objek yang salah klasifikasi sebanyak 14 objek (31.1%). Nilai persentase probabilita pengelompokan awal sebesar 13.3%. Karena persen tepat klasifikasi (68.9%) besar dari (1.25 kali persen peluang pengelompokan awal) yaitu sebesar 16.7 % dapat disimpulkan model diskriminan cukup baik dalam membedakan kelompok. Besar kesalahan klasifikasi yang dihasilkan metode ADV pada data testing berkisar 31.1%.

Pembentukan Model Diskriminan Fisher

Pembentukan model diskriminan dengan menggunakan metode ADF juga dilakukan pada data terapan (data persentase penduduk per-kabupaten/kota berdasarkan indikator kesejahteraan masyarakat di Pulau Sumatera). Pembentukan model diskriminan menggunakan data training sebanyak 106 kabupaten/kota, dan data testing sebanyak 45 kabupaten/kota digunakan untuk mengevaluasi model diskriminan.

Metode ADF membentuk fungsi diskriminan dengan bentuk dan hasil analisis dapat dilihat pada Lampiran 12. ADF membentuk 2 fungsi diskriminan untuk membedakan 3 kelompok berdasarkan banyak objek 106 kabupaten/kota, banyak kelompok 3. Berdasarkan dugaan koefisien pada Lampiran 12 didapatkan bentuk fungsi diskriminan pertama (Y1) dan fungsi diskriminan kedua (Y2) sebagai berikut: Y1 = 0.001X1 - 0.218X2 + 0.379X3 - 0.281X4 + 0.629X5 + 0.122X6 + 0.644X7 + 0.358X8 + 0.106X9 - 0.157X10 + 0.006X11 + 0.629X12 + 0.155X13 + 0.361X14 + 0.520X15 - 0.201X16 - 0.018X17 + 0.209X18 + 0.759X19 Y2 = -0.819 X1 - 0.897 X2 - 0.475X3 + 0.664X4- 0.186X5 + 0.357X6 +0.609X7 – 0.071X8 + 0.373X9 - 0.258X10 - 0.341X11 - 0.277X12 + 0.162X13 + 0.101X14 + 0.164 X15 + 0.547X16 - 0.099X17 + 0.103X18 - 0.317X19

Kebaikan model diskriminan untuk metode ADF dapat dilihat dari ketepatan klasifikasi masing-masing kelompok yang dapat dilihat pada Tabel 13.

20

Tabel 13 Kebaikan model diskriminan untuk metode ADF untuk 106 data training pada kasus matriks X berpangkat penuh

Klasifikasi Model Kelompok 1 2 3 Banyak objek Klasifikasi Sebenarnya 1 10 8 0 18 2 3 75 2 80 3 0 4 4 8 Banyak objek 13 87 6 106

Tabel 13 menunjukan bahwa banyak objek yang diklasifikasikan secara tepat oleh model diskriminan untuk metode ADF adalah sebanyak 89 objek (84%), dan banyak objek yang salah klasifikasi sebanyak 17 objek (16%). Nilai persentase probabilita pengelompokan awal sebesar (16.98%). Karena persen tepat klasifikasi (84%) besar dari (1.25 kali persen peluang pengelompokan awal) yaitu sebesar 20% dapat disimpulkan model diskriminan cukup baik.

Setelah fungsi diskriminan terbentuk, selanjutnya dilakukan evaluasi pada metode ADF menggunakan 45 data testing dengan melihat besar kesalahan klasifikasi (nilai APER). Misalkan untuk objek pertama data testing (Kepulauan Mentawai) dengan klasifikasi awal adalah kelompok 2. Nilai untuk masing-masing peubah distandarisasi, nilai ini tersaji pada Tabel 10.

Nilai masing-masing peubah disubtitusi ke dalam fungsi diskriminan pertama dan fungsi diskriminan kedua pada model diskriminan ADF untuk kasus pangkat matriks data X lebih besar dari banyak peubah p, sehingga diperoleh nilai nilai Y1=-1.53667 dan Y2= 0.910714. Pengklasifikasian berdasarkan persamaan diskriminan linier Fisher untuk Kepulauan Mentawai diklasifikasikan ke dalam kelompok 1. Hasil klasifikasi metode ADF untuk semua data testing dapat dilihat pada Tabel 14.

Tabel 14 Hasil klasifikasi model diskriminan Fisher untuk 45 data testing pada kasus matriks X berpangkat penuh

Klasifikasi Model Kelompok 1 2 3 Banyak objek Klasifikasi Sebenarnya 1 4 9 1 14 2 1 12 0 13 3 1 11 6 18 Banyak objek 6 32 7 45

Tabel 14 menjelaskan bahwa banyak objek yang diklasifikasikan secara tepat untuk model diskriminan pada data testing adalah sebanyak 22 objek (48.89%), dan banyak objek yang salah klasifikasi sebanyak 23 objek (51.1%). Nilai persentase probabilita pengelompokan awal sebesar (31.1%). Karena persen tepat klasifikasi (48.49%) besar dari (1.25 kali persen probabilita pengelompokan

21 awal) yaitu sebesar 38.89% dapat disimpulkan model diskriminan cukup baik. Nilai APER metode ADF menunjukan angka 48.9 %. Hal ini berarti untuk data testing model diskriminan memiliki kemampuan dalam mengklasifikasian objek dengan tepat sebesar 51.1%.

Kasus Terapan untuk Matriks X Berpangkat Tidak Penuh

Data terapan untuk kasus matriks X berpangkat tidak penuh diambil dari data kabupaten/kota yang ada di Provinsi Riau yang terdiri dari 12 kabupaten/kota. Data yang digunakan adalah data persentase penduduk per-kabupaten/kota berdasarkan indikator kesejahteraan masyarakat di Provinsi Riau yang tersaji pada Lampiran 16.

Metode ADF memiliki keterbatasan pada saat matriks X berpangkat tidak penuh, sehingga dalam penerapan data ini metode ADF tidak dapat dilakukan. Metode ADV dapat mengatasi keterbatasan dari metode ADF tersebut. Metode ADV membentuk 2 fungsi diskriminan untuk membedakan 3 kelompok yaitu fungsi diskriminan pertama (Y1) dan fungsi diskriminan kedua (Y2). Hasil analisis metode ADV tersaji pada Lampiran 13. Bentuk fungsi diskriminan ADV untuk membedakan 3 kelompok sebagai berikut:

Y1 = 0.026 0.023X1 - 0.011X2 - 0.006X3 -0.017X4 - 0.014X5 + 0.013X6 - 0.019X7 + 0.011X8 + 0.014 X9 + 0.008X10 + 0.009X11 0.015X12 -0.001X13 + 0.034X14 + 0.012X15 0.006 X16 + 0.005X17 - 0.001X18 + 0.0189X19 Y2 = -0.098 - 0.003X1 + 0.021X2 - 0.003X3 -0.008X4 - 0.017X5 - 0.018X6 - 0.008X7 + 0.0037X8 + 0.015X9 + 0.003X10 - 0.023X11 -0.018X12 + 0.0007X13 - 0.045X14 + 0.012X15 0.008X16 + 0.010X17 - 0.011X18 + 0.008X19

Kebaikan model diskriminan untuk metode ADV dapat dilihat dari ketepatan klasifikasi masing-masing kelompok yang tersaji pada Tabel 15.

Tabel 15 Kebaikan model diskriminan ADV untuk 12 data training pada kasus matriks X berpangkat tidak penuh

Klasifikasi Model Kelompok 1 2 3 Banyak Klasifikasi sebenarnya 1 3 0 0 3 2 0 8 0 8 3 0 0 1 1 Banyak 3 8 1 12

Tabel 15 menjelaskan bahwa banyak objek yang diklasifikasikan secara tepat untuk kedua model diskriminan pada data testing adalah sebanyak 12 objek (100%) dan tidak ada objek yang salah klasifikasi. Lampiran 13 juga menjelaskan metode ADV dapat mengklasifikasi objek dengan tepat tanpa ada kesalahan klasifikasi. Hal ini terlihat dari nilai APER untuk data provinsi Riau adalah 0%.

22

Dokumen terkait