HASIL DAN PEMBAHASAN - Perbandingan Vertex Discriminant Analysis (Vda) Dan Quadratic Discrimina

Kajian Simulasi

Pada kajian simulasi ada empat kelompok skenario. Masing-masing kelompok skenario simulasi dianalisis menggunakan metode QDA dan VDA untuk masing-masing data training dan data testing dengan 100 kali ulangan. sehingga masing-masingnya menghasilkan 100 ketepatan klasifikasi. Perbandingan rataan ketepatan klasifikasi antara metode QDA dan VDA pada data training dan data testing disajikan pada Tabel 2 dan boxplot ketepatan klasifikasi pada data training dan data testing disajikan pada Gambar 2 berikut.

Tabel 2 Perbandingan rataan ketepatan klasifikasi antara VDA dan QDA Skenario

simulasi ^Keragaman

Rataan Ketepatan Klasifikasi QDA data training VDA data training QDA data testing VDA data testing 1 sama 82.2% 79.5% 73.4% 75.4% 2 kecil 99.9% 99.3% 99.1% 98.3% 3 sedang 99.6% 98.8% 98.0% 98.4% 4 besar 91.5% 81.8% 85.8% 79.0%

12 k e te p a ta n k la si fi k a si keragaman metode besar sedang kecil sama VDA QDA VDA QDA VDA QDA VDA QDA 1,0 0,9 0,8 0,7 0,6 k e te p a ta n k la si fi k a si keragaman metode besar sedang kecil sama VDA QDA VDA QDA VDA QDA VDA QDA 1,0 0,9 0,8 0,7 0,6 0,5 0,4

Gambar 2 Boxplot ketepatan klasifikasi data simulasi

Berdasarkan rataan ketepatan klasifikasi pada data training persentase ketepatan klasifikasi QDA lebih besar daripada VDA, meskipun pada keragaman kecil dan sedang selisih persentase rataan klasifikasinya relatif kecil. Hal ini dapat dilihat juga pada boxplotnya di Gambar 2a. Perbedaan yang signifikan terlihat pada keragaman besar, yaitu QDA relatif jauh lebih baik daripada VDA, artinya pada analisis diskriminan non-linier QDA bekerja lebih baik dalam pengklasifikasian dibandingkan VDA. Namun, untuk kondisi keragaman lainnya VDA hampir sama baiknya dengan QDA. Pada data testing perbedaan ketepatan klasifikasi tidak terlihat perbedaan secara signifikan antara ketepatan klasifikasi QDA dan VDA untuk semua jenis keragaman.

Bila dibandingkan antara empat skenario keragaman, QDA dan VDA sangat baik dalam mengklasifikasikan pada keragaman kecil dan sedang, hampir tidak ada kesalahan klasifikasi. Sedangkan pada keragaman sama dan besar relatif lebih beragam dan ketepatan klasifikasinya tidak sebaik pada keragaman kecil dan sedang.

Gambar 3 Perbandingan persentase kebaikan klasifikasi antara QDA dan VDA dari 100 kali ulangan data simulasi

Gambar 3 menyajikan perbandingan persentase kebaikan klasifikasi antara QDA dan VDA berdasarkan ketepatan klasifikasi pada setiap ulangan data simulasi, karena pada setiap ulangan kadang ketepatan klasifikasi VDA lebih

0% 20% 40% 60% 80% 100%

sama kecil sedang besar

24%

2% ^4% _0%

56%

29% ^34%

97%

VDA lebih baik QDA lebih baik

0% 10% 20% 30% 40% 50% 60%

sama kecil sedang besar

36% 6% 14% 9% 24% 15% 9% 59%

VDA lebih baik QDA lebih baik

a) data training b) data testing

13 baik, kadang sebaliknya. atau bisa terjadi ketepatan klasifikasi VDA dan QDA sama. Setiap data simulasi dibandingkan ketepatan klasifikasinya, jika ketepatan klasifikasi VDA lebih besar dibandingkan QDA maka “VDA lebih baik”, begitu juga sebaliknya. Berdasarkan Gambar 3a, pada data training persentase QDA lebih baik daripada VDA untuk semua keragaman, terlihat dari garis “QDA lebih baik” selalu di atas garis “VDA lebih baik”. Pada keragaman besar 97% QDA lebih baik dibandingkan VDA, hal ini sesuai dengan bahasan sebelumnya berdasarkan Gambar 2a. Berdasarkan Gambar 3b, pada keragaman sama dan sedang persentase VDA lebih baik daripada QDA. Seperti halnya pada data

training, untuk keragaman besar persentase kebaikan QDA terhadap VDA lebih besar secara signifikan. Sehingga dapat disimpulkan untuk n > p metode QDA lebih baik dibandingkan VDA terutama pada keragaman besar (analisis diskriminan non-linier), namun ketepatan klasifikasi VDA masih cukup baik, sehingga masih dapat dipakai sebagai analisis pilihan. Jika kondisi data dengan jumlah peubah lebih banyak dibandingkan jumalh obseravasi p > n. VDA merupakan pilihan mutlak, karena pada QDA matriks ragam-peragamnya akan bersifat singular sehingga tidak memiliki invers. Berdasarkan perbandingan antara tabel 2 dengan gambar 3 dapat disimpulkan bahwa rataan ketepatan klasifikasi mirip dengan persentase kebaikan klasifikasi tiap ulangan.

Kajian Kasus Terapan Deskripsi Data

Pulau Sumatera terdiri dari 10 provinsi dan 151 kabupaten/kota. Data tingkat kemiskinan kabupaten di Sumatera berkisar antara 2.47% (Kota Sawahlunto) sampai dengan 42.56% (Kepulauan Meranti), dengan rataan 13.9% dan simpangan baku 6.5%. Tingkat kemiskinan provinsi berkisar antara 6.51% (Bangka Belitung) sampai dengan 20.98% (Aceh), dengan rataan 12.61% dan simpangan baku 5.31%. Semakin kecil tingkat kemiskinan maka semakin sejahtera kehidupan masyarakat di daerah tersebut.

Tingkat Kemiskinan F re k u e n s i 37,5 30,0 22,5 15,0 7,5 0,0 35 30 25 20 15 10 5 0 Mean 13,90 StDev 6,511 N 151

Pada penelitian ini, tingkat kemiskinan merupakan peubah yang dijadikan kelas diskriminasi, sehingga tingkat kemiskinan tersebut dikelompokkan menjadi tiga kelas dengan pertimbangan sebaran datanya. Sebaran data tingkat kemiskinan kabupaten dapat dilihat pada Gambar 4. Tiga kelas tersebut adalah:

kelas 1 (kaya) : tingkat kemiskinan kurang dari 10%.

kelas 2 (menengah) : tingkat kemiskinan 10% sampai dengan 15%. kelas 3 (miskin) : tingkat kemiskinan lebih dari 15%.

Penamaan kelas “kaya”, “menengah”, dan “miskin” dibuat oleh penulis hanya untuk memudahkan interpretasi. Daftar kabupaten/kota di Sumatera dengan klasifikasi berdasarkan tiga kelas di atas dapat dilihat pada Lampiran 1.

Berdasarkan tiga kelas diskriminasi yang ditentukan, ada 41 kabupaten/kota termasuk ke dalam tingkat kemiskinan kelas 1, 55 kabupaten/kota di kelas 2, dan 55 kabupaten/kota di kelas 3. Jumlah kabupaten/kota pada setiap kelas tersebut dan peubah-peubah yang menonjol pada masing-masing kelas disajikan pada Tabel 3. Lampiran 3 menyajikan rataan masing-masing peubah di setiap kelas pada data kabupaten/kota.

Tabel 3 Jumlah kabupaten/kota setiap kelas dan karakteristik peubah masing-masing kelas

Kelas Jumlah

kabupaten/kota

Peubah yang menonjol kelas 1 (kaya) 41 X1, X2, X5, X6, X13, X14, X18

kelas 2 (menengah) 55 X6, X11, X17, X19

kelas 3 (miskin) 55 X3, X4, X8, X9, X12, X19

Pada kelas kaya, peubah yang menonjol atau mencirikan adalah persentase balita kekurangan gizi (X5) dan angka kematian bayi per1000 kelahiran hidup (X6) yang sangat rendah dibandingkan kabupaten/kota di kelas lainnya; persentase penduduk tanpa akses pada fasilitas sarana kesehatan (X13) dan penduduk tanpa akses pada air bersih (X14) yang juga jauh lebih rendah dibandingkan kelas lainnya; pekerja yang bekerja selama kurang dari 14 jam seminggu (X2) yang juga sangat sedikit; tetapi tingkat pengangguran terbuka (X1) dan angka putus sekolah usia 7-15 tahun (X18) sangat tinggi. Kelas menengah dicirikan oleh peubah angka kematian bayi per1000 kelahiran hidup (X6) yang tertinggi dibandingkan kelas lainnya dan angka tersebut hampir sama dengan kabupaten/kota di kelas miskin; persentase rata-rata lama sakit (X11) yang tinggi; angka partisipasi pendidikan SMA (X17) yang paling rendah dibandingkan kelas lainnya; tetapi angka melek huruf (X19) di kelas ini merupakan yang tertinggi dibandingkan kelas lainnya. Sementara itu pada kelas miskin, peubah yang menonjol adalah persentase yang besar untuk jumlah pekerja di sektor informal (X3) yaitu rata-rata 67.47%; pengeluaran perkapita (X4) yang rendah; persentase kelahiran ditolong oleh tenaga medis (X8) yang kecil, rata-rata hanya 78.95%; persentase penduduk dengan keluhan kesehatan (X9) terbesar dibandingkan kelas lainnya, persentase penduduk yang melakukan pengobatan sendiri (X12) besar, dan angka melek huruf (X19) yang terkecil dibandingkan kabupaten/kota di kelas lainnya.

15 Jika mengikuti pengelompokan tingkat kemiskinan seperti data kabupaten/kota, maka untuk data provinsi ada lima provinsi di dalam kelas kaya, yaitu Sumatera Barat, Riau, Jambi, Bangka Belitung, dan Kepualauan Riau; hanya ada satu provinsi di kelas menengah, yaitu Sumatera Utara; dan empat provinsi di kelas miskin, yaitu Aceh, Sumatera Selatan, Bengkulu, dan Lampung. Tersaji pada Tabel 4 jumlah provinsi pada masing-masing kelas dan peubah yang menjadi karakteristiknya. Nilai rataan peubah-peubah di setiap kelas pada data provinsi dapat dilihat pada Lampiran 4.

Tabel 4 Jumlah provinsi setiap kelas dan karakteristik masing-masing kelas Kelas Jumlah provinsi Peubah yang menonjol

kelas 1 (kaya) 5 X3, X6, X13

kelas 2 (menengah) 1 X1, X5, X8, X9, X17, X18, X19

kelas 3 (miskin) 4 X4, X12, X14, X15

Peubah yang menonjol pada kelas kaya adalah persentase pekerja di sektor informal (X3) yang rendah, yaitu rata-rata 51.08%. Lalu peubah angka kematian bayi (X6) yang paling rendah dibandingkan kelas lainnya, yaitu rata-rata 28,8 jiwa per1000 kelahiran hidup. Peubah ketiga yang menjadi karaktistik kelas kaya adalah penduduk tanpa akses pada fasilitas sarana kesehatan (X13) yang rendah, yaitu hanya 9,82%.

Pada kelas menengah, peubah yang menonjol mecerminkan karakteristik dari provinsi Sumatera Utara, karena hanya ada satu provinsi pada kelas tersebut. Ada beberapa peubah yang menarik, yaitu tingkat pengangguran (X1) yang tertinggi dibandingkan kelas lainnya; dan persentase balita kekurangan gizi (X5) yang juga tinggi, bahkan lebih tinggi daripada rata-rata di kelas miskin. Namun, kesadaran terhadap pentingnya kesehatan pada masyarakat relatif tinggi, ditandai dengan persentase kelahiran ditolong oleh tenaga medis (X8) yang tinggi (88.68%), dan penduduk dengan keluhan kesehatan (X9) yang paling rendah dibandingkan kelas lainnya, yaitu 29.11%. Selain itu, pendidikan masyarakat juga relatif baik, ditandai dengan angka melek huruf (X19) yang sangat tinggi (97.32%), angka putus sekolah usia 7-15 tahun (X18) yang sangat rendah (1.6%), dan angka partisipasi pendidikan SMA (X17) yang cukup tinggi dibandingkan kelas lainnya (55.3%).

Kelas miskin dicirikan oleh empat peubah. Pengeluaran per kapita (X4) yang paling rendah dibandingkan kelas lainnya, yaitu rata-rata Rp 621,990. Penduduk yang melakukan pengobatan sendiri (X12) sangat tinggi, rata-rata 72.28%. Persentase penduduk tanpa akses pada air bersih (X14) masih cukup tinggi (54.17%). Angka partisipasi pendidikan SD (X15) paling tinggi dibandingkan kelas lainnya. Peubah-peubah tersebut mencerminkan bahwa pada kelas miskin kesadaran terhadap kesehatan masih rendah, sanitasi masih rendah, demikian juga tingkat pendidikan masyarakatnya.

Dalam analisis diskriminan dibutuhkan data training dan data testing

dengan proporsi 20% data testing. Sehingga ada 30 kabupaten/kota pada data

testing pada data kabupaten/kota, dan ada 2, 4, dan 5 provinsi pada data provinsi karena dilakukan variasi persentase data testing. Pemilihan data testing dilakukan secara acak. Data training digunakan untuk membentuk fungsi diskriminan,

sedangkan data testing berguna untuk menguji ketepatan fungsi diskriminan bila akan menentukan kelas pada data baru.

Hasil Uji Box’s

Seperti telah dijelaskan pada bab tinjauan pustaka, uji Box’s digunakan untuk menguji kehomogenan matriks ragam-peragam antarkelas pada analisis diskriminan. Jika semua kelas mempunyai matriks ragam-peragam yang homogen, maka analisis diskriminan tersebut linier. Tetapi, jika ada kelas yang matriks ragam-peragamnya tidak homogen, lebih cocok menggunakan analisis diskriminan non-linier.

Hasil uji Box’s terhadap data kabupaten/kota menunjukkan bahwa = 0.000 lebih kecil dari �= 0.05, dapat disimpulkan bahwa matriks ragam-peragam yang berbeda, sehingga data ini lebih cocok jika menggunakan analisis diskriminan non-linier. Pada penelitian ini akan digunakan QDA dan VDA. Tetapi, karena menurut Wu & Wu (2012) VDA lebih ditujukan untuk analisis diskriminan linier, maka dibandingkan juga dengan VDA bila data dimodifikasi dengan penambahan komponen kuadratik di dalamnya.

Hasil Analisis Diskriminan Kuadratik (QDA)

Data kemiskinan kabupaten/kota dianalisis dengan QDA dengan bantuan program R. Pada analisis QDA tidak ditampilkan fungsi diskriminannya, tetapi langsung menghitung hasil prediksi kelas pada data training. Sehingga dapat dihitung ketepatan klasifikasi data training yaitu 91.74%, dengan rincian ketepatan klasifikasinya dapat dilihat pada Tabel 5 berikut.

Tabel 5 Ketepatan klasifikasi pada data training kabupaten/kota

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 28 3 1

2 0 44 2

3 0 4 39

Tabel 6 Ketepatan klasifikasi QDA pada data testing kabupaten/kota

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 1 8 0

2 1 8 0

3 0 5 7

Setelah itu prediksi terhadap data testing juga dapat dilakukan, sehingga dapat dihitung ketepatan klasifikasi pada data testing sebesar 53.3%. Rincian kesalahan klasifikasinya disajikan pada Tabel 6. Ketepatan klasifikasi QDA untuk data testing lebih kecil dibandingkan pada data training.

Data kemiskinan provinsi di Sumatera tidak mungkin dianalisa dengan

QDA. karena jumlah peubah jauh lebih besar dibandingkan jumlah provinsi (� ). Hal ini akan mengakibatkan matriks ragam-peragam non-singular,

17 sehingga tidak dapat dilakukan proses analisis diskriminan kuadratik lebih lanjut. Tetapi hal ini dapat diatasi oleh VDA, karena pada VDA besaran kategorik ditransformasi ke besaran empirik.

VDA pada Data Kabupaten

VDA dapat digunakan pada data dengan > � maupun <�. Sehingga pada penelitian ini dapat digunakan untuk menganalisis data kabupaten/kota dan juga data provinsi. Sebagai pembanding, data kabupaten/kota dianalisis dengan metode VDA menggunakan program R. Pada keluaran program R dihasilkan dugaan koefisien (estimated coefficients), sehingga dapat dibentuk fungsi diskriminan vertex Ax_i-b sebagai berikut:

1=−0.016 ₁−0.032 ₂−0.077 ₃+ 0.081 ₄+ 0.198 ₅+ 0.025 ₆−0.066 ₇ −0.049 ₈−0.068 ₉+ 0.027 ₁₀+ 0.046 ₁₁−0.003 ₁₂ −0.061 ₁₃−0.040 ₁₄−0.028 ₁₅−0.008 ₁₆ −0.075 ₁₇ −0.060 ₁₈−0.083 ₁₉+ 0.130 2=−0.075 ₁+ 0.005 ₂−0.025 ₄−0.022 ₅−0.008 ₆−0.024 ₇ + 0.009 ₈−0.003 ₉−0.009 ₁₀+ 0.038 ₁₁−0.013 ₁₂ −0.022 ₁₃+ 0.003 ₁₄+ 0.008 ₁₅−0.010 ₁₆ −0.054 ₁₇ + 0.036 ₁₈+ 0.022 ₁₉− 0.063

Hasil prediksi kelas setiap kabupaten/kota juga sudah ditampilkan pada keluaran, sehingga dapat dibandingkan dengan kelas sebenarnya untuk menghitung ketepatan klasifikasi pada data training, karena kebaikan model diskriminan dapat dilihat dari ketepatan klasifikasi masing-masing kelas. Semakin besar jumlah klasifikasi yang sama antara kelas prediksi dengan kelas sebenarnya atau semakin kecil persentase kesalahan klasifikasi, maka model diskriminan tersebut semakin baik. Ketepatan klasifikasi VDA pada data training sebesar 74.4%, dengan rinciannya pada tabel 7 berikut.

Tabel 7 Ketepatan klasifikasi VDA pada data training kabupaten/kota

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 20 8 4

2 3 39 4

3 3 9 31

Berdasarkan fungsi diskriminan yang dihasilkan VDA, selanjutnya dapat dilakukan prediksi klasifikasi untuk data testing. Kemudian dapat dibandingkan dengan klasifikasi sebenarnya untuk menghitung besarnya ketepatan klasifikasi. Pada Tabel 8 dapat dilihat rincian ketepatan klasifikasi setiap kelas pada data

testing, sehingga dapat dihitung besar ketepatan klasifikasi 0.6667 atau 66.67%. Tabel 8 Ketepatan klasifikasi VDA pada data testing kabupaten/kota

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 5 3 1

2 2 5 2

VDA pada Data Kabupaten dengan Penambahan Komponen Kuadratik

Pada proses analisis diskriminan kuadratik (QDA) terjadi pembentukan komponen kuadratik, sedangkan pada VDA tidak. Agar pembandingan lebih adil, maka dilakukan penambahan komponen kuadratik pada data yang akan dianalisa dengan VDA. Komponen kuadratik merupakan kuadrat dari peubah X1 sampai dengan X19 yang sebelumnya distandarisasi, sehingga pada data ini ada 38 peubah.

Berdasarkan dugaan koefisien (estimated coefficients), fungsi diskriminan vertex yang terbentuk sebagai berikut:

1=−0.032 ₁−0.020 ₂−0.110 ₃+ 0.164 ₄+ 0.069 ₅+ 0.073 ₆−0.048 ₇ −0.020 ₈−0.012 ₉−0.061 ₁₀+ 0.005 ₁₁+ 0.045 ₁₂−0.124 ₁₃ −0.127 ₁₄+ 0.152 ₁₅−0.019 ₁₆−0.008 ₁₇+ 0.003 ₁₈ −0.146 ₁₉+ 0.053 ₂₀−0.002 ₂₁+ 0.074 ₂₂ −0.111 ₂₃ + 0.110 ₂₄−0.076 ₂₅+ 0.003 ₂₆−0.015 ₂₇−0.051 ₂₈ + 0.064 ₂₉+ 0.026 ₃₀−0.024 ₃₁+ 0.093 ₃₂+ 0.104 ₃₃ −0.190 ₃₄+ 0.014 ₃₅−0.020 ₃₆−0.055 ₃₇+ 0.081 ₃₈+ 0.033 2=−0.066 ₁+ 0.003 ₂+ 0.133 ₃+ 0.029 ₄−0.011 ₅−0.113 ₆−0.063 ₇ −0.007 ₈+ 0.081 ₉−0.040 ₁₀−0.001 ₁₁−0.120 ₁₂−0.134 ₁₃ −0.077 ₁₄+ 0.168 ₁₅−0.051 ₁₆−0.029 ₁₇+ 0.034 ₁₈ −0.119 ₁₉−0.033 ₂₀−0.011 ₂₁−0.128 ₂₂−0.091 ₂₃ + 0.026 ₂₄+ 0.097 ₂₅+ 0.060 ₂₆+ 0.023 ₂₇−0.123 ₂₈ + 0.043 ₂₉−0.0143 ₃₀+ 0.095 ₃₁+ 0.123 ₃₂+ 0.078 ₃₃ −0.169 ₃₄+ 0.052 ₃₅+ 0.006 ₃₆+ 0.019 ₃₇+ 0.196 ₃₈− 0.022

Ketepatan klasifikasi VDA pada data training sebesar 81%. lebih besar dibandingkan VDA tanpa penambahan komponen kuadratik. Rincian ketepatan klasifikasi tersebut disajikan pada Tabel 9 berikut.

Tabel 9 Ketepatan klasifikasi VDA pada data training kabupaten/kota dengan penambahan komponen kuadratik

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 23 6 3

2 3 41 2

3 3 6 34

Tabel 10 Ketepatan klasifikasi VDA pada data testing kabupaten/kota dengan penambahan komponen kuadratik

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 2 6 1

2 1 6 2

3 0 2 10

Prediksi klasifikasi untuk data testing dapat dihitung berdasarkan fungsi diskriminan vertex yang sudah terbentuk. Kemudian dibandingkan dengan klasifikasi sebenarnya untuk masing-masing kabupaten/kota. Rincian perbandingan klasifikasi sebenarnya dengan prediksi tersebut disajikan pada

19 Tabel 10, sehingga dapat dihitung ketepatan klasifikasi, yaitu sebesar 60%. Lebih kecil dibandingkan ketepatan klasifikasi data testing tanpa penambahan komponen kuadratik.

VDA pada Data Provinsi

Salah satu kelebihan VDA dibandingkan QDA adalah mampu melakukan analisis pada kondisi data dengan � , seperti pada data kemiskinan provinsi di Sumatera, jumlah peubah (19 peubah) lebih banyak daripada jumlah provinsi (10 provinsi). Data provinsi tersebut dibagi menjadi dua, yaitu data training dan data

testing. Pemilihan data testing dilakukan secara acak. Pada data provinsi ini dicobakan beberapa pilihan persentase data testing, yaitu 20%, 40%, dan 50%, Perbedaan jumlah provinsi pada data training dan data testing mengakibatkan perbedaan fungsi diskriminannya.

Tabel 11 Ketepatan klasifikasi VDA pada data testing provinsi 20%

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 - - 1

2 - - -

3 - - 1

Tabel 12 Ketepatan klasifikasi VDA pada data testing provinsi 40%

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 - 1 1

2 - - -

3 - 1 1

Tabel 13 Ketepatan klasifikasi VDA pada data testing provinsi 50%

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 - 1 1

2 - - -

3 - 1 2

Ketepatan klasifikasi data training untuk ketiga persentase data testing

adalah 100%, artinya tidak ada kesalahan klasifikasi sama sekali. Tetapi ketepatan klasifikasi pada data testing beragam untuk masing-masing proporsi data testing. Secara berurutan proporsi data testing 20%, 40%, dan 50% ketepatan klasifikasinya adalah 50%, 25%, dan 40%. Ketepatan klasifikasi terbesar adalah analisis yang terbaik. Pada kasus ini proporsi data testing 20% adalah yang terbaik. Sehingga ada indikasi bahwa semakin banyak jumlah data training

dibandingkan data testingnya, maka ketepatan klasifikasinya akan semakin besar. Rincian ketepatan klasifikasi data testing VDA dapat dilihat pada Tabel 11, 12, dan 13.

Pada pemilihan data testing 20% (Tabel 11), provinsi yang terpilih sebagai data testing adalah Sumatera Barat dari kelas 1 dan Sumatera Selatan dari kelas 3. Pada pemilihan data testing 40% (Tabel 12), provinsi yang terpilih adalah Riau dan Jambi dari kelas 1 serta Aceh dan Sumatera Selatan dari kelas 3. Selanjutnya pada pemilihan data testing 50% (Tabel 13), provinsi yang terpilih adalah Sumatera Barat dan Jambi dari kelas 1 serta Aceh, Sumatera Selatan, dan Bengkulu dari kelas 3.

Ketepatan klasifikasi data training tersebut relatif kecil. Ada indikasi VDA baik pada klasifikasi data training tetapi kurang baik pada klasifikasi data testing. Hal ini disebabkan jumlah data training yang sedikit sehingga model yang dihasilkan kurang baik. Sebagai perbandingan dilakukan justifikasi dengan melihat jarak antar-propinsi, jarak yang digunakan adalah jarak Euclid. Tabel jarak antar-propinsi pada Lampiran 5a.

Provinsi yang tergolong kelas 1 (kaya) adalah Sumatera Barat, Riau, Jambi, Bangka Belitung, dan Kepulauan Riau. Kelas 2 (menengah) hanya Sumatera Utara saja yang menjadi anggotanya. Provinsi yang tergolong kelas 3 (miskin) adalah Aceh, Sumatera Selatan, Bengkulu, dan Lampung. Berdasarkan jarak antar-provinsi pada Lampiran 5a, jarak terdekat adalah antara Lampung dan Bengkulu yang memang berada pada kelas yang sama. Namun, Sumatera Barat dan Sumatera Utara memiliki jarak yang dekat juga, padahal berada pada kelas yang berbeda. Ada indikasi bahwa kedekatan jarak ini yang menyebabkan kesalahan klasifikasi Sumatera Barat digolongkan ke kelas 2 pada data testing

50% di Tabel 13. Begitu juga kedekatan jarak antara Jambi (kelas 1) dengan Bengkulu dan Lampung dari kelas 3. Kedekatan jarak tersebut menyebabkan kesalahan klasifikasi Jambi digolongkan ke kelas 3 pada pemilihan data testing

40% (Tabel 12) dan 50% (Tabel 13). Provinsi Aceh dari kelas 3 memiliki jarak terdekat dengan Sumatera Utara dari kelas 2, sedangkan cukup jauh jaraknya dengan provinsi-provinsi di kelas 3. Sehingga pada klasifikasi data testing 40% (Tabel 12) dan data testing 50% (Tabel 13), Aceh diklasifikasikan ke kelas 2. Demikian halnya dengan Riau (kelas 1) diklasifikasikan ke kelas 2 pada pemilihan data testing 40% (Tabel 12) karena memiliki jarak terdekat dengan Sumatera Utara yang tergolong ke kelas 2. Dengan demikian dapat disimpulkan bahwa ada indikasi kesalahan klasifikasi pada data testing VDA disebabkan karena dari awal pengelompokan provinsi ke dalam kelas berdasarkan tingkat kemiskinan tidak mencerminkan kedekatan karakteristik peubah antar-provinsi dalam kelas yang sama.

VDA pada Data Provinsi dengan Penambahan Komponen Kuadratik

Seperti yang dilakukan pada data kabupaten/kota, pada data provinsi juga dilakukan penambahan komponen kuadratik, sehingga jumlah peubah menjadi 38. Penambahan peubah ini menyebabkan perbedaan dan � semakin jauh ( �). Data testing juga dicobakan untuk proporsi 20%, 40%, dan 50%. Provinsi-provinsi yang terpilih sebagai data testing sama dengan pemilihan pada VDA tanpa penambahan komponen kuadratik.

Ketepatan klasifikasi data training untuk ketiga persentase data testing

adalah 100%, artinya tidak ada kesalahan klasifikasi sama sekali. Tetapi ketepatan klasifikasi pada data testing beragam untuk masing-masing proporsi data testing, yaitu untuk 20%, 40%, dan 50% masing-masing ketepatan klasifikasinya adalah

21 50%, 25%, dan 20%. Ketepatan klasifikasi terbesar adalah analisis yang terbaik. Pada kasus ini proporsi data testing 20% juga yang terbaik. Sehingga ada indikasi bahwa semakin banyak jumlah data training dibandingkan data testingnya, maka ketepatan klasifikasi akan semakin besar. Rincian ketepatan klasifikasi data

testing VDA dapat dilihat pada Tabel 14,15, dan 16.

Tabel 14 Ketepatan klasifikasi VDA pada data testing provinsi 20% dengan penambahan komponen kuadratik

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 - - 1

2 - - -

3 - - 1

Tabel 15 Ketepatan klasifikasi VDA pada data testing provinsi 40% dengan penambahan komponen kuadratik

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 - 1 1

2 - - -

3 - 1 1

Tabel 16 Ketepatan klasifikasi VDA pada data testing provinsi 50% dengan penambahan komponen kuadratik

Kelas sebenarnya ^{Kelas prediksi}

1 2 3

1 - 1 1

2 - - -

3 - 2 1

Perbandingan dengan jarak antar-observasi juga dilakukan seperti pada data provinsi tanpa penambahan komponen kuadratik. Tabel jarak antar-provinsi pada data dengan penambahan komponen kuadratik dapat dilihat pada Lampiran 5b. Berdasarkan tabel jarak tersebut, klasifikasi berdasarkan jarak antar-propinsi mirip dengan klasifikasi kelas prediksi VDA. Perbedaan dengan hasil VDA tanpa komponen kuadratik hanya pada hasil klasifikasi data testing 50%, yaitu jarak terdekat Sumatera Selatan (kelas 3) dengan Sumatera Utara (kelas 2) menyebabkan Sumatera Selatan digolongkan ke kelas 2. Sebelumnya pada VDA tanpa komponen kuadratik, Sumatera Selatan digolongkan ke kelas 3.

Perbandingan Ketepatan Klasifikasi antara QDA dan VDA

Ketepatan klasifikasi pada analisis diskriminan merupakan indikator untuk melihat kebaikan metode analisis yang digunakan. Perbandingan ketiga analisis yang digunakan pada kajian kasus ini disajikan pada Tabel 17 dan 18. Tabel 17 adalah perbandingan ketepatan klasifikasi untuk data kabupaten/kota, sedangkan Tabel 18 menyajikan perbandingan ketepatan klasifikasi pada data provinsi.

Berdasarkan Tabel 17, untuk data training QDA adalah yang terbaik dibandingkan dengan VDA, karena memiliki ketepatan klasifikasi terbesar. Tetapi pada data testing QDA memiliki ketepatan klasifikasi terkecil, yang terbesar adalah VDA tanpa penambahan komponen kuadratik.

Berdasarkan Tabel 18, untuk data training tidak ada kesalahan klasifikasi sama sekali untuk kedua metode analisis VDA, tetapi VDA tanpa penambahan komponen kuadratik lebih baik dibandingkan VDA dengan penambahan komponen kuadratik. Pada proporsi data testing 50% ada perbedaan ketepatan klasifikasi, yaitu 60% untuk VDA dan 80% untuk VDA dengan penambahan komponen kuadratik. Hal ini sesuai dengan hasil kajian simulasi yang menyatakan bahwa QDA lebih baik pada keragaman antarkelas besar atau matriks ragam-peragam tidak homogen.

Tabel 17 Perbandingan ketepatan klasifikasi antara QDA, VDA, dan VDA dengan penambahan komponen kuadratik pada data kabupaten/kota

Jenis data QDA VDA

VDA dengan komponen

kuadratik Data training 91.74% 74.38% 80.99%

Data testing 53.33% 66.67% 60.00% Tabel 18 Perbandingan ketepatan klasifikasi antara QDA, VDA, dan VDA

dengan penambahan komponen kuadratik pada data provinsi

Jenis data QDA

VDA ^{VDA dengan komponen}

kuadratik Persentase data testing

20% 40% 50% 20% 40% 50%

Data

training ^- ^100% ^100% ^100% ^100% ^100% ^100%

Data

testing ^- ^50% ^25% ^40% ^50% ^25% ^20%

Dalam dokumen Perbandingan Vertex Discriminant Analysis (Vda) Dan Quadratic Discriminant Analysis (Qda) (Studi Kasus Pengklasifikasian Provinsi Dan Kabupaten/Kota Di Pulau Sumatera Berdasarkan Tingkat Kemiskinan). (Halaman 23-34)