• Tidak ada hasil yang ditemukan

Tanah Papua terbagi menjadi dua provinsi yaitu Provinsi Papua dan Provinsi Papua Barat, serta terdiri atas 29 kabupaten/kota. Pada Surveilans Terpadu HIV – Perilaku tahun 2006 (STHP-06), Tanah Papua distratifikasikan berdasarkan topografi menjadi tiga strata, yaitu Daerah Pegunungan yang terdiri atas 6 kabupaten, Pesisir Mudah yang terdiri atas 10 kabupaten dan 2 kota, serta Pesisir Sulit yang terdiri atas 11 kabupaten. Penarikan contoh yang dilakukan menggunakan metode Three Stage Stratified. Tahap pertama penarikan contoh yaitu mengambil sepuluh kabupaten/kota yang mewakili ketiga strata tersebut sebagai sampel survei. Strata Daerah Pegunungan diwakili oleh 3 kabupaten yaitu Jayawijaya, Paniai, dan Pegunungan Bintang. Strata Pesisir Mudah diwakili oleh 4 kabupaten/kota yaitu Kota Sorong, Jayapura, Yapen, dan Kota Jayapura. Strata Pesisir Sulit diwakili oleh 3 kabupaten yaitu Teluk Bintuni, Sorong Selatan, dan Mappi. Tahap kedua penarikan contoh yaitu memilih blok sensus pada kabupaten/kota terpilih dengan komposisi sebanyak 70 blok sensus pada Daerah Pegunungan, 137 blok sensus pada Pesisir Mudah, dan 53 blok sensus pada Pesisir Sulit. Selanjutnya, tahap terakhir dari penarikan contoh yaitu memilih secara sistematik 25 penduduk berumur antara 15 hingga 49 tahun pada tiap blok sensus terpilih dengan daftar penduduk dikelompokkan berdasarkan jenis kelamin dan kelompok umur (BPS dan DepKes 2007). Berdasarkan pada penarikan contoh tersebut, target sampel yang memenuhi syarat sebanyak 6500 responden. Namun, pada realisasinya hanya terdapat 6233 responden yang berhasil diuji darahnya dan pada penelitian ini hanya akan digunakan sebanyak 6217 responden. Berdasarkan data dari 6217 responden STHP-06 dapat diringkas karakteristiknya berdasarkan peubah yang digunakan sesuai Tabel 3.

Berdasarkan Tabel 3 diketahui bahwa hanya sebesar 2.38% responden survei yang dinyatakan positif HIV. Hal inilah yang menyebabkan data hasil STHP-06 termasuk ke dalam data kelas tidak seimbang. Responden yang dinyatakan positif HIV selanjutnya dianggap sebagai kelas positif atau kelas minoritas yang menjadi pusat perhatian pada penelitian ini. Sedangkan, responden dengan hasil tes menunjukkan negatif HIV dianggap sebagai kelas negatif atau kelas mayoritas yang mana jumlahnya jauh lebih besar dibandingkan responden yang dinyatakan positif HIV.

Karakteristik lain dari responden survei STHP-06 ini antara lain sebagian besar responden yaitu sebanyak 85.46% responden melakukan seks pertama kali pada usia lebih dari 16 tahun. Artinya sekitar 15% atau sekitar 930 responden melakukan seks pertama kali saat masih di bawah umur. Selain itu, hampir seluruh responden menyatakan tidak menggunakan alat kontrasepsi dalam berhubungan seksual. Hanya sekitar 2.75% responden yang menyatakan menggunakan alat kontrasepsi dalam berhubungan seksual. Hal ini menunjukkan

11 bahwa sebagian besar masyarakat Tanah Papua tidak terbiasa menggunakan alat kontrasepsi dalam berhubungan seksual karena kurangnya akses yang ada.

Tabel 3 Persentase responden berdasarkan peubah yang digunakan

Peubah Kategori Persentase (%)

Hasil tes HIV Positif HIV 2.38

Negatif HIV 97.62

Umur seks pertama Usia ≤ 16 tahun 14.54

Usia > 16 tahun 85.46

Penggunaan alat kontrasepsi Menggunakan 2.75

Tidak menggunakan 97.25

Perilaku seks berisiko Ya 44.78

Tidak 55.22

Penyakit Menular Seksual Ada PMS 8.85

(PMS) Tidak ada PMS 91.15

Topografi wilayah Pesisir mudah 51.44

Pesisir sulit 20.59

Pegunungan 27.97

Jenis kelamin Laki-laki 50.36

Perempuan 49.64

Suku bangsa Papua 68.97

Non Papua 31.03

Status perkawinan Kawin resmi 66.45

Belum kawin 27.33

Cerai 2.70

Hidup bersama 3.52

Pengetahuan tentang HIV Tahu 30.69

Tidak/kurang tahu 69.31

Penghasilan per bulan Tidak berpendapatan 35.40

≤ Rp 100 000 8.93

Rp 101 000 – Rp 500 000 31.35 Rp 501 000 – Rp 1 500 000 18.98

> Rp 1 500 000 5.34

Lama sekolah Tidak bersekolah 21.20

SD 26.89 SMP 17.40 SMA 27.49 Perguruan tinggi 7.01 Usia 15 – 24 tahun 34.02 25 – 39 tahun 47.34 40 – 49 tahun 18.64

12

Jumlah responden yang memiliki perilaku seks berisiko tidak jauh berbeda dengan jumlah responden yang tidak memiliki perilaku seks berisiko. Berdasarkan Tabel 3 juga ditunjukkan bahwa hanya sekitar 8.85% responden menyatakan memiliki Penyakit Menular Seksual (PMS), sedangkan sisanya menyatakan tidak memiliki PMS. Ini berarti hanya sebagian kecil masyarakat Tanah Papua yang memiliki Penyakit Menular Seksual.

Berdasarkan topografi wilayahnya, perbandingan jumlah responden dari Pesisir Mudah, Pesisir Sulit, dan Daerah Pegunungan yaitu sekitar 2 : 1 : 1. Lebih dari setengah jumlah responden berasal dari Pesisir Mudah. Jumlah responden cukup seimbang antara responden laki-laki dan responden perempuan. Berdasarkan suku bangsanya, responden bersuku bangsa Papua lebih banyak dibandingkan responden non Papua yaitu sebesar 68.97% responden merupakan suku Papua asli. Selain itu, sebesar 66.45% responden menyatakan sudah menikah, 27.33% responden menyatakan belum menikah, dan sisanya menyatakan sudah bercerai atau hidup bersama. Sedangkan berdasarkan pengetahuan terhadap HIV, sebagian besar masyarakat Tanah Papua masih belum mengetahui hal-hal mengenai HIV yaitu sebesar 69.31% responden.

Hal selanjutnya yang cukup memprihatinkan yaitu sebesar 35.4% responden survei menyatakan tidak memiliki penghasilan, rata-rata penghasilan responden yaitu berkisar Rp 500 000 per bulan, dan hanya sekitar 5.34% responden yang berpenghasilan lebih dari Rp 1 500 000 tiap bulannya. Hal ini sama memprihatinkannya dengan lama masa sekolah yang dienyam responden. Terdapat sekitar 21.2% responden tidak pernah bersekolah, 26.89% responden hanya mengenyam pendidikan hingga SD, sekitar 44.89% responden mengenyam pendidikan hingga sekolah menengah, dan sisanya sekitar 7.01% responden mengenyam pendidikan hingga tingkat perguruan tinggi. Jika dilihat dari sisi usia, responden paling banyak berada pada masa dewasa awal yaitu pada rentang usia 25 hingga 39 tahun, sedangkan pada rentang usai 40 hingga 49 tahun hanya sekitar 18.64% responden.

Berikut Tabel 4 menunjukkan proporsi banyaknya responden positif HIV yang berpadanan dengan kategori peubah penjelas yang digunakan.

Tabel 4 Proporsi responden positif HIV pada tiap kategori peubah penjelas

Peubah Kategori Proporsi (%)

Umur seks pertama Usia ≤ 16 tahun 3.21

Usia > 16 tahun 2.24

Penggunaan alat kontrasepsi Menggunakan 1.75

Tidak menggunakan 2.40

Perilaku seks berisiko * Ya 3.13

Tidak 1.78

Penyakit Menular Seksual Ada PMS 3.64

(PMS) * Tidak ada PMS 2.26

*perbedaan proporsi risiko positif HIV signifikan terhadap peubah pada taraf nyata 5% dengan menggunakan uji Chi-Square

13 Tabel 4 Proporsi responden positif HIV berdasarkan peubah yang

digunakan (lanjutan)

Peubah Kategori Proporsi (%)

Topografi wilayah * Pesisir mudah 1.81

Pesisir sulit 3.13

Pegunungan 2.88

Jenis kelamin * Laki-laki 2.87

Perempuan 1.88

Suku bangsa * Papua 2.80

Non Papua 1.45

Status Perkawinan Kawin resmi 2.35

Belum kawin 2.53

Cerai 1.19

Hidup bersama 2.74

Pengetahuan tentang HIV * Tahu 1.57

Tidak/kurang tahu 2.74

*perbedaan proporsi risiko positif HIV signifikan terhadap peubah pada taraf nyata 5% dengan menggunakan uji Chi-Square

Berdasarkan Tabel 4, tanda bintang (*) pada beberapa peubah menunjukkan adanya asosiasi antara peubah tersebut dengan peubah respon yaitu berupa risiko HIV. Terdapat enam dari sembilan peubah yang dinyatakan memiliki perbedaan proporsi risiko positif HIV yang signifikan pada taraf nyata 5%. Berdasarkan tabel 4 dapat dikatakan bahwa responden yang memiliki perilaku seks berisiko atau memiliki Penyakit Menular Seksual (PMS) menghasilkan proporsi mengidap HIV positif yang lebih besar. Responden yang tinggal di daerah pesisir sulit atau di daerah pegunungan juga menunjukkan proporsi mengidap HIV positif lebih besar dibandingkan responden yang tinggal di daerah pesisir mudah. Proporsi responden laki-laki yang mengidap HIV positif juga lebih besar dibandingkan responden perempuan. Begitu pula proporsi pengidap HIV positif lebih besar merupakan responden suku Papua asli. Responden yang tidak/kurang tahu mengenai HIV pun menunjukkan proporsi mengidap HIV positif yang lebih besar. Oleh karena itu, pengetahuan mengenai HIV memang sangat penting untuk dimiliki setiap masyarakat.

Gambar 1 memperlihatkan sebaran penghasilan per bulan pada kelas responden negatif HIV dan kelas responden positif HIV. Dari gambar tersebut terlihat bahwa rata-rata penghasilan per bulan tidak jauh berbeda antara kelas responden negatif HIV dan kelas responden positif HIV yaitu berkisar Rp 400 000 per bulan. Panjang kotak boxplot untuk kedua kelas juga tidak begitu berbeda terlihat lebih jelas pada boxplot skala logaritmik sesuai Gambar 1(b) dengan mengubah penghasilan Rp 0 menjadi Rp 1 000. Hal ini menunjukkan bahwa 50% penghasilan responden yang berada di tengah sama untuk kedua kelas yaitu dengan nilai kuartil 1 adalah Rp 0 dan kuartil 3 adalah Rp 500 000.

14

Gambar 1 Boxplot penghasilan per bulan (ribu) berdasarkan hasil tes HIV

Namun, perbedaan kedua boxplot Gambar 1 sangat terlihat pada banyaknya penghasilan per bulan yang dianggap sebagai pencilan. Kelas responden negatif HIV memiliki banyak sekali amatan pencilan sejalan dengan banyaknya amatan pada kelas ini yang mencapai 6069 amatan. Nilai penghasilan per bulan tertinggi pada kelas responden negatif HIV yaitu Rp 26 400 000. Sebaliknya, pada kelas responden positif HIV amatan yang dianggap pencilan tidak terlalu banyak karena jumlah amatan pada kelas ini tergolong sedikit yaitu hanya 148 amatan. Nilai penghasilan per bulan tertinggi untuk kelas responden positif HIV ini hanya sebesar Rp 5 000 000. Jadi, jika diperhatikan secara sekilas, responden dengan penghasilan lebih dari Rp 5 000 000 per bulan dapat dikatakan bahwa responden tersebut adalah responden negatif HIV.

Gambar 2(a) menunjukkan boxplot lama sekolah untuk kelas responden negatif HIV dan kelas responden positif HIV. Jika dilihat dari dua boxplot Gambar 2(a) dapat diketahui bahwa karakteristik lama sekolah untuk kedua kelas tidak jauh berbeda. Hal ini terlihat dari panjang kotak boxplot dan panjang garis whisker yang tidak berbeda jauh untuk kedua kelas. Namun, terlihat bahwa median kelas responden negatif HIV lebih besar dibandingkan median kelas responden positif HIV. Gambar 2(a) menunjukkan bahwa semakin tinggi tingkat pendidikan seseorang tidak menjamin orang tersebut terhindar dari risiko HIV.

Gambar 2(b) juga menunjukkan dua boxplot yang tidak berbeda jauh. Nilai minimum dan nilai maksimum untuk kedua boxplot sama yaitu 15 tahun dan 49 tahun sesuai dengan syarat usia responden survei yang telah ditentukan. Hal ini menunjukkan bahwa seseorang yang terinfeksi HIV tidak memandang usia, baik muda maupun tua. Median dari kedua boxplot Gambar 2(b) juga menunjukkan nilai yang sama yaitu 29 tahun. Namun, terlihat bahwa panjang kotak boxplot untuk kelas responden negatif HIV lebih sempit dibanding boxplot kelas responden positif HIV. Hal ini menunjukkan bahwa usia responden positif HIV lebih beragam dibanding usia responden negatif HIV. Artinya HIV dapat menyerang siapa saja tanpa melihat usianya.

15

Gambar 2 Boxplot lama sekolah dan usia

Penanganan Kelas Data Tidak Seimbang

Ketidakseimbangan kelas pada data STHP-06 diperlihatkan dengan tidak sebandingnya persentase antara jumlah responden yang dinyatakan positif HIV dan jumlah responden yang dinyatakan negatif HIV. Pada Tabel 3 diperlihatkan bahwa terjadi ketidakseimbangan kelas data yaitu hanya sebesar 2.38% responden survei yang dinyatakan positif HIV sedangkan sisanya sebanyak 97.62% dinyatakan negatif HIV. Hal ini akan menimbulkan masalah ketika dilakukan analisis klasifikasi yaitu kecilnya nilai ketepatan klasifikasi untuk kelas responden positif HIV. Selanjutnya kelas responden positif HIV disebut kelas minoritas yang menjadi pusat perhatian dari penelitian ini, sedangkan kelas responden negatif HIV disebut kelas mayoritas. Pada penelitian ini data dibagi terlebih dahulu menjadi dua bagian yaitu 80% data latih dan 20% data uji dengan komposisi proporsi kelas yang relatif sama dengan data asli.

Tabel 5 Komposisi pembagian data

Kelas Data latih Data uji

Minoritas 118 (2.37%) 30 (2.41%) Mayoritas 4855 (97.63%) 1214 (97.59%) Total 4973 (100.00%) 1244 (100.00%)

Tahap selanjutnya yaitu melakukan pengklasifikasian data latih menggunakan Pohon Klasifikasi C5.0 untuk melihat kinerja klasifikasi pada kondisi kelas data tidak seimbang. Kinerja klasifikasi dilihat dengan membandingkan hasil prediksi pohon klasifikasi yang dihasilkan dengan data aktual pada data uji. Berikut kinerja klasifikasi Pohon Klasifikasi C5.0 sebelum dilakukan penanganan terhadap kelas data tidak seimbang.

16

Tabel 6 Kinerja klasifikasi tanpa penanganan kelas data tidak seimbang

Kinerja klasifikasi Nilai

Akurasi 0.9759

Sensitivitas 0.0000

Spesifisitas 1.0000

Tabel 6 menunjukkan kinerja klasifikasi Pohon Klasifikasi C5.0 pada data uji tanpa dilakukannya penanganan terhadap kelas data tidak seimbang. Terlihat bahwa akurasi dari Pohon Klasifikasi tersebut sangat tinggi yaitu 0.9759 artinya kesalahan klasifikasinya hanya sebesar 0.0241. Namun, jika dilihat lebih dalam yaitu pada nilai sensitivitas menunjukkan nilai yang sangat kecil yaitu 0 yang berarti tidak ada satupun amatan kelas minoritas yang berhasil diklasifikasikan secara benar. Jika diterapkan pada kasus maka tidak ada satupun responden positif HIV yang diklasifikasikan ke dalam kelas positif HIV. Hal inilah yang cukup berbahaya dalam pengambilan keputusan ke depannya. Walaupun di sisi lain spesifisitas bernilai sempurna yaitu 1 tetapi pusat perhatian pada penelitian ini adalah kelas minoritas sehingga diperlukan penanganan terhadap kelas data tidak seimbang agar kinerja klasifikasi yang dihasilkan lebih baik.

Penanganan terhadap kelas data tidak seimbang pada penelitian ini dilakukan melalui beberapa modifikasi metode Synthetic Minority Oversampling Technique (SMOTE) pada data latih dengan tujuan memperoleh model klasifikasi dengan kinerja terbaik. Metode pertama yang digunakan adalah SMOTE sesuai dengan Chawla et al. (2002). Pada metode ini akan dilakukan pembangkitan amatan kelas minoritas buatan (oversampling) dengan konsep t-tetangga terdekat dan juga akan dilakukan penarikan contoh secara acak amatan kelas mayoritas (undersampling). Penelitian ini menggunakan persentase oversampling sebesar 200% yang berarti pada setiap amatan kelas minoritas akan dibangkitkan dua amatan kelas minoritas buatan sehingga hasil akhir SMOTE ini memiliki tiga kali jumlah amatan kelas minoritas awal. Persentase oversampling sebesar 200% ini dipilih karena berdasarkan percobaan yang telah dilakukan diperoleh hasil bahwa semakin banyak amatan buatan yang dibangkitkan maka semakin kecil nilai sensitivitasnya sehingga dipilih persentase oversampling yang tidak terlalu besar. Sedangkan persentase undersampling yang digunakan adalah sebesar 150% dengan tujuan agar terjadi keseimbangan antara jumlah amatan kelas minoritas dan jumlah amatan kelas mayoritas. Semakin besar persentase undersampling akan menurunkan nilai sensitivitas yang dihasilkan pada data ini. Persentase undersampling sebesar 150% artinya amatan kelas mayoritas akan diambil secara acak sebanyak 1.5 kali dari banyaknya kelas minoritas yang dibangkitkan. Ukuran t untuk pembangkitan amatan kelas minoritas dengan konsep t-tetangga terdekat yang digunakan adalah t = 1 karena dikhawatirkan posisi amatan kelas minoritas sangat berbeda jauh satu sama lain sehingga hanya dipilih satu tetangga terdekat dalam membangkitkan amatan buatan dengan harapan amatan buatan tersebut memiliki karakteristik yang tidak berbeda jauh dari amatan acuannya.

17 Tabel 7 Komposisi data hasil SMOTE

Kelas Data latih Data hasil SMOTE Minoritas 118 (2.37%) 354 (50%) Mayoritas 4855 (97.63%) 354 (50%) Total 4973 (100.00%) 708 (100%)

Terlihat dari Tabel 7 bahwa setelah dilakukan SMOTE kondisi kelas data sudah seimbang yaitu dengan proporsi kelas minoritas 50% dan kelas mayoritas 50%.

Metode penanganan kelas data tidak seimbang yang dilakukan selanjutnya adalah metode modifikasi dari SMOTE yaitu Synthetics Minority Oversampling and Undersampling Technique (SMOUTE) yang diajukan oleh Songwattanasiri dan Sinapiromsaran (2010). Perbedaan utama metode ini adalah pada tahap awal undersampling kelas mayoritas. Undersampling pada SMOUTE diawali dengan pengelompokan kelas mayoritas terlebih dahulu melalui algoritme k-rataan. Setelah kelas mayoritas dikelompokkan ke dalam k kelompok, undersampling dilakukan secara acak di masing-masing kelompok serupa dengan undersampling pada SMOTE. Persentase oversampling dan undersampling yang digunakan pada metode ini sama dengan yang digunakan pada metode SMOTE sebelumnya yaitu masing-masing 200% dan 150%. Sedangkan nilai k untuk algoritme k-rataan yang digunakan adalah k = 4 karena berdasarkan percobaan yang telah dilakukan k = 4 cenderung menghasilkan kinerja klasifikasi yang lebih baik untuk data STHP-06 ini.

Tabel 8 Komposisi data hasil SMOUTE

Kelas Data latih Data hasil SMOUTE Minoritas 118 (2.37%) 354 (50%) Mayoritas 4855 (97.63%) 354 (50%) Total 4973 (100.00%) 708 (100%)

Metode SMOUTE ini kemudian dilakukan modifikasi pada bagian oversampling kelas minoritasnya. Bagian oversampling sesuai dengan oversampling yang dilakukan pada metode SMOTE tetapi oversampling ini dilakukan dalam dua tahap untuk menghasilkan komposisi akhir data yang sama dengan Tabel 7 dan Tabel 8. Ide dasar metode SMOUTE dua tahap ini adalah adanya dugaan bahwa amatan buatan yang dibangkitkan akan berbeda jika dibangkitkan dari gabungan amatan minoritas asli dan amatan minoritas buatan hasil oversampling tahap pertama dibandingkan dengan amatan buatan hasil pembangkitan oversampling satu tahap. Berikut ilustrasinya sesuai Gambar 3.

Gambar 3 menunjukkan bahwa ada perbedaan hasil amatan minoritas buatan yang dibangkitkan antara oversampling satu tahap dan oversampling dua tahap. Terlihat bahwa oversampling satu tahap dengan t = 1 untuk konsep t-tetangga terdekat akan membangkitkan amatan buatan selalu berada pada garis antara dua amatan kelas minoritas asli karena perbedaan hasil pembangkitan hanya berasal dari nilai acak yang digunakan. Sedangkan pada oversampling dua

18

tahap, amatan kelas minoritas buatan dapat terbentuk di luar garis lurus antara dua amatan minoritas asli karena pembangkitan amatan buatan pada tahap kedua telah menyertakan amatan minoritas buatan oversampling tahap satu sebagai amatan minoritas asli.

Gambar 3 Perbandingan oversampling 1 tahap dan 2 tahap

Pada tahap pertama dilakukan oversampling kelas minoritas dengan persentase 100% dan tahap kedua dilakukan oversampling kembali dengan persentase 50%. Setelah tahap kedua selesai akan diperoleh jumlah amatan kelas minoritas sesuai dengan Tabel 7 dan Tabel 8. Selanjutnya undersampling kelas mayoritas dilakukan serupa dengan undersampling pada metode SMOUTE sebelumnya. Berikut komposisi data hasil SMOUTE dua tahap sesuai Tabel 9.

Tabel 9 Komposisi data hasil SMOUTE 2 tahap

Kelas Data latih Data hasil SMOUTE

Tahap 1 Tahap 2 Minoritas 118 (2.37%) 236 (4.64%) 354 (50%) Mayoritas 4855 (97.63%) 4855 (95.36%) 354 (50%)

Tabel 9 menunjukkan komposisi data yang seimbang antara kelas minoritas dan kelas mayoritas setelah diterapkannya metode SMOUTE dua tahap dengan komposisi yang sama seperti dua metode sebelumnya.

Dari ketiga metode penanganan terhadap kelas data tidak seimbang yang telah disebutkan, selanjutnya akan ditentukan metode penanganan yang menghasilkan model klasifikasi terbaik.

(a) Oversampling 1 Tahap (b) Oversampling 2 Tahap (b) ■ Asli ● Sintetis ■ Asli ● Sintetis1 ▲Sintetis2

19 Pemilihan Metode Penanganan Terbaik

Setelah dilakukan praproses yaitu penanganan terhadap kelas data tidak seimbang dan dilakukan kembali pengklasifikasian dengan Pohon Klasifikasi C5.0, diperoleh tiga rataan kinerja klasifikasi untuk ketiga metode penanganan kelas data tidak seimbang. Kinerja klasifikasi dihitung dengan membandingkan nilai peubah respon hasil prediksi dan peubah respon aktual dari data uji. Kinerja klasifikasi yang dibandingkan yaitu meliputi akurasi, sensitivitas, spesifisitas, dan nilai AUC dari ROC. Pengklasifikasian dengan Pohon Klasifikasi C5.0 dilakukan dengan ulangan sebanyak 500 kali pada masing-masing metode penanganan kelas tidak seimbang sehingga diperoleh sebaran kinerja klasifikasi untuk ketiga metode penanganan sesuai Gambar 4.

Gambar 4(a) menunjukkan bahwa secara umum sebaran nilai akurasi untuk ketiga model klasifikasi hasil penanganan tidak berbeda jauh. Panjang kotak ketiga boxplot tersebut juga relatif sama. Namun, jika dilihat lebih detil maka diketahui bahwa posisi kotak boxplot dengan metode penanganan SMOUTE dua tahap relatif lebih tinggi dibandingkan kedua boxplot lainnya. Hal ini menunjukkan bahwa 50% nilai akurasi yang berada di bagian tengah data pada metode SMOUTE dua tahap ini cenderung lebih baik walaupun masih terjadinya tumpang tindih (overlapping) dengan kedua boxplot lainnya. Nilai mimimum akurasi terjadi pada model klasifikasi dengan metode penanganan SMOTE yaitu sebesar 0.5924 sedangkan nilai maksimum akurasi terdapat pada model klasifikasi dengan metode penanganan SMOUTE dua tahap dengan nilai sebesar 0.8465.

Boxplot pada Gambar 4(b) menunjukkan sebaran nilai sensitivitas model untuk ketiga metode penanganan. Dari Gambar 4(b) terlihat bahwa ketiga boxplot memiliki panjang kotak yang persis sama yaitu dengan nilai kuartil 1 sebesar 0.2667, kuartil 2 (median) sebesar 0.3333, dan kuartil 3 sebesar 0.4000. Hal ini berarti ketiga metode menghasilkan nilai sensitivitas yang tidak berbeda pada 50% data yang berada di bagian tengah data. Hal ini juga menunjukkan bahwa ketiga metode penanganan kelas tidak seimbang menghasilkan nilai sensitivitas yang relatif sama. Nilai sensitivitas minimum terdapat pada metode penanganan SMOTE yaitu sebesar 0.0333 sedangkan nilai tertinggi terdapat pada metode penanganan SMOUTE yaitu sebesar 0.6333.

Serupa dengan Gambar 4(a), Gambar 4(c) menunjukkan sebaran nilai spesifisitas pada ketiga metode penanganan yang tidak berbeda jauh dilihat dari tinggi kotak boxplot yang relatif sama untuk ketiga metode. Namun, pada Gambar 4(c) terlihat bahwa posisi kotak boxplot dengan metode penanganan SMOUTE dua tahap relatif lebih tinggi dibandingkan kedua boxplot lainnya walaupun masih adanya tumpang tindih nilai dengan kedua boxplot lainnya. Posisi kotak boxplot yang lebih tinggi ini menunjukkan bahwa 50% nilai spesifisitas yang berada di bagian tengah data lebih baik pada metode penanganan SMOUTE dua tahap ini. Nilai minimum spesifisitas sebesar 0.5947 terjadi pada metode penanganan SMOTE sedangkan nilai maksimum spesifisitas sebesar 0.8624 terjadi pada metode penanganan SMOUTE dua tahap.

Gambar 4(d) menunjukkan panjang kotak boxplot yang relatif sama untuk ketiga metode penanganan. Artinya sebaran 50% data AUC yang berada di bagian tengah data relatif sama untuk ketiga metode penanganan tersebut. Nilai minimum AUC sebesar 0.3855 dihasilkan oleh metode penanganan SMOTE sedangkan nilai

20

maksimum AUC sebesar 0.6804 dihasilkan melalui metode penanganan SMOUTE.

Gambar 4 Boxplot kinerja klasifikasi berdasarkan metode penanganan

Penjabaran tersebut menunjukkan bahwa dengan dilakukannya ulangan memungkinkan untuk didapatkannya nilai kinerja klasifikasi yang cukup baik walaupun hal ini jarang terjadi serta memperlihatkan bahwa sebaran nilai akurasi cenderung serupa dengan sebaran spesifisitas, sedangkan sebaran nilai sensitivitas cenderung serupa dengan sebaran AUC. Gambar 5 menampilkan diagram pencar yang memperlihatkan pola kecenderungan hubungan nilai akurasi dan sensitivitas. Dari Gambar 5 tersebut terlihat bahwa akurasi dan sensitivitas memiliki pola hubungan linier negatif yang berarti semakin besar nilai akurasi maka nilai sensitivitas cenderung semakin kecil. Hal ini diperkuat dengan Tabel 10 dan Tabel 11 yang menunjukkan perbandingan kinerja klasifikasi tiap metode penanganan berdasarkan nilai akurasi tertinggi dan nilai sensitivitas tertinggi.

(a) Akurasi (b) Sensitivitas

21

Gambar 5 Diagram pencar antara akurasi dan sensitivitas dengan metode SMOUTE dua tahap

Dokumen terkait