Tahap berikutnya dalam penelitian ini adalah eksplorasi data. Tahapan ini akan memberikan beberapa gambaran umum terhadap pekerja anak di Jakarta, baik ditinjau berdasarkan wilayah maupun dari sisi internal dan eksternal pekerja anak, misalnya dalam hal pendidikan anak, kondisi Kepala Rumah Tangga (KRT), dan tingkat perekonomian rumah tangga dimana anak tersebut menetap. Eksplorasi data menggunakan hasil estimasi Susenas tahun 2013 di Propinsi Jakarta.
Gambaran Umum Pekerja Anak di Jakarta
Jumlah pekerja anak di Jakarta sebanyak 58609 jiwa atau 4.6% dari total anak berumur 10-17 tahun. Kota dengan jumlah pekerja anak terbanyak adalah di kota Jakarta Barat yaitu sebesar 37.2%, sedangkan Kepulauan Seribu merupakan kabupaten di Jakarta yang mempunyai jumlah pekerja anak paling sedikit yaitu sebesar 0.2% dari total pekerja anak. Gambar 4.1 memuat peta persebaran pekerja anak di Jakarta.
Gambar 4.1. Peta persentase persebaran pekerja anak berdasarkan kab/kota Jakarta Barat merupakan kota dengan PDRB terendah dibandingkan kota lain di Jakarta dan merupakan kota terpadat kedua di Jakarta. Berdasarkan Gambar 4.1, terlihat bahwa Jakarta Barat merupakan daerah konsentrasi pekerja anak di propinsi DKI Jakarta. Selain itu, dari total anak berumur 10-17 tahun yang berada di kota ini, 7.1 % merupakan pekerja anak. Oleh karena itu, kota ini perlu mendapat perhatian lebih dalam dari Pemerintah Propinsi DKI Jakarta dalam rangka mengurangi jumlah pekerja anak.
JAKARTA BARAT 37.2% JAKARTA UTARA 20.3 % JAKARTA TIMUR 19.1 %
15
Tabel 4.1. Persentase Status Anak menurut kelompok umur Kelompok
umur
Bukan pekerja anak
Pekerja anak Total
10-12 99.8% 0.2% 100.0%
13-14 98.0% 2.0% 100.0%
15-17 88.9% 11.1% 100.0%
Yang menjadi perhatian serius oleh Pemerintah adalah masih terdapat pekerja anak yang masih berumur 10-12 tahun, yaitu 0.2 persen dari total anak pada umur 10-12 tahun. Sedangkan pada umur 13-14 tahun, terdapat dua persen (2%) pekerja anak dari total anak pada umur tersebut. Pada Tabel 4.2 terlihat bahwa pada umur 10-14 tahun, pekerja anak masih didominasi oleh anak yang sudah tidak bersekolah lagi. Hal ini sangat mengkhawatirkan karena pada kelompok umur ini, anak harus mendapat pembekalan dasar pendidikan dan ketrampilan dasar yang berguna untuk penghidupan mereka di masa mendatang.
Tabel 4.2. Partisipasi sekolah pekerja anak berdasarkan kelompok umur Kelompok umur Partisipasi sekolah Masih bersekolah Tidak bersekolah lagi 10-12 13-14 15-17 30.1% 69.9% 45.9% 54.1% 5.7% 94.3%
Tabel 4.3 memuat persentase pekerja anak menurut peubah-peubah yang digunakan pada penelitian ini. Berdasarkan Jenis Kelamin Anak, pekerja anak didominasi oleh perempuan, selain itu hampir seluruh pekerja anak di Jakarta berstatus tidak bersekolah lagi. Tidak bersekolah lagi dapat berarti anak tersebut tidak melanjutkan sekolahnya atau berhenti di tengah jalan. Sedangkan sebagian kecil pekerja anak masih menempuh pendidikan dalam bangku sekolah. Tidak ada pekerja anak yang tidak atau belum pernah bersekolah di Jakarta. Ini mengindikasikan bahwa pekerja anak merupakan anak-anak yang pernah mengenyam pendidikan.
Salah satu faktor penyebab seorang anak menjadi pekerja anak adalah faktor keluarga atau rumah tangga dimana anak tersebut tinggal (Syahruddin 2004). Pada Tabel 4.3, 13.8 persen pekerja anak memiliki KRT yang tidak bekerja. Sedangkan pekerja anak dengan KRT yang bekerja baik di sektor informal (berusaha sendiri atau berusaha dibantu buruh tidak tetap) maupun sektor formal (buruh atau berusaha dibantu buruh tetap) yaitu 27.4 persen dan 58.8 persen. Selain faktor dari KRT, Pengeluaran Rumah Tangga per Bulan juga berperan dalam faktor-faktor yang mempengaruhi seorang anak menjadi pekerja anak. Tabel 4.3 menunjukkan pekerja anak lebih banyak terdapat pada rumah tangga dengan pengeluaran per bulan rendah dan sedang (dibawah 5.525 juta Rupiah), dibandingkan dengan rumah tangga dengan pengeluaran per bulan tinggi (diatas 5.525 juta Rupiah).
16
Tabel 4.3. Persentase pekerja anak menurut peubah yang digunakan
Gambar 4.2 menunjukkan bahwa boxplot pekerja anak dan bukan pekerja anak memiliki beberapa karakteristik yang mirip. Kemiripan tersebut terletak pada nilai Kuartil ke 1, Kuartil ke 2, dan Kuartil ke 3. Sehingga dapat dikatakan bahwa setengah dari anak-anak di Jakarta tinggal di rumah tangga dengan lima atau kurang dari lima orang ART. Selain itu, kedua kelas data ini memiliki kemiripan dalam sebaran data karena ukuran simpangan kuartil yang sama besar. Sebaran data kedua kelas data ini juga sama-sama tidak simetris atau menceng ke arah kanan, hal ini ditandai dengan terdapatnya pencilan pada kedua boxplot dan panjang garis whisker yang tidak sama. Tetapi kemencengan pada data bukan pekerja anak lebih lebar karena terdapat lebih banyak data pencilan. Pada data pekerja anak, terdapat satu pekerja anak yang tinggal pada rumah tangga dengan sepuluh orang ART. Sedangkan pada data bukan pekerja anak, terdapat beberapa anak yang tinggal pada rumah tangga dengan lebih dari sepuluh ART. Banyaknya ART ikut mempengaruhi seorang anak menjadi pekerja anak.
Peubah Kriteria peubah Pekerja anak(%)
Jenis Kelamin Anak
Laki-laki 40.4
Perempuan 59.6
Partisipasi Sekolah Tidak/belum pernah bersekolah
0.0
Masih bersekolah 10.3
Tidak bersekolah lagi 89.7 Tinggal Dengan
Orang Tua
Ya 39.9
Tidak 60.1
Jenis Kelamin KRT Laki-laki 81.7
Perempuan 18.3 Status Pekerjaan KRT Tidak bekerja 13.8 Informal 27.4 Formal 58.8
Pendidikan KRT Tidak sekolah .0
SLTA kebawah 69.6 PT keatas 30.3 Keluhan Kesehatan KRT Ada keluhan 10.8 Tidak ada 89.2
Status Kawin KRT Tidak kawin 23.1
Kawin 76.9
ART Lain Bekerja Ya 97.0
Tidak 3.0
Pengeluaran Rumah Tangga per Bulan
Rendah dan Sedang 54.6
17
Gambar 4.2. Boxplot Jumlah ART berdasarkan Status Anak
Gambar 4.3. Boxplot Umur KRT berdasarkan Status Anak
Gambar 4.3 menunjukkan perbandingan boxplot pekerja anak dan bukan pekerja anak berdasarkan Umur KRT dimana anak tersebut tinggal. Terlihat bahwa terdapat kemiripan pada nilai tengah kedua boxplot, hal ini berarti bahwa setengah dari anak-anak di Jakarta tinggal pada rumah tangga dimana Umur KRT nya sekitar 45 tahun atau dibawah 45 tahun. Selain itu, kemiripan lainnya adalah kedua data ini sama-sama tidak simetris atau menceng ke arah kanan, hal ini terlihat dari data pencilan yang terdapat pada kedua boxplot dan garis whisker yang tidak sama panjang. Jika dilihat dari ukuran kotak dalam boxplot atau disebut dengan simpangan kuartil, data umur KRT pada pekerja anak lebih menyebar (ukuran kotak lebih panjang) daripada bukan pekerja anak, sehingga dapat dikatakan Umur KRT lebih bervariasi pada data pekerja anak dibandingkan pada bukan pekerja anak. Hal
J
u
m
la
18
ini mengakibatkan data pencilan lebih banyak terdapat pada data bukan pekerja anak. Kondisi kepala rumah tangga ikut mempengaruhi terdapatnya pekerja anak pada suatu rumah tangga (Syahruddin 2004).
Penanganan Data Tidak Seimbang
` Berikut merupakan perbandingan jumlah pekerja anak dan bukan pekerja anak di Jakarta. Ketidakseimbangan distribusi kelas data peubah respon ini yang disebut dengan data tidak seimbang. Perlu penanganan lebih lanjut karena kondisi ini mengakibatkan kecilnya akurasi pada kelas data minoritas, padahal kelas data ini yang akan kita teliti lebih lanjut.
Tabel 4.4. Persentase perbandingan jumlah anak menurut Status Anak
Kategori Jumlah (%)
1 (pekerja anak) 97 (4.04)
0 (bukan pekerja anak) 2305 (95.96)
Jumlah 2402 (100.00)
Pada Tabel 4.4 terlihat bahwa antara perbandingan jumlah pekerja anak dan bukan pekerja anak cukup jauh. Hal ini berarti telah terjadi ketidakseimbangan data. Gambar merupakan ilustrasi plot dari peubah respon Status Anak (pekerja anak dan bukan pekerja anak) berdasarkan peubah Umur KRT dan Jumlah Anggota Rumah Tangga. Pada gambar 4.4, kelas pekerja anak (minoritas) diwakili oleh kotak merah, sedangkan kelas bukan pekerja anak (mayoritas) diwakili oleh lingkaran biru. Terlihat bahwa kelas bukan pekerja anak lebih mendominasi daripada kelas pekerja anak. Kondisi ini yang disebut dengan data tidak seimbang.
Gambar 4.4. Plot Umur KRT dan Jumlah ART berdasarkan Status Anak
100 90 80 70 60 50 40 30 20 10 16 14 12 10 8 6 4 2 Umur KRT Ju m la h A R T
0 (Bukan Pekerja Anak) 1 (Pekerja Anak) Y (Status Anak)
19
Teknik SMOTE akan digunakan untuk menangani ketidakseimbangan data. Teknik ini membangkitkan data sintesis untuk kelas minoritas sebesar 800 persen yang berarti bahwa data sintesis akan dibangkitkan sebesar (800/100 = 8) delapan kali data latih minoritas, yaitu 8x78 = 624 dan data baru ini akan ditambahkan ke data awal sehingga berjumlah 624+78 = 702. Sedangkan kelas data mayoritas akan diambil sampel secara acak dari data awal sebanyak dua kali dari jumlah data bangkitan kelas minoritas, yaitu 624*2 = 1248. Data latih baru berjumlah 780 yang terdiri dari 312 data kelas minoritas dan 468 data mayoritas. Tabel 4.5 memuat perbandingan data latih dengan data yang telah di-SMOTE.
Tabel 4.5. Hasil SMOTE pada data latih
Kategori Data latih(%) Data SMOTE(%)
1 (pekerja anak) 78 (4.06) 702 (36.00)
0 (bukan pekerja anak) 1844 (95.94) 1248 (64.00)
Jumlah 1922 (100.00) 1950 (100.00)
Perbandingan antara kelas data mayoritas dan minoritas pada tabel diatas menjadi lebih seimbang dengan 36 persen kelas data pekerja anak dan 60 persen kelas data bukan pekerja anak. Ilustrasi kelas data yang telah seimbang dapat dilihat pada Gambar 4.5. Kelas minoritas terlihat bertambah banyak dibandingkan pada Gambar 4.5.
Gambar 4.5. Plot hasil SMOTE peubah Umur KRT dan Jumlah ART berdasarkan Status Anak 100 90 80 70 60 50 40 30 20 10 12 10 8 6 4 2 Umur KRT Ju m la h A R T
0 (Bukan Pekerja Anak) 1 (Pekerja Anak) Y (Status Anak)
20
Pemilihan Model Klasifikasi Terbaik
Sebelum mendapatkan faktor-faktor yang mempengaruhi seorang anak menjadi pekerja anak, akan dicari terlebih dahulu model yang dapat memberikan ketepatan yang tinggi untuk memprediksi baik pekerja anak maupun bukan pekerja anak. Model yang dibandingkan adalah C5.0 dan MARS, baik dengan data latih awal maupun dengan data latih baru, dan juga C5.0 yang menggunakan Cost Matrix. Hasil yang diperoleh dapat dilihat pada Tabel 4.6. Hasil dari model pada Tabel 4.6 dapat dilihat pada Lampiran 1-4.
Tabel 4.6. Perbandingan ketepatan metode klasifikasi
Metode Accuracy Specificity Sensitivity
C5.0 0.9667 0.9978 0.2105
C5.0 SMOTE 0.9479 0.9458 1.0000
C5.0 Cost 0.9562 0.9566 0.9474
MARS 0.9688 0.9957 0.3158
MARS SMOTE 0.9500 0.9501 0.9474
Pohon klasifikasi sangat rentan terhadap ketidakseimbangan data, termasuk juga metode C5.0. Seperti yang terlihat pada Tabel 4.6, ketepatan klasifikasi untuk pekerja anak (Sensitivity) sangat rendah yaitu 0.2105, yang berarti bahwa diantara 100 pekerja anak, C5.0 hanya benar memprediksi 21 anak saja. Sedangkan sisanya terdapat kesalahan klasifikasi. Pada kelas data bukan pekerja anak, C5.0 memberikan ketepatan yang tinggi, dimana hampir mendekati angka satu. Hal ini berarti bahwa dari 100 anak yang bukan pekerja anak, C5.0 tepat memprediksikan bahwa mereka adalah bukan pekerja anak. Data tidak seimbang terlihat juga berpengaruh signifikan terhadap metode klasifikasi MARS. Ketepatan klasifikasi pada pekerja anak pada model MARS lebih tinggi dibandingkan C5.0 yaitu 0.3158 yang berarti bahwa dari 100 pekerja anak, MARS berhasil memprediksikan tepat sebanyak 31 anak.
Penanganan data tidak seimbang dengan cost sensitive learning memberikan hasil yang sangat baik. Peningkatan signifikan terjadi pada ketepatan klasifikasi pada pekerja anak yaitu sebesar 0.9474, hal ini lebih besar daripada tanpa menggunakan cost. Kenaikan nilai sensitivity tidak diikuti dengan nilai accuracy dan specificity, kedua nilai tersebut mengalami sedikit penurunan. Dengan cost sensitive learning, C5.0 mengklasifikasikan pekerja anak dengan lebih hati-hati dan menghindari kesalahan klasifikasi.
Penggunaan SMOTE pada penanganan data tidak seimbang memberikan hasil yang optimal. SMOTE mampu menyeimbangkan data dengan membuat data sintetis sehingga keseimbangan dapat tercapai. Keseimbangan tersebut mampu meningkatkan ketepatan klasifikasi pada kelas minoritas. Dalam Tabel 4.6, tingkat akurasi model dengan SMOTE sedikit mengalami penurunan, begitu pula dengan ketepatan klasifikasi bagi kelas bukan pekerja anak (specificity) tetapi keduanya masih berada diatas angka 0.9 yang berarti bahwa tingkat keakuratan yang dihasilkan masih tinggi.
21
Berdasarkan Tabel 4.6, tiga model yang dihasilkan setelah penanganan data tidak seimbang memberikan hasil yang optimal dengan nilai ketepatan klasifikasi yang tinggi pada semua kelas data. Pemilihan model terbaik jika hanya dengan melihat Tabel 4.6 akan sulit karena tidak ada model yang benar-benar memberikan nilai tertinggi. Oleh karena itu pemilihan model terbaik melihat dari nilai AUC. Gambar 4.6 memuat nilai AUC pada ketiga model. Model MARS SMOTE merupakan model terbaik dengan nilai AUC yang tertinggi diantara model lainnya, yaitu 0.9761.
Gambar 4.6. Perbandingan nilai AUC pada ketiga model
Interpretasi Model Terbaik
Berdasarkan Gambar 4.7, Partisipasi Sekolah Anak (X2) merupakan peubah yang paling berpengaruh pada model MARS SMOTE. Hal ini menunjukkan bahwa faktor pendidikan sangat berpengaruh terhadap seorang anak. Berdasarkan Tabel 4.2, pekerja anak masih didominasi oleh anak-anak yang tidak bersekolah lagi. Pemerintah Provinsi DKI Jakarta berusaha untuk mengembalikan anak-anak tersebut ke bangku sekolah dengan mengeluarkan kebijakan wajib belajar 12 tahun bagi warganya, serta pemberian bantuan pendidikan bagi warga miskin berupa Kartu Jakarta Pintar sebagai pendamping Bantuan Operasional Sekolah (BOS) yang dikeluarkan oleh pemerintah pusat. Salah satu harapan dari kebijakan ini adalah mengembalikan para pekerja anak yang putus sekolah untuk kembali ke bangku sekolah dan mengurangi jumlah pekerja anak.
Tingkat kepentingan pada Gambar 4.7 diperoleh berdasarkan peubah yang paling meminimumkan nilai GCV. Peubah selanjutnya yang berpengaruh adalah Tinggal dengan Orang Tua Kandung (X3), Umur KRT (X4), Pendidikan KRT (X7), Pengeluaran Rumah Tangga (X12), dan Jumlah Anggota Rumah Tangga (X10). Terlihat dari faktor yang mempengaruhi anak menjadi pekerja anak, faktor sosial ekonomi rumah tangga dimana anak tersebut tinggal ikut andil membentuk anak menjadi pekerja anak.
22
Gambar 4.7. Tingkat kepentingan tiap peubah
= . + . ∗ − . ∗ − . ∗ + . ∗ − . ∗ − . ∗ − . ∗ + . ∗ − . ∗ + . ∗ − . ∗ − . ∗ − . ∗ − . ∗ + . ∗ − . ∗ + . ∗ . (17) BF1=BF0*(X2 = 3) BF2=BF0*NOT(X2 = 3) BF3=BF2*(X3 = 1) BF4=BF2*NOT(X3 = 1) BF5=BF2*MAX(X4 - 25.679,0) BF6=BF2*MAX(25.679 - X4,0) BF7=BF1*(X7 = 1) BF8=BF1*NOT(X7 = 1) BF9=BF1*MAX(X4 - 80.145,0) BF10=BF1*MAX( 80.145 - X4,0) BF11=BF0*(X7 = 3) BF12=BF0*NOT(X7 = 3) BF13=BF1*(X12 = 2) BF14=BF1*NOT(X12 = 2) BF15=BF1*MAX(X10 - 2.207,0) BF16=BF1*MAX(2.207 - X10,0) BF17=BF11*(X12 = 3) BF18=BF11*NOT(X12 = 3) BF19=BF11*MAX(X4 - 69,0) BF20=BF11*MAX(69 - X4,0) BF21=BF2*MAX(X4 - 82.550,0) BF22=BF2*MAX(82.550 - X4,0) BF23=BF12*MAX(X10 - 2.978,0) BF24=BF12*MAX(2.978 - X10,0) Model MARS SMOTE yang terbentuk seperti pada persamaan 17, dan penjabaran dari fungsi basis seperti pada persamaan 18. Interpretasi model diatas adalah sebagai berikut:
a. . * BF1
� = + . . + .+ . = .
23
Dengan asumsi peubah lainnya konstan, seorang anak yang tidak sekolah lagi, putus sekolah atau tidak melanjutkan sekolah ke jenjang lebih tinggi, berpeluang sangat besar menjadi pekerja anak yaitu 0.98.
b. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tinggal dengan orang tua kandung dan pendidikan anak masih sekolah maka anak tersebut memiliki peluang yang sangat kecil untuk menjadi pekerja anak yaitu 0.1.
c. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang masih sekolah, dan anak tersebut tinggal dalam rumah tangga dimana umur KRT diatas 25 tahun, maka anak tersebut berpeluang besar menjadi pekerja anak yaitu 0.7.
d. . ∗
� = + . . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang masih sekolah, dan anak tersebut tinggal dalam rumah tangga dimana umur KRT dibawah 25 tahun, maka anak tersebut berpeluang besar menjadi pekerja anak yaitu 0.9. Hal ini dapat terjadi pada anak yang tidak tinggal dengan orang tua kandung.
e. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tidak sekolah lagi dan tinggal bersama KRT dimana KRT tersebut tidak pernah menempuh sekolah, maka anak tersebut sangat kecil kemungkinannya untuk menjadi pekerja anak, yaitu 0.01.
f. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tidak bersekolah lagi dan tinggal dalam rumah tangga dimana umur KRT tersebut diatas 80 tahun maka anak tersebut berpeluang lebih besar menjadi pekerja anak yaitu sebesar 0.62.
24
g. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tidak bersekolah lagi dan tinggal dalam rumah tangga dimana umur KRT tersebut dibawah 80 tahun maka anak tersebut berpeluang lebih besar menjadi pekerja anak yaitu sebesar 0.7.
h. 3.2708* BF11
� = + . . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tinggal dalam rumah tangga dimana KRT tersebut diatas SLTA, maka anak tersebut berpeluang sangat besar menjadi pekerja anak yaitu sebesar 0.98. Hal ini dapat terjadi pada rumah tangga yang mempunyai usaha sendiri, sehingga anak-anak berusia 10-17 tahun biasanya akan ikut membantu usaha tersebut. Pekerja anak ini dinamakan dengan pekerja keluarga.
i. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tidak sekolah lagi dan tinggal dalam rumah tangga dimana pengeluaran rumah tangga tersebut tergolong sedang, mempunyai peluang menjadi pekerja anak sebesar 0.36.
j. . ∗
� = + .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tidak sekolah lagi dan tinggal dalam rumah tangga dimana terdapat lebih dari dua anggota rumah tangga, maka anak tersebut mempunyai peluang menjadi pekerja anak sebesar 0.76.
k. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tidak sekolah lagi dan tinggal sendiri, maka anak tersebut mempunyai peluang menjadi pekerja anak sebesar 0.86.
l. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tinggal pada rumah tangga dimana KRT tersebut mempunyai pendidikan di atas SMA dan pengeluaran rumah tangga tersebut tergolong tinggi, maka peluang anak tersebut menjadi pekerja anak hanya 0.37. Peluang yang kecil ini dapat terjadi pada rumah tangga yang mempunyai usaha sendiri,
25
sehingga anak-anak berusia 10-17 tahun biasanya akan ikut membantu usaha tersebut. Pekerja anak ini dinamakan dengan pekerja keluarga.
m. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tinggal di rumah tangga dimana KRT tersebut telah menempuh pendidikan setelah SMA, dan umut KRT tersebut diatas 69 tahun, maka peluang seorang anak menjadi pekerja anak sebesar 0.6.
n. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tinggal di rumah tangga dimana KRT tersebut telah menempuh pendidikan setelah SMA, dan umut KRT tersebut dibawah 69 tahun, maka peluang seorang anak menjadi pekerja anak sebesar 0.7.
o. . ∗
� = + . . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang masih sekolah dan tinggal di rumah tangga dimana KRT tersebut telah berumur diatas 82 tahun, maka anak tersebut dapat dipastikan menjadi pekerja anak.
p. − . ∗
� = +− .− . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tinggal dalam rumah tangga dengan jumlah anggota rumah tangga diatas tiga dan pendidikan KRT tersebut belum sarjana maka anak tersebut berpeluang besar menjadi pekerja anak yaitu sebesar0.7.
q. . ∗
� = + . . + .+ . = .
Dengan asumsi peubah lainnya konstan, seorang anak yang tinggal sendiri, maka peluang anak tersebut menjadi pekerja anak sangat besar, yaitu 0.91.
26
5 SIMPULAN
Data tidak seimbang mempengaruhi ketepatan model klasifikasi yaitu akurasi model untuk salah satu kelas data menjadi rendah. Ketepatan klasifikasi untuk kelas bukan pekerja anak sangat tinggi yaitu 0.9978 untuk C5.0 dan 0.9957 untuk MARS, sedangkan ketepatan klasifikasi pekerja anak pada metode C5.0 dan MARS sangat rendah, yaitu 0.2105 dan 0.3158. Hal ini mengakibatkan model klasifikasi tidak dapat digunakan. Penggunaan metode Syntethic Minority Oversampling Technique (SMOTE) pada tahap pra pengolahan data meningkatkan ketepatan klasifikasi pekerja anak, yaitu 1.0 untuk metode C5.0 dan 0.9474 untuk MARS. Sedangkan metode Cost Sensitive Learning (CSL) meningkatkan ketepatan klasifikasi pekerja anak untuk metode C5.0 sebesar 0.9474.
Model terbaik berdasarkan nilai AUC tertinggi sebesar 0.9761 yaitu MARS SMOTE. Berdasarkan model terbaik, faktor-faktor yang berpengaruh terhadap pekerja anak antara lain Partisipasi Sekolah Anak, Tinggal dengan Orang Tua Kandung, Umur Kepala Rumah Tangga (KRT), Pendidikan KRT, Pengeluaran Rumah Tangga per Bulan, dan Jumlah Anggota Rumah Tangga. Partisipasi Sekolah Anak merupakan pengaruh utama dalam metode MARS SMOTE, dimana anak berumur 10-17 tahun yang tidak bersekolah lagi memiliki kecenderungan tinggi untuk menjadi pekerja anak dibandingkan anak yang masih bersekolah.
SARAN
Metode C5.0 memiliki kelemahan yaitu tidak memiliki kemampuan untuk mengatur pemilihan interaksi antar peubah seperti yang terdapat pada MARS. Peneliti yang menggunakan MARS dapat memilih peubah mana yang dapat berinteraksi atau tidak sehingga peubah-peubah yang seharusnya tidak boleh berinteraksi dapat dihindari seperti peubah Status Pekerjaan dan Jenis Pekerjaan. Oleh karena itu, pemilihan peubah pada analisis dengan metode C5.0 harus hati-hati sehingga tidak terjadi kesalahan interaksi antar peubah.
27