• Tidak ada hasil yang ditemukan

Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi

N/A
N/A
Protected

Academic year: 2017

Membagikan "Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi"

Copied!
48
0
0

Teks penuh

(1)

KLASIFIKASI ANAK PUTUS SEKOLAH

DENGAN MELIBATKAN PEUBAH JARINGAN SOSIAL

MENGGUNAKAN CART DI SULAWESI

DINA SRIKANDI

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa tesis berjudul Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Juni 2015

Dina Srikandi

(4)

RINGKASAN

DINA SRIKANDI. Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi. Dibimbing oleh ERFIANI dan BAGUS SARTONO.

Pendidikan merupakan salah satu hak anak sebagai generasi muda penerus bangsa yang harus dipenuhi oleh pemerintah. Menurut Undang-Undang No.23 Tahun 2002 pasal 4 tentang perlindungan anak, anak didefenisikan sebagai seseorang yang belum berusia 18 tahun. Salah satu hak anak yang harus dipenuhi oleh pemerintah adalah hak mendapatkan pendidikan. Keberhasilan pemerintah dalam memenuhi kewajibannya dapat dilihat dari seberapa besar angka putus sekolah di suatu daerah. Pada tahun 2012, seluruh provinsi di Pulau Sulawesi memiliki angka putus sekolah yang lebih tinggi dibandingkan angka rata-rata nasional, namun hal ini tidak terjadi untuk pulau besar lainnya di Indonesia.

Masalah putus sekolah di Sulawesi perlu diatasi dengan mengidentifikasi dan mencari faktor penyebab siswa putus sekolah, baik faktor sosial ekonomi dan demografi anak maupun faktor lingkungan khususnya pengaruh jaringan sosial dalam kehidupan anak, sehingga kebijakan yang diambil oleh pemerintah dapat tepat sasaran. Salah satu cara yang dapat dilakukan untuk mengetahui karakteristik anak putus sekolah adalah dengan melakukan klasifikasi anak putus sekolah umur 7-17 tahun dengan menggunakan metode pohon klasifikasi kemudian menerapkan teknik Bagging pada pohon klasifikasi yang dibangun.

Penelitian ini bertujuan mengetahui karakteristik anak putus sekolah di Sulawesi dengan melakukan klasifikasi terhadap anak putus sekolah usia 7-17 tahun. Klasifikasi disusun berdasarkan faktor sosial ekonomi dan demografi yang dimiliki anak kemudian menambahkan faktor jaringan sosial. Selanjutnya, akan dilihat pengaruh penambahan faktor tersebut kedalam pohon klasifikasi dengan melihat ketepatan klasifikasi yang dihasilkan.

Penelitian ini menunjukkan bahwa penambahan peubah jaringan sosial kedalam pohon klasifikasi meningkatkan ketepatan klasifikasi sebesar 23.6% dan penerapan teknik Bagging pada pohon CART tunggal dapat memperbaiki ketepatan klasifikasi sebesar 5.3%. Berdasarkan penelusuran klasifikasi yang terbentuk diperoleh beberapa karakteristik utama anak putus sekolah usia 7-17 tahun di Sulawesi yaitu mereka adalah anak-anak yang tinggal di lingkungan yang memiliki angka putus sekolah yang cukup tinggi, memiliki kepala rumah tangga yang tidak muda lagi serta tinggal dengan saudara yang juga putus sekolah.

(5)

SUMMARY

DINA SRIKANDI. Classification of Dropout Students by Involving Social Network Variables Using CART Method in Sulawesi. Supervised by ERFIANI and BAGUS SARTONO.

Education is one of the children’s rights as young generation successor to the nation that must be met by the government. According to Law No. 23 of 2002 Article 4 concerning the protection of children, child is defined as someone who hasn’t 18 years old. One of the rights of children which must be met by the government is the right to education. The government's success in meeting its obligations can be seen from how big the school dropout rate. One factor that can be measured by the low level of education is high dropout rates. In 2012, dropout rate for children 7-17 years old in all province at Sulawesi were still higher than national rate.

To overcome these problems, efforts are required to identify and search factors that cause of dropouts. The socio-economic and demographic factors or environmental factors, especially social network effect in children’s live, so that the measures taken by the government can be precisely targeted. To determine the characteristics of dropout students require to clasify the children 7-17 year old using classification and regression tree (CART) method and then apply the Bagging techniques.

This study aims to determine how the characteristics of dropout students 7-17 years old that more detailed in Sulawesi. Classification is built not only consider the socio-economic and demographic factors but also adds social network factors. Furthermore, it will be seen how the effect of these factors into the classification by looking the classification accuracy.

The results showed that by adding the social network variables into the classification tree increase of 23.6% classification accuracy and application of Bagging techniques on single CART can improve the classification accuracy of 5.3%. The classification obtained some of the main characteristics of dropout students 7-17 years old in Sulawesi ie they are children who live in an environment that has quite high dropout rate, has a head of household who was not young anymore, and live with brother who also dropped out of school.

(6)

© Hak Cipta Milik IPB, Tahun 2015

Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

(7)

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Sains

pada

Program Studi Statistika Terapan

KLASIFIKASI ANAK PUTUS SEKOLAH

DENGAN MELIBATKAN PEUBAH JARINGAN SOSIAL

MENGGUNAKAN CART DI SULAWESI

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2015

(8)
(9)

Judul Tesis : Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi

Nama : Dina Srikandi NIM : G152130494

Disetujui oleh Komisi Pembimbing

Dr Ir Erfiani, MSi Ketua

Dr Bagus Sartono Anggota

Diketahui oleh

Ketua Program Studi Statistika Terapan

Dr Ir Indahwati, MSi

Dekan Sekolah Pascasarjana

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian: 20 Juni 2015

(10)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga tesis yang berjudul “Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi” ini dapat diselesaikan.

Terima kasih penulis ucapkan kepada Ibu Dr Ir Erfiani, MSi dan Bapak Dr Bagus Sartono selaku pembimbing, atas kesediaan dan kesabaran untuk membimbing penulis dalam penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh dan mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan studi, serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan kerjasamanya selama ini. Di samping itu, penghargaan penulis sampaikan kepada rekan-rekan pegawai Badan Pusat Statistik yang telah membantu dalam pengumpulan data. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya.

Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Juni 2015

(11)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR v

DAFTAR LAMPIRAN v

1 PENDAHULUAN 1

Latar Belakang 1

Pertanyaan Penelitian 2

Tujuan Penelitian 3

2 TINJAUAN PUSTAKA 3

Jaringan Sosial 3

Classification And Regression Tree (CART) 4

Prosedur Pembentukan Pohon Klasifikasi 4

Pemangkasan Pohon Klasifikasi 5

Pemilihan Pohon Klasifikasi Optimal 6

Bootstrap Aggregating (Bagging) 6

3 METODE 7

Data 7

Unit Analisis 7

Peubah Penelitian 8

Metode Analisis 9

4 HASIL DAN PEMBAHASAN 11

Gambaran Umum Anak Putus Sekolah 11

Hubungan Peubah Penjelas dan Peubah Respon 16

Pohon Klasifikasi 18

Klasifikasi Tanpa Peubah Jaringan Sosial 19

Klasifikasi Dengan Peubah Jaringan Sosial 20

Perbandingan Pohon Klasifikasi tanpa Peubah Jaringan Sosial dan Pohon

Klasifikasi dengan Peubah Jaringan Sosial 24

Penerapan Teknik Bagging 25

Perbandingan Klasifikasi dengan Metode CART dan Bagging CART 28

5 SIMPULAN 28

DAFTAR PUSTAKA 29

LAMPIRAN 31

(12)

DAFTAR TABEL

1. Peubah Penjelas yang Digunakan Dalam Penelitian 8 2. Distribusi Persentase Status Bersekolah Anak Berdasarkan Jumlah

Anggota Rumah Tangga yang Tidak/Belum Bekerja di Sulawesi,

Tahun 2012 13

3. Distribusi Persentase Status Bersekolah Anak Berdasarkan Tingkat

Pendidikan Ibu di Sulawesi, Tahun 2012 14

4. Distribusi Persentase Status Bersekolah Anak Berdasarkan Status Pekerjaan Kepala Rumah Tangga (KRT) di Sulawesi, Tahun 2012 14 5. Persentase Anak Usia 7-17 Tahun yang Tidak Bersekolah Lagi

Menurut Alasannya 16

6. Nilai Koefisien Asosiasi dan Nilai-p yang diperoleh dari Hasil Tabulasi Silang antara Peubah Penjelas dan Peubah Respon 17 7. Hasil Uji-t pada Uji Beda Dua Rata-rata antara Peubah Penjelas dan

Peubah Respon 18

8. Tingkat Kepentingan Peubah pada Pohon Klasifikasi Optimal 19 9. Hasil Klasifikasi Data Testing pada Pohon Klasifikasi Optimal tanpa

Peubah Jaringan Sosial 20

10.Tingkat Kepentingan Peubah pada Pohon Klasifikasi Optimal

dengan Peubah Jaringan Sosial 21

11.Hasil Klasifikasi Data Testing pada Pohon Klasifikasi Optimal

dengan Menambahkan Peubah Jaringan Sosial 23

12.Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon

Klasifikasi dengan Peubah Jaringan Sosial 25

13.Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon Klasifikasi dengan Keputusan Putus Sekolah Jika Minimal 30% dari

Jumlah Pohon Memilih Kategori Putus Sekolah 27

14.Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon

(13)

DAFTAR GAMBAR

1. Diagram Alir Penelitian 10

2. Angka Putus Sekolah (APTS) Menurut Provinsi di Indonesia, Tahun

2012 11

3. Angka Putus Sekolah (APTS) Menurut Kabupaten di Pulau Sulawesi,

Tahun 2012 12

4. Persentase Anak Putus Sekolah Menurut Jenis Kelamin di Sulawesi,

Tahun 2012 13

5. Persentase Anak Putus Sekolah Menurut Status Ekonomi Rumah

Tangga di Sulawesi, Tahun 2012 15

6. Persentase Anak Putus Sekolah Menurut Klasifikasi Tempat Tinggal

di Sulawesi, Tahun 2012 15

7. Plot Biaya Relatif dengan Jumlah Simpul Terminal pada Klasifikasi

tanpa Peubah Jaringan Sosial 19

8. Plot Biaya Relatif dengan Jumlah Simpul Terminal pada Klasifikasi

dengan Peubah Jaringan Sosial 21

9. Pohon Klasifikasi Optimal dengan Peubah Jaringan Sosial 22 10.Perbandingan Ketepatan Klasifikasi antara Pohon Klasifikasi tanpa

Peubah Jaringan Sosial dan dengan Peubah Jaringan Sosial 24 11.Rata-rata Tingkat Kepentingan Peubah pada Pohon Klasifikasi

Gabungan dengan Pengulangan Sebanyak 125 kali 26

DAFTAR LAMPIRAN

1. Angka Putus Sekolah (APTS) di Sulawesi Menurut Kabupaten,

Tahun 2012 31

(14)
(15)

1

PENDAHULUAN

Latar Belakang

Pendidikan memiliki peran strategis dalam pembangunan nasional. Indonesia membutuhkan generasi muda yang memiliki kualitas pendidikan yang baik untuk menjadi bangsa yang maju dan mandiri. Generasi muda yang dimaksud tak lain adalah anak-anak Indonesia sebagai generasi penerus bangsa, sehingga sebagai perwujudannya berimplikasi pada perlunya pemberian perlindungan terhadap anak dan pemenuhan hak-haknya sebagaimana tertuang dalam Undang-Undang No.23 Tahun 2002 pasal 4 tentang perlindungan anak (Depdiknas 2009). Undang-undang ini adalah hasil ratifikasi dari konvensi hak-hak anak (Convention On The Rights of The Child) yang disahkan oleh Perserikatan Bangsa-Bangsa (PBB) pada tanggal 20 Nopember 1989. Dalam undang-undang tersebut anak adalah seseorang yang belum berusia 18 Tahun.

Pendidikan merupakan salah satu hak anak yang harus dipenuhi dan pemerintah memiliki kewajiban serta tanggung jawab dalam penyelenggaraan pendidikan, sehingga setiap anak Indonesia memiliki kesempatan yang sama dalam memperoleh pendidikan. Namun, pada kenyataannya tidak semua anak mempunyai kesempatan memperoleh pendidikan yang layak dan seluas-luasnya hingga menyebabkan mereka putus sekolah. Rendahnya tingkat pendidikan akan mendorong timbulnya berbagai permasalahan sosial (Rojani 2008).

Salah satu faktor yang menjadi indikator rendahnya tingkat pendidikan adalah tingginya angka putus sekolah. Apabila di suatu wilayah memiliki angka putus sekolah yang tinggi, maka dapat dikatakan wilayah tersebut memiliki tingkat pendidikan yang rendah. Seiring perkembangan pengetahuan dan teknologi, pendidikan dasar sembilan tahun dirasakan masih belum cukup untuk mendapatkan kualitas sumber daya manusia yang baik sehingga dalam penelitian ini anak putus sekolah yang diamati adalah anak yang putus pada jenjang pendidikan sekolah dasar hingga sekolah menengah.

Putus sekolah tidak hanya disebabkan oleh kondisi ekonomi anak namun juga dapat berasal dari kondisi lingkungan sekitarnya. Faktor lingkungan dapat berupa pola pikir masyarakat secara umum di sekitar tempat tinggal anak atau pun dari pengaruh orang-orang terdekat dalam kesehariannya. Interaksi anak dengan orang-orang disekitarnya atau sering dikenal sebagai jejaring sosial terdiri dari beberapa tingkatan mulai dari tingkatan terendah yaitu keluarga hingga tingkatan tertinggi yaitu Negara. Jaringan sosial adalah sebuah pola koneksi dalam hubungan sosial individu, kelompok dan berbagai bentuk kolektif lain. Sehingga jaringan sosial memiliki peranan penting dalam keberhasilan seseorang untuk mencapai tujuannya (Shakya et al. 2013).

(16)

2

yang menarik yaitu seluruh provinsi di Sulawesi memiliki angka putus sekolah lebih tinggi dibandingkan angka rata-rata nasional.

Agar dapat mengatasi masalah anak putus sekolah di Sulawesi, perlu dilakukan upaya untuk mengidentifikasi dan mencari faktor penyebab siswa putus sekolah baik faktor sosial ekonomi dan demografi anak maupun faktor lingkungan khususnya pengaruh jaringan sosial dalam kehidupan anak, sehingga kebijakan yang diambil oleh pemerintah dapat tepat sasaran. Salah satu cara yang dapat dilakukan untuk mengetahui karakteristik anak putus sekolah adalah dengan melakukan klasifikasi anak putus sekolah umur 7-17 tahun.

Dalam literatur statistika tersedia beberapa teknik atau metode untuk melakukan klasifikasi pada peubah respon biner antara lain regresi logistik (Agresti 2007), fungsi dikriminan (Johnson and Wichern, 2002) atau

Classification and Regression Tree (Izenman 2008). CART adalah salah satu metode klasifikasi nonparametrik yang dibangun dari data respon kategorik. Dibandingkan dengan regresi logistik dan fungsi dikriminan, CART memiliki kelebihan yaitu CART dapat menggunakan peubah yang sama lebih dari sekali di berbagai belahan pohon, kemampuan ini dapat mengungkap saling ketergantungan yang kompleks antar peubah (Timofeev 2004 and Gordon 2013).

Pemanfaatan metode CART dalam pengambilan keputusan telah banyak dilakukan pada berbagai bidang kehidupan, diantaranya dalam bidang kesehatan yaitu CART telah digunakan oleh IFPRI (The International Food Policy Research Institute) untuk mengidentifikasi indikator-indikator kerentanan terhadap kelaparan di tingkat rumah tangga dan regional di Afrika (Yohannes dan Webb, 1999). Selain itu, Andriyashin (2005), telah mengaplikasikan CART pada data finansial modern dan menyimpulkan bahwa CART merupakan suatu metode yang sangat bermanfaat dalam aplikasi finansial modern.

Menurut Sutton (2005) CART adalah pohon klasifikasi tunggal yang tidak stabil. Ketidakstabilan ini dikarenakan perubahan-perubahan kecil pada data learning akan sangat mempengaruhi hasil akurasi prediksi. Pada tahun 1996 Leo Brieman memperkenalkan tehnik bootstrap aggregating (Bagging) untuk mengatasi masalah tersebut. Bagging merupakan metode yang diterapkan pada algoritma klasifikasi, yang bertujuan meningkatkan akurasi pengklasifikasi dengan menggabungkan pengklasifikasi tunggal (Izenman 2008).

Dalam penelitian ini metode CART akan digunakan untuk membentuk klasifikasi anak putus sekolah usia 7-17 tahun di Sulawesi dengan melibatkan karakteristik yang berasal dari faktor lingkungan yaitu jaringan sosial yang dimiliki oleh anak usia 7-17 tahun. Kemudian menerapkan teknik Bagging pada pohon klasifikasi CART untuk meningkatkan ketepatan klasifikasi yang dihasilkan.

Pertanyaan Penelitian

Berdasarkan latar belakang yang telah dijelaskan sebelumnya, maka masalah yang dibahas dalam penelitian ini adalah:

1. Bagaimana pengaruh jaringan sosial pada pohon klasifikasi karakteristik anak putus sekolah usia 7-17 tahun dengan menggunakan metode CART? 2. Bagaimana pengaruh penerapan tehnik Bagging pada pohon klasifikasi

CART?

(17)

3

Tujuan Penelitian

Tujuan dari penelitian ini adalah:

1. Menyusun pohon klasifikasi karakteristik anak putus sekolah usia 7-17 tahun di Sulawesi dengan menggunakan metode CART dan melihat pengaruh peubah jaringan sosial pada pohon klasifikasi yang terbentuk. 2. Melihat pengaruh penerapan tehnik Bagging pada pohon klasifikasi

CART.

3. Mengidentifikasi karakteristik anak putus sekolah usia 7-17 tahun di Sulawesi.

2

TINJAUAN PUSTAKA

Jaringan Sosial

Jaringan sosial adalah sebuah struktur sosial yang menghubungkan individu satu dengan individu lainnya melalui dua mekanisme utama yaitu koneksi dan pengaruh dari koneksi tersebut yang pada akhirnya akan mempengaruhi perilaku atau keputusan yang diambil oleh individu tersebut (Shakya et al. 2013).

Pemanfaatan jaringan sosial dalam membantu pengambilan keputusan telah banyak dilakukan oleh peneliti sebelumnya. Mansur and Yusof (2012) dalam penelitiannya menggunakan Social Network Analysis (SNA) untuk mengklasifikasikan perilaku siswa. Dalam perspektif sosial, hal utama yang mempengaruhi perilaku remaja adalah sikap dan perilaku teman-temannya yang berada di sekitarnya. Lingkungan sekitar memberikan pengaruh yang cukup besar sehingga didapatkan bahwa angka putus sekolah yang tinggi banyak ditemukan di lingkungan miskin (Crane 1991). Menurut De Witte et al. (2012), resiko putus sekolah dipengaruhi oleh faktor komunitas yaitu karakteristik lingkungan, jaringan antar teman (friends networks), kondisi pekerjaan dalam keluarga dan diskriminasi sosial.

Selain dalam bidang pendidikan, jaringan sosial juga dimanfaatkan dalam bidang ekonomi. Provost et al. (2009) menggunakan metode privacy friendly

social network untuk mengetahui kecenderungan konsumen dalam memilih merk

suatu produk melalui iklan yang ditayangkan pada sebuah situs internet. Kecenderungan seseorang memilih produk dapat dilihat melalui interaksi sosial yang dilakukan pada situs tersebut dan didapatkan bahwa orang yang memiliki hubungan kekerabatan dan hubungan sosial yang serupa memiliki kecenderungan yang sama dalam memilih suatu produk. Dengan demikian perilaku seseorang dalam mengambil keputusan dapat dipengaruhi oleh perilaku orang lain yang berada disekitarnya.

(18)

4

Classification And Regression Tree (CART)

CART adalah salah satu metode dasar dalam metode pohon keputusan. Bentuk CART bergantung pada peubah respon yang digunakan. Jika peubah respon yang digunakan adalah data kategorik maka CART menghasilkan pohon klasifikasi dan jika peubah responnya berupa data kontinu maka CART menghasilkan pohon regresi.

Sebelum membangun sebuah pohon keputusan, data terlebih dahulu dipilah menjadi data learning dan data testing. Pembagian dapat dilakukan dengan proporsi data learning sebesar 90% dan data testing sebesar 10%. Data learning akan digunakan untuk membangun pohon keputusan dan data testing akan digunakan untuk validasi. Validasi dilakukan untuk melihat seberapa besar tingkat akurasi dari prediksi yang dilakukan oleh CART (Duda et al. 2000).

Prosedur Pembentukan Pohon Klasifikasi

Dalam membentuk sebuah pohon klasifikasi terdapat beberapa hal penting yang perlu diketahui yaitu peubah yang akan dijadikan pemilah dan nilai mana dari peubah tersebut yang menjadi pemilahnya serta ukuran pohon yang tepat sehingga pohon yang terbentuk memiliki kemampuan menduga terbaik. Prosedur pembentukan pohon klasifikasi terbagi kedalam tiga tahap yaitu:

1. Penentuan pemilah

Tahapan pemilihan pemilah (Izenman 2008) :

a. Menentukan jumlah kemungkinan pemilah yang terbentuk pada satu peubah.

Setiap simpul akan dipilah menjadi dua bagian. Terdapat beberapa kemungkinan untuk menentukan nilai atau kriteria yang akan digunakan sebagai pemilah pada satu peubah. Kemungkinan pemilah yang terbentuk bergantung pada jenis peubah yang akan menjadi pemilah. Pada peubah ordinal atau kontinu, jumlah kemungkinan pemilah yang terbentuk adalah M-1 dengan M adalah banyaknya nilai yang berbeda pada peubah yang menjadi kandidat pemilah dan untuk peubah nominal atau kategorik, jumlah kemungkinan pemilah yang terbentuk adalah 2M-1 – 1 dengan M adalah banyaknya kategori pada suatu peubah.

b. Menentukan fungsi impuritas

Pohon klasifikasi dibentuk dengan memilah setiap simpul menjadi dua bagian (simpul kanan dan simpul kiri) dengan tujuan agar nilai-nilai amatan pada peubah respon yang terdapat pada setiap bagian menjadi lebih homogen dibandingkan sebelum dilakukan pemilahan.

Metode yang digunakan untuk mengukur penurunan tingkat keheterogenan pada setiap simpul adalah indeks Gini dengan fungsi sebagai berikut.

( ) = ( | ) ( | )

(19)

5 c. Menentukan pemilah terbaik untuk satu peubah

Setelah memilih metode pengukuran tingkat keheterogenan kemudian memilih pemilah terbaik berdasarkan kriteria goodness of split

yang didefinisikan sebagai ∆ ( , ) = ( ) − . ( ) − . ( ) = proporsi pengamatan pada simpul kanan ( ) = nilai indeks gini pada simpul kiri

( ) = nilai indeks gini pada simpul kanan

Nilai ∆ ( , ) dihitung pada seluruh kemungkinan pemilah yang ada. Pemilah terbaik untuk satu peubah adalah pemilah yang menghasilkan nilai ∆ ( , ) terbesar. Pada masing-masing simpul, langkah a-c dilakukan untuk seluruh peubah kemudian peubah yang terpilih menjadi pemilah pada suatu simpul adalah peubah yang memiliki nilai ∆( , ) terbesar diantara peubah-peubah penjelas yang ada.

2. Pembentukan simpul terminal

Pemilahan simpul pada pembentukan pohon klasifikasi dilakukan hingga setiap simpul terpilah menjadi dua anak simpul (binary tree) dan memiliki tingkat keheterogenan terendah sehingga simpul tersebut tidak dapat dipilah lagi kemudian menjadi simpul terminal. Pada kasus ekstrim namun jarang terjadi, pohon klasifikasi dipilah hingga pada setiap simpul hanya terdapat 1 amatan. Metode lain yang dapat digunakan untuk membentuk simpul terminal adalah dengan menentukan jumlah amatan minimum pada simpul terminal yaitu 5 amatan atau dengan menetapkan besar persentase dari sejumlah data training misal 5 persen. (Duda et al. 2000)

3. Penentuan label kelas pada simpul terminal

Pemberian label kelas pada simpul terminal dilakukan berdasarkan aturan jumlah terbanyak.

Pemangkasan Pohon Klasifikasi

Pohon klasifikasi yang telah dibentuk adalah pohon klasifikasi maksimal (Tmax). bila pohon yang terbentuk sangat besar maka dapat dilakukan

pemangkasan (Prunning). Pemangkasan dilakukan dengan pendekatan

misclassification rate pada setiap simpul. Ukuran pemangkasan yang digunakan untuk memperoleh ukuran pohon yang layak adalah Cost complexity pruning

yaitu:

( ) = ( ) +

dengan,

(20)

6

= ukuran banyaknya simpul terminal pohon T

Untuk setiap α kita memilih sub pohon T(α) dari Tmax yang dapat

meminimumkan ( ) yaitu,

( ( ) ) = min ( )

Jika sub pohon yang terbentuk memenuhi kondisi tersebut maka sub pohon yang terbentuk disebut pohon klasifikasi optimal.

Nilai α menentukan ukuran pohon yang terbentuk. Jika α=0 maka pohon yang dibangun adalah Tmax dimana pada setiap simpul hanya terdapat satu amatan

atau dengan kata lain R(Tmax)=0. Jika α sangat besar maka pohon maksimal (Tmax)

akan dipangkas hingga yang tersisa hanya simpul utama (Izenman 2008).

Pemilihan Pohon Klasifikasi Optimal

Berdasarkan Tmaxyang diperoleh, kita dapat membangun sebanyak T1, T2, T3,……, TM sub pohon dimana TM adalah sub pohon yang hanya terdiri atas

simpul utama dan nilai α1<α2<α3<….<αM. Kemudian dari seluruh kemungkinan

sub pohon yang terbentuk, dipilih satu sub pohon yang merupakan pohon klasifikasi optimal terbaik. Metode yang digunakan yaitu,

1. Independent test Set

Uji ini digunakan bila ukuran data yang dimiliki terbilang besar. 2. Cross-Validation

Uji ini digunakan bila ukuran data yang dimiliki relatif kecil.

Bootstrap Aggregating (Bagging)

Bagging adalah metode pertama yang berhasil meningkatkan akurasi dari algoritma tunggal dengan menggabungkan beberapa algoritma tunggal sehingga dapat mereduksi keragaman dari peubah penjelas. Tehnik Bagging cenderung memberikan peningkatan akurasi yang nyata bila diterapkan pada peubah penjelas yang tidak stabil, namun bila peubah penjelas telah stabil maka hasil yang diperoleh tidak akan jauh berbeda.

Bagging CART adalah penerapan prosedur Bagging pada algoritma CART. Tehnik Bagging akan memberikan banyak versi peubah penjelas yang kemudian digabungkan. Dalam kasus klasifikasi, diambil contoh bootstrap sebanyak B contoh dari data learning dengan pemulihan. B adalah banyaknya replikasi yang dilakukan dalam teknik Bagging. Kemudian pada setiap contoh bootstrap tersebut diterapkan metode CART untuk menghasilkan prediksi kelas. Prediksi akhir merupakan kelas yang paling sering terjadi pada hasil prediksi B contoh bootstrap atau disebut

(21)

7

3

METODE

Data

Data yang digunakan adalah data individu hasil Survei Sosial Ekonomi Nasional (SUSENAS). Susenas merupakan survei yang dirancang untuk mengumpulkan data sosial kependudukan dan dilaksanakan setiap tahun. Kuesioner Susenas terdiri atas Susenas Kor dan Susenas Modul. Susenas Kor berisi pertanyaan yang berkaitan dengan pendidikan, kesehatan, perumahan dan pertanyaan lainnya yang bersifat umum, sedangkan Susenas Modul berisi pertanyaan mengenai pengeluaran konsumsi rumah tangga (BPS 2003). Pada penelitian ini data yang digunakan adalah data yang bersumber dari Susenas Kor seluruh provinsi di Sulawesi pada Tahun 2012 yaitu Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, dan Sulawesi Barat.

Sejak pertama kali dilaksanakan pada Tahun 1963, metode pengumpulan data Susenas mengalami beberapa kali perubahan. Pada Tahun 1963-1978 Susenas rutin dilakukan 2 tahun sekali, dengan cakupan hanya wilayah Pulau Jawa. Pada Tahun 1978-2004, Susenas rutin dilakukan ditiap pertengahan tahun dengan cakupan seluruh provinsi di Indonesia. Kemudian Tahun 2005-2010 pelaksanaan Susenas berubah menjadi 2 kali dalam setahun. Sejak Tahun 2011, Susenas dilaksanakan setiap triwulan untuk pendugaan tingkat nasional dan provinsi kemudian contoh kumulatif dari 4 triwulan tersebut digunakan untuk melakukan pendugaan pada tingkat kabupaten/kota.

Metode sampling yang digunakan yaitu penarikan contoh tiga tahap dengan strata (three stage stratified sampling). Tahapan dari metode ini diuraikan sebagai berikut :

1. Tahap pertama, memilih wilayah pencacahan (wilcah) dari secara pps

(Probability Proportional to Size) dengan size banyaknya rumah tangga SP2010. Wilcah adalah gabungan dari beberapa blok sensus, yang memiliki jumlah muatan rumah tangga seragam dan saling berdekatan. Status wilayah perkotaan dan perdesaan dijadikan sebagai strata yang harus ada perwakilannya dalam wilcah terpilih.

2. Tahap kedua, memilih BS pada setiap wilcah terpilih secara pps dengan size

jumlah rumah tangga SP2010. Selanjutnya blok terpilih Susenas dialokasikan ke 4 triwulan.

3. Tahap ketiga, dari setiap blok sensus terpilih, dipilih 10 rumah tangga biasa secara sistematik berdasarkan hasil pemutakhiran rumah tangga.

Pada tahun 2012 contoh untuk Pulau Sulawesi adalah sebanyak 37 393 rumah tangga. Jumlah contoh ini adalah kumulatif dari pengumpulan data yang diambil setiap triwulan, sehingga ada kemungkinan dalam satu tahun data triwulan awal sudah berubah ketika dianalisis pada triwulan akhir. Dalam penelitian ini dianggap perubahan tersebut tidak terjadi.

Unit Analisis

(22)

8

yakni sebanyak 36 900 anak. Kemudian dari 36 900 anak diperoleh sebanyak 410 anak yang berstatus tidak pernah sekolah dan 36 490 anak yang masih bersekolah atau tidak bersekolah lagi. Penyeleksian dilanjutkan untuk memperoleh anak yang berstatus masih bersekolah atau tidak bersekolah lagi yang tinggal bersama ibu kandung dan diperoleh sebanyak 31 335 anak. Selanjutnya diamati anak yang tidak tamat SD/sederajat, SMP/sederajat, dan SMA/sederajat sebagai unit analisis yakni 11 094 anak.

Dengan demikian anak putus sekolah pada penelitian ini didefinisikan sebagai anak yang berusia 7-17 tahun dengan partisipasi sekolah tidak bersekolah lagi namun belum menyelesaikan pendidikan pada jenjang terakhir yang didudukinya yaitu SD/sederajat, SMP/sederajat, atau SMA/sederajat.

Peubah Penelitian

Berikut ini merupakan peubah-peubah yang digunakan dalam penelitian ini. Peubah respon (Y) adalah status kelangsungan pendidikan anak dan peubah penjelas yang terdiri atas 9 peubah disajikan pada Tabel 2.

Peubah respon

Y: Status kelangsungan pendidikan anak

1 = Putus sekolah adalah anak yang tidak bersekolah lagi 2 = Tidak Putus Sekolah adalah anak yang masih bersekolah Tabel 1 Peubah Penjelas yang Digunakan Dalam Penelitian

Nama

Peubah Keterangan Kriteria

X1 Jenis Kelamin 1 = Laki-laki

X4 Tingkat Pendidikan Ibu 1=Tidak pernah sekolah atau

tidak tamat SD

2=Tamat SD/sederajat atau SMP/sederajat

3=Tamat SMA/sederajat ke atas X5 Status Pekerjaan Kepala Rumah

Tangga

1 = Pekerja formal 2 = Pekerja informal 3 = Tidak bekerja

X6 Status Ekonomi 1 = Jika pengeluaran rumah

tangga perkapita berada di bawah garis kemiskinan 2 = Jika pengeluaran rumah

(23)

9

Nama

Peubah Keterangan Kriteria

X7 Klasifikasi daerah tempat tinggal 1 = Perkotaan

2 = Perdesaan X8 Kepemilikan saudara yang putus

sekolah dan tinggal serumah 1 = Ya 2 = Tidak X9 Persentase Anak Putus Sekolah di

Blok Sensus (BS)1 tempat tinggal Anak

Metode Analisis

Langkah-langkah analisis data yang dilakukan dalam penelitian ini adalah sebagai berikut:

1. Analisis data dengan menggunakan peubah penjelas X1-X7

Membangun pohon klasifikasi dengan CART, dengan langkah-langkah sebagai berikut :

i. Memisahkan data penelitian menjadi 2 (dua) bagian yaitu data learning

dan data testing.

ii. Membentuk pohon klasifikasi dengan menggunakan data learning.

iii. Penghentian pembentukan pohon klasifikasi jika banyaknya objek dalam simpul terminal sebanyak 5.

iv. Pemangkasan pohon klasifikasi.

v. Pemilihan pohon klasifikasi optimal melalui Independent test Set.

vi. Pemilihan pohon klasifikasi terbaik dengan menggunakan kriteria test relative cost.

vii. Menguji keakuratan pohon klasifikasi dengan menjalankan data testing

kedalam pohon klasifikasi sehingga dihasilkan angka ketepatan klasifikasi. 2. Analisis data dengan menggunakan peubah penjelas X1-X9

Ulangi langkah i-vii pada tahapan 1.

3. Membandingkan ketepatan klasifikasi yang dihasilkan pada tahapan 1 dan 2, pilih pohon klasifikasi CART yang memiliki ketepatan klasifikasi yang lebih baik.

4. Penerapan Bagging CART pada pohon klasifikasi terpilih pada tahapan 3. 5. Membandingkan ketepatan klasifikasi yang dihasilkan oleh CART tunggal

dan hasil klasifikasi dengan Bagging CART.

1

(24)

10

Gambaran mengenai alur metode analisis yang akan digunakan dapat dilihat pada Gambar 1

Gambar 1 Diagram Alir Penelitian

Ya

Tidak

Jalankan data testing pada pohon klasifikasi dan hitung ketepatan klasifikasi antara CART set dat X1-X7 dan set data X1-X9

Lakukan Bagging CART pada data learning dan bentuk pohon klasifikasi Dibentuk learning dan data testing

(25)

11

4

HASIL DAN PEMBAHASAN

Gambaran Umum Anak Putus Sekolah

Salah satu cara untuk mengukur tingkat keberhasilan suatu daerah di bidang pendidikan adalah melalui angka putus sekolah. Semakin kecil angka putus sekolah pada suatu daerah dapat menjadi indikasi keberhasilan pemerintah dalam menerapkan kebijakan-kebijakan di bidang pendidikan yang bertujuan menekan angka putus sekolah. Pada tahun 2012, angka putus sekolah anak usia 7-17 tahun secara nasional tercatat sebesar 2.72%. Hal yang menarik adalah lima provinsi di pulau Sulawesi yaitu Sulawesi Utara (4.52%), Sulawesi Tengah (4.71%), Sulawesi Selatan (3.84%), Sulawesi Tenggara (4.54%), Gorontalo (7.09%), dan Sulawesi Barat (7.01%), seluruhnya berada di atas angka rata-rata nasional, sebagaimana terlihat pada Gambar 2.

Bila dibandingkan antar provinsi, Sulawesi Selatan adalah provinsi dengan angka putus sekolah terendah di Sulawesi dan Gorontalo merupakan provinsi dengan angka putus sekolah tertinggi sebelum Sulawesi Barat. Seperti yang telah diketahui bahwa dua daerah ini adalah provinsi yang terbilang baru dalam pembentukannya sehingga masih dalam tahap pembenahan disegala bidang termasuk pada bidang pendidikan. Gorontalo dan Sulawesi Barat merupakan daerah pemekaran dari provinsi induknya yaitu Sulawesi Utara dan Sulawesi Selatan. Bila dilihat lebih rinci menurut kabupaten, angka putus sekolah di pulau Sulawesi memiliki keragaman yang cukup tinggi antar kabupaten dengan angka putus sekolah terendah sebesar 1.32% di kabupaten Toraja Utara (Sulawesi Selatan) dan tertinggi 11.27% di kabupaten Gorontalo Utara (Gorontalo). Sebaran anak putus sekolah di Sulawesi dapat dilihat pada Gambar 3.

(26)

12

Sebagaimana yang telah dijelaskan pada bab sebelumnya bahwa data yang digunakan adalah data Susenas 2012 di lima provinsi di Sulawesi. Berdasarkan hasil survei diperoleh banyaknya contoh anak berusia 7-17 tahun yang pernah/sedang bersekolah dan menjadi unit analisis dalam penelitian ini sebanyak 11 094 anak. Selanjutnya dari jumlah tersebut, anak yang putus sekolah diperoleh sebanyak 1 083 anak atau sekitar 9.7%. Bila ditinjau berdasarkan jenis kelamin, dari 5 880 anak usia sekolah yang berjenis kelamin laki-laki terdapat 12.70% anak putus sekolah, sementara itu dari 5 214 anak usia sekolah yang berjenis kelamin perempuan terdapat 6.44% anak putus sekolah. Hal ini menunjukkan bahwa proporsi anak laki-laki yang putus sekolah lebih besar dibandingkan dengan anak perempuan. Selengkapnya dapat dilihat pada Gambar 4. Di Sulawesi, anak laki-laki lebih banyak berhenti sekolah kemudian bekerja untuk membantu ekonomi keluarga, berdasarkan Susenas 2012 diperoleh bahwa anak laki-laki usia 10-17 tahun di Sulawesi yang bekerja sebanyak 33.23% sedangkan anak perempuan hanya sebesar 7.15%.

(27)

13

Gambar 4 Persentase Anak Putus Sekolah Menurut Jenis Kelamin di Sulawesi, Tahun 2012

Secara ekonomi semakin banyak anggota rumah tangga akan semakin banyak biaya yang dikeluarkan. Anggota rumah tangga yang belum bekerja menjadi tanggungan bagi yang sudah bekerja. Sehingga besarnya beban ketergantungan dalam satu rumah tangga sebanding dengan banyaknya anggota rumah tangga yang tidak/belum bekerja. Pada masyarakat yang memiliki tingkat ekonomi menengah kebawah, pemenuhan kebutuhan akan pendidikan bukan merupakan prioritas utama sehingga bila beban ekonomi yang harus ditanggung cukup besar pemenuhan pendidikan bagi anak akan dikesampingkan (Nurdinawati 2013). Hal ini juga tercermin pada kondisi anak putus sekolah di Sulawesi yang disajikan pada Tabel 2. Berdasarkan hasil Susenas, anak yang tinggal di rumah tangga dengan jumlah tanggungan yang sedikit memiliki proporsi putus sekolah yang lebih rendah dibandingkan anak yang tinggal di rumah tangga yang jumlah tanggungannya sebanyak 4-6 orang. Demikian halnya dengan anak yang tinggal dengan rumah tangga yang jumlah tanggungannya sedang (4-6 orang) memiliki proporsi anak putus sekolah yang lebih rendah dibandingkan anak yang tinggal di rumah tangga yang jumlah tanggungannya banyak (> 6 orang).

Tabel 2 Distribusi Persentase Status Bersekolah Anak Berdasarkan Jumlah Anggota Rumah Tangga yang Tidak/Belum Bekerja di Sulawesi, Tahun 2012

Jumlah ART yang Tidak/Belum

Bekerja

Status Bersekolah

Jumlah Putus Sekolah Tidak Putus Sekolah

< 4 orang 8.36 91.64 100.00

4-6 orang 10.52 89.48 100.00

> 6 orang 10.79 89.21 100.00

(28)

14

Pendidikan yang berhasil dicapai oleh seorang anak tidak terlepas dari peran orang tua. Pendidikan orangtua memberikan pengaruh yang kuat terhadap wawasan tentang arti penting pendidikan bagi anak. Orangtua yang berpendidikan cenderung melakukan investasi pendidikan bagi anak mereka (Sclutz 1989). Ibu sebagai orang tua yang lebih dekat dengan anak memiliki peran utama dalam mendidik anak-anaknya. Jika dilihat dari tingkat pendidikan ibu yang disajikan pada Tabel 3, proporsi anak putus sekolah usia 7-17 tahun paling tinggi terdapat pada anak yang ibunya berpendidikan rendah, yaitu tidak memiliki ijazah/STTB Sekolah Dasar (SD). Demikian halnya proporsi putus sekolah pada anak dengan ibu yang berpendidikan menengah (memiliki ijzah SD-SMP) lebih besar dibandingkan dengan anak yang ibunya berpendidikan tinggi (minimal memiliki ijazah SMA). Tabel 3 Distribusi Persentase Status Bersekolah Anak Berdasarkan Tingkat

Pendidikan Ibu di Sulawesi, Tahun 2012 Tingkat

Pendidikan Ibu

Status Bersekolah

Jumlah Putus Sekolah Tidak Putus Sekolah

< SD 15.09 84.91 100.00

SD - SMP 7.88 92.12 100.00

≥ SMA 4.38 95.62 100.00

Jumlah 9.76 90.24 100.00

Berdasarkan Tabel 3 terlihat bahwa proporsi anak putus sekolah yang tinggal dengan kepala rumah tangga yang bekerja di sektor formal lebih kecil jika dibandingkan dengan anak yang tinggal dengan kepala rumah tangga yang bekerja di sektor informal. Demikian halnya jika dibandingkan dengan anak yang tinggal dengan kepala rumah tangga yang tidak bekerja. Dalam hal ini dapat dikatakan, semakin baik pekerjaan kepala rumah tangga maka proporsi anak putus sekolah akan semakin kecil. Hal ini sejalan dengan penelitian Rojani (2008) yang menyatakan bahwa angka melanjutkan sekolah bagi anak yang kepala rumah tangganya bekerja di sektor formal lebih besar daripada informal pada setiap jenjang pendidikan.

Tabel 4 Distribusi Persentase Status Bersekolah Anak Berdasarkan Status Pekerjaan Kepala Rumah Tangga (KRT) di Sulawesi, Tahun 2012 Status Pekerjaan

KRT

Status Bersekolah

Jumlah Putus Sekolah Tidak Putus Sekolah

Tidak Bekerja 12.12 87.88 100.00

Informal 10.49 89.51 100.00

Formal 7.19 92.81 100.00

Jumlah 9.76 90.24 100.00

(29)

15 pendapatan keluarga memiliki pengaruh yang cukup besar pada jumlah pendaftar sekolah di jenjang pendidikan dasar, menengah, dan tinggi. Hasil penelitian lain mengatakan bahwa tingkat kesejahteraan keluarga merupakan salah satu faktor dominan dalam menentukan keputusan seorang anak akan tetap bersekolah atau putus sekolah (Hilliry 1995).

Gambar 5 Persentase Anak Putus Sekolah Menurut Status Ekonomi Rumah Tangga di Sulawesi, Tahun 2012

Jika ditelusuri berdasarkan wilayah tempat tinggal anak yang disajikan pada Gambar 6, dari 2 568 anak usia 7-17 tahun yang tinggal di perkotaan terdapat 7,87% yang harus mengalami putus sekolah, sedangkan di wilayah pedesaan angka putus sekolahnya mencapai 10,33% dari sekitar 8 526 anak yang masih termasuk usia sekolah. Hal ini dimungkinkan akibat kurangnya fasilitas sekolah di pedesaan dan lebih banyaknya penduduk miskin di pedesaan. Menurut hasil Susenas 2012 di Sulawesi, penduduk miskin yang tinggal di pedesaan sebesar 22.66% sementara yang tinggal di perkotaan sebesar 12.27%.

(30)

16

Banyak faktor yang dapat menjadi penyebab anak usia 7-17 tahun mengalami putus sekolah, baik dari faktor sosial ekonomi maupun demografi. Bila ditelusuri lebih dalam mengenai alasan mengapa mereka pada akhirnya harus berhenti ditengah jalan sebelum menyelesaikan jenjang pendidikan yang pernah didudukinya, didapatkan bahwa dari 9.7% anak putus sekolah, sebanyak 30.66% berhenti karena harus bekerja atau mencari nafkah kemudian sebanyak 24.75% beralasan tidak memiliki biaya untuk melanjutkan sekolah. Dengan demikian lebih dari separuh anak yang putus sekolah disebabkan oleh faktor ekonomi. Selengkapnya dapat dilihat pada Tabel 5.

Tabel 5 Persentase Anak Usia 7-17 Tahun yang Tidak Bersekolah Lagi Menurut Alasannya

No. Uraian Persentase

1 Tidak ada biaya 24.75

2 Bekerja atau mencari nafkah 30.66

3 Menikah atau mengurus rumah tangga 3.23

4 Merasa pendidikan cukup 15.70

5 Malu karena ekonomi 2.77

6 Sekolah jauh 11.73

7 Cacat 0.09

8 Lainnya 11.08

Hubungan Peubah Penjelas dan Peubah Respon

Setelah mengetahui gambaran umum mengenai karakteristik anak putus sekolah usia 7-17 tahun di Sulawesi selanjutnya dilakukan pengujian terhadap sembilan peubah penjelas yang diduga memiliki hubungan dengan peubah respon yaitu status bersekolah anak usia 7-17 tahun. Pengaruh peubah penjelas yang berskala kategorik yaitu jenis kelamin, jumlah anggota rumah tangga yang tidak/belum bekerja, tingkat pendidikan ibu, status pekerjaan kepala rumah tangga, status ekonomi rumah tangga, klasifikasi daerah tempat tinggal, dan kepemilikan saudara putus sekolah yang tinggal serumah terhadap status sekolah anak usia 7-17 tahun akan diuji satu per satu dengan menggunakan tabulasi silang. Hipotesis untuk masing-masing pasangan peubah respon dan peubah penjelas adalah sebagai berikut:

H0 : Tidak ada hubungan antara peubah status sekolah anak usia 7-17 tahun

dengan peubah jenis kelamin, jumlah anggota rumah tangga yang tidak/belum bekerja, tingkat pendidikan ibu, status pekerjaan kepala rumah tangga, status ekonomi rumah tangga, klasifikasi daerah tempat tinggal, dan kepemilikan saudara putus sekolah yang tinggal serumah.

H1 : Ada hubungan antara peubah status sekolah anak usia 7-17 tahun dengan

(31)

17 Tabel 6 Nilai Koefisien Asosiasi dan Nilai-p yang diperoleh dari Hasil Tabulasi

Silang antara Peubah Penjelas dan Peubah Respon Uraian Peubah Penjelas Koefisiaen

Asosiasi Nilai-p

Jenis Kelamin 0.105 0.000

Jumlah ART yang Tidak/Belum Bekerja 0.140 0.000

Tingkat Pendidikan Ibu 0.152 0.000

Status Pekerjaan KRT 0.051 0.000

Status Ekonomi 0.068 0.000

Kalsifikasi Daerah Tempat Tinggal 0.035 0.000 Kepemilikan Saudara Putus Sekolah 0.298 0.000

Hasil pada Tabel 6, memberikan kesimpulan yang sama untuk seluruh peubah penjelas yakni menolak H0 pada taraf nyata 0.05.Hal ini berarti peubah

status bersekolah anak usia 7-17 tahun memiliki hubungan dengan peubah jenis kelamin, jumlah anggota rumah tangga yang tidak/belum bekerja, tingkat pendidikan ibu, status pekerjaan kepala rumah tangga, status ekonomi rumah tangga, klasifikasi daerah tempat tinggal, dan kepemilikan saudara putus sekolah yang tinggal serumah. Namun demikian, seperti terlihat pada besarnya koefisien asosiasi, keeratan hubungan yang dimiliki oleh masing-masing peubah penjelas dengan peubah status sekolah anak sangat kecil. Artinya walaupun hubungan antara peubah penjelas dengan status sekolah anak itu nyata secara statistik tetapi secara praktis nampaknya tidak bermakna. Ini terjadi ketika jumlah contoh sangat besar seperti pada kasus ini.

Selanjutnya, untuk melihat hubungan peubah penjelas yang berskala rasio yaitu umur kepala rumah tangga dan persentase anak putus sekolah di blok sensus tempat tinggal anak dengan peubah respon digunakan uji beda rata-rata.

Hipotesis uji beda dua rata-rata antara peubah umur kepala rumah tangga dan status bersekolah anak usia 7-17 tahun adalah sebagai berikut:

H0: μ1- μ2 = 0

Artinya, rata-rata umur kepala rumah tangga dari anak yang berstatus putus sekolah dan tidak putus sekolah adalah sama.

H1: μ1- μ2≠ 0

Artinya, rata-rata umur kepala rumah tangga dari anak yang berstatus putus sekolah dan tidak putus sekolah adalah tidak sama.

(32)

18

Tabel 7 Hasil Uji-t pada Uji Beda Dua Rata-rata dari Status Sekolah Anak untuk masing-masing Peubah Penjelas

Pada Tabel 7, hasil uji beda dua rata-rata untuk kedua peubah penjelas memberikan kesimpulan yang sama yakni tolak H0 pada taraf nyata 0.05. Hal ini

menunjukkan bahwa peubah rata-rata umur kepala rumah tangga dan persentase anak putus sekolah di Blok Sensus tempat tinggal anak dari anak yang berstatus putus sekolah dan tidak putus sekolah adalah tidak sama.

Pohon Klasifikasi

Pembentukan klasifikasi dengan membangun pohon klasifikasi CART diawali dengan membagi data menjadi data learning dan data testing. Secara khusus belum ada literatur yang menyebutkan berapa proporsi terbaik antara data

learning dan data testing, namun proporsi data learning harus lebih besar dibandingkan data testing (Breiman 1984 dalam Duda et al. 2000). Pada penelitian ini proporsi data learning dan testing masing-masing adalah 80% dan 20% atau masing-masing sebanyak 8.735 dan 2.359 contoh. Pohon klasifikasi dikembangkan dengan menggunakan metode pemilahan gini sebagai kriteria pemilahan (goodness of split) dan kriteria penghentian pembentukan pohon dipilih berdasarkan jumlah pengamatan dalam tiap simpul anak minimal 5 (Duda

et al. 2000).

Pembentukan pohon klasifikasi dimulai dengan pembentukan pohon klasifikasi maksimal yang menghasilkan pohon klasifikasi yang sangat besar dengan struktur data yang kompleks. Hal ini akan menyebabkan nilai kompleksitas yang tinggi sehingga perlu dilakukan pemangkasan untuk mendapatkan pohon optimum yang berukuran sederhana. Pemangkasan dilakukan dengan menggunakan kaidah biaya relatif gugus pengujian (test set relative cost)

terkecil yang dihitung dengan pendekatan dugaan contoh uji (test sample estimate).

Sesuai dengan tujuan penelitian yang telah dijelaskan sebelumnya bahwa penelitian ini ingin mengetahui pengaruh penambahan peubah jaringan sosial pada pohon klasifikasi CART yang dibangun. Klasifikasi akan dilakukan dengan terlebih dahulu membangun pohon klasifikasi CART tanpa memasukkan peubah jaringan sosial kemudian membangun pohon klasifikasi CART dengan memasukkan peubah jaringan sosial. Berikut adalah hasil dari pembentukan pohon klasifikasi.

Uraian Peubah Penjelas t-hitung Nilai-p

Umur Kepala Rumah Tangga 8.79 0.000

Persentase Anak Putus Sekolah di Blok Sensus Tempat Tinggal Anak

(33)

19

Klasifikasi Tanpa Peubah Jaringan Sosial

Pembentukan pohon klasifikasi tanpa memasukkan peubah jaringan sosial menghasilkan pohon maksimal yang memilki 688 simpul terminal. Setelah mendapatkan pohon klasifikasi maksimal, selanjutnya pemangkasan dilakukan untuk mendapatkan pohon klasifikasi optimum. Ukuran pohon optimal yang dipilih adalah pohon yang memiliki 6 simpul terminal dengan nilai biaya relatif pengujian terkecil yaitu 0.698. Ukuran pohon berdasarkan jumlah simpul dengan masing-masing biaya relatif yang dihasilkan disajikan pada Gambar 7.

Gambar 7 Plot Biaya Relatif dengan Jumlah Simpul Terminal pada Klasifikasi tanpa Peubah Jaringan Sosial

Peubah penjelas yang digunakan dalam pembentukan pohon optimal menurut urutan tingkat kepentingannya dapat dilihat pada Tabel 8. Terlihat bahwa peubah penjelas yang memiliki peran terbesar sebagai pemilah pada pohon optimal adalah tingkat pendidikan ibu (X4), peubah ini menduduki urutan pertama dan diberi nilai relatif sebesar 100. Kemudian peubah lain yang berada dibawahnya memiliki nilai lebih rendah hingga menuju nol.

Tabel 8 Tingkat Kepentingan Peubah pada Pohon Klasifikasi Optimal Nama

Peubah Keterangan Nilai

X4 Tingkat Pendidikan Ibu 100.000

X6 Status Ekonomi 31.082

X2 Umur Kepala Rumah Tangga (KRT) 30.879

X1 Jenis Kelamin 22.422

X5 Status Pekerjaan KRT 16.741

X3 Jumlah ART yang tidak/belum Bekerja 9.701

X7 Klasifikasi Daerah Tempat Tinggal 6.565

(34)

20

penentuan tingkat kepentingan peubah dihitung berdasarkan peran peubah tersebut sebagai pemilah utama maupun sebagai pemilah pengganti pada suatu simpul tergantung seberapa besar nilai impuritas dari peubah tersebut. Pada kasus ini, X5, X3, dan X7 merupakan peubah yang hanya memiliki peran sebagai peubah

pengganti. Pohon klasifikasi yang terbentuk dapat dilihat pada Lampiran 2.

Selanjutnya adalah menguji ketepatan klasifikasi yang dihasilkan dengan mengaplikasikan data testing pada pohon klasifikasi optimal yang dibentuk dari data learning. Hasil klasifikasi data testing pada pohon klasifikasi optimal disajikan sebagai berikut:

Ketepatan Klasifikasi Keseluruhan 53.0

Berdasarkan hasil klasifikasi yang disajikan pada Tabel 9, terlihat bahwa dari 2 359 pengamatan data testing, terdapat 1 108 pengamatan yang salah klasifikasi, dimana 46 pengamatan diklasifikasikan sebagai anak tidak putus yang seharusnya merupakan anak putus sekolah dan 1 062 pengamatan diklasifikasikan sebagai kategori anak putus sekolah yang seharusnya merupakan anak tidak putus sekolah. Secara keseluruhan ketepatan klasifikasi yang dihasilkan adalah sebesar 53.0%. Tingkat keberhasilan mengklasifikasikan anak putus sekolah secara tepat digambarkan dengan nilai sensitifity sebesar 80.2%, sedangkan ketepatan klasifikasi untuk anak tidak putus sekolah digambarkan dengan nilai specificity

sebesar 50.1%.

Klasifikasi terhadap anak putus sekolah diharapkan mampu mengetahui kerentanan terhadap anak putus sekolah secara lebih dini untuk mengambil langkah antisipasi yang tepat sasaran, sehingga menjadi hal yang penting untuk mendapatkan nilai sensitifity yang tinggi. Metode CART dengan melibatkan 7 peubah penjelas mampu menghasilkan nilai sensitifity diatas 50%. Hal ini menunjukkan bahwa metode klasifikasi yang digunakan sudah cukup baik untuk memprediksi anak putus sekolah.

Klasifikasi Dengan Peubah Jaringan Sosial

Pembentukan pohon klasifikasi dengan menambahkan peubah jaringan sosial yaitu kepemilikan saudara putus sekolah yang tinggal serumah (X8) dan

persentase anak putus sekolah di Blok Sensus tempat tinggal anak (X9)

(35)

21

Gambar 8 Plot Biaya Relatif dengan Jumlah Simpul Terminal pada Klasifikasi dengan Peubah Jaringan Sosial

Peubah penjelas yang digunakan dalam pembentukan pohon optimal dengan memasukkan peubah jaringan sosial menurut urutan tingkat kepentingannya dapat dilihat pada Tabel 10.

Tabel 10 Tingkat Kepentingan Peubah pada Pohon Klasifikasi Optimal dengan Peubah Jaringan Sosial

Nama

Peubah Keterangan Nilai

X9 Persentase Anak Putus Sekolah di BS tempat tinggal Anak 100.000

X8 Kepemilikan saudara yang putus sekolah dan tinggal

X7 Klasifikasi Daerah Tempat Tinggal 0.000

X6 Status Ekonomi 0.000

X3 Jumlah ART yang tidak/belum Bekerja 0.000

X4 Tingkat Pendidikan Ibu 0.000

Pada tabel 10, terlihat bahwa persentase anak putus sekolah di Blok Sensus tempat tinggal anak (X9) yang merupakan peubah jaringan sosial menjadi pemilah

dengan peran terbesar pada pohon optimal. Peubah penjelas lain yang juga memiliki peran utama sebagai pemilah adalah X8, X1, dan X2. Peubah X5 memiliki

peran sebagai pemilah pengganti sedangkan peubah X7, X6, X3, dan X4 dalam

(36)

22

Berikut adalah gambar pohon klasifikasi optimal yang terbentuk :

Pohon klasifikasi optimal yang terbentuk memiliki 1 simpul utama dan 9 simpul terminal. Anak-anak yang ada dalam simpul terminal 3, 5, 6, 8, 9 dan diberi label kelas 1 merupakan anak-anak yang diindikasikan masuk sebagai kelompok anak putus sekolah, sedangkan anak-anak yang menjadi anggota simpul terminal 1, 2, 4, 7 dan diberi label kelas 2 teridentifikasi sebagai kelompok anak tidak putus sekolah. Secara rinci hasil klasifikasi pada Gambar 9 dapat diuraikan sebagai berikut:

Anak Putus Sekolah

Kelompok anak putus sekolah yang terbentuk memiliki beberapa karakteristik yaitu,

1. Anak laki-laki dengan kepala rumah tangga yang usianya lebih dari 35 tahun dan tinggal di Blok Sensus yang memiliki angka putus sekolah antara 5.13% dan 18.89%.

(37)

23 2. Anak perempuan yang tinggal di Blok Sensus yang memiliki angka putus

sekolah antara 9.31% dan 10.26%.

3. Anak perempuan yang memiliki kepala rumah tangga berusia kurang dari 58 tahun, memiliki saudara putus sekolah yang tinggal serumah dan tinggal di Blok Sensus yang memiliki angka putus sekolah antara 10.26% dan 18.89%. 4. Anak perempuan yang memiliki kepala rumah tangga berusia lebih dari 58

Kelompok anak yang masih bersekolah memiliki beberapa karakteristik yaitu, sekolah antara 5.13% dan 9.03%.

4. Anak perempuan yang memiliki kepala rumah tangga berusia kurang dari 58 tahun, tidak memiliki saudara putus sekolah yang tinggal serumah dan tinggal di Blok Sensus yang memiliki angka putus sekolah antara 10.26% dan 18.89%.

Dengan demikian terlihat bahwa seorang anak yang tinggal dilingkungan yang tetangganya banyak mengalami putus sekolah lebih mungkin untuk mengalami putus sekolah. Hal ini sejalan dengan penelitian yang dilakukan oleh Crane (1991), besarnya kejadian anak putus sekolah dipengaruhi oleh kualitas lingkungan sekitar. Selain itu, menurut Rumberger and Lim (2008) jika seorang siswa memiliki saudara yang putus sekolah maka ia juga akan cenderung mengalami hal yang sama.

Setelah mendapatkan pohon klasifikasi optimal, selanjutnya akan diuji ketepatannya dalam mengklasifikasikan anak usia 7-17 tahun dengan menggunakan data testing dengan ukuran sebesar 20% dari total data yang tersedia. Hasil klasifikasi data testing pada pohon klasifikasi optimal disajikan sebagai berikut:

Tabel 11 Hasil Klasifikasi Data Testing pada Pohon Klasifikasi Optimal dengan Menambahkan Peubah Jaringan Sosial

Ketepatan Klasifikasi Keseluruhan 53.0

(38)

24

sekolah yang seharusnya merupakan kategori putus sekolah dan 527 pengamatan diklasifikasikan sebagai kategori putus sekolah yang seharusnya merupakan kategori tidak putus sekolah. Dengan demikian tingkat ketepatan klasifikasi secara keseluruhan adalah 76.6% dengan sensitifity sebesar 89.2% dan specificity

sebesar 75.2%.

Perbandingan Pohon Klasifikasi tanpa Peubah Jaringan Sosial dan Pohon Klasifikasi dengan Peubah Jaringan Sosial

Klasifikasi anak putus sekolah dengan melibatkan peubah penjelas yang berbeda juga memberikan hasil yang berbeda dalam hal ketepatan klasifikasi maupun kelompok anak putus sekolah yang dihasilkan. Perbandingan ketepatan klasifikasi yang dihasilkan oleh pohon yang berbeda dilakukan untuk mengetahui pohon klasifikasi mana yang mampu memberikan prediksi yang lebih baik. Pohon yang memberikan ketepatan klasifikasi yang lebih tinggi baik secara total maupun untuk masing-masing kategori yaitu putus sekolah dan tidak putus sekolah merupakan pohon klasifikasi yang lebih baik.

Ketepatan klasifikasi pada pohon CART tidak terlepas dari seberapa besar peubah-peubah penjelas yang digunakan mampu menjadi pemilah yang dapat membagi amatan-amatan pada peubah Y ke dalam kelompok yang lebih homogen pada setiap simpul. Penambahan peubah penjelas yang memiliki hubungan yang erat dengan peubah respon diharapkan akan menambah ketepatan klasifikasi pohon CART yang dibangun, sehingga amatan yang ada dapat diklasifikasikan dengan karakteristik yang lebih rinci.

Pohon klasifikasi yang dibentuk dengan jumlah peubah bebas yang berbeda yaitu pohon klasifikasi yang dibangun dengan 7 peubah (tanpa peubah jaringan sosial) dan pohon yang dibangun dengan 9 peubah (menambahkan peubah jaringan sosial) memberikan angka ketepatan klasifikasi yang berbeda. Penambahan peubah jaringan sosial menghasilkan ketepatan klasifikasi yang lebih tinggi dibandingkan pohon klasifikasi yang dibangun dengan tanpa menambahkan peubah jaringan sosial. Ketepatan klasifikasi meningkat sebesar 23.6% yakni dari 53.0% menjadi 76.6%. Perbandingan ketepatan klasifikasi antara kedua pohon klasifikasi ini dapat dilihat pada Gambar 10.

Gambar 10 Perbandingan Ketepatan Klasifikasi antara Pohon Klasifikasi tanpa Peubah Jaringan Sosial dan dengan Peubah Jaringan Sosial

80.2

Sensitivity (%) Specificity (%) Total (%)

(39)

25

Penerapan Teknik Bagging

Bagging (bootstrap and aggregating) adalah salah satu metode yang diterapkan pada pohon klasifikasi tunggal dalam hal ini CART dengan tujuan meningkatkan ketepatan klasifikasi yang dihasilkan oleh metode CART. Klasifikasi dengan metode pohon tunggal CART memberikan prediksi yang tidak stabil, perubahan kecil pada data learning akan menyebabkan perbedaan pengembangan simpul pada pohon sehingga menghasilkan pohon yang berbeda.

Algoritma Bagging CART menghasilkan suatu himpunan data learning baru yang akan digunakan untuk membangun pohon klasifikasi. Pohon klasifikasi yang dihasilkan merupakan pohon klasifikasi yang sangat kompleks karena pohon ini dibangun oleh semua peubah penjelas dan tanpa melalui proses pemangkasan. Jumlah pohon yang terbentuk sesuai dengan jumlah pengulangan yang dilakukan pada set data contoh bootstrap.

Penerapan Bagging pada pohon klasifikasi yang melibatkan peubah jaringan sosial bertujuan meningkatkan ketepatan klasifikasi terhadap status sekolah anak usia 7-17 tahun. Keputusan yang diambil pada teknik Bagging merupakan gabungan dari banyak pohon klasifikasi yang dibangun dengan melakukan pengulangan sebanyak 25, 50, 75, 100, 125, 150, 175, dan 200 kali. Banyaknya pengulangan berdasarkan penelitian sebelumnya yang dilakukan oleh Hestie et al. (2001) dan Sutton (2005). Setiap pohon klasifikasi yang terbentuk dapat menghasilkan simpul-simpul yang berbeda dalam mengklasifikasikan anak usia 7-17 tahun, sehingga hasil klasifikasi apakah seorang anak usia 7-7-17 tahun masuk kedalam kelompok putus sekolah atau kelompok tidak putus sekolah didasarkan pada karakteristik yang berbeda untuk setiap pohon. Teknik Bagging akan menghasilkan satu keputusan gabungan. Keputusan ini diharapkan menjadi lebih akurat karena didalamnya telah mempertimbangkan berbagai kemungkinan karakteristik yang dapat dimiliki oleh seorang anak untuk diklasifikasikan sebagai anak putus sekolah atau anak tidak putus sekolah. Hasil pengujian ketepatan klasifikasi dari pohon klasifikasi yang dihasilkan dari replikasi contoh bootstrap

tersebut tersaji dalam Tabel 12.

Tabel 12 Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon Klasifikasi dengan Peubah Jaringan Sosial

Banyaknya

Replikasi Sensitivity (%) Specificity (%) Ketepatan Klasifikasi (%)

25 kali 62.50 88.15 85.63

50 kali 62.07 88.11 85.54

75 kali 61.21 88.58 85.88

100 kali 62.50 88.25 85.71

125 kali 62.50 88.43 85.88

150 kali 62.07 88.43 85.84

175 kali 62.50 88.43 85.88

(40)

26

Terdapat banyak cara untuk menentukan hasil dugaan gabungan dari sekumpulan pohon yang terbentuk. Metode sederhana yang sering dilakukan dalam pengambilan keputusan gabungan pada pohon klasifikasi adalah memilih suara terbanyak (majority vote) dari nilai dugaan yang dihasilkan oleh sejumlah pohon yang terbentuk. Metode lain yang dapat digunakan adalah dengan nilai minoritas (minority) atau nilai tengah (medium) dengan memberikan penimbang yang berbeda pada masing-masing kelas (Kuncheva 2001), teknik ini diterapkan pada metode random forest (Sutton 2005).

Ketepatan klasifikasi yang dihasilkan pada Tabel 12 adalah ketepatan klasifikasi dengan metode pengambilan keputusan berdasarkan suara terbanyak. Ketepatan klasifikasi terbaik diperoleh pada pengulangan sebanyak 125 kali yakni sebesar 85.88% dengan rata-rata tingkat kepentingan peubah yang disajikan pada Gambar 9. Secara rata-rata peubah X9 (Persentase anak putus sekolah di Blok

Sensus tempat tinggal anak) merupakan peubah yang memiliki peran terbesar sebagai pemilah utama dalam membangun pohon klasifikasi. Hal ini menunjukkan bahwa faktor lingkungan sekitar merupakan faktor yang paling dominan dalam mencirikan anak putus sekolah. Anak yang tinggal dilingkungan yang memiliki angka putus sekolah yang tinggi akan memiliki peluang yang besar untuk mengalami putus sekolah.

Gambar 11 Rata-rata Tingkat Kepentingan Peubah pada Pohon Klasifikasi Gabungan dengan Pengulangan Sebanyak 125 kali

Ketepatan klasifikasi yang dihasilkan dengan pengulangan 125 kali bila dilihat pada masing-masing kategori memiliki nilai sensitivity sebesar 62.50%. Nilai ini menggambarkan besarnya ketepatan klasifikasi untuk amatan pada kategori putus sekolah. Hasil ini tidak lebih baik dibandingkan nilai sensitivity

yang dihasilkan oleh pohon tunggal yakni sebesar 89.2% (lihat Tabel 11). Hal ini mengindikasikan bahwa metode Bagging CART dengan metode suara terbanyak kurang sensitif terhadap data minor yaitu peubah respon dengan kategori putus sekolah yang jumlah datanya relatif kecil yaitu sebesar 9.7% dari data keseluruhan yang dijadikan unit analisis.

Metode pendugaan gabungan yang tidak mengacu pada metode suara terbanyak digunakan untuk mendapatkan ketepatan klasifikasi yang lebih baik

(41)

27 dibandingkan pohon tunggal (single CART) baik untuk ketepatan secara keseluruhan maupun ketepatan pada masing-masing kategori yaitu putus sekolah dan tidak putus sekolah. Sebagai ilustrasi, misal pengulangan yang dilakukan adalah sebanyak 25 kali maka akan terdapat 25 pohon klasifikasi yang terbentuk. Bila pada metode suara terbanyak, keputusan mengklasifikasikan suatu amatan kedalam kategori putus sekolah berdasarkan kriteria minimal terdapat 13 pohon yang menghasilkan klasifikasi yang sama yaitu amatan tersebut masuk kedalam kategori putus sekolah, atau dengan kata lain minimal 51% dari jumlah pohon yang terbentuk menghasilkan keputusan yang sama. Kriteria pengambilan keputusan ini akan diubah menjadi minimal 30% dari jumlah pohon yang terbentuk menghasilkan keputusan putus sekolah maka nilai dugaan gabungan yang dihasilkan adalah putus sekolah.

Tabel 13 Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon Klasifikasi dengan Keputusan Putus Sekolah Jika Minimal 30% dari Jumlah Pohon Memilih Kategori Putus Sekolah

Penerapan pengambilan keputusan dengan minimal 30% jumlah pohon memilih putus sekolah, bertujuan meningkatkan kepekaan hasil klasifikasi terhadap data anak putus sekolah yang jumlahnya hanya sebesar 9.7% dari keseluruhan data yang menjadi unit analisis. Ide dasar pengambilan keputusan gabungan ini mengikuti kriteria penentuan kelas putus sekolah untuk simpul terminal pada pohon tunggal, yaitu simpul terminal akan diberi label putus sekolah jika proporsi anak putus sekolah pada simpul terminal lebih besar dibandingkan proporsi anak putus sekolah pada simpul di atasnya (simpul sebelum pemilahan). Pada pohon klasifikasi, proporsi anak putus sekolah pada simpul utama adalah sebesar 9.7%, dengan demikian simpul hasil pemilahan akan diberi label kelas putus sekolah bila proporsi anak putus sekolah didalamnya lebih besar dari 9.7%, sehingga penentuan kelas putus sekolah tidak harus dengan kriteria proporsi anak putus sekolah lebih dari 50%.

Penerapan metode ini menghasilkan ketepatan klasifikasi yang disajikan pada Tabel 13. Ketepatan klasifikasi terbaik diperoleh dengan melakukan pengulangan sebanyak 175 kali yakni sebesar 82.37% dengan tingkat kepekaan klasifikasi terhadap anak putus sekolah sebesar 80.02%. Hal ini menunjukkan bahwa perubahan metode pengambilan keputusan gabungan pada Bagging

(42)

28

Perbandingan Klasifikasi dengan Metode CART dan Bagging CART

Ketepatan mengklasifikasikan anak usia 7-17 tahun kedalam kelas putus sekolah atau tidak putus sekolah menjadi ukuran untuk menilai kebaikan pohon keputusan yang dibangun. Penerapan metode CART dan Bagging CART dalam mengklasifikasikan status sekolah anak usia 7-17 tahun di Sulawesi memberikan hasil yang berbeda. Dibandingkan pohon CART tunggal, penerapan Bagging

mampu meningkatkan ketepatan klasifikasi total sebesar 5.77% dan mampu mengklasifikasikan anak putus sekolah (Sensitivity) yang merupakan data minor dengan baik yakni sebesar 80.02%, serta memiliki ketepatan klasifikasi yang lebih tinggi untuk anak tidak putus sekolah (Specificity). Dengan demikian berdasarkan ketepatan klasifikasi yang dihasilkan, dapat disimpulkan bahwa metode Bagging

lebih baik dibandingkan metode CART dalam mengklasifikasikan anak putus sekolah dan anak tidak putus sekolah usia 7-17 tahun di Sulawesi. Perbandingan ketepatan klasifikasi yang dihasilkan oleh kedua metode ini secara lebih rinci disajikan pada Tabel 14.

Tabel 14 Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon Klasifikasi dengan Peubah Jaringan Sosial

Berdasarkan hasil dan pembahasan yang diuraikan pada bab sebelumnya, maka dapat diambil kesimpulan sebagai berikut :

1. Penambahan peubah jaringan sosial kedalam pohon klasifikasi mampu meningkatkan ketepatan klasifikasi sebesar 23.6% dibandingkan ketepatan klasifikasi yang dibangun tanpa menambahkan peubah jaringan sosial.

2. Penerapan teknik Bagging pada pohon klasifikasi tunggal (CART) dapat memperbaiki ketepatan klasifikasi sebesar 5.77%.

Gambar

Tabel 1  Peubah Penjelas yang Digunakan Dalam Penelitian
Gambar 1 Diagram Alir Penelitian
Gambaran Umum Anak Putus Sekolah
Gambar 4 Persentase Anak Putus Sekolah Menurut Jenis Kelamin di Sulawesi,
+7

Referensi

Dokumen terkait

Tanah pada lokasi 4 memiliki klas infiltrasi sangat lambat dengan nilai laju infiltrasi hanya 0,704 cm/jam diakibatkan tanah pada lokasi 4 telah pada keadaan jenuh air

Wayah Langit Sumirat. ROGERS PADA PENGOBATAN TRADISIONAL SANGKAL PUTUNG DI DESA SROYO KECAMATAN JATEN KABUPATEN KARANGANYAR. Skripsi, Surakarta: Fakultas Keguruan dan

Kartawinata (1980) melaporkan bahwa beberapa kawasan hutan kerangas adalah varian dari hutan dipterocarpa campuran, sehingga persebaran pohon jenis penyusun hutan juga dapat

Luas CA Situ Patengan yang hanya 21,18 ha dan letaknya yang berbatasan dengan kawasan perkebunan dan kawasan hutan produksi Perum Perhutani, dapat menjadi ancaman bagi

Komponen kedua yakni isi. Isi program suatu bidang yang diajarkan sebenarnya adalah isi kurikulum itu sendiri, atau ada yang menyebutnya silabus. Silabus biasanya

Berendah hati banyak manfaat Dalam bergaul orang kan hormat Saudara suka sahabat mendekat Hidup beramai semakin erat Manfaatnya dapat dunia akhirat Tunjuk Ajar Melayu mengajarkan agar

Puji syukur saya panjatkan kepada Tuhan Yesus Kristus atas berkat, kasih karunia, kekuatan, dan penyertaan-Nya sehingga penulis dapat menyelesaikan skripsi dengan judul

Penilaian dalam akuntansi merupakan proses pemberian jumlah moneter (kuantitatif) yang bermakna pada aktiva. Salah satu tujuan dari penilaian adalah untuk menyajikan