• Tidak ada hasil yang ditemukan

Penentuan Peubah Penciri Penerima Jaminan Kesehatan Daerah (Jamkesda) Kota Bogor dengan Metode CHAID dan Random forest

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penentuan Peubah Penciri Penerima Jaminan Kesehatan Daerah (Jamkesda) Kota Bogor dengan Metode CHAID dan Random forest"

Copied!
26
0
0

Teks penuh

(1)

PENENTUAN PEUBAH PENCIRI PENERIMA

JAMINAN KESEHATAN DAERAH (JAMKESDA) KOTA BOGOR

DENGAN METODE CHAID DAN

RANDOM FOREST

SILVI NUR ARIFAH

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

RINGKASAN

SILVI NUR ARIFAH. Penentuan Peubah Penciri Penerima Jaminan Kesehatan Daerah (Jamkesda) Kota Bogor dengan Metode CHAID dan Random Forest. Dibimbing oleh ANIK DJURAIDAH dan LA ODE ABDUL RAHMAN.

Jaminan kesehatan daerah (Jamkesda) Kota Bogor merupakan program pelayanan pemeliharaan kesehatan masyarakat yang diselenggarakan oleh pemerintah Kota Bogor. Penerima program ini adalah masyarakat Kota Bogor yang belum memperoleh jaminan kesehatan. Pengklasifikasian masyarakat miskin yang tidak menderita sakit kronis dilakukan pada penerima program ini dengan cara pembobotan, dengan pembobot terbesar yaitu indikator ekonomi. Penarikan contoh acak dilakukan pada data tersebut sehingga didapatkan data contoh. Cara yang berbeda untuk pengklasifikasian dilakukan pada data contoh dalam penelitian ini. Hal tersebut berguna membantu Dinas kesehatan (Dinkes) Kota Bogor mengklasifikasikan penerima Jamkesda dengan lebih cepat, tanpa harus melakukan pembobotan pada data populasi. Proses pengolahan data untuk mengidentifikasi peubah penciri menggunakan metode CHAID (Chi-square Automatic Interaction Detection) dan random forest. Proses CHAID diulang hingga terlihat perbedaan pohon. Hasilnya menunjukkan perbedaan bentuk pohon klasifikasi sehingga sulit menentukan peubah penciri yang stabil. Random forest sangat membantu menemukan peubah penciri yang stabil, yaitu peubah pekerjaan dan kepemilikan aset. Peubah tersebut sesuai dengan hasil pengklasifikasian menggunakan pembobotan pada data populasi. Peubah penciri hasil random forest dijadikan peubah yang harus masuk pada algoritma CHAID. Hasil kombinasi kedua metode didapatkan peubah penciri prioritas dua yaitu masyarakat Kota Bogor yang tidak bekerja. Peubah penciri lain yaitu masyarakat Kota Bogor yang bekerja tetapi tidak memiliki aset (tidak memiliki tabungan atau barang yang mudah dijual dengan nilai minimal Rp500 000.00).

(3)

PENENTUAN PEUBAH PENCIRI PENERIMA

JAMINAN KESEHATAN DAERAH (JAMKESDA) KOTA BOGOR

DENGAN METODE CHAID DAN

RANDOM FOREST

SILVI NUR ARIFAH

Skripsi

sebagai salah satu syarat untuk memperoleh gelar

Sarjana Statistika pada

Departemen Statistika

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(4)

Judul Skripsi : Penentuan Peubah Penciri Penerima Jaminan Kesehatan Daerah (Jamkesda) Kota Bogor dengan Metode CHAID dan Random forest

Nama : Silvi Nur Arifah

NRP : G14080064

Menyetujui,

Pembimbing I, Pembimbing II,

Dr. Ir. Anik Djuraidah, MS La Ode Abdul Rahman, S.Si., M.Si.

NIP. 19630515 198703 2 002

Mengetahui, Ketua Departemen Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M.Si. NIP. 19650421 1999002 1 001

(5)

RIWAYAT HIDUP

Penulis dilahirkan di Garut pada tanggal 5 Maret 1990, anak ketiga dari empat bersaudara dari pasangan Mamad Sulaeman dan Empon. Penulis mengawali pendidikan formal di SD Negeri Sukaratu II pada tahun 1996 hingga lulus tahun 2002. Pada tahun 2002, penulis melanjutkan pendidikan di SMP Negeri 1 Banyuresmi dan lulus tahun 2005. Pada tahun 2005, penulis melanjutkan pendidikan di SMA Negeri 1 Tarogong kidul sekarang berubah nama menjadi SMA Negeri 1 Garut dan lulus tahun 2008. Pada tahun yang sama, penulis diterima di Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI) dengan Mayor Statistika di Departemen Statistika. Penulis memilih ilmu penunjang Kewirausahaan Agribisnis pada tahun 2009. Selain itu, mengambil supporting course untuk mata kuliah Makroekonomi I dan Mikroekonomi I.

(6)

KATA PENGANTAR

Assalamu’alaikum wr. wb.

Segala puji dan syukur penulis panjatkan kepada Allah SWT, atas segala rahmat, nikmat, hidayah serta karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini sebagai salah satu syarat untuk memperoleh gelar sarjana pada Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor.

Karya ilmiah ini berjudul “Penentuan Peubah Penciri Penerima Jaminan Kesehatan Daerah (Jamkesda) Kota Bogor dengan Metode CHAID dan Random Forest”. Dalam penelitian ini diharapkan dapat membantu pihak Dinas kesehatan Kota Bogor untuk mendapatkan peubah yang paling berpengaruh terhadap prioritas dua dan tiga sehingga waktu pendataan penerima Jamkesda Kota Bogor bisa lebih cepat.

Ucapan terimakasih kepada semua pihak yang telah membantu penulis mulai dari proses awal hingga terselesaikannya karya ilmiah ini, yaitu kepada:

1. Ibu Dr. Ir. Anik Djuraidah, MS selaku ketua komisi pembimbing skripsi yang telah membimbing, mengarahkan dan memberikan saran kepada penulis.

2. Bapak La Ode Abdul Rahman, S.Si., M.Si. selaku anggota komisi pembimbing skripsi yang telah membimbing serta memberi masukan bagi penulis.

3. Bapak Agus M. Soleh, S.Si, MT sebagai dosen penguji atas masukan dan sarannya. 4. Ibu drg. Margaretha Kurnia, kepala bidang Pembiayaan Kesehatan Masyarakat Dinas

Kesehatan Kota Bogor yang telah banyak memberikan bimbingan dan saran.

5. Seluruh pihak Dinas kesehatan Kota Bogor yang telah membantu mempermudah penulis untuk mendapatkan informasi tentang Jamkesda.

6. Mama dan papa yang saya cintai dan selalu memberikan dukungan serta doa yang tidak terputus bagi penulis. Teh Eris, teh Fitri, dan Intan yang selalu memberikan semangat. 7. Teman-teman di tim SDM LDK Al Hurriyyah IPB 2012 terimakasih untuk perhatian dan

dukungannya selama pengerjaan karya ilmiah ini.

8. Teman-teman di Ponpes Al-Iffah yang selalu membangkitkan semangat untuk menyelesaikan segala sesuatu dengan disiplin.

9. Teman-teman satu bimbingan Sekarsari(Ami), Riza, Meta, Andra, Budi, Fatul, Hendra, dan Nurul yang selalu menyemangati serta seluruh teman-teman Statistika 45 umumnya. 10. Semua pihak yang tidak dapat disebutkan satu persatu atas saran, masukan, dan kritiknya

kepada penulis.

Semoga semua amal ibadah baik dan bantuan yang telah diberikan kepada penulis mendapat balasan yang lebih baik dari Allah SWT, dan semoga karya ilmiah ini dapat bermanfaat bagi pihak yang membutuhkan.

Bogor, September 2012

(7)

DAFTAR ISI

Halaman

DAFTAR TABEL ... viii

DAFTAR GAMBAR ... viii

DAFTAR LAMPIRAN ... viii

PENDAHULUAN Latar Belakang ... 1

Tujuan ... 1

TINJAUAN PUSTAKA Metode CHAID ... 1

Random Forest ... 2

Pembentukan pohon tunggal ... 2

Penentuan peluang salah klasifikasi... 3

Tingkat kepentingan peubah ... 4

METODOLOGI Data ... 4

Metode ... 4

HASIL DAN PEMBAHASAN Deskripsi Data... 5

Identifikasi Peubah Penciri dengan Metode CHAID ... 6

Perbandingan pohon klasifikasi CHAID dengan tiga ulangan ... 6

Penentuan Peubah Penciri dengan Random forest ... 7

Penentuan Peubah Penciri Terbaik Penerima Jamkesda Kota Bogor ... 8

SIMPULAN ... 10

DAFTAR PUSTAKA ... 10

(8)

DAFTAR TABEL

Halaman

1. Perbandingan hasil pohon klasifikasi CHAID dengan tiga kali ulangan ... 6 2. Perbandingan peluang salah klasifikasi pada random forest berukuran m=2,4,8

serta k= 50, 100, 500, dan 1000 ... 7

DAFTAR GAMBAR

Halaman 1. Grafik proporsi data populasi dan data contoh untuk masing-masing kategori

peubah respon. ... 5 2. Perbandingan frekuensi kategori peubah penjelas pendidikan dengan

tiga kali ulangan ... 6 3. Plot perbandingan peluang salah klasifikasi pada random forest berukuran

m=2,4,8 dan k=50,100,500,1000 ... 8 4. Peluang salah klasifikasi pada saat m=4 dengan k=0 - 1000 pohon ... 8 5. Urutan peubah penciri pada saat m=4 dengan k=50 pohon ... 8 6. Nilai rataan peluang salah klasifikasi metode CHAID dan random forest

data Jamkesda Kota Bogor. ... 9 7. Pohon klasifikasi CHAID yang dimodifikasi dengan peubah penciri

hasil algoritma random forest ... 9

DAFTAR LAMPIRAN

Halaman

1. Tabel peubah penjelas dan frekuensi masing-masing kategori pada peubah penjelas untuk ulangan pertama, kedua, dan ketiga. ... 13 2. Kategorisasi pengeluaran keluarga ... 15 3. Grafik perbandingan frekuensi kategori dengan tiga ulangan ... 16

(9)

1

PENDAHULUAN

Latar belakang

Penduduk Kota Bogor yang belum mendapatkan jaminan pemeliharaan kesehatan hingga tahun 2010 sebanyak 66% dari total penduduk Kota Bogor (BPS 2010 dalam Widayani 2011). Salah satu upaya menguranginya, pemerintah Kota Bogor menyelenggarakan program pelayanan Jaminan kesehatan daerah (Jamkesda). Program pelayanan ini mulai berjalan tahun 2012. Namun proses pendataannya telah dilakukan sejak tahun 2010, kemudian dilanjutkan proses pengendalian mutu data tahun 2011. Proses tersebut dilakukan oleh Dinas kesehatan (Dinkes) Kota Bogor dan dibantu pihak ketiga sebagai tenaga ahli dalam hal manajemen database.

Penerima Jamkesda Kota Bogor merupakan masyarakat Kota Bogor yang belum menerima jaminan kesehatan baik dari pemerintah maupun swasta. Penerima Jamkesda ini dibagi menjadi tiga kategori prioritas, yaitu prioritas satu, prioritas dua, dan prioritas tiga. Namun dalam penelitian ini hanya fokus pada penerima Jamkesda prioritas dua dan tiga. Hal ini disebabkan penerima Jamkesda prioritas satu sudah ada penciri yaitu masyarakat Kota Bogor yang menderita sakit kronis dengan kategori jenis penyakit yang dijamin telah ditentukan oleh Dinkes Kota Bogor. Penerima Jamkesda prioritas dua dan tiga belum ada peubah penciri. Kedua prioritas tersebut diperuntukkan bagi masyarakat miskin di luar penerima Jamkesda prioritas satu.

Pengklasifikasian prioritas dua dan tiga pada data populasi dilakukan dengan cara pembobotan pada masing-masing peubah penjelas. Banyaknya peubah penjelas yang terlibat sebanyak 19 peubah. Pembobot yang paling besar diberikan pada indikator ekonomi dengan peubah penjelas yaitu pekerjaan, kepemilikan aset, dan besar penghasilan dari pekerjaan utama. Dinkes Kota Bogor memperbaharui database penerima Jamkesda Kota Bogor dengan cara tersebut. Pada prosesnya seluruh peubah penjelas digunakan sehingga tidak efisien. Penelitian ini bermanfaat untuk penentuan kriteria penerima Jamkesda Kota Bogor sehingga proses pendataan bisa dilakukan lebih cepat oleh Dinkes Kota Bogor.

Metode analisis yang tepat untuk penentuan kriteria penerima Jamkesda Kota Bogor yaitu dengan Metode CHAID ( Chi-square Automatic Interaction Detection).

Metode ini tepat digunakan karena peubah respon berskala nominal (Rokach & Maimon 2008). Namun pada setiap pengambilan data contoh dalam satu populasi, memungkinkan terbentuknya pohon yang tidak stabil. Ketidakstabilan bisa diakibatkan oleh ukuran data contoh yang kecil, simpul terminal yang heterogen, dan korelasi yang cukup tinggi antar peubah penjelas (Berk 2008 dalam Sartono & Syafitri 2010). Sartono & Syafitri (2010) memberikan solusi terhadap masalah ketidakstabilan yaitu dengan metode pohon gabungan (ensemble tree). Metode pohon gabungan yang digunakan dalam penelitian ini yaitu random forest. Penentuan kriteria penerima Jamkesda Kota Bogor menggunakan gabungan dari kedua metode tersebut yaitu random forest dan CHAID.

Tujuan

Tujuan dari penelitian ini yaitu :

1. Mengidentifikasi peubah penciri penerima Jamkesda Kota Bogor menggunakan metode CHAID.

2. Menentukan peubah penciri yang paling stabil bagi penerima Jamkesda Kota Bogor menggunakan random forest. 3. Menentukan peubah penciri terbaik bagi

penerima Jamkesda Kota Bogor menggunakan kombinasi hasil dari random forest dan metode CHAID.

TINJAUAN PUSTAKA

Metode CHAID

CHAID (Chi-square Automatic Interaction Detection) merupakan metode pohon keputusan yang dikembangkan oleh Kass tahun 1980. Metode ini menghasilkan pohon klasifikasi ketika peubah respon berupa data kategorik dan menghasilkan pohon regresi ketika peubah respon berupa data numerik. CHAID menghasilkan pohon dengan dua cabang atau lebih yang terdapat pada simpul akar atau simpul tunggal. Dengan kata lain, CHAID dapat menghasilkan pohon yang non-biner (Kass 1980). Menurut Rokach & Maimon (2008), pada dasarnya CHAID dibuat untuk data dengan peubah respon berskala nominal.

Secara umum, tahapan CHAID meliputi tiga hal, yaitu tahap penggabungan (merging), tahap pemisahan (splitting), dan tahap penghentian (stopping). Menurut Kass (1980), algoritma CHAID sebagai berikut : a. Masing-masing peubah penjelas dibuat

(10)

2

peubah respon dengan kategori-kategori peubah penjelas.

b. Pada setiap tabulasi silang yang dihasilkan di tahap (a), disusun sub-tabel berukuran 2× ( adalah banyaknya kategori peubah respon). Pada setiap sub-tabel dicari nilai χ2hitung kemudian dicari

nilai yang terkecil, misalkan didapatkan

χ2

terkecil. Jika χ2terkecil < χ2α(d-1) atau dengan

kata lain tidak mencapai nilai kritis, maka kedua kategori peubah penjelas tersebut digabungkan menjadi satu kategori campuran.

c. Pada setiap kategori campuran yang terdiri tiga atau lebih kategori asal, dicari pemisahan biner dengan menghitung

χ2

hitung terbesar misalkan didapatkan

χ2

terbesar. Jika χ2terbesar > χ2α(d-1) maka

berlaku pemisahan biner dan kembali ke tahap (b).

d. Setelah diperoleh penggabungan optimal untuk setiap peubah penjelas, dicari χ2hitung

untuk masing-masing tabulasi silang yang baru. Perhatikan tabulasi silang yang memiliki nilai statistik uji terbesar. Jika

χ2

terbesar > χ2α(d-1), data dibagi menurut

kategori tersebut.

e. Jika terjadi pemisahan pada tahap (d), kembali ke tahap (a) untuk setiap data hasil pemisahan. Hentikan jika tidak ada lagi peubah penjelas yang signifikan untuk melakukan pemisahan.

Hipotesis yang digunakan dalam tahapan algoritma CHAID yaitu :

Ho: Tidak terdapat hubungan antara baris dan kolom (saling bebas)

H1: Terdapat hubungan antara baris dan kolom (tidak saling bebas)

Statistik uji khi-kuadrat (�2) yang digunakan

dirumuskan: banyaknya baris, adalah banyaknya kolom, adalah indeks baris, adalah indeks kolom, adalah banyaknya pengamatan pada baris ke- dan kolom ke- , adalah nilai harapan pengamatan pada baris ke- dan kolom ke- ,

.adalah banyaknya pengamatan pada baris

ke-, . adalah banyaknya pengamatan pada

kolom ke- , adalah banyaknya responden. Pengurangan tabel kontingensi pada algoritma CHAID akan menyebabkan pengujian yang sedikit berbeda dalam mencari nilai statistik uji. Dengan kata lain,

jika kategori dari peubah asal menjadi kategori ( < ) maka nilai-p dari khi-kuadrat yang baru akan dikalikan dengan pengganda Bonferroni. Pengganda Bonferroni ada tiga tipe yang dibedakan berdasarkan skala pengukuran peubahnya (Kass 1980), yaitu :

1. Jika peubah asal berskala nominal digunakan rumus pengganda Bonferroni tipe bebas, yaitu : digunakan rumus pengganda Bonferroni tipe monotonik, yaitu :

�= −1

−1

3. Jika peubah asal berskala ordinal, namun terdapat kategori yang belum dapat ditentukan urutannya dalam peubah tersebut digunakan rumus pengganda Bonferroni tipe mengambang (float),

Random forest dikembangkan oleh Breiman tahun 2001. Teori yang melatarbelakangi terbentuknya random forest yaitu teori hukum kuat bilangan besar (the strong law of large number) yang menunjukkan bahwa hasil pemilihan dari pohon yang terbentuk cenderung konvergen ke suatu nilai yang diharapkan, sehingga overfitting tidak menjadi masalah bagi random forest. Hal ini telah dibuktikan oleh Breiman (2001).

Data yang digunakan untuk pembentukan pohon adalah sekitar 2/3 dari set data contoh dan disebut sebagai gugus data training. Sepertiga bagian lainnya digunakan untuk menghitung nilai salah klasifikasi dan disebut sebagai gugus data out of bag (OOB).

Andaikan gugus data training berukuran terdiri atas peubah penjelas. Breiman (2001) menjelaskan algoritma random forest terdiri atas tahapan sebagai berikut :

1. Penarikan contoh acak dilakukan dengan pemulihan berukuran dari gugus data training. Tahap ini disebut tahap bootstrap.

(11)

3

tunggal. Tahap ini disebut tahap tahap random sub-setting.

3. Pendugaan salah klasifikasi menggunakan gugus data OOB.

4. Langkah (1) sampai langkah (3) dilakukan sebanyak kali sehingga didapatkan buah pendugaan. Dalam kasus klasifikasi digunakan teknik suara terbanyak (majority vote).

Pembentukan pohon tunggal

Proses pembentukan pohon tunggal pada algoritma random forest menggunakan algoritma CART (Classification and Regression Tree), hanya saja tidak ada proses pemangkasan (pruning). Prosesnya meliputi tiga hal, yaitu pemilihan pemilah (split), penentuan simpul terminal, dan penandaan label kelas.

Breiman et al. (1984) menjelaskan pembentukan pohon klasifikasi tunggal sebagai berikut :

1. Pemilihan pemilah.

Pada tahap ini, setiap simpul bertujuan mendapatkan pemilah terbaik yang mampu menghasilkan peubah respon yang paling homogen pada setiap simpul. Oleh sebab itu, pada setiap simpul himpunan �, yaitu himpunan dari pemilah �, maka pemilah untuk diperoleh dengan mencari nilai � yang memaksimumkan fungsi kriteria kebaikan pemilah ϕ �, , dengan � ∈ �. Pemilah � yang terpilih dinotasikan dengan �∗.

Salah satu teknik pemilahan yang umum digunakan yaitu indeks Gini. Indeks Gini merupakan fungsi impurity ϕ. Nilai dari fungsi impurity yaitu ( ). Maka ukuran impurity ( ) pada setiap simpul didefinisikan sebagai berikut :

=ϕ 1 , 2 ,…,

Fungsi impurity yang digunakan dalam algoritma ini yaitu :

ϕ 1 , …, = 1− 2 .

Adapun fungsi kriteria kebaikan pemilah ϕ �, yaitu saat penurunan impurity 2. Penentuan simpul terminal.

Pemilahan pada simpul dihentikan saat satu atau lebih kriteria sudah terpenuhi. Selanjutnya disebut simpul terminal. Beberapa kriteria berhenti memilah yaitu :

 tidak terdapat nilai penurunan impurity yang cukup signifikan pada

(max

�∈�△ �, < ; > 0),

 banyaknya amatan pada mencapai batas minimum yang telah ditentukan

( ( ) 5 atau bahkan ( ) 1),

 amatan pada sudah homogen. 3. Penandaan label kelas.

Aturan yang digunakan merupakan aturan pluralitas (jumlah terbanyak), yaitu jika

0 = max ( | ), dengan = acak dari kelas maksimum tersebut.

Penentuan peluang salah klasifikasi

Nilai salah klasifikasi random forest diduga melalui galat OOB. Galat OOB pada random forest secara umum tergantung pada dua hal (Hastie et al. 2008), yaitu :

(12)

4

2. Korelasi antar pohon tunggalnya, dilambangkan dengan . Nilai yang kecil mengakibatkan ragam dugaan hasil random forest menjadi kecil sehingga membuat salah klasifikasi menjadi lebih kecil.

Berdasarkan kedua hal yang menjadi ciri utama ini bisa dipilih random forest terbaik yaitu saat nilai rasio / 2 bernilai kecil

(Breiman 2001). Hal tersebut menurut Sartono & Syafitri(2010), sangat dipengaruhi oleh banyaknya peubah penjelas yang diambil secara acak untuk membentuk pohon. Breiman & Cutler (2003) menyarankan untuk mengamati galat OOB saat

= 1

2 , , 2 , lalu memilih

yang menghasilkan galat OOB terkecil, dengan kata lain menghasilkan nilai salah klasifikasi terrendah dari gugus data OOB.

Tahun 2001, Breiman mempopulerkan batasan besarnya salah klasifikasi, yaitu :

�� 1−2 2

dengan adalah rata-rata korelasi antar pasangan dugaan dari dua pohon tunggal dan adalah rata-rata ukuran kekuatan akurasi pohon tunggal.

Tingkat kepentingan peubah

Salah satu ukuran tingkat kepentingan peubah penjelas yang dihasilkan random forest yaitu Mean Decrease Gini (MDG). MDG adalah menghitung rata-rata penurunan simpul ketika dilakukan pemilahan (Breiman & Cutler 2012). Semakin besar nilai MDG maka peubah tersebut dianggap semakin penting.

Breiman & Cutler (2003) memberikan saran menggunakan banyak pohon yang dibentuk agar urutan tingkat kepentingan peubah (variable importance) stabil. Sandri & Zuccolotto (2006) menjelaskan rumus yang digunakan untuk menentukan tingkat kepentingan peubah. Misalkan terdapat peubah penjelas dengan ℎ= 1,2, . . . , maka MDG mengukur tingkat kepentingan peubah penjelas �ℎ sebagai berikut : penurunan indeks Gini untuk peubah penjelas �ℎ pada simpul t, dan penarikan contoh acak sederhana dari data sensus penerima Jamkesda 2012 (Dinkes 2012). Pengambilan data contoh dilakukan sebanyak tiga kali ulangan untuk membentuk pohon klasifikasi CHAID. Pengambilan data contoh dilakukan kembali untuk membentuk random forest. Pengambilan data contoh terakhir dilakukan untuk membentuk pohon klasifikasi CHAID yang disesuaikan dengan hasil random forest. Rumus ukuran contoh menurut Scheffer et al. (1986) yaitu :

= �(1− �)

−1 �2

4 +�(1− �)

dengan adalah banyaknya populasi penelitian, nilai = 174 571. �adalah nilai proporsi prioritas dua, nilai �= 0.1. �adalah batasan tingkat kesalahan (bound of error), nilai �= 0.025.

Peubah respon dari penelitian ini yaitu prioritas penerima. Kategori respon terbagi menjadi dua, yaitu :

1. Prioritas dua 2. Prioritas tiga

Kedua kategori tersebut merupakan keluarga miskin yang tidak menderita sakit kronis dan belum mendapatkan jaminan kesehatan dari manapun serta dibedakan berdasarkan nilai peubah penjelas. Peubah-peubah penjelas yang digunakan dalam penelitian ini antara lain pendidikan, pekerjaan, penggunaan Surat Keterangan Tidak Mampu (SKTM), fasilitas Mandi Cuci Kakus (MCK), penghasilan Kepala Keluarga (KK), dan lain-lain. Peubah penjelas yang digunakan selengkapnya dapat dilihat pada Lampiran 1.

Metode

1. Melakukan pengkategorian untuk jenis data kontinu yaitu peubah pengeluaran harian, pengeluran mingguan, dan pengeluaran bulanan. Dilandaskan pada komponen Garis Kemiskinan (GK) yang terdiri dari garis kemiskinan makanan (GKM) dan garis kemiskinan non-makanan (GKNM). Pengkategorian data disajikan pada Lampiran 2.

2. Melakukan eksplorasi data untuk masing-masing peubah.

(13)

5

a. Melakukan penarikan contoh acak dari set data populasi.

b. Melakukan proses algoritma CHAID hingga terbentuk pohon klasifikasi CHAID.

c. Langkah (3a) dan langkah (3b) diulang sampai terlihat perbedaan hasil pohon klasifikasi CHAID, pada penelitian ini diulang sampai tiga kali. d. Membandingkan dendogram CHAID

hasil dari tiga kali ulangan.

4. Menentukan peubah penciri yang paling stabil menggunakan tahapan random forest sebagai berikut:

a. Melakukan penarikan contoh acak dari set data populasi.

b. Pada proses pembentukan pohon dipilih peubah penjelas secara acak dengan < peubah penjelas. Proses tersebut dilakukan pada proses pemilihan pemilah, kemudian dipilih pemilah terbaik. Beberapa nilai yang dicobakan, yaitu :

= 1

2 = 2

= 4

2 = 8

c. Langkah (4b) dilakukan terus menerus sampai terbentuk kedalaman pohon maksimum.

d. Sebanyak 1000 random forest dicobakan pada setiap m dan yang dicobakan, kemudian dicatat nilai peluang salah klasifikasi masing-masing random forest dan nilai Mean Decrease Gini (MDG). Nilai k yang disarankan Breiman (2001) digunakan dalam penelitian ini, yaitu k = 50. Umumnya k = 50 sudah memberikan hasil yang memuaskan untuk masalah klasifikasi (Breiman 1996). Sementara itu, k ≥ 100 cenderung menghasilkan tingkat salah klasifikasi yang konstan (Sutton 2005). Sehingga dalam penelitian ini dicobakan beberapa nilai k yaitu 50, 100, 500, dan 1000.

e. Melakukan pendugaan gabungan berdasarkan buah pohon. Dalam kasus klasifikasi digunakan teknik suara terbanyak (majority vote).

f. Urutan nilai MDG diamati, kemudian ditentukan peubah penciri yang paling stabil.

5. Melakukan penarikan contoh acak dari set data populasi.

6. Membuat pohon klasifikasi CHAID menggunakan data pada Langkah 5. Peubah penciri hasil random forest dijadikan peubah yang harus masuk pada algoritma tersebut.

7. Melakukan analisis deskriptif untuk menentukan peubah penciri terbaik bagi penerima Jamkesd Kota Bogor.

Pengolahan data dilakukan menggunakan software IBM SPSS 19 dan R ver 2.15.1 dengan paket randomForest4.6-6.

HASIL DAN PEMBAHASAN

Deskripsi data

Banyaknya penerima Jamkesda Kota Bogor tahun 2012 untuk kategori prioritas dua yaitu 14 866 jiwa dan kategori prioritas tiga sebanyak 159 705 jiwa. Hasil penarikan contoh acak dari masing-masing kategori dengan menggunakan penarikan contoh acak sederhana didapatkan jumlah contoh acak untuk kategori prioritas dua sebanyak 483 jiwa dan kategori prioritas tiga sebanyak 498 jiwa (Gambar 1). Hal tersebut menunjukkan bahwa banyaknya data contoh yang diambil untuk prioritas dua dan tiga sangat sedikit dibandingkan banyaknya populasi yang ada. Proporsi yang cukup jauh berbeda itu memungkinkan terbentuknya pohon yang berbeda pada setiap pengambilan data contoh yang berbeda (Berk 2008 dalam Sartono & Syafitri 2010).

Gambar 1 Grafik proporsi data populasi dan data contoh untuk masing-masing kategori peubah respon.

Pada masing-masing data contoh dapat dibandingkan besarnya keragaman frekuensi pada masing-masing kategori untuk setiap ulangan yang berbeda. Gambar 2 menunjukkan perbandingan frekuensi peubah penjelas pendidikan. Perbandingan frekuensi untuk peubah lain disajikan pada Lampiran 3. Perbedaan frekuensi ini memungkinkan terbentuknya pohon yang berbeda. Namun perbedaannya tidak terlalu signifikan, sehingga pohon yang terbentuk kemungkinan tidak terlalu jauh berbeda.

(14)

6

Gambar 2 Perbandingan frekuensi kategori peubah penjelas pendidikan dengan tiga kali ulangan

Identifikasi Peubah Penciri dengan Metode CHAID

Pembentukan pohon klasifikasi dilakukan pengulangan sebanyak tiga kali untuk melihat kestabilan peubah penciri dari pohon klasifikasi CHAID. Nilai peluang salah jenis I ( ) penggabungan dan penyekatan ditentukan sebesar 0.05. Metode penghentian pohon yang digunakan yaitu saat masing-masing peubah saling bebas. Selain itu, minimum amatan di simpul induk sebanyak 100 amatan serta di simpul anak sebanyak 50 amatan. Kedalaman pohon dibatasi sampai 3 (tiga) level.

Perbandingan pohon klasifikasi CHAID dengan tiga ulangan

Proses algoritma CHAID pada data contoh penelitian ini menghasilkan pohon klasifikasi CHAID. Proses tersebut dilakukan sebanyak tiga kali ulangan karena sudah

dapat dilihat perbedaan pohon klasifikasinya. Perbedaan itu dapat dilihat dari peubah penciri yang dihasilkan pada setiap ulangan, jumlah simpulnya, kedalaman pohon yang dihasilkan, dan nilai peluang salah klasifikasinya (Tabel 1).

Perbedaan pertama yaitu peubah penjelas yang menjadi penciri bagi penerima Jamkesda Kota Bogor. Peubah status rumah pada pohon klasifikasi ulangan pertama menjadi penciri bagi penerima Jamkesda Kota Bogor, sedangkan pada pohon klasifikasi ulangan kedua dan ketiga tidak menjadi penciri bagi penerima Jamkesda Kota Bogor. Hal yang sama yaitu peubah status merokok pada pohon klasifikasi ulangan kedua menjadi penciri bagi penerima Jamkesda Kota Bogor namun tidak menjadi penciri pada pohon klasifikasi ulangan selainnya. Berbeda dengan peubah kepemilikan aset pada pohon klasifikasi ulangan ketiga, peubah tersebut menjadi penciri pada pohon klasifikasi ulangan pertama. Peubah yang menjadi penciri pada keseluruhan ulangan atau masing-masing pohon klasifikasi terbentuk yaitu peubah pekerjaan dan fasilitas MCK.

Perbedaan kedua dilihat dari banyaknya simpul yang terbentuk pada masing-masing pohon klasifikasi CHAID. Banyaknya simpul pada pohon klasifikasi ulangan pertama yaitu sembilan buah simpul dan menghasilkan simpul akhir sebanyak lima buah simpul. Pohon klasifikasi ulangan kedua membentuk simpul yang berbeda, yaitu sebelas simpul dengan enam simpul akhir. Pohon klasifikasi ulangan ketiga pun menghasilkan jumlah

0

Tabel 1 Perbandingan hasil pohon klasifikasi CHAID dengan tiga kali ulangan

Pembeda Hasil dendogram pada ulangan ke-

1 2 3 MCK, Status Merokok

(15)

7

simpul yang berbeda yaitu enam simpul dengan empat simpul akhir. Perbedaan jumlah simpul pada masing-masing pohon klasifikasi ini menunjukkan ketidakstabilan setiap pohon klasifikasi yang terbentuk.

Perbedaan ketiga terlihat dari kedalaman pohon klasifikasi yang dihasilkan. Pohon klasifikasi ulangan pertama menghasilkan pohon klasifikasi dengan kedalaman pohon sebesar tiga tingkatan. Kondisi tersebut berbeda dengan pohon klasifikasi ulangan kedua dan ketiga yang menghasilkan pohon dengan kedalaman sampai dua tingkatan.

Perbedaan terakhir yaitu besar nilai peluang salah klasifikasi pada masing-masing pohon klasifikasi. Masing-masing pohon menghasilkan nilai salah klasifikasi yang cukup kecil. Nilai peluang salah klasifikasi untuk pohon klasifikasi pada ulangan pertama, kedua, dan ketiga masing-masing sebesar 0.023, 0.014, dan 0.025. Nilai tersebut tidak terlalu jauh berbeda, mungkin bisa disebabkan oleh keragaman data yang tidak terlalu jauh berbeda antar ulangan.

Berdasarkan perbedaan yang telah dipaparkan sebelumnya, pohon klasifikasi yang dihasilkan jelas berbeda pada setiap ulangan. Peubah penciri yang dihasilkan pun berbeda pada setiap ulangan, walaupun peubah penjelas pekerjaan dan fasilitas MCK tetap stabil pada masing-masing ulangan. Namun kestabilan pohon yang dihasilkan oleh CHAID belum dapat direpresentasikan secara keseluruhan. Oleh sebab itu, dilakukan random forest untuk melihat kestabilan dari peubah penciri yang terbentuk untuk mengatasi kekurangan metode CHAID (Sartono & Syafitri 2010).

Penentuan Peubah Penciri

dengan Random Forest

Proses pembentukan random forest dilakukan pada beberapa kondisi sehingga didapatkan kondisi terbaik. Kondisi tersebut digunakan untuk menentukan peubah penciri penerima Jamkesda Kota Bogor. Penentuan kondisi terbaik ini dipengaruhi oleh banyaknya peubah penjelas yang dipilih secara acak pada proses pemilahan, dilambangkan dengan . Pengaruh lain yaitu dari banyaknya pohon yang dibentuk pada proses random forest, dilambangkan dengan

(Breiman 2001).

Pada penelitian ini dilakukan proses random forest saat = 2, 4, dan 8 buah peubah penjelas. Setiap kondisi tersebut dibentuk = 50, 100, 500, dan 1000 pohon. Hal ini dilakukan untuk mendapatkan

kestabilan salah klasifikasi dan kondisi nilai peluang salah klasifikasi yang terkecil. Kondisi tersebut disebut kondisi optimum. Hasil dari proses tersebut ditunjukkan pada Tabel 2.

Tabel 2 menunjukkan hasil 12 kali pembentukan random forest dengan nilai peluang salah klasifikasi terkecil yaitu 0.003058. Namun kondisi tersebut tidak terlihat stabil karena setiap pembentukan pohon yang semakin besar, maka nilai peluang salah klasifikasi semakin besar. Hal tersebut juga terlihat dari kenaikan kurva saat = 2 (Gambar 3).

Gambar 3 Plot perbandingan peluang salah klasifikasi pada random forest berukuran = 2, 4, dan 8 buah peubah penjelas dan = 50, 100, 500, dan 1000 pohon

0,0025

k=50 k=100 k=500 k=1000

Pe

(16)

8

Kestabilan nilai peluang salah klasifikasi terlihat pada kondisi sebesar 4 dan 8 buah peubah dan yakni 50, 100, 500, dan 1000 pohon terbentuk. Saat terjadi kondisi seperti itu, yaitu peluang salah klasifikasi yang sama, dipilih = 4 buah dibandingkan = 8 buah karena yang kecil akan menyebabkan korelasi kecil (Breiman 2001). Sehingga jelas terlihat bahwa nilai salah klasifikasi yang dihasilkan pun lebih kecil dibandingkan saat sebanyak 8 buah. Saat kondisi peluang salah klasifikasi yang sama juga, pohon yang lebih sedikit lebih baik karena waktu komputasi yang lebih cepat. Oleh sebab itu, pilihan yang tepat untuk mendapatkan kondisi optimum yaitu saat sebesar 4 buah dan sebanyak 50 pohon terbentuk.

Kondisi tersebut diperkuat saat dilakukan plot algoritma random forest dengan kondisi

= 4 buah dan dilakukan dari nol sampai dengan 1000 pohon terbentuk. Kondisi peluang salah klasifikasi saat terbentuk 50 pohon cenderung stabil sampai terbentuk 1000 pohon (Gambar 4). Dapat disimpulkan bahwa kondisi = 4 buah dan = 50 buah pohon merupakan kondisi optimum untuk mendapatkan peubah penciri yang terbaik.

Gambar 4 Peluang salah klasifikasi pada saat m=4 dengan k=0 - 1000 pohon Penentuan peubah penciri digunakan dengan kriteria pemeringkatan nilai Mean Decrease Gini (MDG) dari random forest saat = 4 buah dan = 50 pohon. Gambar 5 menunjukkan peringkat peubah. Peubah yang sangat berpengaruh bagi penerima Jamkesda prioritas dua dan tiga yaitu peubah pekerjaan dan kepemilikan aset dengan nilai MDG 100. Peubah penjelas selainnya mempunyai nilai MDG < 100. Peubah penjelas tersebut yaitu fasilitas MCK, penghasilan KK, sumber air, status rumah,

sumber listrik, dan pendidikan merupakan peubah-peubah yang relatif homogen. Demikian pula dengan peubah penjelas jenis lantai, penggunaan SKTM, kemampuan membayar obat, jenis dinding, frekuensi pembelian pakaian baru, status merokok, bahan bakar masak, pengeluaran bulanan, pengeluaran mingguan, dan pengeluaran harian, serta intensitas makan/hari. Peubah-peubah tersebut cenderung lebih homogen karena menghasilkan nilai MDG yang hampir mendekati nol.

Berdasarkan nilai MDG yang diperoleh dari pembentukan 50 pohon didapatkan peubah penciri yang paling stabil. Peubah tersebut diduga yaitu pekerjaan, kepemilikan aset, dan fasilitas MCK.

Gambar 5 Urutan peubah penciri pada saat = 4 dengan = 50 pohon

Penentuan Peubah Penciri Terbaik Penerima Jamkesda Kota Bogor

Peubah penciri yang paling stabil secara berurutan hasil random forest yaitu peubah pekerjaan, kepemilikan aset, dan fasilitas MCK. Pohon yang dibentuk yaitu 50 buah pohon klasifikasi tunggal, menghasilkan rataan peluang salah klasifikasi sebesar 0.00407. Cukup berbeda dengan hasil CHAID yang hanya dibentuk tiga buah pohon klasifikasi tunggal sehingga rataan peluang salah klasifikasi CHAID pun tentu lebih besar yaitu 0.02067 (Gambar 6).

(17)

9

Walaupun nilai rataan peluang salah klasifikasi lebih kecil, hasil random forest ini mempunyai kelemahan yaitu tidak terbentuknya pohon seperti dendogram CHAID. Berdasarkan kondisi tersebut maka peubah penciri didapatkan berdasarkan hasil penentuan peubah penciri yang stabil menggunakan random forest dan pemilahan kategorinya menggunakan pohon klasifikasi yang dihasilkan algoritma CHAID.

Gambar 6 Nilai rataan peluang salah klasifikasi metode CHAID dan random forest data Jamkesda Kota Bogor

Dugaan peubah penciri penerima Jamkesda Kota Bogor yaitu peubah pekerjaan, kepemilikan aset dan fasilitas MCK. Dendogram CHAID yang disesuaikan dengan kriteria random forest ditampilkan pada Gambar 7. Dapat dilihat pengklasifikasian untuk masing-masing kategori pada peubah respon.

Peubah penciri pertama yaitu peubah pekerjaan. Masyarakat Kota Bogor yang tidak bekerja dan belum mendapatkan jaminan kesehatan dari manapun dimasukkan sebagai penerima Jamkesda prioritas dua. Hal itu terbukti dari persentase yang cukup besar yaitu 97.7% masyarakat kota Bogor yang tidak bekerja masuk sebagai penerima Jamkesda prioritas dua.

Peubah kedua yaitu kepemilikan aset. Kepemilikan aset dilihat dari kepemilikan tabungan atau barang yang mudah dijual dengan nilai minimal Rp500000.00. Masyarakat Kota Bogor yang bekerja baik sebagai buruh, karyawan/wati, dan lainnya tetapi tidak memiliki tabungan/barang yang 0,00407

0,02067

0 0,005 0,01 0,015 0,02 0,025 Random Forest

CHAID

Peluang salah klasifikasi

(18)

10

mudah dijual dengan nilai minimal Rp500000.00 maka dimasukkan sebagai penerima Jamkesda prioritas dua. Hal itu didasarkan pada hasil dendogram CHAID yang menunjukkan presentase penerima Jamkesda prioritas dua yang bekerja dan tidak memiliki aset yaitu 8.3%. Angka tersebut lebih besar dari presentase masyarakat yang bekerja dan memiliki aset.

Peubah ketiga yaitu fasilitas MCK. Masyarakat Kota Bogor yang belum mendapatkan jaminan kesehatan baik yang bekerja maupun yang tidak bekerja secara umum mempunyai fasilitas MCK bersama-sama atau pribadi untuk masing-masing prioritas. Tidak ada yang membedakan bagi kedua prioritas tersebut. Presentase bagi keduanya cenderung sama besar untuk kategori yang sama pada masing-masing prioritas. Kondisi ini menjadi dasar bahwa fasilitas MCK tidak cocok digunakan sebagai peubah penciri bagi prioritas dua dan tiga.

Berdasarkan pemaparan tiga peubah yang paling stabil maka didapatkan dua peubah penciri terbaik bagi penerima Jamkesda prioritas dua dan tiga yaitu peubah pekerjaan dan kepemilikan aset. Masyarakat Kota Bogor yang belum mendapatkan jaminan kesehatan dari manapun dan tidak sedang menderita sakit kronis diantaranya gagal ginjal, HIV/AIDS, stroke, kanker, jantung koroner, thalasemia , TBC, dan sakit jiwa dimasukkan menjadi penerima Jamkesda prioritas dua atau tiga. Masyarakat Kota Bogor yang dimasukkan menjadi penerima Jamkesda Kota Bogor prioritas dua merupakan mereka yang tidak memiliki pekerjaan. Disamping itu, tidak menutup kemungkinan bagi masyarakat Kota Bogor yang bekerja dengan syarat orang tersebut tidak memiliki aset. Masyarakat Kota Bogor yang tidak memenuhi kriteria penerima Jamkesda Kota Bogor prioritas dua dimasukkan ke penerima Jamkesda Kota Bogor prioritas tiga.

SIMPULAN

Random forest ternyata mampu menduga peubah penciri yang stabil pada data contoh. Peubah penciri hasil random forest yang menggunakan data contoh mampu menunjukkan hasil yang sesuai.dengan peubah penciri hasil dari pembobotan peubah penjelas pada data populasi. Peubah penciri yang dihasilkan yaitu pekerjaan dan kepemilikan aset.

CHAID melengkapi kelemahan random forest yang belum mampu menghasilkan pohon klasifikasi yang mudah untuk diinterpretasikan seperti dendogram CHAID. Berikut ini klasifikasi dari hasil CHAID menunjukkan kriteria penerima Jamkesda Kota Bogor. Kategori penerima Jamkesda prioritas dua, yaitu bagi masyarakat Kota Bogor yang tidak bekerja. Disamping itu, tidak menutup kemungkinan bagi masyarakat Kota Bogor yang bekerja dengan syarat orang tersebut tidak memiliki aset. Masyarakat Kota Bogor yang belum mendapatkan jaminan kesehatan dari manapun dan tidak sedang menderita sakit kronis selain kriteria tersebut dimasukkan sebagai prioritas tiga.

DAFTAR PUSTAKA

Breiman L, Friedman JH, Olshen RA, Stone CJ. 1984. Classification and Regression Tree. New York: Chapman & Hall. Breiman L. 1996. Bagging Predictors.

Machine Learning, 24: 123-140.

Breiman L. 2001. Random Forests. Machine Learning, 45:5-32.

Breiman L, Cutler A. 2003. Manual on Setting up, Using, and Understanding Random Forest V4.0. [terhubung berkala].

http://oz.berkeley.edu/users/breiman/Usi ng_random_forests_v4.0.pdf. [19 Juni 2012].

Breiman L, Cutler A. 2012. Package

„randomForest‟. [terhubung berkala].

http://cran.r-project.org/web/packages/ randomForest/randomForest.pdf. [19 Juni 2012].

BPS. 2011. Penentuan Garis Kemiskinan. Bogor: Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K). Dinkes. 2012. Database Hasil Sensus

Penerima Jamkesda Kota Bogor 2012. Bogor: Dinas Kesehatan Kota Bogor Hastie TJ, Tibshirani RJ, Friedman JH. 2008.

The Elements of Statistical Learning: Data-mining, Inference and Prediction. Second Edition. New York: Springer-Verlag.

Kass GV. 1980. An Exploratory Technique for Investigating Large Quantities of Categorical Data. Applied Statistics, 29(2):119-127.

(19)

11

Vol.69. Singapore: World Scientific Publishing Co. Pte. Ltd.

Sandri M, Zuccolotto P. 2006. Variable Selection Using Random Forest. Di dalam: Zani S, Cerioli A, Riani M, Vichi M, editor. Data Analysis, Classification and the Forward Search. Proceedings of the Meeting of the Classification and Data Analysis Group (CLADAG) of the Italian Statistical Society; University of Parma, 6-8 Juni 2005. New York: Springer Berlin Heidelberg. hlm 263-270.

Scheaffer RL, Mendenhall W, Ott L. 1996. Elementary Survey Sampling 5th edition. New York: Duxbury Press

Sartono B, Syafitri UD. 2010. Ensemble Tree: an Alternative toward Simple Classification & Regression Tree. Forum Statistika dan Komputasi, 15(1):1-7. Sutton CD. 2005. Classification and

Regression Trees, Bagging, and Boosting. Handbook of Statistics, 24: 303-329.

(20)

12

(21)

13

Lampiran 1 Tabel peubah penjelas dan frekuensi masing-masing kategori pada peubah penjelas untuk ulangan pertama, kedua, dan ketiga.

No Nama Peubah Jenis Kategori Ulangan ke-1 Ulangan ke-2 Ulangan ke-3

frek % frek % frek % 1 Pendidikan Ordinal [1] Tidak sekolah/Tidak

tamat SD

52 5.30 54 5.50 65 6.63

[2] SD 458 46.69 497 50.66 479 48.83

[3] SMP 190 19.37 186 18.96 187 19.06

[4] SMA 278 28.34 237 24.16 243 24.77

[5] Perguruan Tinggi (pernah kuliah)

3 0.31 7 0.71 7 0.71

2 Pekerjaan Nominal [1] Tidak bekerja 492 50.15 477 48.62 494 50.36

[2] Kayawan/wati 71 7.24 53 5.40 66 6.73

[3] Wiraswasta 68 6.93 87 8.87 80 8.15

[4] Buruh 265 27.01 280 28.54 258 26.30

[5] Lainnya 85 8.66 84 8.56 83 8.46

3 Pengeluaran harian

Ordinal [1] sangat miskin 930 94.80 941 95.92 941 95.92

[2] miskin 7 0.71 7 0.71 8 0.82

[3] hampir miskin 12 1.22 17 1.73 11 1.12

[4] tidak miskin 32 3.26 16 1.63 21 2.14

4 Pengeluaran mingguan

Ordinal [1] sangat miskin 937 95.51 946 96.43 939 95.72

[2] miskin 6 0.61 8 0.82 15 1.53

[3] hampir miskin 14 1.43 15 1.53 9 0.92

[4] tidak miskin 24 2.45 12 1.22 18 1.83

5 Pengeluaran bulanan

Ordinal [1] sangat miskin 893 91.03 894 91.13 892 90.93

[2] miskin 45 4.59 50 5.10 54 5.50

[3] hampir miskin 16 1.63 14 1.43 9 0.92

[4] tidak miskin 27 2.75 23 2.34 26 2.65

6 Penggunaan SKTM

Nominal [1] Ya 53 5.36 53 5.45 55 5.64

[2] Tidak 928 94.60 928 94.60 926 94.39

7 StatusRumah Nominal [1] Numpang 512 52.19 520 53.01 502 51.17

[2] Ngontrak 100 10.19 100 10.19 98 9.99

[3] Rumah sendiri 369 37.61 361 36.80 381 38.84

8 JenisLantai Nominal [1] Tanah 16 1.63 18 1.83 29 2.96

[2] Bambu 5 0.51 7 0.71 4 0.41

[3] Kayu manis 7 0.71 13 1.33 14 1.43

[4] Floor 603 61.47 596 60.75 566 57.70

[5] Keramik 350 35.68 347 35.37 368 37.51

9 JenisDinding Nominal [1] Bambu 13 1.33 18 1.83 16 1.63

[2] Rumbia 5 0.51 8 0.82 3 0.31

[3] Kayu kualitas rendah 5 0.51 10 1.02 15 1.53

[4] Tembok tanpa diplester 171 17.43 178 18.14 179 18.25

(22)

14

No Nama Peubah Jenis Kategori Ulangan ke-1 Ulangan ke-2 Ulangan ke-3

frek % frek % frek % 10 FasilitasMCK Ordinal [1] Tidak punya 424 43.22 400 40.77 393 40.06

[2] Bersama-sama 96 9.79 106 10.81 101 10.30

[3] Punya 461 46.99 475 48.42 487 49.64

11 SumberListrik Nominal

[1] Tidak ada 483 49.24 466 47.50 503 51.27

[2] Ya 498 50.76 515 52.50 478 48.73

[1] Sumur 649 66.16 665 67.79 652 66.46

12 SumberAir Nominal

[2] Mata air tidak terlindungi

57 5.81 54 5.50 45 4.59

[3] Sungai/air hujan 10 1.02 8 0.82 7 0.71

13 BahanBakar

Masak Nominal

[4] PAM 265 27.01 254 25.89 277 28.24

[1] Kayu bakar/arang 49 4.99 49 4.99 54 5.50

[2] Minyak tanah 15 1.53 19 1.94 17 1.73

[3] Gas 917 93.48 913 93.07 910 92.76

14 PakaianBaru Nominal

[1] Tidak pernah membeli 160 16.31 147 14.98 163 16.62

[2] ≥ satu stel dalam

setahun

821 83.69 834 85.02 818 83.38

15 MakanperHari Nominal [1] Hanya 1x makan

17 1.73 22 2.24 19 1.94

[2] 2x makan dalam sehari 964 98.27 959 97.76 962 98.06

16 MampuBayar

Obat Nominal

[1] Tidak mampu 541 55.15 544 55.45 528 53.82

[2] Mampu 440 44.85 437 44.55 453 46.18

17 Penghasilan

KK Ordinal

[1] Rp0,- s.d. Rp600.000,- 879 89.60 882 89.91 876 89.30

[2] > Rp600.000,- 102 10.40 99 10.09 105 10.70

18 Kepemilikan

Aset Nominal

[1] Tidak 548 55.86 527 53.72 542 55.25

[2] Ya 433 44.14 454 46.28 439 44.75

19 Apakah

Merokok Nominal

[1] Tidak 589 60.04 591 60.24 581 59.23

(23)

15

Lampiran 2 Kategorisasi pengeluaran keluarga*) **)

Kategori Pengeluaran (x)

harian mingguan bulanan

1 ≤ 31120 ≤ 217840 ≤ 871360

2 31120 < x≤37400 217840 < x≤ 261800 871360 < x≤ 1047200 3 37400 < x≤ 46748 261800 < x≤ 327236 1047200 < x≤ 1308944

4 > 46748 > 327236 > 1308944

Ket:

*) asumsi satu keluarga yaitu 4 orang

(24)

16

Lampiran 3 Grafik perbandingan frekuensi kategori dengan tiga ulangan

a. Perbandingan frekuensi kategori untuk peubah penjelas pekerjaan dengan tiga kali ulangan.

b. Perbandingan frekuensi kategori untuk peubah penjelas pengeluaran harian dengan tiga kali ulangan.

c. Perbandingan frekuensi kategori untuk peubah penjelas pengeluaran mingguan dengan tiga kali ulangan.

d. Perbandingan frekuensi kategori untuk peubah penjelas pengeluaran bulanan dengan tiga kali ulangan.

e. Perbandingan frekuensi kategori untuk peubah penjelas pengguna SKTM dengan tiga kali ulangan.

f. Perbandingan frekuensi kategori untuk peubah penjelas status kepemilikan rumah dengan tiga kali ulangan.

g. Perbandingan frekuensi kategori untuk peubah penjelas jenis lantai dengan tiga kali ulangan.

h. Perbandingan frekuensi kategori untuk peubah penjelas jenis dinding dengan tiga kali

[1] Numpang [2] Ngontrak [3] Rumah sendiri

(25)

17

i. Perbandingan frekuensi kategori untuk peubah penjelas fasilitas MCK dengan tiga kali ulangan.

j. Perbandingan frekuensi kategori untuk peubah penjelas sumber listrik dengan tiga kali ulangan.

k. Perbandingan frekuensi kategori untuk peubah penjelas sumber air dengan tiga kali ulangan.

l. Perbandingan frekuensi kategori untuk peubah penjelas bahan bakar untuk masak dengan tiga kali ulangan.

m. Perbandingan frekuensi kategori untuk peubah penjelas frekuensi membeli pakaian baru dengan tiga kali ulangan.

n. Perbandingan frekuensi kategori untuk peubah penjelas frekuensi makan dengan tiga kali ulangan.

o. Perbandingan frekuensi kategori untuk peubah penjelas kemampuan membayar obat dengan tiga kali ulangan.

p. Perbandingan frekuensi kategori untuk peubah penjelas penghasilan KK dengan tiga kali

[1] Tidak punya [2] Bersama-sama [3] Punya

FasilitasMCK

[1] Tidak pernah membeli [2] ≥ satu stel dalam setahun

PakaianBaru

[1] Hanya 1x makan [2] 2x makan dalam sehari

MakanperHari

[1] Tidak mampu [2] Mampu

MampuBayarObat

[1] Rp0,- s.d. Rp600.000,- [2] >

Rp600.000,-PenghasilanKK

(26)

18

q. Perbandingan frekuensi kategori untuk peubah penjelas kepemilikan aset dengan tiga kali ulangan.

r. Perbandingan frekuensi kategori untuk peubah penjelas status perokok dengan tiga kali ulangan.

0 100 200 300 400 500 600

[1] Tidak [2] Ya

KepemilikanAset

Ulangan ke-1

Ulangan ke-2 Ulangan ke-3

0 100 200 300 400 500 600 700

[1] Tidak [2] Ya

ApakahMerokok

Ulangan ke-1

Gambar

Gambar 1 Grafik proporsi data populasi dan data contoh untuk masing-masing  kategori peubah respon
Tabel 2
Gambar 5 Urutan peubah penciri pada  saat  � = 4  dengan � = 50 pohon
Gambar 6 Nilai rataan peluang salah

Referensi

Dokumen terkait

ekstrak benalu teh ( Scurrula atropurpurea [BL]. Dans.) dapat dibuat tablet effervescent yang baik dan untuk kengetahui pengaruh variasi kadar bahan pengikat PVP terhadap sifat

litura dari kelompok pengujian larva instar kedua dan ketiga yang berhasil keluar dari pupa memiliki abnormalitas pada bagian sayap yakni kedua pasang sayapnya

The insertion phase starts by inserting the unprocessed items one by one in the given order until the insertion of the heaviest unprocessed item would lead to a feasible solution..

Sugihan, Sumber Marga Telang dan Muara Padang, Das Sembilang yang meliputi bagian utara kawasan Taman Nasional Sembilang dan Das Musi yang meliputi Kecamatan Rambutan, Banyuasin

[r]

Dari hasil diatas dapat disimpulkan bahwa tingkat pergantian karyawan terjadi setiap bulan yang sedang berjalan ini, dalam satu bulan jumlah turnover karyawan bisa

Dengan merancang sejumlah alternative indeks kinerja dan metoda kendali optimal kecepatan motor yang meminimalkan konsumsi energi tanpa menggunakan dinamika baterai akan

Gigi susu yang berjumlah 20 buah biasanya telah tumbuh seluruhnya pada umur 2,5 th. Perkembangan motorik kasar pada masa prasekolah, diawali dengan kemampuan untuk berdiri..