Kata kunci : regresi logistik, bagging, ketepatan klasifikasi

(1)

1 KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA MALANG DENGAN

PENDEKATAN

BAGGING

REGRESI LOGISTIK

1

Ery Surya Ningrum dan 2Bambang Widjanarko Otok

1_{Mahasiswa Jurusan Statistika FMIPA-ITS (1308 100 107)} 2_{Dosen Jurusan Statistika FMIPA-ITS}

1_{[email protected] dan}2_{[email protected]}

ABSTRAK

Kesejahteraan merupakan aspek penting dari kualitas manusia secara keseluruhan. Berbagai penelitian yang telah dilakukan mengenai kesejahteraan mengindikasikan bahwa banyak sekali faktor yang mempengaruhi kesejahteraan rumah tangga. Oleh karena itu, dilakukan penelitian mengenai klasifikasi kesejahteraan rumah tangga di Kota Malang guna melihat karakteristik dan faktor yang paling berpengaruh terhadap kesejahteraan rumah tangga di Kota Malang. Berdasarkan hasil penelitian diperoleh analisis deskriptif yang menunjukkan bahwa terdapat perbedaan dan persamaan karakteristik kesejahteraan rumah tangga di Kota Malang antara kelompok rumah tangga miskin dan tidak miskin. Pada analisis regresi logistik diperoleh empat variabel prediktor yang signifikan berpengaruh terhadap kesejahteraan rumah tangga di Kota Malang, yaitu jumlah anggota rumah tangga, status pekerjaan utama kepala rumah tangga, pengalaman membeli beras raskin dalam tiga bulan terakhir, dan ada/tidak ada anggota rumah tangga yang dapat menggunakan telepon seluler, dengan nilai ketepatan klasifikasi sebesar 97,8%. Nilai ketepatan klasifikasi tersebut dapat ditingkatkan dengan pendekatan bagging regresi logistik. Hasil analisis bagging regresi logistik menunjukkan bahwa pada 60 kali replikasi bootstrap diperoleh nilai ketepatan klasifikasi terbesar, yaitu sebesar 98%.

Kata kunci : regresi logistik, bagging, ketepatan klasifikasi

1. PENDAHULUAN

Kesejahteraan merupakan aspek penting dari kualitas manusia secara keseluruhan. Krisis ekonomi dan moneter yang melanda Indonesia pada tahun 1997 menyebabkan kemunduran berbagai kegiatan ekonomi, terganggunya ke-giatan produksi dan distribusi. Permasalahan tersebut membawa dampak yang serius pada peningkatan jumlah pengangguran dan penduduk miskin.

Kemiskinan seringkali dipahami sebagai gejala rendahnya tingkat kesejahteraan semata, padahal kemiskinan merupakan gejala yang bersifat kompleks dan multidimensi, dimana berkaitan dengan aspek sosial, ekonomi, budaya, dan aspek lainnya. Berbagai upaya dan kebijakan pembangunan telah dilakukan pemerintah untuk menanggulangi kemiskinan. Seperti inpres desa tertinggal, pemberian BLT (Bantuan Langsung Tunai), raskin, kompensasi BBM, dan berbagai program penanggulangan kemiskinan lainnya. Namun, dari berbagai program yang telah dilaksanakan oleh pemerintah tersebut, masih terdapat kekurangan-kekurangan dalam pelaksa-naannya.

Secara garis besar, kebutuhan rumah tangga dapat dikelompokkan dalam 2 (dua) kategori besar, yaitu kebutuhan pangan dan non pangan. Secara alamiah kuantitas pangan yang dibutuhkan seseorang akan mencapai titik maksimum sementara kebutuhan non pangan, tidak akan ada batasnya. Semakin tinggi pengeluaran untuk

pangan, berarti semakin kurang sejahtera rumah tangga yang bersangkutan. Sebaliknya, semakin kecil pangsa pengeluaran pangan, maka rumah tangga tersebut semakin sejahtera (Mulyanto, 2005). Pengeluaran rumah tangga dapat menjadi ukuran kesejahteraan, makin besar pengeluaran untuk bahan non pangan menandakan semakin sejahtera kehidupan rumah tangga tersebut (BPS Sumut, 2004).

Kota Malang merupakan salah satu kota besar di Jawa Timur dengan tingkat kepadatan penduduk yang tinggi. Kota Malang juga memiliki nilai pengeluaran perkapita per bulan yang cukup besar diantara kabupaten/kota di Jawa Timur. Pada tahun 2009, nilai pengeluaran perkapita per bulan Kota Malang mencapai 45,85% untuk nilai pengeluaran perkapita sebesar Rp 500.000,00 ke atas dan 39,48% untuk nilai pengeluaran perkapita antara Rp 300.000,00 sampai Rp 499.999,00. Hal ini menunjukkan bahwa tingkat kesejahteraan rumah tangga di Kota Malang cukup tinggi.

Kajian mengenai kesejahteraan telah banyak dilakukan, diantaranya oleh Faturokhman dan Molo (1995) yang meneliti tentang karakteristik rumah tangga miskin di Yogyakarta dan Rahmawati (1999) meneliti kesempatan kerja penduduk miskin di DKI Jakarta. Kemudian Badan Pusat Statistik (BPS) bekerja sama dengan Word Bank Institute (2002) menyusun dasar-dasar analisis kemiskinan. Penelitian mengenai kese-jahteraan tersebut mengindikasikan bahwa banyak

(2)

2

sekali faktor yang mempengaruhi kesejahteraan rumah tangga. Oleh karena itu, dilakukan penelitian mengenai klasifikasi kesejahteraan rumah tangga di Kota Malang guna melihat karakteristik dan faktor yang berpengaruh terhadap kesejahteraan rumah tangga di Kota Malang.

Ada beberapa penelitian sebelumnya yang berkaitan dengan klasifikasi kesejahteraan rumah tangga, yaitu penelitian Prakosa (2011) mengenai klasifikasi kesejahteraan rumah tangga di provinsi

Jawa Timur dengan pendekatan bootstrap

aggregating classification and regression trees. Dalam penelitiannya, Prakosa hanya menggu-nakan 7 (tujuh) variabel prediktor sebagai faktor yang mempengaruhi kesejahteraan rumah tangga di Jawa Timur. Penelitian lainnya adalah Pratama (2011) mengenai klasifikasi kesejahteraan rumah tangga di Jawa Timur dengan pendekatan multivariate adaptive regression spline–bootstrap aggregating. Berbeda dengan Prakosa, Pratama menggunakan 17 ( tujuh belas) variabel prediktor sebagai faktor yang mempengaruhi kesejahteraan rumah tangga di Jawa Timur.

Pada penelitian ini juga digunakan 17 (tujuh belas) variabel prediktor yang mencakup aspek kependudukan, pendidikan, perumahan, ketena-gakerjaan, sosial ekonomi rumah tangga, dan teknologi informasi dan komunikasi sebagai faktor yang mempengaruhi kesejahteraan rumah tangga di Kota Malang. Namun, metode analisis yang digunakan adalah regresi logistik. Regresi logistik digunakan untuk mengetahui pola hubungan kesejahteraan rumah tangga di Kota Malang dengan faktor-faktor yang mempe-ngaruhinya. Selain itu, dengan analisis regresi logistik dapat diketahui nilai ketepatan klasifikasi kesejahteraan rumah tangga di Kota Malang. Namun, nilai ketepatan klasifikasi tersebut dapat ditingkatkan dengan pendekatan bagging regresi logistik. Oleh karena itu, untuk memperoleh ketepatan klasifikasi yang lebih tinggi digunakan pendekatan bagging regresi logistik. Paramita (2008) telah melakukan penelitian dengan dengan menggunakan bagging regresi logistik ordinal untuk memperoleh ketepatan klasifikasi yang lebih tinggi.

2. TINJAUAN PUSTAKA Konsep Kesejahteraan

Berdasarkan Rancangan Undang-Undang tentang Sistem Kesejahteraan Sosial Nasional (RUU SKSN), kesejahteraan sosial adalah kondisi

sosial ekonomi yang memungkinkan bagi setiap warga negara untuk dapat memenuhi kebutuhan yang bersifat jasmani, rohani, dan sosial sesuai dengan harkat dan martabat manusia. Kesejah-teraan menurut Cahyat dkk (2007) merupakan kondisi dapat memenuhi kebutuhan dasar baik material maupun non material yang mencakup aspek gizi dan kesehatan, pengetahuan, dan kekayaan materi.

Kemiskinan sendiri merupakan bentuk ketidakmampuan untuk meraih kesejahteraan dipandang dari sisi ekonomi dalam memenuhi kebutuhan dasar makanan dan bukan makanan yang dikur dari sisi pengeluaran. Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran perkapita per bulan di bawah Garis Kemiskinan (GK). Garis kemiskinan merupakan penjumlahan dari Garis Kemiskinan Makanan (GKM) dan Garis Kemiskinan Non Makanan (GKNM). Untuk tahun 2009, garis kemiskinan telah ditentukan oleh BPS, yaitu Rp 200.262,00 (BPS, 2009). Penduduk yang memiliki rata-rata pengeluaran perkapita per bulan di bawah garis kemiskinan dikategorikan sebagai penduduk miskin.

Selain itu, kemiskinan juga dijelaskan sebagai suatu situasi dimana seseorang atau rumah tangga mengalami kesulitan untuk memenuhi kebutuhan dasar, sementara ling-kungan pendukungnya kurang memberikan peluang untuk meningkatkan kesejahteraan secara berkesinambungan atau untuk keluar dari kerentanan (Cahyat dkk, 2007).

Tingkat kesejahteraan masyarakat antara lain dapat diukur melalui besarnya pendapat-an/pengeluaran. Pengeluaran untuk kebutuhan konsumsi dapat mencerminkan tingkat ke-mampuan ekonomi masyarakat, dan keke-mampuan daya beli masyarakat dapat memberikan gam-baran tentang tingkat kesejahteraan masyarakat. Semakin tinggi daya beli masyarakat, me-nunjukkan meningkatnya kemampuan dalam memenuhi kebutuhan hidupnya dan selanjutnya akan berdampak meningkatnya kesejahteraan masyarakat (BPS, 2009).

Faktor-faktor yang Mempengaruhi

Kesejahteraan Rumah Tangga

Dalam mengukur kesejahteraan rumah tangga diperlukan indikator moneter, indikator yang banyak digunakan adalah pendapatan dan pengeluaran (BPS, 2009, dan The World Bank, 2007). Indikator pengeluaran, dalam hal ini

(3)

3

disebut juga konsumsi, dipilih karena sifatnya tetap dan relatif stabil terhadap berfluktuasinya pendapatan dari tahun ke tahun.

Suryadarma (2005) mengungkapkan varia-bel-variabel yang menjadi ciri kesejahteraan suatu keluarga, antara lain : kepemilikan asset, kepe-milikan binatang ternak, status perkawinan kepala rumah tangga, jenis kelamin kepala rumah tangga, tingkat pendidikan kepala rumah tangga dan pasangannya, anggota rumah tangga yang bekerja, sektor pekerjaan, akses terhadap rumah tangga, konsumsi makanan dan indikator kesehatan, indikator kesejahteraan lainnya, serta partisipasi politik dan akses kepada informasi.

Jumlah anggota rumah tangga diduga mempunyai keterkaitan erat dengan kesejahteraan rumah tangga karena kemiskinan dihitung berdasarkan pengeluaran dan jumlah anggota rumah tangga. Makin besar jumlah anggota rumah tangga, akan makin besar pula resiko untuk menjadi miskin apabila pendapatannya tidak meningkat (Faturokhman dan Molo, 1995). Usia kepala rumah tangga juga berkaitan dengan

kesejahteraan rumah tangga walaupun

hubungannya tidak begitu jelas, akan tetapi ada kecenderungan bahwa kepala rumah tangga yang lebih sejahtera lebih tua dibandingkan kepala rumah tangga yang kurang sejahtera.

Jenis karakteristik lain adalah karakteristik jenis pekerjaan. Kemampuan mayoritas rumah tangga untuk keluar dari kemiskinan akan bergantung pada upah mereka dari pekerjaan yang dilakukan. Jadi penting untuk menguji hubungan antara kesejahteraan dengan jenis pekerjaan anggota rumah tangga yang berada dalam usia kerja. Dillon dan Hermanto dalam Faturokhman dan Molo (1995) mengungkapkan bahwa ke-nyataannya, sebagian penduduk atau rumah tangga miskin di desa masih mengandalkan per-tanian sebagai pekerjaan utamanya, akan tetapi usaha-usaha di luar pertanian tetap menjadi sumber pendapatan komplementer dan alternatif bagi keluarga. Sedangkan rumah tangga miskin di kota lebih banyak mengandalkan penghasilan dari sektor-sektor jasa atau lebih dikenal dengan sektor informal. Karakteristik umum penduduk miskin menurut Rusastra dan Togar (2007) adalah sebagian besar tinggal di desa, bekerja di sektor pertanian, sifat pekerjaan adalah informal, serta status pekerjaan sebagai pekerja keluarga yang tidak dibayar. Sedangkan menurut The World Bank (2006) karakteristik umum penduduk miskin adalah sifat pekerjaan yang bersifat informal, serta

status pekerjaan sebagai pekerja keluarga yang tidak dibayar.

Statistik Deskriptif

Statistik deskriptif adalah analisis yang berkaitan dengan pengumpulan dan penyajian data sehingga dapat memberikan informasi yang berguna. Analisis ini bertujuan menguraikan tentang sifat-sifat atau karakteristik dari suatu keadaan dan untuk membuat deskripsi atau gambaran yang sistematis dan akurat mengenai fakta-fakta, sifat-sifat dari fenomena yang diselidiki. Beberapa bentuk penyajian statistik deskriptif adalah tabel, diagram, grafik, histo-gram, dan lainnya (Walpole, 1993).

Regresi Logistik

Regresi logistik digunakan jika variabel respon bersifat kategorik (nominal atau ordinal) dengan variabel-variabel prediktor kontinu mau-pun kategorik (Agresti, 1990). Variabel respon Y yang bersifat random dan biner, yakni bernilai 1 dengan probabilitas

π

dan bernilai 0 de ngan probabilitas 1-

π

, disebut sebagai point-binomial (Le, 1998).

Menurut Le (1998), untuk sampel ke-i (i = 1, 2, ..., n), Yi adalah variabel bernoulli dengan

probabilitas

(

) ( )

i

(

( )

)

i

i y π xi y 1 πxi 1y Y

P ₌ ₌ ₋ −

Dengan yi = 0,1 da n n = jumlah sampel. Le

(1998) menyatakan bahwa fungsi basis logistik adalah

( )

_z e z f =₁₊ − 1 _,₋_∞_<_z_<_∞ (2.1) dimana, ij p j jx z

∑

= + = 1 0 β β

Secara umum fungsi hubung yang digunakan adalah fungsi hubung logit, maka distribusi peluang yang digunakan adalah fungsi logistik berdasarkan McCullagh dan Nelder (1989) adalah

) ( ) ( i 1 ) x ( π g_gx_x e e + = dengan g(x)=β₀+β₁x₁++βpxp; p = jumlah

variabel bebas, sehingga

) ... exp( 1 ) ... exp( ) ( 1 1 0 1 1 0 p p p p i x_x x_x x β β β β β β π + + + + + + + =

(4)

4

          + +           + =

∑

= = p 0 ij 0 0 0 x exp 1 exp ) ( j j p j ij j i x β x β β β π

Jika model pada persamaan di atas ditrans-formasi dengan menggunakan transditrans-formasi logit dari π(x), maka model logistik dapat ditulis sebagai persamaan : p p i i _x _x x x x g β β β π π + + + =         − = ... ) ( 1 ) ( ln ) ( ₀ ₁₁

Metode estimasi yang digunakan dalam regresi logistik adalah metode maximum

likeli-hood (Hosmer and Lemeshow, 2000). Pada

dasarnya metode maximum likelihood menges-timasi nilaiβ_{dengan memaksimumkan fungsi}

Likelihood (Hosmer and Lemeshow, 2000). Setelah mengestimasi parameter model regresi logistik, maka perlu dilakukan pengujian untuk mengetahui variabel prediktor mana yang berpengaruh signifikan terhadap variabel respon. Pengujian signifikansi parameter terdiri dari pengujian secara individu dan serentak.

Pengujian signifikansi parameter model dengan satu variabel prediktor dilakukan untuk mengetahui ada atau tidaknya hubungan antara suatu variabel prediktor dan variabel respon (Le, 1998). Langkah pengujian hipotesisnya adalah sebagai berikut.

Hipotesis: H0 :

β

_j= 0

H1 :

β

j≠ 0 ; j = 1, 2, ... , p

Statistik Uji (Le, 1998): Wald (W)

) ˆ ( ˆ ˆ j j E S β β =

Untuk memperoleh keputusan, nilai statistik uji dibandingkan dengan distribusi normal baku (Z). H0 ditolak jika W >Zα/2.

Uji signifikansi parameter secara serentak dilakukan sebagai upaya memeriksa peranan masing-masing variabel prediktor dalam model secara bersama-sama dengan langkah sebagai berikut.

Hipotesis:

H0 : β1 = β2 = … = βp = 0

H1 : paling sedikit ada satu βj≠ 0, dengan

j = 1,2,…, p

Statistik Uji (Hosmer and Lemeshow, 2000):

(

)

( )

(

( )

)

( )             −             − =

∏

= − n 1 y 1 y 0 1 x πˆ 1 x πˆ 2 G 0 1 i i i n n i i n n n n Ln Test Ratio Likelihood dengan

∑

= = n 1 1 y i i n ,

∑

(

)

= − = n 1 0 1 y i i n , n=n0+n1

Sehingga persamaan dapat ditulis sebagai

( ) ( ) ( ) ( ( )) [ ] [ ( ) ( ) ( )]       ₊ ₋ ₋ ₋ ₊ ₋ =

∑

= n nln ln ln x πˆ 1 ln y 1 x πˆ ln y 2 G 1 1 0 0 n 1 i n n n n i i i i

Statistik uji G mengikuti distribusi chi-square dengan derajat bebas v (Hosmer and Lemeshow, 1989). Akibatnya, kriteria penolakan H0 adalah

jika 2

v) , (

G>χ_α .

Dari estimasi model regresi logistik yang telah diperoleh, i ngin diketahui seberapa besar keefektifan model dalam menjelaskan variabel respon. Hal ini disebut sebagai goodnessoffit (kesesuaian model). Goodness of fit dihitung berdasarkan nilaiπˆ yang tergantung pada susunan

variabel-variabel prediktor dalam model, bukan dari jumlah variabel prediktor (Hosmer and Lemeshow, 2000). Berikut ini adalah langkah-langkah pengujian kesesuaian model.

H0 : Model sesuai

H1 : Model tidak sesuai

Statistik Uji (Hosmer and Lemeshow, 2000):

(

)

_∑

(

₍

)

₎

= − − = − g k k k k k k k n n o Lemeshow Hosmer C 1 2 π 1 ' π ' ˆ π g = Jumlah grup

'

k

n

= Jumlah subjek pada grup ke-k

∑

= = ck j j k o 1

y , jumlah nilai variabel respon pada grup ke-k

( )

∑

= = ck j k j k _n m 1 j ' x πˆ

π , rata-rata taksiran probabilitas

dimana mj adalah banyaknya subjek pada

c

_k

kombinasi variabel prediktor.

Jika H0 benar, maka distribusi statistik uji

C

ˆ

mengikuti distribusi chi-square dengan derajat bebas g-2 (Hosmer and Lemeshow, 2000). Daerah penolakan H0 adalah Cˆ>χ(2g−2).

Interpretasi koefisien model regresi logistik meliputi menentukan hubungan fungsional antara variabel respon dan variabel prediktor serta mendefinisikan unit perubahan variabel respon yang disebabkan oleh variabel prediktor (Hosmer

(5)

5

and Lemeshow, 2000). Untuk variabel prediktor dikotomus, ada dua nilai

π

( )

x

dan dua nilai

( )

x π

1− seperti pada Tabel 1.

Tabel 1. Nilai-Nilaiπ

( )

x dan 1−π

( )

x Untuk Variabel

Prediktor Dikotomus

Odds rasio, dinotasikanψ, didefinisikan sebagai rasio odds untuk x= 1 terhadap odds untuk x = 0 (Hosmer and Lemeshow, 2000).

( )

[

( )

]

( )

0/

[

1 π

( )

0

]

π 1 π 1 / 1 π ψ − − =

Berdasarkan Tabel 1, nilai odds rasio :

( )

₁

exp

ψ= β

Prosedur klasifikasi yang dipakai pada regresi logistik adalah apparent error rate (APER). Nilai APER menyatakan proporsi sampel yang salah diklasifikasikan oleh fungsi klasifikasi (Johnson and Wichern, 1992).

Tabel 2. Tabel Klasifikasi Regresi Logistik

Hasil Observasi _y Taksiran

1 y2

y1 n11 n12

y2 n21 n22

Keterangan :

n11 = Jumlah subjek dari y1 tepat diklasifikasikan

sebagai y1

n12 = Jumlah subjek dari y1 salah diklasifikasikan

sebagai y2

n21 = Jumlah subjek dari y2 salah diklasifikasikan

sebagai y1

n22 = Jumlah subjek dari y2 tepat diklasifikasikan

sebagai y2 APER (%) = 22 12 11 21 12 n n n n n n 21+ + + +

Bootstrap Aggregating (Bagging)

Metode bagging pertama kali digunakan oleh Breiman (1994). Bagging digunakan sebagai alat untuk memperbaiki stabilitas dan kekuatan prediksi dengan cara mereduksi variansi dari suatu prediktor. Bagging prediktor adalah metode untuk membangkitkan multiple version dari prediktor dan menggunakannya untuk aggregate

prediktor. Multiple versions dibentuk dengan replikasi bootstrap dari sebuah data set. Pada beberapa kasus bagging pada data set real atau simulasi dapat meningkatkan akurasi. Jika perubahan dalam data set menyebabkan perubahan yang signifikan maka bagging dapat meningkatkan akurasi. Ide dasar dari bagging adalah menggunakan bootstrap resampling untuk membangkitkan prediktor dengan banyak versi, dimana ketika dikombinasikan seharusnya hasilnya lebih baik dibandingkan dengan prediktor tunggal yang dibangun untuk menyelesaikan masalah yang sama.

Sebuah data set £ terdiri dari {(yn, xn), n = 1,

... , N } dengan y da pat berupa klas label atau numerik respon. Jika input adalah x, maka y diprediksi dengan 𝜑𝜑(x, £) dimana 𝜑𝜑(x, £) adalah prediktor. Untuk mendapatkan prediktor yang lebih baik maka dilakukan replikasi bootstrap {£Rk} yang kemudian disebut {𝜑𝜑(x, £Rk)}. Replikasi

bootstrap dilakukan sebanyak B kali sehingga {£P

(B)_{} dari}_£_{dan dibentuk prediktor {}_𝜑𝜑_(x,_£ P (B)_)}.

{£P

(B)_{} adalah resampling dengan pengembalian.}

Bagging bekerja dengan baik pada metode klasifikasi yang menghasilkan parameter yang tidak stabil, dimana perubahan kecil pada data set akan menghasilkan perubahan besar pada model yang diperoleh. Beberapa metode yang tidak stabil adalah neural network, regresi, klasifikasi, dan regresi pohon. S edangkan contoh metode yang stabil adalah k-nearest neighbor (Breiman, 1994).

Aggregate classifier atau metode klasifikasi agregat µA diberikan secara umum dalam :

µA(y) = EF [𝜇𝜇̂(y, £Rk)]

dimana ekspektasi sampel Dk berdasarkan

distribusi F (fungsi distribusi empirik). Breiman mengenalkan prosedur bagging dimana syarat µA(y) diperoleh dengan membangkitkan B dari Dk

dengan metode bootstrap. Bootstrap sampel ditentukan dari sampling dengan pengembalian data observasi. Untuk setiap resampel bootstrap dari 𝐹𝐹� dihitung :

𝜇𝜇̂P (*b)_(y,_£

Rk

(*b)_{), b = 1, ... , B}

dan kemudian menaksir classifier sebagai berikut.

𝜇𝜇̂RA(y) =𝐸𝐸𝐹𝐹� [𝜇𝜇̂(y, £Rk *_)]

(Dias dan Vermunt, 2005).

Estimasi BaggingClass Probability

Beberapa metode klasifikasi menaksir peluang 𝑝𝑝̂(jx) suatu objek dengan prediksi vector x termasuk dalam klas j. Kemudian klas yang sesuai x ditaksir sebagai maxj𝑝𝑝̂(jx). Untuk

Variabel

respon _{x = 1}Variabel Prediktor _{x = 0} y = 1 ( ) (₍ )₎ 1 0 1 0 exp 1 exp 1 π β_β β_β + + + = ( ) ( )_{( )} 0 0 exp 1 exp 0 π β β + = y = 0 ( ) ₍ ₎ 1 0 exp 1 1 1 π -1 = ₊ _β ₊_β ( ) _{( )} 0 exp 1 1 0 π -1 β + =

(6)

6

metode seperti ini, ketepatan bagging dengan voting (peluang terbesar) adalah rata-rata 𝑝𝑝̂(jx) dari semua replikasi bootstrap, memperoleh

𝑝𝑝̂RB(jx) dan kemudian digunakan mengestimasi

klas maxj 𝑝𝑝̂RB(jx). Penaksir ini dihitung di setiap

klasifikasi bootstrap yang dilakukan. Hasil kesalahan klasifikasi sebenarnya identik dengan menghitung setiap kesalahan klasifikasi di tiap replikasi bootstrap. Selama ini bukti-bukti mengindikasikan bahwa bagged menaksir lebih akurat daripada penaksir tunggal. Untuk menguji pernyataan ini dilakukan perbandingan estimasi

𝑝𝑝̂*(jx) dari nilai sebenarnya. Perbandingan dilakukan dengan membandingkan prediksi error dari hasil model tunggal sebagai berikut.

eS = 𝑝𝑝̂(jx) – p*(jx)

dimana 𝑝𝑝̂(jx) adalah penaksir peluang dari model tunggal dan p*(jx) adalah peluang sebenarnya. Sedangkan untuk model hasil bagging, pada setiap iterasi bootstrap dilakukan perhitungan prediksi error.

eB = 𝑝𝑝̂RB(jx) – p*(jx)

dimana 𝑝𝑝̂RB(jx) penaksir dari peluang pada setiap

replikasi, sehingga prediksi error dari model bagging merupakan hasil rata-rata prediksi error pada setiap pengambilan sampel pada setiap B replikasi bootstrap (Breiman, 1994).

Algoritma bagging untuk regresi logistik biner adalah sebagai berikut :

1. Mengambil sampel bootstrap sebanyak n dari data set £ dengan pengulangan sebanyak n. Pengambilan sampel sedemikian hingga setiap variabel aggregate dalam setiap observasi.

2. Memodelkan regresi logistik biner data set hasil sampel bootstrap£RB .

3. Menghitung peluang respon untuk setiap observasi dan menghitung ketepatan klasifikasi. Kesalahan klasifikasi pada langkah ini disebut eB.

4. Mengulang langkah 1 sampai langkah 4

sebanyak B kali (replikasi bootstrap).

5. Memperoleh ketepatan klasifikasi bagging dari rata-rata ketepatan klasifikasi setiap pengambilan sampel sampai B, sehingga kesalahan klasifikasi bagging untuk replikasi B kali adalah 𝑒𝑒̅RB.

6. Membentuk model bagging regresi logistik biner dari rata-rata setiap parameter pada setiap pengambilan sampel sampai B.

7. Untuk memperoleh hasil yang lebih baik, maka replikasi bootstrap dilakukan sebanyak

mungkin (Efron dan Tibshirani, 1993). Replikasi bootstrap yang biasa digunakan adalah 50 sampai 200.

3. METODOLOGI PENELITIAN

Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari hasil Survey Sosial Ekonomi Nasional (SUSENAS) Jawa Timur tahun 2009.

Variabel respon dalam penelitian ini adalah rumah tangga yang dibagi menjadi 2 kategori, yaitu :

1 = miskin 2 = tidak miskin

Sedangkan yang menjadi variabel prediktor adalah 17 (tujuh belas) faktor sebagai berikut. 1. Jenis kelamin kepala rumah tangga (X1)

1 = laki-laki 2 = perempuan

2. Usia kepala rumah tangga (X2)

3. Status perkawinan kepala rumah tangga

(X3)

1 = kawin 2 = lainnya

4. Ijazah tertinggi kepala rumah tangga (X4)

1 = tidak punya ijazah 2 = tamat SD

3 = tamat SLTP/Sederajat 4 = tamat SLTA/Sederajat 5 = tamat di atas SLTA 6 = tidak pernah sekolah

5. Jumlah anggota rumah tangga (X5)

6. Kegiatan utama kepala rumah tangga (X6)

1 = bekerja 2 = tidak bekerja

7. Lapangan usaha utama kepala rumah

tangga (X7)

1 = pertanian 2 = non pertanian 3 = tidak bekerja

8. Status pekerjaan utama kepala rumah

tangga (X8)

1 = buruh/karyawan 2 = pengusaha 3 = lainnya 4 = tidak bekerja

9. Status penguasaan bangunan tempat tinggal

(X9) 1 = milik sendiri 2 = kontrak/sewa 3 = bebas sewa 4 = dinas 5 = lainnya

(7)

7

10. Sumber air minum (X10)

1 = air kemasan bermerek 2 = air isi ulang

3 = leding meteran/leding eceran

4 = sumur bor/pompa/sumur terlindungi/ sumur tidak terlindungi

5 = mata air terlindung/mata air tidak terlindung

6 = lainnya

11. Cara memperoleh air minum (X11)

1 = membeli 2 = tidak membeli 12. Sumber penerangan (X12) 1 = listrik PLN 2 = listrik non PLN 3 = lainnya

13. Bahan bakar energi utama untuk memasak

(X13) 1 = listrik 2 = gas/elpiji 3 = minyak tanah 4 = arang/briket/kayu bakar 5 = lainnya

14. Pengalaman mendapatkan pelayanan

kesehatan gratis selama enam bulan terakhir (X14)

1 = pernah 2 = tidak pernah

15. Pengalaman membeli beras raskin selama tiga bulan terakhir (X15)

1= pernah 2= tidak pernah

16. Ada anggota rumah tangga yang dapat

menggunakan telepon seluler (X16)

1 = ya 2 = tidak

17. Ada anggota rumah tangga yang menguasai

penggunaan komputer desktop (X17)

1 = ya 2 = tidak

Analisis dilakukan dengan langkah-langkah sebagai berikut.

1. Analisis statistik deskriptif untuk masing-masing faktor-faktor yang mempengaruhi kesejahteraan rumah tangga di Kota Malang.

2. Melakukan analisis regresi logistik biner dengan pengujian secara individu terhadap masing-masing variabel prediktor.

3. Menentukan model regresi logistik biner dengan memasukkan seluruh variabel prediktor yang signifikan berpengaruh pada pengujian secara individu.

4. Mendapatkan variabel prediktor yang

signifikan berpengaruh terhadap model regresi logistik biner.

5. Melakukan bootstrap aggregating untuk

prediktor dari model logistik biner, dengan 50 sampai 80 replikasi bootstrap.

6. Menentukan ketepatan klasifikasi pada

setiap pengambilan sampel B replikasi bootstrap, sehingga diperoleh kesalahan klasifikasi eB.

7. Menentukan kesalahan klasifikasi bagging

𝑒𝑒̅RB.

8. Membentuk model bagging regresi logistik

biner dari rata-rata setiap parameter pada setiap pengambilan sampel sampai B.

4. ANALISIS DAN PEMBAHASAN

Pengeluaran rumah tangga dapat menjadi ukuran kesejahteraan, makin besar pengeluaran untuk bahan non pangan menandakan semakin sejahtera kehidupan rumah tangga tersebut (BPS Sumut, 2004). Pada penelitian ini, klasifikasi kesejahteraan rumah tangga di Kota Malang didasarkan pada besarnya pengeluaran perkapita rumah tangga per bulan, dimana rumah tangga digolongkan sebagai rumah tangga miskin dan tidak miskin. Pada tahun 2009, BPS telah menetapkan angka Rp 200.262,00 sebagai garis kemiskinan. Apabila suatu rumah tangga memiliki pengeluaran perkapita per bulan di bawah nilai garis kemiskinan tersebut, maka rumah tangga tersebut digolongkan sebagai rumah tangga miskin, dan sebaliknya. Berikut ini adalah deskriptif pengeluaran perkapita rumah tangga di Kota Malang tahun 2009.

Tabel 3. Statistik Deskriptif Pengeluaran Perkapita

Rumah Tangga Per Bulan

n Minimum Maximum Mean

736 126.100 4.299.393 710.387

Tabel 3 menunjukkan bahwa nilai penge-luaran perkapita rumah tangga per bulan yang terkecil adalah sebesar Rp 126.100,00, sedangkan yang terbesar sebesar Rp 4.299.393,00. Nilai rata-rata pengeluaran perkapita rumah tangga per bulan di Kota Malang dari 736 rumah tangga adalah sebesar Rp 710.387,00.

Berikut ini adalah hasil pengelompokkan rumah tangga di Kota Malang berdasarkan garis kemiskinan yang telah ditetapkan oleh BPS.

(8)

8

Tabel 4. Jumlah dan Persentase Rumah Tangga Miskin

dan Tidak Miskin

Kelompok Rumah Tangga n (%)

Miskin 15 2,04

Tidak Miskin 721 97,96

Total 736 100

Tabel 4 memberikan informasi bahwa 2,04% rumah tangga di Kota Malang termasuk dalam kelompok miskin karena memiliki pengeluaran perkapita per bulan di bawah garis kemiskinan. Sedangkan 97,96% sisanya termasuk dalam kelompok tidak miskin.

Menurut Faturochman dan Molo (1995), jumlah anggota rumah tangga dan usia kepala rumah tangga dapat dijadikan sebagai peninjau kesejahteraan rumah tangga pada aspek ke-pendudukan. Berikut ini adalah deskriptif jumlah anggota rumah tangga dan usia kepala rumah tangga di Kota Malang tahun 2009.

Tabel 5. Statistik Deskriptif Jumlah Anggota Rumah

Tangga dan Usia Kepala Rumah Tangga

Variabel Sosial Demografi

Miskin Tidak Miskin

mean stdev mean stdev

Jumlah anggota

rumah tangga 5,667 1,676 3,6158 1,7202 Usia kepala

rumah tangga 52,40 16,33 47,659 15,567 Tabel 5 menunjukkan bahwa rata-rata rumah tangga miskin di Kota Malang memiliki anggota rumah tangga sebanyak 5,667 ~ 6 orang. Sedang-kan rata-rata jumlah anggota rumah tangga tidak miskin sebesar 3,6158 ~ 4 orang. Hal ini menun-jukkan bahwa rata-rata jumlah anggota rumah tangga miskin di Kota Malang tahun 2009 lebih tinggi dibandingkan dengan rumah tangga tidak miskin. Selain itu, diketahui bahwa rata-rata usia kepala rumah tangga miskin lebih tinggi daripada rumah tangga tidak miskin. Rata-rata usia kepala rumah tangga miskin adalah 52,40 tahun, sedangkan rata-rata usia kepala rumah tangga tidak miskin adalah 47,659 tahun.

Pada aspek kependudukan juga bisa dilihat jenis kelamin dan status perkawinan kepala rumah tangga sebagaimana ditunjukkan pada Tabel 6.

Tabel 6. Statistik Deskriptif Jenis Kelamin dan Status

Perkawinan Kepala Rumah Tangga

Variabel Sosial Demografi

(%)

Miskin Tidak _miskin Jenis kelamin kepala rumah

tangga

Laki-laki 93,3 76

Perempuan 6,7 24

Status perkawinan kepala rumah tangga

Kawin 93,3 69,8

Lainnya 6,7 30,2

Tabel 6 menunjukkan bahwa persentase perempuan yang berperan sebagai kepala rumah tangga tidak miskin lebih besar daripada rumah tangga miskin, yaitu mencapai 24%. Sementara itu, persentase kepala rumah tangga dengan status kawin lebih banyak ditemukan pada kelompok rumah tangga miskin. Informasi ini menunjukkan bahwa terdapat perbedaan antara kelompok rumah tangga miskin dan tidak miskin dalam hal jenis kelamin dan status perkawinan kepala rumah tangga.

Menurut Suryadarma (2005), salah satu ukuran untuk meninjau kesejahteraan rumah tangga dari aspek pendidikan adalah tingkat pendidikan tertinggi yang ditamatkan (ijazah tertinggi yang dimiliki) kepala rumah tangga. Pendidikan tertinggi yang ditamatkan merupakan indikator pokok kualitas SDM, semakin tinggi ijazah yang dimiliki oleh rata-rata penduduk suatu daerah, mencerminkan tingkat intelektual penduduk daerah tersebut (BPS, 2009).

Tabel 7 menunjukkan bahwa persentase kepala rumah tangga tidak miskin yang pendidikannya tamat di atas SLTA sebesar 100%. Sedangkan persentase kepala rumah tangga miskin yang pendidikannya tamat di atas SLTA hanya sebesar 0%. Jadi, dapat dikatakan bahwa semakin tinggi pendidikan kepala rumah tangga, semakin menunjukkan bahwa rumah tangga tersebut tidak miskin. Sebaliknya, semakin rendah pendidikan kepala rumah tangga, semakin menunjukkan bahwa rumah tangga tersebut miskin.

(9)

9

Tabel 7. Statistik Deskriptif Ijazah Tertinggi yang

dimiliki Kepala Rumah Tangga

Ijazah Tertinggi

Miskin Tidak Miskin

Total n (%) n (%) Tidak mempunyai ijazah 7 6,9 94 93,1 101 Tamat SD 4 2,6 150 97,4 154 Tamat SLTP/Sederajat 2 0,8 257 99,2 259 Tamat SLTA/Sederajat 1 1,2 80 98,8 81 Tamat di atas SLTA 0 0 116 100 116 Tidak pernah sekolah 1 4 24 96 25 Total 15 2 721 98 736

Karakteristik kesejahteraan rumah tangga berdasarkan aspek perumahan dideskripsikan dalam status penguasaan bangunan tempat tinggal, sumber air minum, cara memperoleh air minum, sumber penerangan, dan bahan bakar memasak.

Tabel 8. Statistik Deskriptif Status Penguasaan Tempat

Tinggal Status Penguasaan Bangunan Tempat Tinggal Miskin Tidak Miskin Total n (%) n (%) n Milik sendiri 12 80 543 75,3 555 Kontrak/sewa 1 6,7 116 16,1 117 Bebas sewa 0 0 6 0,8 6 Dinas 0 0 3 0,4 3 Lainnya 2 13,3 53 7,4 55 Total 15 100 721 100 736

Tabel 8 menunjukkan bahwa sebagian besar status penguasaan bangunan tempat tinggal rumah tangga miskin dan tidak miskin di Kota Malang tahun 2009 adalah milik sendiri dengan persentase jauh lebih tinggi daripada status penguasaan bangunan tempat tinggal yang lain. Persentase status penguasaan bangunan tempat tinggal rumah tangga miskin yang milik sendiri adalah sebesar 80%, sedangkan rumah tangga tidak miskin sebesar 75,3%.

Tabel 9. Statistik Deskriptif Sumber Air Minum

Sumber Air Minum Miskin Tidak Miskin Total n (%) n (%) n (%) Air kemasan bermerek 0 0 87 100 87 100 Air isi ulang 0 0 25 100 25 100 Leding 4 1,5 258 98,5 262 100 Sumur 11 3,1 345 96,9 356 100 Mata air 0 0 4 100 4 100 Lainnya 0 0 2 100 2 100 Total 15 2 721 98 736 100

Tabel 9 memberikan informasi bahwa per-sentase rumah tangga miskin untuk meng-konsumsi sumber air minum semodern mungkin semakin kecil, yaitu sebesar 0% untuk air kemasan bermerk. Sebaliknya, persentase rumah tangga tidak miskin untuk mengkonsumsi sumber air minum semodern mungkin semakin besar, yaitu sebesar 100% untuk air kemasan bermerk.

Tabel 10. Statistik Deskriptif Cara Memperoleh Air

Minum Cara Memperoleh Air Minum Miskin Tidak Miskin Total n (%) n (%) n (%) Membeli 2 0,5 372 99,5 374 100 Tidak membeli 13 3,6 349 96,4 362 100 Total 15 2 721 98 736 100

Tabel 10 menunjukkan bahwa cara mem-peroleh air minum rumah tangga miskin cenderung memilih tidak membeli. Sedangkan rumah tangga tidak miskin memilih membeli untuk memperoleh air minum.

Tabel 11. Statistik Deskriptif Sumber Penerangan

Sumber Penerangan Miskin Tidak Miskin Total n (%) n (%) n (%) Listrik PLN 15 2,1 711 97,9 726 100 Listrik non PLN 0 0 9 100 9 100 Lainnya 0 0 1 100 1 100 Total 15 2 721 98 736 100

Tabel 11 menunjukkan bahwa rumah tangga miskin dan tidak miskin lebih memilih listrik PLN sebagai sumber penerangan.

(10)

10

Tabel 12. Statistik Deskriptif Bahan Bakar Memasak

Bahan Bakar Memasak Miskin Tidak Miskin Total n (%) n (%) n (%) Listrik 0 0 46 100 46 100 Gas/elpiji 7 1,3 542 98,7 549 100 Minyak tanah 6 6,4 88 93,6 94 100 Arang/briket/kay u bakar 2 4,8 40 95,2 42 100 Lainnya 0 0 5 100 5 100 Total 15 2 721 98 736 100

Tabel 12 menunjukkan bahwa rumah tangga miskin dan tidak miskin lebih memilih gas/elpiji sebagai bahan bakar memasak.

Karakteristik kesejahteraan rumah tangga berdasarkan aspek ketenagakerjaan dideskripsikan dalam kegiatan utama kepala rumah tangga, lapangan usaha utama kepala rumah tangga, dan status pekerjaan utama kepala rumah tangga.

Tabel 13. Statistik Deskriptif Kegiatan Utama Kepala

Rumah Tangga Kegiatan Utama KRT Miskin Tidak Miskin Total n (%) n (%) n (%) Bekerja 13 2,4 538 97,6 551 100 Tidak bekerja 2 1,1 183 98,9 185 100 Total 15 2 721 98 736 100

Tabel 13 memberikan informasi bahwa jumlah kepala rumah tangga miskin dan tidak miskin yang kegiatan utamanya bekerja lebih besar dibandingkan dengan kepala rumah tangga yang tidak bekerja.

Tabel 14. Statistik Deskriptif Lapangan Usaha Utama

Kepala Rumah Tangga

Lapangan Usaha Utama KRT Miskin Tidak Miskin Total n (%) n (%) n (%) Pertanian 1 2,8 35 97,2 36 100 Non pertanian 12 2,3 503 97,7 515 100 Tidak bekerja 2 1,1 183 98,9 185 100 Total 15 2 721 98 736 100

Tabel 14 menunjukkan bahwa jumlah kepala rumah tangga miskin dan tidak miskin yang bekerja di sektor non pertanian lebih besar dibandingkan dengan sekor pertanian.

Tabel 15. Statistik Deskriptif Status Pekerjaan Utama

Kepala Rumah Tangga

Status Pekerjaan Utama KRT Miskin Tidak Miskin Total n (%) n (%) n (%) Buruh/karyawan 4 1,4 284 98,6 288 100 Pengusaha 4 1,8 221 98,2 225 100 Lainnya 5 13,2 33 86,8 38 100 Tidak Bekerja 2 1,1 183 98,9 185 100 Total 15 2 721 98 736 100

Tabel 15 menunjukkan bahwa perbedaan status pekerjaan utama kepala rumah tangga miskin dan tidak miskin dalam jumlah sampel dan persentase. Jumlah kepala rumah tangga miskin yang tidak bekerja lebih kecil daripada kategori status pekerjaan lainnya. Selain itu, status pekerjaan utama kepala rumah tangga tidak miskin sebagai buruh/karyawan lebih banyak daripada status pekerjaan lainnya.

Karakteristik kesejahteraan rumah tangga berdasarkan aspek sosial ekonomi rumah tangga dideskripsikan dalam pengalaman rumah tangga mendapatkan pelayanan kesehatan gratis dalam enam bulan terakhir dan pengalaman rumah tangga membeli beras raskin dalam tiga bulan terakhir.

Tabel 16. Statistik Deskriptif Pengalaman

Mendapatkan Pelayanan Kesehatan Gratis dalam Enam Bulan Terakhir Pengalaman Mendapatkan Pelayanan Kesehatan Gratis dalam Enam Bulan Terakhir Miskin Tidak Miskin Total n (%) n (%) n (%) Pernah 7 6,5 101 93,5 108 100 Tidak pernah 8 1,3 620 98,7 628 100 Total 15 2 721 98 736 100

Tabel 16 menunjukkan bahwa persentase rumah tangga miskin pernah mendapatkan pelayanan kesehatan gratis dalam enam bulan terakhir lebih besar daripada tidak pernah. Sebaliknya, persentase rumah tangga tidak miskin pernah mendapatkan pelayanan kesehatan gratis dalam enam bulan terakhir lebih kecil daripada tidak pernah.

(11)

11

Tabel 17. Statistik Deskriptif Pengalaman Membeli

Beras Raskin dalam Tiga Bulan Terakhir

Pengalaman Membeli Beras Raskin dalam Tiga Bulan Terakhir Miskin Tidak Miskin Total n (%) n (%) n (%) Pernah 13 6,1 200 93,9 213 100 Tidak pernah 2 0,4 521 99,6 523 100 Total 15 2 721 98 736 100

Tabel 17 menunjukkan bahwa persentase rumah tangga miskin pernah membeli beras raskin dalam tiga bulan terakhir lebih besar daripada tidak pernah. Sebaliknya, persentase rumah tangga tidak miskin pernah membeli beras raskin dalam tiga bulan terakhir lebih kecil daripada tidak pernah.

Karakteristik kesejahteraan rumah tangga berdasarkan aspek teknologi informasi dan komunikasi dideskripsikan dalam ada/tidak ada anggota rumah tangga yang dapat menggunakan telepon seluler dan ada/tidak ada anggota rumah tangga yang menguasai penggunaan komputer desktop.

Tabel 18. Statistik Deskriptif Ada/Tidak Ada Anggota

Rumah Tangga yang dapat Menggunakan Telepon Seluler Ada/Tidak Ada ART yang dapat Menggunakan Telepon Seluler Miskin Tidak Miskin Total n (%) n (%) n (%) Ya 8 1,4 583 98,6 591 100 Tidak 7 4,8 138 95,2 145 100 Total 15 2 721 98 736 100

Tabel 18 menunjukkan bahwa persentase adanya anggota rumah tangga miskin yang dapat menggunakan telepon seluler lebih kecil daripada yang tidak dapat. Sebaliknya, persentase adanya anggota rumah tangga tidak miskin yang dapat menggunakan telepon seluler lebih besar daripada yang tidak dapat.

Tabel 19. Statistik Deskriptif Ada/Tidak Ada Anggota

Rumah Tangga yang Menguasai Penggunaan Komputer Desktop Ada/Tidak Ada ART yang Menguasai Penggunaan Komputer Desktop Miskin Tidak Miskin Total n (%) n (%) n (%) Ya 3 1,6 183 98,4 186 100 Tidak 12 2,2 538 97,8 550 100 Total 15 2 721 98 736 100

Tabel 19 menunjukkan bahwa bahwa jumlah anggota rumah tangga miskin dan tidak miskin yang tidak menguasai penggunaan komputer desktop lebih besar daripada yang menguasai.

Metode regresi logistik digunakan untuk mengetahui pola hubungan antara variabel respon yang bersifat kategorik dengan satu atau lebih variabel prediktor baik yang bersifat kontinu maupun kategorik. Pada penelitian ini regresi logistik digunakan untuk mengetahui pola hubungan kesejahteraan rumah tangga di Kota Malang dengan variabel-variabel prediktor yang diduga mempengaruhinya. Variabel respon yang digunakan adalah kesejahteraan rumah tangga yang dikategorikan menjadi dua, yaitu Y=1 untuk rumah tangga miskin dan Y=2 untuk rumah tangga tidak miskin. Oleh karena itu, regresi logistik yang digunakan adalah regresi logistik biner.

Analisis regresi logistik biner ini didahului dengan pengujian secara individu terhadap masing-masing variabel prediktor. Pengujian ini digunakan untuk mengetahui pengaruh masing-masing variabel prediktor terhadap variabel respon secara individu. Hipotesis yang digunakan sebagai berikut.

H0 : βj= 0

H1 : βj≠ 0, dengan j = 1,2,…,p

Tingkat signifikansi yang digunakan yaitu α = 5%. Statistik uji yang digunakan adalah statistik uji Wald. Keputusan penolakan H0 jika p-value <

α atau nilai W2_{lebih besar dari}_𝜒𝜒₂

(12)

12

Tabel 20. Uji Signifikansi Parameter Secara

Individu

Variabel

Prediktor Wald p-value

X1 2,047 0,153 X2 1,351 0,245 X3 3,015 0,082 X4 9,564 0,089 X5 18,018 0,000* X6 1,078 0,299 X7 1,110 0,574 X8 16,663 0,001* X9 1,430 0,839 X10 1,495 0,914 X11 6,432 0,011* X12 0,000 1,000 X13 9,188 0,057 X14 10,116 0,001* X15 13,710 0,000* X16 6,175 0,013* X17 0,224 0,636 Keterangan :

*parameter signifikan berpengaruh pada α = 5% Tabel 20 menunjukkan bahwa variabel pre-diktor signifikan berpengaruh pada taraf α = 5% adalah variabel X5, X8, X11, X14, X15, dan X16.

Dengan demikian, pada pembentukan model regresi logistik biner secara serentak hanya keenam variabel prediktor tersebut yang dapat dimasukkan ke dalam model.

Pembentukan model regresi logistik biner secara serentak ini bertujuan untuk mengetahui peranan setiap variabel prediktor dalam model secara bersama-sama (serentak). Variabel prediktor yang digunakan untuk membentuk model regresi logistik biner ini adalah variabel prediktor yang secara individu signifikan berpengaruh terhadap variabel respon. Teknik yang digunakan dalam uji serentak adalah teknik backward wald dengan hipotesis sebagai berikut.

H0 : β1 = β2 = … = βp = 0

H1 : paling sedikit ada satu βj≠ 0, dengan

j = 1,2,…, p

Tingkat signifikansi yang digunakan yaitu α = 5%. Statistik uji yang digunakan adalah statistik uji G yang mengikuti distribusi Chi-Square. Keputusan penolakan H0 jika p-value < α, yang

berarti bahwa nilai G lebih besar 𝜒𝜒2

R(6;0,05)=

12,592.

Tabel 21. Uji Signifikansi Parameter Secara Serentak

Variabel Prediktor β p-value X5 -0,616 0,000* X8 0,035* X8(1) -0,251 0,804 X8(2) -0,396 0,695 X8(3) -2,398 0,026* X11(1) 1,659 0,053 X14(1) -1,068 0,096 X15(1) -1,779 0,037* X16(1) 1,526 0,032* Konstanta 7,266 0,000 Keterangan :

*parameter signifikan berpengaruh pada α = 5% Nilai statistik uji G yang dihasilkan adalah sebesar 56,352 dimana nilai ini lebih besar dari nilai 𝜒𝜒2

R(6;0,05) sehingga keputusan yang diambil

adalah tolak H0, atau dengan kata lain paling

sedikit ada satu βj≠ 0. Tabel 21 mengindikasikan

bahwa variabel prediktor yang signifikan berpengaruh terhadap variabel respon adalah X5,

X8, X15, dan X16.

Jadi, model regresi logistik biner yang diperoleh adalah sebagai berikut.

(1)) X 526 , 1 ) 1 ( 1,779X -(3) 2,398X -0,616X -(7,266 exp 1 (1)) X 526 , 1 ) 1 ( 1,779X -(3) 2,398X -0,616X -exp(7,266 (x) 16 15 8 5 16 15 8 5 + + + = π

Berikut ini adalah ilustrasi mengenai perhitungan nilai peluang. Misal, rumah tangga dengan karakteristik jumlah anggota rumah tangga 4 or ang, status pekerjaan utama kepala rumah tangga adalah pengusaha, tidak pernah membeli beras raskin dalam tiga bulan terakhir, dan ada anggota rumah tangga yang dapat menggunakan telepon seluler memiliki nilai peluang untuk menjadi tidak miskin sebagai berikut. 99 , 0 (1)) 526 , 1 ) 0 ( 1,779 -2,398(0) -0,616(4) -(7,266 exp 1 (1)) 526 , 1 ) 0 ( 1,779 -2,398(0) -0,616(4) -exp(7,266 ) ( = + + + = miskin tidak P

Uji kesesuaian model digunakan untuk mengetahui apakah terdapat perbedaan antara hasil observasi dengan kemungkinan hasil prediksi. Hipotesis yang digunakan adalah sebagai berikut.

H0 : model sesuai (tidak ada perbedaan antara

hasil observasi dengan kemungkinan hasil prediksi)

H1 : model tidak sesuai (ada perbedaan antara

hasil observasi dengan kemungkinan hasil prediksi)

Tingkat signifikasi yang digunakan adalah α = 5%. Pada Hosmer and L emeshow test diperoleh nilai p-value sebesar 0,820 dimana nilai p-value >

(13)

13

α sehingga keputusannya adalah gagal tolak H0

yang berarti model sesuai atau tidak ada perbedaan antara hasil observasi dengan hasil prediksi pada tingkat signifikansi α = 5%. Dengan demikian, model regresi logistik yang diperoleh sesuai untuk menjelaskan seberapa besar peluang sebuah rumah tangga di Kota Malang termasuk rumah tangga tidak miskin.

Setelah dilakukan uji kesesuaian model langkah selanjutnya adalah menginterpretasikan model dengan odds ratio. Nilai odds ratio ditunjukkan pada Tabel 22.

Tabel 22. Nilai Odds Ratio Model Regresi Logistik

Variabel Prediktor β Odds Ratio X5 -0,616 0,540 X8 X8(1) -0,251 0,778 X8(2) -0,396 0,673 X8(3) -2,398 0,091 X15(1) -1,779 0,169 X16(1) 1,526 4,601

Tabel 22 menunjukkan nilai odds ratio yang berguna untuk mengetahui besarnya pengaruh variabel prediktor terhadap kesejahteraan rumah tangga. Interpretasi yang bisa diperoleh adalah sebagai berikut.

- Variabel jumlah anggota rumah tangga

memiliki nilai odds ratio sebesar 0,540 dan β bertanda negatif. Hal ini menunjukkan bahwa rumah tangga dengan jumlah anggota rumah tangga yang sedikit memiliki resiko lebih kecil daripada rumah tangga dengan jumlah anggota rumah tangga yang banyak untuk menjadi rumah tangga tidak miskin.

- Pada variabel status pekerjaan utama kepala rumah tangga, rumah tangga dengan status pekerjaan utama kepala rumah tangga sebagai buruh/karyawan memiliki resiko 0,778 kali lebih tinggi daripada rumah tangga yang kepala rumah tangganya tidak bekerja untuk menjadi rumah tangga tidak miskin. Rumah tangga dengan status pekerjaan utama kepala rumah tangga sebagai pengusaha memiliki resiko 0,673 kali lebih tinggi daripada rumah tangga yang kepala rumah tangganya tidak bekerja untuk menjadi rumah tangga tidak miskin. Sedangkan rumah tangga dengan status pekerjaan utama kepala rumah tangga lainnya memiliki resiko 0,091 kali lebih tinggi daripada rumah tangga

yang kepala rumah tangganya tidak bekerja untuk menjadi rumah tangga tidak miskin.

- Pada variabel pengalaman membeli beras

raskin dalam tiga bulan terakhir, rumah tangga yang pernah membeli beras raskin dalam tiga bulan terakhir memiliki resiko 0,169 kali lebih tinggi daripada rumah tangga yang tidak pernah membeli beras raskin dalam tiga bulan terakhir untuk menjadi rumah tangga tidak miskin.

- Pada variabel ada/tidak ada anggota rumah tangga yang dapat menggunakan telepon seluler, rumah tangga yang memiliki anggota rumah tangga yang dapat menggunakan telepon seluler memiliki resiko 4,601 k ali lebih tinggi daripada rumah tangga yang tidak memiliki anggota rumah tangga yang dapat menggunakan telepon seluler untuk menjadi rumah tangga tidak miskin.

Tabel klasifikasi merupakan cara lain yang menarik untuk menyatakan kelayakan suatu model yaitu seberapa besar persentase observasi secara tepat diklasifikasikan. Hasil tabel ini berupa klasifikasi silang dari variabel respon

dengan skala dikotomus (dua kategori)

sebagaimana ditunjukkan pada Tabel 23.

Tabel 23. Tabel Klasifikasi Model Regresi Logistik

Observasi Prediksi Ketepatan Klasifikasi(%) Miskin Tidak Miskin Miskin 1 14 6,7 Tidak Miskin 2 719 99,7

Ketepatan Klasifikasi Total (%) 97,8 Berdasarkan Tabel 23 diketahui bahwa persentase seluruh observasi terklasifikasikan dengan benar adalah 97,8% sehingga besarnya misklasifikasi (APER) adalah 2,2%. Nilai misklasifikasi ini tidak terlalu besar sehingga bisa disimpulkan bahwa model regresi logistik cukup baik dalam mengklasifikasikan rumah tangga miskin dan tidak miskin.

Pendekatan bagging regresi logistik

dilakukan untuk meningkatkan nilai ketepatan klasifikasi yang telah diperoleh pada regresi logistik biner. Hasil pada model regresi logistik biner menyimpulkan bahwa variabel yang signifikan berpengaruh terhadap kesejahteraan rumah tangga adalah jumlah anggota rumah tangga (X5), status pekerjaan utama kepala rumah

tangga (X8), pengalaman membeli beras raskin

(14)

14

anggota rumah tangga yang dapat menggunakan telepon seluler (X16). Keempat variabel inilah

yang kemudian akan diperlakukan resampling bagging.

Sampel bootstrap diambil sebanyak n da ta, yaitu sebanyak 736 data, kemudian direplikasi bootstrap sebanyak 50, 60, 70 hingga 80 kali. Pada setiap pengambilan sampel akan dibentuk model multiple regresi logistik biner sehingga akan diperoleh nilai ketepatan klasifikasi sebanyak B dalam setiap B replikasi bootstrap.

Program bagging dijalankan dengan macro

minitab.

Perhitungan ketepatan klasifikasi dilakukan pada setiap pengambilan sampel. Hasil perhitungan ketepatan kemudian dirata-rata sehingga menghasilkan ketepatan klasifikasi

bagging regresi logistik biner. Kesalahan

klasifikasi eB pada tiap pengambilan sampel

dihitung dengan perhitungan (1-ketepatan klasifikasi). Keberhasilan bagging diukur dari

seberapa besar bagging dapat menurunkan

kesalahan klasifikasi dari model data set tunggal. Tabel 22 merupakan hasil dari bagging dengan 50, 60, 70 hingga 80 kali replikasi bootstrap.

Tabel 24. Hasil Bagging Regresi Logistik

Replikasi Bootstrap Rata-rata Ketepatan Klasifikasi 𝒆𝒆� RB es 50 kali 97,6 2,4% 97,8% 60 kali 98% 2% 97,8% 70 kali 97,8% 2,2% 97,8% 80 kali 97,5% 2,5% 97,8%

Tabel 24 memberikan informasi bahwa dengan 60 kali replikasi bootstrap diperoleh rata-rata ketepatan klasifikasi terbesar, yaitu sebesar 98%. Jadi, berdasarkan hasil di atas, maka dapat disimpulkan bahwa diperoleh bagging prediktor terbaik adalah pada replikasi bootstrap sebanyak 60 kali. Model bagging ini dapat meningkatkan ketepatan klasifikasi dari model data set tunggal, yaitu sebesar 97,8% menjadi 98%.

Estimasi parameter model bagging

merupakan nilai rata-rata estimasi parameter B kali replikasi bootstrap. Jika dilakukan replikasi 60 kali, maka estimasi parameter model bagging adalah hasil rata-rata estimasi parameter ke-60 model multiple regresi logistik biner. Pada 60 kali replikasi bootstrap diperoleh ketepatan klasifikasi terbesar. Model bagging regresi logistik yang diperoleh pada 60 kali replikasi bootstrap adalah :

(2) 1,54173X -(2) 5,62061X (4) X 87352 , 1 ) 3 ( 1,52336X -(2) 0,40477X -0,73314X -7,72562 ) ( 16 15 8 8 8 5 + + = x g

5. KESIMPULAN DAN SARAN

Berdasarkan hasil analisis dan pembahasan, maka diperoleh kesimpulan sebagai berikut. 1.

Hasil analisis statistik deskriptif

menun-jukkan bahwa terdapat perbedaan dan

persamaan karakteristik kesejahteraan

ru-mah tangga di Kota Malang antara

ke-lompok rumah tangga miskin dan tidak

miskin dalam aspek kependudukan,

pen-didikan, perumahan, ketenagakerjaan, sosial ekonomi rumah tangga, dan teknologi in-formasi dan komunikasi.

2.

Hasil

analisis

regresi

logistik

menunjukkan bahwa

pola hubungan kesejahteraan rumah tangga di Kota Malang dengan faktor-faktor yang mempengaruhinya digambarkan dalam model regresi logistik berikut. (1)) X 526 , 1 ) 1 ( 1,779X -(3) 2,398X -0,616X -(7,266 exp 1 (1)) X 526 , 1 ) 1 ( 1,779X -(3) 2,398X -0,616X -exp(7,266 (x) 16 15 8 5 16 15 8 5 + + + = π

Pada model tersebut terdapat 4 (empat)

variabel prediktor yang signifikan

berpengaruh terhadap variabel respon, yaitu jumlah anggota rumah tangga (X5), status

pekerjaan utama kepala rumah tangga (X8),

pengalaman membeli beras raskin dalam tiga bulan terakhir (X15), dan ada/tidak ada

anggota rumah tangga yang dapat menggunakan telepon seluler (X16). Model

tersebut sudah sesuai untuk menjelaskan

seberapa besar peluang sebuah rumah

tangga di Kota Malang tahun 2009

termasuk dalam rumah tangga tidak

miskin dengan ketepatan klasifikasi

sebesar 97,8%.

3. Hasil analisis bagging regresi logistik menunjukkan bahwa pada 60 k ali replikasi bootstrap diperoleh nilai ketepatan klasifikasi terbesar, yaitu sebesar 98%.

Berdasarkan hasil analisis dan pembahasan, didapatkan informasi bahwa kesejahteraan rumah tangga di Kota Malang pada tahun 2009 lebih banyak dipengaruhi oleh status pekerjaan utama kepala rumah tangga sehingga diharapkan pemerintah Kota Malang dapat mengoptimalkan berbagai program yang telah dicanangkan untuk memperluas kesempatan kerja.

Sebaiknya pada penelitian selanjutnya yang

(15)

15

replikasi bootstrap yang lebih banyak untuk meningkatkan ketepatan klasifikasi.

6. DAFTAR PUSTAKA

Agresti, A. 1990. Categorical Data Analysis. John Wiley and Sons. New York.

Ananth, C.V. dan Kleinbaum, D.G. 1997. Regression Models for Ordinal Responses: A Review of Methods and A pplications. International Journal of Epidemiology, Vol. 26, No. 6, hal. 1323-1333.

Badan Pusat Statistik Sumatera Utara. 2004. Pola Distribusi Pendapatan dan Pengeluaran Penduduk.

Badan Pusat Statistik. 2009. Jawa Timur dalam Angka 2009. Surabaya : BPS.

Breiman, L. 1994. Bagging Predictor. Technical report No. 421. Departement of statistics University of California.

Cahyat, A., Gonner, C., dan Haug, M., 2007. Mengkaji Kemiskinan dan Kesejahteraan Rumah Tangga : Sebuah Panduan dengan Contoh dari Kutai Barat, Indonesia. Bogor : CIFOR.

Dias, J.G dan Vermunt J.K. 2005. A Bootstrap based Aggregate Classier for Model based Clustering. Journal of Annals Statistics. Efron, B., dan R. J. Tibshirani. 1993. An

Introduction to the Bootstrap. Chapman and Hall. New York.

Faturokhman, Molo dan Marcelinus, 1995. Kemiskinan dan Kependudukan di Pedesaan Jawa: Analisis data Susenas 1992. Yogyakarta : Pusat Penelitian Kependudukan Universitas Gadjah Mada.

Hosmer, D.W., dan Lemenshow. 2000. Applied Logistic Regression. USA : John Wiley and Sons.

Johnson, R. A. dan Wichern, D. W., 1992. Applied Multivariate Statistical Analysis. Prentice Hall. New Jersey.

Le, C. T., 1998. Applied Categorical Data Analysis. John Wiley and Sons, Inc. USA. McCullagh, P. dan J.A. Nelder. 1989. Generalized

Linear Models. 2nd ed. Chapman &

Hall/CRC, Boca Raton, Florida.

Mulyanto. 2005. Kemiskinan dan Kebutuhan Pokok. Jakarta : Rajawali.

Paramita. 2008. Bagging Regresi Logistik Ordinal pada Klasifikasi Status Gizi Balita (Studi

Kasus Kabupaten Nganjuk). Surabaya :

Jurusan Statistika FMIPA-ITS.

Prakosa. 2011. Klasifikasi Kesejahteraan Rumah Tangga di Provinsi Jawa Timur dengan

Pendekatan Bootstrap Aggregating

Classification and R egression Trees.

Surabaya : Jurusan Statistika FMIPA-ITS. Pratama. 2011. Klasifikasi Kesejahteraan Rumah

Tangga di Jawa Timur dengan Pendekatan Multivariate Adaptive Regression

Spline-Bootstrap Aggregating (MARS BAGGING).

Surabaya : Jurusan Statistika FMIPA-ITS. Rusastra, IW dan Togar, A.N., 2007.

Karak-teristik Wilayah dan Keluarga Miskindi Perdesaan: Basis Perumusan dan Intervensi Kebijakan. Pusat Analisis Sosial Ekonomi Pertanian, Bogor.

Suryadarma, D., Akhmad, H., dan Nina, T., 2005. Ukuran Obyektif Kesejahteraan Keluarga untuk Penargetan Kemiskinan : Hasil Uji CobaSistem Pemantauan Kesejahteraan oleh Masyarakat di Indonesia. Jakarta : SMERU. The World Bank, 2006. Making the New

IndonesiaWork for the Poor. USA.

Walpole, R.E. (Eds), 1993. Pengantar Statistika. Jakarta : PT Gramedia Pustaka Utama.