1 P P
(R.2)
KAJIAN PREDIKSI KLASIFIKASI OBYEK PADA VARIABEL RESPON BINER
Drs. Soekardi Hadi P.
Prodi Matematika Fakultas Sains dan Teknologi Universitas Islam As-Syafi’iyah
Email : [email protected]
Abstrak
Dalam makalah ini dibahas prediksi klasifikasi obyek respon biner berdasarkan variabel bebas (prediktor) numerik. Namun dengan asumsi Normalitas Distribusi populasi data numerik tidak dipenuhi, dalam pembentukan model digunakan fungsi logistik PEXP Z( ) /[1EXP Z( )] dengan bentuk kurva signoid, dalam hal ini Z = 0 + 1x1 +
2x2 + 3x3 + .
Hasil penerapan pada prediksi status pekerjaan anggota BKMT didapat bentuk taksiran fungsi logistik ln = 3,145 + 0,188pkprt - 0,625 pspnk - 0,295 pha kwnt atau p = exp (3,145 + 0,188 pkprt - 0,625 pspnk - 0,295 pha kwnt)
Kata Kunci : klasifikasi obyek, prediksi, biner, numerik, normalitas, logistik.
1. PENDAHULUAN
Dalam mempelajari masalah klasifikasi obyek atau keanggotaan kelompok dari individu anggota BKMT sebagai variabel respon (X) yang mencerminkan pilihan dua alternatif, status pekerjaan, menjadi wanita karir dengan probabilitas P dan diasumsikan berharga 1, lainnya bukan wanita karir (ibu rumah tangga) dengan probabilitas = 1 – P dan diasumsikan berharga 0. Berdasarkan variabel bebas (X) campuran antara kategori dan numerik atau semua numerik namun asumsi kenormalan distribusi populasi tidak dapat dipenuhi, melalui pendeteksian menggunakan uji Kolmogorov Smirnov. Hubungan antara Z sebagai kumpulan fungsi linier variabel predikfor atau bebas berbentuk :
Z = 0 + 1X1 + 2X2 + 3X3 + (1 )
Dalam hal ini :
X1 = Perilaku terhadap pekerjaan rumah tangga X2 = Perilaku terhadap status pernikahan X3 = Pandangan terhadap hak wanita (gender)
i = Parameter populasi, i = 1, 2, 3
= Faktor galat dalam model regresi linier ganda.
Dengan Y tidak linier dan seringkali dijumpai fungsi respon berbentuk signoid, salah satu pendekatan untuk memprediksi model ini adalah fungsi logistik biner (logit) berganda.
) exp(
1 exp
Z P Z
( 2 )
Dimana Z variabel prediktor dan penulisan exp Z (experimen Z) merupakan cara penulisan eZ, dan e bilangan pokok logaritma natural (dasar) disingkat ln, yang nilainya 2,71827.
Oleh karena itu fungsi logistik (1) di atas dapat ditulis dengan alternatif sebagai berikut :
Z Z e
e
Z Z
exp 1
exp
1
( 3 )
Sedangkan P merupakan probabilitas ibu-ibu anggota BKMT memilih status pekerjaan wanita karir, besarannya antara 0 dan 1.
Untuk probabilitas ibu-ibu BKMT yang memilih status pekerjaan bukan wanita karir (rumah tangga) dinyatakan dengan fungsi :
1 exp( )
1 exp
1 Z
Z ( 4 )2. METODE PENAKSIRAN FUNGSI LOGISTIK
Fungsi logistik ditaksir dengan metode kemungkinan maksimum (Maximum Likelihood Estimator = MLE). Setelah fungsi logistik dilinierkan dengan menggunakan transformasi perbandingan antara dan (1 - ) atau odd
1 dan diperoleh :
= eZ ( 5 )
Selanjutnya, bila kedua ruas kiri dan kanan di lon kan (ln), didapat persamaan : L = ln
1 = Z ( 6 )
dimana berbentuk fungsi Z seperti tertulis pada persamaan (1), maka diperoleh bentuk linier.
L = 0 + 1X1 + 2X2 + 3X3 + ( 7 ) Untuk menentukan taksiran i, i = 0, 1, 2, 3.
Karena Y berharga 0 atau 1, maka Y berdistribusi Bernaulli dan fungsi densitas dari Y dapat ditulis sebagai berikut :
y
y
yf ( ) [ ] ( 1 )
1 ( 8 )Dengan demikian bentuk fungsi Likelihoodnya :
y
L ( )
y( 1 )
1 ( 9 )Prinsip maksimum Likelihood pada intinya mencari kumpulan parameter i, i = 1,2,3,4 yang dapat memaksimumkan fungsi Likelihood, maka secara matematis ditulis ln L () = yi ln + (1 – y) ln (1 – ). Selanjutnya dengan persyaratan optimasi 0, 1, 2, 3, yang optimal akan diperoleh bila persyaratan FONC (First Order Necessary Condition) berikut dipenuhi :
FONC = 0
i L n
, i = 1, 2, 3, 4 (10)
Bila persamaan (10) diselesaikan maka diperoleh taksiran i sama dengan dan biasa ditulis bi, i = 0, 1, …, 4. dan taksiran ditulis P, maka diperoleh taksiran model logistik yang dilinierkan dalam ln :
ln
p p
1 = b0 + b1X1 + b2X2 + b3X3 (11)
atau
) exp(
1 exp
Z p Z
(12)
untuk :
Z = b0 + b1X1 + b2X2 + b3X3 (13)
Sebagai taksiran model regresi linier ganda dalam bentuk ln odd rasio P dengan (1 – P) dan fungsi logistik pada persamaan (2).
3. PENGUJIAN HIPOTESIS
Untuk memberlakukan model regresi logistik biner yang diperoleh atas dasar data sampel terhadap keseluruhan tatanan populasi obyek, perlu dilakukan pengujian hipotesis tentang pengaruh variabel bebas (X) terhadap proporsi fenomena variabel respons, dengan mengguntakan statistik uji Wald.
W =
2
i i
) E(b
b
Statistik ini berdistribusi khi kuadrat (chi-square) dengan Ho ditolak bila W 21 P dan diterima bila G 2 (1 P).
Dengan derajat kebebasan secara simbolik ditulis : W 2 2(1) dan kriteria pengujian Ho ditolak bila Wi ≥ 2tabel serta diterima bila W < 2 tabel.
Untuk uji keabsahan model logistik digunakan statistik uji :
G = -2 ln
B model Likelihood
A model Likelihood
(14)
Dalam hal ini model : G 2 (P)
A = hanya terdiri konstanta saja B = terdiri atas seluruh variabel
Ho ditolak bila G ≥ 2tabel serta diterima bila G < 2 tabel.
4. APLIKASI DAN PEMBAHASAN
Penerapan Pembentukan klasifikasi status pekerjaan wanita dengan menggunakan pendekatan Fungsi Logistik Biner, dilakukan terhadap 3 Responden ibu – ibu anggota Badan Kontak Majelis Ta’lim (BKMT) di Kota Bekasi.
Berdasarkan hasil olahan data dengan SPSS versi 15.00 didapat informasi prediksi klasifikasi pilihan status pekerjaan Wanita Karir dan bukan yang disajikan dalam Tabel 1 berikut ini :
Dari Tabel 1, terlihat bahwa taksiran (Prediksi) ibu – ibu BKMT yang masuk katagori wanita karir 150, sedangkan hasil observasi hanya 90, dengan demikian ketepatan klasifikasi 60,0 % dan prediksi yang bukan wanita karir 70, sedangkan hasil
Tabel.1 Klasifikasi data Observasi dan prediksi Status Pekerjaan
90 60 60.0
80 70 46.7
53.3 Observasi
Wanita Karir Bukan Wanita Karir
Status Pekerjaan
Peeswntase keseluruhan Langkah 1
Wanita Karir
Bukan Wanita Karir Prediksi
Persentase Prediksi
observasi 130, jadi ketepatan klasifikasi 70,0 %, secara keseluruhan kecepatan klasifikasi sebesar 752,2 %.
Untuk menyelidiki ketepatan model, dapat diperhatikan Tabel 2 berikut ini :
Berdasarkan tabel 2 di atas didapat nilai -2 log L = 41,325 lebih kecil dari nilai sehingga ditolak, hal ini menunjukan bahwa yang dihipotesiskan cocok atau sesuai dengann data. Sementara nilai uji Hosmer dan Lemeshouis juga lebih kecil dari , maka diterima dan dinyatakan bahwa data empires hasil penelitian sesuai dengan model. Taksiran Fungsi Regresi Logistik dapat dilihat dalam tabel 3 berikut ini :
Dari Tabel 3 tersebut tersebut didapat bentuk taksiran Fungsi Logistik Statyistik Pekerjaan sebagai berikut :
( ) = 3,145 + 0,188 pkprt - 0,625 pspnk atau - 0,295 phakwnt.
= exp [ ………]
Dan terlihat juga nilai wald untuk semua koefpers Fungsi Logistik lebih besar dari = 3,841, hal ini berarti masing - masing variabel bebas berpengaruh nyata dalam pembetukan Fungsi Logistik.
Selanjutnya dengan nilaia eksprimen ( ) untukl variabelpandangan tugas ibu - ibu rumah tangga sbesar 0,024. Hal ini menunjukkan bahwa kelompok ibu - BKMT yang
Tabel.2 Hasil Uji Kecocokan (FIT) Model
41,325 124,342 Diterima
8,512 9,4877 Diterima
Yang Dihipotesiskan (-2log L)
Data Empirik (Hosmer &
Lemeshow^s STATISTK
UJI FIT MODEL
Hitung Tabel
Khi Kuadrat (Chi Square) Kriteria uji Ho Data
Tabel.3 Koefisien Persamaan untuk tiap Variabel Bebas dan Konstanta
.188 .042 2305.314 1 .00 .024
-.625 .057 1439.452 1 .00 .141
-;295 .049 1759.045 1 .00 ,211
3.145 .042 5928.704 1 .00 6.290
pkprt(1) pspnk(1) phakwnt(1) Konstanta Step
1
B S.E. Wald df Sig. Exp(B)
berpandangan positif 0,024kali lebih rendah dari yang ne4gatif untuk menjadi wanita karir.
5. SIMPULAN
Berdasarkan hasil pembahasan dan kategori teoritis dapat disimpulkan, bahwa Model Regresi Logistik Biner dapat digunakan lebih fleksibel dibandig teknik yang lain yang dapat merancang prediksi model klasisifikasi obyek, karna tidak memiliki Normalitas atau variabel bebas digunakan dalam pembentukan model.
Kemudian interprestasi model tidak dapat langsung dari melihat nilai koefisien persamaan yang diperoleh dalam hasil keluaran (output) SPSS, melain kan di transformasi dulu kedalam bentuk exponent, dengan demikian bentuk persamaan yang diperoleh dinyatakan dalam bentuk = exp [ ………]
6. DAFTAR PUSTAKA
Freund, JE. (2000). Mathematical Statistics, Mexico, Prentice-Hall International.
Hosmer, DW & Stanley, W. (1999). Applied Logistic Regression, New York, John Wiley &
Sons.
Prabowo, Hadi, S. (2008). Alternatif Penerapan Model Diskriminan dan Logistik, Prosiding. Seminar Nasional Matematika, UNPAD, Jatinangor, 205-212.
Rusdin, (2004). Statistik Penelitian Sebab Akibat, Bandung, Pustaka Bani Quraisy.
Sartono, B. & Anang, K. (2007). Penerapan Generalized Additive Model dalam Penyusunan Model Skoring, Prosiding. Seminar Nasional Statistika, UNISBA, Bandung, Mei, 97 - 102.