RINGKASAN
RANI PUSPA DEWI. Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta). Dibimbing oleh AGUS M. SOLEH dan FARIT MOCHAMMAD AFENDI.
Model Regresi Poisson secara umum digunakan untuk menganalisis data cacah (count data) di mana rata-rata dan ragamnya harus sama. Namun kondisi ini jarang sekali ditemukan sehingga seringkali terjadi masalah overdispersi pada data. Salah satu model yang dapat mengakomodir masalah ini adalah Regresi Binomial Negatif. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.
Pendidikan merupakan salah satu faktor penting yang berperan dalam upaya peningkatan kesejahteraan rakyat dan pembentukan sumber daya manusia yang berkualitas. Ujian Nasional merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa, dimulai ketika tahun 2003 dimana terjadi perubahan sistem pendidikan di Indonesia dengan adanya pemberlakuan standar nilai kelulusan.
Jumlah siswa yang tidak lulus UN diasumsikan menyebar mengikuti sebaran Poisson, sehingga untuk mengetahui pengaruh faktor eksternal dapat digunakan Regresi Poisson.
Jumlah siswa yang tidak lulus UN menunjukkan terjadi overdispersi, sehingga pemodelan yang tepat adalah menggunakan Regresi Binomial Negatif. Hasil analisis menunjukkan bahwa faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus UN adalah akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru. Model Regresi Binomial Negatif memenuhi kriteria kebaikan model daripada model Regresi Poisson dalam masalah overdispersi, sehingga dapat disimpulkan Regresi Binomial Negatif merupakan salah satu solusi yang dapat digunakan untuk mengatasi permasalahan overdispersi.
KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN
MENGGUNAKAN REGRESI BINOMIAL NEGATIF
(Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional
di DKI Jakarta)
RANI PUSPA DEWI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Karya ini ku persembahkan untuk ....
Orang tuaku..
Teman-temanku: Meta, Mala, Yusri, Ika, Agustina,
Ufi, Neng, Sevrien. Thx for our friendship,,hope we will
be friends forever...
RINGKASAN
RANI PUSPA DEWI. Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta). Dibimbing oleh AGUS M. SOLEH dan FARIT MOCHAMMAD AFENDI.
Model Regresi Poisson secara umum digunakan untuk menganalisis data cacah (count data) di mana rata-rata dan ragamnya harus sama. Namun kondisi ini jarang sekali ditemukan sehingga seringkali terjadi masalah overdispersi pada data. Salah satu model yang dapat mengakomodir masalah ini adalah Regresi Binomial Negatif. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.
Pendidikan merupakan salah satu faktor penting yang berperan dalam upaya peningkatan kesejahteraan rakyat dan pembentukan sumber daya manusia yang berkualitas. Ujian Nasional merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa, dimulai ketika tahun 2003 dimana terjadi perubahan sistem pendidikan di Indonesia dengan adanya pemberlakuan standar nilai kelulusan.
Jumlah siswa yang tidak lulus UN diasumsikan menyebar mengikuti sebaran Poisson, sehingga untuk mengetahui pengaruh faktor eksternal dapat digunakan Regresi Poisson.
Jumlah siswa yang tidak lulus UN menunjukkan terjadi overdispersi, sehingga pemodelan yang tepat adalah menggunakan Regresi Binomial Negatif. Hasil analisis menunjukkan bahwa faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus UN adalah akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru. Model Regresi Binomial Negatif memenuhi kriteria kebaikan model daripada model Regresi Poisson dalam masalah overdispersi, sehingga dapat disimpulkan Regresi Binomial Negatif merupakan salah satu solusi yang dapat digunakan untuk mengatasi permasalahan overdispersi.
KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN
MENGGUNAKAN REGRESI BINOMIAL NEGATIF
(Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional
di DKI Jakarta)
RANI PUSPA DEWI
Skripsi
Sebagai Salah satu syarat untuk meperoleh gelar Sarjana Sains
Pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Judul Skripsi : KAJIAN OVERDISPERSI PADA REGRESI POISSON
DENGAN MENGGUNAKAN REGRESI BINOMIAL
NEGATIF (Studi Kasus Ketidaklulusan Siswa SMA dalam
Ujian Nasional di DKI Jakarta)
Nama
: Rani Puspa Dewi
NRP
: G14104022
Menyetujui:
Pembimbing I,
Pembimbing II,
Agus M. Soleh, S.Si, M.T.
Farit Mochamad Afendi, M.Si
NIP. 132232455
NIP. 132314007
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. Drh. Hasim, DEA
NIP. 131578806
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta tanggal 23 Desember 1986 sebagai anak pertama dari pasangan Bambang Sudjati dan Linda Syarifah.
Pendidikan dasar diselesaikan penulis di SD Waskito 4 pada tahun 1998, dilanjutkan dengan pendidikan menengah pertama di SLTP Negeri 2 Pamulang dan lulus pada tahun 2001. Tahun 2004 penulis menyelesaikan pendidikan menengah atas di SMA Negeri 1 Pamulang dan pada tahun yang sama diterima sebagai mahasiswa di Departemen Statistika Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI).
Selama perkuliahan penulis aktif berorganisasi sebagai Anggota Departemen Olahraga dan Seni Himpunan Profesi Gamma Sigma Beta tahun 2006 dan anggota Divisi Data Analysis Decision Centre. Selain itu, penulis juga aktif mengikuti beberapa kegiatan kepanitiaan seperti Statistika Ria 2005, Statistika Ria 2006, Studium General dan Software Training 2006 serta Pesta Sains Nasional 2007. Penulis juga pernah menjadi asisten responsi untuk mata kuliah Metode Statistika pada tahun 2006-2007.
KATA PENGANTAR
Alhamdulillahi robbil alamin, puji dan syukur penulis panjatkan kehadirat Allah SWT atas limpahan nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Tak lupa shalawat serta salam penulis panjatkan kepada Rasulullah Muhammad SAW beserta keluarga, sahabat dan umatnya.
Karya ilmiah ini berjudul ”Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta)”. Karya ilmiah ini memuat kajian mengenai pemodelan Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor eksternal yang berpengaruh terhadap ketidaklulusan siswa SMA dalam Ujian Nasional di DKI Jakarta yang dapat memberikan manfaat kepada penulis khususnya dan kepada semua pihak pada umumnya.
Terima kasih penulis ucapkan kepda semua pihak yang telah membantu dalam penyusunan karya ilmiah ini, antara lain :
1. Bapak Agus M. Soleh S.Si, M.T. dan Bapak Farit Mochammad Afendi M.Si atas bimbingannya selama menyelesaikan karya ilmiah ini.
2. Bapak Daryono, Ibu Eli dan pihak DIKMENTI Propinsi DKI Jakarta atas bantuannya kepada penulis memperoleh data untuk karya ilmiah ini.
3. Efril dan Cheria sebagai teman seperjuangan dan atas bantuannya dalam entrydata.
4. Mas Supri dan Adi atas softcopyskripsinya dan waktu sharing-nya tentang materi penelitian ini.
5. Wiwik, Lia dan Doddy yang telah bersedia menjadi pembahas dalam seminar.
6. Keluarga khususnya kedua orang tuaku dan adikku Vina atas doa, kasih sayang dan dukungannya yang mendorong penulis untuk memberikan yang terbaik.
7. Semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu penulis selama menyelesaikan karya ilmiah ini.
Bogor, September 2008
DAFTAR ISI
Halaman
DAFTAR TABEL ... vii
DAFTAR GAMBAR ... vii
DAFTAR LAMPIRAN ... vii
PENDAHULUAN Latar Belakang... 1
Tujuan... 1
TINJAUAN PUSTAKA Generalized Linear Model... 1
Regresi Poisson ... 1
Overdispersi Pada Regresi Poisson ... 1
Regresi Binomial Negatif ... 2
Goodness of Fits Tests... 2
BAHAN DAN METODE Bahan... 2
Metode... 2
HASIL DAN PEMBAHASAN Deskripsi Data ... 3
Model Regresi Poisson dan Regresi Binomial Negatif... 5
Goodness of FitsModel... 6
SIMPULAN DAN SARAN Simpulan... 6
Saran ... 7
DAFTAR PUSTAKA ... 7
DAFTAR TABEL
Halaman
1. Peubah penjelas untuk membangun model ... 3
2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah ... 3
3. Nilai rata-rata karakteristik SMA... 4
4. Deskripsi peubah penjelas... 5
5. Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007 ... 5
6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007... 5
7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007 ... 6
8. Goodness of fits statisticsmodel Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 ... 6
9. Goodness of fits statisticsmodel Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 ... 6
DAFTAR GAMBAR
Halaman 1. Diagram alur analisis ... 3
2. Persentase jumlah siswa tidak lulus UN ... 3
3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta ... 4
DAFTAR LAMPIRAN
Halaman 1. Hasil uji parameter model Regresi Poisson masing-masing tahun ajaran 1.1 Hasil uji parameter model Regresi Poisson tahun ajaran 2005/2006... 9
1.2 Hasil uji parameter model Regresi Poisson tahun ajaran 2006/2007... 9
2. Hasil uji parameter model Regresi Binomial Negatif masing-masing tahun ajaran 2.1 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2005/2006 ... 10
1
PENDAHULUAN
Latar Belakang
Model Regresi Poisson secara umum telah banyak digunakan untuk menganalisis data cacah di mana rata-rata dan ragamnya sama. Akan tetapi kondisi ini jarang sekali ditemukan pada data, sehingga seringkali ditemukan keragaman data lebih besar daripada rata-ratanya. Fenomena seperti ini disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.
UN merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa. Hal ini bermula pada tahun 2003 ketika pemerintah mengubah Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) menjadi UN. Perubahan ini ditujukan agar sumber daya yang dihasilkan lebih berkualitas yaitu dengan memberlakukan standar nilai kelulusan.
Jumlah siswa SMA yang tidak lulus UN dapat dikatakan masih cukup tinggi. Sementara itu diketahui bahwa tingkat pendidikan penduduk berkorelasi positif dengan status ekonomi, derajat kesehatan dan laju pertumbuhan penduduk (Depdiknas dalam Wulansari 2008). Hasil penelitian Wulansari (2008) menyatakan secara statistik jumlah siswa yang tidak lulus UN dapat diasumsikan berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, sehingga hubungan antara jumlah siswa yang tidak lulus UN dengan faktor-faktor yang berpengaruh dapat diketahui melalui Regresi Poisson.
Tujuan
Tujuan dari penelitian ini adalah mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA dalam UN di DKI Jakarta untuk tahun ajaran 2005/2006 dan 2006/2007.
TINJAUAN PUSTAKA
Generalized Linear ModelGeneralized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002)
menyatakan ada tiga komponen dalam GLM yaitu:
Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya.
Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan.
Link function ditunjukkan dengan fungsi nilai harapannya sama dengan systematic component.
Regresi Poisson
Regresi Poisson termasuk ke dalam GLM dan merupakan salah satu bentuk analisis regresi yang digunakan untuk model data cacah (count data) dan data dalam bentuk tabel kontingensi. Model Regresi Poisson kadang dikenal dengan log-linear model, terutama ketika digunakan untuk model tabel kontingensi.
Model Regresi Poisson dengan peubah penjelas X dapat dituliskan sebagai berikut (Agresti, 2002) :
Log = +x
Fungsi peluang sebaran Poisson adalah:
! ) ; ( y e y f y
y=0,1,2,.... dengan asumsi E(Y)= Var(Y)=.
Fungsi penghubung kanonik (cannonical link function) untuk Regresi Poisson yaitu:
) ' ( ) log( ) (
g X
Pendugaan parameter koefisien Regresi Poisson dapat diduga dengan menggunakan Maximum Likelihood Estimation (MLE) melalui iterasi dengan metode Newton Raphson untuk memaksimumkan fungsi log-likelihoodnya L(y,,).
Overdispersi pada Regresi Poisson
Data cacah untuk Regresi Poisson dikatakan mengandung overdispersi apabila keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Fenomena overdispersi (McCullagh & Nelder, 1983) dapat dituliskan:
2
Overdispersi dapat diindikasikan dengan nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada data. Overdispersi dapat pula terjadi karena adanya pengamatan missing pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, peubah penjelas perlu ditransformasi atau kesalahan spesifikasi link function(Hardin & Hilbe, 2007).
Regresi Binomial Negatif
Regresi Binomial Negatif merupakan salah satu solusi untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe, 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut:
y k k k k k y k k y k y f
1 ) 1 ( ) ( ) ( ) , , ( y=0,1,2,....di mana k dan adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut parameter dispersi.
Goodness Of Fit Tests
Ismail dan Jemain (2007) menyatakan bahwagoodness of fits model Regresi Poisson dan Regresi Binomial Negatif dapat dilihat dari nilai Pearson Chi-squares, Deviance, AIC (Akaike Information Criterion), BSC (Bayesian Schwartz Information Criterion) dan nilai Likelihood Ratio statistics. Nilai Pearson Chi-squaresdan Devianceyang lebih mendekati derajat bebasnya menunjukkan model yang lebih baik. Sedangkan nilai AIC dan BSC yang lebih kecil menujukkan model yang lebih baik dan untuk nilai Likelihood Ratio Statistics yang menunjukkan Tolak H0 berarti model tersebut yang lebih baik, karena mengindikasikan adanya overdispersi pada data.
Famoye, Wulu & Singh (2004) menyatakan untuk goodness of fitsdapat pula digunakan nilai log-likelihood di mana model dengan nilai log-likelihood yang lebih besar menunjukkan model yang lebih baik.
BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini adalah data sekunder jumlah kelulusan siswa tiap SMA di DKI Jakarta yang diperoleh dari Dinas Pendidikan Menengah dan Tinggi (DIKMENTI) Propinsi DKI Jakarta. Peubah respon yang diamati adalah jumlah siswa yang tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1.
Pada penelitian ini untuk membangun model dimasukkan pula peubah offset, yaitu suatu peubah penjelas yang dimasukkan ke dalam model namun nilai koefisiennya tidak diestimasi tapi diasumsikan nilainya sama dengan 1 dan biasanya nilainya bervariasi dari satu observasi ke observasi lain. Peubah yang digunakan sebagai peubah offsetadalah jumlah peserta UN.
Metode
Tahapan metode yang dilakukan dalam penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan adalah sebagai berikut :
1. Analisis statistika deskriptif jumlah siswa tidak lulus UN per rayon wilayah.
2. Deskripsi peubah penjelas untuk mendapatkan karakteristik SMA pada masing-masing tahun ajaran.
3. Pendeteksian overdispersi pada data dengan melihat nilai Pearson Chi-squares dan Deviance yang dibagi dengan derajat bebasnya.
4. Melakukan analisis Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor-faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN.
5. Interpretasi model Regresi Poisson dan Regresi Binomial Negatif.
6. Identifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, BSC, Pearson Chi-squares, Deviance, Likelihood ratio statistics dan log-likelihood dalam permasalahan overdispersi.
3
Tabel 1. Peubah penjelas untuk membangun model
Peubah Penjelas Simbol Kategori
Jumlah peserta UN
Peubah offset
Status SMA X1 Negeri=1,
Swasta=2
Akreditasi SMA X2 A=1, B=2, C=3 Rata-rata jumlah
siswa per kelas X3
Numerik
Jumlah ruang kelas dengan kondisi baik
X4
Numerik
Jumlah ruang kelas dengan kondisi rusak ringan
X5
Numerik
Jumlah ruang kelas dengan kondisi rusak berat
X6
Numerik
Jumlah ruang kelas bukan milik X7
Numerik
Jumlah
laboratorium IPA X8
Numerik Jumlah laboratorium bahasa X9 Numerik Jumlah laboratorium komputer X10 Numerik Jumlah
laboratorium IPS X11
Numerik
Jumlah
perpustakaan X12
Numerik
Jumlah guru X13 Numerik
Gambar 1. Diagram alur analisis
HASIL DAN PEMBAHASAN
Deskripsi Data
Banyaknya SMA di DKI Jakarta terhitung sebanyak 497 sekolah yang terdiri dari 116 SMA negeri dan 381 SMA swasta dengan distribusi jumlah SMA pada masing-masing rayon wilayah dapat dilihat pada Tabel 2. Persentase jumlah siswa yang tidak lulus UN untuk tahun ajaran 2005/2006 tercatat sebesar 5.61% lebih besar dibandingkan tahun ajaran 2006/2007 yang hanya sebesar 3.67% (Gambar 2).
Tabel 2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah
Rayon
Wilayah Negeri Swasta
Jakarta Barat 17 97
Jakarta Pusat 13 60
Jakarta Selatan 29 67
Jakarta Timur 39 95
Jakarta Utara 17 62
Kepulauan
Seribu 1 0
Jumlah 116 381
5.61% 3.76% 0% 1% 2% 3% 4% 5% 6% 2005/2006 2006/2007 P e rs e n ta se J u m la h S is w a T id a k L u lu s
Gambar 2. Persentase jumlah siswa tidak lulus UN
Distribusi jumlah siswa tidak lulus UN tahun ajaran 2005/2006 dan 2006/2007 untuk tiap rayon wilayah di DKI Jakarta memperlihatkan jumlah siswa tidak lulus terbesar terjadi pada tahun ajaran 2005/2006 (Gambar 3). Ketidaklulusan tertinggi terjadi pada rayon Jakarta Pusat untuk tahun ajaran 2005/2006, sedangkan untuk tahun ajaran 2006/2007 ketidaklulusan tertinggi terjadi pada rayon Jakarta Timur.
4
0 200 400 600 800 1000 1200 1400 Ju m la h S is w a T id a k L u lu s Rayon Wilayah 2005/2006 2006/2007Gambar 3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta
Karakteristik untuk masing-masing tahun ajaran berdasarkan peubah penjelas secara lengkap dapat dilihat pada Tabel 3 dan Tabel 4.
Tahun ajaran 2005/2006
Karakteristik tahun ajaran 2005/2006 menunjukkan bahwa rata-rata jumlah siswa tidak lulus UN lebih tinggi daripada tahun ajaran 2006/2007. Kebanyakan SMA negeri pada tahun ajaran ini terakreditasi A, hanya satu yang terkreditasi B dan tidak ada SMA negeri yang terakreditasi C. Sedangkan untuk SMA swasta banyaknya SMA terakreditasi A dan B tidak berbeda jauh dan hanya 16 SMA swasta yang terakreditasi C. Rata-rata Log dari jumlah peserta UN lebih besar dibandingkan tahun ajaran 2006/2007. Rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2006/2007.
Tahun Ajaran 2006/2007
Karakteristik pada tahun ajaran 2006/2007 menunjukkan bahwa jumlah siswa tidak lulus UN lebih rendah daripada tahun ajaran 2005/2006. Seluruh SMA negeri pada tahun ajaran ini terakreditasi A, sedangkan banyaknya SMA swasta yang terkreditasi A, B dan C tidak jauh berbeda dengan tahun ajaran 2005/2006. Rata-rata Log dari jumlah peserta UN lebih kecil dibanding tahun ajaran 2005/2006. Rata-rata jumlah siswa per kelas,
jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2005/2006.
Tabel 3. Nilai rata-rata karakteristik SMA
Karakteristik SMA
Rata-rata 2005/2006 2006/2007
Jumlah siswa
tidak lulus 5.64 4.51
Rata-rata jumlah siswa per kelas
28.54 28.20
Jumlah ruang kelas dengan kondisi baik
13.58 13.46
Jumlah ruang kelas dengan kondisi rusak ringan
0.25 0.25
Jumlah ruang kelas dengan kondisi rusak berat
0.05 0.05
Jumlah ruang kelas bukan milik 0.11 0.11 Jumlah laboratorium IPA 0.57 0.57 Jumlah laboratorium Bahasa 0.52 0.52 Jumlah laboratorium Komputer 0.82 0.81 Jumlah laboratorium IPS 0.17 0.17 Jumlah
perpustakaan 0.92 0.93
Jumlah guru 32.41 32.12
5
Tabel 4. Deskripsi peubah penjelas
Tahu n Ajara n Status SMA Akr edit asi Juml ah % 2005/ 2006 Negeri
A 99 25.98%
B 1 0.26%
C 0 0%
Swasta
A 151 39.63%
B 114 29.92%
C 16 4.2%
2006/ 2007
Negeri
A 100 25.71%
B 0 0%
C 0 0%
Swasta
A 159 40.87%
B 115 29.56%
C 15 3.86%
Model Regresi Poisson dan Regresi Binomial Negatif
Overdispersi terjadi pada data tahun ajaran 2005/2006 dan 2006/2007 yang ditunjukkan oleh nilai Pearson Chi-squares dan Deviance dibagi dengan derajat bebas bernilai lebih dari 1 (Tabel 5).
Tabel 5. Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007
Tahun Ajaran
Pearson
Chi-squares Deviance
2005/2006 12.190 9.270
2006/2007 15.119 9.311
Model Regresi Poisson untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 6 dengan taraf nyata yang digunakan =10%. Hasil analisis dari uji koefisien parameter Regresi Poisson disajikan pada Lampiran 3.1 dan Lampiran 3.2.
Berdasarkan hasil analisis dari Uji Wald untuk koefisien parameter Regresi Poisson model tahun ajaran 2005/2006 faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium bahasa dan jumlah guru. Sedangkan untuk model tahun ajaran 2006/2007 faktor eksternal yang berpengaruh adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah
laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.
Pada Tabel 6 terlihat bahwa nilai dugaan parameter model tahun ajaran 2005/2006 untuk rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, laboratorium bahasa dan jumlah guru bernilai negatif. Hal ini menunjukkan bahwa hubungan antara peubah-peubah tersebut dengan log rata-rata dari jumlah siswa tidak lulus UN berbanding terbalik dan berlaku sebaliknya untuk nilai dugaan parameter yang bernilai positif. Hasil dari model Regresi Poisson ini dibandingkan dengan model Regresi Binomial Negatif.
Tabel 6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007
Tahun
Ajaran Model Regresi Poisson
2005/2006
Log()= -1.435 -0.187 X1(1) + 0.696 X2(3) - 0.012 X3 0.212 X6 -0.055 X7 - 0.319 X9 - 0.028 X13
2006/2007
Log()= -3.514 + 0.34 X1(1) + 1.202 X3(3) + 1.085 X3(2)+ 0.023 X4 0.013 X5 -0.056 X6 + 0.074 X8 + 0.287 X9 + 0.178 X10 + 0.268 X11 – 1.05 X12 – 0.356 X13 - 0.027 X14
Model Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 7. Hasil analisis dari uji koefisien parameter Regresi Binomial Negatif disajikan pada Lampiran 4.1 dan Lampiran 4.2.
6
Tabel 7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007
Tahun Ajaran
Model Regresi Binomial Negatif
2005/2006 Log()= -1.6487 + 0.760 X2(3)– 0.028 X13
2006/2007
Log()= -1.8568 + 0.8267 X2(2)+ 1.0729 X2(3) - 0.0220 X4 + 0.3232 X10 - 0.8312 X11 0.5850 X12 -0.0440 X13
Dari Tabel 7 terlihat bahwa untuk model tahun ajaran 2005/2006 nilai dugaan parameter untuk jumlah guru bernilai negatif yang berarti hubungan antara log rata-rata jumlah siswa tidak lulus UN dengan jumlah guru berbanding terbalik. Jika terjadi kenaikan jumlah guru maka log rata-rata jumlah siswa tidak lulus akan menurun. Begitu pula berlaku sebaliknya untuk nilai dugaan parameter akreditasi SMA yang bernilai positif.
Model Regresi Poisson menghasilkan hampir semua peubah penjelas berpengaruh terhadap jumlah siswa tidak lulus UN sedangkan pada model Regresi Binomial Negatif menunjukkan hal yang sebaliknya. Hal ini menunjukkan bahwa Regresi Binomial Negatif memberikan hasil uji signifikansi peubah penjelas yang lebih berarti dibanding Regresi Poisson sebagai akibat adanya overdispersi pada data.
Goodness of Fits Model
Kebaikan model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/ 2006 dan 2006/2007 dapat dilihat pada Tabel 8 dan Tabel 9. Untuk mendapatkan model yang terbaik dapat dilihat dari nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya dan nilai log-likelihood yang lebih besar. Pada Tabel 8 dan Tabel 9 terlihat bahwa hasil pemodelan faktor eksternal terhadap jumlah siswa tidak lulus UN dengan Regresi Binomial Negatif memenuhi kriteria yang telah disebutkan sehingga dapat dikatakan model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson untuk mengatasi permasalahan overdispersi. Nilai p-value dariLikelihood ratio testmodel Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan 2006/2007 yaitu 0.0000 (p-value < =10%) atau Tolak H0 dan
disimpulkan bahwa terjadi overdispersi pada data.
Tabel 8. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif
AIC 4335.053 2047.444
BSC 4394.195 2110.528
Pearson
Chi-squares 4475.605 397.7475 Deviance 3392.256 414.8415
Log-likelihood -2152.526 -1007.7218 Likelihood ratio statistics 908.104 (p-value= 0.0000 78.12 (p-value= 0.0000)
Tabel 9. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif
AIC 4211.490 1738.708
BSC 4212.490 1802.125
Pearson
Chi-squares 5654.693 438.3615 Deviance 3482.492 374.3787
Log-likelihood -2090.745 -853.35393 Likelihood ratio statistics 2021.192 (p-value= 0.0000 96.37 (p-value= 0.0000)
SIMPULAN DAN SARAN
Simpulan
Faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus untuk tahun ajaran 2005/2006 adalah akreditasi SMA dan jumlah guru. Sedangkan untuk tahun ajaran 2006/2007 faktor eksternal yang berpengaruh antara lain akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.
7
Hal ini ditunjukkan dengan terpenuhinya kriteria kebaikan modelnya yaitu nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya, nilai log-likelihood yang lebih besar dan nilai likelihood ratio testsyang menunjukkan Tolak H0.
Saran
Beberapa solusi lain yang dapat digunakan untuk mengatasi permasalahan overdispersi yaitu dengan Quasi-Likelihood dan Generalized Poisson Regression. Untuk penelitian selanjutnya dapat dibandingkan beberapa metode tersebut untuk mengetahui metode mana yang dapat memberikan tingkat akurasi yang cukup tinggi.
DAFTAR PUSTAKA
Agresti A. 2002. Categorical Data Analysis. John Wiley & Sons, Inc.
Ismail N & AA. Jemain. 2007. Handling Overdispersion with Binomial Negative and Generalized Poisson Regression Models. Casualty Actuarial Society Forum Casualty Actuarial Society – Arlington:Virginia:Winter, 103-158. http://www.casact.org/pubs/forum/07wfo rum/07w109.pdf. [29 April 2008]
Famoye F, Wulu JT., Singh KP. 2004. On The Generalized Poisson Regression Model with An Apllication to Accident Data. Journal of Data Science 2, 287-295.
Hardin JW, JM Hilbe. 2007. Generalized Linear Models and Extensions. Texas: A Stata Press Publication
McCullagh P & JA Nelder. 1983. Generalized Linear Models. London: Chapmann and Hall.
Wulansari, AD. 2008. Aplikasi Poisson Regression [abstrak]. Institut Teknologi
Sepuluh November.
9
Lampiran 1. Hasil uji parameter model Regresi Poisson masing-masing tahun ajaran
Lampiran 1.1 Hasil uji parameter model Regresi Poisson tahun ajaran 2005/2006
Parameter B Std. Error
95% Wald
Confidence Interval Hypothesis Test
Lower Upper
Wald Chi-Square
df Sig.
(Intercept) -1.435 0.1689 -1.766 -1.104 72.247 1 0.000
Swasta -0.187 0.0808 -0.346 -0.029 5.381 1 0.020
C 0.696 0.1207 0.459 0.932 33.189 1 0.000
B 0.070 0.0619 -0.051 0.192 1.288 1 0.256
Rata-rata jumlah
siswa per kelas -0.012 0.0033 -0.018 -0.006 13.790 1 0.000
Baik -0.002 0.0032 -0.008 0.005 0.290 1 0.590
Rusak ringan -0.008 0.0141 -0.035 0.020 0.302 1 0.583
Berat -0.212 0.0981 -0.404 -0.020 4.682 1 0.030
Bukan Milik -0.055 0.0285 -0.111 0.001 3.687 1 0.055
Lab IPA -0.041 0.0345 -0.108 0.027 1.398 1 0.237
Lab Bahasa -0.319 0.0504 -0.417 -0.220 40.026 1 0.000
Lab Komputer 0.017 0.0423 -0.066 0.100 0.169 1 0.681
Lab IPS 0.008 0.0652 -0.119 0.136 0.017 1 0.898
Perpustakaan 0.028 0.0804 -0.130 0.186 0.122 1 0.727
Jumlah guru -0.028 0.0027 -0.033 -0.022 102.494 1 0.000
(Scale) 1
Lampiran 1.2 Hasil uji parameter model Regresi Poisson tahun ajaran 2006/2007
Parameter B Std. Error
95% Wald
Confidence Interval Hypothesis Test
Lower Upper
Wald Chi-Square
df Sig.
(Intercept) -3.514 0.1725 -3.852 -3.176 415.070 1 0.000
Swasta 0.340 0.0978 0.148 0.531 12.073 1 0.001
C 1.202 0.1422 0.923 1.480 71.437 1 0.000
B 1.085 0.0637 0.960 1.209 290.059 1 0.000
Rata-rata jumlah
siswa per kelas 0.023 0.0033 0.017 0.030 49.151 1 0.000
Baik -0.013 0.0043 -0.022 -0.005 9.411 1 0.002
Rusak ringan -0.056 0.0256 -0.106 -0.005 4.711 1 0.030
Berat -0.020 0.0719 -0.161 0.121 0.076 1 0.783
Bukan Milik 0.074 0.0121 0.050 0.098 37.114 1 0.000
Lab IPA 0.287 0.0292 0.230 0.345 96.831 1 0.000
Lab Bahasa 0.178 0.0535 0.073 0.283 11.092 1 0.001
Lab Komputer 0.268 0.0490 0.172 0.364 29.990 1 0.000
Lab IPS -1.050 0.1085 -1.262 -0.837 93.544 1 0.000
Perpustakaan -0.356 0.0811 -0.515 -0.197 19.303 1 0.000
Jumlah guru -0.027 0.0034 -0.034 -0.021 65.691 1 0.000
10
Lampiran 2. Hasil uji parameter model Regresi Binomial Negatif masing-masing tahun ajaran
Lampiran 2.1 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2005/2006
Parameter B Std. Error
95% Wald Confidence
Interval Hypothesis Test
Lower Upper
Wald Chi-Square
df Sig.
(Intercept) -1.6487 0.6101 -2.8445 -0.4529 -2.70 1 0.007
Swasta -0.235 0.2827 -0.7890 0.3192 -0.83 1 0.406
C 0.760 0.4355 -0.0933 1.6137 1.75 1 0.081
B 0.250 0.2127 -0.1670 0.6668 1.18 1 0.240
Rata-rata jumlah siswa per kelas
-0.009 0.0105 -0.0299 0.0113 -0.89 1 0.375
Baik -0.007 0.0107 -0.0275 0.0144 -0.61 1 0.541
Rusak ringan 0.018 0.0762 -0.1311 0.1677 0.24 1 0.811
Berat -0.171 0.1925 -0.5487 0.2060 -0.89 1 0.373
Bukan Milik -0.100 0.0833 -0.2636 0.0629 -1.20 1 0.228
Lab IPA -0.062 0.1316 -0.3197 0.1963 -0.47 1 0.639
Lab Bahasa -0.216 0.1842 -0.5770 0.1451 -1.17 1 0.241
Lab Komputer 0.133 0.1520 -0.1649 0.4310 0.88 1 0.381
Lab IPS -0.257 0.2271 -0.7017 0.1885 -1.13 1 0.259
Perpustakaan 0.165 0.2816 -0.3867 0.7170 0.59 1 0.557
Jumlah guru -0.028 0.0089 -0.0455 -0.0105 -3.14 1 0.002
(Scale) 1.906 0.1664 1.6061 2.2616
Lampiran 2.2 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2006/2007
Parameter B Std. Error
95% Wald Confidence
Interval Hypothesis Test
Lower Upper
Wald Chi-Square
df Sig.
(Intercept) -1.8568 0.6260 -3.0838 -0.6298 -2.97 1 0.003
Swasta -0.2397 0.3707 -0.9663 0.4869 -0.65 1 0.518
C 1.0729 0.5361 0.0222 2.1236 2.00 1 0.045
B 0.8267 0.2461 0.3444 1.3091 3.36 1 0.001
Rata-rata jumlah siswa per kelas
0.0219 0.0137 -0.0049 0.0488 1.60 1 0.109
Baik -0.0220 0.0134 -0.0482 0.0042 -1.65 1 0.099
Rusak ringan -0.0748 0.0666 -0.2054 0.0558 -1.12 1 0.262
Berat 0.0298 0.1890 -0.3407 0.4003 0.16 1 0.875
Bukan Milik 0.0105 0.1028 -0.1909 0.2120 0.10 1 0.919
Lab IPA 0.1139 0.1487 -0.1775 0.4053 0.77 1 0.443
Lab Bahasa -0.0153 0.2258 -0.4579 0.4273 -0.07 1 0.946
Lab Komputer 0.3232 0.1867 -0.0427 0.6891 1.73 1 0.083
Lab IPS -0.8312 0.2792 -1.3784 -0.2840 -2.98 1 0.003
Perpustakaan -0.5850 0.3451 -1.2613 0.0913 -1.70 1 0.090
Jumlah guru -0.0440 0.0114 -0.0662 -0.0217 -3.87 1 0.000
KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN
MENGGUNAKAN REGRESI BINOMIAL NEGATIF
(Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional
di DKI Jakarta)
RANI PUSPA DEWI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
1
PENDAHULUAN
Latar Belakang
Model Regresi Poisson secara umum telah banyak digunakan untuk menganalisis data cacah di mana rata-rata dan ragamnya sama. Akan tetapi kondisi ini jarang sekali ditemukan pada data, sehingga seringkali ditemukan keragaman data lebih besar daripada rata-ratanya. Fenomena seperti ini disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.
UN merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa. Hal ini bermula pada tahun 2003 ketika pemerintah mengubah Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) menjadi UN. Perubahan ini ditujukan agar sumber daya yang dihasilkan lebih berkualitas yaitu dengan memberlakukan standar nilai kelulusan.
Jumlah siswa SMA yang tidak lulus UN dapat dikatakan masih cukup tinggi. Sementara itu diketahui bahwa tingkat pendidikan penduduk berkorelasi positif dengan status ekonomi, derajat kesehatan dan laju pertumbuhan penduduk (Depdiknas dalam Wulansari 2008). Hasil penelitian Wulansari (2008) menyatakan secara statistik jumlah siswa yang tidak lulus UN dapat diasumsikan berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, sehingga hubungan antara jumlah siswa yang tidak lulus UN dengan faktor-faktor yang berpengaruh dapat diketahui melalui Regresi Poisson.
Tujuan
Tujuan dari penelitian ini adalah mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA dalam UN di DKI Jakarta untuk tahun ajaran 2005/2006 dan 2006/2007.
TINJAUAN PUSTAKA
Generalized Linear ModelGeneralized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002)
menyatakan ada tiga komponen dalam GLM yaitu:
Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya.
Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan.
Link function ditunjukkan dengan fungsi nilai harapannya sama dengan systematic component.
Regresi Poisson
Regresi Poisson termasuk ke dalam GLM dan merupakan salah satu bentuk analisis regresi yang digunakan untuk model data cacah (count data) dan data dalam bentuk tabel kontingensi. Model Regresi Poisson kadang dikenal dengan log-linear model, terutama ketika digunakan untuk model tabel kontingensi.
Model Regresi Poisson dengan peubah penjelas X dapat dituliskan sebagai berikut (Agresti, 2002) :
Log = +x
Fungsi peluang sebaran Poisson adalah:
! ) ; ( y e y f y
y=0,1,2,.... dengan asumsi E(Y)= Var(Y)=.
Fungsi penghubung kanonik (cannonical link function) untuk Regresi Poisson yaitu:
) ' ( ) log( ) (
g X
Pendugaan parameter koefisien Regresi Poisson dapat diduga dengan menggunakan Maximum Likelihood Estimation (MLE) melalui iterasi dengan metode Newton Raphson untuk memaksimumkan fungsi log-likelihoodnya L(y,,).
Overdispersi pada Regresi Poisson
Data cacah untuk Regresi Poisson dikatakan mengandung overdispersi apabila keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Fenomena overdispersi (McCullagh & Nelder, 1983) dapat dituliskan:
1
PENDAHULUAN
Latar Belakang
Model Regresi Poisson secara umum telah banyak digunakan untuk menganalisis data cacah di mana rata-rata dan ragamnya sama. Akan tetapi kondisi ini jarang sekali ditemukan pada data, sehingga seringkali ditemukan keragaman data lebih besar daripada rata-ratanya. Fenomena seperti ini disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.
UN merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa. Hal ini bermula pada tahun 2003 ketika pemerintah mengubah Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) menjadi UN. Perubahan ini ditujukan agar sumber daya yang dihasilkan lebih berkualitas yaitu dengan memberlakukan standar nilai kelulusan.
Jumlah siswa SMA yang tidak lulus UN dapat dikatakan masih cukup tinggi. Sementara itu diketahui bahwa tingkat pendidikan penduduk berkorelasi positif dengan status ekonomi, derajat kesehatan dan laju pertumbuhan penduduk (Depdiknas dalam Wulansari 2008). Hasil penelitian Wulansari (2008) menyatakan secara statistik jumlah siswa yang tidak lulus UN dapat diasumsikan berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, sehingga hubungan antara jumlah siswa yang tidak lulus UN dengan faktor-faktor yang berpengaruh dapat diketahui melalui Regresi Poisson.
Tujuan
Tujuan dari penelitian ini adalah mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA dalam UN di DKI Jakarta untuk tahun ajaran 2005/2006 dan 2006/2007.
TINJAUAN PUSTAKA
Generalized Linear ModelGeneralized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002)
menyatakan ada tiga komponen dalam GLM yaitu:
Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya.
Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan.
Link function ditunjukkan dengan fungsi nilai harapannya sama dengan systematic component.
Regresi Poisson
Regresi Poisson termasuk ke dalam GLM dan merupakan salah satu bentuk analisis regresi yang digunakan untuk model data cacah (count data) dan data dalam bentuk tabel kontingensi. Model Regresi Poisson kadang dikenal dengan log-linear model, terutama ketika digunakan untuk model tabel kontingensi.
Model Regresi Poisson dengan peubah penjelas X dapat dituliskan sebagai berikut (Agresti, 2002) :
Log = +x
Fungsi peluang sebaran Poisson adalah:
! ) ; ( y e y f y
y=0,1,2,.... dengan asumsi E(Y)= Var(Y)=.
Fungsi penghubung kanonik (cannonical link function) untuk Regresi Poisson yaitu:
) ' ( ) log( ) (
g X
Pendugaan parameter koefisien Regresi Poisson dapat diduga dengan menggunakan Maximum Likelihood Estimation (MLE) melalui iterasi dengan metode Newton Raphson untuk memaksimumkan fungsi log-likelihoodnya L(y,,).
Overdispersi pada Regresi Poisson
Data cacah untuk Regresi Poisson dikatakan mengandung overdispersi apabila keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Fenomena overdispersi (McCullagh & Nelder, 1983) dapat dituliskan:
2
Overdispersi dapat diindikasikan dengan nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada data. Overdispersi dapat pula terjadi karena adanya pengamatan missing pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, peubah penjelas perlu ditransformasi atau kesalahan spesifikasi link function(Hardin & Hilbe, 2007).
Regresi Binomial Negatif
Regresi Binomial Negatif merupakan salah satu solusi untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe, 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut:
y k k k k k y k k y k y f
1 ) 1 ( ) ( ) ( ) , , ( y=0,1,2,....di mana k dan adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut parameter dispersi.
Goodness Of Fit Tests
Ismail dan Jemain (2007) menyatakan bahwagoodness of fits model Regresi Poisson dan Regresi Binomial Negatif dapat dilihat dari nilai Pearson Chi-squares, Deviance, AIC (Akaike Information Criterion), BSC (Bayesian Schwartz Information Criterion) dan nilai Likelihood Ratio statistics. Nilai Pearson Chi-squaresdan Devianceyang lebih mendekati derajat bebasnya menunjukkan model yang lebih baik. Sedangkan nilai AIC dan BSC yang lebih kecil menujukkan model yang lebih baik dan untuk nilai Likelihood Ratio Statistics yang menunjukkan Tolak H0 berarti model tersebut yang lebih baik, karena mengindikasikan adanya overdispersi pada data.
Famoye, Wulu & Singh (2004) menyatakan untuk goodness of fitsdapat pula digunakan nilai log-likelihood di mana model dengan nilai log-likelihood yang lebih besar menunjukkan model yang lebih baik.
BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini adalah data sekunder jumlah kelulusan siswa tiap SMA di DKI Jakarta yang diperoleh dari Dinas Pendidikan Menengah dan Tinggi (DIKMENTI) Propinsi DKI Jakarta. Peubah respon yang diamati adalah jumlah siswa yang tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1.
Pada penelitian ini untuk membangun model dimasukkan pula peubah offset, yaitu suatu peubah penjelas yang dimasukkan ke dalam model namun nilai koefisiennya tidak diestimasi tapi diasumsikan nilainya sama dengan 1 dan biasanya nilainya bervariasi dari satu observasi ke observasi lain. Peubah yang digunakan sebagai peubah offsetadalah jumlah peserta UN.
Metode
Tahapan metode yang dilakukan dalam penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan adalah sebagai berikut :
1. Analisis statistika deskriptif jumlah siswa tidak lulus UN per rayon wilayah.
2. Deskripsi peubah penjelas untuk mendapatkan karakteristik SMA pada masing-masing tahun ajaran.
3. Pendeteksian overdispersi pada data dengan melihat nilai Pearson Chi-squares dan Deviance yang dibagi dengan derajat bebasnya.
4. Melakukan analisis Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor-faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN.
5. Interpretasi model Regresi Poisson dan Regresi Binomial Negatif.
6. Identifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, BSC, Pearson Chi-squares, Deviance, Likelihood ratio statistics dan log-likelihood dalam permasalahan overdispersi.
3
Tabel 1. Peubah penjelas untuk membangun model
Peubah Penjelas Simbol Kategori
Jumlah peserta UN
Peubah offset
Status SMA X1 Negeri=1,
Swasta=2
Akreditasi SMA X2 A=1, B=2, C=3 Rata-rata jumlah
siswa per kelas X3
Numerik
Jumlah ruang kelas dengan kondisi baik
X4
Numerik
Jumlah ruang kelas dengan kondisi rusak ringan
X5
Numerik
Jumlah ruang kelas dengan kondisi rusak berat
X6
Numerik
Jumlah ruang kelas bukan milik X7
Numerik
Jumlah
laboratorium IPA X8
Numerik Jumlah laboratorium bahasa X9 Numerik Jumlah laboratorium komputer X10 Numerik Jumlah
laboratorium IPS X11
Numerik
Jumlah
perpustakaan X12
Numerik
Jumlah guru X13 Numerik
Gambar 1. Diagram alur analisis
HASIL DAN PEMBAHASAN
Deskripsi Data
Banyaknya SMA di DKI Jakarta terhitung sebanyak 497 sekolah yang terdiri dari 116 SMA negeri dan 381 SMA swasta dengan distribusi jumlah SMA pada masing-masing rayon wilayah dapat dilihat pada Tabel 2. Persentase jumlah siswa yang tidak lulus UN untuk tahun ajaran 2005/2006 tercatat sebesar 5.61% lebih besar dibandingkan tahun ajaran 2006/2007 yang hanya sebesar 3.67% (Gambar 2).
Tabel 2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah
Rayon
Wilayah Negeri Swasta
Jakarta Barat 17 97
Jakarta Pusat 13 60
Jakarta Selatan 29 67
Jakarta Timur 39 95
Jakarta Utara 17 62
Kepulauan
Seribu 1 0
Jumlah 116 381
5.61% 3.76% 0% 1% 2% 3% 4% 5% 6% 2005/2006 2006/2007 P e rs e n ta se J u m la h S is w a T id a k L u lu s
Gambar 2. Persentase jumlah siswa tidak lulus UN
Distribusi jumlah siswa tidak lulus UN tahun ajaran 2005/2006 dan 2006/2007 untuk tiap rayon wilayah di DKI Jakarta memperlihatkan jumlah siswa tidak lulus terbesar terjadi pada tahun ajaran 2005/2006 (Gambar 3). Ketidaklulusan tertinggi terjadi pada rayon Jakarta Pusat untuk tahun ajaran 2005/2006, sedangkan untuk tahun ajaran 2006/2007 ketidaklulusan tertinggi terjadi pada rayon Jakarta Timur.
4
0 200 400 600 800 1000 1200 1400 Ju m la h S is w a T id a k L u lu s Rayon Wilayah 2005/2006 2006/2007Gambar 3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta
Karakteristik untuk masing-masing tahun ajaran berdasarkan peubah penjelas secara lengkap dapat dilihat pada Tabel 3 dan Tabel 4.
Tahun ajaran 2005/2006
Karakteristik tahun ajaran 2005/2006 menunjukkan bahwa rata-rata jumlah siswa tidak lulus UN lebih tinggi daripada tahun ajaran 2006/2007. Kebanyakan SMA negeri pada tahun ajaran ini terakreditasi A, hanya satu yang terkreditasi B dan tidak ada SMA negeri yang terakreditasi C. Sedangkan untuk SMA swasta banyaknya SMA terakreditasi A dan B tidak berbeda jauh dan hanya 16 SMA swasta yang terakreditasi C. Rata-rata Log dari jumlah peserta UN lebih besar dibandingkan tahun ajaran 2006/2007. Rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2006/2007.
Tahun Ajaran 2006/2007
Karakteristik pada tahun ajaran 2006/2007 menunjukkan bahwa jumlah siswa tidak lulus UN lebih rendah daripada tahun ajaran 2005/2006. Seluruh SMA negeri pada tahun ajaran ini terakreditasi A, sedangkan banyaknya SMA swasta yang terkreditasi A, B dan C tidak jauh berbeda dengan tahun ajaran 2005/2006. Rata-rata Log dari jumlah peserta UN lebih kecil dibanding tahun ajaran 2005/2006. Rata-rata jumlah siswa per kelas,
jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2005/2006.
Tabel 3. Nilai rata-rata karakteristik SMA
Karakteristik SMA
Rata-rata 2005/2006 2006/2007
Jumlah siswa
tidak lulus 5.64 4.51
Rata-rata jumlah siswa per kelas
28.54 28.20
Jumlah ruang kelas dengan kondisi baik
13.58 13.46
Jumlah ruang kelas dengan kondisi rusak ringan
0.25 0.25
Jumlah ruang kelas dengan kondisi rusak berat
0.05 0.05
Jumlah ruang kelas bukan milik 0.11 0.11 Jumlah laboratorium IPA 0.57 0.57 Jumlah laboratorium Bahasa 0.52 0.52 Jumlah laboratorium Komputer 0.82 0.81 Jumlah laboratorium IPS 0.17 0.17 Jumlah
perpustakaan 0.92 0.93
Jumlah guru 32.41 32.12
5
Tabel 4. Deskripsi peubah penjelas
Tahu n Ajara n Status SMA Akr edit asi Juml ah % 2005/ 2006 Negeri
A 99 25.98%
B 1 0.26%
C 0 0%
Swasta
A 151 39.63%
B 114 29.92%
C 16 4.2%
2006/ 2007
Negeri
A 100 25.71%
B 0 0%
C 0 0%
Swasta
A 159 40.87%
B 115 29.56%
C 15 3.86%
Model Regresi Poisson dan Regresi Binomial Negatif
Overdispersi terjadi pada data tahun ajaran 2005/2006 dan 2006/2007 yang ditunjukkan oleh nilai Pearson Chi-squares dan Deviance dibagi dengan derajat bebas bernilai lebih dari 1 (Tabel 5).
Tabel 5. Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007
Tahun Ajaran
Pearson
Chi-squares Deviance
2005/2006 12.190 9.270
2006/2007 15.119 9.311
Model Regresi Poisson untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 6 dengan taraf nyata yang digunakan =10%. Hasil analisis dari uji koefisien parameter Regresi Poisson disajikan pada Lampiran 3.1 dan Lampiran 3.2.
Berdasarkan hasil analisis dari Uji Wald untuk koefisien parameter Regresi Poisson model tahun ajaran 2005/2006 faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium bahasa dan jumlah guru. Sedangkan untuk model tahun ajaran 2006/2007 faktor eksternal yang berpengaruh adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah
laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.
Pada Tabel 6 terlihat bahwa nilai dugaan parameter model tahun ajaran 2005/2006 untuk rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, laboratorium bahasa dan jumlah guru bernilai negatif. Hal ini menunjukkan bahwa hubungan antara peubah-peubah tersebut dengan log rata-rata dari jumlah siswa tidak lulus UN berbanding terbalik dan berlaku sebaliknya untuk nilai dugaan parameter yang bernilai positif. Hasil dari model Regresi Poisson ini dibandingkan dengan model Regresi Binomial Negatif.
Tabel 6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007
Tahun
Ajaran Model Regresi Poisson
2005/2006
Log()= -1.435 -0.187 X1(1) + 0.696 X2(3) - 0.012 X3 0.212 X6 -0.055 X7 - 0.319 X9 - 0.028 X13
2006/2007
Log()= -3.514 + 0.34 X1(1) + 1.202 X3(3) + 1.085 X3(2)+ 0.023 X4 0.013 X5 -0.056 X6 + 0.074 X8 + 0.287 X9 + 0.178 X10 + 0.268 X11 – 1.05 X12 – 0.356 X13 - 0.027 X14
Model Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 7. Hasil analisis dari uji koefisien parameter Regresi Binomial Negatif disajikan pada Lampiran 4.1 dan Lampiran 4.2.
6
Tabel 7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007
Tahun Ajaran
Model Regresi Binomial Negatif
2005/2006 Log()= -1.6487 + 0.760 X2(3)– 0.028 X13
2006/2007
Log()= -1.8568 + 0.8267 X2(2)+ 1.0729 X2(3) - 0.0220 X4 + 0.3232 X10 - 0.8312 X11 0.5850 X12 -0.0440 X13
Dari Tabel 7 terlihat bahwa untuk model tahun ajaran 2005/2006 nilai dugaan parameter untuk jumlah guru bernilai negatif yang berarti hubungan antara log rata-rata jumlah siswa tidak lulus UN dengan jumlah guru berbanding terbalik. Jika terjadi kenaikan jumlah guru maka log rata-rata jumlah siswa tidak lulus akan menurun. Begitu pula berlaku sebaliknya untuk nilai dugaan parameter akreditasi SMA yang bernilai positif.
Model Regresi Poisson menghasilkan hampir semua peubah penjelas berpengaruh terhadap jumlah siswa tidak lulus UN sedangkan pada model Regresi Binomial Negatif menunjukkan hal yang sebaliknya. Hal ini menunjukkan bahwa Regresi Binomial Negatif memberikan hasil uji signifikansi peubah penjelas yang lebih berarti dibanding Regresi Poisson sebagai akibat adanya overdispersi pada data.
Goodness of Fits Model
Kebaikan model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/ 2006 dan 2006/2007 dapat dilihat pada Tabel 8 dan Tabel 9. Untuk mendapatkan model yang terbaik dapat dilihat dari nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya dan nilai log-likelihood yang lebih besar. Pada Tabel 8 dan Tabel 9 terlihat bahwa hasil pemodelan faktor eksternal terhadap jumlah siswa tidak lulus UN dengan Regresi Binomial Negatif memenuhi kriteria yang telah disebutkan sehingga dapat dikatakan model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson untuk mengatasi permasalahan overdispersi. Nilai p-value dariLikelihood ratio testmodel Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan 2006/2007 yaitu 0.0000 (p-value < =10%) atau Tolak H0 dan
disimpulkan bahwa terjadi overdispersi pada data.
Tabel 8. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif
AIC 4335.053 2047.444
BSC 4394.195 2110.528
Pearson
Chi-squares 4475.605 397.7475 Deviance 3392.256 414.8415
Log-likelihood -2152.526 -1007.7218 Likelihood ratio statistics 908.104 (p-value= 0.0000 78.12 (p-value= 0.0000)
Tabel 9. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif
AIC 4211.490 1738.708
BSC 4212.490 1802.125
Pearson
Chi-squares 5654.693 438.3615 Deviance 3482.492 374.3787
Log-likelihood -2090.745 -853.35393 Likelihood ratio statistics 2021.192 (p-value= 0.0000 96.37 (p-value= 0.0000)
SIMPULAN DAN SARAN
Simpulan
Faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus untuk tahun ajaran 2005/2006 adalah akreditasi SMA dan jumlah guru. Sedangkan untuk tahun ajaran 2006/2007 faktor eksternal yang berpengaruh antara lain akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.
2
Overdispersi dapat diindikasikan dengan nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada data. Overdispersi dapat pula terjadi karena adanya pengamatan missing pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, peubah penjelas perlu ditransformasi atau kesalahan spesifikasi link function(Hardin & Hilbe, 2007).
Regresi Binomial Negatif
Regresi Binomial Negatif merupakan salah satu solusi untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe, 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut:
y k k k k k y k k y k y f
1 ) 1 ( ) ( ) ( ) , , ( y=0,1,2,....di mana k dan adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut parameter dispersi.
Goodness Of Fit Tests
Ismail dan Jemain (2007) menyatakan bahwagoodness of fits model Regresi Poisson dan Regresi Binomial Negatif dapat dilihat dari nilai Pearson Chi-squares, Deviance, AIC (Akaike Information Criterion), BSC (Bayesian Schwartz Information Criterion) dan nilai Likelihood Ratio statistics. Nilai Pearson Chi-squaresdan Devianceyang lebih mendekati derajat bebasnya menunjukkan model yang lebih baik. Sedangkan nilai AIC dan BSC yang lebih kecil menujukkan model yang lebih baik dan untuk nilai Likelihood Ratio Statistics yang menunjukkan Tolak H0 berarti model tersebut yang lebih baik, karena mengindikasikan adanya overdispersi pada data.
Famoye, Wulu & Singh (2004) menyatakan untuk goodness of fitsdapat pula digunakan nilai log-likelihood di mana model dengan nilai log-likelihood yang lebih besar menunjukkan model yang lebih baik.
BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini adalah data sekunder jumlah kelulusan siswa tiap SMA di DKI Jakarta yang diperoleh dari Dinas Pendidikan Menengah dan Tinggi (DIKMENTI) Propinsi DKI Jakarta. Peubah respon yang diamati adalah jumlah siswa yang tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1.
Pada penelitian ini untuk membangun model dimasukkan pula peubah offset, yaitu suatu peubah penjelas yang dimasukkan ke dalam model namun nilai koefisiennya tidak diestimasi tapi diasumsikan nilainya sama dengan 1 dan biasanya nilainya bervariasi dari satu observasi ke observasi lain. Peubah yang digunakan sebagai peubah offsetadalah jumlah peserta UN.
Metode
Tahapan metode yang dilakukan dalam penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan adalah sebagai berikut :
1. Analisis statistika deskriptif jumlah siswa tidak lulus UN per rayon wilayah.
2. Deskripsi peubah penjelas untuk mendapatkan karakteristik SMA pada masing-masing tahun ajaran.
3. Pendeteksian overdispersi pada data dengan melihat nilai Pearson Chi-squares dan Deviance yang dibagi dengan derajat bebasnya.
4. Melakukan analisis Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor-faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN.
5. Interpretasi model Regresi Poisson dan Regresi Binomial Negatif.
6. Identifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, BSC, Pearson Chi-squares, Deviance, Likelihood ratio statistics dan log-likelihood dalam permasalahan overdispersi.
3
Tabel 1. Peubah penjelas untuk membangun model
Peubah Penjelas Simbol Kategori
Jumlah peserta UN
Peubah offset
Status SMA X1 Negeri=1,
Swasta=2
Akreditasi SMA X2 A=1, B=2, C=3 Rata-rata jumlah
siswa per kelas X3
Numerik
Jumlah ruang kelas dengan kondisi baik
X4
Numerik
Jumlah ruang kelas dengan kondisi rusak ringan
X5
Numerik
Jumlah ruang kelas dengan kondisi rusak berat
X6
Numerik
Jumlah ruang kelas bukan milik X7
Numerik
Jumlah
laboratorium IPA X8
Numerik Jumlah laboratorium bahasa X9 Numerik Jumlah laboratorium komputer X10 Numerik Jumlah
laboratorium IPS X11
Numerik
Jumlah
perpustakaan X12
Numerik
[image:30.612.112.309.99.737.2]Jumlah guru X13 Numerik
Gambar 1. Diagram alur analisis
HASIL DAN PEMBAHASAN
Deskripsi Data
Banyaknya SMA di DKI Jakarta terhitung sebanyak 497 sekolah yang terdiri dari 116 SMA negeri dan 381 SMA swasta dengan distribusi jumlah SMA pada masing-masing rayon wilayah dapat dilihat pada Tabel 2. Persentase jumlah siswa yang tidak lulus UN untuk tahun ajaran 2005/2006 tercatat sebesar 5.61% lebih besar dibandingkan tahun ajaran 2006/2007 yang hanya sebesar 3.67% (Gambar 2).
Tabel 2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah
Rayon
Wilayah Negeri Swasta
Jakarta Barat 17 97
Jakarta Pusat 13 60
Jakarta Selatan 29 67
Jakarta Timur 39 95
Jakarta Utara 17 62
Kepulauan
Seribu 1 0
Jumlah 116 381
5.61% 3.76% 0% 1% 2% 3% 4% 5% 6% 2005/2006 2006/2007 P e rs e n ta se J u m la h S is w a T id a k L u lu s
Gambar 2. Persentase jumlah siswa tidak lulus UN
Distribusi jumlah siswa tidak lulus UN tahun ajaran 2005/2006 dan 2006/2007 untuk tiap rayon wilayah di DKI Jakarta memperlihatkan jumlah siswa tidak lulus terbesar terjadi pada tahun ajaran 2005/2006 (Gambar 3). Ketidaklulusan tertinggi terjadi pada rayon Jakarta Pusat untuk tahun ajaran 2005/2006, sedangkan untuk tahun ajaran 2006/2007 ketidaklulusan tertinggi terjadi pada rayon Jakarta Timur.
[image:30.612.106.310.110.688.2] [image:30.612.328.507.263.536.2]6
Tabel 7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007
Tahun Ajaran
Model Regresi Binomial Negatif
2005/2006 Log()= -1.6487 + 0.760 X2(3)– 0.028 X13
2006/2007
Log()= -1.8568 + 0.8267 X2(2)+ 1.0729 X2(3) - 0.0220 X4 + 0.3232 X10 - 0.8312 X11 0.5850 X12 -0.0440 X13
Dari Tabel 7 terlihat bahwa untuk model tahun ajaran 2005/2006 nilai dugaan parameter untuk jumlah guru bernilai negatif yang berarti hubungan antara log rata-rata jumlah siswa tidak lulus UN dengan jumlah guru berbanding terbalik. Jika terjadi kenaikan jumlah guru maka log rata-rata jumlah siswa tidak lulus akan menurun. Begitu pula berlaku sebaliknya untuk nilai dugaan parameter akreditasi SMA yang bernilai positif.
Model Regresi Poisson menghasilkan hampir semua peubah penjelas berpengaruh terhadap jumlah siswa tidak lulus UN sedangkan pada model Regresi Binomial Negatif menunjukkan hal yang sebaliknya. Hal ini menunjukkan bahwa Regresi Binomial Negatif memberikan hasil uji signifikansi peubah penjelas yang lebih berarti dibanding Regresi Poisson sebagai akibat adanya overdispersi pada data.
Goodness of Fits Model
Kebaikan model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/ 2006 dan 2006/2007 dapat dilihat pada Tabel 8 dan Tabel 9. Untuk mendapatkan model yang terbaik dapat dilihat dari nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya dan nilai log-likelihood yang lebih besar. Pada Tabel 8 dan Tabel 9 terlihat bahwa hasil pemodelan faktor eksternal terhadap jumlah siswa tidak lulus UN dengan Regresi Binomial Negatif memenuhi kriteria yang telah disebutkan sehingga dapat dikatakan model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson untuk mengatasi permasalahan overdispersi. Nilai p-value dariLikelihood ratio testmodel Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan 2006/2007