• Tidak ada hasil yang ditemukan

Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta)

N/A
N/A
Protected

Academic year: 2017

Membagikan "Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta)"

Copied!
36
0
0

Teks penuh

(1)

RINGKASAN

RANI PUSPA DEWI. Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta). Dibimbing oleh AGUS M. SOLEH dan FARIT MOCHAMMAD AFENDI.

Model Regresi Poisson secara umum digunakan untuk menganalisis data cacah (count data) di mana rata-rata dan ragamnya harus sama. Namun kondisi ini jarang sekali ditemukan sehingga seringkali terjadi masalah overdispersi pada data. Salah satu model yang dapat mengakomodir masalah ini adalah Regresi Binomial Negatif. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.

Pendidikan merupakan salah satu faktor penting yang berperan dalam upaya peningkatan kesejahteraan rakyat dan pembentukan sumber daya manusia yang berkualitas. Ujian Nasional merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa, dimulai ketika tahun 2003 dimana terjadi perubahan sistem pendidikan di Indonesia dengan adanya pemberlakuan standar nilai kelulusan.

Jumlah siswa yang tidak lulus UN diasumsikan menyebar mengikuti sebaran Poisson, sehingga untuk mengetahui pengaruh faktor eksternal dapat digunakan Regresi Poisson.

Jumlah siswa yang tidak lulus UN menunjukkan terjadi overdispersi, sehingga pemodelan yang tepat adalah menggunakan Regresi Binomial Negatif. Hasil analisis menunjukkan bahwa faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus UN adalah akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru. Model Regresi Binomial Negatif memenuhi kriteria kebaikan model daripada model Regresi Poisson dalam masalah overdispersi, sehingga dapat disimpulkan Regresi Binomial Negatif merupakan salah satu solusi yang dapat digunakan untuk mengatasi permasalahan overdispersi.

(2)

KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN

MENGGUNAKAN REGRESI BINOMIAL NEGATIF

(Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional

di DKI Jakarta)

RANI PUSPA DEWI

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(3)

Karya ini ku persembahkan untuk ....

Orang tuaku..

Teman-temanku: Meta, Mala, Yusri, Ika, Agustina,

Ufi, Neng, Sevrien. Thx for our friendship,,hope we will

be friends forever...

(4)

RINGKASAN

RANI PUSPA DEWI. Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta). Dibimbing oleh AGUS M. SOLEH dan FARIT MOCHAMMAD AFENDI.

Model Regresi Poisson secara umum digunakan untuk menganalisis data cacah (count data) di mana rata-rata dan ragamnya harus sama. Namun kondisi ini jarang sekali ditemukan sehingga seringkali terjadi masalah overdispersi pada data. Salah satu model yang dapat mengakomodir masalah ini adalah Regresi Binomial Negatif. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.

Pendidikan merupakan salah satu faktor penting yang berperan dalam upaya peningkatan kesejahteraan rakyat dan pembentukan sumber daya manusia yang berkualitas. Ujian Nasional merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa, dimulai ketika tahun 2003 dimana terjadi perubahan sistem pendidikan di Indonesia dengan adanya pemberlakuan standar nilai kelulusan.

Jumlah siswa yang tidak lulus UN diasumsikan menyebar mengikuti sebaran Poisson, sehingga untuk mengetahui pengaruh faktor eksternal dapat digunakan Regresi Poisson.

Jumlah siswa yang tidak lulus UN menunjukkan terjadi overdispersi, sehingga pemodelan yang tepat adalah menggunakan Regresi Binomial Negatif. Hasil analisis menunjukkan bahwa faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus UN adalah akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru. Model Regresi Binomial Negatif memenuhi kriteria kebaikan model daripada model Regresi Poisson dalam masalah overdispersi, sehingga dapat disimpulkan Regresi Binomial Negatif merupakan salah satu solusi yang dapat digunakan untuk mengatasi permasalahan overdispersi.

(5)

KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN

MENGGUNAKAN REGRESI BINOMIAL NEGATIF

(Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional

di DKI Jakarta)

RANI PUSPA DEWI

Skripsi

Sebagai Salah satu syarat untuk meperoleh gelar Sarjana Sains

Pada Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Pertanian Bogor

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(6)

Judul Skripsi : KAJIAN OVERDISPERSI PADA REGRESI POISSON

DENGAN MENGGUNAKAN REGRESI BINOMIAL

NEGATIF (Studi Kasus Ketidaklulusan Siswa SMA dalam

Ujian Nasional di DKI Jakarta)

Nama

: Rani Puspa Dewi

NRP

: G14104022

Menyetujui:

Pembimbing I,

Pembimbing II,

Agus M. Soleh, S.Si, M.T.

Farit Mochamad Afendi, M.Si

NIP. 132232455

NIP. 132314007

Mengetahui:

Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Pertanian Bogor

Dr. Drh. Hasim, DEA

NIP. 131578806

(7)

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta tanggal 23 Desember 1986 sebagai anak pertama dari pasangan Bambang Sudjati dan Linda Syarifah.

Pendidikan dasar diselesaikan penulis di SD Waskito 4 pada tahun 1998, dilanjutkan dengan pendidikan menengah pertama di SLTP Negeri 2 Pamulang dan lulus pada tahun 2001. Tahun 2004 penulis menyelesaikan pendidikan menengah atas di SMA Negeri 1 Pamulang dan pada tahun yang sama diterima sebagai mahasiswa di Departemen Statistika Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI).

Selama perkuliahan penulis aktif berorganisasi sebagai Anggota Departemen Olahraga dan Seni Himpunan Profesi Gamma Sigma Beta tahun 2006 dan anggota Divisi Data Analysis Decision Centre. Selain itu, penulis juga aktif mengikuti beberapa kegiatan kepanitiaan seperti Statistika Ria 2005, Statistika Ria 2006, Studium General dan Software Training 2006 serta Pesta Sains Nasional 2007. Penulis juga pernah menjadi asisten responsi untuk mata kuliah Metode Statistika pada tahun 2006-2007.

(8)

KATA PENGANTAR

Alhamdulillahi robbil alamin, puji dan syukur penulis panjatkan kehadirat Allah SWT atas limpahan nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Tak lupa shalawat serta salam penulis panjatkan kepada Rasulullah Muhammad SAW beserta keluarga, sahabat dan umatnya.

Karya ilmiah ini berjudul ”Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta)”. Karya ilmiah ini memuat kajian mengenai pemodelan Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor eksternal yang berpengaruh terhadap ketidaklulusan siswa SMA dalam Ujian Nasional di DKI Jakarta yang dapat memberikan manfaat kepada penulis khususnya dan kepada semua pihak pada umumnya.

Terima kasih penulis ucapkan kepda semua pihak yang telah membantu dalam penyusunan karya ilmiah ini, antara lain :

1. Bapak Agus M. Soleh S.Si, M.T. dan Bapak Farit Mochammad Afendi M.Si atas bimbingannya selama menyelesaikan karya ilmiah ini.

2. Bapak Daryono, Ibu Eli dan pihak DIKMENTI Propinsi DKI Jakarta atas bantuannya kepada penulis memperoleh data untuk karya ilmiah ini.

3. Efril dan Cheria sebagai teman seperjuangan dan atas bantuannya dalam entrydata.

4. Mas Supri dan Adi atas softcopyskripsinya dan waktu sharing-nya tentang materi penelitian ini.

5. Wiwik, Lia dan Doddy yang telah bersedia menjadi pembahas dalam seminar.

6. Keluarga khususnya kedua orang tuaku dan adikku Vina atas doa, kasih sayang dan dukungannya yang mendorong penulis untuk memberikan yang terbaik.

7. Semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu penulis selama menyelesaikan karya ilmiah ini.

Bogor, September 2008

(9)

DAFTAR ISI

Halaman

DAFTAR TABEL ... vii

DAFTAR GAMBAR ... vii

DAFTAR LAMPIRAN ... vii

PENDAHULUAN Latar Belakang... 1

Tujuan... 1

TINJAUAN PUSTAKA Generalized Linear Model... 1

Regresi Poisson ... 1

Overdispersi Pada Regresi Poisson ... 1

Regresi Binomial Negatif ... 2

Goodness of Fits Tests... 2

BAHAN DAN METODE Bahan... 2

Metode... 2

HASIL DAN PEMBAHASAN Deskripsi Data ... 3

Model Regresi Poisson dan Regresi Binomial Negatif... 5

Goodness of FitsModel... 6

SIMPULAN DAN SARAN Simpulan... 6

Saran ... 7

DAFTAR PUSTAKA ... 7

(10)

DAFTAR TABEL

Halaman

1. Peubah penjelas untuk membangun model ... 3

2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah ... 3

3. Nilai rata-rata karakteristik SMA... 4

4. Deskripsi peubah penjelas... 5

5. Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007 ... 5

6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007... 5

7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007 ... 6

8. Goodness of fits statisticsmodel Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 ... 6

9. Goodness of fits statisticsmodel Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 ... 6

DAFTAR GAMBAR

Halaman 1. Diagram alur analisis ... 3

2. Persentase jumlah siswa tidak lulus UN ... 3

3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta ... 4

DAFTAR LAMPIRAN

Halaman 1. Hasil uji parameter model Regresi Poisson masing-masing tahun ajaran 1.1 Hasil uji parameter model Regresi Poisson tahun ajaran 2005/2006... 9

1.2 Hasil uji parameter model Regresi Poisson tahun ajaran 2006/2007... 9

2. Hasil uji parameter model Regresi Binomial Negatif masing-masing tahun ajaran 2.1 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2005/2006 ... 10

(11)

1

PENDAHULUAN

Latar Belakang

Model Regresi Poisson secara umum telah banyak digunakan untuk menganalisis data cacah di mana rata-rata dan ragamnya sama. Akan tetapi kondisi ini jarang sekali ditemukan pada data, sehingga seringkali ditemukan keragaman data lebih besar daripada rata-ratanya. Fenomena seperti ini disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.

UN merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa. Hal ini bermula pada tahun 2003 ketika pemerintah mengubah Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) menjadi UN. Perubahan ini ditujukan agar sumber daya yang dihasilkan lebih berkualitas yaitu dengan memberlakukan standar nilai kelulusan.

Jumlah siswa SMA yang tidak lulus UN dapat dikatakan masih cukup tinggi. Sementara itu diketahui bahwa tingkat pendidikan penduduk berkorelasi positif dengan status ekonomi, derajat kesehatan dan laju pertumbuhan penduduk (Depdiknas dalam Wulansari 2008). Hasil penelitian Wulansari (2008) menyatakan secara statistik jumlah siswa yang tidak lulus UN dapat diasumsikan berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, sehingga hubungan antara jumlah siswa yang tidak lulus UN dengan faktor-faktor yang berpengaruh dapat diketahui melalui Regresi Poisson.

Tujuan

Tujuan dari penelitian ini adalah mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA dalam UN di DKI Jakarta untuk tahun ajaran 2005/2006 dan 2006/2007.

TINJAUAN PUSTAKA

Generalized Linear Model

Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002)

menyatakan ada tiga komponen dalam GLM yaitu:

Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya.

Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan.

Link function ditunjukkan dengan fungsi nilai harapannya sama dengan systematic component.

Regresi Poisson

Regresi Poisson termasuk ke dalam GLM dan merupakan salah satu bentuk analisis regresi yang digunakan untuk model data cacah (count data) dan data dalam bentuk tabel kontingensi. Model Regresi Poisson kadang dikenal dengan log-linear model, terutama ketika digunakan untuk model tabel kontingensi.

Model Regresi Poisson dengan peubah penjelas X dapat dituliskan sebagai berikut (Agresti, 2002) :

Log = +x

Fungsi peluang sebaran Poisson adalah:

! ) ; ( y e y f y

   y=0,1,2,.... dengan asumsi E(Y)= Var(Y)=.

Fungsi penghubung kanonik (cannonical link function) untuk Regresi Poisson yaitu:

) ' ( ) log( ) (  

g   X

Pendugaan parameter koefisien Regresi Poisson dapat diduga dengan menggunakan Maximum Likelihood Estimation (MLE) melalui iterasi dengan metode Newton Raphson untuk memaksimumkan fungsi log-likelihoodnya L(y,,).

Overdispersi pada Regresi Poisson

Data cacah untuk Regresi Poisson dikatakan mengandung overdispersi apabila keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Fenomena overdispersi (McCullagh & Nelder, 1983) dapat dituliskan:

(12)

2

Overdispersi dapat diindikasikan dengan nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada data. Overdispersi dapat pula terjadi karena adanya pengamatan missing pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, peubah penjelas perlu ditransformasi atau kesalahan spesifikasi link function(Hardin & Hilbe, 2007).

Regresi Binomial Negatif

Regresi Binomial Negatif merupakan salah satu solusi untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe, 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut:

y k k k k k y k k y k y f

            1 ) 1 ( ) ( ) ( ) , , ( y=0,1,2,....

di mana k dan  adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut parameter dispersi.

Goodness Of Fit Tests

Ismail dan Jemain (2007) menyatakan bahwagoodness of fits model Regresi Poisson dan Regresi Binomial Negatif dapat dilihat dari nilai Pearson Chi-squares, Deviance, AIC (Akaike Information Criterion), BSC (Bayesian Schwartz Information Criterion) dan nilai Likelihood Ratio statistics. Nilai Pearson Chi-squaresdan Devianceyang lebih mendekati derajat bebasnya menunjukkan model yang lebih baik. Sedangkan nilai AIC dan BSC yang lebih kecil menujukkan model yang lebih baik dan untuk nilai Likelihood Ratio Statistics yang menunjukkan Tolak H0 berarti model tersebut yang lebih baik, karena mengindikasikan adanya overdispersi pada data.

Famoye, Wulu & Singh (2004) menyatakan untuk goodness of fitsdapat pula digunakan nilai log-likelihood di mana model dengan nilai log-likelihood yang lebih besar menunjukkan model yang lebih baik.

BAHAN DAN METODE

Bahan

Data yang digunakan dalam penelitian ini adalah data sekunder jumlah kelulusan siswa tiap SMA di DKI Jakarta yang diperoleh dari Dinas Pendidikan Menengah dan Tinggi (DIKMENTI) Propinsi DKI Jakarta. Peubah respon yang diamati adalah jumlah siswa yang tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1.

Pada penelitian ini untuk membangun model dimasukkan pula peubah offset, yaitu suatu peubah penjelas yang dimasukkan ke dalam model namun nilai koefisiennya tidak diestimasi tapi diasumsikan nilainya sama dengan 1 dan biasanya nilainya bervariasi dari satu observasi ke observasi lain. Peubah yang digunakan sebagai peubah offsetadalah jumlah peserta UN.

Metode

Tahapan metode yang dilakukan dalam penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan adalah sebagai berikut :

1. Analisis statistika deskriptif jumlah siswa tidak lulus UN per rayon wilayah.

2. Deskripsi peubah penjelas untuk mendapatkan karakteristik SMA pada masing-masing tahun ajaran.

3. Pendeteksian overdispersi pada data dengan melihat nilai Pearson Chi-squares dan Deviance yang dibagi dengan derajat bebasnya.

4. Melakukan analisis Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor-faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN.

5. Interpretasi model Regresi Poisson dan Regresi Binomial Negatif.

6. Identifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, BSC, Pearson Chi-squares, Deviance, Likelihood ratio statistics dan log-likelihood dalam permasalahan overdispersi.

(13)

3

Tabel 1. Peubah penjelas untuk membangun model

Peubah Penjelas Simbol Kategori

Jumlah peserta UN

Peubah offset

Status SMA X1 Negeri=1,

Swasta=2

Akreditasi SMA X2 A=1, B=2, C=3 Rata-rata jumlah

siswa per kelas X3

Numerik

Jumlah ruang kelas dengan kondisi baik

X4

Numerik

Jumlah ruang kelas dengan kondisi rusak ringan

X5

Numerik

Jumlah ruang kelas dengan kondisi rusak berat

X6

Numerik

Jumlah ruang kelas bukan milik X7

Numerik

Jumlah

laboratorium IPA X8

Numerik Jumlah laboratorium bahasa X9 Numerik Jumlah laboratorium komputer X10 Numerik Jumlah

laboratorium IPS X11

Numerik

Jumlah

perpustakaan X12

Numerik

Jumlah guru X13 Numerik

Gambar 1. Diagram alur analisis

HASIL DAN PEMBAHASAN

Deskripsi Data

Banyaknya SMA di DKI Jakarta terhitung sebanyak 497 sekolah yang terdiri dari 116 SMA negeri dan 381 SMA swasta dengan distribusi jumlah SMA pada masing-masing rayon wilayah dapat dilihat pada Tabel 2. Persentase jumlah siswa yang tidak lulus UN untuk tahun ajaran 2005/2006 tercatat sebesar 5.61% lebih besar dibandingkan tahun ajaran 2006/2007 yang hanya sebesar 3.67% (Gambar 2).

Tabel 2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah

Rayon

Wilayah Negeri Swasta

Jakarta Barat 17 97

Jakarta Pusat 13 60

Jakarta Selatan 29 67

Jakarta Timur 39 95

Jakarta Utara 17 62

Kepulauan

Seribu 1 0

Jumlah 116 381

5.61% 3.76% 0% 1% 2% 3% 4% 5% 6% 2005/2006 2006/2007 P e rs e n ta se J u m la h S is w a T id a k L u lu s

Gambar 2. Persentase jumlah siswa tidak lulus UN

Distribusi jumlah siswa tidak lulus UN tahun ajaran 2005/2006 dan 2006/2007 untuk tiap rayon wilayah di DKI Jakarta memperlihatkan jumlah siswa tidak lulus terbesar terjadi pada tahun ajaran 2005/2006 (Gambar 3). Ketidaklulusan tertinggi terjadi pada rayon Jakarta Pusat untuk tahun ajaran 2005/2006, sedangkan untuk tahun ajaran 2006/2007 ketidaklulusan tertinggi terjadi pada rayon Jakarta Timur.

(14)

4

0 200 400 600 800 1000 1200 1400 Ju m la h S is w a T id a k L u lu s Rayon Wilayah 2005/2006 2006/2007

Gambar 3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta

Karakteristik untuk masing-masing tahun ajaran berdasarkan peubah penjelas secara lengkap dapat dilihat pada Tabel 3 dan Tabel 4.

Tahun ajaran 2005/2006

Karakteristik tahun ajaran 2005/2006 menunjukkan bahwa rata-rata jumlah siswa tidak lulus UN lebih tinggi daripada tahun ajaran 2006/2007. Kebanyakan SMA negeri pada tahun ajaran ini terakreditasi A, hanya satu yang terkreditasi B dan tidak ada SMA negeri yang terakreditasi C. Sedangkan untuk SMA swasta banyaknya SMA terakreditasi A dan B tidak berbeda jauh dan hanya 16 SMA swasta yang terakreditasi C. Rata-rata Log dari jumlah peserta UN lebih besar dibandingkan tahun ajaran 2006/2007. Rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2006/2007.

Tahun Ajaran 2006/2007

Karakteristik pada tahun ajaran 2006/2007 menunjukkan bahwa jumlah siswa tidak lulus UN lebih rendah daripada tahun ajaran 2005/2006. Seluruh SMA negeri pada tahun ajaran ini terakreditasi A, sedangkan banyaknya SMA swasta yang terkreditasi A, B dan C tidak jauh berbeda dengan tahun ajaran 2005/2006. Rata-rata Log dari jumlah peserta UN lebih kecil dibanding tahun ajaran 2005/2006. Rata-rata jumlah siswa per kelas,

jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2005/2006.

Tabel 3. Nilai rata-rata karakteristik SMA

Karakteristik SMA

Rata-rata 2005/2006 2006/2007

Jumlah siswa

tidak lulus 5.64 4.51

Rata-rata jumlah siswa per kelas

28.54 28.20

Jumlah ruang kelas dengan kondisi baik

13.58 13.46

Jumlah ruang kelas dengan kondisi rusak ringan

0.25 0.25

Jumlah ruang kelas dengan kondisi rusak berat

0.05 0.05

Jumlah ruang kelas bukan milik 0.11 0.11 Jumlah laboratorium IPA 0.57 0.57 Jumlah laboratorium Bahasa 0.52 0.52 Jumlah laboratorium Komputer 0.82 0.81 Jumlah laboratorium IPS 0.17 0.17 Jumlah

perpustakaan 0.92 0.93

Jumlah guru 32.41 32.12

(15)

5

Tabel 4. Deskripsi peubah penjelas

Tahu n Ajara n Status SMA Akr edit asi Juml ah % 2005/ 2006 Negeri

A 99 25.98%

B 1 0.26%

C 0 0%

Swasta

A 151 39.63%

B 114 29.92%

C 16 4.2%

2006/ 2007

Negeri

A 100 25.71%

B 0 0%

C 0 0%

Swasta

A 159 40.87%

B 115 29.56%

C 15 3.86%

Model Regresi Poisson dan Regresi Binomial Negatif

Overdispersi terjadi pada data tahun ajaran 2005/2006 dan 2006/2007 yang ditunjukkan oleh nilai Pearson Chi-squares dan Deviance dibagi dengan derajat bebas bernilai lebih dari 1 (Tabel 5).

Tabel 5. Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007

Tahun Ajaran

Pearson

Chi-squares Deviance

2005/2006 12.190 9.270

2006/2007 15.119 9.311

Model Regresi Poisson untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 6 dengan taraf nyata yang digunakan =10%. Hasil analisis dari uji koefisien parameter Regresi Poisson disajikan pada Lampiran 3.1 dan Lampiran 3.2.

Berdasarkan hasil analisis dari Uji Wald untuk koefisien parameter Regresi Poisson model tahun ajaran 2005/2006 faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium bahasa dan jumlah guru. Sedangkan untuk model tahun ajaran 2006/2007 faktor eksternal yang berpengaruh adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah

laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.

Pada Tabel 6 terlihat bahwa nilai dugaan parameter model tahun ajaran 2005/2006 untuk rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, laboratorium bahasa dan jumlah guru bernilai negatif. Hal ini menunjukkan bahwa hubungan antara peubah-peubah tersebut dengan log rata-rata dari jumlah siswa tidak lulus UN berbanding terbalik dan berlaku sebaliknya untuk nilai dugaan parameter yang bernilai positif. Hasil dari model Regresi Poisson ini dibandingkan dengan model Regresi Binomial Negatif.

Tabel 6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007

Tahun

Ajaran Model Regresi Poisson

2005/2006

Log()= -1.435 -0.187 X1(1) + 0.696 X2(3) - 0.012 X3 0.212 X6 -0.055 X7 - 0.319 X9 - 0.028 X13

2006/2007

Log()= -3.514 + 0.34 X1(1) + 1.202 X3(3) + 1.085 X3(2)+ 0.023 X4 0.013 X5 -0.056 X6 + 0.074 X8 + 0.287 X9 + 0.178 X10 + 0.268 X11 – 1.05 X12 – 0.356 X13 - 0.027 X14

Model Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 7. Hasil analisis dari uji koefisien parameter Regresi Binomial Negatif disajikan pada Lampiran 4.1 dan Lampiran 4.2.

(16)

6

Tabel 7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007

Tahun Ajaran

Model Regresi Binomial Negatif

2005/2006 Log()= -1.6487 + 0.760 X2(3)– 0.028 X13

2006/2007

Log()= -1.8568 + 0.8267 X2(2)+ 1.0729 X2(3) - 0.0220 X4 + 0.3232 X10 - 0.8312 X11 0.5850 X12 -0.0440 X13

Dari Tabel 7 terlihat bahwa untuk model tahun ajaran 2005/2006 nilai dugaan parameter untuk jumlah guru bernilai negatif yang berarti hubungan antara log rata-rata jumlah siswa tidak lulus UN dengan jumlah guru berbanding terbalik. Jika terjadi kenaikan jumlah guru maka log rata-rata jumlah siswa tidak lulus akan menurun. Begitu pula berlaku sebaliknya untuk nilai dugaan parameter akreditasi SMA yang bernilai positif.

Model Regresi Poisson menghasilkan hampir semua peubah penjelas berpengaruh terhadap jumlah siswa tidak lulus UN sedangkan pada model Regresi Binomial Negatif menunjukkan hal yang sebaliknya. Hal ini menunjukkan bahwa Regresi Binomial Negatif memberikan hasil uji signifikansi peubah penjelas yang lebih berarti dibanding Regresi Poisson sebagai akibat adanya overdispersi pada data.

Goodness of Fits Model

Kebaikan model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/ 2006 dan 2006/2007 dapat dilihat pada Tabel 8 dan Tabel 9. Untuk mendapatkan model yang terbaik dapat dilihat dari nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya dan nilai log-likelihood yang lebih besar. Pada Tabel 8 dan Tabel 9 terlihat bahwa hasil pemodelan faktor eksternal terhadap jumlah siswa tidak lulus UN dengan Regresi Binomial Negatif memenuhi kriteria yang telah disebutkan sehingga dapat dikatakan model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson untuk mengatasi permasalahan overdispersi. Nilai p-value dariLikelihood ratio testmodel Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan 2006/2007 yaitu 0.0000 (p-value < =10%) atau Tolak H0 dan

disimpulkan bahwa terjadi overdispersi pada data.

Tabel 8. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif

AIC 4335.053 2047.444

BSC 4394.195 2110.528

Pearson

Chi-squares 4475.605 397.7475 Deviance 3392.256 414.8415

Log-likelihood -2152.526 -1007.7218 Likelihood ratio statistics 908.104 (p-value= 0.0000 78.12 (p-value= 0.0000)

Tabel 9. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif

AIC 4211.490 1738.708

BSC 4212.490 1802.125

Pearson

Chi-squares 5654.693 438.3615 Deviance 3482.492 374.3787

Log-likelihood -2090.745 -853.35393 Likelihood ratio statistics 2021.192 (p-value= 0.0000 96.37 (p-value= 0.0000)

SIMPULAN DAN SARAN

Simpulan

Faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus untuk tahun ajaran 2005/2006 adalah akreditasi SMA dan jumlah guru. Sedangkan untuk tahun ajaran 2006/2007 faktor eksternal yang berpengaruh antara lain akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.

(17)

7

Hal ini ditunjukkan dengan terpenuhinya kriteria kebaikan modelnya yaitu nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya, nilai log-likelihood yang lebih besar dan nilai likelihood ratio testsyang menunjukkan Tolak H0.

Saran

Beberapa solusi lain yang dapat digunakan untuk mengatasi permasalahan overdispersi yaitu dengan Quasi-Likelihood dan Generalized Poisson Regression. Untuk penelitian selanjutnya dapat dibandingkan beberapa metode tersebut untuk mengetahui metode mana yang dapat memberikan tingkat akurasi yang cukup tinggi.

DAFTAR PUSTAKA

Agresti A. 2002. Categorical Data Analysis. John Wiley & Sons, Inc.

Ismail N & AA. Jemain. 2007. Handling Overdispersion with Binomial Negative and Generalized Poisson Regression Models. Casualty Actuarial Society Forum Casualty Actuarial Society – Arlington:Virginia:Winter, 103-158. http://www.casact.org/pubs/forum/07wfo rum/07w109.pdf. [29 April 2008]

Famoye F, Wulu JT., Singh KP. 2004. On The Generalized Poisson Regression Model with An Apllication to Accident Data. Journal of Data Science 2, 287-295.

Hardin JW, JM Hilbe. 2007. Generalized Linear Models and Extensions. Texas: A Stata Press Publication

McCullagh P & JA Nelder. 1983. Generalized Linear Models. London: Chapmann and Hall.

Wulansari, AD. 2008. Aplikasi Poisson Regression [abstrak]. Institut Teknologi

Sepuluh November.

(18)
(19)

9

Lampiran 1. Hasil uji parameter model Regresi Poisson masing-masing tahun ajaran

Lampiran 1.1 Hasil uji parameter model Regresi Poisson tahun ajaran 2005/2006

Parameter B Std. Error

95% Wald

Confidence Interval Hypothesis Test

Lower Upper

Wald Chi-Square

df Sig.

(Intercept) -1.435 0.1689 -1.766 -1.104 72.247 1 0.000

Swasta -0.187 0.0808 -0.346 -0.029 5.381 1 0.020

C 0.696 0.1207 0.459 0.932 33.189 1 0.000

B 0.070 0.0619 -0.051 0.192 1.288 1 0.256

Rata-rata jumlah

siswa per kelas -0.012 0.0033 -0.018 -0.006 13.790 1 0.000

Baik -0.002 0.0032 -0.008 0.005 0.290 1 0.590

Rusak ringan -0.008 0.0141 -0.035 0.020 0.302 1 0.583

Berat -0.212 0.0981 -0.404 -0.020 4.682 1 0.030

Bukan Milik -0.055 0.0285 -0.111 0.001 3.687 1 0.055

Lab IPA -0.041 0.0345 -0.108 0.027 1.398 1 0.237

Lab Bahasa -0.319 0.0504 -0.417 -0.220 40.026 1 0.000

Lab Komputer 0.017 0.0423 -0.066 0.100 0.169 1 0.681

Lab IPS 0.008 0.0652 -0.119 0.136 0.017 1 0.898

Perpustakaan 0.028 0.0804 -0.130 0.186 0.122 1 0.727

Jumlah guru -0.028 0.0027 -0.033 -0.022 102.494 1 0.000

(Scale) 1

Lampiran 1.2 Hasil uji parameter model Regresi Poisson tahun ajaran 2006/2007

Parameter B Std. Error

95% Wald

Confidence Interval Hypothesis Test

Lower Upper

Wald Chi-Square

df Sig.

(Intercept) -3.514 0.1725 -3.852 -3.176 415.070 1 0.000

Swasta 0.340 0.0978 0.148 0.531 12.073 1 0.001

C 1.202 0.1422 0.923 1.480 71.437 1 0.000

B 1.085 0.0637 0.960 1.209 290.059 1 0.000

Rata-rata jumlah

siswa per kelas 0.023 0.0033 0.017 0.030 49.151 1 0.000

Baik -0.013 0.0043 -0.022 -0.005 9.411 1 0.002

Rusak ringan -0.056 0.0256 -0.106 -0.005 4.711 1 0.030

Berat -0.020 0.0719 -0.161 0.121 0.076 1 0.783

Bukan Milik 0.074 0.0121 0.050 0.098 37.114 1 0.000

Lab IPA 0.287 0.0292 0.230 0.345 96.831 1 0.000

Lab Bahasa 0.178 0.0535 0.073 0.283 11.092 1 0.001

Lab Komputer 0.268 0.0490 0.172 0.364 29.990 1 0.000

Lab IPS -1.050 0.1085 -1.262 -0.837 93.544 1 0.000

Perpustakaan -0.356 0.0811 -0.515 -0.197 19.303 1 0.000

Jumlah guru -0.027 0.0034 -0.034 -0.021 65.691 1 0.000

(20)

10

Lampiran 2. Hasil uji parameter model Regresi Binomial Negatif masing-masing tahun ajaran

Lampiran 2.1 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2005/2006

Parameter B Std. Error

95% Wald Confidence

Interval Hypothesis Test

Lower Upper

Wald Chi-Square

df Sig.

(Intercept) -1.6487 0.6101 -2.8445 -0.4529 -2.70 1 0.007

Swasta -0.235 0.2827 -0.7890 0.3192 -0.83 1 0.406

C 0.760 0.4355 -0.0933 1.6137 1.75 1 0.081

B 0.250 0.2127 -0.1670 0.6668 1.18 1 0.240

Rata-rata jumlah siswa per kelas

-0.009 0.0105 -0.0299 0.0113 -0.89 1 0.375

Baik -0.007 0.0107 -0.0275 0.0144 -0.61 1 0.541

Rusak ringan 0.018 0.0762 -0.1311 0.1677 0.24 1 0.811

Berat -0.171 0.1925 -0.5487 0.2060 -0.89 1 0.373

Bukan Milik -0.100 0.0833 -0.2636 0.0629 -1.20 1 0.228

Lab IPA -0.062 0.1316 -0.3197 0.1963 -0.47 1 0.639

Lab Bahasa -0.216 0.1842 -0.5770 0.1451 -1.17 1 0.241

Lab Komputer 0.133 0.1520 -0.1649 0.4310 0.88 1 0.381

Lab IPS -0.257 0.2271 -0.7017 0.1885 -1.13 1 0.259

Perpustakaan 0.165 0.2816 -0.3867 0.7170 0.59 1 0.557

Jumlah guru -0.028 0.0089 -0.0455 -0.0105 -3.14 1 0.002

(Scale) 1.906 0.1664 1.6061 2.2616

Lampiran 2.2 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2006/2007

Parameter B Std. Error

95% Wald Confidence

Interval Hypothesis Test

Lower Upper

Wald Chi-Square

df Sig.

(Intercept) -1.8568 0.6260 -3.0838 -0.6298 -2.97 1 0.003

Swasta -0.2397 0.3707 -0.9663 0.4869 -0.65 1 0.518

C 1.0729 0.5361 0.0222 2.1236 2.00 1 0.045

B 0.8267 0.2461 0.3444 1.3091 3.36 1 0.001

Rata-rata jumlah siswa per kelas

0.0219 0.0137 -0.0049 0.0488 1.60 1 0.109

Baik -0.0220 0.0134 -0.0482 0.0042 -1.65 1 0.099

Rusak ringan -0.0748 0.0666 -0.2054 0.0558 -1.12 1 0.262

Berat 0.0298 0.1890 -0.3407 0.4003 0.16 1 0.875

Bukan Milik 0.0105 0.1028 -0.1909 0.2120 0.10 1 0.919

Lab IPA 0.1139 0.1487 -0.1775 0.4053 0.77 1 0.443

Lab Bahasa -0.0153 0.2258 -0.4579 0.4273 -0.07 1 0.946

Lab Komputer 0.3232 0.1867 -0.0427 0.6891 1.73 1 0.083

Lab IPS -0.8312 0.2792 -1.3784 -0.2840 -2.98 1 0.003

Perpustakaan -0.5850 0.3451 -1.2613 0.0913 -1.70 1 0.090

Jumlah guru -0.0440 0.0114 -0.0662 -0.0217 -3.87 1 0.000

(21)

KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN

MENGGUNAKAN REGRESI BINOMIAL NEGATIF

(Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional

di DKI Jakarta)

RANI PUSPA DEWI

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(22)

1

PENDAHULUAN

Latar Belakang

Model Regresi Poisson secara umum telah banyak digunakan untuk menganalisis data cacah di mana rata-rata dan ragamnya sama. Akan tetapi kondisi ini jarang sekali ditemukan pada data, sehingga seringkali ditemukan keragaman data lebih besar daripada rata-ratanya. Fenomena seperti ini disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.

UN merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa. Hal ini bermula pada tahun 2003 ketika pemerintah mengubah Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) menjadi UN. Perubahan ini ditujukan agar sumber daya yang dihasilkan lebih berkualitas yaitu dengan memberlakukan standar nilai kelulusan.

Jumlah siswa SMA yang tidak lulus UN dapat dikatakan masih cukup tinggi. Sementara itu diketahui bahwa tingkat pendidikan penduduk berkorelasi positif dengan status ekonomi, derajat kesehatan dan laju pertumbuhan penduduk (Depdiknas dalam Wulansari 2008). Hasil penelitian Wulansari (2008) menyatakan secara statistik jumlah siswa yang tidak lulus UN dapat diasumsikan berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, sehingga hubungan antara jumlah siswa yang tidak lulus UN dengan faktor-faktor yang berpengaruh dapat diketahui melalui Regresi Poisson.

Tujuan

Tujuan dari penelitian ini adalah mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA dalam UN di DKI Jakarta untuk tahun ajaran 2005/2006 dan 2006/2007.

TINJAUAN PUSTAKA

Generalized Linear Model

Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002)

menyatakan ada tiga komponen dalam GLM yaitu:

Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya.

Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan.

Link function ditunjukkan dengan fungsi nilai harapannya sama dengan systematic component.

Regresi Poisson

Regresi Poisson termasuk ke dalam GLM dan merupakan salah satu bentuk analisis regresi yang digunakan untuk model data cacah (count data) dan data dalam bentuk tabel kontingensi. Model Regresi Poisson kadang dikenal dengan log-linear model, terutama ketika digunakan untuk model tabel kontingensi.

Model Regresi Poisson dengan peubah penjelas X dapat dituliskan sebagai berikut (Agresti, 2002) :

Log = +x

Fungsi peluang sebaran Poisson adalah:

! ) ; ( y e y f y

   y=0,1,2,.... dengan asumsi E(Y)= Var(Y)=.

Fungsi penghubung kanonik (cannonical link function) untuk Regresi Poisson yaitu:

) ' ( ) log( ) (  

g   X

Pendugaan parameter koefisien Regresi Poisson dapat diduga dengan menggunakan Maximum Likelihood Estimation (MLE) melalui iterasi dengan metode Newton Raphson untuk memaksimumkan fungsi log-likelihoodnya L(y,,).

Overdispersi pada Regresi Poisson

Data cacah untuk Regresi Poisson dikatakan mengandung overdispersi apabila keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Fenomena overdispersi (McCullagh & Nelder, 1983) dapat dituliskan:

(23)

1

PENDAHULUAN

Latar Belakang

Model Regresi Poisson secara umum telah banyak digunakan untuk menganalisis data cacah di mana rata-rata dan ragamnya sama. Akan tetapi kondisi ini jarang sekali ditemukan pada data, sehingga seringkali ditemukan keragaman data lebih besar daripada rata-ratanya. Fenomena seperti ini disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta.

UN merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa. Hal ini bermula pada tahun 2003 ketika pemerintah mengubah Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) menjadi UN. Perubahan ini ditujukan agar sumber daya yang dihasilkan lebih berkualitas yaitu dengan memberlakukan standar nilai kelulusan.

Jumlah siswa SMA yang tidak lulus UN dapat dikatakan masih cukup tinggi. Sementara itu diketahui bahwa tingkat pendidikan penduduk berkorelasi positif dengan status ekonomi, derajat kesehatan dan laju pertumbuhan penduduk (Depdiknas dalam Wulansari 2008). Hasil penelitian Wulansari (2008) menyatakan secara statistik jumlah siswa yang tidak lulus UN dapat diasumsikan berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, sehingga hubungan antara jumlah siswa yang tidak lulus UN dengan faktor-faktor yang berpengaruh dapat diketahui melalui Regresi Poisson.

Tujuan

Tujuan dari penelitian ini adalah mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA dalam UN di DKI Jakarta untuk tahun ajaran 2005/2006 dan 2006/2007.

TINJAUAN PUSTAKA

Generalized Linear Model

Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002)

menyatakan ada tiga komponen dalam GLM yaitu:

Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya.

Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan.

Link function ditunjukkan dengan fungsi nilai harapannya sama dengan systematic component.

Regresi Poisson

Regresi Poisson termasuk ke dalam GLM dan merupakan salah satu bentuk analisis regresi yang digunakan untuk model data cacah (count data) dan data dalam bentuk tabel kontingensi. Model Regresi Poisson kadang dikenal dengan log-linear model, terutama ketika digunakan untuk model tabel kontingensi.

Model Regresi Poisson dengan peubah penjelas X dapat dituliskan sebagai berikut (Agresti, 2002) :

Log = +x

Fungsi peluang sebaran Poisson adalah:

! ) ; ( y e y f y

   y=0,1,2,.... dengan asumsi E(Y)= Var(Y)=.

Fungsi penghubung kanonik (cannonical link function) untuk Regresi Poisson yaitu:

) ' ( ) log( ) (  

g   X

Pendugaan parameter koefisien Regresi Poisson dapat diduga dengan menggunakan Maximum Likelihood Estimation (MLE) melalui iterasi dengan metode Newton Raphson untuk memaksimumkan fungsi log-likelihoodnya L(y,,).

Overdispersi pada Regresi Poisson

Data cacah untuk Regresi Poisson dikatakan mengandung overdispersi apabila keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Fenomena overdispersi (McCullagh & Nelder, 1983) dapat dituliskan:

(24)

2

Overdispersi dapat diindikasikan dengan nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada data. Overdispersi dapat pula terjadi karena adanya pengamatan missing pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, peubah penjelas perlu ditransformasi atau kesalahan spesifikasi link function(Hardin & Hilbe, 2007).

Regresi Binomial Negatif

Regresi Binomial Negatif merupakan salah satu solusi untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe, 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut:

y k k k k k y k k y k y f

            1 ) 1 ( ) ( ) ( ) , , ( y=0,1,2,....

di mana k dan  adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut parameter dispersi.

Goodness Of Fit Tests

Ismail dan Jemain (2007) menyatakan bahwagoodness of fits model Regresi Poisson dan Regresi Binomial Negatif dapat dilihat dari nilai Pearson Chi-squares, Deviance, AIC (Akaike Information Criterion), BSC (Bayesian Schwartz Information Criterion) dan nilai Likelihood Ratio statistics. Nilai Pearson Chi-squaresdan Devianceyang lebih mendekati derajat bebasnya menunjukkan model yang lebih baik. Sedangkan nilai AIC dan BSC yang lebih kecil menujukkan model yang lebih baik dan untuk nilai Likelihood Ratio Statistics yang menunjukkan Tolak H0 berarti model tersebut yang lebih baik, karena mengindikasikan adanya overdispersi pada data.

Famoye, Wulu & Singh (2004) menyatakan untuk goodness of fitsdapat pula digunakan nilai log-likelihood di mana model dengan nilai log-likelihood yang lebih besar menunjukkan model yang lebih baik.

BAHAN DAN METODE

Bahan

Data yang digunakan dalam penelitian ini adalah data sekunder jumlah kelulusan siswa tiap SMA di DKI Jakarta yang diperoleh dari Dinas Pendidikan Menengah dan Tinggi (DIKMENTI) Propinsi DKI Jakarta. Peubah respon yang diamati adalah jumlah siswa yang tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1.

Pada penelitian ini untuk membangun model dimasukkan pula peubah offset, yaitu suatu peubah penjelas yang dimasukkan ke dalam model namun nilai koefisiennya tidak diestimasi tapi diasumsikan nilainya sama dengan 1 dan biasanya nilainya bervariasi dari satu observasi ke observasi lain. Peubah yang digunakan sebagai peubah offsetadalah jumlah peserta UN.

Metode

Tahapan metode yang dilakukan dalam penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan adalah sebagai berikut :

1. Analisis statistika deskriptif jumlah siswa tidak lulus UN per rayon wilayah.

2. Deskripsi peubah penjelas untuk mendapatkan karakteristik SMA pada masing-masing tahun ajaran.

3. Pendeteksian overdispersi pada data dengan melihat nilai Pearson Chi-squares dan Deviance yang dibagi dengan derajat bebasnya.

4. Melakukan analisis Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor-faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN.

5. Interpretasi model Regresi Poisson dan Regresi Binomial Negatif.

6. Identifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, BSC, Pearson Chi-squares, Deviance, Likelihood ratio statistics dan log-likelihood dalam permasalahan overdispersi.

(25)

3

Tabel 1. Peubah penjelas untuk membangun model

Peubah Penjelas Simbol Kategori

Jumlah peserta UN

Peubah offset

Status SMA X1 Negeri=1,

Swasta=2

Akreditasi SMA X2 A=1, B=2, C=3 Rata-rata jumlah

siswa per kelas X3

Numerik

Jumlah ruang kelas dengan kondisi baik

X4

Numerik

Jumlah ruang kelas dengan kondisi rusak ringan

X5

Numerik

Jumlah ruang kelas dengan kondisi rusak berat

X6

Numerik

Jumlah ruang kelas bukan milik X7

Numerik

Jumlah

laboratorium IPA X8

Numerik Jumlah laboratorium bahasa X9 Numerik Jumlah laboratorium komputer X10 Numerik Jumlah

laboratorium IPS X11

Numerik

Jumlah

perpustakaan X12

Numerik

Jumlah guru X13 Numerik

Gambar 1. Diagram alur analisis

HASIL DAN PEMBAHASAN

Deskripsi Data

Banyaknya SMA di DKI Jakarta terhitung sebanyak 497 sekolah yang terdiri dari 116 SMA negeri dan 381 SMA swasta dengan distribusi jumlah SMA pada masing-masing rayon wilayah dapat dilihat pada Tabel 2. Persentase jumlah siswa yang tidak lulus UN untuk tahun ajaran 2005/2006 tercatat sebesar 5.61% lebih besar dibandingkan tahun ajaran 2006/2007 yang hanya sebesar 3.67% (Gambar 2).

Tabel 2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah

Rayon

Wilayah Negeri Swasta

Jakarta Barat 17 97

Jakarta Pusat 13 60

Jakarta Selatan 29 67

Jakarta Timur 39 95

Jakarta Utara 17 62

Kepulauan

Seribu 1 0

Jumlah 116 381

5.61% 3.76% 0% 1% 2% 3% 4% 5% 6% 2005/2006 2006/2007 P e rs e n ta se J u m la h S is w a T id a k L u lu s

Gambar 2. Persentase jumlah siswa tidak lulus UN

Distribusi jumlah siswa tidak lulus UN tahun ajaran 2005/2006 dan 2006/2007 untuk tiap rayon wilayah di DKI Jakarta memperlihatkan jumlah siswa tidak lulus terbesar terjadi pada tahun ajaran 2005/2006 (Gambar 3). Ketidaklulusan tertinggi terjadi pada rayon Jakarta Pusat untuk tahun ajaran 2005/2006, sedangkan untuk tahun ajaran 2006/2007 ketidaklulusan tertinggi terjadi pada rayon Jakarta Timur.

(26)

4

0 200 400 600 800 1000 1200 1400 Ju m la h S is w a T id a k L u lu s Rayon Wilayah 2005/2006 2006/2007

Gambar 3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta

Karakteristik untuk masing-masing tahun ajaran berdasarkan peubah penjelas secara lengkap dapat dilihat pada Tabel 3 dan Tabel 4.

Tahun ajaran 2005/2006

Karakteristik tahun ajaran 2005/2006 menunjukkan bahwa rata-rata jumlah siswa tidak lulus UN lebih tinggi daripada tahun ajaran 2006/2007. Kebanyakan SMA negeri pada tahun ajaran ini terakreditasi A, hanya satu yang terkreditasi B dan tidak ada SMA negeri yang terakreditasi C. Sedangkan untuk SMA swasta banyaknya SMA terakreditasi A dan B tidak berbeda jauh dan hanya 16 SMA swasta yang terakreditasi C. Rata-rata Log dari jumlah peserta UN lebih besar dibandingkan tahun ajaran 2006/2007. Rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2006/2007.

Tahun Ajaran 2006/2007

Karakteristik pada tahun ajaran 2006/2007 menunjukkan bahwa jumlah siswa tidak lulus UN lebih rendah daripada tahun ajaran 2005/2006. Seluruh SMA negeri pada tahun ajaran ini terakreditasi A, sedangkan banyaknya SMA swasta yang terkreditasi A, B dan C tidak jauh berbeda dengan tahun ajaran 2005/2006. Rata-rata Log dari jumlah peserta UN lebih kecil dibanding tahun ajaran 2005/2006. Rata-rata jumlah siswa per kelas,

jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2005/2006.

Tabel 3. Nilai rata-rata karakteristik SMA

Karakteristik SMA

Rata-rata 2005/2006 2006/2007

Jumlah siswa

tidak lulus 5.64 4.51

Rata-rata jumlah siswa per kelas

28.54 28.20

Jumlah ruang kelas dengan kondisi baik

13.58 13.46

Jumlah ruang kelas dengan kondisi rusak ringan

0.25 0.25

Jumlah ruang kelas dengan kondisi rusak berat

0.05 0.05

Jumlah ruang kelas bukan milik 0.11 0.11 Jumlah laboratorium IPA 0.57 0.57 Jumlah laboratorium Bahasa 0.52 0.52 Jumlah laboratorium Komputer 0.82 0.81 Jumlah laboratorium IPS 0.17 0.17 Jumlah

perpustakaan 0.92 0.93

Jumlah guru 32.41 32.12

(27)

5

Tabel 4. Deskripsi peubah penjelas

Tahu n Ajara n Status SMA Akr edit asi Juml ah % 2005/ 2006 Negeri

A 99 25.98%

B 1 0.26%

C 0 0%

Swasta

A 151 39.63%

B 114 29.92%

C 16 4.2%

2006/ 2007

Negeri

A 100 25.71%

B 0 0%

C 0 0%

Swasta

A 159 40.87%

B 115 29.56%

C 15 3.86%

Model Regresi Poisson dan Regresi Binomial Negatif

Overdispersi terjadi pada data tahun ajaran 2005/2006 dan 2006/2007 yang ditunjukkan oleh nilai Pearson Chi-squares dan Deviance dibagi dengan derajat bebas bernilai lebih dari 1 (Tabel 5).

Tabel 5. Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007

Tahun Ajaran

Pearson

Chi-squares Deviance

2005/2006 12.190 9.270

2006/2007 15.119 9.311

Model Regresi Poisson untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 6 dengan taraf nyata yang digunakan =10%. Hasil analisis dari uji koefisien parameter Regresi Poisson disajikan pada Lampiran 3.1 dan Lampiran 3.2.

Berdasarkan hasil analisis dari Uji Wald untuk koefisien parameter Regresi Poisson model tahun ajaran 2005/2006 faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium bahasa dan jumlah guru. Sedangkan untuk model tahun ajaran 2006/2007 faktor eksternal yang berpengaruh adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah

laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.

Pada Tabel 6 terlihat bahwa nilai dugaan parameter model tahun ajaran 2005/2006 untuk rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, laboratorium bahasa dan jumlah guru bernilai negatif. Hal ini menunjukkan bahwa hubungan antara peubah-peubah tersebut dengan log rata-rata dari jumlah siswa tidak lulus UN berbanding terbalik dan berlaku sebaliknya untuk nilai dugaan parameter yang bernilai positif. Hasil dari model Regresi Poisson ini dibandingkan dengan model Regresi Binomial Negatif.

Tabel 6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007

Tahun

Ajaran Model Regresi Poisson

2005/2006

Log()= -1.435 -0.187 X1(1) + 0.696 X2(3) - 0.012 X3 0.212 X6 -0.055 X7 - 0.319 X9 - 0.028 X13

2006/2007

Log()= -3.514 + 0.34 X1(1) + 1.202 X3(3) + 1.085 X3(2)+ 0.023 X4 0.013 X5 -0.056 X6 + 0.074 X8 + 0.287 X9 + 0.178 X10 + 0.268 X11 – 1.05 X12 – 0.356 X13 - 0.027 X14

Model Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 7. Hasil analisis dari uji koefisien parameter Regresi Binomial Negatif disajikan pada Lampiran 4.1 dan Lampiran 4.2.

(28)

6

Tabel 7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007

Tahun Ajaran

Model Regresi Binomial Negatif

2005/2006 Log()= -1.6487 + 0.760 X2(3)– 0.028 X13

2006/2007

Log()= -1.8568 + 0.8267 X2(2)+ 1.0729 X2(3) - 0.0220 X4 + 0.3232 X10 - 0.8312 X11 0.5850 X12 -0.0440 X13

Dari Tabel 7 terlihat bahwa untuk model tahun ajaran 2005/2006 nilai dugaan parameter untuk jumlah guru bernilai negatif yang berarti hubungan antara log rata-rata jumlah siswa tidak lulus UN dengan jumlah guru berbanding terbalik. Jika terjadi kenaikan jumlah guru maka log rata-rata jumlah siswa tidak lulus akan menurun. Begitu pula berlaku sebaliknya untuk nilai dugaan parameter akreditasi SMA yang bernilai positif.

Model Regresi Poisson menghasilkan hampir semua peubah penjelas berpengaruh terhadap jumlah siswa tidak lulus UN sedangkan pada model Regresi Binomial Negatif menunjukkan hal yang sebaliknya. Hal ini menunjukkan bahwa Regresi Binomial Negatif memberikan hasil uji signifikansi peubah penjelas yang lebih berarti dibanding Regresi Poisson sebagai akibat adanya overdispersi pada data.

Goodness of Fits Model

Kebaikan model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/ 2006 dan 2006/2007 dapat dilihat pada Tabel 8 dan Tabel 9. Untuk mendapatkan model yang terbaik dapat dilihat dari nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya dan nilai log-likelihood yang lebih besar. Pada Tabel 8 dan Tabel 9 terlihat bahwa hasil pemodelan faktor eksternal terhadap jumlah siswa tidak lulus UN dengan Regresi Binomial Negatif memenuhi kriteria yang telah disebutkan sehingga dapat dikatakan model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson untuk mengatasi permasalahan overdispersi. Nilai p-value dariLikelihood ratio testmodel Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan 2006/2007 yaitu 0.0000 (p-value < =10%) atau Tolak H0 dan

disimpulkan bahwa terjadi overdispersi pada data.

Tabel 8. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif

AIC 4335.053 2047.444

BSC 4394.195 2110.528

Pearson

Chi-squares 4475.605 397.7475 Deviance 3392.256 414.8415

Log-likelihood -2152.526 -1007.7218 Likelihood ratio statistics 908.104 (p-value= 0.0000 78.12 (p-value= 0.0000)

Tabel 9. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 Goodness of Fits Statitics Regresi Poisson Regresi Binomial Negatif

AIC 4211.490 1738.708

BSC 4212.490 1802.125

Pearson

Chi-squares 5654.693 438.3615 Deviance 3482.492 374.3787

Log-likelihood -2090.745 -853.35393 Likelihood ratio statistics 2021.192 (p-value= 0.0000 96.37 (p-value= 0.0000)

SIMPULAN DAN SARAN

Simpulan

Faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus untuk tahun ajaran 2005/2006 adalah akreditasi SMA dan jumlah guru. Sedangkan untuk tahun ajaran 2006/2007 faktor eksternal yang berpengaruh antara lain akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru.

(29)

2

Overdispersi dapat diindikasikan dengan nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada data. Overdispersi dapat pula terjadi karena adanya pengamatan missing pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, peubah penjelas perlu ditransformasi atau kesalahan spesifikasi link function(Hardin & Hilbe, 2007).

Regresi Binomial Negatif

Regresi Binomial Negatif merupakan salah satu solusi untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe, 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut:

y k k k k k y k k y k y f

            1 ) 1 ( ) ( ) ( ) , , ( y=0,1,2,....

di mana k dan  adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut parameter dispersi.

Goodness Of Fit Tests

Ismail dan Jemain (2007) menyatakan bahwagoodness of fits model Regresi Poisson dan Regresi Binomial Negatif dapat dilihat dari nilai Pearson Chi-squares, Deviance, AIC (Akaike Information Criterion), BSC (Bayesian Schwartz Information Criterion) dan nilai Likelihood Ratio statistics. Nilai Pearson Chi-squaresdan Devianceyang lebih mendekati derajat bebasnya menunjukkan model yang lebih baik. Sedangkan nilai AIC dan BSC yang lebih kecil menujukkan model yang lebih baik dan untuk nilai Likelihood Ratio Statistics yang menunjukkan Tolak H0 berarti model tersebut yang lebih baik, karena mengindikasikan adanya overdispersi pada data.

Famoye, Wulu & Singh (2004) menyatakan untuk goodness of fitsdapat pula digunakan nilai log-likelihood di mana model dengan nilai log-likelihood yang lebih besar menunjukkan model yang lebih baik.

BAHAN DAN METODE

Bahan

Data yang digunakan dalam penelitian ini adalah data sekunder jumlah kelulusan siswa tiap SMA di DKI Jakarta yang diperoleh dari Dinas Pendidikan Menengah dan Tinggi (DIKMENTI) Propinsi DKI Jakarta. Peubah respon yang diamati adalah jumlah siswa yang tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1.

Pada penelitian ini untuk membangun model dimasukkan pula peubah offset, yaitu suatu peubah penjelas yang dimasukkan ke dalam model namun nilai koefisiennya tidak diestimasi tapi diasumsikan nilainya sama dengan 1 dan biasanya nilainya bervariasi dari satu observasi ke observasi lain. Peubah yang digunakan sebagai peubah offsetadalah jumlah peserta UN.

Metode

Tahapan metode yang dilakukan dalam penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan adalah sebagai berikut :

1. Analisis statistika deskriptif jumlah siswa tidak lulus UN per rayon wilayah.

2. Deskripsi peubah penjelas untuk mendapatkan karakteristik SMA pada masing-masing tahun ajaran.

3. Pendeteksian overdispersi pada data dengan melihat nilai Pearson Chi-squares dan Deviance yang dibagi dengan derajat bebasnya.

4. Melakukan analisis Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor-faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN.

5. Interpretasi model Regresi Poisson dan Regresi Binomial Negatif.

6. Identifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, BSC, Pearson Chi-squares, Deviance, Likelihood ratio statistics dan log-likelihood dalam permasalahan overdispersi.

(30)

3

Tabel 1. Peubah penjelas untuk membangun model

Peubah Penjelas Simbol Kategori

Jumlah peserta UN

Peubah offset

Status SMA X1 Negeri=1,

Swasta=2

Akreditasi SMA X2 A=1, B=2, C=3 Rata-rata jumlah

siswa per kelas X3

Numerik

Jumlah ruang kelas dengan kondisi baik

X4

Numerik

Jumlah ruang kelas dengan kondisi rusak ringan

X5

Numerik

Jumlah ruang kelas dengan kondisi rusak berat

X6

Numerik

Jumlah ruang kelas bukan milik X7

Numerik

Jumlah

laboratorium IPA X8

Numerik Jumlah laboratorium bahasa X9 Numerik Jumlah laboratorium komputer X10 Numerik Jumlah

laboratorium IPS X11

Numerik

Jumlah

perpustakaan X12

Numerik

[image:30.612.112.309.99.737.2]

Jumlah guru X13 Numerik

Gambar 1. Diagram alur analisis

HASIL DAN PEMBAHASAN

Deskripsi Data

Banyaknya SMA di DKI Jakarta terhitung sebanyak 497 sekolah yang terdiri dari 116 SMA negeri dan 381 SMA swasta dengan distribusi jumlah SMA pada masing-masing rayon wilayah dapat dilihat pada Tabel 2. Persentase jumlah siswa yang tidak lulus UN untuk tahun ajaran 2005/2006 tercatat sebesar 5.61% lebih besar dibandingkan tahun ajaran 2006/2007 yang hanya sebesar 3.67% (Gambar 2).

Tabel 2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah

Rayon

Wilayah Negeri Swasta

Jakarta Barat 17 97

Jakarta Pusat 13 60

Jakarta Selatan 29 67

Jakarta Timur 39 95

Jakarta Utara 17 62

Kepulauan

Seribu 1 0

Jumlah 116 381

5.61% 3.76% 0% 1% 2% 3% 4% 5% 6% 2005/2006 2006/2007 P e rs e n ta se J u m la h S is w a T id a k L u lu s

Gambar 2. Persentase jumlah siswa tidak lulus UN

Distribusi jumlah siswa tidak lulus UN tahun ajaran 2005/2006 dan 2006/2007 untuk tiap rayon wilayah di DKI Jakarta memperlihatkan jumlah siswa tidak lulus terbesar terjadi pada tahun ajaran 2005/2006 (Gambar 3). Ketidaklulusan tertinggi terjadi pada rayon Jakarta Pusat untuk tahun ajaran 2005/2006, sedangkan untuk tahun ajaran 2006/2007 ketidaklulusan tertinggi terjadi pada rayon Jakarta Timur.

[image:30.612.106.310.110.688.2] [image:30.612.328.507.263.536.2]
(31)

6

Tabel 7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007

Tahun Ajaran

Model Regresi Binomial Negatif

2005/2006 Log()= -1.6487 + 0.760 X2(3)– 0.028 X13

2006/2007

Log()= -1.8568 + 0.8267 X2(2)+ 1.0729 X2(3) - 0.0220 X4 + 0.3232 X10 - 0.8312 X11 0.5850 X12 -0.0440 X13

Dari Tabel 7 terlihat bahwa untuk model tahun ajaran 2005/2006 nilai dugaan parameter untuk jumlah guru bernilai negatif yang berarti hubungan antara log rata-rata jumlah siswa tidak lulus UN dengan jumlah guru berbanding terbalik. Jika terjadi kenaikan jumlah guru maka log rata-rata jumlah siswa tidak lulus akan menurun. Begitu pula berlaku sebaliknya untuk nilai dugaan parameter akreditasi SMA yang bernilai positif.

Model Regresi Poisson menghasilkan hampir semua peubah penjelas berpengaruh terhadap jumlah siswa tidak lulus UN sedangkan pada model Regresi Binomial Negatif menunjukkan hal yang sebaliknya. Hal ini menunjukkan bahwa Regresi Binomial Negatif memberikan hasil uji signifikansi peubah penjelas yang lebih berarti dibanding Regresi Poisson sebagai akibat adanya overdispersi pada data.

Goodness of Fits Model

Kebaikan model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/ 2006 dan 2006/2007 dapat dilihat pada Tabel 8 dan Tabel 9. Untuk mendapatkan model yang terbaik dapat dilihat dari nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya dan nilai log-likelihood yang lebih besar. Pada Tabel 8 dan Tabel 9 terlihat bahwa hasil pemodelan faktor eksternal terhadap jumlah siswa tidak lulus UN dengan Regresi Binomial Negatif memenuhi kriteria yang telah disebutkan sehingga dapat dikatakan model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson untuk mengatasi permasalahan overdispersi. Nilai p-value dariLikelihood ratio testmodel Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan 2006/2007

Gambar

Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta ...............
Gambar 1. Diagram alur analisis
Gambar 3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta
Tabel 6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007
+7

Referensi

Dokumen terkait

Kebijakan penjualan kredit mengenai usaha perusahaan dalam merencanakan sistem penjualan kreditnya (yang menghasilkan piutang) dengan baik sehingga perusahaan tidak

Braja M (1988) menerangkan bahwa tanah lempung sebagian besar terdiri dari partikel mikroskopis dan sub-mikroskopis (tidak dapat dilihat dengan jelas bila hanya dengan

Syarief (1989) berpendapat bahwa struktur tanah merupakan suatu sifat fisik yang penting, karena dapat mempengaruhi pertumbuhan tanaman, mempengaruhi sifat dan keadaan tanah

Menurut Bernard(2005, p315) system data flow diagram yang lebih dikenal sebagai diagram aliran data yang dimaksudkan untuk menunjukkan proses dalam suatu sistem

Tantangan utama yang harus dipikirkan oleh Apple karena menjual produknya pada harga premium adalah produk yang dihasilkan juga harus premium tidak ada kompromi untuk

Analisis data berdasarkan metode yang dipilih Setelah menentukan metode statistik yang akan digunakan selanjutnya menerjemahkan ke dalam algoritma yang sesuai untuk mendapatkan

Efektifitas dan Kontribusi Penerimaan Pajak Bumi dan Bangunan Perdesaan Dan Perkotaan Terhadap Pendapatan Asli Daerah Kota Surabaya”.5.

Dikesrensning får utföras utan tillstånd så länge det är underhåll utav det befintliga diket för att bibehålla vattnets djup eller läge, det vill säga att rensningen inte