• Tidak ada hasil yang ditemukan

PERINGATAN!!! Bismillaahirrahmaanirraahiim Assalamu alaikum warahmatullaahi wabarakaatuh

N/A
N/A
Protected

Academic year: 2021

Membagikan "PERINGATAN!!! Bismillaahirrahmaanirraahiim Assalamu alaikum warahmatullaahi wabarakaatuh"

Copied!
71
0
0

Teks penuh

(1)

PERINGATAN !!!

Bismillaahirrahmaanirraahiim

Assalamu’alaikum warahmatullaahi wabarakaatuh

1. Skripsi digital ini hanya digunakan sebagai bahan referensi

2. Cantumkanlah sumber referensi secara lengkap bila Anda mengutip dari Dokumen ini

3. Plagiarisme dalam bentuk apapun merupakan

pelanggaran keras terhadap etika moral penyusunan karya ilmiah

4. Patuhilah etika penulisan karya ilmiah Selamat membaca !!!

Wassalamu’alaikum warahmatullaahi wabarakaatuh

(2)

PENAKSIRAN PARAMETER DARI MODEL REGRESI BETA UNTUK DATA PROPORSI DENGAN MENGGUNAKAN

METODE KEMUNGKINAN MAKSIMUM

Oleh :

BETA PUTRI WIJAYA NPM: 10060108003

PROGRAM STUDI STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS ISLAM BANDUNG

2012 M / 1433 H SKRIPSI

(3)

PENAKSIRAN PARAMETER DARI MODEL REGRESI BETA UNTUK DATA PROPORSI DENGAN MENGGUNAKAN

METODE KEMUNGKINAN MAKSIMUM

Diajukan untuk memenuhi salah satu persyaratan guna Memperoleh Gelar Sarjana Sains pada Program Studi Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Islam Bandung

Oleh:

BETA PUTRI WIJAYA NPM: 10060108003

PROGRAM STUDI STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS ISLAM BANDUNG

(4)

SURAT PERNYATAAN

Yang bertanda tangan di bawah ini : Nama : Beta Putri Wijaya

NPM : 10060108003

Status : Mahasiswa Semester Delapan Program Studi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Islam Bandung

Judul Skripsi : PENAKSIRAN PARAMETER DARI

MODEL REGRESI BETA UNTUK

DATA PROPORSI DENGAN MENGGUNAKAN METODE KEMUNGKINAN MAKSIMUM

Menyatakan dengan sesungguhnya bahwa skripsi atau karya tulis ilmiah ini benar-benar hasil karya sendiri bukan jiplakan dari hasil karya orang lain. Demikian pernyataan ini saya buat dengan sebenar-benarnya, dengan harapan yang berkepentingan menjadi maklum adanya.

Bandung, September 2012 Yang Membuat Pernyataan

(5)

Setelah membaca skripsi ini secara seksama, menurut pertimbangan kami telah memenuhi

persyaratan ilmiah sebagai skripsi

Pembimbing I

Nusar Hajarisman., M.Si. NIK.D.94.0.200 Pembimbing II Siti Sunendiari.,Dra.,M.Si. NIK.D.88.0.0.76 Mengetahui, Dekan F-MIPA Unisba

M. Yusuf Fajar, Drs., M.Si. NIP.195610261986021001

Ketua Jurusan Statistika F-MIPA Unisba

Suliadi, M.Si., Ph.D NIK. D.97.0.267

Tanggal Lulus : 6 September 2012

JUDUL : PENAKSIRAN PARAMETER DARI MODEL REGRESI

BETA UNTUK DATA PROPORSI DENGAN

MENGGUNAKAN METODE KEMUNGKINAN

MAKSIMUM

NAMA : BETA PUTRI WIJAYA

(6)

ABSTRAK

Beta Putri Wijaya, 10060108003. Penaksiran Parameter Dari Model Regresi Beta Untuk Data Proporsi Dengan Metode Kemungkinan Maksimum.

Di bawah bimbingan Nusar Hajarisman.,M.Si dan Siti Sunendiari.,M.Si.

Skripsi ini menyajikan suatu variabel respons yang berbentuk proporsi yang nilainya berada dalam selang terbuka (0, 1) dapat dihubungkan dengan sejumlah variabel prediktor melalui model regresi beta. Model ini merupakan bagian dari

generalized linear model (GLM) dimana variabel respons megikuti distribusi beta

yang merupakan anggota dari keluarga eksponensial. Parameter regresi dari model regresi beta diinterpretasikan dalam bentuk rata-rata dari respons, dan saat menggunakan fungsi hubung logit, parameter regresi ini diinterpretasikan sebagai odds rasio. Penaksiran parameter model menggunakan metode kemungkinan maksimum, dimana proses penaksirannya harus diselesaikan secara numerik. Dalam skripsi ini penaksiran parameter model regresi beta dilakukan melalui metode penskoran Fisher berdasarkan pada vektor skor dan matriks informasi Fisher untuk menaksir perilaku kelulusan mahasiswa dalam mengikuti Tingkat Persiapan Bersama di Institut Pertanian Bogor tahun akademik 1997/1998, dimana hanya jenis kelamin dan nilai ebtanas murni yang dapat mempengaruhi perilaku kelulusan mahasiswa tersebut.

Kata Kunci: distribusi beta, model linear umum, metode kemungkinan

(7)

MOTTO DAN PERSEMBAHAN

Motto

Artinya :

“Bahwa tiada yang orang dapatkan, kecuali yang ia usahakan, Dan bahwa usahanya akan kelihatan nantinya.”

(Q.S. An Najm ayat 39-40)

Persembahan

Dengan rasa syukur yang mendalam skripsi ini kupersembahkan untuk Kedua orang

tuaku tercinta Papa dan Mama, ini anakmu mencoba memberikan yang terbaik

untukmu. Betapa diri ini ingin melihat kalian bangga padaku. Betapa tak ternilai kasih

sayang dan pengorbanan kalian padaku, Maaf bila selama ini anakmu nakal dan tidak

mau mendengar apa kata orang tuanya. Dalam hati ini aku sayang kalian.

Kakakku Eka dan Winda terimakasih atas dukungan kalian yang selalu siap

membantuku, selalu peduli dan terus mendukungku.

Sahabat-sahabatku tersayang,teman seperjuanganku dikampus, Rizky, Sarah, Fitri,

dan Riris terimakash untuk motivasi dan dukunganya 

Dan yang terkasih dan tersayang, Ardi terimakasih untuk segala dukungan, motivasi

dan pengertiannya 

(8)

i

KATA PENGANTAR

Bismillahirahmanirrahiim.

Puji dan syukur penulis panjatkan kehadirat Allah SWT, atas nikmat, rahmat serta hidayah-Nya, tidak lupa shalawat serta salam tercurah pada Nabi Muhammad SAW, dengan karunia-Nya sehingga penulis dapat menyelesaikan kuliah di Program Studi Statistika Universitas Islam Bandung serta menyusun dan menyelesaikan skripsi yang merupakan salah satu syarat untuk memenuhi kelulusan kuliah pada Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam di Universitas Islam Bandung.

Penulis menyadari skripsi ini belum dikatakan sempurna, hal ini dikarenakan keterbatasan pengetahuan, pengalaman, maupun kemampuan yang dimiliki, Oleh karena itu penulis mengharapkan semua pihak dapat memberikan saran-saran penyempurnaan yang berguna bagi penulis khususnya dan bagi pembaca pada umumnya.

Dengan seluruh kerendahan hati dan penuh rasa hormat penulis mengucapkan terima kasih dan penghargaan sebesar-besarnya kepada :

1. Bapak Nusar Hajarisman.,M.Si., selaku dosen pembimbing I yang telah memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini.

(9)

2. Ibu Siti Sunendiari.,Dra.,M.Si., selaku dosen pembimbing II yang telah memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini.

3. Bapak M. Yusuf Fajar, Drs., M.Si., selaku Dekan FMIPA Universitas Islam Bandung.

4. Bapak R. Dachlan Muchlis, Drs., M.T., selaku wakil dekan FMIPA Universitas Islam Bandung.

5. Bapak Suliadi, M.Si., Ph.D., selaku Ketua Program Studi Statistika FMIPA Universitas Islam Bandung.

6. Bapak Dr. Suwanda, MS., selaku dosen wali Statistika Universitas Islam Bandung angkatan 2008 yang telah meluangkan waktu dan kesabarannya dalam memberi pengarahan, ilmu, serta bimbingan selama ini.

7. Dosen-Dosen Program Studi Statistika, yang telah memberikan banyak bekal ilmu pengetahuan selama perkuliahan.

8. Bapak Mastur, Ibu Tineu, dan bagian administrasi FMIPA yang selalu membantu penulis dalam proses administrasi perkuliahan dan sidang skripsi.

9. Akang dan Teteh Asisten Lab Statistika terima kasih atas segala bantuan, dukungan dan waktu luang dalam membantu skripsi ini.

10. Teman-teman Program Studi Statistika angkatan 2005, 2006, 2007, 2008, 2009, 2010 dan 2011 Universitas Islam Bandung, terima kasih untuk suka duka, bantuan, kebersamaan dan persahabatan kita.

(10)

iii

Semoga Allah SWT senantiasa memberikan rahmat dan karunia untuk memberi balasan atas semua bantuan fikiran yang telah diberikan kepada penulis. Besar harapan bahwa skripsi ini dapat memberikan manfaat bagi pembaca.

Akhir kata dengan ketulusan dan kerendahan hati, penulis panjatkan dan semoga Allah SWT membalas budi baik serta melimpahkan rahmat-Nya kepada semua pihak yang telah memberikan bantuannya, Amin.

Jazakumullaahu khairun katsira

Billahitaufiqwalhidayah. Wassalamu’alaikum Wr. Wb.

Bandung, September 2012

(11)

DAFTAR ISI

Halaman

KATA PENGANTAR ... i

DAFTAR ISI ... iv

DAFTAR TABEL ... vi

DAFTAR GAMBAR ... vii

DAFTAR LAMPIRAN... viii

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah... 1

1.2 Tujuan dan Manfaat Penelitian... 3

1.3 Kerangka Penulisan... 4

BAB II PENAKSIR MODEL REGRESI BETA 2.1 Pendahuluan... 5

2.2 Generalized Linear Model (GLM) ... 6

2.2.1 Distribusi Keluarga Eksponensial... 7

2.2.2 Unsur-unsur dalam GLM ... 8

2.3 Prosedur Penaksiran Parameter dalam GLM... 9

2.4 Distribusi Beta ... 10

2.5 Model Regresi Beta... 11

2.6 Penaksir Kemungkinan Maksimum Untuk Regresi Beta .. 14

2.7 Regresi Logistik ... 17

2.7.1 Uji Kecocokan Model ... 18

2.7.2 Uji Signifikansi Parameter Model ... 20

BAB III METODOLOGI PENELITIAN 3.1 Data dan Sumber Data ... 22

(12)

v

3.3 Algoritma Penskoran Fisher ... 26

BAB IV HASIL DAN PEMBAHASAN 4.1 Pendahuluan... 29

4.2 Deskriptif Data ... 30

4.3 Hasil- hasil Pada Model Regresi Logistik ... 34

4.4 Hasil- hasil Pada Model Regresi Beta... 37

4.5 Pembahasan Hasil- hasil dari Kedua Model Regresi ... 40

BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan ... 43

5.2 Saran... 45

DAFTAR PUSTAKA ... 46

(13)

DAFTAR TABEL

No.Tabel Halaman

Tabel 3.1 Daftar Nama Variabel dan Kategori dari Variabel... 23

Tabel 3.2 Daftar Proporsi Kelulusan Mahasiswa …………... 24

Tabel 4.1 Model Regresi Logistik Variabel Tunggal... 35

Tabel 4.2 Penaksir Koefisien, Standar Error, dan Statistik

Chi-kuadrat Berdasarkan Hasil Pada Tabel 4.1... 36

Tabel 4.3 Penaksir Koefisien, Standar Error, dan Statistik

Chi-kuadrat Berdasarkan Hasil Pada Tabel 4.2... 36

Tabel 4.4 Model Regresi Beta Variabel Tunggal………... 38

Tabel 4.5 Penaksir Koefisien, Standar Error, dan Uji t

Berdasarkan Hasil Pada Tabel 4.4... 39

Tabel 4.6 Penaksir Koefisien, Standar Error, dan Uji t

(14)

vii

DAFTAR GAMBAR

No. Gambar Halaman

Gambar 3.1 Diagram Alir Penskoran Fisher... 28

Gambar 4.1 Diagram Lingkaran Jenis Kelamin... 31

Gambar 4.2 Diagram Lingkaran Cara Lolos Seleksi ke IPB... 31

Gambar 4.3 Box Plot Nilai Rata-rata Ijazah………... 32

Gambar 4.4 Box Plot Nilai Ebtanas Murni………... 32

Gambar 4.5 Diagram Lingkaran Daerah Asal Sekolah... 33

(15)

DAFTAR LAMPIRAN

No. Lampiran Halaman

Lampiran 1. Notasi ………... 47

Lampiran 2. Data Proporsi Kelulusan Mahasiswa …………...…..…. 48

Lampiran 3. Hasil Output SAS Model Regresi Beta.………... 49

(16)

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

Analisis regresi adalah metode statistika yang digunakan untuk menyelidiki atau memodelkan hubungan antar variabel bebas dan variabel tak bebas. Analisis regresi telah banyak diterapkan dalam ilmu sosial dan eksak. Apabila kita dihadapkan pada suatu masalah penaksir atau peramalan nilai variabel, katakanlah variabel itu Y dan variabel satunya X, dengan pengambilan suatu sampel acak berukuran n dari populasi [(xi,yi), untuk i =1,2,..,n], maka data yang diperoleh dapat diplotkan untuk menghasilkan diagram pencar. Apabila titik-titik dalam diagram pencar itu mengikuti garis lurus, hal ini menunjukan bahwa kedua variabel tersebut berhubungan secara linier, dengan secara matematik hubungan linier yang terbentuk dalam persamaan garis lurus disebut garis regresi linier.

Persamaaan tersebut dinyatakan oleh:

ݕ௜= ߚ଴+ ߚଵݔ௜+ ߝ௜ ; ݅= 1,2, . . , ݊ ...(1.1)

dimanaߚ menyatakan intersep atau perpotongan dengan sumbu tegak,ߚ adalah kemiringan (slope) atau gradiennya, y adalah variabel tak bebas atau sering juga disebut sebagai variabel respon, x adalah variabel bebas atau prediktor, dan εi merupakan variabel acak yang memperhitungkan kegagalan model untuk kecocokan data secara tepat.

(17)

Tujuan utama analisis regresi adalah melihat hubungan antara variabel respon dengan satu atau lebih variabel prediktor. Bentuk hubungan antara kedua variabel tersebut yang dinyatakan dalam model regresi digunakan utamanya untuk melihat bagaimana pengaruh dari satu atau lebih variabel prediktor terhadap variabel respon.

Jika diasumsikan bahwa εi mengikuti distribusi normal dengan rata-rata 0 dan variansi ditulis ߝ2

௜ ∼ ܰ(0, ߪଶܫ) di dalam metode kuadrat terkecil. Ketika

asumsi terpenuhi, maka penaksir kuadrat terkecil mempunyai sifat-sifat kualitas penaksir yang baik, artinya penaksir tak bias dan bervariansi minimum, maka penaksir kuadrat terkecil ini akan sama dengan hasil dari metode kemungkinan maksimum.

Apabila dihadapkan dengan variabel respons yang berbentuk proporsi, tentu saja penggunaan metode kuadrat terkecil biasa (ordinary least square) bukan merupakan solusi yang tepat untuk memodelkan data yang variabel responsnya (y*) berbentuk proporsi. Hal ini bisa terjadi karena dua alasan, masalah non-linearitas, dimana model regresi linear biasa akan memberikan nilai taksiran y* di luar wilayah (0, 1), serta masalah heteroskedastisitas, dimana varians y* adalah tidak konstan.

Untuk mengatasi masalah tersebut biasanya diselesaikan dengan cara menggunakan pendekatan kemungkinan maksimum berdasarkan pada fungsi kemungkinan dari distribusi binomial sebagai dasar pada pemodelan regresi logistik. Namun selain menggunakan pendekatan pemodelan regresi logistik, pendekatan lain yang dapat digunakan adalah melalui pemodelan regresi beta. Model yang diusulkan dalam skripsi ini tentu saja berdasarkan asumsi bahwa

(18)

variabel respons mengikuti distribusi beta. karena model regresi beta merupakan model yang memberikan penaksir parameter yang akurat dan efisien dibandingkan dengan metode kuadrat terkecil biasa, ketika variabel respons yang diamati distribusinya tidak simetris, atau pada saat terjadi masalah heteroskedastisitas.

Distribusi beta sangat fleksibel dan berbagai fenomena ketidakpastian dapat dimodelkan dengan menggunakan distribusi beta ini. Fleksibilitas ini mendorong berkembangnya penggunaan distribusi beta secara empiris dalam berbagai bidang aplikasi. Distribusi beta dicirikan oleh dua buah parameter bentuk, dimana melalui transformasi aljabar sederhana dari kedua parameter dapat ditunjukkan bahwa parameter dalam distribusi beta merupakan parameter rata-rata dan parameter presisi. Dengan cara tersebut, model regresi beta dapat memberikan penaksir parameter yang berhubungan dengan perubahan dalam rata-rata dan dispersi dari variabel respons.

Dari uraian diatas maka dalam skripsi ini akan dibahas mengenai bentuk pemodelan regresi beta, penaksiran parameter dalam model regresi beta dengan menggunakan metode pendekatan kemungkinan maksimum.

1.2 Tujuan dan Manfaat Penelitian

Tujuan umum dari penulisan skripsi ini ialah untuk menggambarkan hubungan fungsional antara variabel respon dengan variabel prediktor, dimana variabel responnya berbentuk proporsi yang mengikuti distribusi beta. Oleh karena variabel responnya berbentuk proporsi maka pada umumnya variabel respon tersebut dimodelkan dengan model regresi logistik, tetapi dalam skripsi ini

(19)

juga variabel tersebut dapat dimodelkan dengan model regresi beta dengan demikian tujuan khusus dari skripsi ini yaitu :

 Menaksir parameter yang ada dalam model dengan regresi logistik  Menaksir parameter yang ada dalam model dengan regresi beta  Membandingkan hasil-hasil yang diperoleh model regresi logistik

dan model regresi beta.

Solusi dari hasil penelitian ini diharapkan mampu bermanfaat bagi perkembangan ilmu statistika dan penerapannya di berbagai bidang, khususnya mereka yang tertarik untuk memodelkan data berbentuk proporsi.

1.3 Kerangka Penulisan

Untuk mempermudah pemahaman mengenai pembahasan skripsi ini maka dibuatlah kerangka penulisan sebagai berikut : Bab I Pendahuluan, pada bab ini menjelaskan tentang latar belakang masalah, tujuan beserta manfaat penelitian, dan kerangka penulisan. Bab II dari skripsi ini berisikan penjelasan tentang tinjauan pustaka yang dipakai dalam penelitian yang diuraikan dalam teori-teori mengenai pengertian GLM, distribusi beta, model regresi beta, penaksir kemungkinan maksimum untuk beta. Bab III Metoda Penelitian, pada bab III ini diuraikan mengenai data dan sumber data yang digunakan, dan langkah-langkah penelitian. Bab IV Pembahasan, bab ini menguraikan tentang hasil perhitungan yang dilakukan berdasarkan data yang diperoleh dengan menggunakan metode-metode yang sudah dibahas pada bab sebelumnya, dilanjutkan dengan pembahasan terhadap hasil tersebut. Bab V Kesimpulan saran, bab ini merupakan bab penutup dari skripsi ini yang berisikan tentang kesimpulan dan saran.

(20)

BAB II

PENAKSIRAN MODEL REGRESI BETA

2.1 Pendahuluan

Model linier pada umunya berbentuk

࢟ = ࢄࢼ + ࢋ… (2.1)

dengan asumsi bahwa unsur-unsur dari e adalah berdistribusi normal identik dan saling bebas, ࢋ~ܰܫܦ(0, ߪଶ), merupakan basis dari kebanyakan analisis untuk data-data kontinu.

Dengan adanya berbagai kelebihan dalam teori statistik dan perangkat lunak komputer, kita dapat menggunakan metoda analog dengan pengembangan model linear dalam beberapa situasi sebagai berikut:

 Variabel respons mempunyai distribusi selain distribusi normal – mereka mungkin dapat berbentuk kategori daripada kontinu.

 Hubungan antara variabel respons dengan penjelasnya tidak perlu berbentuk linear sederhana seperti dalam (2.1).

Salah satu dari kelebihannya yang telah banyak dikenal juga sebagai sifat-sifat yang ‘baik’ dari distribusi normal dibagi ke dalam kelas yang lebih luas dari suatu distribusi yang disebut juga sebagai distribusi dari keluarga eksponensial.

Kelebihan yang kedua adalah perluasan dari metoda numerik untuk penaksiran parameter, dari kombinasi linear seperti Xβ dalam (2.1) kepada fungsi dari kombinasi linear seperti ψ(Xβ). Dalam teori prosedur penaksirannya adalah langsung. Dalam prakteknya prosedur penaksiran ini melibatkan suatu komputasi tertentu sehingga tidak hanya menjadi lebih mudah dengan perkembangan

(21)

program komputer untuk optimisasi numerik dari fungsi non-linear. Prosedur seperti ini sudah ada dalam paket-paket statistik seperti GLIM (Baker dan Nelder, 1978).

2.2 Generalized Model Linear (GLM)

Istilah model linear umum atau generalized linear model (GLM) biasanya merujuk pada model regresi biasa untuk variabel respons kontinu pada variabel prediktor kontinu dan/atau kategorik. Model ini juga termasuk model regresi multipel maupun model ANOVA atau ANCOVA (hanya untuk efek tetap). Bentuknya adalah

ݕ௜~ܰ(ݔ௜்ߚ, ߪଶ) … (2.2)

dimana xi berisi kovariat yang diketahui dan β adalah koefisien yang akan ditaksir. Model ini dapat ditaksir dengan menggunakan metode kuadrat terkecil dan metode kuadrat terkecil diboboti.

Istilah GLM merujuk pada kelas model yang lebih besar yang dipopulerkan oleh McCullagh dan Nelder (1989). Dalam model ini, variabel respons yi diasumsikan mengikuti distribusi dari keluarga eksponensial dengan rata-rata µi, yang biasanya diasumsikan sebagai suatu fungsi (seringkali bentuknya nonlinear) dari ݔ்ߚ. Beberapa penulis mengatakan bentuknya adalah nonlinear karena µi seringkali merupakan fungsi nonlinear dari kovariat, tetapi McCullagh dan Nelder (1983) mempertimbangkan fungsi tersebut sebagai bentuk yang linear, karena kovariat ini mempengaruhi distribusi dari yi hanya melalui kombinasi linear dari ݔ்ߚ. Perangkat lunak yang pertama kali dikembangkan untuk mencocokan model ini disebut GLIM, akan tetapi saat ini sudah tersedia

(22)

paket komputer yang dapat digunakan, termasuk didalamnya adalah melalui SAS/IML.

Selain distribusi normal, model yang mungkin untuk variabel respons dalam GLM diantaranya adalah binomial, Poisson, Gamma, ataupun Inverse Gaussian. Dalam skripsi ini akan difokuskan pembahasannya pada distribusi beta.

2.2.1 Distribusi Keluarga Eksponensial

Perhatikan bila satu buah variabel acak Y yang mempunyai fungsi (massa) peluang, maka variabel ini disebut diskrit, atau bila satu buah variabel acak Y yang mempunyai fungsi densitas peluang, maka variabel ini disebut kontinu, yang bergantung pada satu buah parameter θ. Suatu distribusi merupakan anggota dari keluarga eksponensial apabila mempunyai bentuk sebagai berikut:

݂(ݕ, ߠ) = ݁ݔ݌ቊݕߠ − ܾ(ߠ)ܽ(߮) + ܿ(ݕ, ߮)ቋ

= ݁ݔ݌ቊ−ܽ(߮)ቋ݁ݔ݌ܾ(ߠ) ൜ܽ(߮) ݕߠ ൠܿ(ݕ, ߠ) … (2.3)

dimana θ disebut juga sebagai parameter kanonik dan φ disebut juga sebagai parameter dispersi. Rata-rata E(y) = µ merupakan fungsi dari θ itu sendiri, sehingga θ merupakan parameter yang diamati, sedangkan φ biasanya dianggap sebagai suatu gangguan. Kemudian a(·), b(·), dan c(·) merupakan suatu fungsi yang diketahui dan masing-masing mencirikan anggota distribusi dari keluarga eksponensial. Perlu diketahui bahwa nilai harrapan y, E(y), hanya bergantung pada parameter θ dan bukan pada parameter φ.

(23)

2.2.2 Unsur – unsur dalam GLM

Seluruh model linear umum akan mempunyai tiga buah komponen, yaitu :

a. Komponen acak. Komponen ini menggambarkan distribusi dari variabel respons yang diamati. Variabel respon y1, y2, …, yn merupakan sampel acak yang distribusinya berasal dari keluarga eksponensial, seperti normal, binomial, Poisson, gamma, dan banyak lainnya. Distribusi keluarga eksponensial seluruhnya bergantung pada vektor parameter θ dimana fungsi loglikelihoodnya dapat ditulis kembali dalam bentuk seperti berikut :

ܮ(ߠ) = −ܽ(߶) +ܾ(ߠ) ܽ(߶) + logߠݕ [ܿ(߶, ݕ)] … (2.4) dimana θ adalah parameter kanonik atau natural, φ adalah parameter skala, serta a(·), b(·), dan c(·) masing-masing mencirikan anggota distribusi dari keluarga eksponensial.

b. Komponen sistematik. Komponen ini menggambarkan bagaimana kovariat

dimasukan ke dalam model sebagai nilai harapan dari y, µ= E(y). Di dalam model linear umum ini nilai dari µ akan bervariasi menurut taraf dari variabel penjelasnya. Komponen sistematik dapat dituliskan dalam bentuk seperti berikut: ߟ࢏= ܺ௜்ߚ = ߚ଴+ ߚଵݔଵ௜+ ߚଶݔଶ௜+ ⋯ + ߚ௞ݔ௞௜= ൦ ߟଵ ߟଶ ⋮ ߟ௡ ൪ … (2.5)

Kombinasi linear dari variabel penjelas ini disebut juga sebagai prediktor linear. Beberapa {xj} dapat berbentuk lainnya di dalam model, misalnya x3 =

(24)

memberikan efek pada y, atau mungkin dapat berbentuk x2 = x12 untuk

menyatakan adanya bentuk kurva dari variabel x1.

c. Fungsi hubung. Komponen ini menyatakan, bagaimana µ= E(y) berhubungan dengan variabel penjelas (X) di dalam prediktor linear. Kita dapat memodelan rata-rata µ secara langsung atau memodelkan suatu fungsi monoton g(µi).

Persamaan model menyatakan bahwa :

݃(ߤ௜) = ߟ௜= ܺ௜்ߚ… (2.6)

Untuk beberapa fungsi g monoton, yang biasa disebut sebagai fungsi penghubung (link function).

2.3 Prosedur Penaksiran Model dalam GLM

Dalam regresi linier sederhana, metode yang paling banyak digunakan untuk menaksir parameter itu adalah metode kuadrat terkecil. Pada metode tersebut kita pilih suatu nilai β0 dan β1tertentu yang akan meminimumkan jumlah

kuadrat error dari nilai pengamatan Y dari nilai taksirannya berdasarkan model tertentu. Di bawah asumsi yang biasa untuk regresi linier, metode kuadrat terkecil menghasilkan penaksir dengan sejumlah persyaratan secara statistik tertentu. Jika metode ini diterapkan pada model dengan variabel biner, maka penaksir tersebut tidak akan mempunyai sifat yang sama.

Metode umum penaksiran yang membawa kepada fungsi kuadrat terkecil di bawah model regresi linier (jika bentuk galatnya menyebar normal) disebut dengan kemungkinan maksimum. Metode ini akan memberikan landasan pada suatu pendekatan pada penaksiran dengan model regresi logistik. Metode kemungkinan maksimum akan memberikan nilai-nilai untuk parameter-parameter

(25)

yang tidak diketahui yang mana akan memaksimumkan peluang yang diperoleh melalui sekumpulan data pengamatan. Untuk dapat menerapkan metode ini, maka kita perlu membentuk suatu fungsi yang disebut dengan fungsi kemungkinan (likelihood function). Fungsi ini menyatakan peluang dari data pengamatan sebagai fungsi dari parameter yang tidak diketahui tersebut. Penaksir kemungkinan maksimum dari parameter-parameter itu dipilih sedemikian rupa sehingga dapat memaksimumkan fungsi tersebut.

Metode penskoran Fisher merupakan salah satu metode yang paling banyak digunakan untuk menyelesaikan persamaan non linear. Metode ini juga dapat digunakan untuk menentukan titik maksimum dari suatu fungsi, sebagaimana permasalahan dalam menentukan penaksir kemungkinan maksimum. Prosedur penaksiran parameter melalui prosedur ini memerlukan turunan parsial pertama dan kedua dari fungsi kemungkinan, dimana turunan pertama dan kedua dari fungsi kemungkinan masing-masing disebut sebagai statistik skor (score

statistics) dan matriks informasi (I).

Statistik skor adalah suatu ukuran untuk menguji keberartian parameter, dimana statistik ini berbentuk kuadratik yang berdasarkan pada vektor turunan pertama parsial dari fungsi log kemungkinan terhadap β, yang dievaluasi pada saat H0: β = β0. Sedangkan matriks informasi merupakan nilai harapan yang berharga

negatif dari matriks turunan kedua parsial dari fungsi log kemungkinan.

2.4 Distribusi Beta

Dalam teori probabilitas dan statistik, distribusi beta adalah distribusi probabilitas yang didefinisikan pada interval (0, 1) oleh dua parameter positif, bentuk parameter biasanya dilambangkan dengan a dan b. Fungsi densitas dari

(26)

suatu variabel acak Y yang berdistribusi Beta, dengan parameter a dan b, dapat ditulis sebagai berikut :

݂(ݕ) = ቐ

Γ(ܽ + ܾ)

Γ(ܽ)Γ(ܾ) ݕ௔ିଵ(1 − ݕ)௕ିଵ ; 0 < ݕ < 1, ܽ > 0, ܾ > 0

0 ; ݕ݈ܽ݅݊݊ݕܽ … (2.7)

dimana Г(.) merupakan fungsi gamma. Rata-rata dan variansi dari distribusi Beta dengan parameter a dan b masing-masing adalah :

ܧ(ܻ) = ܽ + ܾܽ … (2.8)

dan

ݒܽݎ(ܻ) =(ܽ + ܾ)(ܽ+ ܾ+ 1)ܾܽ … (2.9)

2.5 Model Regresi Beta

Pada bagian ini dibahas mengenai suatu model regresi untuk respons yang mengikuti distribusi beta. Fungsi densitas dari distribusi beta diberikan dalam Pers. (2.7), dengan parameter a dan b. Akan tetapi untuk keperluan pemodelan, maka biasanya akan sangat berguna apabila memodelkan rata-rata dari variabel respons. Selain itu pula biasanya perlu mendefinisikan model sedemikian rupa sehingga model ini berisi suatu parameter dispersi. Untuk membentuk model regresi beta dengan menyertakan rata-rata respons bersamaan dengan parameter dispersinya, maka perlu dilakukan reparameterisasi dari fungsi densitas beta. Misalkan ߤ = ௔

(௔ା௕) dan ߢ = (ܽ + ܾ), sehingga diperoleh bahwa ܽ = ߤߢ dan

ܾ = (1 − ߤ)ߢ. Dengan demikian, berdasarkan Pers. (2.8) dan (2.9) diketahui bahwa :

(27)

dan

ݒܽݎ(ܻ) =ߤ(1 − ߤ)ߢ + 1 … (2.11) dimana µ adalah rata-rata dari variabel respons dan κ dapat diinterpretasikan sebagai parameter dispersi, dalam arti bahwa untuk µ tertentu, maka nilai dari κ lebih besar akan memberikan varians bagi variabel respons yang lebih kecil.

Setelah dilakukan reparameterisasi tersebut, maka fungsi untuk variabel acak Y yang mengikuti distribusi beta menjadi :

݂(ݕ) =Γ(ߤߢ)Γ((1 − ߤ)ߢ) ݕΓ(ߢ) ఓ఑ିଵ(1 − ݕ)(ଵିఓ)఑ିଵ ; 0 < ݕ < 1 … (2.12)

Parameterisasi semacam ini menyatakan bahwa0 < ߤ < 1 dan ߢ> 0, dan juga dapat dengan mudah ditunjukkan bahwaܽ= ߤߢ> 0 dan ܾ= ߢ(1 – ߤ) > 0.

Untuk membentuk model regresi beta dilakukan pendekatan GLM dengan menggunakan dua fungsi hubung yaitu, satu fungsi hubung digunakan untuk parameter lokasi ߤ dan fungsi hubung yang lainnya digunakan untuk parameter dispersi ߢ. Menurut Smithson dan Verkuilen (2005) bahwa fungsi ini merupakan fungsi non linear, halus (smooth), dan monoton yang memetakan dari ruang yang tidak berbatas (unbounded) dari prediktor linear ke dalam ruang sampel yang diamati, dalam hal ini terbatas pada interval terbuka (0, 1). Misalkan X dan Z adalah matriks kovariat (mungkin bisa identik), dengan xi dan zi merupakan vektor baris ke-i dari kedua matriks tersebut. Dimisalkan pula ࢼ dan ࢾ masing-masing adalah vektor koefisien regresi beta. GLM untuk parameter lokasi biasanya adalah

(28)

dimana ݃(. )adalah fungsi hubung monoton, suatu fungsi yang mempunyai turunan. Fungsi hubung yang digunakan oleh Pers (2.13) adalah menggunakan fungsi hubung logit. Bentuk umum dari hubungan antara rata-rata dan varians adalah

ߪ= ߥ(ߤ

௜)ݑ(ߢ௜) … (2.14)

dimana v dan u adalah fungsi yang bersifat non-negatif. Parameter dispersi ߢ diasumsikan sebagai suatu bentuk yang dapat dimodelkan sebagai

ℎ(ߢ௜) = ࢠ࢏ࢀࢾ… (2.15)

dimana h merupakan fungsi hubung yang lain, yaitu dalam hal ini menggunakan fungsi hubung log dimana variabel ziyang dinyatakan dalam Pers (2.15) berupa vektor satu.

Untuk variabel respons yang berdistribusi beta, maka rata-ratanya harus berada dalam selang terbuka, sehingga diperlukan suatu fungsi hubung yang dapat memenuhi kondisi tersebut. Salah satu pilihan fungsi hubung yang dapat digunakan adalah fungsi hubung logit, karena fungsi hubung ini mampu memetakan ߤ ∈ (0, 1) ke dalam ruang sampel yang sesuai dengan distribusinya. Fungsi hubung logit ini juga biasa digunakan sebagai fungsi hubung dalam model regresi logistik. Dengan demikian, model regresi beta dapat dikatakan sebagai bentuk umum dari model regresi logistik ketika variabel respon yang diamati berbentuk proporsi.

Parameter dispersi κ harus bernilai positif karena setelah direpatameterisasi parameter µ dan κ bernilai positif. Fungsi hubung log yang dapat memenuhi sifat tersebut, yaitu

(29)

sehingga nilai taksiran untuk parameter dispersinya dimodelkan dalam bentuk ߢ௜= exp൫−ࢠ࢏ࢀࢾ൯ … (2.17)

disini digunakan tanda negatif untuk membuat interpretasi mengenai koefisien ߜ menjadi lebih mudah. Oleh karenaߢ merupakan parameter dispersi, maka suatu ߜ yang bernilai positif mengindikasikan variansi yang lebih kecil, dan hal ini tentu saja menjadi sulit dalam interpretasinya.

2.6 Penaksir Kemungkinan Maksimum Untuk Regresi Beta

Misalkan Yi, …, Ynadalah variabel acak saling bebas, dimana untuk setiap

Yi, untuk i = 1, …, n mengikuti densitas yang diberikan dalam Pers. (2.12) dengan rata-rata ߤ dan parameter dispersi ߢ yang tidak diketahui. Model diperoleh dengan cara mengasumsikan bahwa rata-rata yt dapat ditulis sebagai berikut

݃(ߤ௜) = ෍ ݔ௜௝ߚ௝ ௣ ௝ୀଵ

=ߟ௜… (2.18)

dimana ࢼ = (ߚ, … ߚ)் adalah vektor dari parameter regresi, dan xi1, …, xip merupakan data pengamatan pada k buah kovariat, untuk ݇ < ݊, yang diasumsikan tetap (fixed) dan diketahui bahwa varians dari respons y merupakan fungsi dariߤ, dan akibatnya juga merupakan fungsi dari nilai kovariatnya. Dengan demikian, varians yang tidak konstan secara tidak langsung akan diakomodasikan ke dalam model. Disini terlihat parameter rata-rata dibatasi pada selang terbuka (0, 1), sehingga diperlukan suatu fungsi hubung yang akan memetakan parameter dari interval ke dalam ruang bilangan nyata. Fungsi hubung logit merupakan fungsi hubung kanonik dan akan mengembalikan penaksir parameter ke dalam bentuk log odds rasio.

(30)

Fungsi hubung logit݃(ߤ) didefinisikan sebagai : ݃(ߤ௜) = ݈݋݃݅ݐ(ߤ௜) = log ൬1 − ߤߤ௜ ௜൰= ࢄ࢏ ࢀࢼ → ߤ ௜= exp൫ࢄ࢏ ࢀࢼ൯ 1 + exp(ࢄࢼ) … (2.19)

Dalam hal ini, parameter regresi mempunyai interpretasi yang penting. Misalkan bahwa nilai dari prediktor ke-i meningkat sebesar c unit, dan variabel prediktor lainnya dianggap tidak berubah, serta ߤ∗ merupakan rata-rata dari variabel y di bawah suatu nilai kovariat yang baru, sedangkan ߤ menyatakan rata-rata y di bawah nilai kovariat yang asli, maka dapat ditunjukkan bahwa :

exp൫ܿߚ௝൯ =ߤ

/(1 − ߤ)

ߤ/(1 − ߤ) … (2.20)

Artinya, exp൫ܿߚ൯ adalah sama dengan odds rasio, sama dengan interpretasi dalam model regresi logistik. Fungsi log-likelihood untuk ruang sampel model regresi beta memiliki bentuk :

݈(ߚ, ߜ) = ෍ ݈(ߤ௜, ߢ ௡ ௜ୀଵ ) … (2.21) dimana ݈(ߤ௜, ߢ) = ݈݋݃Γ(ߢ) − log Γ(ߤ௜ߢ) − ݈݋݃Γ{(1 − ߤ௜)ߢ} + (ߤ௜ߢ − 1)݈݋݃ݕ௜ + {(1 − ߤ௜)ߢ− 1} log(1 − ݕ௜) … (2.22)

Atau dapat dituliskan dalam bentuk persamaan seperti berikut : ݈(ߚ, ߜ: ࢞, ࢠ) = log Γ൫݁ିࢠఋ

− log Γ ቆ1 + ݁݁࢞ࢼିࢠఋ௫ࢼቇ− log Γ ቆ1 + ݁݁ିࢠఋ࢞ࢼቇ + ቆ1 + ݁݁࢞ࢼିࢠఋ௫ࢼ− 1ቇlog ݕ௜

+ ቆ1 + ݁݁࢞ࢼିࢠఋ௫ࢼ− 1ቇlog ݕ௜+ ቆ ݁ ିࢠఋ

(31)

Misalkanݏ= ݈݋݃{ݕ/ (1 −ݕ)} dan ߤ∗= ߰(ߤߢ) − ߰((1 − ߤ)ߢ). Kemudian, vektor skor yang merupakan turunan pertama dari fungsi log-likelihood terhadap parameterࢼ dan ࢾ, diberikan oleh :

ܷ(ߚ, ߜ) =߲(ߤ߲ߠ௜, ߢ) ⎝ ⎛ ߲݈(ߤ௜, ߢ) ߲ߚ ߲݈(ߤ௜, ߢ) ߲ߜ ⎠ ⎞ = ൮ ߢࢄࢀࢀ(ݏ ௜− ߤ௜∗) ෍ ൛ߤ௧(ݏ௜− ߤ௜∗) + log(1 − ݕ௜) − ߰൫(1 − ߤ௜)ߢ൯+ ψ(ߢ)ൟ ௡ ௜ୀଵ ൲ … (2.24)

dimana X adalah matriks data dari variabel prediktor berukuran ݊× ݇ dengan unsur baris ke-t adalah ݔ் dan ࢀ = ݀݅ܽ݃ቂଵ

௚`(ߤଵ), … , ଵ

௚`(ߤ௡)ቃ dan vektor

parameterࣂ = (ߚ, ߜ).

Tahap selanjutnya adalah menentukan matriks informasi. Misalkan diketahui ࢃ = ݀݅ܽ݃{ݓଵ, … , ݓ௡}, dengan

ݓ௜= ߢ{߰`(ߤ௜ߢ) + ߰`(1 − ߤ௜)ߢ)}{݃`(ߤ1 ௜)}ଶ

ܿ= (ܿଵ, … , ܿ௡)் dengan ܿ௜= ߢ{߰`(ߤ௜ߢ)ߤ௜− ߰`(1 − ߤ௜)ߢ)(1 −ߤ௜)}, dimana

߰`(. ) merupakan fungsi trigamma. Dimisalkan pula ࡰ = ݀݅ܽ݃{݀ଵ, . . . , ݀௡},

dengan

݀௜= ߰`(ߤ௜ߢ)ߤ௜ଶ+ ߰`((1 − ߤ௜)ߢ)(1 − ߤ௜)ଶ− ߰`(ߢ).

Dengan demikian matriks informasi Fisher, yang merupakan turunan kedua dari minus ekspetasi fungsi log-likelihood yang diberikan dalam Pers (2.22) terhadap parameter(ߚ, ߜ) diberikan oleh

(32)

ܫ(ߚ, ߜ) = −ܧ ⎣ ⎢ ⎢ ⎢ ⎡߲ଶ݈(ߚ, ߜ) ߲ߚଶ ߲ଶ݈(ߚ, ߜ) ߲ߚ߲ߜ ߲ଶ݈(ߚ, ߜ) ߲ߜ߲ߚ ߲ଶ݈(ߚ, ߜ) ߲ߜଶ ⎥ ⎥ ⎥ ⎤ … (2.25) dimanaడమ௟(ఉ,ఋ) డఉమ = ߢࢄࢀࢃ ࢄ, డమ௟(ఉ,ఋ) డఉడఋ = ࢄࢀࢀࢉ, dan డమ௟(ఉ,ఋ) డఋమ = ࢚࢘(ࡰ), Namun di sini

bahwa parameterߚ dan ߜ bersifat tidak orthogonal.

Pada saat ukuran sampel besar, maka vektor penaksir parameter ߠ෠` = (ߚመ,ߜመ) akan mengikuti akan mengikuti pendekatan distribusi normal

multivariat, atau dapat dinyatakan sebagai ߠ~ܰቆቀߚ

ߜቁ, [ܫ(ߚ, ߜ)]ିଵቇ, dimana ߚመ

dan ߜመ masing-masing adalah penaksir kemungkinan maksimum. Perlu ditambahkan juga bahwa [ܫ(ߚ, ߜ)]ିଵ dapat digunakan untuk memperoleh galat baku asimptotik bagi penaksir kemungkinan maksimum

Penaksir kemungkinan maksimum bagi β dan ߜ yang diperoleh dari

U(ߚ, ߜ) = 0 bukan merupakan persamaan tertutup. Dengan demikian solusinya

harus diselesaikan secara numerik dengan menggunakan algoritma optimisasi nonlinear, seperti metode penskoran Fisher.

2.7 Regresi Logistik

Regresi logistik adalah salah satu bagian dari analisis regresi, yang digunakan untuk memprediksi peluang kejadian suatu peristiwa dengan mencocokan data pada fungsi logit. Metode ini merupakan model linier umum yang digunakan untuk regresi binomial. Seperti analisis regresi pada umunya, metode ini menggunakan beberapa variabel bebas berupa data berskala interval dan atau kategorik. Regresi logistik tidak memerlukan asumsi normalitas,

(33)

heteroskedastitsitas dan autokorelasi, dikarenakan variabel tak bebas yang terdapat pada regresi logistik merupakan variabel biner (0 dan 1).

Bentuk umum model peluang regresi logistik diformulasikan sebagai berikut :

ߨ(ݔ) = 1 + exp(ࢄexp൫ࢄ࢏ࢀࢼ൯

ࢼ) … (2.26)

dimana ߨ(ݔ) adalah peluang kejadian sukses dengan nilai peluang 0 ≤ߨ(ݔ)≤1, dan β adalah koefisien parameter.

ߨ(ݔ) merupakan fungsi yang non linier, sehingga perlu dilakukan transformasi kedalam bentuk logit untuk memperoleh fungsi yang linier. Dengan melakukan transformasi dari logitߨ(ݔ), maka didapat persamaan yang lebih sederhana,yaitu : ݃(x) = log൫ଵିగ(௫)൯గ(௫) = ࢄࢼ… (2.27)

Langkah-langkah yang ada dalam penggunaan analisis regresi logistik yaitu statistik kecocokan model dan uji signifikansi parameter model.

2.7.1 Uji Kecocokan Model (Goodness Of Fit )

Suatu alat statistik yang digunakan untuk pengujian kecocokan model berguna untuk memilih sebuah model yang hasilnya paling cocok untuk data yang diperoleh. Nilai p-value yang tinggi berarti, model merupakan model yang terbaik. Metode yang digunakan untuk goodness of fit pada data kategorik adalah statistik chi-kuadrat Pearson, dan statistik chi-kuadrat Deviance dengan hipotesis uji sebagai berikut:

(34)

dimana statistik chi-kuadrat Pearson : ߯ଶ= ෍ (ݕ௜− ݊௜݌Ƹ௜) ݊௜݌Ƹ௜(1 − ݌Ƹ௜) ௡ ௜ୀଵ . . . (2.28)

dan statistik chi-kuadrat Devians :

ܦ = 2 ෍ ൜ݕ௜log൬ݕݕො௜ ௜൰+ (݊ − ݕ௜) log ൬ 1 − ݕ௜ 1 − ݕො௜൰ൠ ௡ ௜ୀଵ … (2.29)

Baik statistik chi-kuadrat Pearson dan statistik chi-kuadrat Devians keduanya mengikuti distribusi chi kuadrat. Dengan demikian kriteria uji untuk menguji dapat dirumuskan seperti berikut :

 Jika nilai statistik chi kuadrat Pearson pada Pers (2.28) dibandingkan dengan nilai chi kuadrat pada derajat bebas (݊ − ݌) tertentu atau nilai signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat pearson lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih besar dari α, maka hipotesis dari hal ini berarti H0 diterima, yang berati

model cocok dengan data. Dan apabila sebaliknya nilai chi kuadrat Pearson lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi lebih kecil sama dengan α, maka hipotesis H0 ditolak, yang berarti model

tidak cocok dengan data.

 Jika nilai statistik chi kuadrat Devians pada Pers (2.29) dibandingkan dengan nilai chi kuadrat pada derajat bebas (݊ − ݌) tertentu atau nilai signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat Devians lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih besar dari α, maka hipotesis dari hal ini berarti H0 diterima, yang berati

(35)

model cocok dengan data. Dan apabila sebaliknya nilai chi kuadrat Devians lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi lebih kecil sama dengan α, maka hipotesis H0 ditolak, yang berarti model

tidak cocok dengan data.

2.7.2 Uji Signifikansi Parameter Model

Untuk memeriksa peranan variabel-variabel penjelas (X) dalam model, dilakukan penguiian terhadap parameter model (β). Penguiian secara simultan dilakukan menggunakan uji G, sedangkan secara parsial menggunakan statistik uji

T2. Statistik uji G adalah uji rasio kemungkinan ( likelihood ratio test) yang digunakan untuk menguji peranan variabel penjelas di dalam model secara bersama-sama. Rumus umum statistik uji G untuk menguii hipotesis :

H0: β1= β2= . . . = βk= 0

H1: minimal ada satu β yang tidak sama dengan 0

Melalui uji statistik seperti berikut :

ܩ = −2 lnܮܮ

௣ . . . (2.30)

dimana :

Lo = maksimum likelihood dari model reduksi atau model yang terdiri dari konstatnta saja

Lp = maksimum likelihood dari model penuh (full) atau dengan semua variabel bebas.

Statistik G ini secara teoritis mengikuti sebaran chi-kuadrat dengan derajat bebas k. Kriteria keputusan yang diambil yaitu menolak H0 bila nilai statistik G

lebih besar dari chi-kuadrat. Sementara itu, uji T2 digunakan untuk menguji parameter βjsecara parsial. Hipotesis yang diuji adalah :

(36)

H0 : βj = 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi terhadap model)

H1 : βj ≠ 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi terhadap model)

Formula untuk statistik uji T2adalah :

ܶଶ= ቆ ߚ௜

ܵܧ൫ߚመ௜൯ቇ ଶ

… (2.31)

Secara teori statistik uji T2 ini mengikuti sebaran normal baku jika H0 benar.

(37)

BAB III

METODOLOGI PENELITIAN

3.1 Data dan Sumber Data

Data yang digunakan dalam skripsi ini merupakan data skunder yang berasal dari sebuah tesis yang berjudul “Kajian Perbandingan Model Regresi Beta-binomial dengan Model Regresi Logistik dan Penerapannya untuk Menduga Pola Kelulusan Mahasiswa IPB-TPB tahun akademik 1997/1998”. Populasi dalam penelitian adalah mahasiswa – mahasiswa pada program tingkat persiapan bersama di Institut Pertanian Bogor (IPB). Mahasiswa – mahasiswa yang dimaksud adalah mahasiswa program strata satu (S1) yang telah diterima di IPB pada tahun akademik 1997/1998, baik yang diterima melalui saringan ujian masuk perguruan tinggi negeri (UMPTN) maupun jalur penelusuran minat dan bakat (atau dikenal pula dengan jalur PMDK). Data akan diambil dari Program Tingkat Persiapan Bersama IPB dengan banyak pengamatan 2216 pengamatan.

Data yang diperlukan untuk menganalisis pola kelulusan mahasiswa dalam mengikuti sejumlah mata kuliah yang diselenggarakan pada tingkat persiapan bersama di Institut Pertanian Bogor (IPB), yaitu semua mata kuliah yang diambil oleh mahasiswa pada semester satu dan dua.

(38)

Tabel 3.1. Daftar Nama Variabel dan Kategori dari Variabel

No Nama Variabel Kategori Notasi

1 ID

2 Jenis Kelamin (JK) 0 = Perempuan

1 = Laki - laki X1 3 Cara lolos seleksi ke IPB (Jalur) 0 = PMDK

1 = UMPTN X2

4 Nilai rata-rata ijazah X3

5 Nilai ebtanas murni/NEM X4

6 Daerah asal sekolah 0 = Kabupaten

1 = Kotamadya X5

7 Status sekolah 0 = Swasta

1 = Negeri X6

8 Banyaknya mata kuliah yang lulus R

9 Banyaknya mata kuliah yang diambil N

10 Proporsi banyaknya mata kuliah yang

lulus y*

Nusar Hajarisman (1998). Kajian Perbandingan Model Regresi Beta-Binomial dengan Model regresi Logistik dan Penerapannya untuk Menduga Pola Kelulusan Mahasiswa IPB-TPB tahun 1997/1998

Variabel ID merupakan nomor induk mahasiswa IPB, baik yang berjenis kelamin laki-laki ataupun perempuan. Variabel Cara lolos seleksi ke IPB (jalur) dapat melalui dua tes yaitu PMDK dan UMPTN, dimana Variabel nilai rata-rata ijazah dan Variabel nilai ebtanas murni (NEM) harus sesuai dengan persyaratan yang ditentukan oleh pihak kampus yaitu IPB. Variabel Daerah asal sekolah ialah tempat asal SMU calon mahasiswa itu berada di wilayah kabupaten atau kotamadya, dengan Variabel status sekolah swasta atau negeri.

Pada dasarnya mahasiswa hanya mengambil banyaknya mata kuliah yang ada pada semester 1 dan 2, yang bertujuan untuk mengetahui berapa banyaknya mata kuliah yang lulus dari semester tersebut setelah mengikuti program tingkat persiapan bersama di Institut Pertanian Bogor (IPB).

Dari hasil program tersebut akan didapat hasil proporsi kelulusan dari banyaknya mata kuliah yang diambil oleh peserta dimana data proporsi kelulusan tersebut disajikan pada Tabel 3.2

(39)

Tabel 3.2 Data proporsi kelulusan Mahasiswa dalam mengambil sejumlah mata

kuliah yang diselenggarakan pada Tingkat Persiapan Bersama di Institut Pertanian Bogor pada tahun 1997/1998

Obs ID JK Jalur Ijasah NEM Asal Sekolah Status Sekolah Mata Kuliah Yang lulus Mata Kuliah yang diambil Proporsi mata kuliah yang lulus 1 A00497001 0 1 7.30 43.75 1 0 15 15 1.00 2 A00497002 0 1 8.50 50.86 1 0 15 15 1.00 3 A00497003 0 1 8.70 54.89 1 0 15 15 1.00 4 A00497004 1 1 8.20 51.81 1 0 15 15 1.00 5 A00497005 0 1 7.31 41.13 1 1 15 15 1.00 6 A00497006 0 0 8.00 52.04 1 0 15 15 1.00 7 A00497007 0 1 7.60 41.78 1 0 15 15 1.00 8 A00497008 0 1 7.50 48.38 1 0 15 15 1.00 9 A00497009 0 1 7.70 55.81 1 0 15 15 1.00 10 A00497010 0 1 7.60 46.82 1 0 15 15 1.00 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2209 G07497028 1 1 7.40 40.92 1 1 3 15 0.20 2210 G07497029 1 1 6.70 34.68 1 1 1 15 0.07 2211 G07497030 1 1 7.60 40.10 1 1 7 15 0.47 2212 G07497031 1 1 7.90 46.70 0 0 6 15 0.40 2213 G07497032 1 1 6.70 40.64 0 0 4 15 0.27 2214 G07497033 1 1 6.40 41.60 0 0 8 15 0.53 2215 G07497034 1 1 7.18 41.39 0 1 1 15 0.07 2216 G07497035 1 1 7.30 52.18 0 0 10 15 0.67

Dari Tabel 3.2 terlihat bahwa nilai dari proporsi mencakup nilai 0 dan 1, yang mana didalam model regresi beta berada dalam selang (0,1) yaitu tidak mencakup nilai 0 dan 1. Maka untuk mengatasi permasalahan tersebut dengan menggunakan persamaan seperti berikut, y’’ = [y(n – 1) + s]/n, dimana s adalah konstan antara 0 dan 1 yaitu 0.5 menurut Smithson dan Verkuilen (2005). Dari hasil persamaan berikut maka didapat nilai proporsi yang baru tidak mencakup 0 dan 1, yang disajikan pada Tabel dilampiran 2 .

(40)

3.2 Tahapan Penelitian

Tahapan yang digunakan dalam menentukan model regresi beta pada data proporsi yaitu :

1. Mendeskripsikan data penelitian

2. Memodelkan data penelitian dengan regresi logistik, dengan tahapan

sebagai berikut :

a. Mengidentifikasi variabel yang signifikan melalui statistik uji T2 untuk masing-masing variabel prediktor. Proses ini disebut juga sebagai analisis variabel tunggal dengan mengambil taraf signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989)

b. Variabel yang dianggap signifikan pada tahap pertama, kemudian dianalisis secara simultan (proses ini disebut sebagai analisis variabel ganda). Pada proses ini menggunakan statistik uji chi-kuadrat pada taraf signifikansi sebesar 10%.

c. Sebelum membuat kesimpulan akhir, untuk setiap variabel yang dianggap tidak signifikan pada tahap kedua akan diperiksa kembali signifikansi variabel tersebut terhadap model dengan menggunakan uji rasio kemungkinan.

3. Memodelkan data penelitian dengan regresi beta, melalui Pers (2.13) dan

(2.17) dimana metode numerik yang digunakan penskoran Fisher, dengan tahapan sebagai berikut :

a. Mengidentifikasi variabel yang signifikan melalui statistik uji T2 untuk masing-masing variabel prediktor. Proses ini disebut juga

(41)

sebagai analisis variabel tunggal dengan mengambil taraf signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989)

b. Variabel yang dianggap signifikan pada tahap pertama, kemudian dianalisis secara simultan (proses ini disebut sebagai analisis variabel ganda). Pada proses ini menggunakan statistik uji chi-kuadrat pada taraf signifikansi sebesar 10%.

c. Sebelum membuat kesimpulan akhir, untuk setiap variabel yang dianggap tidak signifikan pada tahap kedua akan diperiksa kembali signifikansi variabel tersebut terhadap model dengan menggunakan uji rasio kemungkinan.

3.3 Algoritma Penskoran Fisher

Salah satu metode penaksiran model adalah dengan menggunakan penskoran Fisher, dimana model ini untuk menyelesaikan persamaan non-linier. Metode ini dapat digunakan untuk menentukan titik maksimum dari suatu fungsi, sebagaimana permasalahan dalam menentukan penaksir parameter dengan metode kemungkinana maksimum. Berikut ini prosedur penskoran Fisher untuk menentukan penaksir β yang dapat memaksimumkan fungsi kemungkinan, yang sebut saja fungsi u(β*).

Pertama-tama perhatikan bahwa n buah pengamatan akan digunakan untuk menaksir nilai-nilai dari p buah parameter, β1, β2,..., βp , serta bentuk fungsi kemungkinan L(β). Turunan sebanyak p buah dari fungsi log kemungkinan terhadap β1, β2,..., βp, disebut sebagai statistik skor atau disebut juga sebagai skor efisien (efficient score), dan dapat dipasangkan untuk memberikan vektor statistik skor p x 1, dimana komponen ke-j adalah

(42)

߲݈݋݃ܮ(ߚ)/߲ߚ௝, untuk j = 1, 2,..., p. Vektor ini dinotasikan sebagai u(β).

Misalkan I(β) adalah matriks berukuran p x p pada turunan kedua dari log L(β), dimana unsur-unsur ke-(j, k) dari matriks tersebut adalah:−ܧ ൜డమ௟௢௚௅(ఉ)

డఉೕడఉೖ ൠ

, untuk j = 1, 2, ..., p dan k = 1, 2, ..., p. Matriks I(β) ini kadang-kadang disebut juga sebagai matriks Informasi.

Perhatikan u(β), yaitu vektor skor statistik yang dievaluasi pada penaksir kemungkinan maksimum β, β෠. Dengan menggunakan deret Taylor, dimana harga β* diperkirakan akan mendekati β෠, akan diperoleh:

ݑ(ߚ) ≈ ݑ(ߚ∗) + ܫ(ߚ)(ߚ − ߚ) … (3.1)

Penaksir kemungkinan maksimum bagi β akan memenuhi persamaan berikut:

߲݈݋݃ܮ(ߚ)

߲ߚ௝ ቤ = 0 … (3.2)

untuk j = 1, 2, ..., p, sehingga u(β) = 0. Dari Pers (3.1) dapat diketahui bahwa: ߚ ≈ ߚ∗+ ܫିଵ)ݑ(ߚ) . Penentuan β yang dicapai melalui proses iterasi

ditentukan oleh:

ߚ(௧ାଵ) = ߚ(௧)+ ܫିଵ൫ߚ(௧)൯ݑ൫ߚ(௧) … (3.3)

Proses iterasi selesai jika selisih antar iterasi sudah ‘sangat kecil’. Agresti (1990) menyebutkan salah satu kriteria kekonvergenanߚ(௧) ke β, yaitu:

ቚߚ(௧ାଵ)− ߚመ௝ቚ≤ ܿቚߚ௝(௧) − ߚመ௝ቚ ଶ

(43)

Untuk lebih mudah dapat dilihat pada Gambar 3.1 dibawah ini. Evaluasi apakahหߠ෠(௧ାଵ)− ߠ෠(௧)ห< ܿ Dimana c=0.0001 ߠ(௧ାଵ)= ߠ(௧)+ ൥−ܧ߲ 2݈ߤ ݅, ߢ൯ ߲ߠ ൱൩ −1 ቆ߲൫ߤ݅, ߢ൯ ߲ߠ ቇ Hitung

Hitung vector skor dan Matriks informasi Tentukan nilai awalߠ෠

Mulai TIDAK Konvergen en? YA Berhenti

(44)

BAB IV

HASIL DAN PEMBAHASAN

4.1 Pendahuluan

Pada bab ini akan dibahas penerapan model regresi beta untuk menduga pola kelulusan mahasiswa dalam mengambil sejumlah mata kuliah. Dalam penelitian ini akan diamati proporsi lulus tidaknya seorang mahasiswa dalam mengikuti sejumlah mata kuliah. Pengamatan seperti ini perlu dicarikan suatu metode untuk menganalisis hubungan antara proporsi tingkat kelulusan mahasiswa dengan sejumlah variabel prediktor yang dianggap mampu menjelaskan proporsi tingkat kelulusan mahasiswa tersebut. Sehingga dalam penelitian ini digunakan dua tahapan yaitu yang pertama, data yang diperoleh akan dianalisis melalui metoda baku, dalam hal ini adalah dengan menggunakan metoda regresi logistik biasa Pada tahap kedua, baru akan dilakukan analisis dengan menggunakan metoda atau model regresi beta.

Pada masing-masing tahap analisis, sebelumnya kita harus mendeskripsikan mengenai variabel-variabel yang ada, setelah itu ada dua hal yang dapat dilakukan sehubungan dengan pemilihan model yang dianggap baik. Hal-hal yang akan dilakukan itu penaksiran model (termasuk didalamnya penaksiran parameter di dalam model, serta pengujian keberartian parameter di dalam model). Metoda penaksiran yang digunakan baik dalam model regresi logistik maupun dalam model regresi beta adalah dengan menggunakan metoda kemungkinan maksimum, melalui metoda iterasi seperti metoda Penskoran Fisher.

(45)

Pada proses pengujian keberartian parameter yang berada di dalam model biasanya menyangkut perumusan hipotesis statistik untuk menentukan apakah variabel-variabel prediktor yang digunakan secara berarti berhubungan dengan variabel responnya. Perbandingan antara nilai pengamatan dari variabel respon terhadap nilai taksiran yang diperoleh dari model dengan atau tanpa variabel yang diamati dan berdasarkan pada fungsi log-likelihood merupakan suatu ukuran untuk menguji keberatian parameter dalam model. Perbandingan parameter yang berdasarkan pada dua buah log-likelihood ini disebut juga sebagai uji rasio likelihood (Hosmer dan Lemeshow, 1989). Sedangkan McCullagh dan Nelder (1983) menyebut statistik ini sebagai devians, yang menyebar secara chi-kuadrat dengan derajat bebas (n - p).

Adapun ukuran lain yang digunakan untuk menguji keberartian parameter ini, yaitu dengan menggunakan uji chi-kuadrat untuk regresi logistik dan menggunakan uji t yang pada dasarnya menunjukkan seberapa jauh pengaruh satu variabel bebas secara individual dalam menerangkan variasi variabel respon. Tujuan dari uji t adalah untuk menguji koefisien regresi secara individual pada regresi beta. Statistik-statistik tersebut nantinya akan digunakan pada proses pemilihan variabel yang akan masuk ke dalam model.

4.2 Deskripsi Data

Dalam deskripsi data ini penulis mendeskripsikan variabel - variabel prediktor yang terdapat pada data proporsi kelulusan banyaknya mata kuliah yang diambil oleh mahasiswa pada tahun akademik 1997/1998. Untuk lebih singkat deskripsi data akan di visualisasikan melalui Gambar 4.1:

(46)

Gambar 4.1 Diagram Lingkaran Jenis Kelamin

Dari Gambar 4.1 terlihat bahwa perbandingan persentase perempuan dan laki-laki yang masuk ke IPB pada tahun akademik 1997/1998 relatif seimbang, yaitu: 54.51% dan 45.49% .

Gambar 4.2 Diagram Lingkaran Cara Lolos Seleksi ke IPB

Dari Gambar 4.2 terlihat di Institut Pertanian Bogor merupakan salah satu perguruan tinggi negeri di Indonesia yang menyelenggarakan penyaringan mahasiswanya melalui dua jalur, yaitu jalur Ujian Masuk Perguruan Tinggi Negeri (UMPTN) dan jalur Penelusuran Minat dan Bakat IPB (PMDK), dimana hampir 91,47% diantara mahasiswa yang masuk ke IPB adalah yang melalui jalur UMPTN.

(47)

Gambar 4.3 Box Plot Nilai Rata-rata Ijazah

Dari Gambar 4.3 terlihat latar belakang prestasi pendidikan mahasiswa selama mereka masih duduk di bangku SLTA ditunjukkan oleh nilai rata-rata ijazah, dimana nilai rata-rata ijazah adalah sebesar 7.45 dengan simpangan baku sebesar 0.45472, yang mempunyai nilai minimal sebesar 6.00 dan nilai maksimal sebesar 9.00. Angka-angka tersebut menunjukkan bahwa mahasiswa TPB-IPB tahun akademik 1997/1998 mempunyai latar belakang prestasi akademik yang cukup baik.

(48)

Dari Gambar 4.4 terlihat latar belakang prestasi pendidikan mahasiswa selama mereka masih duduk di bangku SLTA ditunjukkan oleh Nilai Ebtanas Murni (NEM), dimana Nilai Ebtanas Murni (NEM) adalah sebesar 44.31 dengan simpangan baku sebesar 6.041, yang mempunyai nilai minimal sebesar 23.93 dan nilai maksimal sebesar 62.29. Angka-angka tersebut menunjukkan bahwa mahasiswa TPB-IPB tahun akademik 1997/1998 mempunyai latar belakang prestasi akademik yang cukup baik.

Gambar 4.5 Diagram Lingkaran Daerah Asal Sekolah

Dari Gambar 4.5 terlihat bahwa sebagian besar mahasiswa IPB pada tahun akademik 1997/1998 masih didominasi oleh para siswa yang berasal dari daerah kotamadya dibandingkan dengan kabupaten yaitu sebesar 70.31%, dan 29.69%.

(49)

Dari Gambar 4.6 perlu diketahui bahwa perbandingan persentase status sekolah negeri dan swasta yang masuk ke IPB pada tahun akademik 1997/1998 relatif seimbang, yaitu: 49.05% dan 50.95%

4.3 Hasil - hasil Pada Model Regresi Logistik

Berdasarkan uraian singkat tentang data pada Tabel 3.1, data pengamatan yang akan diteliti yaitu data proporsi kelulusan mahasiswa dalam mengikuti sejumlah mata kuliah yang diselenggarakan pada tingkat persiapan bersama di Institut Pertanian Bogor (IPB), dimana semua mata kuliah yang diambil oleh mahasiswa pada semester satu dan dua. Dalam kasus ini yang dijadikan sebagai variabel prediktor yaitu JK (X1), jalur (X2), ijazah (X3), NEM (X4), daerah asal

sekolah (X5), dan status sekolah (X6), yang akan dicocokan dalam model regresi

logistik seperti berikut :

log ൤1 − ߤ൨= ߚߤ ଴+ ߚଵݔଵ+ ߚଶݔଶ+ ߚଷݔଷ+ ߚସݔସ+ ߚହݔହ+ ߚ଺ݔ଺

dengan melalui dua tahapan yaitu melalui tahapan analisis variabel tunggal

(univariate), kemudian tahapan analisis variabel ganda (multivariate). Satu hal

yang harus diperhatikan pada saat tahapan analisis variabel tunggal dilakukan adalah tentang variabel yang berskala ordinal, maka variabel itu dapat dimodelkan sebagai variabel kontinu. Sedangkan untuk variabel kontinu analisis variabel tunggal yang paling diperlukan adalah mendapatkan penaksir koefisien, standar error, dan uji rasio likelihood untuk menguji keberartian koefisien.

(50)

Tabel 4.1 Model Regresi Logistik Variabel Tunggal

Parameter Koefisien Standard Error Uji Chi-Square P-value β1 -0.065 0.044 2.180 0.140 β2 -0.046 0.079 0.340 0.559 β3 -0.003 0.059 0.000 0.965 β4 0.092 0.028 11.080 0.001 β5 -0.050 0.052 0.930 0.336 β6 0.081 0.044 3.400 0.065 Log likelihood = -5800.6295

Dari Tabel 4.1 dapat dilihat bahwa variabel-variabel yang dapat dilihat bahwa variabel-variabel yang dapat dianalisis selanjutnya dengan taraf signifikansi 30% (Hosmer dan Lemeshow, 1989), yaitu ada tiga variabel diantaranya jenis kelamin (X1), nilai ebtanas murni (X4), dan status sekolah (X6).

Sedangkan untuk variabel-variabel cara lolos seleksi ke IPB (X2), nilai rata-rata

ijazah (X3), dan daerah asal sekolah (X5) merupakan variabel-variabel yang tidak

nyata bagi model taksiran karena menghasilkan p-value yang cukup besar. Oleh karena itu, variabel-variabel tersebut tidak diikutsertakan lagi dalam analisis berikutnya. Perlu diketahui bahwa konstanta tidak ditampilkan ke dalam tabel. Setelah analisis variabel tunggal dilakukan, maka langkah selanjutnya adalah memilih variabel untuk keperluan analisis variabel ganda.

Mengikuti penaksiran model variabel ganda ini, untuk kepentingan dari masing-masing variabel yang dilibatkan ke dalam model, maka harus diuji terlebih dahulu. Langkah ini termasuk didalamnya adalah penentuan statistik uji chi-kuadrat untuk masing-masing variabel, serta perbandingan koefisien taksiran dengan koefisien-koefisien dari model tunggal yang berisi variabel tersebut saja. Variabel - variabel yang memberikan kontribusi terhadap model berdasarkan kriteria ini dapat dihapus dan selanjutnya menaksir model yang baru. Model yang

(51)

baru kemudian akan dibandingkan dengan model sebelumnya melalui uji rasio likelihood. Selain itu koefisien taksiran juga akan dibandingkan untuk variabel -variabel lainnya terhadap model lengkap.

Tabel 4.2 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadrat

Berdasarkan Hasil Pada Tabel 4.1

Variabel Koefisien Standar Error Uji Chi-Kuadrat P-value β0 -0,363 0,157 4,340 0,037 β1 -0,061 0,044 1,900 0,168 β4 0,087 0,024 12,840 0,000 β6 0,078 0,044 3,150 0,076 log likelihood (λ(β))=-5805.9900

Berdasarkan hasil yang didapat dalam Tabel 4.2 dengan nilai taraf signifikansi 10% dapat dilihat bahwa variabel X4 dan X6 mempunyai p-value <

0.10, sedangkan variabel X1 (JK) p-value > 0.10, didapat pula nilai

ߣ(ߚ) = ߣ(ߚ଴, ߚଵ, ߚସ, ߚ଺) = −5805.9900 dalam model. Untuk selanjutnya

variabel X1 tidak dilibatkan lagi pada model berikutnya. Dengan mengabaikan

variabel X1dibuat model baru yang disajikan pada Tabel 4.3 berikut

Tabel 4.3 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadrat

Berdasarkan Hasil Pada Tabel 4.2

Variabel Koefisien Standar Error Uji Chi-Kuadrat P-value β0 -0,3510 0,1557 5,0800 0,0242 β4 0,0869 0,0244 12,7400 0,0004 β6 0,0757 0,0439 2,9800 0,0845 log likelihood (λ(β)) = -5807.1176

Dari tabel tersebut dapat dilihat bahwa penaksir koefisien dan standar error memberikan nilai-nilai yang tidak jauh berbeda dengan nilai yang diperoleh pada model sebelumnya, seperti pada nilai ߣ(ߚ) = ߣ(ߚ, ߚ, ߚ) = −5807.1176 . Hal ini menunjukkan bahwa variabel jenis kelamin (X ) tidak memberikan pengaruh

(52)

yang berarti terhadap model. Pernyatan ini didukung oleh nilai chi-kuadrat untuk kedua model itu memberikan hasil yang tidak jauh berbeda.

Lebih jauh lagi, untuk melihat bagaimana pengaruh variabel-variabel yang dianggap tidak nyata terhadap model dilakukan melalui uji rasio likelihood ߣ(ߚ), yang menyatakan perbedaan antara model yang dalam Tabel 4.2 dan Tabel 4.3 (untuk menguji keberartian variabel X1) menghasilkan suatu nilai sebagai berikut:

ߣ(ߚଵ|ߚ଴, ߚସ, ߚ଺) = −2[ߣ(ߚ଴, ߚସ, ߚ଺) − ࣅ(ࢼ)]

= −2(−5807.1176 + 5805.9900) = 2.2552 Dengan membandingkan hasil tersebut dengan sebaran ߯(ଵ)ଶ pada taraf nyata 5% memberikan hasil yang tidak nyata (p-value = 0.1332). Artinya, variabel X1 tidak cukup berarti untuk menaksir pola kelulusan mahasiswa. Dengan

demikian dapat dikatakan bahwa faktor-faktor yang mempengaruhi pola kelulusan mahasiswa TPB menurut regresi logistik adalah nilai ebtanas murni (X4) dan

status sekolah (X6).

Berdasarkan hasil pengujian koefisen regresi diatas yang signifikan adalah nilai rata-rata ijazah dan status sekolah dengan model regresi logistik seperti berikut :

log ൤1 − ߤ൨= −0.3510 + 0.0869ݔߤ ସ+ 0.0757ݔ଺

4.4 Hasil - hasil Pada Model Regresi Beta

Langkah-langkah yang akan ditempuh pada pembentukan model dalam model regresi beta hampir sama dengan langkah-langkah yang ada dalam pemodelan regresi logistik, begitu juga pada model regresinya seperti berikut :

(53)

tetapi dimana model ini diasumsikan bahwa varians dari variabel respons adalah konstan, sehingga mempunyai parameter dispersi yang dimodelkan dalam bentuk ߢ௜= exp(−ࢠ࢏ࢾ) .

Proses pembentukan model dimulai dengan analisis variabel tunggal, yang dilanjutkan dengan analisis variabel ganda. Demikian juga halnya dengan kriteria pemilihan variabel ke dalam model yang digunakan adalah log likelihood, akan tetapi disini menggunakan uji t.

Tabel 4.4 Model Regresi Beta Variabel Tunggal

Parameter Koefisien Standard Error Statistik Uji t P-value β1 -0.084 0.042 -1.990 0.047 β2 -0.049 0.075 -0.650 0.513 β3 0.012 0.057 0.210 0.831 β4 0.089 0.026 3.370 0.001 β5 -0.061 0.050 -1.220 0.224 β6 0.048 0.042 1.140 0.253 Δ -1.070 0.026 -40.600 <.0001 Log likelihood = -291.2

Dari Tabel 4.4 dapat dilihat bahwa variabel - variabel yang dapat dianalisis selanjutnya dengan taraf signifikansi 30% (Hosmer dan Lemeshow, 1989) yaitu ada empat variabel jenis kelamin (X1), nilai ebtanas murni (X4), daerah asal

sekolah (X5), status sekolah (X6). Sedangkan untuk variabel - variabel cara lolos

seleksi ke IPB (X2), nilai rata-rata ijazah (X3) merupakan variabel-variabel yang

tidak nyata bagi model taksiran karena menghasilkan p-value yang cukup besar. Oleh karena itu, variabel-variabel tersebut tidak diikutsertakan lagi dalam analisis berikutnya. Perlu diketahui bahwa konstanta tidak ditampilkan ke dalam tabel. Setelah analisis variabel tunggal dilakukan, maka langkah selanjutnya adalah

(54)

memilih variabel untuk keperluan analisis variabel ganda, dimana hasilnya dapat dilihat pada Tabel 4.5.

Tabel 4.5 Penaksir Koefisien, Standar Error, dan Statistik Uji t

Berdasarkan Hasil Pada Tabel 4.4

Variabel Koefisien Standar Error Statistik Uji-t P-value β0 -0,2573 0,1503 -1,71 0,0871 β1 -0,08248 0,04222 -1,95 0,0509 β4 0,09061 0,02349 3,86 0,0001 β5 -0,05766 0,04648 -1,24 0,2148 β6 0,04822 0,04211 1,15 0,2523 Δ -1,0698 0,02635 -40,59 <.0001 log-likelihood (λ(β'))= -290.7

Pada Tabel 4.5 dapat dilihat bahwa menurut model beta variabel-variabel yang dianggap nyata dalam menduga pola kelulusan mahasiswa dengan taraf signifikansi 10% hanya ada dua variabel, yaitu: jenis kelamin (X1), dan nilai

ebtanas murni (X4), dan mempunyai nilaiߣ(ߚ) = ߣ൫ߚ, ߚଵ,ߚ, ߚ, ߚ൯= −290.7.

Tabel 4.6 Penaksir Koefisien, Standar Error, dan Statistik Uji t

Berdasarkan Hasil Pada Tabel 4.5

Variabel Koefisien Standar Error Statistik Uji-t P-value β0 -0,2583 0,1493 -1,73 0,0837 β1 -0,0778 0,0421 -1,85 0,0650 β4 0,0879 0,0233 3,78 0,0002 Δ -1,0685 0,0264 -40,55 <.0001 log-likelihood (λ(β'))= -288.0

Dari hasil Tabel 4.6 dapat dilihat bahwa penaksir koefisien dan standar error memberikan nilai – nilai yang tidak jauh berbeda dengan nilai yang

diperoleh pada model sebelumnya, seperti pada nilai

ߣ(ߚ) = ߣ൫ߚ

(55)

Hal ini menunjukkan bahwa variabel-variabel daerah asal sekolah (X5) dan

status sekolah (X6) tidak memberikan pengaruh yang berarti terhadap model.

Pernyatan ini didukung oleh nilai devians untuk kedua model itu memberikan hasil yang tidak jauh berbeda.

Lebih jauh lagi, untuk melihat bagaimana pengaruh variabel-variabel yang dianggap tidak nyata terhadap model dilakukan melalui uji rasio likelihood ߣ(ߚ), yang menyatakan perbedaan antara model yang dalam Tabel 4.5 dan Tabel 4.6 (untuk menguji keberartian variabel X5 dan X6) menghasilkan suatu nilai sebagai

berikut:

ߣ(ߚହ, ߚ଺|ߚ଴, ߚଵ, ߚସ) = −2[ߣ(ߚ଴, ߚଵ, ߚସ) − ࣅ(ࢼ)]

= −2(288 − 290.7) = −5.4

Dengan membandingkan hasil tersebut dengan sebaran ߯(ଶ)ଶ pada taraf nyata 5% memberikan hasil yang nyata (p-value = 0.06720). Artinya, variabel X5

dan X6 tidak cukup berarti untuk menaksir pola kelulusan mahasiswa, sehingga

dapat dikatakan bahwa faktor-faktor yang mempengaruhi pola kelulusan mahasiswa TPB menurut regresi beta adalah jenis kelmin (X1) dan nilai ebtanas

murni (X4).

4.5 Pembahasan Hasil – hasil dari Kedua Model Regresi

Dari hasil model regresi logistik dan regresi beta dapat disimpulkan bahwa variabel-variabel yang dianggap berarti dalam kedua model tersebut berbeda dan perbedaannya terlihat pula pada nilai-nilai yang dihasilkan untuk penaksir koefisien, standar error, dan log-likelihood. Nilai yang cukup nyata yang menunjukkan perbedaan diantara kedua model ini ditunjukkan pada nilai log-likelihoodnya, dimana nilai log-likelihood untuk model beta berada disekitar nilai

Gambar

Tabel 3.1. Daftar Nama Variabel dan Kategori dari Variabel
Tabel 3.2 Data proporsi kelulusan Mahasiswa dalam mengambil sejumlah mata kuliah yang diselenggarakan pada Tingkat Persiapan Bersama di Institut Pertanian Bogor pada tahun 1997/1998
Gambar 3.1 Diagram Alir Penskoran Fisher
Gambar 4.1 Diagram Lingkaran Jenis Kelamin
+7

Referensi

Dokumen terkait

 Pengaruh Estimasi Pertumbuhan Ekonomi (ŷ) Terhadap Kemiskinan dapat dijelaskan bahwa jika terjadi pertumbuhan ekonomi sebesar 1 unit akibat adanya perubahan

Pada aspek kegiatan inti yang terdiri dari penyajian materi, pendalaman materi, permainan tongkat dan menarik kesimpulan, siswa memperoleh skor 20.. Pada aspek terakhir

All praises belong to Allah SWT to his blessing and mercies given to the researcher, she can complete her research paper entitled CLASSROOM TECHNIQUES USED BY

Analisis kandungan ALB digunakan untuk mengetahui jumlah asam lemak bebas yang terkandung di dalam minyak. Netralkan etanol 95% dengan menggunakan NaOH ),1 N dan indikator

1) Penelitian ini diharapkan dapat memberi manfaat secara langsung maupun tidak langsung kepada berbagai pihak mengenai pentingnya pendidikan seks bagi remaja. 2)

Bulan Juni : petugas rawat inap mendapatkan konfirmasi kembali dari perawat ruangan dikarenakan Risperidone 2 mg dan clozapine 25mg salah seorang pasien masih disiapkan, padahal

Apabila dalam masa pemulihan mata anda menjadi lebih sakit dari biasanya atau penglihatan anda tiba-tiba menjadi kabur kembali, anda harus segera datang ke Klinik Mata

Pemeriksaan bakteriologi dilakukan pada seluruh pasien yang telah dipasang kateter epidural, pada saat pencabutan kateter diberi tindakan aseptik serta antiseptik pada daerah