• Tidak ada hasil yang ditemukan

PEMODELAN REGRESI POISSON DAN ANALISIS FAKTOR- FAKTOR EKSISTENSI KASUS PENDERITA DEMAM BERDARAH STUDI KASUS DI KABUPATEN DELI SERDANG SKRIPSI

N/A
N/A
Protected

Academic year: 2022

Membagikan "PEMODELAN REGRESI POISSON DAN ANALISIS FAKTOR- FAKTOR EKSISTENSI KASUS PENDERITA DEMAM BERDARAH STUDI KASUS DI KABUPATEN DELI SERDANG SKRIPSI"

Copied!
83
0
0

Teks penuh

(1)

PEMODELAN REGRESI POISSON DAN ANALISIS FAKTOR- FAKTOR EKSISTENSI KASUS PENDERITA DEMAM BERDARAH STUDI KASUS DI KABUPATEN DELI SERDANG

SKRIPSI

HERMAN BASUKI LUMBANTOBING 150803067

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

MEDAN 2019

(2)

BERDARAH STUDI KASUS DI KABUPATEN DELI SERDANG

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains

HERMAN BASUKI LUMBANTOBING 150803067

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

MEDAN 2019

(3)

PEMODELAN REGRESI POISSON DAN ANALISIS FAKTOR- FAKTOR EKSISTENSI KASUS PENDERITA DEMAM BERDARAH STUDI KASUS DI KABUPATEN DELI SERDANG

SKRIPSI

Saya menyatakan bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, Juli 2019

Herman Basuki LumbanTobing 150803067

(4)

Judul : Pemodelan Regresi Poisson dan Analisis Faktor-Faktor Eksistensi Kasus Penderita Demam Berdarah Studi Kasus di Kabupaten Deli Serdang.

Kategori : Skripsi

Nama : Herman Basuki LumbanTobing

Nomor Induk Mahasiswa : 150803067

Program Studi : Sarjana (S1) Matematika

Fakultas : Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara

Disetujui di Medan, Juli 2019

Ketua Program Studi Pembimbing,

Dr. Suyanto, M.Kom. Dr.Open Darnius, M.Sc NIP. 19590813 198601 1 002 NIP. 19641014 199103 1 004

(5)

BERDARAH STUDI KASUS DI KABUPATEN DELI SERDANG

ABSTRAK

Demam berdarah merupakan penyakit yang disebabkan oleh virus dengue yang ditularkan melalui gigitan nyamuk Aedes aegypti. Penyakit ini banyak ditemukan di daerah tropis seperti di Asia Tenggara, yang mana salah satunya adalah Indonesia.

Kabupaten Deli Serdang merupakan salah satu daerah endemis demam berdarah di Provinsi Sumatera Utara. Penelitian ini bertujuan untuk membuat model matematika berdasarkan faktor – faktor mempengaruhi demam berdarah di Kabupaten Deli Serdang. Metode yang digunakan untuk memodelkan faktor – faktor yang mempengaruhi demam berdarah adalah metode regresi Poison dengan variabel respon adalah kasus penderita demam berdarah sedangkan variabel prediktor yang diteliti yaitu variabel kepadatan penduduk, jumlah sarana kesehatan, jumlah tenaga kesehatan, ketinggian wilayah dan keluarga miskin. Analisis data di lakukan menggunakan analisis deskriptif, regresi poisson dan regresi binomial negatif.

Regresi poisson merupakan salah satu regresi nonlinier yang sering digunakan untuk memodelkan variabel respon berupa bilangan cacah. Regresi Poisson memiliki asumsi equidispersi, yaitu kondisi dimana nilai mean dan varian bernilai sama pada variabel terikat. Pada prakteknya kadang terjadi pelanggaran asumsi dalam analisis data diskrit berupa overdispersion. Kondisi overdispersion yaitu nilai variansi lebih besar dari pada nilai mean pada variabel terikat, sehingga model regresi poisson tidak tepat digunakan. Maka penggunaan regresi binomial negatif digunakan untuk mengatasi overdispersion. Sedangkan hasil uji regresi poisson walupun mengalami overdispersion menunjukkan bahwa variabel jumlah sarana kesehatan, jumlah tenaga kesehatan, tinggi wilayah, dan keluarga miskin yang mempunyai pengaruh terhadap kasus penderita malaria di Kabupaten Deli Serdang.

Kata kunci: Demam berdarah, Kabupaten Deli Serdang, Regresi Poisson

(6)

DELI SERDANG RENGENCY

ABSTRACT

Dengue fever is a disease caused by the dengue virus that is transmitted through the bite of the Aedes aegypti mosquito. This disease is found in tropical regions such as Southeast Asia, where one of them is Indonesia. Deli Serdang Regency is one of the endemic areas of dengue fever in North Sumatra Province. This study aims to make a mathematical model based on the factors that influence dengue fever in Deli Serdang Regency. The method used to model the factors that influence dengue fever is the Poisson regression method with the response variable is the case of dengue fever while the predictor variables studied are population density, number of health facilities, number of health workers, height of territory and poor families. Data analysis was performed using descriptive analysis, poisson regression and negative binomial regression. Poisson regression has an equidispersion assumption, which is a condition where the mean and variance values are equal to the dependent variable.

In practice, sometimes there are violations of assumptions in discrete data analysis in the form of overdispersion. The overdispersion condition is that the variance value is greater than the mean value of the dependent variable, so the poisson regression model is not appropriate. Then the use of negative binomial regression is used to overcome overdispersion. While the results of the Poisson regression test even though experiencing overdispersion showed that the variable number of health facilities, the number of health workers, the height of the region, and poor families had an influence on cases of malaria sufferers in Deli Serdang District.

Keywords: Dengue Fever, Deli Serdang Regency, Poisson Regression

(7)

Puji dan syukur kepada Tuhan Yang Maha Esa yang telah memberikan berkah dan rahmat-Nya sehingga penulis dapat menyelesaikan skripsi ini yang berjudul

“Pemodelan Regresi Poisson dan Analisis Faktor-Faktor Eksistensi Kasus Penderita Demam Berdarah Studi Kasus di Kabupaten Batu Bara”. Skripsi ini merupakan salah satu syarat untuk menyelesaikan studi pada Program Studi Sarjana Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara.

Penyusunan dan penulisan skripsi ini tidak terlepas dari bantuan, bimbingan, serta dukungan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada:

1. Bapak Prof. Dr. Runtung Sitepu, S.H., M.Hum. sebagai Rektor Universitas Sumatera Utara.

2. Bapak Drs. Kerista Sebayang, M.S. sebgai Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara.

3. Bapak Dr. Suyanto, M.Kom. sebagai Ketua Program Studi S1 Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara.

4. Bapak Drs. Rosman Siregar, M.Si. sebagai Sekretaris Program Studi S1 Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara.

5. Bapak Dr. Sutarman, M.Sc. selaku Dosen penasehat akademik yang telah banyak memberikan arahan, nasehat dan saran akademik, serta dukungan dalam proses perkuliahan.

6. Bapak Dr. Open Darnius, M.Sc. selaku Pembimbing penulis yang telah memberikan bimbingan, arahan , nasehat dan saran bagi penulis dalam penyelesaian skripsi ini.

7. Bapak Dr. Sutarman, M.Sc. sebagai Pembanding I penulis yang telah memberikan arahan, kritik dan saran bagi penulis dalam penyelesaian skripsi ini.

(8)

skripsi ini.

9. Seluruh Staf Pengajar di Program Studi S1 Matematika FMIPA USU yang telah banyak memberikan ilmu pengetahuan kepada penulis selama masa perkuliahan.

10. Seluruh Pegawai Program Studi S1 Matematika FMIPA USU yang telah banyak memberikan pelayanan yang baik kepada penulis selama masa perkuliahan.

11. Orangtua penulis Togu LumbanTobing dan Netty Hutapea, saudara-saudara penulis Adianto LumbanTobing dan Lambok LumbanTobing, serta keluarga penulis yang telah memberikan motivasi kepada penulis selama pengerjaan skripsi ini.

12. Sahabat diskusi belajar penulis, yaitu Winardi, Reynold Sitorus, Yohana Tambunan yang telah memberikan masukan dan saran yang baik dalam pengerjaan skripsi ini.

13. Rekan-rekan jurusan Matematika khususnya stambuk 2015, adik-adik junior stambuk 2016, stambuk 2017, stambuk 2018 serta abang dan kakak alumni.

Penulis menyadari bahwa masih banyak kekurangan dalam penyusunan skripsi ini. Oleh karena itu, penulis sangat mengharapkan kritik dan saran yang sifatnya membangun guna dari pembaca dan pihak-pihak lain untuk menyempurnakan tugas akhir ini.

Medan, Juli 2019 Penulis,

Herman Basuki LumbanTobing

(9)

Halaman

PERNYATAAN ORISINILITAS i

PENGESAHAN SKRIPSI ii

ABSTRAK iii

ABSTRACT iv

PENGHARGAAN v

DAFTAR ISI vii

DAFTAR TABEL ix

DAFTAR GAMBAR x

DAFTAR LAMPIRAN xi

BAB 1 PENDAHULUAN 1

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Batasan Masalah 3

1.4 Tujuan Penulisan 3

1.5 Kontribusi Penelitian 4

BAB 2 TINJAUAN PUSTAKA 5

2.1 Statistika Deskriptif 5

2.1.1 Rata – Rata (average) 5

2.1.2 Varians 6

2.1.3 Uji Kolmogorov - Smirnov 8

2.2 Analisis Regresi 8

2.2.1 Analis Regresi Linear Sederhana 9 2.2.2 Analis Regresi Linear Berganda 13

2.3 Pengujian Multikolinearitas 14

2.4 Keluarga Distribusi Eksponensial 15

2.5 Distribusi Poisson 16

2.6 Model Regresi Poisson 17

2.7 Pengujian Kesesuaian Regresi Poisson 20

2.8 Overdispersion 22

2.9 Distribusi Binomial Negatif 23

2.10 Regresi Binomial Negatif 24

BAB 3 METODOLOGI PENELITIAN 27

3.1 Waktu dan Tempat Penelitian 27

3.2 Metode Pengumpulan Data 27

3.3 Variabel Penelitian 29

3.4 Metode Pengolahan Data dan Analisis Data 30

(10)

4.1 Analisis Deskriptif 32

4.2 Deskriptif Data 39

4.3 Uji Kolmogorov - Smirnov 43

4.4 Uji Multikolinieritas 44

4.5 Model Regresi Poisson 46

4.5.1 Uji Parsial Model Regresi Poisson 46

4.5.2 Interpretasi Parameter 49

4.6 Uji Asumsi Equidispersi 50

4.7 Overdispersion Regresi Poisson 50

4.8 Model Regresi Binomial Negatif 52

4.9 Overdispersion Regresi Binomial Negatif 54 4.10 Perbandingan Model Regresi Poisson dengan

Binomial Negatif 55

BAB 5 KESIMPULAN DAN SARAN 56

5.1 Kesimpulan 56

5.2 Saran 57

DAFTAR PUSTAKA 58

LAMPIRAN 60

(11)

Nomor Tabel

Judul Halaman

3.1 Data Variabel Prediktor dan Variabel Respon 28

3.2 Variabel bebas (X) 29

4.1 Pengolahan Data 32

4.2 Statistika Deskriptif Data Kasus Demam Berdarah 40

4.3 One Sample Kolmogorov-Smirnov Test 43

4.4 Hasil Pengujian Multikolinieritas 44

4.5 Keputusan Hasil Pengujian Multikolinieritas 45

4.6 Nilai parameter Regresi Poisson 46

4.7 Hasil Uji Parsial Regresi Poisson 48

4.8 Hasil Nilai equidispersi 50

4.9 Hasil Uji Overdispersion Poisson 51

4.10 Nilai parameter Regresi Binomial Negatif 52 4.11 Hasil Uji Overdispersion Binomial Negatif 54 4.12 Nilai deviance, pearson chi-square dan AIC 55

(12)

Nomor Gambar

Judul Halaman

2.1 Diagaram Pencar 10

2.2 Diagram Pencar, Garis Regresi dan Sisa 11

3.1 Diagram Alur Pengolahan data 30

4.1 Kecamatan dengan penderita penyakit DBD terbanyak

berdasarkan kepadatan penduduk 35

4.2 Kecamatan dengan penderita penyakit DBD terbanyak

berdasarkan ketinggian wilayah 36

4.3 Kecamatan dengan penderita penyakit DBD terbanyak

berdasarkan tenaga kesehatan 37 4.4 Kecamatan dengan penderita penyakit DBD terbanyak

berdasarkan sarana kesehatan 38 4.5 Kecamatan dengan penderita penyakit DBD terbanyak

berdasarkan keluarga miskin 39

(13)

Nomor Lampiran

Judul Halaman

1 Data Yang digunakan dalam Analisis kasus Demam

Berdarah 61

2 Uji Kolmogorov-Smirnov menggunakan softaware SPSS 62 3 Uji Multikolinnearitas menggunakan softaware SPSS 19 62 4

Hasil dari pemograman software SPSS 19 pada regresi

Poisson 63

5

Hasil dari pemograman software SPSS 19 untuk melihat

overdispersion 63

6

Hasil dari pemograman software SPSS 19 pada regresi

Binomial Negatif 64

7

Hasil dari pemograman software SPSS 19 untuk melihat

overdispersion 65

8 Tabel Distribusi Chi-Square 66

9

Surat izin pengambilan data di Badan Pusat Statistika

Sumatera Utara 67

10 Surat balasan dari Badan Pusat Statistika Sumatera Utara 68

(14)

BAB 1 PENDAHULUAN

1.1. Latar Belakang

Tingkat curah hujan dan kelembaban yang tinggi di Indonesia merupakan salah satu faktor yang mengakibatkan cepatnya perkembangan dari sumber penyakit.

Banyak penyakit yang dapat terjadi pada saat musim penghujan seperti penyakit diare, muntaber, dan ispa. Dalam penelitian ini, penyakit yang menjadi perhatian utama pada musim penghujan adalah penyakit Deman Berdarah Dengue(DBD).

Berdasarkan hasil penelitian yang dilakukan oleh Dinas Kesehatan Deli Serdang jumlah kasus Demam Berdarah Dengue (DBD) tiga tahun terakhir terus meningkat.

Pada tahun 2014 sebanyak 921, tahun 2015 sebanyak 98 kasus, dan tahun tahun 2016 sebanyak 1144 kasus. Kecamatan Tanjung Morawa dan Kutamlimbaru merupakan daerah endemis DBD dimana seriap tahun dipastikan ditemukan kasus DBD.

Menurut Chandra (2010), DBD merupakan penyakit yang banyak ditemukan di sebagian besar wilayah tropis dan subtropis, termasuk Indonesia. Penyakit demam berdarah dengue merupakan masalah kesehatan di Indonesia hal ini tampak dari kenyataan seluruh wilayah di Indonesia mempunyai resiko untuk terjangkit penyakit demam berdarah dengue. Sebab baik virus penyebab maupun nyamuk penularannya sudah tersebar luas di perumahan-perumahan penduduk.

Analisis regresi merupakan analisis statistika bertujuan untuk memodelkan hubungan antara variabel respon (Y) dengan variabel prediktor (X). Bila dalam analisisnya hanya melibatkan sebuah variabel prediktor, maka regresi yang digunakan adalah Regresi Linear Sederhana. Sedangkan bila dalam analisisnya melibatkan dua atau lebih variabel prediktor, maka regresi yang digunakan adalah Regresi Linear Berganda. Apabila variabel respon (Y) berdistribusi Poisson, maka model regresi yang digunakan adalah regresi Poisson. Regresi Poisson didapatkan dari distribusi Poisson, yaitu suatu distribusi untuk peristiwa yang probabilitas kejadiannya kecil, dimana kejadiannya tergantung pada interval waktu tertentu atau di suatu daerah tertentu dengan hasil pengamatan berupa variabel diskrit dan antar variabel saling independen.

(15)

Salah satu model regresi yang dapat digunakan untuk menjelaskan hubungan antara variabel respon Y yang berupa data diskrit dengan variabel prediktor X berupa data diskrit, kontinu, kategorik atau campuran adalah model regresi Poisson. Model yang digunakan untuk data cacahan adalah regresi Poisson yang merupakan model regresi non-linear. Regresi Poisson mengacu pada sebaran Poisson dengan 𝜇 sebagai parameternya. Sebaran Poisson merupakan salah satu sebaran peluang diskret (Cameron dan Trivedi, 1998).

Dari persoalan di atas memperlihatkan bahwa demam berdarah dengue merupakan penyakit yang serius yang dapat memberi ancaman bagi kesehatan masyarakat khususnya Kabupaten Deli Serdang. Untuk itu perlu diadakannya beberapa penanggulangan dalam mencegah meningkatnya angka kematian, dalam usaha untuk menanggulangi permasalahan ini, oleh sebab itu perlu mengetahui faktor utama penyebab Demam Berdarah Dengue dan seberapa besar faktor tersebut mempengaruhi penyebab penyakit DBD. Maka Regresi Binomial Negatif dipilih sebagai model non-linear yang berasal dari distribusi poisson-gamma mixture yang merupakan penerapan dari Generalized Linear Model (GLM) yang menggambarkan hubungan antara variabel dependen dengan variabel independen dan digunakan untuk memodelkan data dengan variabel respon berupa data count yang digunakan sebagai alternatif dari Model Regresi Poisson yang mengalami Overdispersi yaitu nilai variansi lebih besar dari mean (Pingit, 2019).

Berdasarkan latar belakang diatas maka peneliti tertarik mengambil penelitian dengan tema yang berjudul “Pemodelan Regresi Poisson Penyakit Demam Berdarah Kabupaten Deli Serdang Tahun 2018”.

(16)

1.2. Rumusan Masalah

Kasus demam berdarah tiga tahun terakhir terus meningkat di Kabupaten Deli Serdang. Pada tahun 2014 sebanyak 921, tahun 2015 sebanyak 98 kasus, dan tahun tahun 2016 sebanyak 1144 kasus. Kecamatan Tanjung Morawa dan Kutamlimbaru merupakan daerah endemis demam berdarah. Hal tersebut menjadi masalah yang perlu diatasi oleh pemerintah setempat dan masyarakat agar tidak memakan korban jiwa. Dalam mengatasi kasus demam berdarah, perlu diketahui penyebab terjadinya serta faktor – faktor risiko demam berdarah. Berdasarkan faktor – faktor risiko tersebut, akan dibentuk model matematika yang memengaruhi demam berdarah di Kabupaten Deli Serdang Tahun 2018.

1.3. Batasan Masalah

Adapun yang menjadi batasan masalah dalam penulisan skripsi ini yaitu:

1. Pengambilan data sekunder tahun 2018 yang diperoleh dari Badan Pusat Statistika Provinsi Sumatera Utara

2. Adapun faktor – faktor yang dibatasi dalam penelitian ini adalah Kepadatan penduduk (𝑋1), Jumlah tenaga kesehatan (𝑋2), Jumlah sarana kesehatan (𝑋3), Ketinggian Wilayah (𝑋4), dan Keluarga miskin (𝑋5).

3. Metode yang digunakan adalah Regresi Poisson

1.4. Tujuan Penulisan

Tujuan yang ingin dicapai dari penelitian ini adalah:

1. Memodelkan variabel manakah yang berpengaruh terhadap tingkat kasus demam berdarah di Kabupaten Deli Serdang dengan regresi poisson

2. Mengetahui kecamatan di Kabupaten Deli Serdang yang perlu diprioritaskan perhatian dan bantuan dari pemerintah untuk mengentaskan demam berdarah

(17)

1.5. Kontribusi Penelitian

Manfaat dari penelitian ini adalah sebagai berikut:

1. Sebagai bahan evaluasi kegiatan tentang faktor – faktor yang mempengaruhi terjadinya kasus demam berdarah

2. Sebagai bahan perimbangan bagi instansi dalam proses eliminasi dan pemberantasan penyakit DBD di masa yang akan datang.

3. Sebagai bahan referensi bagi penulis selanjutnya

(18)

BAB 2

TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Metode statistik adalah prosedur-prosedur yang digunakan dalam pengumpulan, analisis dan penafsiran data Analisis statistika deskriptif sendiri dapat diartikan sebagai metode yang berkaitan dengan mengumpulkan, mengolah, dan menyajikan data sehingga memberikan informasi yang berguna ( Walpole, 1995). Dalam analisis statistika deskriptif, data disajikan dalam bentuk grafik atau tabel. Untuk ukuran pemusatan data dan ukuran penyebaran data dideskripsikan secara numerik. Ukuran pemusatan data yaitu meliputi rata – rata, nilai tengah, dan modus sedangkan ukuran penyebaran data meliputi ragam dan standar deviasi (Walpole, 1995).

2.1.1 Rata-Rata (average)

Rata – rata (avarage) adalah nilai yang memiliki himpunan atau sekelompok data (a set of data). Nilai rata –rata umumnya cenderung terletak teguh suatu kelompok data yang disusun besar kecilnya nilai.

Adapun macam –macam rumus data – data sebagai berikut:

1. Rata – Rata Hitung

Merupakan nilai variabel 𝑋, hasil pengamatan atau observasi sebanyak nilai N kali, yaitu 𝑋1, 𝑋2, … , 𝑋𝑏, … , 𝑋𝑛, maka:

a) Rata – rata sebenarnya (populasi):

𝜇 = 1 𝑁∑ 𝑋𝑖

𝑁

𝑖=1

(2.1)

dengan :

𝜇 = rata – rata populasi

𝑁 = banyaknya data/pengamatan dari sebuah populasi 𝑋𝑖 = nilai pengamatan ke-i

(19)

𝑁𝑖=1𝑋𝑖 = jumlah nilai seluruh pengamatan dari sebuah pupulasi

𝜇 adalah simbol rata – rata sebenarnya yang disebut parameter rata – rata ini dihitung berdasarkan populasi, karena itu rata – rata sebenarnya sering juga disebut rata – rata populasi.

b) Rata – rata perkiraan (sampel)

Rata – rata perkiraan dihitung berdasarkan sampel sebanyak n dimana 𝑛 > 𝑁 observasi, maka rata – rata yang diperoleh disebut rata – rata perkiraan, atau rata – rata sampel, yang diberi simbol 𝑥 yang rumusnya adalah sebagai berikut:

𝑋̅ =1 𝑛∑ 𝑋𝑖

𝑁

𝑖=1

(2.2)

dengan :

𝑋 = rata – rata sampel

𝑛 = banyaknya data/pengamatan dari sebuah sampel 𝑋𝑖 = nilai pengamatan ke-i5

𝑁𝑖=1𝑋𝑖 = jumlah nilai seluruh pengamatan dari sebuah sampel

2.1.2 Varians

Varians adalah jumlah kuadrat dari selisih nilai data observasi dari nilai rata – ratanya, kemudian dibagi dengan jumlah observasinya. Varians digunakan untuk mengetahui seberapa jauh persebaran nilai hasil observasi terhadap rata- rata. Rumus varians ada dua jenis untuk data yang berasal dari populasi dan sampel, jika data yang diperoleh berasal dari populasi maka rumus varians dan simpangan bakunya adalah:

𝜎2 = 1

𝑁∑(𝑋𝑖− 𝜎)2

𝑁

𝑖=1

(2.3)

(20)

dengan :

𝜎2 = varians populasi

𝜎 = simpangan baku populasi 𝑁 = jumlah populsi

𝑋𝑖 = nilai pengamatan ke-i 𝜇 = rata – rata populasi = 1

𝑁𝑁𝑖=1𝑋𝑖

Jika data yang diperolah berasal dari sampel maka rumus varians dan simpangan baku yang digunakan ada dua jenis yaitu:

𝑠2 = 1

(𝑁 − 1)∑(𝑋𝑖 − 𝑋̅)2

𝑛

𝑖=1

(2.4)

atau

𝑠2 = 1

(𝑁 − 1)(∑ 𝑋12

𝑛

𝑖=1

−(∑𝑛𝑖=1𝑥𝑖)

𝑛 ) (2.5) dengan :

𝑠2 = varians sampel

𝑠 = simpangan baku sampel 𝑋̅ = rata – rata sampel 𝑛 = jumlah sampel 𝑋𝑖 = nilai pengamtan ke-i

2.1.3 Uji Kolmogorov-Smirnov

Uji Kolmogorov-Smirnov adalah suatu uji goodness of fit test (uji kecocokan), artinya yang diperhatikan adalah tingkat kesesuaian antara sebaran dari serangkaian nilai sampel yang diobservasi dengan suatu distribusi teoritis tertentu. Pengujian Kolmogorov-Smirnov dilakukan pada dua buah fungsi sebaran kumulatif, yaitu sebaran kumulatif, yang hipotesiskan dan sebaran kumulatif yang diamati. Misalkan diambil sebuah sampel acak dari suatu fungsi sebaran (𝑋) yang belum diketahui, akan dipastikan apakah dapat disimpulkan bahwa (𝑥) = 𝐹0(𝑋) untuk semua 𝑥, dengan 𝐹0(𝑋) adalah fungsi distribusi kumulatif yang dihipotesiskan.

(21)

2.2 Analisis Regresi

Analisis Regresi adalah sebuah metode statitstik yang berguna untuk memodelkan fungsi hubungan antara variabel, dalam hal tersebut adalah variabel dependen dan variabel independen. Variabel dependen adalah variabel terikat atau variabel yang dijelaskan oleh variabel lainnya atau variabel yang dipengaruhi oleh variabel independen. Setiap perubahan nilai atau skor dalam variabel dependen bergantung pada variabel independen. Hal ini dalam model regresi dilambangkan dengan notasi 𝑌. Variabel independen adalah variabel bebas. Variabel independen berkedudukan sebagai variabel penjelas, variabel yang mempengaruhi atau variabel prediksi bagi variabel dependen (Yamin dkk, 2011).

Analisis regresi digunakan apabila ada korelasi antara satu atau beberapa variabel bebas dengan variabel terikat ( dependent). Variabel bebas dapat berupa data kontinu maupun kategori. Analisis regresi adalah suatu analisis matematis yang mendefinisikan hubungan antara dua variabel. Analisis regresi yang digunakan estimasi, yaitu suatu formula matematis yang menunjukkan hubungan keterkaitan antara satu atau beberapa variabel yang nilainya sudah diketahui dengan satu variabel lain yang nilainya belum diketahui.

Variabel bebas adalah variabel yang nilai – nilainya tidak tergantung pada variabel lainnya, biasanya disimbolkan dengan 𝑋. Variabel ini digunakan untuk meramalkan atau menerangkan nilai variabel yang lain. Sedangkan variabel terikat adalah variabel yang nilai – nilainya bergantung pada variabel lainnya, biasanya disimbolkan dengan 𝑌. Vaariabel ini merupakan variabel yang diramalkan atau diterangkan nilainya.

Untuk mempelajari hubungan – hubungan antara beberapa variabel, analisis regresi dapat dilihat dari dua bentuk, yaitu:

1. Analisis regresi linear sederhana 2. Analisis regresi linear berganda

(22)

2.2.1 Analisis Regresi Linear Sederhana

Regresi linear sederhana merupakan bagian regresi yang mencakup hubungan linear antara satu variabel terikat dengan satu variabel bebas. Variabel bebas biasanya disimbolkan dengan 𝑋, sedangkan variabel terikat disimbolkan dengan 𝑌 (Sembiring, 1995). Bentuk umum persamaan regresi linier sederhana yang menunjukkan hubungan antara dua variabel, yaitu variabel 𝑋 sebagai variabel bebas dan variabel 𝑌 sebagai terikat dari suatu populasi adalah sebagai berikut:

𝑌𝑖 = 𝛽0+ 𝛽1𝑋𝑖+ 𝜀𝑖 (2.6) Keterangan:

𝑌𝑖 = Varaiabel terikat 𝑋𝑖 = Variabel bebas

𝛽0 = Jarak titik pangkal dengan titik potong garis dengan sumbu 𝑌 (inyercept)

𝛽1 = Kemiringan (slope) garis regresi 𝜀𝑖 = Nilai kesalahan

Parameter 𝛽0 dan 𝛽1 diduga dengan menggunakan garis regresi. Bentuk persamaan garis regresi adalah sebagai berikut:

𝑌̂ = 𝑏0+ 𝑏1𝑋 (2.7)

Keterangan:

𝑏0 = Intersept, jarak titik pangkal dan titik potong garis regresi dengan sumbu 𝑌

𝑏1 = Kemiringan garis regresi Dalam hal ini:

𝑌̂ merupakan penduga titik bagi 𝑌 𝑏0 merupakan penduga titik bagi 𝛽0 𝑏1 merupakan penduga titik bagi 𝛽1

Penduga dilakukan dengan mengambil contoh acak berukuran 𝑛 dari suatu populasi. Hasil pengamatan berupa pasangan 𝑥 dan 𝑦 sebagai berikut:

(𝑥1, 𝑦1), (𝑥2, 𝑦2), … , (𝑥𝑛, 𝑦𝑛

(23)

Jika data berpasangan tersebut digamabr pada sumbu koordinat siku – siku, maka diperoleh gambar sebagai berikut:

Gambar 2.1 Diagram Pencar

Dengan demikian diperoleh model regresi linear sederhana sebagai berikut:

𝑌𝑖 = 𝑏0+ 𝑏1𝑋 + 𝜀𝑖 (2.8)

Gambar 2.2 Diagram Pencar, Garis Regresi dan Sisa

Pada umumnya 𝑌𝑖 tidak sama dengan 𝑌̂ , perbedaan antara 𝑌𝑖 𝑖 dan 𝑌̂ dinyatakan 𝑖 dengan 𝑒𝑖 yang disebut dengan sisa (residual). Dalam hal ini:

(24)

𝑒𝑖 = 𝑌0+ 𝑌̂ 𝑖 (2.9) Nilai 𝑏0 dan 𝑏1 diperoleh dengan menggunakan Metode Least Square atau Metode Kuadrat Terkecil. Metode kuadrat terkecil merupakan suatu cara untuk memperoleh 𝑏0 dan 𝑏1 sebagai penaksir 𝛽0 dan 𝛽1.

Didapat eror, yaitu 𝜀 atau 𝜀𝑖 sebagai berikut:

𝜀 = 𝑌 − 𝑌̂ = 𝑌 − 𝑏0 − 𝑏1𝑋 (2.10) atau

𝜀𝑖 = 𝑌 − 𝑌̂ = 𝑌𝑖 𝑖 − 𝑏0 − 𝑏1𝑋𝑖

Metode least square bertujuan mendapatkan penaksir koefisien regresi, yaitu 𝑏0 dan 𝑏1, yang menajdikan jumlah kuadrat error, yaitu ∑𝑛𝑖=1𝜀𝑖2 sekecil mungkin. Prosedur metode kuadrat terkecil adalah sebagai berikut:

i. Membentuk ∑𝑛𝑖=1𝜀𝑖2 sebagai fungsi 𝑏0 dan 𝑏1, 𝑆 = 𝑓(𝑏0, 𝑏1)

𝑆 = ∑𝑛𝑖=1𝜀𝑖2

𝑆 = ∑𝑛𝑖=1(𝑌𝑖− 𝑏0− 𝑏1𝑋𝑖)2 (2.11)

ii. Mendiferensialkan 𝑆 terhadap 𝑏0 dan 𝑏1, kemudian hasil diferensialnya, yaitu 𝜕𝑆

𝜕𝑏0

dan 𝜕𝑆

𝜕𝑏1 disamakan dengan 0

𝜕𝑆

𝜕𝑏0 = ∑𝑛𝑖=12(𝑌𝑖 − 𝑏0− 𝑏1𝑋𝑖)(−1) = 0

𝑛𝑖=1(𝑌𝑖 − 𝑏0− 𝑏1𝑋𝑖) = 0

𝑛𝑖=1𝑌𝑖− ∑𝑛𝑖=1𝑏0 − ∑𝑛𝑖=1𝑏𝑖𝑋𝑖 = 0

𝑛𝑏0 + 𝑏𝑖𝑛𝑖=1𝑋𝑖 = ∑𝑛𝑖=1𝑌𝑖 (2.12)

𝜕𝑆

𝜕𝑏0 = ∑𝑛𝑖=12(𝑌𝑖 − 𝑏0− 𝑏1𝑋𝑖)(−𝑋𝑖) = 0 ∑𝑛𝑖=1(𝑌𝑖 − 𝑏0 − 𝑏1𝑋𝑖)(𝑋𝑖) = 0

(25)

𝑛𝑖=1𝑌𝑖𝑋𝑖 − ∑𝑛𝑖=1𝑏0𝑋𝑖− ∑𝑛𝑖=1𝑏𝑖𝑋𝑖2 = 0

𝑛𝑖=1𝑋𝑖𝑌𝑖 − 𝑏0𝑛𝑖=1𝑋𝑖− 𝑏𝑖𝑛𝑖=1𝑋𝑖2 = 0

𝑏0𝑛𝑖=1𝑋𝑖 + 𝑏𝑖𝑛𝑖=1𝑋𝑖2 =∑𝑛𝑖=1𝑋𝑖𝑌𝑖 (2.13)

Persamaan (2.12) dan (2.13) dinamai persamaan normal.

Untuk menentkan hubungan pengaruh perubahan variabel yang satu terhadap variabel yang lainnya, maka dibutuhkan peranan garis regresi. Selanjutnya, dari hubungan dua variabel ini dapat dikembangkan untuk permasalahan regresi berganda.

2.2.2 Analisis Regresi Linier Berganda

Regresi linear berganda adalah analis yang melibatkan hubungan dari dua atau lebih variabel bebas. Adakalanya persamaan regresi dalam menganalisis hubungan antar variabel teriakt hanya dipengaruhi, oleh faktor atau variabel bebas tetapi dapat juga dipengaruhi oleh dua atau lebih faktor yang mempengaruhinya. Regresi linier yang mengandung lebih dari satu variabel bebas digunakan regresi linear berganda. Jadi model ini dikembangkan untuk mengestimasi nilai 𝑣 terikat dinyatakan dengan 𝑌 sedangkan variabel bebas dinyatakan dengan 𝑋1, 𝑋2, … , 𝑋𝑘(Sudjana, 1996).

Model regresi linier berganda merupakan suatu model yang dapat dinyatakan dalam persamaan linier yang memuat variabel dan parameter. Parameter ini umumnya tidak diketahui dan dapat ditaksir. Hubungan linier lebih dari dua variabel dinyatakan dalam bentuk persamaan matematisnya adalah:

𝑌𝑖 = 𝛽0+ 𝛽1𝑋𝑖1+ 𝛽2𝑋𝑖2+ ⋯ + 𝛽𝑘𝑋𝑖𝑘 + 𝜀𝑖 (2.14) Keterangan:

𝑌𝑖 = Varaiabel terikat 𝑋𝑖1, 𝑋𝑖2, … , 𝑋𝑖𝑘 = Variabel bebas ke-𝑘

𝛽0, 𝛽1, 𝛽2, … , 𝛽𝑘 = Parameter regresi (nilai yag akan ditaksir) ke-𝑘 𝜀1 = Galat atau kesalahan

(26)

𝑖 = 1,2, … , 𝑛

Jika 𝜀1 = 0, maka diperoleh persamaan regresi linier ganda darisuatu populasi adalah sebagai berikut:

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖1+ 𝛽2𝑋𝑖2+ ⋯ + 𝛽𝑘𝑋𝑖𝑘 + 𝜀𝑖 Dalam melakukan analisis regresi linier barganda, sering dijumpai maslaah

multikolinieritas pada variael bebas (𝑋). Akibatnya adanya pelanggaran terhadap salah satu asumsi yang disyaratkan pada penggunaan regresi linier tersebut sehingga memperoleh sifat – sifat penduga atau penaksir koefisien regresi linier bergandanya.

Adapaun asumsi – asumsi yang mendasari analisis regresi berganda tersebut antara lain:

1. Nilai rata – rata kesalahan pengganggu nol, yaitu 𝐸(𝜀𝑖) = 0 untuk 𝑖 = 1,2, … , 𝑛.

2. 𝑉𝑎𝑟(𝜀𝑖) = 𝐸(𝜀𝑖2) = 𝜎2, adalah konstan untuk semua kesalahan pengganggu (asumsi homokedastisitas).

3. Tidak ada otokorelasi antara kesalahan pengganggu 𝜀𝑖, berarti kovarian (𝜀𝑖, 𝜀𝑦) = 0, 𝑖 ≠ 𝑗.

4. Variabel bebas 𝑥1, 𝑥2, … , 𝑥1 konstan dalam sampling yang terulang san bebas terhadap kesalahan pengganggu 𝜀𝑖.

5. Tidak ada multikolinearitas diantara variabel bebas 𝑋

2.3 Pengujian Multikolinearitas

Istilah kolinieritas ganda (multicolinieritas) diciptakan pertama kali oleh Ragner Frish yang artinya adanya hubungan linier sempurna atau eksak diantara variabel bebas dalam model regresi. Penyimpangan asumsi model klasik yang pertama adalah adanya multikolonieritas dalam model regresi yang dihasilkan. Artinya antar variabel bebas yang terdapat dalm model memiliki hubungan yang sempurna (koefisien korelasinya tinggi bahkan 1).

Koefisien yang sangat penting bagi model regresi yang mengandung multikolinieritas adalah bahwa kesalahan standar estimasi akan cenderung meningkat dengan bertambahnya variabel bebas, tingkat signifikan yang digunakan untuk menolak hipotesis nol akan semakin besar dan probabilitas menerima yang salah (kesalahan 𝛽) juga semakin besar. Akibatnya, model regresi yang diperoleh tidak sah (valid) untuk menaksir nilai variabel bebas (Algifari, 2000).

(27)

Pendeteksian kasus multikolinieritas dilakukan menggunakan kriteria nilai VIF. Jika nilai Variance Inflation Factor (VIF) lebih besar 10 menunjukkan adanaya multikolinieritas antar variabel prediktor. Nilai dinyatakan sebagai berikut:

𝑉𝐼𝐹𝑘= 1

1−𝑅𝑘2, (𝑘 = 1,2, … , 𝑝) (2.15) 𝑅𝑘2 = 1 −∑(𝑦𝑖−𝑦̂ )𝑖 2

∑(𝑦𝑖−𝑦̅) , (𝑖 = 1,2, … , 𝑝) Keterangan:

𝑘 = banyaknya variabel bebas

𝑦𝑖 = nilai variabel terikat dari pengamatan ke –𝑖 𝑦𝑖 = 𝑏0+ 𝑏1𝑥1+ 𝑏2𝑥2+ ⋯ + 𝑏𝑛𝑥𝑛+ 𝑒

𝑦̂ = nilai ramalan variabel terikat dari pengamatan ke-i 𝑖

𝑅𝑘2 adalah ukuran statistika tentang seberapa dekat data cocok ke garis regresi.

Batas tolerance value adalah 0,10 dan batas VIF adalah 10.

Dengan

𝑇𝑜𝑙𝑒𝑟𝑎𝑛𝑐𝑒 𝑣𝑎𝑙𝑢𝑒 < 0,10 atau VIF > 10 = terjadi multikolinieritas 𝑇𝑜𝑙𝑒𝑟𝑎𝑛𝑐𝑒 𝑣𝑎𝑙𝑢𝑒 < 0,10 atau VIF < 10 = tidak terjadi multikolinieritas.

2.4 Keluarga Distribusi Eksponensial

Menurut Mc Cullagh dan Nelder (1983), suatu fungsi probabilitas yang tergantung pada suatu parameter 𝜃 dari suatu variabel random 𝑌 dikatakan termasuk dalam keluarga distribusi eksponensial apabila dapat dituliskan sebagai

𝑃(𝑦; 𝜃) = exp [𝑦𝜃 − 𝑏(𝜃)

𝑎(𝜙) + 𝑐(𝑦; 𝜙)] (2.16) dengan 𝜃 adalah parameter kanomik dan 𝜙 adalah parameter dispersi. Harga harapan

dan variansi dari distribusi keluarga eksponensial dengan rumus 𝐸(𝑋) = 𝑏(𝜃) dan 𝑉𝑎𝑟(𝑌) = 𝑏′′(𝜃)𝑎(𝜙). Salah satu anggota keluarga distribusi eksponensial adalah distribusi poisson.

2.5 Distribusi Poisson

Distribusi Poisson merupakan suatu distribusi untuk peristiwa yang probabilitas kejadiannya kecil, dimana kejadian tergantung pada selang waktu tertentu atau di

(28)

suatu daerah tertentu dengan hasil pengamatan berupa variabel diskrit dan antar variabel prediktor saling independen. Selang waktu tersebut dapat berupa berapa saja panjangnya, misalnya semenit, sehari, seminggu, sebulan, bahkan setahun. Daerah tertentu yang dimaksudkan dapat berupa suatu garis , suatu luasan, suatu volume, atau mungkin sepotong bulan (Walpole, 1995).

Distribusi Poisson memiliki ciri – ciri sebagai berikut:

1. Banyaknya percobaan yang terjadi dalam suatu selang waktu atau daerah tertentu, tidak tergantung pada banyaknya hasil percobaan yang terjadi pada selang waktu atau daerah lain yang terpisah.

2. Peluang terjadinya satu hasil percobaan selam suatu selang waktu yang singkat sekali atau dalam suatu daerah yang kecil. Sebanding dengan panjang selang waktu tersebut atau besarnya daerah tersebut dan tidak bergantung pada banyak hasil percobaan yang terjadi diluar selang waktu dann daerah tertentu.

3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat tersebut atau dalam daerah yang kecil tersebut dapat diabaikan.

Cameron dan Trivedi (1998) menyatakan bahwa distribusi sering digunakan untuk untuk memodelkan jumlah kemunculan dari suatu kejadian. Jika variabel random diskrit 𝑌 berdistribusi Poisson dengan parameter 𝜇 > 0 maka variabel random 𝑌 mempunyai fungsi densitas probabilitas.

𝑃(𝑌 = 𝑦; 𝜇) =𝑒−𝜇𝜇𝑦

𝑦! ; 𝑦𝑖 = 0,1,2, … (2.17) Keterangan :

𝑦 = Banyaknya hasil percobaan yang terjadi selama suatu selang waktu atau tertentu.

𝜇 = Rata – rata banyaknya hasil percobaan yang terjadi selama selang waktu atau dalam daerah yang diberikan

𝑒 = Merupakan sebuah bilangan konstan yang jika dihitung dengan pembulatan empat desimal sama dengan 2,7183

(29)

Distribusi Poisson termasuk dalam keluarga distribusi eksponensial, hal ini ditunjukkan dengan membawa persamaan (2.16) ke persamaan (2.17)

𝑃(𝑦; 𝜇) =𝑒−𝜇𝜇𝑦

𝑦! = exp[𝑦 log 𝜇 + (−𝜇) − log 𝑦!] = exp ([𝑦 log 𝜇−𝜇]

1 − log 𝑦!) dengan 𝜃 = log 𝜇 , 𝑎(𝜙) = 1, 𝑏(𝜃) = exp(𝜃) = 𝜇 dan 𝑐(𝑦; 𝜙) = − log 𝑦!

Karena distribusi Poisson merupakan anggota distribuis keluarga eksponensial, maka dapat ditentukan nilai mean dan variansi yaitu:

𝐸(𝑦) = 𝑏(𝜃) = exp(𝜃) = 𝜇

𝑉𝑎𝑟(𝑦) = 𝜎2 = 𝑏′′𝑎(𝜙) = exp(𝜃) = 𝜇

sehingga pada distribusi Poisson berlaku:

𝐸(𝑦) = 𝑉𝑎𝑟(𝑦) = 𝜇

Distribusi Poisson merupakan distribusi diskrit. Untuk nilai 𝜇 yang besar akan lebih mendekati dsitribusi normal. Untuk kasus yang jarang terjadi maka nilai 𝜇 akan kecil. Distribusi Poisson adalah suatu distribusi yang paling sederhana dalam pemodelan data yang berupa data cacah, tetapi bukan satu – satunya.

2.6 Model Regresi Poisson

Menurut Safrida, Ispriyanti, dan Widiharih (2013) regresi Poisson merupakan salah satu regresi nonlinear yang sering digunakan untuk memodelkan hubungan antara variabel respon yang berupa data diskrit dengan variabel prediktor yang berupa data diskrit dengan variabel prediktor yang berupa data diskrit atau kontinu.

Regresi Poisson merupakan penerapan dari Generalized Linear Model (GLM).

Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk variabel respon yang memiliki sebaran eksponensial. Regresi Poisson digunakan untuk menganalisis data count ( berjenis diskrit atau data membilang).

(30)

Pada regresi Poisson diasumsiakn variabel respon (𝑌) berdistribusi Poisson dan tidak terjadi multikolinearitas diantara masing – masing variabel prediktor (𝑋).

Dalam regresi Poisson terdapat asumsi yang harus dipenuhi yaitu variabel respon (𝑌) diskrit dan asumsi equidispersi. Equidispersi yaitu nilai rata –rata sama dengan nilai varian atau (𝑌|𝑥) = 𝐸(𝑌|𝑥) = 𝜆. Regresi Poisson ada dua tipe yaitu regresi Poisson sederhana dan regresi Poisson berganda.

Regresi Poisson merupakan model regresi non-linear yang sering digunakan untuk menganalisis suatu data diskrit. Regresi Poisson mengacu pada penggunaan distribusi Poisson (Myers, 1990). Pada regresi Poisson terdapat asumsi, yaitu variabel respon (Y) berdistribusi Poisson dan tidak terjadi multikoliniearitas di antara variabel prediktor (X) (Hinde dalam Astuti, 2013).

Regresi Poisson merupakan salah satu penerapan dari Generalized Linear Model (GLM) yang menggambarkan hubungan antara variabel terikat 𝑌 berupa data diskrit atau data cacahan (count data) dengan variabel bebas berupa data diskrit, kontinu, kategorik atau campuran. Jika variabel terikat 𝑌 merupakan data diskrit yang berdistribusi Poisson dengan parameter 𝜇𝑖 > 0, dengan 𝜇𝑖 merupakan rata – rata dari variabel terikat 𝑌, maka fungsi masa peluangnya adalah (Aziz dan Jemain, 2007) [4]:

𝑓(𝑦𝑖; 𝜇𝑖) =𝑒−𝜇𝑖𝜇𝑦𝑖

𝑦𝑖! 𝑦𝑖 = 0,1,2, … , 𝑛 (2.18) Regresi Generalized Poisson merupakan suatu model regresi yang digunakan untuk menganalisis hubungan antara sebuah variabel terikat yang berupa data cacah dengan satu atau lebih variabel bebas. Fungsi masa peluangnya adalah ( Aziz dan Jemain, 2007)[4]:

𝑓(𝑦𝑖; 𝜇, 𝛼) = ( 𝜇𝑖

1 + 𝛼𝜇𝑖)𝑦𝑖(1 + 𝛼𝑦𝑖)𝑦𝑖−1

𝑦𝑖! exp (𝜇𝑖(1 + 𝛼𝑦𝑖)

1 + 𝛼𝜇𝑖 ) (2.19) Model regresi Poisson adalah model regresi nonlinear yang berasal dari distribusi poisson yang merupakan penerapan dari GLM yang menggambarkan hubungan antar variabel dependen dengan variabel independen, dengan variabel dependen berupa data diskrit / count dengan asumsi 𝐸(𝑦𝑖 = 𝑣𝑎𝑟(𝑦𝑖) = 𝜇𝑖 atau disebut equidispersi (Agresti, 2002).

Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya

(31)

merupakan fungsi dari nilai harapannya. Agresti (2002) menyatakan ada tiga komponen dalam GLM yaitu:

1. Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya.

2. Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan.

3. Link function (fungsi penghubung) ditunjukkan dengan fungsi nilai harapannya sama dengan komponen sistematiknya.

Asumsi multikolinearitas dalam penelitian ini dilihat dari nilai korelasi antar peubah penjelas. Jika nilai korelasinya lemah (𝑟 < 0.5) maka dianggap tidak ada masalah multikolinearitas. Pada GLM terdapat sebuah fungsi yang linear dan menghubungkan nilai tengah peubah respon dengan sebuah peubah penjelas yaitu:

𝑔(𝜇𝑖) = 𝜂𝑖 = 𝑥𝑖𝑇𝛽

𝑔(𝜇𝑖) = 𝜂𝑖 = (𝛽0 + 𝛽1𝑋𝑖1+ ⋯ + 𝛽𝑝𝑋𝑖𝑝+ 𝜀𝑖) (2.20) Fungsi disebut fungsi penghubung (link function). Hubungan antara nilai tengah dengan peubah penjelas linear adalah:

𝜇𝑖 = 𝑔−1(𝜂𝑖) = 𝑔−1(𝑥𝑖𝑇𝛽) (2.21) Terdapat dua fungsi penghubung yang biasa digunakan dalam regresi Poisson.

Pertama adalah penghubung identitas (identity link). Kedua adalah penghubung log (log link). Fungsi penghubung log bebrbentuk:

𝑔(𝜇𝑖) = 𝜇𝑖 = 𝑥𝑖𝑇𝛽 (2.22)

Dan fungsi penghubung log berbentuk:

𝑔(𝜇𝑖) = ln(𝜇𝑖) = 𝑥𝑖𝑇𝛽 (2.23) Fungsi penghubung log adalah fungsi yang lebih cocok digunakan karena fungsi log menjamin bahwa nilai peuabah yang diharapkan dari peubah responnya akan bernilai non negatif. Sehingga fungsi penghubung yang digunakan dalam penelitian ini adalah fungsi penghubung log. Hubungan antara nilai tengah peubah respon dengan peubah penjelas linear adalah sebagai berikut:

ln(𝜇𝑖) = 𝑥𝑖𝑇𝛽 𝑒ln(𝜇𝑖)= 𝑥𝑖𝑇𝛽

𝜇𝑖 = 𝑥𝑖𝑇𝛽 (2.24) Sehingga model regresi Poisson berganda dapat ditiliskan sebagai berikut:

(32)

ln(𝜇𝑖) = (𝛽0 + 𝛽1𝑋𝑖1+ ⋯ + 𝛽𝑝𝑋𝑖𝑝+ 𝜀𝑖) (2.25) 𝜇𝑖 = 𝑒𝛽0+𝛽1𝑋𝑖1+⋯+𝛽𝑝𝑋𝑖𝑝+𝜀𝑖

dimana:

𝜇𝑖 = adalah nilai ekspektasi dari 𝑦𝑖 yang berdistribusi Binomial Negatif 𝛽0 = adalah nilai konstanta

𝛽1𝑋1 = adalah nilai variabel independen ke-i 𝛽𝑝𝑋𝑖𝑝 = adalah nilai koefisien variabel independen

Dengan 𝑥𝑖𝑝 merupakan peubah penjelas ke-p pada pengamatan ke-i dan 𝑖 = 1,2, … , 𝑛 dan adalah nilai tengah banyaknya kejadian (Camaron dan Trivedi 1998).

2.7 Pengujian Kesesuaian Regresi Poisson

Pengujian kesesuaian model dengan menggunakan goodness of fit disebut devians (Kleinbaum et al, 1998). Analisis deviance merupakan salah satu analisis yang digunakan dalam analisis regresi pada pembentukan suatu model deviance dapat diartikan sebagai logaritma dari uji likelihoodnya yaitu:

𝐷 = −2 log [𝐿(𝑦;𝜇)

𝐿(𝑦;𝑦)]

= 2(log 𝐿(𝑦; 𝑦) − log 𝐿(𝑦; 𝜇) (2.26) dimana:

𝐷 = adalah statistik uji atau deviance untuk model regresi Poisson

𝐿(𝑦; 𝜇) = adalah fungsi likelihood current model untuk model lengkap dengan melibatkan variabel prediktor

𝐿(𝑦; 𝑦) = adalah fungsi likelihood saturated model dari dsitribusi poisson untuk model sederhana tanpa melibatkan variabel prediktor

Adapun fungsi log-likelihood current model dituliskan sebagai berikut:

𝑙(𝜇; 𝑦) = log 𝐿 (𝜇; 𝑦) = log ∏ 𝜇𝑖𝑦𝑖𝑒−𝜇𝑖

𝑦𝑖! 𝑛𝑖=1

= ∑𝑛𝑖=1(𝑦𝑖log 𝜇𝑖− 𝜇𝑖− log 𝑦𝑖!) (2.27)

(33)

Sedangkan untuk saturated model, dimana nilai –nilai 𝜇𝑖 diganti dengan nilai 𝑦𝑖 (tanpa asumsi tentang keeratan hubungannya dengan variabel 𝑥 nya), fungsi saturated modelnya yaitu:

𝐿(𝑦; 𝑦) = ∏𝑛𝑖=1𝑓(𝑦𝑖; 𝑦𝑖) = ∏ 𝑦𝑖𝑦𝑖𝑒−𝑦𝑖

𝑦𝑖! 𝑛𝑖=1

Sehingga fungsi log-likelihood saturated modelnya menjadi 𝑙(𝜇; 𝑦) = log 𝐿 (𝑦; 𝑦)

= log ∏ 𝑦𝑖𝑦𝑖𝑒−𝑦𝑖

𝑦𝑖! 𝑛𝑖=1

= ∑𝑛𝑖=1(𝑦𝑖log 𝑦𝑖 − 𝑦𝑖 − log 𝑦𝑖!) (2.28) Sehingga Deviance dapat diperoleh dengan mensubsitusikn (2.27) dan (2.28) ke dalam (2.26)

𝐷 = 2 {∑(𝑦𝑖log 𝑦𝑖 − 𝑦𝑖 − log 𝑦𝑖! ) − ∑(𝑦𝑖log 𝜇𝑖 − 𝜇𝑖 − log 𝑦𝑖!)

𝑛

𝑖=1 𝑛

𝑖=1

} = 2 ∑ {𝑦𝑖log𝑦𝑖

𝜇𝑖− (𝑦𝑖 − 𝜇𝑖)}

𝑛𝑖=1 (2.29)

dimana 𝑦𝑖 merupakan nilai aktual amatan ke-i dengan variabel terikat dan 𝜇𝑖 merupakan nilai dugaan variabel teriakt untuk amatan ke-i. Untuk model yang sesuai, deviance mendekati distribusi Chi-Kuadrat dengan derajat kebebasan = (𝑛 − 𝑘 − 1), dimana 𝑛 adalah banyak pengamatan dan 𝑘 + 1 adalah banyak parameter. kriteria untuk pengujian ini adalah toalk 𝐻0 pada taraf signifikan 𝛼, jika 𝐷 > 𝜒2(𝑛−𝑘−1),𝛼.

2.8 Overdispersion

Rini. C (2014) menyatakan model regresi Poisson mensyaratkan equidispersi, yaitu kondisi di mana nilai mean dan variansinya dari variabel terikat bernilai sama.

Namun, adakalanya terjadi overdispersion berarti varians lebih besar daripada mean.

Hal ini mengindasikan bahwa model regresi Poisson tidak cocok untuk data tersebut.

Fenomena overdispersion oleh McCullagh dan Nelder (1989) dinyatakan dengan 𝑉𝑎𝑟(𝑌) > 𝐸(𝑌)

(34)

Adanya overdispersion dapat diketahui melalui rasio antara devians dengan derajat bebasnya. Jika rasio ini menghasilkan nilai yang lebih besar dari satu, maka model dua cara untuk mendeteksi overdispersion yaitu:

1. Deviance

𝜃1 = 𝐷

𝑑𝑏 > 1; 𝐷 = 2 ∑ {𝑦𝑖log𝑦𝑖 𝜇𝑖}

𝑛

𝑖=1

(2.30)

2. Pearson Chi-Square

𝜃2 = 𝑥2

𝑑𝑏 > 1; 𝑥2 = ∑(𝑦𝑖 − 𝜇𝑖)2 𝜎𝑖

𝑛

𝑖=1

(2.31)

dimana:

𝑦𝑖 = nilai peubah dari pengamatan ke-i 𝜇𝑖 = penduga bagi respon rata – rata ke-i 𝜎𝑖 = penduga bagi respon ke-i

𝑑𝑏 = 𝑛 − 𝑘 − 1

𝑘 = banyaknya parameter termasuk konstanta 𝑛 = banyaknya pengamatan

Jika 𝜃1 dan 𝜃2 bernilai lebih dari 1 terjadi overdispersion data.

2.9 Distribusi Binomial Negatif

Percobaan Bernoulli bebas yang diulang menghasilkan peluang sukses p sedangkan gagal menghasilkan peluang 𝑞 = 1 − 𝑝, misalkan 𝑥 menyatakan banyaknya percobaan yang diperlukan untuk memperoleh 𝑘 sukses. Distribusi peubah acak 𝑥 merupakan distribusi Binomial Negatif yang diberikan oleh: (Walpole & Myers, 1995)

𝑥~𝑁𝐵(𝑥; 𝑘; 𝑝) = (𝑥 − 1

𝑘 − 1) 𝑝𝑘𝑞𝑥−𝑘, 𝑥 = 𝑘, 𝑘 + 2, … (2.32)

(35)

Model regresi Binomial Negatif mempunyai fungsi massa peluang sebagai berikut:

𝑃(𝑦, 𝜇; 𝑘) =𝑟 (𝑦 +1 𝑘) 𝑟 (1

𝑘) 𝑦!

( 1

1 + 𝑘𝜇)1𝑘( 𝑘𝜇 1 + 𝑘𝜇)𝑦

(2.33)

Dengan:

𝑦 = variabel dependen bernilai diskrit yaitu 𝑜, 1,2, … 𝑘 = derajat overdispersi

𝜇 = parameter

Γ(𝑛) = (𝑛 − 1)! (2.34)

2.10 Regresi Binomial Negatif

Model Regresi Binomial Negatif adalah model non-linear yang berasal dari distribusi poisson–gamma mixture yang merupakan penerapan dari GLM yang menggambarkan hubungan antar variabel dependen dengan variabel independen.

Regresi Binomial Negatif biasanaya digunakan untuk memodelakn data dengan variabel respon berupa data count. Regresi Binomail Negatif digunakan sebagai alternatif dari model regresi poisson yang mengalami overdispersi (𝑣𝑎𝑟 > 𝑚𝑒𝑎𝑛) (Ma’sum, 2013).

Misalkan 𝑦𝑖 adalah nilai dari peuabah respon untuk pengamatan ke-i dan 𝑥𝑖 adalah vektor dari nilai peubah penjelas untuk pengamatan ke-i dengan 𝑖 = 1,2, … , 𝑛.

Model regresi binomial negatif mengasumsikan bahwa peubah respon ke-i mengikuti sebaran binomial negatif. Model regresi binomial negatif berganda dapat dituliskan sebagai berikut:

ln(𝜇𝑖) = 𝛽0+ 𝛽1𝑋𝑖1+ ⋯ + 𝛽𝑘𝑋𝑖𝑘+ 𝜀𝑖 𝜇𝑖 = 𝑒𝛽0+𝛽1𝑋𝑖1+⋯+𝛽𝑘𝑋𝑖𝑘+𝜀𝑖 (2.35)

dimana:

𝜇𝑖 = adalah nilai ekspektasi dari 𝑦𝑖 yang berdistribusi Binomial Negatif 𝛽0 = adalah nilai konstanta

𝛽1𝑋1 = adalah nilai variabel independen ke-i

(36)

𝛽𝑝𝑋𝑖𝑘 = adalah nilai koefisien variabel independen.

Untuk Estimasi parameter dan pengujian model regresi binomial negatif dapat dilakukan dengan menggunakan Uji Overal dan Uji Parsial.

Dimana Uji overall untuk melihat secara serentak pengaruh variabel independen terhadap variabel dependen dan dapat digunakan sebagai uji kelayakan model regresi binomial negatif.

a. Menentukan Hipotesis dimana

𝐻0: 𝛽1 = ⋯ = 𝛽5 = 0 ( tidak ada variabel inpenden berpengaruh terhadap variabel dependen)

𝐻1: Paling sedikit ada satu 𝑗 dengan 𝛽𝑗 ≠ 0, 𝑗 = 1,2, … , 𝑝 ( paling sedikit ada satu variabel inpenden yang berpengaruh terhadap varibel independen)

b. Tingkat signifikansi 𝛼 = 0.05

c. Statisitik Uji

𝐺 = −2 log𝐿0

𝐿1

= −2(log 𝐿0− log 𝐿1)

= −2(log 𝐿0− log 𝐿1) (2.36) Dengan:

𝐿0 = Likelihood tanpa variabel independen 𝐿1 = Likelihood dengan variabel independen

Statistik uji 𝐺 mengikuti distribusi chi-square sehingga di banfingkan dengan table chi-square dengan derajat bebas 𝑑𝑏 ( banyaknya variabel), dengan daerah penolakan 𝐻0 jika 𝐺 > 𝜒2(𝑎,𝑑𝑏=5) atau berdasarkan nilai 𝑝 − 𝑣𝑎𝑙𝑢𝑒 yang di bandingkan dengan nilai 𝛼, dengan daerah penolakan 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼 = 0,05.

Uji Parsial digunakan untuk melihat pengaruh variabel independen terhadap variabel dependen secara individu.

a. Menentukan Hipotesis

(37)

Dimana

𝐻0: 𝛽𝑗 = 0 (variabel inpenden tidak berpengaruh terhadap variabel dependen) dimana

𝐻0: 𝛽1 ≠ 0 variabel independen terhadap variabel independen

b. Menentukan Hipotesis 𝛼 = 0.05

c. Statistik Uji

𝑊 = ( 𝛽𝑗 𝑆𝐸𝐵𝑗)

2

(2.37) dengan:

𝑊 = Bobot nilai

𝛽𝑗 = Nilai dugaan untuk parameter 𝛽𝑗 𝑆𝐸𝐵𝑗 = Dugaan galat baku untuk koefisien 𝛽𝑗

Dimana Nilai uji 𝑊 mengikuti distribusi Chi-Square sehingga di bandingkan dengan chi-square tabel 𝜒2(𝑎,𝑑𝑏=1). Maka kriteria uji untuk pengambilan keputusan dengan taraf nayata (𝛼) adalah tolak 𝐻0 jika nilai 𝑊 > 𝜒2(𝑎,𝑑𝑏=1), dan maka dapat di lihat berdasarkan 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼, dimana nilai 𝛼 = 0,05.

Untuk memeriksaan kesesuaian model regresi binomial negatif atau disebut juga goodness of fit dapat diketahui dari nilai devians dan pearson chi-square yang dibagi dengan derajat bebasnya. Jika nilai devians dan pearson-square yang telah dibagi dengan derajat beabsnya menunjukkan nilai yang mendekati 1 maka model di katakan sesuai. Suatu model dengan nilai devians dan pearson chi-square merupakan model terbaik dan lebih sesuai untuk menggambarkan pola hubungan antara variabel dependendengan variabel independennya (prediktor)

(38)

BAB 3

METODOLOGI PENELITIAN

3.1 Sumber Data

Data yang digunakan dalam penelitian ini adalah data sekunder. Data yang digunakan diperoleh dari publikasi Kabupaten Deli Serdang Dalam Angka tahun 2018 oleh Badan Pusat Statistika Provinsi Sumatera Utara. Data yang digunakan adalah data untuk masing-masing 22 kecamatan di Kabupaten Deli Serdang.

3.2 Waktu dan Tempat Penelitian

Penelitian ini dilaksanakan di Badan Pusat Statistika Provinsi Sumatera Utara.

Tempat penelitian ini bertempat di Jl. Asrama No.179 Medan. Waktu pengambilan data dilakukan pada bulan Januari 2017 – Desember 2017.

3.3 Waktu dan Tempat Penelitian

Data yang akan digunakan untuk penelitian ini merupakan data sekunder yang diperoleh dari instansi pemerintah, yaitu Badan Pusat Statistik Provinsi Sumatera Utara pada tahun 2018. Data hasil pengamatan penelitian terhadap kasus DBD di Kabupaten Deli Serdang tahun 2018 dan faktor – faktornya. Data yang diperoleh di Tabel 3.1 akan diolah dengan metode regresi poisson.

Tabel 3.1 Data Variabel Prediktor dan Variabel Respon

NO Nama Kecamatan

Y 𝑋1 𝑋2 𝑋3 𝑋4 𝑋5

1 Gunung Meriah 0 40 20 29 1131 31

2 STM Hulu 0 65 43 49 442 214

3 Sibolangit 0 131 78 78 883 203

4 Kutalimbaru 23 243 77 40 251 682 5 Pancur Batu 32 819 121 92 94 398 6 Namo Rambe 42 693 69 68 110 332

7 Biru-Biru 3 450 71 47 170 329

8 STM Hilir 16 191 60 45 153 559

9 Bangun Purba 49 197 76 34 120 475

10 Galang 60 486 108 59 65 406

Referensi

Dokumen terkait

Saya mengucapkan terima kasih yang sebesar-besarnya atas dukungan perusahaan selama ini kepada saya; sekaligus permintaan maaf atas kesalahan atau kekurangan yang

Monoetilen Glycol, dihasilkan dari reaksi etilen oksida dengan air, merupakan agen antibeku yang digunakan pada mesin-mesin, Juga digunakan untuk bahan baku

Program Pascasarjana UIN Antasari Banjarmasin, 2019, Pembimbing (I) Dr. Sessi Rewetty Revilla, M.M.Pd. Kata Kunci : Implementasi, Supervisi, Supervisor, dan TK/TP Al-Qur’an. Supervisi

Limit switch, real time clock (RTC DS 1307) dan keypad menjadi masukan ATMEGA 8535 yang digunakan sebagai timer dengan waktu yang sudah ditentukan oleh data

Berdasarkan pendapat para ahli di atas, dapat disimpulkan bahwa aktivitas belajar ialah kegiatan-kegiatan aktif yang dilakukan siswa yang bersifat fisik dan

Menurut Bernard(2005, p315) system data flow diagram yang lebih dikenal sebagai diagram aliran data yang dimaksudkan untuk menunjukkan proses dalam suatu sistem

Langkah tersebut secara normatif dilatarbelakangi oleh ketentuan Pasal 76 Undang-undang Nomor 33 Tahun 2004 tentang Perimbangan Keuangan antara Pemerintah Pusat dan

Peran kendang batangan pada pertunjukan karawitan mandiri adalah sebagai penghias irama, karena berdasarkan pertunjukanya karawitan mandiri dapat mampu menentuukan