APLIKASI MODEL GEOGRAPHICALLY WEIGHTED REGRESSION (GWR)
UNTUK MENENTUKAN FAKTOR-FAKTOR YANG MEMPENGARUHI
KASUS GIZI BURUK ANAK BALITA DI JAWA BARAT
SKRIPSI
Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Sarjana Sains
Program Studi Matematika Konsentrasi Statistika
Oleh
ATIYA MAULANI 0905645
JURUSAN PENDIDIKAN MATEMATIKA
FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA
APLIKASI
MODEL
GEOGRAPHICALLY WEIGHTED REGRESSION
(GWR)
UNTUK MENENTUKAN FAKTOR-FAKTOR YANG MEMPENGARUHI
KASUS GIZI BURUK ANAK BALITA DI JAWA BARAT
Oleh Atiya Maulani
Sebuah skripsi yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana pada Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam
© Atiya Maulani 2013 Universitas Pendidikan Indonesia
Juli 2013
Hak Cipta dilindungi undang-undang.
ABSTRAK
Model regresi linear klasik atau Ordinary Linear Regression (OLR) merupakan bentuk regresi yang umum digunakan untuk menyatakan bentuk hubungan antara variabel respon dengan variabel prediktornya. Regresi linear klasik mengasumsikan bahwa nilai taksiran parameter regresi akan bernilai sama untuk setiap lokasi pengamatan atau berlaku secara global. Model Geographically Weighted Regression (GWR) adalah bentuk lokal dari regresi linear klasik yang memperhatikan aspek spasial atau lokasi geografis yang berupa koordinat titik �, � . Dalam GWR, nilai taksiran parameter regresi yang diperoleh untuk setiap lokasi pengamatan akan berbeda-beda. Penelitian ini bertujuan untuk mengatahui faktor-faktor yang mempengaruhi kasus gizi buruk anak balita di Jawa Barat dengan menggunakan GWR. Hasil pengujian terhadap model regresi linear berganda menunjukkan bahwa asumsi homogenitas varians tidak terpenuhi atau terjadi heterogenitas spasial, dan model regresi linear berganda yang diperoleh tidak berarti secara signifikan. Sehingga, analisis dilanjutkan dengan menggunakan GWR dengan pembobot fixed Kernel Gaussian dan GWR dengan pembobot adaptive Kernel Gaussian. Berdasarkan nilai 2 dan jumlah kuadrat residual , model GWR dengan pembobot adaptive Kernel Gaussian lebih cocok digunakan untuk memodelkan kasus gizi buruk anak balita di Jawa Barat. Model GWR dengan pembobot adaptive Kernel Gaussian, menghasilkan 2 paling besar dibandingkan model regresi linear berganda dan model GWR dengan pembobot fixed Kernel Gaussian, yaitu 0,8994658 atau 89,95 %, dan yang paling kecil, yaitu 0,2555239. Faktor geografis juga berpengaruh terhadap kasus gizi buruk anak balita di Jawa Barat sehingga akan diperoleh model GWR berbeda-beda untuk setiap kota/kabupaten di Jawa Barat. Adapun faktor-faktor lokal yang mempengaruhi kasus gizi buruk anak balita di Jawa Barat secara signifikan adalah kasus bayi dengan berat badan lahir rendah (BBLR), anak balita mendapat vitamin A, sarana kesehatan, bayi yang diberi ASI ekslusif, penduduk miskin, dan usia perkawinan pertama ≤ 15 tahun.
ABSTRACT
Ordinary Linear Regression (OLR) model is a regression that used to indicate the relationship between the response variable with the predictor variable. Classical linear regression assumes that the value of the regression parameter estimates will have the same value for each observation or apply globally. Geographically Weighted Regression (GWR) model is the local form of the classical linear regression model that takes into account aspects of the spatial or geographic coordinates of a point �, � . In GWR, the estimated value of the regression parameters will vary for each location. This study aims to know the factors that affect toddler malnutrition cases in West Java by using GWR. The test results of the multiple linear regression model showed that the assumption of variance homogeneity is not significant or there is spatial heterogeneity, and multiple linear regression model were not significant. Thus, the analysis continued using a GWR with weighted fixed Kernel Gaussian and GWR with adaptive weighted Kernel Gaussian. Based on the value of coefficient determination 2 and sum of squared residuals, GWR models with adaptive weighted Kernel Gaussian is more suitable for modeling the toddler malnutrition in West Java. GWR models with adaptive weighted kernel Gaussian has an 2 value that greater than the multiple linear regression model and GWR model with fixed weighting kernel Gaussian, that is 0,8994658 or 89,95%, and JK (S) is the smallest, 0,2555239. Geographical factors also affect the cases of toddler malnutrition in West Java that would be obtained GWR models vary according to each city/district in West Java. The local factors affecting toddler malnutrition in West Java is the case of infants with low birth weight (LBW), infants received vitamin A, health facilities, exclusively breast-fed babies, poverty, and the age of first marriage ≤ 15 years.
DAFTAR ISI
Halaman
LEMBAR PERNYATAAN ... iii
KATA PENGANTAR ...v
UCAPAN TERIMA KASIH ... vi
ABSTRAK ... vii
ABSTRACT ... viii
DAFTAR ISI ... ix
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiii
DAFTAR LAMPIRAN ... xiv
BAB IPENDAHULUAN ...1
1.1 Latar Belakang Masalah ...1
1.2 Rumusan Masalah ...3
1.3 Batasan Masalah ...3
1.4 Tujuan Penulisan ...4
1.5 Manfaat Penulisan ...4
1.6 Sistematika Penulisan ...5
BAB IIKAJIAN PUSTAKA ...6
2.1 Analisis Regresi ...6
2.2 Regresi Linear Sederhana ...7
2.2.1 Penaksiran Koefisien Regresi Linear Sederhana ...7
2.2.2 Uji Linearitas dan Uji Keberartian Model Regresi Linear Sederhana ...10
2.3 Regresi Linear Berganda ...12
2.3.3 Uji Keberartian Model Regresi Linear Berganda ...21
2.4 Koefisien Determinasi ...22
2.5 Status Gizi Anak Balita ...23
BAB IIIGEOGRAPHICALLY WEIGHTED REGRESSION (GWR) ...26
3.1 Data Spasial ...26
3.2 Geographically Weighted Regression (GWR) ...27
3.2.1 Penkasiran Koefisien Regresi GWR ...28
3.2.2 Pembobot Model GWR ...31
3.2.3 Bandwith pada GWR ...34
3.3 Uji Keberartian Model GWR...35
3.4 Uji Keberartian Koefisien GWR ...37
3.5 Koefisien Determinasi Lokal ...38
3.6 Langkah-Langkah Analisis ...39
BAB IVSTUDI KASUS ...41
4.1 Deskripsi Data ...41
4.2 Variabel-Variabel Penelitian dan Deskripsi Operasional ...41
4.3 Hasil dan Pembahasan ...45
4.3.1 Regresi Linear Berganda ...48
4.3.1.1 Penaskiran Koefisien Regresi ...48
4.3.1.2 Uji Asumsi Residual ...49
4.3.1.3 Uji Keberartian Model Regresi Linear Berganda ...53
4.3.2 Geographically Weighted Regression (GWR) ...54
4.3.2.1 Perbandingan Nilai dan ...55
4.3.2.2 Bandwidth GWR...57
4.3.2.3 Penaksiran Koefisien GWR ...59
4.3.2.4 Uji Keberartian Model GWR ...62
BAB VPENUTUP ...69
5.1 Kesimpulan ...69
5.2 Saran ...70
DAFTAR PUSTAKA ...71
LAMPIRAN-LAMPIRAN ...73
DAFTAR TABEL
Tabel Halaman
2.1 Analisis Varians (ANOVA) Regresi Linear Sederhana ... 11
2.2 Data Hasil Pengamatan dari Responden ... 13
2.3 Klasifikasi Status Gizi Anak Balita Berdasarkan Indeks BB/U ... 24
4.1 Statistika Deskriptif Kasus Gizi Buruk Anak Balita di Jawa Barat ... 46
4.2 Nilai Taksiran Koefisien Regresi ... 49
4.3 Coefficientsa ... 50
4.4 Model Summaryb ... 51
4.5 Uji Normalitas ... 52
4.6 ANOVAa ... 53
4.7 Perbandingan Nilai dan ... 55
4.8 Bandwidth Model GWR dengan Pembobot Adaptive Kernel Gaussian ... 57
4.9 Nilai Minimum dan Nilai Maksimum Penakasir Parameter Model GWR ... 59
4.10 ANOVA ... 63
4.11 Uji t ... 64
DAFTAR GAMBAR
Gambar Halaman
3.1 Kernel Spasial ... 32
3.2 GWR dengan Kernel Tetap ... 33
3.3 GWR dengan Kernel Adaptif ... 34
4.1 Scatterplot Gizi Buruk ... 50
DAFTAR LAMPIRAN
Lampiran Halaman
1 Bukti Persamaan (3.10) ... 74
2 Data Persentase Kasus Gizi Buruk Anak Balita di Jawa Barat dan Faktor-Faktor yang Mempengaruhinya ... 76
3 Koordinat Lokasi Kota/Kabupaten di Jawa Barat ... 79
4 Matriks Jarak Kota/Kabupaten di Jawa Barat ... 80
5 Matriks Pembobot Kota/Kabupaten di Jawa Barat ... 89
6 Penaksir Parameter setiap Kota/Kabupaten di Jawa Barat ... 95
7 Output Software R ... 101
8 Tabel Distribusi F ... 111
9 Tabel Distribusi t ... 118
10 Tabel Durbin Watson ... 120
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Dalam kehidupan sehari-hari, tidak jarang dihadapkan pada berbagai
masalah yang berkaitan dengan dua atau lebih variabel dalam suatu bentuk
hubungan tertentu yang dinyatakan dalam sebuah persamaan matematik. Bentuk
hubungan antara variabel-variabel tersebut dikenal sebagai regresi (Sudjana,
2005). Terdapat dua jenis variabel dalam analisis regresi, yaitu variabel respon
atau variabel tak bebas ( ) dan variabel prediktor atau variabel bebas ( ).
Variabel respon adalah suatu variabel yang bergantung pada variabel prediktor.
Untuk mempelajari bentuk hubungan antara variabel respon dengan variabel
prediktor tersebut biasanya digunakan analisis regresi klasik atau Ordinary Linear
Regression (OLR).
Hasil dari analisis regresi klasik berupa persamaan yang menghubungkan
variabel respon dengan variabel prediktor. Analisis regresi klasik mengasumsikan
bahwa nilai taksiran dari parameter regresi akan bernilai sama untuk setiap lokasi
pengamatan atau berlaku secara global. Dalam analisis regresi klasik sendiri,
terdapat beberapa asumsi yang harus dipenuhi. Asumsi tersebut dinamakan
asumsi klasik, yaitu normalitas, linearitas, tidak terjadi autokorelasi, tidak terdapat
multikolinearitas, dan homoskedastisitas. Namun, apabila analisis regresi klasik
ini diterapkan untuk memodelkan data yang dipengaruhi oleh aspek spasial atau
kondisi geografis lokasi pengamatan, maka ada beberapa asumsi yang sulit
dipenuhi. Berdasarkan keragaman data yang dimiliki oleh data spasial, maka
asusmsi linearitas dalam model regresi linear klasik akan sulit dipenuhi. Selain itu,
asumsi yang sulit dipenuhi lainnya apabila data spasial dimodelkan dalam model
regresi linear klasik adalah asumsi residual yang harus identik atau
homoskedastistitas. Sehingga, apabila asumsi ini tidak dipenuhi maka akan
2
Salah satu masalah yang memperhatikan aspek spasial (faktor geografis)
adalah kasus gizi buruk pada anak balita. Permasalahan gizi buruk pada anak
balita tidak hanya dipandang dari sisi kesehatan saja, namun perlu ditinjau dari
aspek lain seperti aspek sosial, ekonomi, budaya, dan keadaan lingkungan tempat
tinggal anak balita. Kasus gizi buruk anak balita dan faktor-faktor yang
mempengaruhinya, mungkin akan berbeda untuk setiap daerah atau lokasi
pengamatan tergantung pada kondisi daerah atau lokasi pengamatan. Sehingga,
untuk menanggulangi kasus gizi buruk tersebut, tidak dapat dilakukan secara
menyeluruh untuk setiap daerah atau lokasi pengamatan.
Jawa Barat merupakan salah satu dari enam provinsi di Indonesia yang
mendapat prioritas untuk menanggulangi kasus gizi buruk. Pada tahun 2011,
sekitar 30 ribu anak balita di Jawa Barat menderita gizi buruk. Dari 26
kota/kabupaten di Jawa Barat, Kabupaten Bogor adalah daerah dengan kasus gizi
buruk tertinggi sebesar 11,91% dari total kasus gizi buruk di Jawa Barat pada
tahun 2011. Banyak balita yang bestatus gizi buruk di Kabupaten Bogor ada 3.304
anak. Selanjutnya diikuti Kabupaten Cirebon dan Kabupaten Bandung,
masing-masing 2.516 dan 2.437 kasus gizi buruk (BPS, 2011). Tingginya kasus gizi buruk
anak balita di sejumlah daerah tersebut diduga dipengaruhi oleh beberapa faktor,
seperti berat badan bayi lahir rendah (BBLR), kemiskinan, dan juga kondisi
geografis dari kota/kabupaten tersebut.
Berdasarkan keragaman kasus gizi buruk anak balita di setiap
kota/kabupaten di Jawa Barat dan untuk mengetahui faktor-faktor apa saja yang
mempengaruhi kasus gizi buruk anak balita di setiap kota/kabupaten di Jawa
Barat yang memperhatikan aspek spasial tersebut, maka diperlukan sebuah
metode statistika yang diharapkan dapat memodelkan kasus gizi buruk anak balita
di Jawa Barat dengan lebih baik. Metode statistika tersebut adalah Geographically
Weighted Regression (GWR).
Model GWR merupakan pengembangan dari model regresi klasik. Pada
model GWR, nilai-nilai taksiran parameter yang dihasilkan bersifat lokal,
sehingga setiap lokasi pengamatan mempunyai nilai koefisien regresi yang
3
pembobot lokasi. Pemilihan fungsi pembobot adalah salah satu penentu hasil
analisis model GWR (Fotheringham et al, 2002).
Berdasarkan uraian di atas, penulis tertarik untuk mengkaji lebih mendalam
permasalahan Geographically Weighted Regression (GWR) dan aplikasinya untuk
memodelkan kasus gizi buruk anak balita di Jawa Barat. Untuk selanjutnya
Skripsi ini diberi judul “Aplikasi Geographically Weighted Regression (GWR) untuk Menentukan Faktor-Faktor yang Mempengaruhi Kasus Gizi Buruk Anak
Balita di Jawa Barat”.
1.2 Rumusan Masalah
Berdasarkan latar belakang masalah di atas, permasalahan yang akan diteliti
dapat dirumuskan sebagai berikut :
1. Berdasarkan jumlah kuadrat residual dan nilai koefisien determinasi
2 , model manakah diantara model regresi linear berganda atau Ordinary
Linear Regression (OLR), model Geographically Weighted Regression
(GWR) dengan pembobot fixed Kernel Gaussian, dan model Geographically
Weighted Regression (GWR) dengan pembobot adaptive Kernel Gaussian
yang lebih baik untuk memodelkan kasus gizi buruk anak balita di Jawa
Barat?
2. Berdasarkan model terbaik untuk kasus gizi buruk anak balita di Jawa Barat,
faktor-faktor apa saja yang berpengaruh secara signifikan terhadap kasus
gizi buruk pada anak balita di setiap kota/kabupaten di Jawa Barat?
1.3 Batasan Masalah
Terdapat beberapa macam fungsi pembobot yang dapat digunakan dalam
pemodelan dengan model Geographically Weighted Regression (GWR), seperti
fungsi Kernel Gaussian dan fungsi Kernel Bi-square. Dalam penulisan skripsi ini,
masalah hanya akan dibatasi pada pemilihan model terbaik antara model OLR,
model GWR dengan menggunakan fungsi pembobot fixed Kernel Gaussian dan
4
untuk menentukan faktor-faktor yang mempengaruhi kasus gizi buruk anak balita
di setiap kota/kabupaten di Jawa Barat.
1.4 Tujuan Penulisan
Berdasarkan rumusan masalah di atas, maka tujuan penulisan skripsi ini
sebagai berikut :
1. Mengetahui model terbaik untuk kasus gizi buruk anak balita di Jawa Barat
berdasarkan jumlah kuadrat residual dan nilai koefisien determinasi
2 model regresi linear berganda atau Ordinary Linear Regression (OLR),
Geographically Weighted Regression (GWR) dengan pembobot fixed
Kernel Gaussian, dan Geographically Weighted Regression (GWR) dengan
pembobot adaptive Kernel Gaussian.
2. Mengetahui faktor-faktor lokal yang mempengaruhi kasus gizi buruk anak
balita di setiap kota/kabupaten di Jawa Barat dengan menggunakan model
terbaik.
1.5 Manfaat Penulisan
Adapun manfaat dari penulisan skripsi ini dibagi menjadi dua, yaitu :
1. Manfaat Teoritis
Secara teoritis, skripsi ini membahas tentang konsep-konsep regresi linear
klasik dan regresi terboboti geografis atau Geographically Weighted Regression
(GWR), sehingga diharapkan dapat memberikan manfaat sebagai bahan rujukan
untuk pengembangan analisis regresi di masa yang akan datang, khususnya
tentang Geographically Weighted Regression (GWR).
2. Manfaat Praktis
Secara praktis, penulisan ini diharapkan dapat menjadi masukan untuk
Dinas Kesehatan Jawa Barat untuk menanggulangi kasus gizi buruk anak balita
dengan faktor-faktor yang ditentukan dengan menggunakan model
5
1.6 Sistematika Penulisan
Adapun sistematika penulisan untuk skripsi ini adalah :
BAB I PENDAHULUAN
Mengemukakan latar belakang masalah, rumusan masalah, batasan
masalah, tujuan penulisan, manfaat penulisan dan sistematika penulisan.
BAB II KAJIAN PUSTAKA
Mengemukakan landasan teori yang mendukung BAB III yaitu konsep
analisis regresi klasik, regresi linear sederhana, regresi linear berganda,
dan konsep gizi pada balita.
BAB III GEOGRAPHICALLY WEIGHTED REGRESSION (GWR)
Mengemukakan kajian teoritis tentang Geographically Weighted
Regression (GWR).
BAB IV STUDI KASUS
Mengemukakan aplikasi dari Geographically Weighted Regression
(GWR) untuk menentukan faktor-faktor yang mempengaruhi kasus gizi
buruk pada anak balita di Jawa Barat.
BAB V KESIMPULAN DAN SARAN
Merangkum keseluruhan hasil pembahasan dalam bentuk kesimpulan
dan saran.
DAFTAR PUSTAKA
BAB III
GEOGRAPHICALLY WEIGHTED REGRESSION (GWR)
3.1 Data Spasial
Data spasial memuat informasi tentang atribut dan informasi lokasi.
Sedangkan data bukan spasial (aspatial data) hanya memuat informasi tentang
atribut saja. Sebagai ilustrasi, data produk yang dihasilkan oleh suatu perusahaan
berdasarkan banyaknya karyawan merupakan contoh data bukan spasial.
Banyaknya orang yang bertahan dari suatu penyakit di berbagai daerah di suatu
negara merupakan contoh data spasial (Fotheringham et al, 2002).
Data spasial merupakan sebuah data yang berorientasi geografis, memiliki
sistem koordinat tertentu sebagai dasar referensinya dan mempunyai dua bagian
penting yang membuatnya berbeda dari data lain, yaitu informasi lokasi (spatial)
dan deskriptif (attribute) yang dijelaskan berikut ini :
1. Informasi lokasi (spatial) berkaitan dengan suatu koordinat geografi yaitu
lintang (latitude) dan bujur (longitude).
2. Informasi deskriptif (attribute) atau informasi non-spasial, suatu lokasi yang
memiliki beberapa keterangan seperti populasi dan jenis vegetasi (Fikri dkk,
2009) .
Data spasial secara sederhana dapat diartikan sebagai data yang memiliki
referensi keruangan (geografi). Setiap bagian dari data tersebut selain memberikan
gambaran tentang suatu fenomena, juga dapat memberikan informasi mengenai
lokasi dan juga persebaran dari fenomena tersebut dalam suatu ruang (wilayah).
Apabila dikaitkan dengan cara penyajian data, maka peta merupakan bentuk/cara
penyajian data spasial yang paling tepat.
Analisis terhadap data spasial memerlukan perhatian lebih dibandingkan
dengan analisis terhadap data bukan spasial. Kondisi dari suatu lokasi pengamatan
akan berbeda dengan lokasi pengamatan yang lain. Meskipun demikian, kondisi di
suatu lokasi pengamatan akan memiliki hubungan yang erat dengan lokasi
27
Hal tersebut sesuai dengan Hukum I Tobler yang dikemukakan oleh Tobler
(Tobler’s fisrt law of geography) dalam Schanbenberger dan Gotway (2005),
yaitu ”Everything is related to everything else, but near thing are more related than distant things” yang berarti “Segala sesuatu saling berhubungan satu dengan
yang lainnya, tapi sesuatu yang dekat lebih mempunyai pengaruh daripada sesuatu
yang jauh”.
Hubungan tersebut dinamakan efek spasial. Efek spasial di sini terkait
dengan perbedaan karakteristik lingkungan dan geografis antar lokasi pengamatan
sehingga masing-masing pengamatan kemungkinan memiliki variasi yang
berbeda atau terdapat perbedaan pengaruh variabel prediktor terhadap variabel
respon untuk setiap lokasi pengamatan. Efek spasial ini kemudian disebut sebagai
keragaman spasial atau heterogenitas spasial.
Oleh karena itu, diperlukan sebuah metode statistika yang diharapkan dapat
mengantisipasi heterogenitas spasial. Metode statistika tersebut yaitu metode
regersi terboboti geografis atau Geographically Weighted Regression (GWR)
(Fotheringham et al, 2002).
3.2 Geographically Weighted Regression (GWR)
Model regresi terboboti geografis (RTG) atau Geographically Weighted
Regression (GWR) pertama kali diperkenalkan oleh Fotheringham pada tahun
1967. Model GWR adalah pengembangan dari model regresi linear klasik atau
Ordinary Linear Regression (OLR). Model GWR adalah model regresi yang
dikembangkan untuk memodelkan data dengan variabel respon yang bersifat
kontinu dan mempertimbangkan aspek spasial atau lokasi.
Pendekatan yang dilakukan dalam GWR adalah pendekatan titik. Setiap
nilai parameter ditaksir pada setiap titik lokasi pengamatan, sehingga setiap titik
lokasi pengamatan mempunyai nilai parameter yang berbeda-beda.
Model dari Geographically Weighted Regression (GWR) dapat ditulis
sebagai berikut :
28
dimana
: nilai variabel respon pada titik lokasi pengamatan ke-i
: nilai variabel prediktor ke-k pada titik lokasi pengamatan ke-i
, : koordinat titik lokasi pengamatan ke-i (longitude, latitude)
0 , : konstanta/intercept GWR
, : koefisien regresi ke-k pada titik lokasi pengamatan ke-i
� : error pada titik lokasi ke-i yang diasumsikan independen, identik, dan berdistribusi normal dengan rata-rata nol dan
varians �2
Persamaan (3.1) dapat ditulis dalam bentuk matriks sebagai berikut :
= ⨂ 1 +� (3.2)
Penaksiran koefisien regresi pada Geographically Weighted Regression
(GWR) dilakukan dengan menggunakan metode kuadrat terkecil terboboti atau
Weighted Least Square (WLS), yaitu metode kuadrat terkecil dengan memberikan
pembobot yang berbeda pada setiap titik lokasi pengamatan. Pembobot tersebut
berupa matriks diagonal dimana elemen-elemen diagonalnya merupakan sebuah
29
Misalkan pembobot untuk setiap titik lokasi pengamatan , adalah
, = 1,2, , , maka koefisien regresi pada titik lokasi pengamatan ,
ditaksir dengan menambahkan pembobot pada Persamaan (3.1) dan
meminumkan jumlah kuadrat error-nya seperti pada penaksiran koefisien regresi
linear klasik sebagai berikut :
�2
, merupakan matriks diagonal × dengan setiap elemen diagonalnya
adalah pembobot untuk masing-masing titik lokasi pengamatan , atau .
Persamaan (3.4) dapat ditulis dalam bentuk matriks sebagai berikut :
�′ , �= ′ , −2 ′ , ′ ,
+ ′ , ′ , ,
(3.6)
Jumlah kuadrat error akan minimum dengan mendiferensialkan
Persamaan (3.6) terhadap ′ , sebagai berikut :
�
� ′ , �′ , �= 0−2 ′ , + 2 ′ , , = 0
(3.7)
Penyelesaian Persamaan (3.7) sebagai berikut :
0−2 ′ , + 2 ′ , , = 0
30
2 ′ , , = 2 ′ ,
′ , , = ′ , (3.8)
Untuk memperoleh nilai taksiran koefisien regresi , , kalikan kedua ruas
dari sebelah kiri pada Persamaan (3.8) dengan invers dari ′ , sehingga :
′ , −1 ′ , , = ′ , −1 ′ ,
(3.9)
karena ′ , −1 ′ , = , maka :
, = ′ , −1 ′ ,
atau
, = ′ , −1 ′ , (3.10)
, merupakan penaksir yang tak bias, efisien, dan konsisten bagi , . Misalkan ′ = 1, 1, 2, , adalah elemen baris ke-i dari matriks ,
maka nilai taksiran untuk pada titik lokasi pengamatan , adalah :
= ′ ,
= ′ ′ , −1 ′ , (3.11)
Misalkan ′ ′ , −1 ′ , adalah elemen baris ke-i dari matriks
1, sehingga nilai taksiran untuk buah pengamatan dapat ditentukan sebagai
berikut :
= 1 (3.12)
dengan
1 =
1′ ′ 1, 1 −1 ′ 1, 1
2′ ′ 2, 2 −1 ′ 2, 2
′ ′ , −1 ′ ,
31
3.2.2 Pembobot Model GWR
Peran pembobot dalam GWR merupakan aspek penting. Pembobot
tersebut bergantung pada jarak antar titik lokasi pengamatan. Seperti penjelasan
sebelumnya, pembobot tersebut berupa matriks diagonal dimana elemen-elemen
diagonalnya merupakan sebuah fungsi pembobot dari setiap titik lokasi
pengamatan. Fungsi dari matriks pembobot adalah untuk menentukan atau
menaksir parameter yang berbeda pada setiap titik lokasi pengamatan.
Matriks pembobot pada GWR merupakan matriks pembobot berbasis pada
kedekatan titik lokasi pengamatan ke-i dengan titik lokasi pengamatan lainnya.
Pengamatan terdekat ke titik lokasi pengamatan ke-i umumnya diasumsikan
memiliki pengaruh paling besar terhadap penaksiran parameter di titik lokasi
pengamatan ke-i. Oleh karena itu, matriks pembobot , akan semakin
besar seperti jarak yang semakin dekat.
Terdapat beberapa cara yang dapat digunakan untuk menentukan nilai
pembobot. Salah satu cara yang paling sederhana adalah dengan memberikan
bobot sebesar 1 untuk setiap titik lokasi pengamatan i dan j sebagai berikut :
= 1 ,∀ (3.14)
Sehingga, model yang dihasilkan apabila menggunakan fungsi pembobot ini
adalah model regresi linear klasik atau Ordinary Linear Regression (OLR).
Pembobot dalam GWR juga dapat ditentukan dengan menggunakan fungsi
invers jarak sebagai berikut :
= 1 , <
0 , ≥ (3.15)
adalah jarak euclidean antara titik lokasi pengamtan ke-i dengan titik lokasi
pengamatan ke-j (Fotheringham et al, 2002).
32
dan adalah bandwidth atau lebar jendela yang dianalogikan sebagai radius
suatu lingkaran, sehingga sebuah titik lokasi pengamatan yang berada dalam
radius lingkaran masih dianggap berpengaruh dalam membentuk parameter di
titik lokasi pengamatan ke-i.
Fungsi invers jarak akan memberikan bobot = 1, jika titik lokasi ke-j
berada di dalam radius . Sedangkan jika titik lokasi ke-j berada di luar radius
dari titik lokasi ke-i, maka fungsi invers jarak akan memiliki bobot = 0.
Selain itu, matriks pembobot , dapat ditentukan dengan
menggunakan fungsi Kernel. Fungsi Kernel memberikan pembobot sesuai
bandwidth optimum yang nilainya bergantung pada kondisi data.
Gambar 3. 1 Kernel Spasial
Terdapat dua jenis fungsi Kernel dalam GWR, yaitu fungsi Kernel tetap
atau fixed Kernel dan fungsi Kernel adaptif atau adaptive Kernel (Wheeler dan
Antonio, 2010).
a. Fungsi Kernel tetap (fixed Kernel)
Fungsi Kernel tetap memiliki bandwidth yang sama pada setiap titik lokasi
pengamatan.
X : titik lokasi pengamatan ke-i (regression point)
● : titik lokasi pengamatan lainnya (data point)
: pembobot dari titik lokasi pengamatan ke-j terhadap titik lokasi
pengamatan ke-i
: jarak antara titik lokasi pengamatan ke-i terhadap titik lokasi
33
X : titik lokasi pengamatan ke-i (regression point)
● : titik lokasi pengamatan lainnya (data point)
Gambar 3. 2 GWR dengan Kernel Tetap
Dua jenis fungsi Kernel tetap yang digunakan dalam GWR adalah :
1. Fungsi Kernel Gaussian
= −1
2 2
(3.17)
2. Fungsi Kernel Bi-square
= 1−
2 2
, <
0 ,
(3.18)
b. Fungsi Kernel adaptif (adaptive Kernel)
Fungsi Kernel adaptif memiliki bandwidth yang berbeda untuk setiap titik
lokasi pengamatan. Hal ini disebabkan kemampuan fungsi Kernel adaptif yang
dapat disesuaikan dengan kondisi titik-titik pengamatan. Bila titik-titik lokasi
pengamatan tersebar secara padat disekitar lokasi pengamatan ke-i maka
bandwidth yang diperoleh relatif sempit. Sebaliknya jika titik-titik lokasi
pengamatan memiliki jarak yang relatif jauh dari titik lokasi pengamatan ke-i
34
X : titik lokasi pengamatan ke-i (regression point)
● : titik lokasi pengamatan lainnya (data point)
Gambar 3. 3 GWR dengan Kernel Adaptif
Dua jenis fungsi Kernel adaptif yang digunakan dalam GWR adalah :
1. Fungsi Kernel adaptif Gaussian
= −1
2 2
(3.19)
2. Fungsi Kernel adaptif Bi-square
= 1− 2 2
, <
0 ,
(3.20)
dengan ( ) adalah bandwidth adaptif yang menetapkan q sebagai jarak tetangga
terdekat dari titik lokasi pengamatan ke-i.
3.2.3 Bandwith pada GWR
Dalam fungsi pembobot Kernel di atas, terdapat parameter bandwidth yang
nilainya tidak diketahui. Sehingga, perlu dilakukan penaksiran terhadap parameter
bandwidth tersebut. Bandwidth dapat dianalogikan sebagai radius suatu
lingkaran, sehingga sebuah titik lokasi pengamatan yang berada dalam radius
lingkaran masih dianggap berpengaruh dalam membentuk parameter di titik lokasi
pengamatan ke-i. Pemilihan bandwidth optimum dalam GWR merupakan hal
35
Nilai bandwidth yang sangat kecil akan mengakibatkan penaksiran
parameter di lokasi pengamatan ke-i semakin bergantung pada titik lokasi
pengamatan lain yang memiliki jarak terdekat dengan lokasi pengamatan ke-i,
sehingga varians yang dihasilkan akan semakin besar. Sebaliknya, jika nilai
bandwidth sangat besar maka akan mengakibatkan bias yang semakin besar,
sehingga model yang diperoleh terlalu halus (Dwinata, 2012).
Metode yang digunakan untuk menentukan bandwidth optimum adalah
metode validasi silang atau Cross Validation (CV) sebagai berikut :
� = − =1 ≠ 2 (3.21)
dengan ≠ adalah nilai penaksir , dimana pengamatan di titik lokasi
pengamatan ke-i dihilangkan dari proses penaksiran. Nilai bandwidth optimum
diperoleh ketika CV minimum (Fotheringham et al, 2002).
3.3 Uji Keberartian Model GWR
Uji keberartian model GWR dilakukan untuk menentukan apakah model
GWR lebih baik secara signifikan dalam memodelkan data daripada model OLR
atau tidak.
Perumusan hipotesisnya adalah :
0 : Tidak ada pengaruh faktor geografis pada model
1 : Ada pengaruh faktor geografis pada model
atau
0 : , = untuk setiap = 1,2, , dan = 1,2, ,
1 : Paling sedikit ada satu , ≠ , = 1,2, ,
Penentuan statistik uji untuk uji keberartian model GWR didasarkan pada
jumlah kuadrat residual atau residual sum of square yang diperoleh dari model
36
= (3.22)
dan nilai taksiran residual dari model OLR atau GWR dinyatakan sebagai berikut :
� = − = − = − (3.23)
merupakan matriks identitas dan merupakan matriks topi dengan bernilai 0
atau 1 yang masing-masing menunjukkan model OLR atau GWR.
Jumlah kuadrat residual dari kedua model tersebut dapat ditulis sebagai
berikut :
� ′� = ′ − ′ −
� ′� = ′ (3.24)
dengan = − ′ − .
Ketika = 0, maka diperoleh 0 yaitu matriks topi untuk model OLR yang
dinyatakan sebagai berikut :
0 = ′ −1 ′ (3.25)
Sehingga, jumlah kuadrat residual atau residual sum of square untuk model OLR
adalah :
= ′ − 0 ′ − 0 (3.26)
dan ketika = 1, maka diperoleh 1 yaitu merupakan matriks topi untuk model
GWR yang dinyatakan pada Persamaan (3.13) sebagai berikut :
1 =
1′ ′ 1, 1 −1 ′ 1, 1
2′ ′ 2, 2 −1 ′ 2, 2
′ ′ , −1 ′ ,
Sehingga, jumlah kuadrat residual atau residual sum of square untuk model GWR
37
= ′ − 1 ′ − 1 (3.27)
Selisih antara jumlah kuadrat residual model OLR dan model GWR disebut
sebagai GWR improvement dan dinyatakan sebagai berikut :
= − (3.28)
Adapun statistik uji yang digunakan untuk uji keberartian model GWR
adalah :
= ℎℎ (3.29)
dengan adalah banyak lokasi pengataman.
Kriteria uji yang digunakan yaitu, jika ≥ ; 1, 2 , maka 0 ditolak.
Artinya, ada perbedaan yang signifikan antara model OLR dan model GWR
dalam memodelkan data. Nilai ; 1, 2 , diperoleh dari Tabel Distribusi
dengan taraf signifikansi , pembilang = 1 = − −1, dan penyebut
= 2 = −2 1 + 1′ 1 (Brunsdon, Fotheringham & Charlton, 2002,
91-92).
3.4 Uji Keberartian Koefisien GWR
Pengujian parameter model GWR dilakukan untuk mengetahui faktor-faktor
yang mempengaruhi kasus gizi anak balita di setiap kota/kabupaten di Jawa Barat.
Perumusan hipotesis yang digunakan adalah :
0 : , = 0 ; = 1,2, ,
1 : , ≠0
Statistik uji yang digunakan adalah :
ℎ = ,, (3.30)
dimana , merupakan standar error yang diperoleh dari akar positif
38
Perhatikan Persamaan (3.10), yaitu penaksir paramater lokal untuk model
GWR . Persamaan (3.10) dapat ditulis dalam bentuk sederhana sebagai berikut :
, =� (3.31)
dimana
� = ′ , −1 ′ , (3.32)
Varians dari penaksir parameter GWR adalah :
, =��′�2 (3.33)
Kriteria pengujian yang digunakan yaitu, jika ℎ > 1−
2, − −1
diperoleh dari Tabel Distribusi t-Student dengan taraf signifikansi
= 5% dan = − −1 .
3.5 Koefisien Determinasi �� Lokal
Dalam model regresi global yaitu model regresi linear klasik, koefisien
39
pengamatan yang dapat dijelaskan oleh model. Sedangkan dalam GWR, koefisien
determinasi lokal 2 ditentukan untuk menentukan baik tidaknya sebuah model
pada suatu titik lokasi pengamatan. 2 dapat ditentukan dengan menggunakan
persamaan sebagai berikut :
2 = −
(3.38)
dengan adalah jumlah kuadrat total model GWR yang dinyatakan
sebagai berikut :
= =1 − 2 (3.39)
dan adalah jumlah kuadrat residual model GWR yang dinyatakan
sebagai berikut :
= =1 − 2 (3.40)
sedangkan adalah pembobot pada titik lokasi pengamatan ke-j dari titik lokasi
pengamatan ke-i, dengan , = 1,2, , (Fotheringham et al, 2002).
3.6 Langkah-Langkah Analisis
Adapun langkah-langkah analisis yang dilakukan untuk menentukan
faktor-faktor yang mempengaruhi kasus gizi buruk anak balita di Jawa Barat dengan
menggunakan Geographically Weighted Regression (GWR) adalah :
1. Mendeskripsikan variabel respon dan variabel-variabel prediktor kasus gizi
buruk anak balita di Jawa Barat.
2. Menganalisis model regresi linear klasik atau Ordinary Linear Regression
(OLR) untuk kasus gizi buruk anak balita di Jawa Barat dengan
langkah-langkah sebagai berikut :
a. Melakukan uji asumsi residual kasus gizi buruk anak balita di Jawa
40
b. Menaksir parameter model regresi klasik dengan metode kuadrat
terkecil atau Ordinary Least Square (OLS).
c. Melakukan uji keberartian model regresi linear berganda.
3. Menganalisis model Geographically Weighted Regression (GWR) untuk
kasus gizi buruk anak balita di Jawa Barat dengan langkah-langkah sebagai
berikut :
a. Menentukan koordinat longitude latitude tiap kota/ kabupaten di Jawa
Barat.
b. Menghitung jarak euclidean antar kota/ kabupaten di Jawa Barat.
c. Menentukan bandwidth berdasarkan kriteria CV minimum.
d. Menghitung matriks pembobot tiap kota/kabupaten di Jawa Barat
dengan fungsi Kernel.
e. Menaksir parameter GWR dengan menggunakan bandwidth optimum.
4. Membandingkan jumlah kuadrat residual atau residual sum of sqaure dan
koefisien determinasi 2 model dari OLS, model GWR dengan pembobot
fixed Kernel Gaussian, dan GWR dengan pembobot adaptive Kernel
Gaussian.
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil analisis terhadap faktor-faktor yang mempengaruhi kasus
gizi buruk anak balita, diperoleh bahwa :
1. Berdasarkan jumlah kuadrat residual dan nilai koefisien determinasi
2 , model Geographically Weighted Regression (GWR) dengan
pembobot adaptive Kernel Gaussian ternyata lebih cocok untuk
memodelkan kasus gizi buruk anak balita di Jawa Barat daripada model
OLR dan modelGWR dengan pembobot fixed Kernel Gaussian. Hal ini bisa
dilihat dari jumlah kuadrat residual model GWR dengan pembobot adaptive
Kernel Gaussian sebesar 0,2555239 yang paling kecil diantara jumlah
kuadrat residual model OLR sebesar 1,3451993 dan jumlah kuadrat model
GWR dengan pembobot fixed Kernel Gaussian sebesar 0,2951993. Selain
itu, nilai koefisien determinasi model GWR dengan pembobot adaptive
Kernel Gaussian sebesar 89,95% lebih besar daripada nilai koefisien
determinasi model OLR sebesar 40,7% dan nilai koefisien determinasi
model GWR dengan pembobot fixed Kernel Gaussian sebesar88,39%. Nilai
koefisien determinasi 2 terbesar yaitu untuk model GWR dengan
pembobot adaptive Kernel Gaussian, menunjukkan bahwa 89,95% kasus
gizi buruk anak balita di Jawa Barat dengan model GWR dengan pembobot
adaptive Kernel Gaussian dipengaruhi oleh kasus bayi dengan berat badan
lahir rendah (BBLR), imunisasi lengkap, vitamin A, sarana kesehatan, ASI
eksklusif, penduduk miskin, usia perkawinan pertama ≤ 15 tahun, dan air
bersih.
2. Berdasarkan hasil pengujian dengan menggunakan metode GWR, dari 26
kota/kabupaten di Jawa Barat diperoleh sepuluh kelompok kota/kabupaten
70
mempengaruhi kasus gizi buruk anak balita di setiap kota/kabupaten di Jawa
Barat secara signifikan. Secara keseluruhan, dengan menggunakan model
GWR dengan pembobot adaptive Kernel Gaussian diperoleh bahwa
faktor-faktor yang berpengaruh secara signifikan terhadap kasus gizi buruk anak
balita di Jawa Barat adalah kasus bayi dengan berat badan lahir rendah
(BBLR), balita yang mendapat vitamin A, sarana kesehatan, bayi yang
diberi ASI eksklusif, penduduk miskin, dan usia perkawinan pertama ≤ 15
tahun.
5.2 Saran
Berdasarkan hasil analisis terhadap faktor-faktor yang mempengaruhi kasus
gizi buruk anak balita di Jawa Barat dengan menggunakan metode GWR, penulis
mengajukan beberapa saran sebagai berikut :
1. Model GWR dengan pembobot adaptive Kernel Gaussian dapat digunakan
untuk memodelkan atau menentukan faktor-faktor yang mempengaruhi
kasus gizi buruk anak balita di Jawa Barat.
2. Pada penulisan skripsi ini hanya digunakan satu fungsi pembobot yaitu
fungsi Kernel Gaussian untuk menaksir parameter GWR. Pada penulisan
skripsi selanjutnya disarankan untuk menggunakan fungsi pembobot yang
lain, yaitu fungsi Kernel Bi-Square.
3. Untuk penelitian selanjutnya, perlu ditambahkan variabel prediktor lain
yang mempengaruhi kasus gizi buruk anak balita diluar faktor kesehatan
dan ekonomi, seperti kasus bencana alam yang pernah terjadi di setiap
DAFTAR PUSTAKA
Admin, Master. (2012). Mendeteksi Gizi Buruk Pada Balita. Pati : Dinkes.
Agustina, Fitriani. (2010). Modul Praktikum4 Analisis Regresi Ganda. Bandung : Jurusan Pendidikan Matematika FPMIPA UPI : Tidak diterbitkan.
Almatsier, Sunita. (2004). Prinsip Gizi Dasar. Jakarta : PT Gramedia Pustaka Utama.
Ariyanto, Eko Fuji. (2010). Forum. Potret Gizi di Jawa Barat. [online] Tersedia di http://www.yipd.or.id/main/readnews/16099. Tanggal akses : 14 Mei 2013.
Badan Pusat Statistik Provinsi Jawa Barat. (2012). Jabar dalam Angka 2012. Bandung: BPS Provinsi Jawa Barat.
Departemen Kesehatan Republik Indonesia. (2010). Keputusan Menteri Kesehatan Republik Indonesia Nomor : 1995/MENKES/SK/XII/2010 Tentang Standar Antropometri Penilaian Status Gizi Anak. Jakarta : Depkes RI.
Dwinata, Alona. (2012). Model Regresi Logistik Terboboti Geografis (Studi Kasus : Pemodelan Kemiskinan di Provinsi Jawa Timur). Tesis. Bogor : Sekolah Pascasarjana IPB : Tidak diterbitkan.
Fikri, M. Nazarudin, dkk. (2009). Modul Pelatihan Sistem Informasi Geografis (SIG) Tingkat Dasar Bidang Kesehatan. Mataram : Kerjasama Pemerintah Kota Mataram, Dinas Kesehatan Provinsi NTB, DED, GTZ : Tidak diterbitkan.
Fotheringham AS, Brundson C, Chartlon M. (2002). Geographically Weighted Regression, the Analysis of Spatially Varying Relationships. England : John Wiley & Sons, Ltd.
Gujarati, Damodar N. (2003). Basic Econometrics. New York : McGraw-Hill.
72
Istiono, Wahyudi, dkk. (2009). Analisis Faktor-Faktor yang Mempengaruhi Status Gizi Balita. Berita Kedokteran Masyarakat. 25, (3), 150-155.
Janie, Dyah Nirmala Arum. (2012). Statistik Deskriptif & Regresi Linear Berganda Dengan SPSS. Semarang : Semarang University Press.
Nachrowi, Nachrowi Djalal dan Hardius Usman. (2002). Penggunaan Teknik Ekonometri. Jakarta : PT RajaGrafindo Persada.
Nakaya T, Fotheringham AS, Brunsdon C, Charlon M. (2005). Geographcally Weighted Poisson Regression for Desease Association Mapping. Statistics in Medicine, Volume 24 Issue 17, pages 2695-2717.
Pangaribuan, Siska Dina Delima. (2001). Analisis Regresi Logistik Terhadap Faktor-Faktor yang Mempengaruhi Status Gizi Anak Balita di Jawa Tengah. Skripsi. Bogor : Jurusan Statistika FPMIPA IPB : Tidak diterbitkan.
Prihatiningsih, Oktaviani. (2012). Menentukan Faktor-Faktor yang Mempengaruhi Tingkat Pengangguran Terbuka (TPT) Provinsi Jawa Barat dengan Regresi Terboboti Geografis (RTG). Skripsi. Bogor : Jurusan Statistika FPMIPA IPB : Tidak diterbitkan.
Rahmawati, Rita dan Anik Djuraidah. (2010). Regresi Terboboti Geografis dengan Pembobot Kernel Kudrat Galat untuk Data Kemiskinan di Kabupaten Jember. [online] Tersedia di http://journal.ipb.ac.id/index.php/statistika/arti-cle/viewFile/4885/3319. Tanggal akses : 17 Januari 2013.
Saefuddin, Asep. (2011). On Comparisson between Ordinary Linear Regression and Geographically Weighted Regression: With Application to Indonesia Poverty Data. European Journal of Scientific Research. 57,(2), 275-285. Sudjana. (2003). Teknik Analisis Regresi dan Korelasi. Bandung : Tarsito.
Sudjana. (2005). Metoda Statistika. Bandung : Tarsito.
Suparyanto. (2011). Konsep Balita. [online] Tersedia di http://dr-suparyanto.blogspot.com/2011/03/konsep-balita.html?m=1 . Tanggal akses: 29 Maret 2013.
Wheeler, David C. and Antonio Paez. (2010). Handbook of Applied Spatial Analysis : Software Tools, Methods and Applications. Berlin : Springer.