i
MODEL REGRESI POISSON BIVARIAT
UNTUK MEMPREDIKSI PERINGKAT KLUB SEPAK BOLA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Sains
Program Studi Matematika
Oleh :
Arga Sari Ardhi Rahayu NIM : 103114002
PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
iv
HALAMAN PERSEMBAHAN
Karya ini sebagai bukti kasih setia Tuhan Yesus dalam hidupku.
Segala perkara dapat kutanggung di dalam Dia yang memberi kekuatan kepadaku. ( Filipi 4: 13 )
….KAKI yang akan berjalan lebih jauh dari biasanya, TANGAN yang akan berbuat lebih banyak dari biasanya, MATA yang akan menatap lebih lama dari biasanya, LEHER yang akan lebih sering melihat ke atas, lapisan TEKAD yang 1000 kali lebih keras dari baja, HATI yang akan bekerja lebih keras dari biasanya,
serta MULUT yang akan selalu berdoa….. ( 5 cm )
Karya ini aku persembahkan untuk :
Orang-orang terkasih: bapak, ibu, Milano, dan Tian
Orang-orang terhebat: sahabat-sahabat matematika 2010
vi ABSTRAK
Arga Sari Ardhi Rahayu. 2014. Model Regresi Poisson Bivariat untuk Memprediksi Peringkat Klub Sepak Bola. Skripsi. Program Studi Matematika, Jurusan Matematika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma, Yogyakarta.
Topik yang dibahas dalam skripsi ini adalah aplikasi model regresi Poisson bivariat dalam sepak bola. Hasil pertandingan sepak bola tidak mudah untuk diketahui secara pasti, sehingga membuat para penggemar sepak bola lebih sering hanya menebak-nebak tim mana yang akan menang dan berada di peringkat teratas. Namun, dalam proses memprediksi peringkat dapat digunakan model regresi Poisson bivariat, sebagai berikut :
untuk i = 1,2,…,n dimana i adalah banyaknya percobaan atau pertandingan, menyatakan banyaknya gol yang dicetak sebagai tim tuan rumah, menyatakan banyaknya kemasukan gol yang dialami sebagai klub tamu, menyatakan banyaknya gol yang dicetak sebagai klub tamu, menyatakan banyaknya kemasukan gol yang dialami sebagai klub tuan rumah, dan menyatakan total poin sebagai klub tuan rumah dan klub tamu, dan
menyatakan rata-rata, merupakan parameter konstan, dan merupakan parameter home effect ( HE ).
Untuk menduga parameter regresi, digunakan metode kemungkinan maksimum dan diselesaikan dengan metode Newton. Persamaan parameter yang diselesaikan menggunakan metode Newton, yaitu
di mana t = 0,1,2,…; j = 1,2; merupakan vektor gradien dan merupakan matriks Hessian.
vii ABSTRACT
Arga Sari Ardhi Rahayu. 2014. Bivariate Poisson Regression Model for Predicting Football Club Rating. A Thesis. Mathematics Study Program, Departement of Mathematics, Faculty of Science and Technology, Sanata Dharma University, Yogyakarta.
The topic that is covered in this thesis is the application of bivariate Poisson regression models in football. It is not easy to know the result of a football match; therefore, it makes the football fans only guess which club will win and be on the top rank. However, the process can be used to predict ratings bivariate Poisson regression model, as follows:
for i = 1,2,…,n where i is the number of trials or the matches, is the number of goals scored by the home club, is a number of experienced club conceded guest, is a number of goals scored by the guest club, is a number of goals conceded experienced by the home club, and is the total point of the home and the guest club, and is a mean, is a constant parameter, and
is the home effect parameter ( HE ).
The regression parameters is estimated by using the maximum likelihood method and it would be solved by Newton’s method. The equation parameters that were solved by using Newton’s method:
where t = 0,1,2,…; j = 1,2; is a gradient vector, and is a Hessian matrix.
viii
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus yang telah
melimpahkan berkat dan kasihNya sehingga penulis dapat menyelesaikan skripsi
ini dengan baik.
Dalam penulisan skripsi ini penulis mendapatkan bantuan baik moril
maupun materiil dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan
terima kasih kepada :
1. YG. Hartono, S.Si., M.Sc., Ph.D, selaku Ketua Program Studi
Matematika.
2. Ir. Ig. Aris Dwiatmoko, M.Sc., selaku dosen pembimbing skripsi dan
pembimbing akademik yang telah meluangkan banyak waktu dan
membimbing penulis dengan penuh kesabaran.
3. Bapak, Ibu, dan Romo, dosen-dosen yang telah memberikan ilmu yang
berguna kepada penulis.
4. Kedua orang tua, Bapak Sukardi dan Ibu Tri Rahayu, yang selalu
mendukung penulis dengan doa, semangat, dan materi.
5. Milano Yuda Pramuktya (adik) dan Kristian Wijanarko yang selalu
memberikan canda tawa, semangat, dan doa.
6. Astri, Celly, Ayu, Tika, Ratri, Yohan, Pandu, Roy, Marsel, Yosi, Dini,
Agnes, Sari, dan Leni, terima kasih untuk canda tawa, kebersamaan,
ix
7. Teman-teman sepelayanan GKJ Wonosari yang senantiasa memberikan
doa dan semangatnya.
8. Semua pihak yang telah ikut membantu penulis dalam menyelesaikan
skripsi ini.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Oleh karena
itu, penulis mengharapkan kritik dan saran yang dapat membangun serta
menyempurnakan skripsi ini. Akhirnya, penulis berharap semoga skripsi ini dapat
memberikan wawasan dan pengetahuan bagi pembaca.
Yogyakarta, 4 Agustus 2014
xi DAFTAR ISI
Halaman
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN PEMBIMBING ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERSEMBAHAN ... iv
PERNYATAAN KEASLIAN KARYA ... v
ABSTRAK ... vi
ABSTRACT ... vii
KATA PENGANTAR ... viii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH ... x
DAFTAR ISI ... xi
DAFTAR TABEL ... xiii
DAFTAR LAMPIRAN ... xv
BAB I PENDAHULUAN ... 1
A. Latar Belakang ... 1
B. Rumusan Masalah ... 7
C. Batasan Masalah ... 7
D. Tujuan Penulisan ... 7
E. Metode Penulisan ... 8
F. Manfaat Penulisan ... 8
G. Sistematika Penulisan ... 8
BAB II DASAR TEORI PROBABILISTAS DAN REGRESI ... 10
xii
B. Distribusi Probabilitas Bersama ... 13
C. Distribusi Poisson ... 18
D. Metode Kemungkinan Maksimum (Maximum Likelihood Estimation) ... 20
E. Analisis Regresi ... 22
1. Model Regresi Linear ... 23
2. Penduga Parameter Regresi ... 25
F. Model Regresi Poisson ... 27
1. Penduga Parameter Regresi Poisson ... 29
G. Metode Newton ... 33
BAB III MODEL REGRESI POISSON BIVARIAT ... 49
A. Model Regresi Poisson Bivariat ... 49
B. Penduga Parameter Regresi Poisson Bivariat ... 50
BAB IV APLIKASI MODEL REGRESI POISSON BIVARIAT UNTUK MEMPREDIKSI PERINGKAT KLUB SEPAK BOLA ... 61
A. Home Effect ... 68
B. Aplikasi Model Regresi Poisson Bivariat untuk Memprediksi Peringkat Klub Sepak Bola ... 69
BAB V PENUTUP ... 89
A. Kesimpulan ... 89
B. Saran ... 91
xiii
DAFTAR TABEL
Halaman
Tabel 3.2 Iterasi Contoh Penerapan Penduga Parameter Regresi Poisson
Bivariat ... 58
Tabel 3.3 Iterasi Contoh Penerapan Penduga Parameter Regresi Poisson
Bivariat ... 59
Tabel 4.1 Contoh Data Hasil Pertandingan Sepak Bola ... 68
Tabel 4.2 Data Hasil Pertandingan Sepak Bola di Liga Inggris Musim
Pertama Tahun 2012/2013 ... 72
Tabel 4.3 Data Hasil Pertandingan Sepak Bola di Liga Inggris Tahun
2013/2014 ... 72
Tabel 4.4 Data Hasil Pertandingan Sepak Bola di Liga Inggris Musim
Pertama Tahun 2013/2014 ... 73
Tabel 4.8 Data Prediksi Hasil Pertandingan Musim Terakhir Tahun
2012/2013 ... 77
Tabel 4.9 Data Nyata Hasil Pertandingan Musim Terakhir tahun
2012/2013 ... 77
Tabel 4.13 Data Prediksi Hasil Pertandingan Akhir Kompetisi Tahun
2013/2014 ... 82
Tabel 4.14 Data Nyata Hasil Pertandingan Akhir Kompetisi Tahun
xiv
Tabel 4.17 Data Prediksi Hasil Pertandingan Musim Terakhir Tahun
2013/2014 ... 86
Tabel 4.18 Data Nyata Hasil Pertandingan Musim Terakhir Tahun
xv DAFTAR LAMPIRAN
Halaman
Lampiran 1 Uji Sampel Tunggal Kolmogorov-Smirnov ... 93
Lampiran 2 Tabel 3.1 Contoh Data ... 98
Lampiran 3 Uji Distribusi Poisson Tabel 3.1 Menggunakan SPSS ... 99
Lampiran 4 Program Matlab untuk Menduga Parameter Regresi
Poisson Bivariat Tabel 3.1 ... 100
Lampiran 5 Uji Distribusi Poisson Tabel 4.2, Tabel 4.3, dan Tabel 4.4
Menggunakan SPSS ... 102
Lampiran 6 Program Matlab untuk Menduga Parameter Regresi
Poisson Bivariat Data Hasil Pertandingan Sepak Bola di
Liga Inggris ... 104
Lampiran 7 Tabel 4.5 dan Tabel 4.6 Iterasi Data Hasil Pertandingan
Sepak Bola untuk Menduga Parameter Regresi Poisson
Bivariat ... 106
Lampiran 8 Tabel 4.7 Data Hasil Pertandingan Sepak Bola Musim
Terakhir Tahun 2012/2013 ... 108
Lampiran 9 Tabel 4.10 dan Tabel 4.11 Iterasi Data Hasil Pertandingan
Sepak Bola untuk Menduga Parameter Regresi Poisson
Bivariat ... 109
Lampiran 10 Tabel 4.12 Data Hasil Pertandingan Sepak Bola Musim
xvi
Lampiran 11 Tabel 4.15 dan Tabel 4.16 Iterasi Data Hasil Pertandingan
Sepak Bola untuk Menduga Parameter Regresi Poisson
1 BAB I PENDAHULUAN
A. Latar Belakang Masalah
Sepak bola merupakan olah raga yang sangat populer di dunia, karena
permainan sepak bola mudah dilakukan dan peraturan permainannya cukup
sederhana dibandingkan dengan olah raga lainnya. Karena sangat populer dan
diminati banyak orang, maka dibentuklah organisasi sepak bola dunia bernama
Federation of International Football Association ( FIFA ) yang beranggotakan
negara-negara di seluruh dunia. FIFA berhak membuat peraturan-peraturan yang
harus dipatuhi oleh negara anggota FIFA agar pertandingan sepak bola dapat
berjalan dengan tertib. Salah satu kesepakatan yang dibuat FIFA adalah dalam
menentukan poin saat menang, kalah, dan seri. Jika menang akan mendapat 3 poin,
seri mendapat 1 poin, dan kalah mendapat 0 poin. FIFA juga membuat
kesepakatan tentang pertandingan kandang dan tandang dalam sebuah kompetisi,
misalnya dalam Liga Inggris juga menggunakan sistem kandang dan tandang.
Tiap negara mempunyai divisi yang berbeda-beda, karena jumlah klub yang
dimiliki tiap negara tidaklah sama. Divisi adalah tingkatan dalam pertandingan
sepak bola. Setiap klub di tiap divisi berusaha untuk meningkatkan kualitas
permainan agar mampu mencapai divisi tertinggi, misalnya dalam Liga Inggris,
merupakan liga paling atas di negara Inggris. Tiap klub yang berada di bawah liga
utama di suatu negara, akan berlomba-lomba untuk mencapai peringkat teratas di
liga tersebut agar di musim kompetisi berikutnya dapat dipromosikan ke dalam
liga utama berlomba-lomba untuk mencapai peringkat tiga terbaik, agar dapat
dipromosikan ke liga utama untuk menggantikan klub-klub yang terdegradasi. Ini
berarti tidak semua klub dapat masuk dalam liga utama, hanya klub yang memiliki
peringkat tinggi yang dapat bertanding di liga utama.
Saat ini, cara memeringkat klub sepak bola hanya didasarkan pada jumlah
poin yang didapat dari klub-klub yang bertanding. Jika suatu klub menang dalam
suatu kompetisi, maka klub tersebut akan mendapat poin 3, jika kalah akan
mendapat poin 0, dan jika seri akan mendapat poin 1. Dari poin tersebut biasanya
dibuat peringkat agar dapat diketahui posisi klub tersebut dibanding dengan
klub-klub lainnya.
Kata “peringkat” menurut Kamus Besar Bahasa Indonesia (KBBI) berarti
tingkat, pangkat, sedangkan “pemeringkatan” berasal dari kata “peringkat” yang
mendapat imbuhan pe-an yang berarti proses memeringkat. Secara umum,
pemeringkatan dapat digunakan untuk mengetahui juara dalam suatu kompetisi
dan mengukur kualitas klub yang bersangkutan, selain itu klub yang mendapat
peringkat terbaik juga akan memperoleh keuntungan finansial.
Dalam permainan sepak bola, pemeringkatan memiliki manfaat yang cukup
besar. Misalnya, jika sebuah klub mengikuti kompetisi di divisi utama dan dapat
berada di peringkat teratas, maka klub tersebut berhak untuk mengikuti kompetisi
yang lebih besar dari kompetisi sebelumnya, sehingga rating klub tersebut akan
naik.
Dari manfaat tersebut, tidak heran jika memprediksi peringkat dalam
untuk dapat masuk dalam liga yang lebih besar, namun peringkat yang dimiliki
tidak memungkinkan klub tersebut untuk mengambil bagian dalam liga tersebut,
maka klub tersebut dapat mengubah strategi atau mengambil tindakan lain agar
klub tersebut dapat meraih poin yang ditargetkan sehingga peringkat klub itu
dapat naik.
Adapun salah satu contoh konkrit yang berkaitan dengan pemeringkatan
adalah sebagai berikut, di pertandingan Liga Inggris musim 2012/2013 ada 20
klub yang berada di divisi utama.
POS Klub P W D L GF GA GD PTS
1 Manchester United 38 28 5 5 86 43 43 89
2 Manchester City 38 23 9 6 66 34 32 78
3 Chelsea 38 22 9 7 75 39 36 75
4 Arsenal 38 21 10 7 72 37 35 73
5 Tottenham Hotspur 38 21 9 8 66 46 20 72
6 Everton 38 16 15 7 55 40 15 63
7 Liverpool 38 16 13 9 71 43 28 61
8 West Bromwich 38 14 7 17 53 57 -4 49
9 Swansea City 38 11 13 14 47 51 -4 46
10 West Ham United 38 12 10 16 45 53 -8 46
11 Norwich City 38 10 14 14 41 58 -17 44
12 Fulham 38 11 10 17 50 60 -10 43
13 Stoke City 38 9 15 14 34 45 -11 42
14 Southampton 38 9 14 15 49 60 -11 41
15 Aston Villa 38 10 11 17 47 69 -22 41
16 Newcastle United 38 11 8 19 45 68 -23 41
17 Sunderland 38 9 12 17 41 54 -13 39
18 Wigan Athletic 38 9 9 20 47 73 -26 36
19 Reading 38 6 10 22 43 73 -30 28
20 Queens Park Rangers 38 4 13 21 30 60 -30 25 sumber :
http://www.premierleague.com/en-gb/matchday/league-table.html?season=2012-2013&month=MAY&timelineView=date&toDate=1368918000000&tableView=CURRENT_STANDINGS
Keterangan: POS: peringkat
P : jumlah pertandingan W : menang
D : seri L : kalah
PTS: total poin
Wigan, Reading dan QPR adalah tiga klub terbawah di divisi utama, maka
tiga klub paling bawah itu akan terdegradasi. Dan tiga klub yang berada di bawah
liga utama inggris, seperti Cardiff, Hullcity, dan Crystal Palace akan
dipromosikan ke divisi utama Liga Inggris.
Hasil dari pertandingan sepak bola sampai saat ini belum dapat diketahui
secara pasti, sehingga para penggemar sepak bola lebih sering hanya
menebak-nebak klub mana yang akan menang di antara kedua klub yang bertanding. Secara
umum, ada dua cara memeringkat, yaitu memeringkat secara intuitif dan
memeringkat menggunakan data. Memeringkat secara intuitif adalah menetapkan
peringkat yang diperoleh dari feeling, menebak-nebak, atau bahkan berdasarkan
keegoisan masing-masing orang yang menjadi penggemar dari klub yang akan
bertanding dalam memprediksi hasil pertandingan di suatu kompetisi. Sedangkan
memeringkat dengan data adalah menetapkan peringkat yang diperoleh dengan
memprediksi hasil pertandingan sebelumnya. Memprediksi hasil pertandingan
sepak bola cukup sulit, karena perlu menentukan nilai kemungkinan yang tepat,
untuk itu diperlukan suatu model matematika untuk menyelesaikan permasalahan
tersebut.
Dalam memodelkan permasalahan tersebut diperlukan pengamatan hasil
pertandingan. Saat mengamati hasil pertandingan suatu klub, banyaknya gol yang
didapat oleh klub tersebut tidak tergantung dengan gol yang telah diraih di
pertandingan, maka peluang klub tersebut untuk mencetak gol semakin besar.
Mempertimbangkan hal-hal tersebut maka data yang didapat dari hasil
pertandingan memiliki ciri yang sama dengan ciri-ciri percobaan Poisson.
Percobaan Poisson adalah percobaan yang menghasilkan nilai-nilai bagi
suatu peubah acak Y, yaitu banyaknya hasil percobaan yang terjadi selama suatu
selang waktu tertentu. Adapun ciri-ciri percobaan Poisson, yaitu
1. Kejadian satu peristiwa dengan peristiwa lain pada selang waktu
tertentu adalah independen. Dalam pertandingan sepak bola, poin
yang didapat dalam interval 15-21 dalam total poin tidak tergantung
pada poin dalam interval 0 – 3 dalam total poin.
2. Suatu peristiwa dapat terjadi secara acak dan pada selang waktu
tertentu. Dalam suatu kompetisi sepak bola, kemungkinan terjadinya
menang ( 3 poin ), kalah ( 0 poin ), atau seri ( 1 poin ) hanya pada
interval 0-57 dalam total poin ( 19 kali pertandingan ) dan belum
dapat diprediksi kapan kemungkinan itu terjadi.
3. Peluang kejadian suatu peristiwa sebanding dengan panjang selang
waktu dan luas tempat peristiwa terjadi. Dalam sepak bola, peluang
terjadinya menang ( 3 poin ), kalah ( 0 poin ), atau seri ( 1 poin ) pada
selang 0-36 dalam total poin lebih besar dari selang 48-57 dalam total
poin.
Karena kemiripan sifat hasil pertandingan sepak bola dengan sifat
percobaan Poisson, maka proses memeringkat dapat didekati dengan distribusi
Distribusi Poisson menjadi salah satu alat untuk memprediksi hasil dalam
suatu pertandingan sepak bola. Distribusi tersebut digunakan untuk mengetahui
peluang suatu kejadian acak pada selang waktu tertentu. Peluang banyaknya gol
yang akan diciptakan oleh masing-masing klub dapat ditentukan menggunakan
distribusi Poisson. Selain itu, distribusi Poisson dapat digunakan untuk
memprediksi peringkat klub dalam suatu pertandingan. Namun, dalam skripsi ini
hanya akan dibahas tentang distribusi Poisson untuk memprediksi peringkat klub
sepak bola. Distribusi Poisson diklasifikasikan menjadi dua, yaitu distribusi
Poisson univariat dan distribusi Poisson multivariat. Pengklasifikasian ini
didasarkan pada banyaknya variabel tak bebas yang digunakan.
Dalam memodelkan hasil pertandingan, akan digunakan dua variabel tak
bebas, yaitu Y1 yang menyatakan total poin sebagai klub tuan rumah dan Y2
menyatakan total poin sebagai klub tamu, sehingga distribusi Poisson yang
digunakan adalah distribusi Poisson bivariat. Proses untuk mendapatkan peringkat
klub sepak bola didapat dari membuat model regresi Poisson.
Model regresi adalah model hubungan antara variabel yang mengikuti suatu
distribusi tertentu. Sedangkan model regresi Poisson adalah model regresi yang
variabel tak bebasnya mengikuti distribusi Poisson. Dengan asumsi variabel tak
bebas dalam konteks sepak bola ini mengikuti distribusi Poisson bivariat, maka
untuk memprediksi peringkat menggunakan model regresi Poisson bivariat.
Peringkat klub sepak bola dapat diprediksi dengan menghitung total poin
satu musim dan dituangkan dalam bentuk tabel, kemudian digunakan model
regresi Poisson bivariat untuk menyelesaikannya.
A. Rumusan Masalah
Pokok permasalahan yang akan dibahas dalam tulisan ini yaitu :
1. Apa yang dimaksud dengan regresi Poisson bivariat ?
2. Bagaimana memprediksi peringkat klub sepak bola menggunakan
model regresi Poisson bivariat ?
B. Batasan Masalah
1. Dalam skripsi ini, penulis akan membahas model regresi Poisson bivariat.
2. Dasar – dasar teori yang dibahas hanya yang berkaitan langsung dengan
model regresi Poisson bivariat.
3. Dalam skripsi ini hanya akan dibahas tentang distribusi Poisson untuk
memprediksi peringkat klub sepak bola.
4. Data yang digunakan adalah data pertandingan sepak bola di Liga Inggris.
C. Tujuan Penulisan
Tujuan yang akan dicapai dalam tulisan ini adalah
1. Memahami model regresi Poisson bivariat dan cara mendapatkan
parameter-parameternya.
2. Memperoleh model regresi Poisson bivariat untuk memprediksi
D. Metode Penulisan
Metode penulisan yang digunakan penulis adalah metode studi
pustaka, yaitu dengan membaca referensi buku – buku pendukung dan jurnal
ilmiah yang berkaitan dengan model regresi Poisson bivariat untuk memprediksi
peringkat hasil sepak bola. Data diolah menggunakan software Matlab dan SPSS.
E. Manfaat Penulisan
Manfaat penulisan ini adalah untuk memperoleh pengetahuan tentang
regresi Poisson bivariat, membahas dasar-dasar teori yang terkain, dapat
menentukan parameter-parameter dari model regresi Poisson bivariat, serta dapat
memprediksi peringkat klub sepak bola menggunakan model regresi Poisson
bivariat.
F. Sistematika Penulisan
BAB I : PENDAHULUAN
Bab ini menjelaskan tentang latar belakang masalah, rumusan
masalah, batasan masalah, tujuan penulisan, metode penulisan,
manfaat penulisan, dan sistematika penulisan.
BAB II : DASAR TEORI PROBABILITAS DAN REGRESI
Bab ini menjelaskan tentang variabel random dan distribusi
probabilitas, distribusi probabilitas bersama, distribusi Poisson,
metode kemungkinan maksimum (MLE), analisis regresi, model
BAB III : MODEL REGRESI POISSON BIVARIAT
Bab ini menjelaskan tentang model regresi Poisson bivariat,
pendugaan parameter regresi Poisson bivariat.
BAB IV : APLIKASI MODEL REGRESI POISSON BIVARIAT UNTUK MEMPREDIKSI PERINGKAT KLUB SEPAK BOLA
Bab ini menjelaskan tentang home effect, aplikasi model regresi
Poisson bivariat untuk memprediksi peringkat klub sepak bola.
BAB V : PENUTUP
10
BAB II
DASAR TEORI PROBABILITAS DAN REGRESI
A. Variabel Random Teorema 2.1
Untuk setiap fungsi distribusi probabilitas diskret p(x), harus memenuhi :
1. p(xi)0 , untuk setiap xi
2.
( )1xi i x p
dengan i =1,2,…
Bukti :
1. Sifat p(x)0berasal dari fakta bahwa nilai fungsi probabilitas diskret
yang harus tidak negatif.
2. Nilai x1,x2,... menggambarkan semua kemungkinan nilai X, kejadian
X x1
X x2
...merupakan partisi lengkap dari ruang sampel, sehingga
i i
x x
i
i P X x
x
p( ) ( ) 1 ∎
Definisi 2.1
Misal X adalah variabel random diskret dengan fungsi probabilitas p(x). Maka
nilai harapan dari X , E(X), didefinisikan sebagai berikut :
x
x
xp
X
Definisi 2.2
Misal X adalah variabel random kontinu dengan fungsi densitas f(x), maka nilai
harapan dari X , E(X), didefinisikan sebagai berikut :
xf x dx X
E( ) ( )
Teorema 2.2
Jika X variabel random dan c adalah konstanta, maka E(cX)cE(X).
Bukti :
Pembuktian untuk variabel random diskret.
) (cX
E =
n
i
x cxp
1
) (
=
n
i x xp c
1 ) (
= cE(X)
Pembuktian untuk variabel random kontinu.
) (cX
E =
dx x cxf( )
=
dx x xf c ( )
= cE(X) ∎
Definisi 2.3
Andaikan X variabel random dan g(x) adalah fungsi dari variabel random X ,
nilai harapan dari fungsi variabel random X yang dinotasikan dengan E
g
X
(i)
p dan nilai sigmanya konvergen absolut.
(ii)
f dan nilai integralnya ada.
Teorema 2.3
Pembuktian untuk variabel random diskret
Pembuktian untuk variabel random kontinu
=
dy y f y h dx x f x
g( ) ( ) ( ) ( )
= E
g
X
E
h
Y ∎Definisi 2.4
Bila X adalah variabel random dengan nilai harapan E(X), variansi dari variabel
random X didefinisikan sebagai nilai harapan dari (X E(X))2. Sehingga
2 )] ( [
)
(X E X E X
Var
Definisi 2.5
Misal X adalah variabel random diskret dengan fungsi probabilitas p(x)dan nilai
harapan E(X), maka
x
x p X E x X
Var( ) ( ( ))2 ( )
Definisi 2.6
Misal X adalah variabel random kontinu dengan fungsi densitas f(x)dan nilai
harapan E(X), maka
x E X f x dx
X
Var( ) ( ( ))2 ( )
A. Distribusi Probabilitas Bersama
Di banyak aplikasi akan ditemukan lebih dari satu variabel random,
dianggap sebagai komponen dari sebuah vektor k-dimensi,
X X Xk
X 1, 2,..., ,yang mempunyai nilai x
x1,x2,...,xk
.Definisi 2.7
Distribusi probabilitas bersama dari variabel random diskret berdimensi k ,
X X Xk
random dikatakan independen jika dan hanya jika
Definisi 2.10
Jika X1,X2,...,Xk adalah variabel random yang berdistribusi bersama, maka
fungsi distribusi probabilitas bersama dari X1,X2,...,Xkadalah
)
sedemikian sehingga fungsi distribusi kumulatifnya dapat dinyatakan dengan
Akibat dari definisi di atas, fungsi densitas bersama dapat diperoleh dari
fungsi distribusi kumulatif melalui diferensiasi, yaitu :
Andaikan X1dan X2variabel random diskret dengan fungsi probabilitas bersama
Definisi 2.15
Andaikan X1dan X2variabel random diskret dengan fungsi probabilitas bersama
) , (x1 x2
p dan fungsi probabilitas marginal p1(x1) dan p2(x2) secara
berturut-turut :
(i) Fungsi probabilitas bersyarat dari X1dengan diketahui X2 x2 adalah
sebagai berikut
2 22 1,
x p
x x p
,p2
x2 0 ) | (x1 x2 p
0 ,selainnya
(ii) Fungsi probabilitas bersyarat dari X2 dengan diketahui X1 x1 adalah
sebagai berikut
1 12 1,
x p
x x p
,p1
x1 0 ) | (x2 x1 p
0 ,selainnya
Definisi 2.16
Andaikan variabel random X dan Yberdistribusi bersama, nilai harapan bersyarat
dari Y jika diketahui X x dinotasikan dengan E(Y |x) didefinisikan sebagai
berikut
(i)
yyp y x X
Y
E( | ) ( | ) , jika X dan Y diskret dengan fungsi
(ii)
yf y x dy X
Y
E( | ) ( | ) , jika X dan Y kontinu dengan fungsi densitas
bersyarat f(y|x).
B. Distribusi Poisson
Percobaan Poisson adalah percobaan yang menghasilkan nilai-nilai bagi
suatu variabel random Y, yaitu banyaknya hasil percobaan yang terjadi selama
suatu selang waktu tertentu atau di suatu daerah tertentu. Selang waktu tertentu
dapat berupa semenit, sehari, seminggu, sebulan, setahun, dan seterusnya.
Sedangkan daerah tertentu dapat berupa satu meter, satu meter kubik, dan
lain-lain.
Percobaan Poisson memiliki ciri-ciri sebagai berikut :
1. Kejadian satu peristiwa dengan peristiwa lain pada selang waktu
tertentu adalah independen.
2. Suatu peristiwa dapat terjadi secara acak dan pada selang waktu
tertentu.
3. Peluang kejadian suatu peristiwa sebanding dengan panjang selang
waktu dan luas tempat peristiwa terjadi.
Definisi 2.17
Variabel random diskret Y dikatakan berdistribusi probabilitas Poisson jika dan
hanya jika
,... 2 , 1 , 0 , ! )
( e y
y y p
y
Variabel Y yang menyatakan banyaknya hasil percobaan dalam suatu
percobaan Poisson disebut variabel random Poisson.
Teorema 2.4
Jika Y adalah variabel berdistribusi Poisson dengan parameter , maka
E(Y) dan 2 V(Y)
Bukti :
(i) Bukti untuk nilai harapan
Dari definisi nilai harapan,
)
adalah fungsi probabilitas untuk variabel
(ii) Bukti untuk variansi
Dari definisi variansi,
C. Metode Kemungkinan Maksimum (Maximum Likelihood Estimation) Metode kemungkinan maksimum (maximum likelihood estimation) adalah
metode yang digunakan untuk menentukan penduga yang memaksimumkan
fungsi kemungkinan. Ide dasar dari metode ini adalah mencari nilai parameter
suatu data yang terobservasi sebagai suatu penduga dari parameter yang tak
diketahui.
Definisi 2.18
Andaikan X1,X2,...,Xn adalah variabel random kontinu dan adalah sebuah
vektor parameter dari X1,X2,...,Xn. Fungsi densitas gabungan dari X1,X2,...,Xn
dapat ditulis sebagai hasil kali dari fungsi densitas bersyarat sebagai berikut :
Bila X1,X2,...,Xnadalah variabel random yang memiliki fungsi densitas bersama
)
merupakan kemungkinan dari sebagai suatu fungsi dari x1,x2,...,xndidefinisikan
Logaritma dari fungsi kemungkinan (likelihood function), yang disebut
kemungkinan log (log-likelihood) didefinisikan sebagai berikut
Penduga maksimum likelihood didapat dari turunan pertama fungsi log
likelihood kemudian menyamakan turunan pertama tersebut ke nol.
D. Analisis Regresi
Analisis regresi merupakan analisis untuk menjelaskan tentang hubungan
antara dua variabel atau lebih.
Dalam analisis regresi, dikenal dua jenis variabel, yaitu :
1) Variabel dependent ( variabel tak bebas ), yaitu variabel yang
dipengaruhi oleh variabel lainnya. Variabel dependent biasanya
dinotasikan dengan Y.
2) Variabel independent ( variabel bebas ), yaitu variabel yang tidak
dipengaruhi oleh variabel lainnya. Variabel independent biasanya
dinotasikan dengan X.
Analisis regresi bertujuan menganalisis hubungan antara Y dan X.
Dalam analisis regresi linear, ada beberapa asumsi yang harus dipenuhi.
Asumsi dalam analisis regresi linear adalah sebagai berikut :
1. Model regresi harus linear dalam parameter.
2. Nilai X tetap disetiap percobaan, dengan kata lain nilainya bersifat
nonstochastic.
3. Nilai i yang diharapkan adalah nol dan secara simbolik dinyatakan
dengan E
i |Xi
0. 0ln
4. Variansi dari i adalah sama atau bersifat homoskedastisitas, dan
secara simbolik dinyatakan dengan var
2|
i Xi .
5. Tidak ada autokorelasi antara i dan j pada setiap nilai Xi dan Xj.
Secara simbolik dinyatakan dengan
cov
i,j |Xi,Xj
E
i |Xi
j |Xj
0.6. Tidak ada korelasi antara i dan Xi.
7. Banyaknya observasi n harus lebih besar daripada banyaknya
parameter yang diduga.
8. Variabel X harus bervariasi.
9. Model regresi ditetapkan dengan tepat.
10. Tidak ada multikolinearitas sempurna antar variabel bebas.
1. Model Regresi Linear Definisi 2.21
Model regresi linear k-variabel yang meliputi variabel tak bebas Y dan k
variabel bebas X2,X3,...,Xkdapat ditulis sebagai berikut
i ki k i
i
i X X X
Y 12 2 3 3 ... (2.1)
di mana :
i
Y = variabel tak bebas
1
= intersep
j
ji
X = nilai variabel bebas ke-j pada pengamatan ke-i
i
= galat (error)
i = 1,2,3,…,n
j = 2,3,…,k
n = ukuran populasi
Persamaan dalam Definisi 2.21 ,dapat dinyatakan dalam bentuk matriks menjadi
Matriks tersebut dapat dinyatakan sebagai berikut
y = Xβ + ε
matriks, yaitu :
a. Nilai harapan dari vektor galat ε adalah nol, sehingga E(ε) = 0, di
b. Vektor galat ε tidak berkorelasi dengan vektor galat ε’, tetapi memiliki
variansi yang sama.
E(ε ε’) =
n
n
E
1 2
2 1
Secara ringkas dapat dinyatakan dengan E(ε ε’) = σ2I, di mana ε’
adalah transpose dari vektor kolom ε dan I adalah matriks identitas
berordo
nn
.c. Matriks X berordo
nk
.terdiri dari bilangan - bilangan tetap ( takstokastik ).
d. Matriks X mempunyai derajat kolom sama dengan k ( = banyaknya
kolom dalam X ), dan k lebih kecil dari n.
e. Vektor galat ε memiliki distribusi normal multivariat ε ~ N(0,σ2I).
2. Pendugaan Parameter Regresi
Parameter β dalam model regresi dapat diduga dengan salah satu
metode pendugaan yaitu metode penduga kemungkinan maksimum
(Maximun Likelihood Estimation). Misalkan dari persamaan model regresi
pada persamaan (2.1), Yi berdistribusi normal, dan karena asumsi bahwa galat
𝛆 berdistribisi normal, ε ~ N(0,σ2I), dengan E(ε)=0, rata-rata E(Y) =μ=Xβ,
dan var(𝛆)=σ2 ,sehingga fungsi probabilitas gabungan dari Y1,Y2,…,Yn dapat
f merupakan fungsi densitas
dari variabel yang berdistribusi normal, sehingga fungsi probabilitas
gabungannya menjadi
Untuk mendapatkan penduga kemungkinan maksimum dari β,
digunakan fungsi log-likelihood sebagai berikut :
= −𝑛
2𝑙𝑛 2𝜋𝜎
2 − 1
2𝜎2 𝒀′− 𝜷′𝑿′ 𝒀 − 𝑿𝜷
= −𝑛
2𝑙𝑛 2𝜋𝜎
2 − 1 2𝜎2 𝒀
′𝒀 − 𝒀′𝑿𝜷 − 𝜷′𝑿′𝒀+𝜷′𝑿′𝑿𝜷
= −𝑛
2𝑙𝑛 2𝜋𝜎
2 − 1
2𝜎2 𝒀′𝒀 − 𝒀′𝑿𝜷 ′− 𝜷′𝑿′𝒀+𝜷′𝑿′𝑿𝜷
= −𝑛
2𝑙𝑛 2𝜋𝜎
2 − 1
2𝜎2 𝒀′𝒀 − 𝜷′𝑿′𝒀 − 𝜷′𝑿′𝒀+𝜷′𝑿′𝑿𝜷
= −𝑛
2𝑙𝑛 2𝜋𝜎
2 − 1 2𝜎2 𝒀
′𝒀 −2𝜷′𝑿′𝒀+𝜷′𝑿′𝑿𝜷
Pendugaan untuk parameter 𝜷 adalah sebagai berikut
𝜕
𝜕𝜷ln𝐿 𝜷 = 0
𝜕 𝜕𝜷 −
𝑛
2𝑙𝑛 2𝜋𝜎
2 − 1 2𝜎2 𝒀
′𝒀 −2𝜷′𝑿′𝒀+𝜷′𝑿′𝑿𝜷 = 0
−2𝜎12 −2𝑿
′𝒀+ 2𝜷′𝑿′𝑿 = 0
𝑿′𝒀 𝜎2
−
𝜷 𝑿′𝑿
𝜎2
= 0
−
𝜷 𝑿𝜎2′𝑿=
−
𝑿′𝒀𝜎2
𝜷 𝑿′𝑿 = 𝑿′𝒀
𝜷 = 𝑿′𝑿 −1𝑿′𝒀
E. Model Regresi Poisson
Model regresi Poisson merupakan regresi yang menggambarkan hubungan
antara variabel tak bebas (Y) dengan variabel bebas (X), dimana variabel tak bebas
(Y) bersifat diskret yang bernilai bulat tak negatif dan berdistribusi Poisson.
Sehingga dapat disimpulkan bahwa regresi Poisson terbentuk dari distribusi
diskret yang variabel tak bebasnya berdistribusi Poisson, yang memiliki rata-rata
(mean) dan variansi sama yaitu 0.
Bila diberikan variabel tak bebas Yi berdistribusi Poisson dengan k variabel
bebas X2,X3,...,Xk , persamaan regresi Yi dengan X2,X3,...,Xk dinyatakan
seperti persamaan (2.1), maka nilai harapan bersyarat Yi dengan X2i = x2i , X3i =
x3i ,…, Xki = xki sebagai berikut
Yi X i x i X i x i Xki xki
E | 2 2, 3 3,...,
X i kXki i X i x i Xki xki
E
1 2 2 ... | 2 2,...,
= E
1|X2i x2i,...,Xki xki
E 2X2i |X2i x2i,...,Xki xki
...E
kXki|X2i x2i,...,Xki xki
Ei |X2i x2i,...,Xki xki
menurut Teorema 2.2 dan asumsi regresi linear E ( ℰi | Xi ) = 0 , maka
2 | 2 2,...,
...
| 2 2 ,...,
02
1
E X i X i xi Xki xki kE Xki X i xi Xki xki
ki k i
i x x
x
1 2 2 3 3 ...
Dikarenakan Yi|Xki berdistribusi Poisson, maka nilai rata-ratanya E(Yi|Xki) =
ki k i
i x x
x
1 2 2 3 3 ... = λ harus tak negatif ( dalam interval (0,)),
padahal telah diketahui bahwa nilai regresi 12x2i 3x3i...kxki tak
berhingga (,). Untuk itu, diperlukan fungsi penghubung ( link function ) g
yang dapat membuat memiliki nilai dalam interval (0,), yaitu dengan fungsi
penghubung logaritma (logarithmic link), sehingga
) (
g 1 2x2i 3x3i ...kxki
gmerupakan fungsi logaritma, sehingga model regresi Poisson menjadi
x i x i ...kxkiatau dapat juga dinyatakan dengan
exp (x β)
Definisi 2.22
Model regresi Poisson dinyatakan dalam bentuk
ln x β
di mana adalah rata-rata yang bergantung pada vektor variabel x dan vektor koefisien β.
Model regresi Poisson merupakan regresi non-linear yang termasuk
keluarga eksponensial.
1. Penduga Parameter Regresi Poisson
Parameter β dalam model regresi Poisson dapat diduga dengan salah
satu metode penduga yaitu metode penduga kemungkinan maksimum
(Maximun Likelihood Estimation).
Fungsi probabilitas bersyarat Y bila diberikan X = x untuk 0adalah
,... 2 , 1 , 0 , ! ) ; |
(
y y e x
y p
y
di mana exp (xβ), sehingga
p(y|x) =
exp(-exp(xβ))(exp(xβ)y
)
= exp(-exp(xβ))(exp(yxβ))
Fungsi probabilitas gabungannya sebagai berikut
p(y1,…,yn|x21,…,xki;β)= 𝑛𝑖=1𝑝 𝑦𝑖|𝒙𝑘𝑖;𝜷
L(β) = 𝑒𝑥𝑝 −𝑒𝑥𝑝 𝒙𝒌𝒊𝑦𝜷 𝑒𝑥𝑝 𝑦! 𝑖𝒙𝒌𝒊𝜷 𝑛
𝑖=1
Untuk mendapatkan penduga kemungkinan maksimum dari β,
digunakan fungsi log-likelihood sebagai berikut :
ln L(β) = ln 𝑛𝑖=1𝑝 𝑦𝑖|𝒙𝑘𝑖;𝜷
= ln 𝑒𝑥𝑝 −𝑒𝑥𝑝 𝒙𝒌𝒊𝜷 𝑒𝑥𝑝 𝑦𝑖𝒙𝒌𝒊𝜷
𝑦! 𝑛
𝑖=1
= ln 𝑖𝑛=1𝑒𝑥𝑝 −𝑒𝑥𝑝 𝒙𝒌𝒊𝜷 +𝑙𝑛 𝑖𝑛=1𝑒𝑥𝑝 𝑦𝑖𝒙𝒌𝒊𝜷 − 𝑙𝑛 𝑛𝑖=1𝑦𝑖!
= 𝑛𝑖=1−𝑒𝑥𝑝 𝒙𝒌𝒊𝜷 + 𝑦𝑖𝑛=1 𝑖𝒙𝒌𝒊𝜷 − 𝑛𝑖=1𝑙𝑛 𝑦𝑖!
= −𝑒𝑥𝑝 𝒙𝑛𝑖=1 𝒌𝒊𝜷 +𝑦𝑖𝒙𝒌𝒊𝜷 − 𝑙𝑛𝑦𝑖! (2.2)
Memaksimalkan nilai untuk 𝜷, biasa dinotasikan dengan 𝜷 , dapat
ditentukan dari k turunan pertama dari fungsi log-likelihood dan menyama
dengankan nol.
Misal diberikan persamaan regresi Poisson dengan variabel sebanyak
k=2, maka
) (
g 12x2
1 2 2ln x
Sehingga exp
12x2
Bila diketahui , 0,1,2,...
! )
; |
(
y y e x
y p
y
Maka,
! exp exp
exp 1 2 2 1 2 2
y
x y
x
=
untuk mendapatkan 2
, maka digunakan metode Newton.
Misal diberikan persamaan regresi Poisson dengan variabel sebanyak k =3,
Persamaan (2.2), (2.3), dan (2.4) bila dinyatakan dengan matriks, maka
Penduga parameter dari persamaan (2.2) dapat diperoleh dengan
Karena persamaan (2.6) tidak linear, maka persamaan tersebut dapat
diselesaikan dengan pendekatan yang disebut metode numeris. Salah satu
metode numeris yang digunakan adalah metode Newton.
F. Metode Newton
Metode Newton adalah salah satu metode numeris yang digunakan untuk
Bila diketahui f C2
a,b. Misal 𝑥 ∈ 𝑎,𝑏 adalah aproksimasi untuk psedemikian hingga 𝑓′ 𝑥 ≠0 dan |𝑥 − 𝑝|‘kecil’. Polinomial Taylor berderajat 1
untuk 𝑓 𝑥 di sekitar 𝑥 dinyatakan sebagai berikut
𝑓 𝑥 = 𝑓 𝑥 + 𝑥 − 𝑥 𝑓′ 𝑥 + 𝑥−𝑥 2
2 𝑓′′ 𝜉 𝑥 (2.7)
di mana 𝜉 𝑥 merupakan variabel yang menyatakan suku sisa dari deret Taylor,
karena 𝑓 𝑝 = 0 dan x p , persamaan (2.7) menjadi
0 =𝑓 𝑥 + 𝑝 − 𝑥 𝑓′ 𝑥 + 𝑝 − 𝑥 2
2 𝑓′′ 𝜉 𝑝
Metode Newton sederhana dapat ditentukan dengan asumsi bahwa suku yang
memuat (𝑝 − 𝑥 )2 diabaikan, sehingga
0≈ 𝑓 𝑥 + 𝑝 − 𝑥 𝑓′ 𝑥 (2.8)
maka penyelesaian untuk p pada persamaan (2.8) adalah
𝑝 ≈ 𝑥 −𝑓′ 𝑥 𝑓 𝑥
bila didekati dengan titik awal p0, maka menjadi
, '
0, 1' 1 1
1
1
f p n
p f
p f p
p n
n n n
n
Misalkan diberikan dua persamaan tidak linear yang tidak diketahui dalam
variabel x1dan x2.
1, 2
0 1 x x f
1, 2
0 2 x x Kedua fungsi tersebut dapat diperluas ke dalam deret Taylor di sekitar titik
superscript (1) digunakan untuk menunjukkan banyaknya iterasi pendugaan.
Misalkan ruas kiri dari persamaan (2.9a) dan (2.9b) disama dengankan nol dan
dipangkas pada turunan kedua pada deret Taylor, sehingga menjadi
bila dinyatakan dalam bentuk matrik, persamaan (2.10a) dan (2.10b) menjadi
kemudian akar persamaan didapat dari rumus
Diberikan fungsi berdimensi n yang dinyatakan dalam bentuk matriks sebagai
berikut
memberikan kekonvergenan secara kuadratik untuk penyelesaian dari 𝑭 𝒙 =𝟎 ,
Definisi 2.24
Misal 𝑝𝑛 𝑛∞=0 konvergen ke p dan himpinan En = p – pn untuk . Jika konstanta
positif A ada, dan
lim𝑛→∞ 𝑝−𝑝𝑛+1
𝑝−𝑝𝑛 2 = lim𝑛→∞
𝐸𝑛+1 𝐸𝑛 2 =𝐴
sehingga barisan tersebut dikatakan konvergen ke p dengan derajat
kekonvergenan 2 ( konvergen secara kuadratik ) dan A adalah konstanta eror
asimtotik.
Teorema 2.5
Misalkan 𝒑 adalah penyelesaian dari 𝑮 𝒙 =𝒙untuk fungsi 𝑮= 𝑔1,𝑔2,…,𝑔𝑛 𝑇
yang memetakan ℝ𝑛 ke ℝ𝑛. Andaikan 𝛿 > 0 ada dengan
(i) 𝜕𝑔𝑖
𝜕𝑥𝑗 kontinu di 𝑁𝛿(𝒑) = 𝒙| 𝒙 − 𝒑 < 𝛿 , untuk setiap 𝑖= 1,2,…,𝑛
dan 𝑗= 1,2,…,𝑛 ;
(ii) 𝜕
2𝑔 𝑖(𝒙)
(𝜕𝑥𝑗𝜕𝑥𝑘) kontinu, dan 𝜕2
𝑔𝑖(𝒙)
(𝜕𝑥𝑗𝜕𝑥𝑘) ≤ 𝑀 untuk suatu konstanta M, saat
𝒙 ∈ 𝑁𝛿 , untuk setiap 𝑖= 1,2,…,𝑛, 𝑗 = 1,2,…,𝑛, dan 𝑘 = 1,2,…,𝑛 ;
(iii) 𝜕𝑔𝑖(𝒑)
𝜕𝑥𝑘
= 0
, untuk setiap 𝑖= 1,2,…,𝑛 dan 𝑘= 1,2,…,𝑛.Maka ada 𝛿 ≤ 𝛿 sedemikian hingga barisan yang dibangkitkan oleh 𝒙(𝑘) =
𝑮(𝒙 𝑘−1 ) konvergen secara kuadratik ke 𝒑 untuk setiap pilihan 𝒙(0),dengan
syarat 𝒙(0)− 𝒑 < 𝛿. Selain itu
𝒙(𝑘)− 𝒑 ∞ ≤
𝑛2𝑀 2 𝒙
(𝑘−1)− 𝒑 ∞ 2
Bukti :
Tanpa mengurangi perumuman bukti, diasumsikan 𝒙 = 𝑥𝑦 , 𝒑= 𝑝𝑝1
2 , 𝑮 𝒙 =
𝑔1(𝑥,𝑦)
𝑔2(𝑥,𝑦) .
Ambil 0 < w < 1 dan 𝛿> 0 sedemikian hingga di 𝑁𝛿(𝒑) berlaku ∇𝒈 𝒙 ∞ ≤ 𝑤,
dengan ∇𝒈 𝒙 =
𝑔1(𝑥,𝑦) 𝜕𝑥
𝑔1 (𝑥,𝑦) 𝜕𝑦 𝑔2(𝑥,𝑦)
𝜕𝑥
𝑔2 (𝑥,𝑦) 𝜕𝑦
= 𝑔1 𝑋(𝑥,𝑦) 𝑔1 𝑌(𝑥,𝑦)
𝑔2 𝑋(𝑥,𝑦) 𝑔2 𝑌(𝑥,𝑦) dan
𝜕2𝑔 𝑖(𝒙)
(𝜕𝑥𝑗𝜕𝑥𝑘) kontinu untuk setiap 𝑖= 1,2 , 𝑗 = 1,2 , dan 𝑘 = 1,2 . Karena
∇𝒈 𝒙 ∞ ≤ 𝑤< 1, maka 𝒑𝑛 ∞𝑛=0 termuat di 𝑁𝛿(𝒑) dengan n adalah banyaknya
barisan. Sehingga, perluasan 𝒈 𝑥,𝑦 dalam polynomial Taylor untuk 𝑥,𝑦 ∈
𝑁𝛿(𝒑) adalah
𝑔1 𝑥,𝑦 = 𝑔1 𝑝1,𝑝2 +𝑔1 𝑋 𝑝1,𝑝2 𝑥 − 𝑝1 +𝑔1 𝑌 𝑝1,𝑝2 𝑦 − 𝑝2
+1
2! 𝑔1 𝑋𝑋 𝜉 (𝑥 − 𝑝1) 2+ 2𝑔
1 𝑋𝑌 𝜉 𝑥 − 𝑝1 𝑦 − 𝑝2 +𝑔 1 𝑌𝑌 𝜉 (𝑦 − 𝑝2)2
𝑔2 𝑥,𝑦 = 𝑔2 𝑝1,𝑝2 +𝑔2 𝑋 𝑝1,𝑝2 𝑥 − 𝑝1 +𝑔2 𝑌 𝑝1,𝑝2 𝑦 − 𝑝2
+1
2! 𝑔2 𝑋𝑋 𝜉 (𝑥 − 𝑝1) 2+ 2𝑔
2 𝑋𝑌 𝜉 𝑥 − 𝑝1 𝑦 − 𝑝2 +𝑔 2 𝑌𝑌 𝜉 (𝑦 − 𝑝2)2
di mana 𝜉 berada di antara 𝒙 dan 𝒑.
Bila 𝒈 𝒑 =𝒑 dan ∇𝒈 𝒑 =𝟎, maka
𝑔1 𝑥,𝑦 =𝑝1+ 1
2! 𝑔 1 𝑋𝑋 𝜉 (𝑥 − 𝑝1) 2+ 2𝑔
1 𝑋𝑌 𝜉 𝑥 − 𝑝1 𝑦 − 𝑝2
𝑔2 𝑥,𝑦 =𝑝2+
bila dinyatakan dalam bentuk matriks, menjadi
Untuk n variabel, menjadi
𝒙(𝑘)− 𝒑 ∞ ≤𝑛2
2 𝑴 𝒙
(𝑘−1)− 𝒑 ∞
2
,𝑘 ≥1 ∎
Andaikan 𝐴 𝒙 adalah matriks n x n dari fungsi di ℝ𝑛 ke ℝ pada persamaan
(2.11). Diasumsikan 𝐴 𝒙 tak singular mendekati penyelesaian 𝒑 dari 𝑭 𝒙 = 0
dan misalkan 𝑏𝑖𝑗(𝒙) menyatakan elemen dari 𝐴 𝒙 −1 di baris ke-i dan kolom ke-j.
Karena 𝑮 𝒙 =𝒙 − 𝐴(𝒙)−1𝑭(𝒙), sehingga 𝑔𝑖 𝒙 =𝑥𝑖− 𝑛𝑗=1𝑏𝑖𝑗 𝒙 𝑓𝑗(𝒙) dan
𝜕𝑔𝑖
𝜕𝑥𝑘 𝒙 =
1− 𝑏𝑖𝑗(𝒙)𝜕𝑥𝜕𝑓𝑗
𝑘 𝒙 +
𝜕𝑏𝑖𝑗
𝜕𝑥𝑘 𝒙 𝑓𝑗(𝒙) ,𝑢𝑛𝑡𝑢𝑘𝑖 =𝑘
𝑛 𝑗=1
− 𝑏𝑖𝑗(𝒙)𝜕𝑥𝜕𝑓𝑗
𝑘 𝒙 +
𝜕𝑏𝑖𝑗
𝜕𝑥𝑘 𝒙 𝑓𝑗(𝒙)
𝑛
𝑗=1 ,𝑢𝑛𝑡𝑢𝑘𝑖 ≠ 𝑘
Dalam Teorema 2.5 diketahui bahwa 𝜕𝑔𝑖(𝒑)
𝜕𝑥𝑘
= 0
, untuk setiap 𝑖=1,2,…,𝑛 dan 𝑘 = 1,2,…,𝑛. Ini berarti untuk i = k,
0 = 1− 𝑏𝑖𝑗(𝒑)𝜕𝑥𝜕𝑓𝑗
𝑘𝑓𝑗(𝒑)
𝑛
𝑗=1 , sehingga
𝑏𝑖𝑗(𝒑)𝜕𝑥𝜕𝑓𝑗
𝑘𝑓𝑗(𝒑)
𝑛
𝑗=1 = 1 (2.12)
ketika 𝑘 ≠ 𝑖,
0 =− 𝑏𝑖𝑗(𝒑)𝜕𝑥𝜕𝑓𝑗
𝑘𝑓𝑗(𝒑)
𝑛
𝑗=1 , sehingga
𝑏𝑖𝑗(𝒑)𝜕𝑥𝜕𝑓𝑗
𝑘𝑓𝑗(𝒑)
𝑛
𝑗=1 = 0 (2.13)
𝐽 𝒙 = 𝜕𝑓1
𝜕𝑥1(𝒙) ⋯ 𝜕𝑓1 𝜕𝑥𝑛(𝒙)
⋮ ⋱ ⋮
𝜕𝑓𝑛
𝜕𝑥1(𝒙) ⋯ 𝜕𝑓𝑛
𝜕𝑥𝑛(𝒙)
(2.14)
dari persamaan (2.12) dan (2.13) menghendaki
𝐴 𝒑 −1𝐽 𝒑 = 𝐼, merupakan matriks identitas
sehingga
𝐴 𝒑 = 𝐽 𝒑 .
Pilihan yang tepat untuk 𝐴 𝒙 adalah 𝐴 𝒙 =𝐽 𝒙 karena memenuhi
kondisi (iii) dalam Teorema 2.5. Fungsi G didefinisikan sebagai berikut
𝑮 𝒙 = 𝒙 − 𝐽 𝒙 −1𝑭(𝒙),
dan langkah iterasi fungsi berkembang dari pemilihan 𝒙 0 dan membangkitkan
untuk 𝑘 ≥1,
𝒙(𝑘) =𝑮 𝒙 𝑘−1 =𝒙(𝑘−1)− 𝑱 𝒙 𝑘−1 −1𝑭 𝒙 𝑘−1
𝐽 𝑥 merupakan matriks Jacobi yang memuat turunan parsial dari persamaan tidak
linear.
Definisi 2.25
Metode Newton untuk sistem persamaan yang tidak linear didefinisikan sebagai
berikut
𝒙(𝑘) =𝑮 𝒙 𝑘−1 =𝒙(𝑘−1)− 𝑱 𝒙 𝑘−1 −1𝑭 𝒙 𝑘−1
Contoh 2.1
Diberikan dua persamaan tak linear sebagai berikut
0
Cari akar persamaan di atas!
Penyelesaian :
Untuk persamaan pertama
1
Untuk persamaan kedua
misal 1 1
bila dinyatakan dalam bentuk matriks menjadi
Akar persamaan dapat diperoleh dari
atau dapat ditulis,
x
(n)=
x
(n-1)–
J
(
x
(n-1))
F
(
x
(n-1))
Proses ini dilakukan berulang sampai 1 1
n
x dan 2 1
n
x konvergen ke suatu nilai.
Setelah melakukan 6 kali iterasi ternyata x1dan x2 konvergen ke 0,5000dan
8660 .
0 , seperti dinyatakan dalam tabel berikut
Bila Definisi 2.25 dikaitan dengan model regresi Poisson, maka 𝑭 𝒙 𝑘−1
diperoleh dengan metode Newton sebagai berikut
𝑦 − 𝑒𝑥𝑝 𝛽1+𝛽2𝑥2+𝛽3𝑥3 𝑥2
𝑦 − 𝑒𝑥𝑝 𝛽1+𝛽2𝑥2+𝛽3𝑥3 𝑥3
dengan k = 1,2,…
Untuk membahas tentang penduga bagi , yaitu , diperlukan definisi
matriks Hessian sebagai berikut
Definisi 2.25
Matriks Hessian merupakan matriks n x n yang berisi turunan parsial kedua dari
suatu fungsi. Misalkan f(x)adalah fungsi dengan n variabel yang turunan parsial
keduanya ada dan kontinu, maka matriks Hessian dari f adalah
metode Newton adalah sebagai berikut
𝛽 𝑡+1 = 𝛽 𝑡− 𝐻 𝛽 𝑡 −1
𝑔 𝛽 𝑡
dimana 𝑔 menyatakan gradien persamaan (2.6), H adalah matriks Hessian, yaitu
matriks turunan kedua dari fungsi log-likelihood, dan 𝛽 1 menyatakan nilai awal.
𝐻 𝜷 =𝜕
2𝑙𝑛𝐿 𝜷
𝜕𝜷𝜕𝜷′
= 𝜕
𝜕𝜷 𝑦𝑛𝑖=1 𝑖− 𝑒𝑥𝑝 𝒙𝒌𝒊𝜷 𝒙𝒌𝒊
= − 𝑛𝑖=1𝑒𝑥𝑝 𝒙𝒌𝒊𝜷 𝒙𝒌𝒊𝒙𝒌𝒊′ (2.15)
Secara umum model regresi Poisson ada dua jenis, yaitu model regresi
Poisson univariat dan model regresi Poisson multivariat. Pengklasifikasian ini
didasarkan pada banyaknya variabel tak bebas yang digunakan. Pada skripsi ini
akan dibahas mengenai model regresi Poisson bivariat. Untuk menguji distribusi
Poisson digunakan uji sampel tunggal Kolmogorov-Smirnov yang terdapat pada
49
BAB III
MODEL REGRESI POISSON BIVARIAT
A. Model Regresi Poisson Bivariat
Bila diberikan dua variabel tak bebas Y1i dan Y2i berdistribusi Poisson
dengan variabel bebas X11,X12,...,X1k dan X21,X22,...,X2k , maka persamaan
regresinya dinyatakan sebagai berikut
i k ki i
i
i x x x
Y1 01 1111 1212... 1 1 1 (3.1a)
i k ki i
i
i x x x
Y2 02 2121 2222... 2 2 2 (3.1b)
di mana :
i = 1,2,…,n
j = 1,2
m = 1,2,…,k
ji
Y = variabel tak bebas ke-j pengamatan ke-i
j
0
= intersep
jm
= koefisien regresi dari variabel bebas ke-m variabel tak bebas ke-j
jmi
x = nilai variabel bebas ke-m pada pengamatan ke-i
ji
= galat
n = ukuran populasi
seperti pada pembahasan regresi Poisson di bab sebelumnya, dikarenakan
ki i X
Y1 | 1 dan Y2i |X2ki berdistribusi Poisson, maka nilai rata-ratanya
1 1 1 12
12 11 11 1 0 1
1i |X ki x i x i ...xki k Y
2 2 2 22
22 21 21 2
0 ...
x i x i x ki k harus tak negatif. Untuk itu diperlukan
fungsi penghubung ( link function ) g1dan g2 yaitu dengan fungsi penghubung
logaritma ( logarithmic link ), sehingga menjadi
k ki i
i x x
x
g1 1 01 1111 1212... 1 1
k ki i
i x x
x
g2 2 0 2 2121 2222... 2 2
g merupakan fungsi logaritma, sehingga model regresi Poisson bivariat menjadi
k ki i
i x x
x11 11 12 12 1 1
1 0
1 ...
ln
k ki i
i x x
x21 21 22 22 2 2
2 0
2 ...
ln
atau dapat juga dinyatakan dengan
𝜆1 = exp (𝒙𝟏𝜷1)
𝜆2 = exp (𝒙𝟐𝜷2)
Definisi 3.1
Model regresi Poisson bivariat adalah
𝑙𝑛 𝜆1 = 𝒙𝟏𝜷𝟏
𝑙𝑛 𝜆2 =𝒙𝟐𝜷𝟐
di mana adalah rata-rata yang bergantung pada vektor variabel x dan vektor koefisien β.
A. Penduga Model Regresi Poisson Bivariat
Parameter β dalam model regresi Poisson bivariat dapat diduga dengan
Fungsi probabilitas bersyarat Yj bila diberikan Xj = xj untuk j 0adalah
Fungsi probabilitas gabungannya sebagai berikut
p(y11,…,y1n|x111,…,x1ki;β1)= 𝑛𝑖=1𝑝 𝑦1𝑖|𝒙1𝑘𝑖;𝜷𝟏
Untuk mendapatkan penduga kemungkinan maksimum dari β, digunakan
fungsi log-likelihood sebagai berikut :