PENDUGAAN INTENSITAS CURAH HUJAN MAKSIMUM DENGAN GENERALIZED PARETO DISTRIBUTION
(Studi kasus: Intensitas Curah Hujan Kota Semarang Periode 2001-2011)
Putra Eka Wardana
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA
2012 M / 1433 H
i
PENDUGAAN INTENSITAS CURAH HUJAN MAKSIMUM DENGAN GENERALIZED PARETO DISTRIBUTION
(Studi kasus: Intensitas Curah Hujan Kota Semarang Periode 2001-2011)
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains
Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh:
Putra Eka
Wardana 108094000008PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA
2012 M / 1433 H
iii
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN.
Tangerang Selatan, Juni 2012
Putra Eka Wardana 108094000008
iv
PERSEMBAHAN
Skripsi ini ku persembahkan untuk kedua orang tuaku, dan adikku semoga dengan selesainya skripsi ini
merupakan awal dari terbukanya jalanku untuk
membalas segala bentuk perhatian, perlindungan, dan kasih sayang kalian berikan selama ini.
MOTTO
Hai orang-orang yang beriman jadikanlah sabar dan sholat sebagai penolongmu, sesungguhnya Allah SWT beserta orang-orang yang sabar.
(Qs. Al-Baqarah : 45)
Telah pasti datangnya ketetapan Allah SWT,
maka janganlah kamu meminta agar disegerakan (datang) nya.
(Qs. An-Nahl : 1)
v ABSTRAK
PUTRA EKA WARDANA, Pendugaan Intensitas Curah Hujan Maksimum dengan Generalized Pareto Distribution. Studi kasus: Intensitas Curah Hujan Kota Semarang tahun 2001-2011. Di bawah bimbingan Hermawan Setiawan, M.Kom dan Kastolan, M.Si.
Distribusi nilai ekstrim muncul sebagai distribusi dari nilai maksimum atau minimum (nilai ekstrim) dari suatu kejadian dengan peubah acak yang didistribusikan secara bebas dan identik. Distribusi nilai ekstrim digunakan untuk memodelkan suatu resiko yang mungkin terjadi dari suatu kejadian, dengan peluang yang sangat kecil. Generalized Pareto Distribution merupakan salah satu bagian dari distribusi nilai eksrim yang didasarkan pada pengambilan suatu nilai batas 𝑢 bagi nilai ekstrim. Data yang melebihi suatu nilai batas 𝑢, dikategorikan sebagai data yang ekstrim.
Aplikasi dari GPD dalam penelitian ini digunakan untuk menduga intensitas curah hujan maksimum di Kota Semarang. Kota Semarang, merupakan kota yang rentan terhadap akibat buruk dari terjadinya intensitas curah hujan maksimum.
Penelitian serupa dengan GPD pernah dilakukan untuk Kota yang berbeda, namun terbatas hanya dalam penentuan periode tingkat pengembalian saja. Hasil akhir dari penelitian ini yaitu berupa suatu pendugaan nilai intensitas curah hujan maksimum untuk satu hari di Kota Semarang pada periode antara Januari 2012 sampai Juni 2012 yaitu sebesar 86.55 mm. Hasil pendugaan intensitas curah hujan tersebut bisa saja belum merepresentasikan hasil pendugaan terbaik, karena ada kemungkinan diperoleh hasil dugaan yang lebih baik apabila pengambilan periode pendugaannya diperbesar.
Kata kunci: Distribusi Nilai Ekstrim, Generalized Pareto Distribution, Tingkat Pengembalian.
vi ABSTRACT
PUTRA EKA WARDANA, Maximum Rainfall Intensity Estimation by Generalized Pareto Distribution. Case study: Rainfall Intensity of Semarang in 2001-2011. Under the guidance of Hermawan Setiawan, M.Kom and Kastolan, M.Si.
Extreme value distributions arise as the distribution of the maximum or minimum values (extreme values) of an event with random variables are independent and identically distributed. Extrem Value Distribution is used to modelling and measuring events which occur with every small probability. Generalized Pareto Distribution is one part of the distribution extreme value based on the decision of a threshold value of 𝑢 for extreme value. Data that exceeds a threshold value of 𝑢, categorized as extreme data.
Application of the GPD in this study are used to estimate the maximum intensity of rainfall in the Semarang City. The Semarang City, is a city vulnerable to the harmful effects of the maximum rainfall intensity. A similar study by GPD was made to a different city, but limited only to the determination of the period return level. The final results of this study is in the form of a prediction value of the maximum rainfall intensity for a single day in the city of Semarang in the period between January 2012 until Juni 2012 that is equal to 86.55 mm. The results of the estimation of rainfall intensity may not represent the best prediction, because it is possible to get a better prediction results, if the prediction period is enlarged..
Keywords: Extreme Value Distributions, Generalized Pareto Distribution (GPD), Return Level.
vii
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.
Segala puji bagi Allah SWT pencipta semesta alam yang telah memberi nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi ‘Pendugaan Intensitas Curah Hujan Maksimum dengan Generalized Pareto Distribution.
Shalawat serta salam tercurah pada junjungan Nabi Muhammad SAW yang senantiasa memperjuangkan umatnya.
Penyusunan skripsi ini ditujukan sebagai syarat kelulusan yang harus ditempuh mahasiswa Progam Studi Matematika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta dalam mencapai jenjang pendidikan sarjana srata satu.
Pada penyusunan skripsi ini penulis banyak mendapat bantuan dari berbagai pihak, sehingga penulis dapat menyelesaikan laporan ini, Dalam Kesempatan ini penulis ingin menyampaikan terima kasih kepada:
1. Bapak Dr. Syopiansyah Jaya Putra, M.Sis, selaku Dekan Fakultas Sains dan Teknologi.
2. Ibu Yanne Irene, M.Si selaku Ketua Program Studi Matematika.
3. Ibu Suma’inna, M.Si selaku Sekretaris Program Studi Matematika.
4. Bapak Hermawan Setiawan,M.Kom selaku Pembimbing I, terimakasih atas segala bantuan serta dukungan dalam penyusunan skripsi ini.
viii 5. Bapak Kastolan, M.Si selaku Pembimbing II, terimakasih atas bimbingan dan
nasihatnya.
6. Seluruh Dosen Program Studi Matematika, terimakasih atas pengajaran dan ilmu bermanfaat yang telah diberikan kepada penulis.
7. Kedua orangtuaku, terimakasih atas dukungannya baik moril maupun materiil serta doa dan kasih sayang yang tak henti-hentinya.
8. Seluruh teman-teman Matematika angkatan 2008, kompak selalu.
9. Para penyewa kos-kosan Antala’lai nomor 4, terimakasih atas tumpangannya selama masa kuliah.
Penulis menyadari sepenuhnya bahwa skripsi ini masih jauh dari kesempurnaan, masih banyak kekurangan dan kelemahan yang ditemukan, hal ini disebabkan karena keterbatasan kemampuan Penulis. Untuk itu dengan segala kerendahan hati Penulis selalu sedia menerima kritikan dan saran yang sifatnya membangun dari pembaca.
Wassalamu’alaikum Wr.Wb.
Jakarta, Juni 2012
Penulis
ix DAFTAR ISI
HALAMAN JUDUL...………..……… i
PENGESAHAN UJIAN……… ii
PERNYATAAN………. iii
PERSEMBAHAN DAN MOTTO………. iv
ABSTRAK………... v
ABSTRACT……… vi
KATA PENGANTAR………... vii
DAFTAR ISI………... ix
DAFTAR TABEL………... xii
DAFTAR GAMBAR……….. xiii
DAFTAR LAMPIRAN……….. xiv
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah………... . 1
1.2 Perumusan Masalah ……….. 3
1.3 Pembatasan Masalah………. 4
1.4 Tujuan Penulisan……… 4
1.5 Manfaat Penelitian………. 5
BAB II LANDASAN TEORI 2.1 Karakteristik Curah Hujan………. 6
2.2 Pengantar dalam Teori Nilai Ekstrim………. 7
x
2.2.1 Peubah Acak Saling Bebas……….. 7
2.2.2 Kekonvergenan dalam Distribusi………. 9
2.2.3 Peluang Bersyarat……… 11
2.2.4 Supremum dan Infimum……….. 13
2.3 Teori Nilai Ekstrim………. 14
2.4 Generalized Pareto Distribution……… 18
2.5 Pemilihan Nilai Batas untuk GPD………. 21
2.6 Tingkat Pengembalian……… 21
BAB III METODOLOGI 3.1 Metode Pengumpulan Data……….. 24
3.2 Metode Pengolahan Data……….. 24
3.5 Alur Penelitian……….. 27
BAB IV HASIL DAN PEMBAHASAN 4.1 Eksplorasi Data Ekstrim Curah Hujan………. 28
4.2 Penentuan Nilai Batas GPD………. 29
4.3 Pendugaan Parameter GPD………. 32
4.4 Pemeriksaan Ketepatan Model terhadap Sebaran Data…...…… 35
4.5 Peramalan Tingkat Pengembalian……… 38
4.6 Peramalan Nilai Intensitas Curah Hujan Maksimum…………... 42
BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan……….. 44
5.2 Saran……… 45
xi
DAFTAR PUSTAKA……….. 46
LAMPIRAN
xii
DAFTAR TABEL
Tabel 2.1 Kriteria intensitas curah hujan di Indonesia……… 7
Tabel 4.1 Kisaran Curah Hujan Tahunan Stasiun Klimatologi Semarang 2001-2011……… 27
Tabel 4.2 Nilai Batas 𝑢 untuk periode 2 bulan ke depan……… 28
Tabel 4.3 Nilai Batas 𝑢 untuk periode 3 bulan ke depan……… 28
Tabel 4.4 Nilai Batas 𝑢 untuk periode 4 bulan ke depan……… 29
Tabel 4.5 Nilai Batas 𝑢 untuk periode 5 bulan ke depan……… 29
Tabel 4.6 Nilai Batas 𝑢 untuk periode 6 bulan ke depan……… 29
Tabel 4.7 Nilai dugaan parameter untuk periode 2 bulan ke depan……… 30
Tabel 4.8 Nilai dugaan parameter untuk periode 3 bulan ke depan……… 31
Tabel 4.9 Nilai dugaan parameter untuk periode 4 bulan ke depan……… 31
Tabel 4.10 Nilai dugaan parameter untuk periode 5 bulan ke depan……… 32
Tabel 4.11 Nilai dugaan parameter untuk periode 6 bulan ke depan……… 32
Tabel 4.12 Hasil ramalan tingkat pengembalian untuk 2 bulan ke depan………. 36
Tabel 4.13 Hasil ramalan tingkat pengembalian untuk 3 bulan ke depan………. 37
Tabel 4.14 Hasil ramalan tingkat pengembalian untuk 4 bulan ke depan………. 38
Tabel 4.15 Hasil ramalan tingkat pengembalian untuk 5 bulan ke depan………. 38
Tabel 4.16 Hasil ramalan tingkat pengembalian untuk 6 bulan ke depan……….. 38
xiii
DAFTAR GAMBAR
Gambar 2.1 Plot fungsi kepadatan peluang untuk GPD……….. 19
Gambar 3.1 Alur Penelitian……….. 25
Gambar 4.1 Intensitas curah hujan Kota Semarang Tahun 2001 – 2011………. 26
Gambar 4.2 Plot kuantil-kuantil untuk periode 2 bulan ke depan……… 33
Gambar 4.3 Plot kuantil-kuantil untuk periode 3 bulan ke depan……… 34
Gambar 4.4 Plot kuantil-kuantil untuk periode 4 bulan ke depan……….... 34
Gambar 4.5 Plot kuantil-kuantil untuk periode 5 bulan ke depan……… 35
Gambar 4.6 Plot kuantil-kuantil untuk periode 6 bulan ke depan……… 35
Gambar 4.7 Plot kuantil-kuantil periode Januari 2001 sampai Desember 2011.. 40
xiv
DAFTAR LAMPIRAN
Lampiran 1 Tabel fungsi distribusi dan fungsi kepadatan peluang untuk periode tingkat pengembalian 2 bulan ke depan.
Lampiran 2 Tabel fungsi distribusi dan fungsi kepadatan peluang untuk periode tingkat pengembalian 3 bulan ke depan.
Lampiran 3 Tabel fungsi distribusi dan fungsi kepadatan peluang untuk periode tingkat pengembalian 4 bulan ke depan.
Lampiran 4 Tabel fungsi distribusi dan fungsi kepadatan peluang untuk periode tingkat pengembalian 5 bulan ke depan.
Lampiran 5 Tabel fungsi distribusi dan fungsi kepadatan peluang untuk periode tingkat pengembalian 6 bulan ke depan.
Lampiran 6 Tabel perhitungan tingkat pengembalian untuk 2 bulan ke depan.
Lampiran 7 Tabel perhitungan tingkat pengembalian untuk 3 bulan ke depan.
Lampiran 8 Tabel perhitungan tingkat pengembalian untuk 4 bulan ke depan.
Lampiran 9 Tabel perhitungan tingkat pengembalian untuk 5 bulan ke depan.
Lampiran 10 Tabel perhitungan tingkat pengembalian untuk 6 bulan ke depan.
Lampiran 11 Syntax pendugaan parameter GPD dengan MATLAB
1 BAB I PENDAHULUAN
1.1 Latar Belakang Masalah
Cuaca dan iklim sangat mempengaruhi kehidupan makhluk hidup di muka bumi.
Kebiasaan kehidupan makhluk hidup terutama manusia, sangat dipengaruhi oleh keadaan cuaca dan iklim. Hal ini disebabkan karena selama manusia hidup, dalam melakukan kegiatannya manusia selalu memperhitungkan pengaruh cuaca dan iklim.
Sebagai contoh pengaruh curah hujan yang sangat berpengaruh terhadap pola dan kegiatan manusia.
Keberadaan teknologi modern memang tidak bisa menanggulangi pengaruh cuaca secara maksimal. Misalnya jika terjadi suatu bencana yang ditimbulkan oleh cuaca yang buruk, teknologi modern hanya berperan sebatas sebagai metode untuk meramalkan kapan terjadinya cuaca buruk tersebut. Walaupun demikian, dengan keberadaan metode peramalan tersebut, dapat diminimalisir pengaruh ketakterdugaan bila terjadi bencana yang diakibatkan oleh cuaca buruk. Sehingga efek kerugian yang mungkin timbul bisa dikurangi.
Salah satu bentuk dari cuaca buruk yaitu keadaan dimana suatu wilayah mengalami curah hujan yang tinggi. Hal ini disebabkan karena keadaan curah hujan yang turun lebih dari 50 mm/hari. Salah satu dampak buruk yang ditimbulkan dari curah hujan yang tinggi ini, terutama dirasakan oleh sektor pertanian karena lahan pertaniannya tergenang air secara berlebihan, akibatnya bisa menimbulkan gagal panen.
2 Selain itu kemungkinan terjadi bencana longsor dan banjir di kawasan pemukiman, juga merupakan dampak buruk dari tingginya curah hujan yang perlu diwaspadai dan dilakukan tindakan prefentif, agar kerugian yang ditimbulkan dapat diminimalkan.
Kota Semarang yang terletak di Provinsi Jawa Tengah merupakan daerah yang menurut topografinya dibagi menjadi dua wilayah yaitu Semarang bagian bawah dan Semarang bagian atas. Semarang bagian bawah merupakan daerah dataran rendah di sekitar pesisir Laut Jawa, yang apabila hujan turun dengan lebat, maka sungai-sungai di wilayah tersebut meluap. Terlebih lagi, sebagian dataran rendah di Semarang, ketinggiannya berada di bawah permukaan laut. Sementara Semarang bagian atas merupakan daerah yang didominasi oleh perbukitan, yang tentu saja apabila hujan turun dengan lebat, maka daerah ini rawan longsor. Air hujan kiriman dari Semarang atas dapat menimbulkan banjir di Semarang bawah. Dalam mengantisipasi akibat buruk dari intensitas curah hujan yang tinggi, maka dibutuhkan informasi ramalan berkenaan dengan kejadian-kejadian ekstrim maksimum dari intensitas curah hujan.
Penggunaan model sebaran yang dapat menggambarkan pola kejadian-kejadian ekstrim intensitas curah hujan, akan sangat membantu dalam pendugaan kejadian ekstrim curah hujan selanjutnya. Teori Nilai Ekstrim (Extreme Value Theory/EVT) merupakan suatu cara untuk mengkaji kejadian-kejadian ekstrim. Dua buah sebaran yang dimiliki EVT yaitu Generalized Extreme Value Distribution (GEVD) dan Generalized Pareto Distribution (GPD). Pendugaan intensitas curah hujan maksimum dalam penelitian ini menggunakan GPD untuk menghindari kesulitan dalam pemilihan ukuran blok yang digunakan dalam GEVD.
3 Hasil dari analisis pendugaan intensitas curah hujan maksimum di Kota Semarang dengan GPD diharapkan dapat memberikan informasi terhadap Pemerintah setempat, sehingga dapat diambil langkah-langkah yang sesuai untuk meminimalkan akibat buruk yang mungkin timbul. Penelitian dalam skripsi ini didasari oleh penelitian sebelumnya yang dilakukan oleh Muhammad Irfan dengan judul “Sebaran Pareto Terampat untuk Menentukan Curah Hujan Ekstrim. Studi Kasus : Curah Hujan Kota Bogor.” Dalam penelitian sebelumnya hanya dilakukan pendugaan periode tingkat pengembalian curah hujan terbaik, sementara dalam penelitian ini bertujuan untuk memperoleh nilai dugaan dari intensitas curah hujan maksimum.
1.2 Perumusan Masalah
Berikut masalah yang akan dikaji dalam penelitian ini yaitu:
1. Bagaimana menganalisis data intensitas curah hujan maksimum dengan menggunakan GPD?
2. Berapa periode tingkat pengembalian yang paling tepat antara 2, 3, 4, 5, dan 6 bulan untuk melakukan peramalan intensitas curah hujan maksimun di Kota Semarang?
3. Berapakah besar intensitas curah hujan maksimum di Kota Semarang untuk periode ke depan sesuai dengan periode tingkat pengembalian intensitas curah hujan yang paling tepat?
4 1.3 Pembatasan Masalah
Dalam penelitian ini dilakukan pembatasan masalah yaitu data yang digunakan berupa data intensitas curah hujan harian di Kota Semarang pada selang periode antara tahun 2001 sampai tahun 2011. Selain itu periode tingkat pengembalian yang ingin dibandingkan untuk kemudian dicari yang terbaik yaitu antara 2, 3, 4, 5 dan 6 bulan.
Pembatasan masalah terhadap penentuan periode tingkat pengembalian, bertujuan agar hasil yang diperoleh relevan dengan kondisi data yang ada dan juga relevan terhadap penerapannya di kondisi nyata.
1.4 Tujuan Penelitian
Adapun tujuan dari dilakukannya penelitian ini yaitu:
1. Menganalisis data intensitas curah hujan maksimum dengan menggunakan GPD.
2. Menentukan periode tingkat pengembalian yang paling tepat antara 2, 3, 4, 5 dan 6 bulan, untuk melakukan peramalan intensitas curah hujan maksimum di Kota Semarang.
3. Menghitung besar intensitas curah hujan maksimum di Kota Semarang untuk periode ke depan sesuai dengan periode tingkat pengembalian curah hujan yang paling tepat
1.5 Manfaat Penelitian
Manfaat dari analisis intensitas curah hujan maksimum di Kota Semarang dengan menggunakan GPD yaitu memberikan gambaran dugaan intensitas curah hujan
5 maksimum yang dapat dijadikan referensi pengkajian lebih lanjut atau sebagai peringatan dini untuk mengantisipasi terjadinya intensitas curah hujan yang dikategorikan ekstrim (maksimum).
6 BAB II
LANDASAN TEORI
2.1 Karakteristik Curah Hujan
Menurut [1], hujan adalah jatuhnya hydrometeor yang berupa partikel-partikel air dengan diameter 0.5 mm atau lebih. Jika jatuhnya sampai ke tanah maka disebut hujan, akan tetapi bila jatuhnya tidak mencapai ke tanah karena menguap lagi, maka jatuhan tersebut disebut Virga. Hujan juga dapat didefinisikan dengan uap yang mengkondensasi dan jatuh ke tanah dalam rangkaian proses hidrologi.
Hujan merupakan salah satu bentuk pengumpulan uap air yang berasal dari awan yang terdapat di atmosfer. Menurut [1], syarat agar hujan dapat terjadi, diperlukan titik-titik kondensasi amoniak, debu dan asam belerang. Titik kondensasi ini mempunyai sifat dapat mengambil uap air dari udara.
Curah hujan merupakan ketinggian air hujan yang terkumpul dalam tempat yang datar, tidak menguap, tidak meresap, dan tidak mengalir. Satuan curah hujan selalu dinyatakan dalam satuan milimeter atau inchi, namun untuk di Indonesia satuan curah hujan yang digunakan adalah dalam satuan milimeter (mm). Curah hujan 1 (satu) milimeter artinya dalam luasan satu meter persegi pada tempat yang datar tertampung air setinggi satu milimeter atau tertampung air sebanyak satu liter.
Intensitas curah hujan merupakan banyaknya curah hujan persatuan jangka waktu tertentu. Apabila dikatakan intensitasnya besar, berarti hujan lebat dan kondisi ini sangat berbahaya karena berdampak dapat menimbulkan banjir, longsor dan efek
7 negatif terhadap tanaman. Menurut [2], berikut kriteria intensitas curah hujan di wilayah Indonesia:
Tabel 2.1 Kriteria intensitas curah hujan di Indonesia Kategori Curah Hujan Keterangan
Ringan 5-20 mm/hari
Sedang 20-50 mm/hari
Lebat 50-100 mm/hari
Sangat Lebat 100 mm/hari
2.2 Pengantar dalam Teori Nilai Ekstrim.
Teori-teori yang terdapat dalam pengantar teori nilai ekstrim, merupakan teori-teori dasar dalam statistika matematika yang dapat dibaca dalam [3] dan analisis real yang dapat dibaca dalam [4].
2.2.1 Peubah Acak Saling Bebas
Definisi 1. Misalkan peubah acak 𝑋1 dan 𝑋2 mempunyai fungsi kepadatan peluang bersama 𝑓 𝑥1, 𝑥2 , dan fungsi kepadatan peluang marginalnya secara berturut-turut 𝑓1(𝑥1) dan 𝑓2(𝑥2). Peubah acak 𝑋1 dan 𝑋2 dikatakan saling bebas jika dan hanya jika 𝑓 𝑥1, 𝑥2 = 𝑓1(𝑥1)𝑓2(𝑥2). Peubah acak yang tidak saling bebas dikatakan saling bergantung.
Definisi 2. Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 menyatakan 𝑛 buah peubah acak yang saling bebas, masing-masing memiliki fungsi kepadatan peluang 𝑓(𝑥) yang sama, namun
8 mungkin tidak diketahui. Fungsi kepadatan peluang marginal dari 𝑋1, , … , 𝑋𝑛 berturut-turut 𝑓1 𝑥1 = 𝑓 𝑥1 , … , 𝑓𝑛 𝑥𝑛 = 𝑓 𝑥𝑛 . Jadi bentuk fungsi kepadatan peluang bersamanya yaitu 𝑓 𝑥1 … 𝑓 𝑥𝑛 . Peubah acak 𝑋1, … , 𝑋𝑛 kemudian dikatakan merupakan sampel acak dari distribusi dengan fungsi kepadatan peluang 𝑓(𝑥), yang disebut sampel acak dari pengamatan yang didistribusikan secara bebas dan identik.
Teorema 1. Jika 𝑋1 dan 𝑋2 merupakan sampel acak dengan fungsi kepadatan peluang marginalnya secara berturut-turut 𝑓1(𝑋1) dan 𝑓2(𝑋2), maka
Pr 𝑎 < 𝑋1 < 𝑏, 𝑐 < 𝑋2 < 𝑑 = Pr( 𝑎 < 𝑋1 < 𝑏) Pr 𝑐 < 𝑋2 < 𝑑 Untuk setiap 𝑎 < 𝑏 dan 𝑐 < 𝑑, dimana 𝑎, 𝑏, 𝑐, dan 𝑑 merupakan konstanta.
Bukti untuk teorema 1:
Berdasarkan definisi 1, jika 𝑋1 dan 𝑋2 saling bebas, maka bentuk fungsi kepadatan peluang dari X1 dan X2 yaitu 𝑓 𝑥1, 𝑥2 = 𝑓1(𝑥1)𝑓2(𝑥2).
Dalam kasus, jika 𝑋1 dan 𝑋2 merupakan peubah acak diskrit maka Pr 𝑎 < 𝑋1 < 𝑏, 𝑐 < 𝑋2 < 𝑑 = 𝑓1(𝑥1)𝑓2(𝑥2)
𝑐<𝑋2<𝑑 𝑎<𝑋1<𝑏
= 𝑓1(𝑥1)
𝑎<𝑋1<𝑏
𝑓2(𝑥2)
𝑐<𝑋2<𝑑
= Pr( a < X1 < 𝑏) Pr c < X2 < 𝑑 Sementara dalam kasus jika 𝑋1 dan 𝑋2 merupakan peubah acak kontinu maka
9 Pr( a < X1 < 𝑏) Pr c < X2 < 𝑑 = 𝑓1 𝑥1 𝑓2 𝑥2 𝑑𝑥2 𝑑𝑥1
d
c b
a
= 𝑓1 𝑥1 𝑑𝑥1
𝑏
𝑎
𝑓2 𝑥2 𝑑𝑥2
𝑑
𝑐
= 𝑃𝑟( 𝑎 < 𝑋1 < 𝑏) 𝑃𝑟 𝑐 < 𝑋2 < 𝑑
2.2.2 Kekonvergenan dalam Distribusi
Dalam ilmu statistik, sering diperlihatkan contoh dari suatu distribusi dari sebuah peubah acak yang sering bergantung pada bilangan bulat positif 𝑛. Salah satu contohnya yaitu jika peubah acak 𝑋 berdistribusi 𝑏(𝑛, 𝑝), maka distribusi dari 𝑋 bergantung pada 𝑛. Jika terdapat suatu distribusi yang bergantung pada bilangan bulat positif 𝑛, maka fungsi distribusi 𝐹 dari distribusi tersebut juga bergantung pada 𝑛.
Oleh karena itu, fungsi distribusi tersebut dituliskan dengan 𝐹𝑛, dengan fungsi kepadatan peluang 𝑓𝑛.
Apabila kita dihadapkan pada suatu barisan peubah acak 𝑋1, … , 𝑋𝑛 yang bergantung pada 𝑛, maka perlu didefinisikan kekonvergenan dalam distribusi dari barisan peubah acak tersebut.
Definisi 1. Misalkan fungsi distribusi 𝐹𝑛(𝑥) dari peubah acak 𝑋𝑛 bergantung pada 𝑛, 𝑛 = 1,2,3, …. Jika 𝐹(𝑥) adalah sebuah fungsi distribusi dan jika 𝑙𝑖𝑚𝑛→∞𝐹𝑛 𝑥 = 𝐹(𝑥) untuk setiap titik 𝑥, dimana 𝐹(𝑥) kontinu, maka barisan peubah acak 𝑋1, … , 𝑋𝑛 konvergen dalam distribusi ke peubah acak 𝑋 dengan fungsi distribusi 𝐹(𝑥).
10 Fungsi distribusi 𝐹(𝑥) dikatakan “degenerate distribution” pada suatu titik 𝑥 = 𝑐, jika memenuhi:
𝐹 𝑥 = 0, 𝑥 < 𝑐 1, 𝑥 ≥ 𝑐
Jika terdapat barisan peubah acak 𝑋1, … , 𝑋𝑛 yang konvergen dalam distribusi ke peubah acak 𝑋 dengan fungsi distribusi 𝐹(𝑥), maka fungsi distribusi 𝐹1(𝑥), … , 𝐹𝑛(𝑥) juga konvergen dalam distribusi ke fungsi distribusi 𝐹(𝑥).
Berdasarkan kenyataan ini maka 𝐹(𝑥) disebut sebagai “batas distribusi”.
Contoh:
Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 merupakan peubah acak dengan fungsi kepadatan peluang
𝑓 𝑥 = 1
; 0 < 𝑥 < 𝜃, 0 < 𝜃 < ∞𝜃 0 ; 𝑙𝑎𝑖𝑛𝑛𝑦𝑎
dan 𝑌𝑛 adalah statistik urutan ke-𝑛 dari 𝑋1, 𝑋2, … , 𝑋𝑛 maka fungsi kepadatan peluang dari 𝑌𝑛 adalah:
𝑔𝑛 𝑦𝑛 = 𝑛 𝑓 𝑦𝑛 𝐹 𝑦𝑛 𝑛−1
= 𝑛 1
𝜃 𝑦𝑛
𝜃 𝑛−1
= 𝑛 𝑦𝑛𝑛−1
𝜃𝑛 ; 0 < 𝑥 < 𝜃, 0 < 𝜃 < ∞ 0 ; 𝑙𝑎𝑖𝑛𝑛𝑦𝑎
Kemudian bentuk fungsi distribusi dari 𝑌𝑛 adalah:
11 𝐹𝑛 𝑦 = 𝑔𝑛 𝑤 𝑑𝑤
𝑦
0
= 𝑛 𝑤𝑛−1 𝜃𝑛
𝑦
0
𝑑𝑤
= 𝑦 𝜃
𝑛
; 0 ≤ 𝑦 < 𝜃 0 ; 𝑦 < 0 1 ; 𝑦 > 𝜃
maka
𝑛→∞lim 𝐹𝑛 𝑦 = 𝑙𝑖𝑚
𝑛 →∞
𝑦 𝜃
𝑛
= 0 ; −∞ < 𝑦 < 𝜃 1 ; 𝜃 ≤ 𝑦 < ∞
Sekarang ambil
𝐹 𝑦 = 0; −∞ < 𝑦 < 𝜃 1; 𝜃 ≤ 𝑦 < ∞
Sehingga lim𝑛 →∞𝐹𝑛 𝑦 = 𝐹 𝑦 untuk setiap titik dimana 𝐹(𝑦) kontinu. Peubah acak 𝑌𝑛 dikatakan konvergen dalam distribusi terhadap peubah acak 𝑌 dengan fungsi distribusi 𝐹(𝑦) sebagai batas distribusinya.
2.2.3 Peluang Bersyarat
Misalkan fungsi peluang 𝑃(𝐶) yang didefinisikan pada ruang sampel 𝒞.
Kemudian untuk 𝐶1 yang merupakan himpunan bagian dari 𝒞 berlaku 𝑃 𝐶1 > 0.
Jika suatu percobaaan acak hanya fokus terhadap kejadian-kejadian yang berasal dari 𝐶1, maka bisa dikatakan bahwa 𝐶1 suatu ruang sampel baru. Misalkan 𝐶2 merupakan
12 suatu himpunan bagian lain dari 𝒞, maka didefinisikan suatu peluang bersyarat 𝑃(𝐶2 |𝐶1) yaitu merupakan ukuran peluang terjadinya kejadian 𝐶2 relatif terhadap peluang terjadinya kejadian 𝐶1 yang merupakan suatu ruang sampel baru. Berarti peluang bersyarat 𝑃(𝐶2 |𝐶1) menekankan pada kejadian 𝐶2 yang juga merupakan kejadian 𝐶1 atau disimbolkan dengan 𝐶1⋂𝐶2. Sehingga diperoleh persamaan berikut:
𝑃 𝐶1 𝐶1 = 1 dan
𝑃 𝐶2 𝐶1 = 𝑃(𝐶1⋂𝐶2|𝐶1)
Karena rasio antara peluang kejadian 𝐶1⋂𝐶2 dengan peluang kejadian 𝐶1 yang masing-masing relatif terhadap peluang kejadian 𝐶1, sebenarnya hasil yang diperoleh akan sama saja dengan rasio antara peluang kejadian 𝐶1⋂𝐶2 dengan peluang kejadian 𝐶1 yang masing-masing relatif terhadap ruang sampel 𝒞, maka berlaku persamaan berikut:
𝑃(𝐶1⋂𝐶2|𝐶1)
𝑃 𝐶1 𝐶1 = 𝑃(𝐶1⋂𝐶2) 𝑃(𝐶1) Sehingga berdasarkan ketiga persamaan di atas berlaku
𝑃 𝐶2 𝐶1 =𝑃(𝐶1⋂𝐶2)
𝑃(𝐶1) (2.1) yang merupakan definisi yang cocok untuk menyatakan peluang bersyarat dari kejadian 𝐶2 jika diberikan kejadian 𝐶1, dengan 𝑃 𝐶1 > 0.
13 2.2.4 Supremum dan Infimum
Definisi 1. Misalkan 𝑆 suatu himpunan bagian dari ℝ
(i) Bilangan 𝑢 ∈ ℝ dikatakan batas atas dari 𝑆 jika 𝑠 ≤ 𝑢, ∀ 𝑠 ∈ 𝑆.
(ii) Bilangan 𝑤 ∈ ℝ dikatakan batas bawah dari 𝑆 jika 𝑤 ≤ 𝑠, ∀ 𝑠 ∈ 𝑆.
Suatu himpunan bagian 𝑆 dari ℝ mungkin saja tidak mempunyai batas atas atau batas bawah, sebagai contoh jika 𝑆 = ℝ. Tetapi misalkan 𝑆 mempunyai batas atas, maka 𝑆 mempunyai tak hingga banyak batas atas dari 𝑆, maka sebarang 𝑣 ∈ ℝ dengan 𝑣 > 𝑢 juga merupakan batas atas dari 𝑆. Hal ini berlaku juga untuk batas bawah.
Suatu himpunan 𝑆 dikatakan terbatas di atas bila 𝑆 mempunyai batas atas.
Dengan alasan yang sama, himpunan 𝑆 dikatakan terbatas di bawah bila 𝑆 mempunyai batas bawah. Sedangkan suatu himpunan 𝐴 di ℝ dikatakan tidak terbatas, bila 𝐴 tidak mempunyai paling tidak satu dari batas atas atau batas bawah.
Definisi 2. Misalkan 𝑆 merupakan himpunan bagian dari ℝ,
(i) Bila 𝑆 terbatas di atas, maka batas atas 𝑢 ∈ ℝ dikatakan supremum atau batas atas terkecil dari 𝑆 bila, 𝑠 ≤ 𝑢, ∀ 𝑠 ∈ 𝑆, dan jika terdapat sebarang 𝑢′ ∈ ℝ sehingga 𝑠 ≤ 𝑢′ untuk semua 𝑠 ∈ 𝑆, maka berlaku 𝑢 < 𝑢′.
(ii) Bila 𝑆 terbatas di bawah, maka batas bawah 𝑤 ∈ ℝ dikatakan infimum atau batas bawah terbesar dari 𝑆 bila, 𝑠 ≥ 𝑤, ∀ 𝑠 ∈ 𝑆, dan jika terdapat sebarang 𝑤′ ∈ ℝ sehingga 𝑠 ≥ 𝑤′ untuk semua 𝑠 ∈ 𝑆, maka berlaku 𝑤 > 𝑤′.
14 2.3 Teori Nilai Ekstrim
Distribusi nilai ekstrim muncul sebagai distribusi dari nilai maksimum atau minimum (nilai ekstrim) dari suatu kejadian dengan peubah acak yang didistribusikan secara bebas dan identik. Teori nilai ekstrim merupakan suatu teori yang memodelkan dan mengukur kejadian yang terjadi dengan peluang yang sangat kecil. Ini berakibat bahwa dengan teori ini kita dapat memodelkan suatu resiko yang mungkin terjadi dari suatu kejadian dengan peluang yang sangat kecil. Jadi distribusi nilai ekstrim sangat penting dalam ilmu statistik.
Menurut [5], teori nilai ekstrim merupakan bagian dari ilmu statistik, yang inti pembahasannya mengenai cara membuat model dari kejadian-kejadian ekstrim yang didasarkan pada sifat 𝑀𝑛 yaitu:
𝑀𝑛 = 𝑚𝑎𝑘𝑠{𝑋1, 𝑋2, … , 𝑋𝑛}
dimana {𝑋1, 𝑋2, … , 𝑋𝑛} merupakan barisan dari peubah acak 𝑋𝑖 dengan 𝑖 = 1, 2, … , 𝑛 yang didistribusikan secara indentik dan saling bebas yang mempunyai fungsi distribusi 𝐹. Dalam prakteknya, peubah acak 𝑋𝑖 biasanya menyatakan nilai yang merupakan hasil suatu kejadian yang diukur dalam suatu skala waktu, kemudian 𝑀𝑛 merupakan kejadian maksimum dalam 𝑛 unit waktu.
Fungsi distribusi dari 𝑀𝑛 dapat dicari dengan menggunakan cara, yaitu jika untuk setiap peubah acak 𝑋1, 𝑋2, … , 𝑋𝑛 memiliki fungsi kepadatan peluang
𝑓 𝑥𝑖 = 𝑓 𝑥 , 𝑖 = 1, … , 𝑛 maka fungsi distribusi dari 𝑀𝑛 adalah
15 𝐹𝑀𝑛(𝑥) = Pr 𝑀𝑛 ≤ 𝑥
= Pr 𝑋1 ≤ 𝑥, … , 𝑋𝑛 ≤ 𝑥
= Pr 𝑋1 ≤ 𝑥 × … × Pr 𝑋𝑛 ≤ 𝑥
= 𝐹 𝑥 𝑛 (2.2) Berdasarkan persamaan (2.2) dapat diketahui bahwa jika 𝑛 menuju ke tak hingga, maka berlaku :
𝑛 →∞lim 𝐹𝑀𝑛 𝑥 = 1 , 𝑢𝑛𝑡𝑢𝑘 𝐹 𝑥 = 1 0, 𝑢𝑛𝑡𝑢𝑘 𝐹 𝑥 < 1
yang mengalami degenerate distribution pada 𝐹 𝑥 = 1. Kemunculan fungsi yang degenerate distribution tidak diharapkan, karena harus ditemukan suatu fungsi
distribusi 𝐹(𝑥) yang non-degenerate distribution, agar bisa ditemukan fungsi batas distribusi. Cara dalam mengatasi permasalahan ini, yaitu dengan melakukan normalisasi linear dengan maksud untuk mereduksi nilai tertinggi dari data. Hal ini didasari oleh teorema berikut yang dapat dibaca pada [6] :
Teorema Fundamental Nilai Ekstrim (Fisher-Tippet 1928; Gnedenko, 1943).
Jika terdapat proses normalisasi dengan konstanta 𝑎𝑛 > 0 dan 𝑏𝑛 ∈ ℝ sedemikian sehingga
𝑛 ⟶∞lim Pr 𝑎𝑛−1(𝑚𝑎𝑥 𝑋1, … , 𝑋𝑛 − 𝑏𝑛) ≤ 𝑥 = 𝐺(𝑥) maka fungsi distribusi 𝐺 yang non-degenerate akan memiliki bentuk
𝐺 𝑥 = 𝑒𝑥𝑝 − 1 + 𝜉𝑥 −1 𝜉 , 𝜉 ≠ 0 𝑒𝑥𝑝 −𝑒𝑥𝑝 −𝑥 , 𝜉 = 0
16 untuk semua nilai 𝑥 sehingga 1 + 𝜉𝑥 > 0, dengan indeks nilai ekstrim 𝜉 ∈ ℝ.. Jika nilai 𝜉 ⟶ 0, maka 𝐺 𝑥 akan tereduksi menjadi berdistribusi Gumbel.
Menurut Von Mises (1936) [7], dengan melakukan standarisasi fungsi distribusi 𝐺 𝑥 , yaitu dengan memasukan parameter lokasi 𝜇 dan parameter skala 𝜎 kedalamnya, maka fungsi distribusi 𝐺 𝑥 memiliki nama Generalized Extreme Value Distribution (GEVD), dengan bentuk:
𝐺 𝑥 =
exp − 1 + 𝜉 𝑥−𝜇
𝜎
−1 𝜉
, 𝜉 ≠ 0 exp −𝑒𝑥𝑝 − 𝑥−𝜇
𝜎 , 𝜉 = 0
(2.3)
dengan syarat: 1 + 𝜉(𝑧 − 𝜇)/𝜎 > 0 Keterangan:
𝜇 : parameter lokasi, dimana −∞ < 𝜇 < ∞ 𝜎 : parameter skala, dimana 𝜎 > 0
𝜉 : parameter bentuk, dimana −∞ < 𝜉 < ∞
GEVD merupakan suatu distribusi yang dibentuk dari penggabungan tiga buah distribusi nilai ekstrim yaitu distribusi Gumbel, Frechet, dan Weibull menjadi sebuah keluarga distribusi. Hal ini dikarenakan, terdapat kesulitan untuk menentukan salah satu dari ketiga distribusi nilai ekstrim tersebut yang dianggap paling tepat digunakan dalam pendugaan parameter. Sehingga cara yang paling tepat yaitu dengan menggabungkan ketiga distribusi tersebut kedalam satu keluarga distribusi yaitu GEVD. Berikut bentuk fungsi distribusi dari ketiga distribusi nilai ekstrim :
17 I. 𝐺 𝑧 = 𝑒𝑥𝑝 −𝑒𝑥𝑝 − 𝑥−𝜇
𝜎 , −∞ < 𝑥 < ∞
II. 𝐺 𝑧 =
0 𝑥 ≤ 𝜇 𝑒𝑥𝑝 − 𝑥−𝜇
𝜎
−𝜉 𝑥 > 𝜇
III. 𝐺 𝑧 = 𝑒𝑥𝑝 − − 𝑥−𝜇
𝜎
𝜉
𝑥 < 𝜇 1 𝑥 ≥ 𝜇
(2.4)
Untuk ketiga bentuk fungsi distribusi di atas berlaku 𝑎 > 0 dan 𝑏 bernilai real. Dalam bentuk II dan III berlaku 𝛼 > 0. Ketiga bentuk distribusi di atas diberi nama Extreme Value Distribution (EVD), dengan bentuk I, II, dan III secara berturut-turut
merupakan sebaran Gumbel, Frechet, dan Weibull.
Menurut [8], Setelah parameter lokasi 𝜉 diperoleh dari GEVD, maka kita akan dapat menentukan distribusi yang paling tepat dari EVD dengan aturan sebagai berikut : 1. Distribusi tipe II (Frechet) diperoleh ketika 𝜉 > 0
2. Distribusi tipe III (Weibull) diperoleh ketika 𝜉 < 0 3. Distribusi tipe I (Gumbel) diperoleh ketika 𝜉 → 0
Dalam proses memodelkan nilai ekstrim dengan menggunakan GEVD, mengharuskan kita untuk membagi data pengamatan menjadi sebanyak 𝑛 blok yang sama besar ukurannya. Besar ukuran satu blok yang digunakan misalkan berupa data harian dalam satu tahun. Dari masing-masing blok ke-𝑖 tersebut, kemudian diambil satu nilai maksimum 𝑥𝑖, sehingga perhitungan GEVD didasarkan pada rangkaian nilai maksimum 𝑥1, 𝑥2, … 𝑥𝑛 untuk setiap blok. Menurut [9], tentu saja cara pengambilan nilai maksimum berdasarkan blok, akan membuang banyak informasi
18 dari data yang tersedia jika pemilihan ukuran setiap bloknya cukup besar, sehingga memunculkan masalah bias dan ragam yang besar juga.
2.4 Generalized Pareto Distribution (GPD)
Dalam memodelkan suatu data ekstrim dengan menggunakan teori nilai ektrim, untuk mengatasi kesulitan pemilihan ukuran blok yang tepat dalam GEVD, maka dicari cara lain yang lebih efisien. Bardasarkan [10], cara lain dalam memodelkan nilai ekstrim yaitu diawali dengan mengatakan bahwa data yang digolongkan ke dalam nilai ekstrim merupakan data yang melampaui suatu nilai batas 𝑢 (Peaks Over Threshold / POT). Misalkan 𝑋 merupakan peubah acak dengan fungsi distribusi 𝐹. Didefinisikan suatu titik akhir dari fungsi distribusi 𝐹 yaitu 𝑥∗ = 𝑠𝑢𝑝 𝑥 ∈ ℝ: 𝐹 𝑥 < 1 . Diberikan suatu bilangan real 𝑢 < 𝑥∗, sehingga nilai kejadian 𝑦 adalah nilai yang melampaui nilai batas 𝑢 yang dirumuskan dengan 𝑦𝑖 = 𝑥𝑖 − 𝑢, dan 𝑥𝑖 dimana 𝑖 = 1, 2, … , 𝑘 merupakan data asli pengamatan. Misalkan 𝑦1, … , 𝑦𝑘, dengan 𝑘 merupakan banyaknya nilai yang melampaui nilai batas 𝑢. Jika diberikan barisan peubah acak 𝑋1, … , 𝑋𝑛 yang didistribusikan secara bebas dan identik, dan mempunyai fungsi distribusi 𝐹, maka terdapat peluang bersyarat yang didasari pada rumus 2.1 yaitu :
𝐹𝑢 𝑦 = 𝑃(𝑋 ≤ 𝑢 + 𝑦 𝑋 > 𝑢) = 𝐹 𝑢+𝑦1−𝐹(𝑢)−𝐹(𝑢) (2.5)
19 Sehingga untuk nilai 𝑢 yang besar, peluang bersyarat untuk 𝑋 − 𝑢 terhadap 𝑋 > 𝑢, pendekatannya diberikan oleh Generalized Pareto Distribution (GPD) dengan bentuk fungsi distribusinya sebagai berikut:
𝐻 𝑦; 𝜉, 𝜎 = 1 − 1 +𝜉𝑦
𝜎
−1 𝜉 , 𝜉 ≠ 0 1 − 𝑒𝑥𝑝 −𝑦
𝜎 , 𝜉 = 0
(2.6)
yang didefinisikan pada 𝑦 𝑦 > 0 𝑑𝑎𝑛 1 + 𝜉𝑦 𝜎 > 0 , 𝑦 > 0 dengan 𝜎 > 0 dan dimana 𝜎 = 𝜎 + 𝜉(𝑢 − 𝜇).
Menurut Pickand (1975) yang dapat dibaca dalam [11], untuk nilai batas 𝑢 yang cukup besar, sebuah model asimtotik untuk 𝐹𝑢 𝑦 pada Persamaan (2.4) memiliki bentuk GPD dengan penjelasan berikut:
𝑢⟶𝑥lim∗ sup
0<𝑦 <𝑥∗−𝑢 𝐹𝑢 𝑦 − 𝐻 𝑦; 𝜉, 𝜎 = 0 yang berarti peluang bersyarat 𝐹𝑢 𝑦 konvergen menuju 𝐻 𝑦; 𝜉, 𝜎 .
Seperti GEVD, parameter 𝜉 dominan digunakan untuk menentukan kriteria dari distribusi GPD:
1. Jika 𝜉 < 0, maka distribusi terbatas oleh 𝑢 − 𝜎 /𝜉, dan merupakan keluarga dari distribusi beta.
2. Jika 𝜉 > 0, maka distribusi tidak terbatas, dan merupakan keluarga dari distribusi pareto.
3. Jika 𝜉 = 0, maka distribusi juga tidak terbatas dan merupakan keluarga dari distribusi eksponensial dengn parameter 1/𝜎 .
20 Bentuk dari fungsi kepadatan peluang dari GPD dapat dinyatakan sebagai berikut:
𝑦 =
1
𝜎 1 +𝜉𝑦
𝜎
−1𝜉−1
, 𝜉 ≠ 0
1
𝜎𝑒𝑥𝑝 −𝑦
𝜎 , 𝜉 = 0
(2.7)
Gambar 2.1 Plot fungsi kepadatan peluang untuk GPD
Untuk melakukan pendugaan parameter dari GPD, maka digunakan metode Maximum Likelihood Estimator. Bentuk dari fungsi log kemungkinannya beradasarkan fungsi kepadatan peluang GPD adalah sebagai berikut:
ℓ 𝜎 , 𝜉 = −𝑘 log 𝜎 − 1 +1
𝜉 log 1 + 𝜉𝑦𝑖
𝜎 , 𝜉 ≠ 0
𝑘𝑖=1
−𝑘 log 𝜎 − 𝜎 −1 𝑘𝑖=1𝑦𝑖 ,𝜉 = 0
(2.8)
Berdasarkan fungsi log kemungkinan di atas, menurut [12], maka proses pendugaan parameternya membutuhkan perhitungan secara numerik dengan metode Newton Rhapson.
21 2.5 Pemilihan Nilai Batas untuk GPD
Pemilihan suatu nilai batas yang tepat untuk GPD merupakan suatu hal yang harus benar-benar diperhatikan. Hal ini dapat disejajarkan dengan penetuan ukuran blok untuk GEVD. Apabila, ukuran nilai batas 𝑢 yang dipilih terlalu besar, maka akan dihasilkan penduga yang bias bagi GPD, sementara jika nilai batas yang dipilih terlalu kecil maka akan banyak data yang melampaui nilai batas, sehingga akan menghasilkan ragam yang besar.
Menurut [12], terdapat cara yang praktis dalam menentukan nilai batas yaitu dengan menggunakan metode persentase. Berdasarkan studi simulasi komparatif, pemilihan nilai batas dapat dilakukan dengan memilih nilai batas sehingga persentase data yang berada di atas nilai batas kurang lebih sekitar 10 %. Meskipun metode ini terlihat sangat sederhana dalam menentukan nilai batas, namun dengan melakukan perubahan kecil terhadap nilai batas, hanya akan berdampak kecil terhadap perolehan hasil pendugaan yang dilakukan.
2.6 Tingkat Pengembalian
Menurut [10], dalam menduga suatu kejadian ekstrim dengan GPD, tentu saja tidak hanya terbatas pada pendugaan parameter GPD, namun perlu untuk diketahui nilai dari kejadian ekstrim di atas kuantil ke- 1 − 1 𝑚 , pada periode pengembalian 𝑚 pengamatan, yang sering disebut sebagai tingkat pengembalian dari penduga GPD.
Berdasarkan [5], tingkat pengembalian merupakan nilai maksimum yang diharapkan
22 untuk dilampaui satu kali pada suatu periode pengamatan dengan panjang 𝑚 pengamatan.
Dasar dari perhitungan tingkat pengembalian, diawali dengan suatu peluang tidak bersyarat dari peubah acak 𝑋 yaitu Pr 𝑋 > 𝑥 dengan 𝑥 > 𝑢. Misalkan 𝛿𝑢 = Pr 𝑋 > 𝑢 dan berdasarkan peluang bersyarat berikut:
Pr 𝑋 > 𝑥 𝑋 > 𝑢 =Pr(𝑋 > 𝑥) Pr 𝑋 > 𝑢 1 − Pr 𝑋 < 𝑥 𝑋 > 𝑢 =Pr(𝑋 > 𝑥)
𝛿𝑢
1 − 1 − 1 +𝜉 𝑥 − 𝑢 𝜎
−1 𝜉
= Pr(𝑋 > 𝑥) 𝛿𝑢
1 +𝜉(𝑥 − 𝑢) 𝜎
−1 𝜉
= Pr(𝑋 > 𝑥) 𝛿𝑢 diperoleh bahwa
Pr 𝑋 > 𝑥 = 𝛿𝑢 1 + 𝜉 𝑥−𝑢
𝜎
−1 𝜉
Secara spesifik, penghitungan tingkat pengembalian dihubungkan dengan suatu periode pengambalian yaitu 𝑚, sehingga persamaan di atas berubah menjadi
1
𝑚 = 𝛿𝑢 1 + 𝜉 𝑥𝑚−𝑢
𝜎
−1 𝜉
Karena 𝑥𝑚 merupakan nilai maksimum yang secara rata-rata dilampaui satu kali untuk setiap 𝑚 pengamatan, maka solusinya yaitu:
𝑥𝑚 = 𝑢 +𝜎
𝜉 𝑚𝛿𝑢 𝜉 − 1 (2.9)
23 persamaan di atas berlaku untuk nilai 𝑥𝑚 > 𝑢.
Besarnya nilai peluang dari 𝛿𝑢 = Pr 𝑋 > 𝑢 , dapat diduga dengan menggunakan 𝛿 𝑢 = 𝑘/𝑛 keterangan:
𝑘 : banyaknya nilai yang melebihi nilai ambang 𝑢
𝑛 : banyaknya keseluruhan data pengamatan yang digunakan.
24 BAB III
METODOLOGI PENELITIAN
3.1 Metode Pengumpulan Data
Data yang penulis gunakan dalam penulisan skripsi ini merupakan data sekunder, yaitu data mengenai intensitas curah hujan harian pada Stasiun Klimatologi Klas I Semarang dari periode 2001 sampai 2011. Pengambilan data dilakukan di kantor Balai Besar Badan Meteorologi, Klimatologi, dan Geofisika Wilayah II, Jl. Kp. Bulak Raya No. 5 Cempaka Putih, Ciputat, Kota Tangerang Selatan.
3.2 Metode Pengolahan Data
Pengolahan data dilakukan dengan menggunakan GPD untuk mendapatkan besarnya tingkat pengembalian curah hujan maksimum dan menentukan periode tingkat pengembalian yang tepat untuk terjadinya curah hujan maksimum, dengan tahapan sebagai berikut:
1. Pendeskripsian data curah hujan dengan menggunakan grafik untuk melihat adanya curah hujan esktrim yang digolongkan sebagai curah hujan maksimum.
2. Pembagian data menjadi beberapa periode tingkat pengembalian yaitu 2, 3, 4, 5, dan 6 bulan ke depan. Prosesnya yaitu data dari periode 2001 sampai 2008 digunakan sebagai data awal pembuat model GPD untuk setiap periode pengembalian.
Kemudian data periode 2009 sampai 2011 digunakan untuk menghitung tingkat pengembalian untuk 2, 3, 4, 5, dan 6 bulan ke depan.
25 3. Penentuan nilai batas dengan menggunakan metode persentase berdasarkan[12],
dengan tahapan-tahapan sebagai berikut:
a. Mengurutkan data curah hujan dari yang terbesar hingga terkecil
b. Hitung banyaknya keseluruhan data, dan kalikan dengan 10% sehingga nilai yang dihasilkan merupakan 10% data teratas.
c. Mengurutkan data mulai dari data teratas menuju ke bawah dan berhenti pada nilai hasil perkalian 10% tadi, sehingga diperoleh 10% data teratas yang masuk sebagai nilai ekstrim.
d. Batas bawah dari 10% data teratas tersebut akan menjadi nilai batas yang terpilih.
4. Pendugaan parameter GPD yang terdapat pada Persamaan 2.6, yaitu 𝜎 dan 𝜉 dengan menggunakan metode Maximum Likelihood Estimator.
5. Pemeriksaan model GPD dilakukan dengan menggunakan plot kuantil-kuantil.
Menurut [13], plot kuantil-kuantil digunakan untuk memeriksa kesesuaian pola sebaran data sampel dengan pola sebaran teoritik. Berikut cara untuk membangun plot kuantil:
a. Urutkan data menjadi 𝑦1 ≤ ⋯ ≤ 𝑦𝑖 ≤ ⋯ ≤ 𝑦𝑘 , dengan 𝑖 = 1, … , 𝑘, 𝑦𝑖 = 𝑥𝑖 − 𝑢 dan 𝑥𝑖 > 𝑢.
b. Untuk setiap 𝑦𝑖, tentukan nilai 𝑝𝑖 dengan 𝑝𝑖 = (𝑖 − 0.5)/𝑘 c. Membuat plot kuantil-kuantil dengan koordinat sebagai berikut:
𝐻−1 𝑝𝑖 , 𝑦𝑖
26 dengan 𝐻−1 merupakan invers dari fungsi distribusi GPD yang dapat dinyatakan sebagai berikut:
𝐻−1(𝑝) = 𝜎
𝜉 1 − 𝑝 −𝜉 − 1 , 𝜉 ≠ 0
−𝜎 ln 1 − 𝑝 , 𝜉 = 0
Apabila plot kuantil-kuantil membentuk pola garis linear, maka model dikatakan sesuai dengan sebaran data yang digunakan.
6. Pendugaan besarnya tingkat pengembalian curah hujan maksimum untuk masing-masing periode tingkat pengembalian
7. Pengukuran besarnya tingkat kesalahan antara nilai aktual (intensitas curah hujan maksimum dalam suatu periode) dengan nilai tingkat pengembalian menggunakan Root Mean Square Percentage Error (RMSPE). Hal ini digunakan untuk memilih periode tingkat pengembalian intensitas curah hujan paling tepat, berdasarkan nilai RMSPE terkecil. Rumusan RMSPE adalah sebagai berikut yang dapat dilihat di [14]:
𝑅𝑀𝑆𝑃𝐸 =
𝐴 𝑡−𝐹𝑡 𝐴 𝑡 𝑛 2 𝑡=1
𝑛 × 100% (3.1) Keterangan:
𝐴𝑡: data aktual ke-t, dan 𝐴𝑡 ≠ 0 𝐹𝑡: data ramalan ke-t
8. Menduga curah hujan maksimum yang akan terjadi di masa mendatang berdasarkan periode tingkat pengembalian yang paling tepat.
27 3.3 Alur Penelitian
Gambar 3.1 Alur Penelitian
Data pembentukan model GPD Data untuk Validasi GPD
Membagi data tahun 2001-2011 menjadi beberapa periode tingkat pengembalian yaitu 2, 3, 4, 5, dan 6 bulan ke depan yang
dimulai di tahun 2009
Menentukan nilai batas (𝑢) untuk masing-
masing periode tingkat pengembalian Membagi data tahun 2009-2011 menjadi periode 2, 3, 4, 5, dan 6
bulan ke depan
Menentukan nilai tingkat pengembalian untuk masing-masing periode Uji ketepatan model GPD masing-masing
periode dengan plot kuantil -kuantil Menentukan nilai parameter GPD 𝜉, 𝜎
masing-masing periode
Mengambil nilai maksimum dari masing-masing periode
Menyesuaikan data model dan data validasi sesuai dengan periodenya
Mengambil periode tingkat pengembalian terbaik yang memiliki nilai RMSPE terkecil.
Menghitung nilai RMSPE masing-masing periode
Pendeskripsian Data
Meramalkan curah hujan maksimum ke depan, berdasarkan periode tingkat pengembalian terbaik
28 BAB IV
HASIL DAN PEMBAHASAN
4.1 Eksplorasi Data Ekstrim Curah Hujan
Pada sub bab ini, berisikan informasi mengenai terjadinya intensitas curah hujan ekstrim yang dikategorikan maksimum pada Stasiun Klimatologi Semarang.
Berdasarkan gambar 4.1, terlihat bahwa pada data intensitas curah hujan harian antara tahun 2001 sampai tahun 2011, terdapat adanya nilai-nilai ekstrim.
Gambar 4.1 Intensitas curah hujan Kota Semarang Tahun 2001 – 2011
Sementara pada tabel 4.1 memperlihatkan kisaran curah hujan antara tahun 2001 sampai 2011.
29 Tabel 4.1 Kisaran Curah Hujan Tahunan Stasiun Klimatologi Semarang 2001-2011
Tahun Kisaran Curah Hujan (mm) Hari dengan Curah Hujan > 50 mm
2001 0 – 109 6 hari
2002 0 – 98 6 hari
2003 0-106 9 hari
2004 0 – 85 6 hari
2005 0 – 98 10 hari
2006 0 - 152 6 hari
2007 0 - 108 10 hari
2008 0 - 119 16 hari
2009 0 - 135 9 hari
2010 0 - 139 12 hari
2011 0 - 106 9 hari
Tabel 4.1, berisikan informasi bahwa kisaran hujan yang paling tinggi terjadi pada tahun 2006 yaitu antara 0 sampai 152 mm. Berdasarkan informasi pada tabel 4.1, bahwa daerah Semarang mempunyai kisaran intensitas curah hujan yang tinggi, maka tepat untuk dilakukan analisis mengenai intensitas curah hujan ekstrim (maksimum). Hal ini dimaksudkan agar mengurangi efek kerugian yang mungkin saja timbul dari kejadian intensitas curah hujan ekstrim tersebut. Dalam penelitian ini data intensitas curah hujan dibagi menjadi dua bagian yaitu data tahun 2001 sampai 2008 digunakan sebagai data analisis, dan data tahun 2009 sampai 2011 digunakan sebagai validasi. Proses analisis data dalam penelitian ini dibagi menjadi 5 periode tingkat pengembalian yaitu untuk 2, 3, 4, 5 dan 6 bulan tingkat pengembalian.
4.2 Penentuan Nilai Batas GPD
Dalam melakukan pendugaan nilai ekstrim dengan menggunakan GPD, terlebih dahulu harus dicari nilai batas 𝑢 dari data yang dimiliki. Hal ini dimaksudkan
30 agar nilai-nilai pengamatan yang nilainya lebih besar daripada nilai batas 𝑢, dikategorikan sebagai nilai ekstrim berdasarkan GPD. Menurut [12], cara untuk menentukan nilai batas 𝑢 yaitu dengan menggunakan metode persentase. Pemilihan nilai batas dapat dilakukan dengan memilih nilai batas sehingga persentase data yang berada di atas nilai batas kurang lebih sekitar 10 %.
Awal dari proses penentuan nilai batas 𝑢 yaitu dengan mengurutkan data pengamatan dari yang terbesar sampai yang terkecil. Setelah itu, 10% data pengamatan terbesar dikategorikan sebagai nilai ekstrim, kemudian nilai terkecil dari 10% data tersebut disebut sebagai nilai batas 𝑢. Tabel 4.2 sampai 4.6 berisikan nilai batas 𝑢 yang terpilih dalam setiap periode analisis.
Tabel 4.2 Nilai Batas 𝑢 untuk periode 2 bulan ke depan
Periode Analisis Nilai Batas 𝑢 Banyak nilai Pengamatan di atas 𝑢
Januari 2001 - Desember 2008 22 286
Januari 2001 - Februari 2009 23 281
Januari 2001 - April 2009 23 287
Januari 2001 - Juni 2009 23 293
Januari 2001 - Agustus 2009 23 295
Januari 2001 - Oktober 2009 22 318
Tabel 4.3 Nilai Batas 𝑢 untuk periode 3 bulan ke depan
Periode Analisis Nilai Batas 𝑢 Banyak nilai Pengamatan di atas 𝑢
Januari 2001 - Desember 2008 22 286
Januari 2001 - Maret 2009 23 282
Januari 2001 - Juni 2009 23 293
Januari 2001 - September 2009 22 318
Januari 2001 - Desember 2009 22 327
Januari 2001 - Maret 2010 23 325
31 Tabel 4.4 Nilai Batas 𝑢 untuk periode 4 bulan ke depan
Periode Analisis Nilai Batas 𝑢 Banyak nilai Pengamatan di atas 𝑢
Januari 2001 - Desember 2008 22 286
Januari 2001 - April 2009 23 287
Januari 2001 - Agustus 2009 23 295
Januari 2001 - Desember 2009 22 327
Januari 2001 - April 2010 23 326
Januari 2001 - Agustus 2010 23 339
Tabel 4.5 Nilai Batas 𝑢 untuk periode 5 bulan ke depan
Periode Analisis Nilai Batas 𝑢 Banyak nilai Pengamatan di atas 𝑢
Januari 2001 - Desember 2008 22 286
Januari 2001 - Mei 2009 23 292
Januari 2001 - Oktober 2009 22 318
Januari 2001 - Maret 2010 23 325
Januari 2001 - Agustus 2010 23 339
Januari 2001 - Januari 2011 23 361
Tabel 4.6 Nilai Batas 𝑢 untuk periode 6 bulan ke depan
Periode Analisis Nilai Batas 𝑢 Banyak nilai Pengamatan di atas 𝑢
Januari 2001 - Desember 2008 22 286
Januari 2001 - Juni 2009 23 293
Januari 2001 - Desember 2009 22 327
Januari 2001 - Juni 2010 23 335
Januari 2001 - Desember 2010 23 357
Januari 2001 - Juni 2011 23 373
Dari tabel 4.2 sampai 4.6 terlihat bahwa nilai batas 𝑢 berkisar antara 22 sampai 23 untuk setiap periode analisisnya.
32 4.3 Pendugaan Parameter GPD
Pendugaan parameter GPD dapat dikatakan merupakan hal yang sangat menentukan hasil dari analisis nilai ekstrim dengan menggunakan GPD. Parameter- parameter GPD yang dapat memaksimumkan peluang dari GPD merupakan tujuan utama dari pendugaan parameter. Oleh karena itu, dalam penelitian ini digunakan metode pendugaan kemungkinan maksimum dalam menduga parameter GPD.
Berdasarkan bentuk fungsi kepadatan peluang GPD terdapat dua buah parameter yang diduga yaitu parameter bentuk 𝜉 dan skala 𝜎. Parameter bentuk 𝜉 menyatakan bentuk titik ujung kanan dari fungsi peluang GPD. Sementara parameter skala 𝜎 menyatakan pola keragaman data atau lebar kecilnya bentuk dari fungsi peluangnya. Tabel 4.7 sampai 4.11 memperlihatkan hasil pendugaan parameter dengan untuk setiap periode analisis.
Tabel 4.7 Nilai dugaan parameter untuk periode 2 bulan ke depan
Periode Analisis Nilai Batas 𝑢 𝜉 𝜎
Januari 2001 - Desember 2008 22 -0.0321 22.0839 Januari 2001 - Februari 2009 23 -0.0336 22.6080 Januari 2001 - April 2009 23 -0.0342 22.5680 Januari 2001 - Juni 2009 23 -0.0352 22.5991 Januari 2001 - Agustus 2009 23 -0.0300 22.3529 Januari 2001 - Oktober 2009 22 -0.0058 21.2925
Tabel 4.7, memperlihatkan bahwa nilai 𝜉 < 0 untuk setiap periode analisis, yang berarti fungsi peluangnya memiliki nilai ujung kanan yang terbatas. Sementara nilai dari 𝜎 untuk setiap periode analisis berkisar antara 21 sampai 22. Periode analisis Januari 2001 – Februari 2009 memiliki nilai 𝜎 terbesar pada periode 2 bulan
33 ke depan, yaitu sebesar 22.6080. Artinya pada periode analisis ini nilai ekstrim curah hujannya lebih bervariasi jika dibandingkan dengan periode analisis lainnya.
Tabel 4.8 Nilai dugaan parameter untuk periode 3 bulan ke depan
Periode Analisis Nilai Batas 𝑢 𝜉 𝜎
Januari 2001 - Desember 2008 22 -0.0321 22.0839 Januari 2001 - Maret 2009 23 -0.0328 22.5466 Januari 2001 - Juni 2009 23 -0.0352 22.5991 Januari 2001 - September 2009 22 -0.0058 21.2925 Januari 2001 - Desember 2009 22 -0.0140 21.6080 Januari 2001 - Maret 2010 23 -0.0295 22.4730
Berdasarkan tabel 4.8, terlihat bahwa nilai 𝜉 < 0 untuk setiap periode analisis, yang berarti fungsi peluangnya memiliki nilai ujung kanan yang terbatas. Sementara nilai dari 𝜎 untuk setiap periode analisis berkisar antara 21 sampai 22.
Tabel 4.9 Nilai dugaan parameter untuk periode 4 bulan ke depan
Periode Analisis Nilai Batas 𝑢 𝜉 𝜎
Januari 2001 - Desember 2008 22 -0.0321 22.0839 Januari 2001 - April 2009 23 -0.0342 22.5680 Januari 2001 - Agustus 2009 23 -0.0300 22.3529 Januari 2001 - Desember 2009 22 -0.0140 21.6080 Januari 2001 - April 2010 23 -0.0282 22.6279 Januari 2001 - Agustus 2010 23 -0.0367 22.7385
Berdasarkan tabel 4.9, terlihat bahwa nilai 𝜉 < 0 untuk setiap periode analisis, yang berarti fungsi peluangnya memiliki nilai ujung kanan yang terbatas. Sementara nilai dari 𝜎 untuk setiap periode analisis berkisar antara 21 sampai 22.