PENDEKATAN NEWTON RAPHSON UNTUK OPTIMASI FUNGSI LIKELIHOOD PADA PENAKSIRAN
PARAMETER DISTRIBUSI GAMMA
SKRIPSI
TRI SUCI RAHMADANI 150803076
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2019
PENDEKATAN NEWTON RAPHSON UNTUK OPTIMASI FUNGSI LIKELIHOOD PADA PENAKSIRAN
PARAMETER DISTRIBUSI GAMMA
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
TRI SUCI RAHMADANI 150803076
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2019
PERNYATAAN ORISINALITAS
PENDEKATAN NEWTON RAPHSON UNTUK OPTIMASI FUNGSI LIKELIHOOD PADA PENAKSIRAN
PARAMETER DISTRIBUSI GAMMA
SKRIPSI
Menyatakan dengan sebenarnya bahwa skripsi yang saya serahkan ini benar-benar merupakan hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, Juni 2019
Tri Suci Rahmadani 150803076
PENGESAHAN SKRIPSI
Judul : Pendekatan Newton Raphson Untuk Optimasi Fungsi Likelihood Pada Penaksiran Distribusi Gamma
Nama : Tri Suci Rahmadani
Nomor Induk Mahasiswa : 150803076
Program Studi : Sarjana (S1) Matematika Departemen : Matematika
Fakultas : Matematika Dan Ilmu Pengetahuan Alam Universitas Sumatera Utara
Disetujui di Medan, Juni 2019
Ketua Departemen Matematika
FMIPA USU Pembimbing,
Dr. Suyanto, M.Kom Dr. Sutarman, M.Sc
NIP. 19590813 198601 1 002 NIP. 19631026 199103 1 001
ii
PENDEKATAN NEWTON RAPHSON UNTUK OPTIMASI FUNGSI LIKELIHOOD PADA PENAKSIRAN
PARAMETER DISTRIBUSI GAMMA
ABSTRAK
Penaksiran parameter merupakan suatu metode untuk mengetahui sekitar berapa nilai-nilai populasi dengan menggunakan nilai-nilai sampel. Nilai populasi yang ditaksir adalah suatu nilai rata-rata.
Teori penaksiran digolongkan menjadi dua, yaitu penaksiran titik (point estimation) dan penaksiran interval (interval estimation).
Beberapa metode penaksiran titik yang digunakan untuk menaksir parameter adalah Metode Momen, Metode Maksimum Likelihood, dan Metode Bayes. Dalam penelitian ini, dilakukan penaksiran parameter Distribusi Gamma dengan menggunakan metode maksimum likelihood. Metode ini mempunyai beberapa kriteria atau bersifat takbias (unbias), efisien dan konsisten, sehingga untuk mencapai penaksiran titik yang baik dapat dicari dan diketahui dengan metode maksimum likelihood. Karena differensial parsial fungsi log likelihood tidak dapat diselesaikan secara analitik, maka dilakukan pendekatan numerik yaitu dengan metode newton raphson.
Metode Newton Raphson merupakan salah satu metode iterasi yang digunakan untuk menyelesaikan permasalahan non linear.
Kata Kunci: Penaksiran Parameter, Distribusi Gamma, Metode Maksimum Likelihood, Metode Newton Raphson
NEWTON RAPHSON APPROACH FOR THE OPTIMIZATION OF LIKELIHOOOD FUNCTION IN PARAMETER
ESTIMATION OF GAMMA DISTRIBUTION
ABSTRACT
Parameter estimation is a method to estimate the population number by using the number of samples. The estimated population number is the average number.
Estimation theory is categorized into two theory,which is point estimation an interval estimation. Some point estimation method used for estimating the parameter are the Moment Method, Maximum Likelihood Method, and Bayes Method. In this research, parameter estimation of gamma distribution using maximum likelihood method.
This method has several criteria or unbiased, efficient and consistent.
Therefore, a good point estimation can be discovered by using maximum likelihood method. Because of differential partial log likelihood function cannot be solved analytically, then the numerical approach is the Newton Raphson Method.
The Newton Raphson method is one of the iterative Methods used to solve non-linear problems.
Keywords: Parameter Estimation, Gamma Distributon, Maximum Likelihood Method, Newton Raphson Method.
iv
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Allah SWT Yang Maha Pemurah dan Maha Penyayang, dengan limpah karunia-Nya Penulis dapat menyelesaikan penyusunan skripsi ini dengan judul Skripsi
“Pendekatan Newton Raphson untuk Optimasi Fungsi Likelihood pada Penaksiran Distribusi Gamma”.
Terima kasih penulis sampaikan kepada Bapak Dr. Sutarman, M.Sc selaku pembimbing yang telah meluangkan waktunya selama penyusunan skripsi ini. Terima kasih kepada Ibu Dr. Elly Rosmaini, M.Si dan Ibu Dra. Laurentina Pangaribuan, MS selaku dosen pembanding 1 dan pembanding 2 yang memberikan kritik dan saran yang membangun dalam menyelesaikan skripsi penulis. Terima kasih kepada Bapak Dr. Drs. Suyanto, M.Kom dan Bapak Drs. Rosman Siregar, M.Si selaku Ketua Departemen dan Sekertaris Departemen Matematika FMIPA USU Medan, Bapak Dr. Kerista sebayang, M.S selaku Dekan FMIPA USU Medan, seluruh Staff dan Dosen Matematika FMIPA USU serta pegawai FMIPA USU.
Terima kasih kepada kedua orangtua tercinta, Ayahanda Saharuddin dan Ibunda Yusnawati, beserta saudara-saudara penulis M.
Aris Munandar, M. Fakhri Wardana, Dina Ayu Wardani, dan M. Imam Kurniawan.
Terima kasih kepada kelompok belajar (Pokemon) Maya Apriani, Mustika Rahayu, Ninfa Syafitri, Reynold Sitorus, dan Husein Aziz Nst. Terima kasih kepada sahabat-sahabat SMA, Yudhitya Lubis, Rani Endriani, Rafida Zahro, Vita Ramadhani, Fina Ramadhani, Fauziah Pratiwi, Fiki Putri. Terima kasih kepada keluarga kost 25, Maya Apriani, Siska Indriani, dan Rostini. Terima kasih kepada abangda Agus Kadra.
Terima kasih kepada Ofie Isranta. Terima kasih kepada Arianto. Terima
kasih kepada teman-teman Matematika 2015 FMIPA USU serta rekan- rekan kuliah lainnya yang tidak dapat saya sebutkan satu persatu namanya yang telah membantu penulis dalam menyelesaikan skripsi ini.
Semoga segala bentuk bantuan yang telah diberikan kepada penulis mendapatkan balasan yang lebih baik dari Tuhan Yang Maha Esa. Akhir kata penulis mengharapkan saran dan kritik yang membangun demi penyempurnaan skripsi ini dan berharap ini dapat bermanfaat bagi para pembaca.
Medan, Juni 2019 Penulis,
Tri Suci Rahmadani
vi DAFTAR ISI
Halaman
PENGESAHAN SKRIPSI i
ABSTRAK ii
ABSTRACT iii
PENGHARGAAN iv
DAFTAR ISI vi
DAFTAR GAMBAR viii
BAB 1 PENDAHULUAN
1.1 Latar Belakang 1
1.2 Rumusan Masalah 4
1.3 Tujuan Penelitian 4
1.4 Batasan Masalah 4
1.5 Manfaat Penelitian 5
BAB 2 TINJAUAN PUSTAKA
2.1 Probabilitas Dasar 6
2.2 Peubah Acak 7
2.2.1 Peubah Acak Diskrit 8
2.2.2 Peubah Acak Kontinu 8
2.3 Ekspektasi dan Varians 10
2.3.1 Ekspektasi 10
2.3.2 Varians 12
2.4 Distribusi Gamma 13
2.4.1 Fungsi Gamma 14
2.4.2 Fungsi Kepadatan Probabilitas dan
Fungsi Distribusi Kumulatif Gamma 16 2.4.3 Ekspektasi dan Varians Distribusi
Gamma 16
2.5 Distribusi Sampel 16
2.6 Distribusi Bersyarat 18
2.7 Penaksiran Parameter 18
2.7.1 Metode Maksimum Likelihood 19
2.8 Metode Newton Raphson 20
BAB 3 HASIL DAN PEMBAHASAN
3.1 Penaksiran Parameter pada Distribusi Gamma 24
3.1.1 Penaksiran Parameter Distribusi Gamma dengan Metode Maksimum
Likelihood 25
3.1.2 Pendekatan Metode Newton Raphson dalam Menyelesaikan Penaksiran Parameter Distribusi Gamma dengan
Metode Maksimum Likelihood 28
3.2 Aplikasi Penaksiran Parameter Distribusi Gamma dengan Metode Maksimum
Likelhood 29
BAB 4 KESIMPULAN DAN SARAN
4.1 Kesimpulan 31
4.2 Saran 31
DAFTAR PUSTAKA 32
LAMPIRAN 33
viii
DAFTAR GAMBAR Nomor
Gambar Judul Halaman
2.1 Diagram Alir Metode Newton Raphson 22
BAB 1 PENDAHULUAN
1.1 Latar Belakang
Metode Newton Raphson adalah proses iterasi yang dilakukan dalam metode numerik yang dapat digunakan untuk mencari solusi atau pemecahan suatu persamaan yang non linear. Proses iterasi adalah suatu teknik penghampiran yang dilakukan secara berulang-ulang, dimana setiap pengulangan disebut iterasi. Pada umumnya para ahli statistik sering menggunakan metode Newton Raphson untuk menghampiri nilai parameter dari suatu persamaan. Jika hampiran menghasilkan suatu nilai pemecahan yang sangat dekat dengan pemecahan persamaan yang non linear maka iterasi mengalami proses konvergen (John Wenyu Wang, 2001).
Metode Newton Raphson merupakan salah satu metode iterasi yang digunakan untuk menyelesaikan permasalahan non linear. Secara umum metode Newton Raphson dikembangkan dari perluasan deret Taylor. Kelebihan penyelesaian persamaan non linear dengan metode Newton Raphson ini adalah proses iterasinya yang cepat (Abdul & Aries, 2003). Metode Newton Raphson merupakan metode pencarian akar suatu fungsi dengan pendekatan satu titik, dimana fungsi mempunyai turunan. Metode Newton Raphson menggunakan pendekatan satu titik sebagai titik awal (Bambang, 2015). Pada metode Newton Raphson, hanya diperlukan satu nilai 𝑥 awal untuk memulai iterasi untuk mendapatkan nilai akar persamaan. Nilai 𝑥 awal tersebut tidak dibatasi pada interval tertentu, sehingga metode ini sering dikategorikan sebagai metode terbuka. Konsekuensinya hasil iterasi tidak selalu konvergen. Jika iterasi berada pada konvergensi, iterasi yang dilakukan sangat efektif untuk mencapai nilai akar persamaan yang dicari (Julan, 2012).
Pengetahuan tentang penaksiran parameter menjadi hal yang sangat penting. Para peneliti, administrator dalam bidang pendidikan, bisnis, atau pemerintah, dan pengamat politik semuanya berkepentingan dalam masalah penaksiran (Walpole, 1998). Penaksiran parameter adalah pendugaan atau taksiran nilai parameter populasi berdasarkan sampel. Penaksiran parameter merupakan
2
suatu pernyataan mengenai parameter populasi yang diketahui berdasarkan populasi dari sampel, dalam hal ini sampel random, yang diambil dari populasi yang bersangkutan. Jadi, dengan penaksiran ini keadaan parameter populasi dapat diketahui (Jaka, 2014). Penaksiran parameter dan pengujian hipotesis merupakan teori statistika inferensi. Statistika inferensi merupakan salah satu cabang statistika yang digunakan dalam penarikan kesimpulan atau generalisasi mengenai suatu populasi (Waluyo, 2001). Statistika inferensi meliputi metode analisis, interpretasi, dan prediksi berdasarkan hasil sampel dalam membantu penarikan kesimpulan suatu populasi.
Statistika inferensi dapat dikelompokkan ke dalam dua teknik utama, yaitu penaksiran parameter dan pengujian hipotesis. Teknik ini menggunakan informasi sampel dalam menentukan kesimpulan. Dalam teori keputusan, inferensi didasarkan pada kombinasi informasi sampel beserta bagian-bagian lainnya yang dianggap relevan dengan suatu persoalan tertentu agar dihasilkan keputusan yang terbaik.
Nilai dugaan yang diperoleh dari statistik contoh acak akan menghasilkan nilai yang berbeda dengan berbedanya contoh acak yang diambil. Dengan demikian, dalam penaksiran ini terdapat ketidakpastian (uncertainty). Karena ketidakpastian ini, maka suatu penaksir yang baik harus memiliki sifat-sifat tertentu agar penaksiran yang dihasilkan memberikan nilai taksiran yang terbaik.
Penaksir yang memiliki sifat terbaiklah yang akan digunakan sebagai penaksir sebuah parameter. Suatu penaksir yang baik adalah bila nilai tengah sebaran penaksir tersebut sama dengan parameter sebarannya. Penaksir yang bersifat demikian disebut penaksir tak berbias (unbiased). Selain penaksir tak berbias, ciri penaksir yang baik adalah memiliki variansi minimum, yakni penaksir yang memiliki varians terkecil diantara seluruh penaksir untuk parameter yang sama dan penaksir yang konsistensi, yakni apabila ukuran sampel n mendekati ukuran populasi dan menyebabkan θ̂ mendekati  (Walpole, 1997).
Secara umum penaksiran parameter digolongkan menjadi dua yaitu penaksiran titik (point estimation) dan penaksiran interval (interval estimation).
Penaksiran titik (point estimation) merupakan penaksiran dari sebuah parameter
populasi yang dinyatakan oleh bilangan tunggal guna menaksir parameter.
Penaksiran interval (interval estimation) merupakan penaksiran dari parameter populasi yang dinyatakan dengan dua buah bilangan diantara posisi parameternya diperkirakan berbeda (Walpole, 1997).
Beberapa metode penaksiran titik yang digunakan untuk menaksir parameter diantaranya adalah metode Momen, metode Bayes, dan metode Maksimum Likelihood. Salah satu metode yang paling sering digunakan untuk menaksir parameter suatu distribusi adalah metode kemungkinan maksimum (maximum likelihood)
Metode maksimum likelihood estimation merupakan suatu metode yang mempunyai prinsip menentukan penaksir titik dari suatu parameter dengan peluang maksimum. Memaksimumkan fungsi likelihood biasanya dilakukan dengan metode derivatif (turunan). Metode ini mempunyai beberapa kriteria atau bersifat tak bias (unbias), efisien, dan konsisten sehingga untuk mencapai penaksiran titik yang baik dapat dicari dan diketahui dengan menggunakan metode penaksiran maksimum likelihood.
Karakteristik yang berkaitan dengan sampel disebut sebagai statistik, sedangkan karakteristik yang berkaitan dengan populasi disebut dengan parameter. Sedangkan nilai sampel statistik yang digunakan untuk mengestimasi parameter populasi disebut dengan estimator. Parameter adalah ukuran seluruh populasi yang diwakili oleh nilai estimasi. Parameter populasi pada umumnya tidak diketahui karena banyaknya anggota populasi.
Teori penaksiran sering dipakai sebagai prosedur untuk mencari parameter dari sebuah model yang paling cocok pada suatu data pengamanan yang ada.
Dalam analisis keandalan (reliabilitas) dan teori antrian, penaksiran parameter digunakan untuk mencari parameter dari distribusi yang berkaitan dengan data yang dimiliki.
Analisis uji hidup merupakan suatu analisis terhadap individu-individu suatu populasi dengan memusatkan perhatian pada lamanya waktu individu menjalankan fungsinya dengan baik sampai kematian individu tersebut, yang
4
dinyatakan dengan fungsi selamat dan fungsi bahaya. Fungsi distribusi tahan hidup yang didasarkan pada pengetahuan atau asumsi tertentu tentang distribusi populasinya termasuk dalam fungsi parametrik. Beberapa distribusi yang dapat digunakan dalam menggambarkan waktu hidup antara lain distribusi Eksponensial, distribusi Weibull, distribusi Gamma, distribusi Rayleigh, dan lain- lain (Lawless, 1982). Berdasarkan beberapa distribusi tersebut dipilih fungsi tahan hidup berdistribusi Gamma pada penelitian ini. Distribusi Gamma dapat diestimasi dengan Metode Maksimum Likelihood karena mempuyai suatu fungsi padat peluang kontinu.
Langkah-langkah penaksiran Maksimum Likelihood adalah menentukan fungsi padat peluang, membentuk fungsi padat peluang ke dalam bentuk fungsi likelihood, membentuk fungsi likelihood ke dalam bentuk log likelihood, menurunkan fungsi log likelihood terhadap parameter yang mengikutinya yakni 𝛼 dan 𝛽, dan menentukan penaksiran dari parameter 𝛼 dan 𝛽. Sehingga didapatkan 𝐸(𝑋) dari distribusi Gamma adalah 𝛼𝛽 dan 𝑣𝑎𝑟(𝑋) dari distribusi Gamma adalah 𝛼𝛽2.
1.2 Rumusan Masalah
Fungsi maksimum likelihood terdiri atas beberapa persamaan yang non linear.
Sehingga untuk mendapatkan nilai parameter harus diselesaikan dengan pendekatan numerik yaitu metode newton raphson.
1.3 Tujuan Penelitian
Menentukan penaksiran parameter dari distribusi Gamma dengan metode maksimum likelihood dan dengan pendekatan numerik yaitu metode newton raphson.
1.4 Batasan Masalah
Batasan masalah pada penelitian ini adalah:
1. Distribusi yang digunakan pada penelitian ini adalah distribusi Gamma.
2. Penaksiran yang dilakukan pada penelitian ini adalah penaksiran titik (point estimation).
3. Metode yang digunakan untuk melakukan penaksiran terhadap parameter pada penelitian ini adalah metode Maksimum Likelihood.
4. Pendekatan yang digunakan pada penelitian ini adalah pendekatan newton raphson.
1.5 Manfaat Penelitian
1. Mengembangkan dan menerapkan probabilitas dan statistika dengan metode Maksimum Likelihood serta memperlihatkan prosedur penggunaan metode Maksimum Likelihooddalam menduga parameter dari distribusi Gamma.
2. Menerapkan metode Maksimum Likelihood dalam penunjang ilmu matematika statistika dan probabilitas sehingga dapat meningkatkan penguasaan dan pemikiran teknik estimasi yang lebih baik serta memudahkan dalam pengambilan keputusan pada tingkat populasi.
3. Bahan acuan tambahan untuk penelitian sejenis di masa akan datang.
6
BAB 2
TINJAUAN PUSTAKA
Pada bab ini akan di uraikan teori dan konsep yang akan digunakan untuk menaksir parameter distribusi Gamma dengan 2 parameter. Uraian ini diawali dengan konsep probabilitas dasar, peubah acak, ekspektasi, distribusi Gamma, distribusi sampel, distribusi bersyarat, penaksiran parameter, dan metode newton raphson.
Konsep ini akan di uraikan guna untuk menjelaskan tentang teori dan konsep yang akan digunakan untuk menaksir parameter distribusi Gamma dengan 2 parameter.
2.1 Probabilitas Dasar
Istilah percobaan atau percobaan statistik telah digunakan untuk menjelaskan sembarang proses yang menghasilkan satu atau lebih ukuran bagi faktor kebetulan. Sering kali, kita tidak tertarik pada keterangan rinci setiap titik contoh, namun hanya pada suatu keterangan numerik hasil percobaan. Dalam mempelajari dasar-dasar teori statistika kita sudah mengetahui bahwa statistika merupakan suatu alat dan juga metode analisa yang digunakan untuk mengevaluasi data di mana pada akhirnya akan diperoleh suatu kesimpulan dari data sampel yang ada.
Dari semua alat analisa yang ada, maka konsep probabilitas merupakan salah satu alat analisa yang cukup penting untuk diketahui, karena dalam statistik modern sekarang ini konsep teori probabilitas banyak sekali digunakan dalam memecahkan masalah yang ada.
Andrei Kolgomorov (1930-1987) meletakkan landasan matematis teori probabilitas dan teori acak. Dalam tulisannya, Kolgomorov menggunakan teori probabilitas dalam mempelajari pergerakan planet dan turbulensi aliran udara.
Kontribusi penting lainnya adalah proses stokastik, informasi, mekanika statistik dan dinamika nonlinear.
Konsep probabilitas memungkinkan peneliti dalam mengolah statistika deskriptif ke dalam statistika inferensial. Asal teori probabilitas adalah modelisasi peluang permainan. Probabilitas muncul dari kolaborasi antara Blaise Pascal dan Pierre de Fermat dalam menemukan peluang dari suatu permainan. Sejak kolaborasi tersebut probabilitas lebih banyak digunakan kepada permainan hingga abad ke 18, ketika Pierre di Laplace dan Karl F Gauss menggunakan aturan dasar probabilitas terhadap masalah fisis lainnya.
Kemungkinan terjadinya suatu kejadian yang dihasilkan dari suatu percobaan statistik dievaluasi dengan segugus (himpunan) bilangan riil yang disebut bobot atau probabilitas dengan berjangkauan 0 sampai 1. Untuk setiap titik di dalam ruang contoh tersebut kita menetapkan suatu probabilitas sedemikian rupa sehingga jumlah semua probabilitas adalah 1. Untuk mendapatkan probabilitas dari suatu kejadian 𝐴, kita menjumlahkan semua probabilitas yang diketahui titik-titik contoh dalam 𝐴. Jumlah ini disebut probabilitas dari 𝐴 dan ditandai dengan 𝑃(𝐴).
Definisi 2.1
Andaikan S adalah ukuran sampel yang berhubungan dengan sebuah eksperimen.
Untuk setiap kejadian 𝐴 dalam 𝑆 (𝐴 himpunan bagian dari 𝑆), kita ambil sebuah angka, 𝑃(𝐴) yang disebut dengan probabilitas 𝐴 (Wackerly et al. 2008). Jadi, berikut axioma:
Axioma 1 : 𝑃(𝐴) ≥ 0 Axioma 2 : 𝑃(𝑆) = 0
Axioma 3 : Jika 𝐴1, 𝐴2, 𝐴3, ⋯ bentuk barisan kejadian saling lepas pada S (itu berarti 𝐴𝑖 ∩ 𝐴𝑗 = ∅, jika 𝑖 ≠ 𝑗, kemudian:
𝑃(𝐴1∪ 𝐴2∪ 𝐴3⋯ ) = ∑∞𝑖=1𝑃(𝐴𝑖)
2.2 Peubah Acak
Eksperimen probabilitas memiliki keluaran (outcome) yang bisa berupa suatu nilai numerik (angka/bilangan), suatu cacahan/hitungan, atau suatu hasil pengukuran (measurement). Variabel acak (random variable), biasa ditandai dengan sebuah simbol seperti 𝑋, adalah variabel yang memiliki sebuah nilai numerik tunggal
8
untuk setiap keluaran dari sebuah eksperimen probabilitas. Dengan kata lain, nilai tertentu dari 𝑋 dalam sebuah eksperimen adalah suatu kemungkinan keluaran yang acak.
Definisi 2.2
Peubah acak adalah suatu fungsi yang menghubungkan sebuah bilangan real dengan setiap unsur di dalam ruang sampel (Walpole dan Myers, 1998).
2.2.1 Peubah Acak Diskrit Definisi 2.3
Jika himpunan seluruh nilai yang mungkin dari peubah acak 𝑋 adalah suatu himpunan yang dapat dicacah sedemikian rupa 𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛 atau 𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛 disebut sebagai variabel acak diskrit. Bagi suatu peubah acak diskrit 𝑋, didefinisikan fungsi massa peluang 𝑃𝑋(𝑥) sebagai:
𝑃𝑋(𝑥) = 𝑃(𝑋 = 𝑥) (2.1)
Fungsi massa peluang 𝑃(𝑥) bernilai positif, untuk sejumlah nilai x tercacah.
Dengan kata lain, jika 𝑋 mengambil salah satu dari nilai 𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛 maka peubah acak diskrit 𝑋 dengan nilai yang mungkin 𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛 fungsi massa peluang adalah fungsi yang memenuhi kriteria berikut:
1) 𝑝(𝑥𝑖) ≥ 0; 𝑖 = 1, 2, ⋯ 2) ∑𝑛𝑖=1𝑝(𝑥𝑖) = 1
3) 𝑝(𝑥𝑖) = 𝑃(𝑋 = 𝑥𝑖)
2.2.2 Peubah Acak Kontinu Definisi 2.4
Sebuah peubah acak 𝑋 berdistribusi kontinu jika terdapat fungsi f tak negatif, terdefinisi pada garis bilangan riil, sehingga setiap interval pada bilangan riil (berbatas atau tak berbatas), probabilitas bahwa 𝑋 yang berada pada interval tersebut merupakan jumlahan daerah f pada interval tersebut. Sebagai contoh,
keadaan yang menggambarkan definisi di atas, dengan batas dalam interval tertutup [a,b].
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑏
𝑎
Berimplikasi pada:
𝑃(𝑋 ≥ 𝑎) = ∫ 𝑓(𝑥)𝑑𝑥𝑎∞ dan 𝑃(𝑋 ≤ 𝑏) = ∫−∞𝑏 𝑓(𝑥)𝑑𝑥 (2.2) Berdasarkan karakteristik 𝑓 distribusi variabel acak kontinu dengan cara yang sama menyatakan bahwa fungsi probabilitas berkarakteristik distribusi peubah acak kontinu. Fungsi kepadatan peluang 𝑓 dapat digunakan untuk menggambarkan distribusi probabilitas peubah acak kontinu. Jika suatu interval memuat kemiripan nilai 𝑋, probabilitasnya besar dan berkorespondensi dengan 𝑓(𝑥). Memenuhi ketiga kaidah berikut:
1) 𝑓(𝑥) ≥ 0
2) ∫−∞∞ 𝑓(𝑥)𝑑𝑥= 1
3) 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥𝑎𝑏
Distribusi probabilitas adalah visualisasi peubah acak 𝑋 dalam bentuk kurva.
Ketika 𝑋 merupakan peubah acak berbatas, himpunan probabilitas yang digambarkan terhadap nilai yang mungkin disebut probabilitas 𝑋.
Jika 𝑋 adalah peubah acak berbatas, dengan nilai-nilai 𝑛1, 𝑛2, ⋯ maka daftar distribusi probabilitas bekaitan dengan 𝑋 = 𝑛1, 𝑋 = 𝑛2, ⋯ Jumlah seluruh probabilitas selalu sama dengan 1.
Ingat bahwa 𝑋 merupakan variabel acak, sedangkan 𝑥 merupakan nilai spesifik dari variabel acak 𝑋. Berakibat jika 𝑥 = 2 maka probabilitas 𝑃(𝑋 = 𝑥) berarti 𝑃(𝑋 = 2), probabilitas bahwa 𝑋 adalah 2. Hal yang sama jika 𝑌 merupakan peubah acak maka 𝑃(𝑌 = 𝑦) probabilitas 𝑌 dengan nilai khusus 𝑦.
10
2.3 Ekspektasi dan Varians
Berikut ini akan dijelaskan pengertian serta sifat-sifat dari ekspektasi dan varians.
2.3.1 Ekspektasi
Dalam suatu pengukuran eskperimen, hasil pengukuran eksperimen seringkali menghasilkan variasi. Ukuran-ukuran yang menggambarkan karakteristik sampel berkorespondensi dengan karakteristik populasi. Secara sederhana karakteristik tersebut digambarkan sebagai nilai harapan atau lebih dikenal dengan mean.
Secara matematis dinyatakan dengan formula berikut:
1) Peubah Acak Diskrit
𝜇𝑥 = 𝐸[𝑋] = ∑𝑛𝑖=1𝑥𝑖𝑃(𝑥𝑖) (2.3)
2) Peubah Acak Kontinu
𝜇𝑥 = 𝐸[𝑋] = ∫−∞∞ 𝑥𝑓(𝑥)𝑑𝑥 (2.4)
Sifat-sifat Ekspektasi:
1) 𝐸(𝑏) = 𝑏 (2.5)
Bukti: 𝐸[𝑋] = ∫−∞∞ 𝑥𝑓(𝑥)𝑑𝑥 𝐸[𝑏] = 𝑏
Substitusi 𝑋 = 𝑏 maka 𝐸[𝑏] = ∫−∞∞ 𝑏𝑓(𝑥)𝑑𝑥, karena b merupakan konstanta maka berlaku:
𝐸[𝑏] = ∫−∞∞ 𝑏𝑓(𝑥)𝑑𝑥, karena ∫−∞∞ 𝑓(𝑥)𝑑𝑥= 1, maka 𝐸[𝑏] = 𝑏. 1
∴ 𝐸[𝑏] = 𝑏 ∎
2) 𝐸[𝑎𝑋 + 𝑏] = 𝑎𝐸[𝑋] + 𝑏 (2.6)
Bukti: Misalkan 𝑋 adalah suatu peubah acak dengan a dan b merupakan suatu tetapan, maka
𝐸[𝑎𝑋 + 𝑏] = 𝑎𝐸[𝑋] + 𝑏
𝐸[𝑎𝑋 + 𝑏] = ∫ [𝑎𝑥 + 𝑏]𝑓(𝑥)𝑑𝑥
∞
−∞
= 𝑎 ∫−∞∞ 𝑥𝑓(𝑥)𝑑𝑥 + 𝑏 ∫−∞∞ 𝑓(𝑥)𝑑𝑥 Karena ∫−∞∞ 𝑥𝑓(𝑥)𝑑𝑥 = 𝐸[𝑋], dan ∫−∞∞ 𝑓(𝑥)𝑑𝑥 = 1,
∴ 𝐸[𝑎𝑋 + 𝑏] = 𝑎𝐸[𝑋] + 𝑏 ∎
3) 𝐸[𝑔(𝑋, 𝑌) ± ℎ(𝑋, 𝑌)] = 𝐸[𝑔(𝑋, 𝑌)] ± 𝐸[ℎ(𝑋, 𝑌)] (2.7) Bukti: 𝐸[𝑔(𝑋, 𝑌) ± ℎ(𝑋, 𝑌)] = ∫−∞∞ ∫ [𝑔(𝑥, 𝑦) ± ℎ(𝑥, 𝑦)]−∞∞ 𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦
= ∫−∞∞ ∫−∞∞ 𝑔(𝑥, 𝑦)𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦 ±
∫−∞∞ ∫−∞∞ ℎ(𝑥, 𝑦)𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦
∴ 𝐸[𝑔(𝑋, 𝑌) ± ℎ(𝑋, 𝑌)] = 𝐸[𝑔(𝑋, 𝑌)] ± 𝐸[ℎ(𝑋, 𝑌)] ∎
4) 𝐸[𝑔(𝑋) ± ℎ(𝑋)] = 𝐸[𝑔(𝑋)] ± 𝐸[ℎ(𝑋)] (2.8)
Bukti: 𝐸[𝑔(𝑌) ± ℎ(𝑌)] = 𝐸[𝑔(𝑋)] ± 𝐸[ℎ(𝑋)]
Karena 𝐸[𝑋] = ∫−∞∞ 𝑥𝑓(𝑥)𝑑𝑥, maka substitusi 𝑌 = 𝑔(𝑋) ± ℎ(𝑋), sehingga diperoleh
𝐸[𝑌] = ∫−∞∞ 𝑌𝑓(𝑥)𝑑𝑥
𝐸[𝑌] = ∫ [𝑔(𝑋) ± ℎ(𝑋)]𝑓(𝑥)𝑑𝑥−∞∞ Berlaku:
𝐸[𝑌] = ∫−∞∞ 𝑔(𝑋)𝑓(𝑥)𝑑𝑥 ± ∫−∞∞ 𝑔(𝑋)𝑓(𝑋)𝑑𝑥
𝐸[𝑔(𝑋) ± ℎ(𝑋)] = ∫−∞∞ 𝑔(𝑋)𝑓(𝑥)𝑑𝑥 ± ∫−∞∞ 𝑔(𝑋)𝑓(𝑋)𝑑𝑥
∴ 𝐸[𝑔(𝑋) ± ℎ(𝑋)] = 𝐸[𝑔(𝑋)] ± 𝐸[ℎ(𝑋)] ∎
5) 𝐸[𝑋𝑌] = 𝐸[𝑋]𝐸[𝑌] (2.9)
Bukti: 𝑋 dan 𝑌 adalah dua peubah acak bebas, maka 𝐸[𝑋𝑌] = 𝐸[𝑋]𝐸[𝑌]
Menurut definisi,
𝐸[𝑋𝑌] = ∫−∞∞ ∫−∞∞ 𝑥𝑦𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦
Karena 𝑋 dan 𝑌 adalah bebas, dapat kita tuliskan 𝑓(𝑥, 𝑦) = 𝑔(𝑥)ℎ(𝑦).
Dimana 𝑔(𝑥) dan ℎ(𝑦) adalah sebaran marginal dari 𝑋 dan 𝑌. Oleh sebab itu:
12
𝐸[𝑋𝑌] = ∫−∞∞ ∫−∞∞ 𝑥𝑦𝑔(𝑥)ℎ(𝑦)𝑑𝑥𝑑𝑦 𝐸[𝑋𝑌] = ∫−∞∞ 𝑥𝑔(𝑥)𝑑𝑥∫−∞∞ 𝑦ℎ(𝑦)𝑑𝑦 𝐸[𝑋𝑌] = ∫−∞∞ 𝑥𝑔(𝑥)𝑑𝑥∫−∞∞ 𝑦ℎ(𝑦)𝑑𝑦
∴ 𝐸[𝑋𝑌] = 𝐸(𝑋)𝐸(𝑌) ∎
2.3.2 Varians
Pengukuran suatu variabel memungkinkan untuk mempermudah pemahaman mengenai suatu data. Untuk mengetahui seberapa besar tingkat variabilitas sampel yang berhubungan dengan populasi didefinisikan oleh 𝑉𝑎𝑟[𝑋] = 𝐸[(𝑋 − 𝜇)2], secara lebih jelas diperlihatkan oleh:
1) Variabel Acak Diskrit
𝜎2 = 𝑉𝑎𝑟[𝑋] = ∑𝑛𝑖=0(𝑋 − 𝜇)2𝑝(𝑥𝑖) (2.10) 2) Variabel Acak Kontinu
𝜎2 = 𝑉𝑎𝑟[𝑋] = ∫ (𝑋 − 𝜇)−∞∞ 2𝑓(𝑥)𝑑𝑥 (2.11) Varians untuk kasus kontinu dapat dijabarkan sebagai berikut:
𝑉𝑎𝑟[𝑋] = 𝐸[(𝑋 − 𝜇)2]
𝑉𝑎𝑟[𝑋] = ∫ (𝑋 − 𝜇)−∞∞ 2𝑓(𝑥)𝑑𝑥
𝑉𝑎𝑟[𝑋] = ∫ (𝑋−∞∞ 2− 2𝑋𝜇 + 𝜇2)𝑓(𝑥)𝑑𝑥
= ∫ (𝑋−∞∞ 2− 2𝑋𝜇 + 𝜇2)𝑓(𝑥)𝑑𝑥
= ∫−∞∞ 𝑋2𝑓(𝑥)𝑑𝑥 − 2𝜇 ∫−∞∞ 𝑋𝑓(𝑥)𝑑𝑥+ 𝜇2∫−∞∞ 𝑓(𝑥)𝑑𝑥 𝑉𝑎𝑟[𝑋] = 𝐸[𝑋2] − 2𝜇𝐸[𝑋] + 𝜇2
Karena 𝜇 = 𝐸[𝑋], maka diperoleh:
𝑉𝑎𝑟[𝑋] = 𝐸[𝑋2] − (𝐸[𝑋])2 Sifat-sifat Varians:
1) 𝑉𝑎𝑟[𝑐] = 0 (2.12)
Bukti: Berdasarkan definisi dari perumusan varians, maka:
𝑉𝑎𝑟[𝑐] = 𝐸[𝑐 − 𝐸(𝑐)]2
= 𝐸[𝑐 − 𝑐]2
= 𝐸[0]
∴ 𝑉𝑎𝑟[𝑐] = 0 ∎
2) 𝑉𝑎𝑟[𝑐𝑋] = 𝑐2𝑉𝑎𝑟[𝑋] (2.13)
Bukti: Berdasarkan definisi dari perumusan varians, maka:
𝑉𝑎𝑟[𝑐𝑋] = 𝐸[(𝑐𝑋) − 𝐸(𝑐𝑋)]2
= 𝐸[𝑐𝑋 − 𝐸(𝑐𝑋)]2
= 𝐸[𝑐𝑋 − 𝑐𝐸(𝑋)]2
= 𝐸[𝑐2𝐸[𝑋 − 𝐸(𝑥)]2
∴ 𝑉𝑎𝑟[𝑐𝑋] = 𝑐2𝑉𝑎𝑟[𝑋] ∎
3) 𝑉𝑎𝑟[𝑋 + 𝑐] = 𝑉𝑎𝑟[𝑋] (2.14)
Bukti: Berdasarkan definisi dari perumusan varians, maka:
𝑉𝑎𝑟[𝑋 + 𝑐] = 𝐸[(𝑋 + 𝑐) − 𝐸(𝑋 + 𝑐)]2
= 𝐸[𝑋 + 𝑐 − 𝐸(𝑋) − 𝐸(𝑐)]2
= 𝐸[𝑋 + 𝑐 − 𝐸(𝑋) − 𝑐]2
= 𝐸[𝑋 − 𝐸(𝑋)]2
∴ 𝑉𝑎𝑟[𝑋 + 𝑐] = 𝑉𝑎𝑟[𝑋] ∎
2.4 Distribusi Gamma
Distribusi Gamma merupakan salah satu alternatif model yang banyak digunakan dalam eksperimen yang menunjukkan distribusi yang tidak simetris. Meskipun distribusi normal memiliki peranan yang luas di berbagai bidang, dalam kenyatannya terdapat situasi di mana hasil-hasil eksperimen menunjukkan distribusi yang tidak simetris ataupun tidak menunjukkan kecendrungan simetris.
Dalam kasus-kasus semacam ini, model distribusi normal tidak dapat memberikan hasil yang tepat jika digunakan. Untuk eksperimen-eksperimen probabilitas yang hasilnya menunjukkan suatu bentuk distribusi yang mempunyai variasi ukuran kemencengan yang cukup signifikan.
14
2.4.1 Fungsi Gamma
Didefinisikan untuk 𝛼 > 0, fungsi Gamma Γ(𝛼) adalah:
Γ(𝛼) = ∫ 𝑥𝛼−1𝑒−𝑥𝑑𝑥
∞
0
(2.15)
Sifat-sifat penting fungsi Gamma antara lain:
1) Γ(𝛼) = (α − 1)Γ(𝛼 − 1) atau Γ(𝛼 − 1) = Γ(𝛼)
(𝛼 − 1); 𝛼 > 1 (2.16) Bukti: Berdasarkan persamaan (2.15) jika dilakukan integral parsial dari
fungsi Gamma dengan 𝑢(𝑥) = 𝑥𝛼−1 dan 𝑑𝑣(𝑥) = 𝑒𝑥𝑑𝑥, sehingga diperoleh:
𝑢(𝑥) = 𝑥𝛼−1 → 𝑑𝑢(𝑥) = (𝛼 − 1)𝑥𝛼−2𝑑𝑥 𝑑𝑣(𝑥) = 𝑒−𝑥𝑑𝑥 → 𝑣(𝑥) = ∫ 𝑒0∞ −𝑥𝑑𝑥 = −𝑒−𝑥 sehingga
Γ(𝛼) = ∫ 𝑢(𝑥)𝑑𝑣(𝑥)0∞
= 𝑢(𝑥)𝑣(𝑥) − ∫ 𝑣(𝑥)𝑑𝑢(𝑥)0∞
= 𝑥𝛼−1 − 𝑒−𝑥− ∫ (−𝑒0∞ −𝑥)(𝛼 − 1)𝑥𝛼−2𝑑𝑥
= −𝑒−𝑥𝑥𝛼−1|∞
0 + (𝛼 − 1) ∫ (𝑥0∞ 𝛼−2)(−𝑒−𝑥)𝑑𝑥
= 0 + (𝛼 − 1) Γ(𝛼)
= (𝛼 − 1) Γ(𝛼 − 1)
∴ Γ(𝛼) = (α − 1)Γ(𝛼 − 1), a > 1
2) Untuk sebuah bilangan bulat positif 𝑛,
Γ(𝑛) = (𝑛 − 1)! (2.17) Bukti: Berdasarkan persamaan (2.17), dapat diperoleh
Γ(𝛼) = (α − 1)Γ(𝛼 − 1), dengan cara yang sama akan dihasilkan Γ(𝑛) = (n − 1)(n − 2)Γ(𝑛 − 2)
= (n − 1)(n − 2) ⋯ Γ(1) dalam hal ini,
Γ(1) = ∫ x0e−xdx = −e−x|∞ 0
1
0
= −𝑒−∞− (−𝑒0)
= 0 − (−1)
=1
Sehingga diperoleh,
Γ(𝛼) = (α − 1)(α − 2) ⋯ 1
∴ Γ(𝛼) = (α − 1)! ∎
3) Didefinisikan Γ (1
2) = √π (2.18) Bukti: Γ(𝛼) = ∫ 𝑥0∞ 𝛼−1𝑒−𝑥𝑑𝑥
(1
2)=∫𝑥12−1𝑒−x𝑑𝑥
∞
0
= ∫ 𝑥−12𝑒−x𝑑𝑥
∞
0
Misal = 𝑢2 , 𝑑𝑥 = 2𝑢 𝑑𝑢 = ∫ (𝑢2)−12𝑒−𝑢2
∞
0
2𝑢 𝑑𝑢
= ∫ 𝑢−22𝑒−𝑢2
∞
0
2𝑢 𝑑𝑢
= ∫ 𝑢−1𝑒−𝑢2
∞
0
2𝑢 𝑑𝑢
= ∫ 2uu−1𝑒−𝑢2
∞
0
𝑑𝑢
= 2 ∫ u1−1𝑒−𝑢2
∞
0
𝑑𝑢
= 2 ∫ u0𝑒−𝑢2
∞
0
𝑑𝑢
16
= 2 ∫ 𝑒−𝑢2
∞
0
𝑑𝑢 , 𝑘𝑎𝑟𝑒𝑛𝑎 ∫ 𝑒−𝑢2
∞
0
𝑑𝑢 = (√𝜋
2 ) , 𝑚𝑎𝑘𝑎
= 2 (√𝜋 2 ) = √𝜋
∴ Γ (1
2) = √𝜋 ∎
2.4.2 Fungsi Kepadatan Probabilitas dan Fungsi Distribusi Kumulatif Gamma
Definisi 2.5
Sebuah variabel acak 𝑌 dikatakan memiliki distribusi gamma dengan parameter 𝛼 > 0 dan 𝛽 > 0 jika dan hanya jika fungsi densitas dari 𝑌 adalah:
𝑓(𝑌) = {𝑦𝛼−1𝑒−
𝑦 𝛽
𝛽𝛼Γ(𝛼) , 0 ≤ 𝑦 ≤ ∞ 0 , 𝑥 𝑙𝑎𝑖𝑛𝑛𝑦𝑎
(2.19)
sedangkan fungsi distribusi kumulatif Gamma adalah (Wackerly et al. 2008):
𝐹𝐺(𝑌) = ∫𝑦𝛼−1𝑒−
𝑦 𝛽
𝛽𝛼Γ(𝛼)
𝑑
𝑐
𝑑𝑦 , 0 < 𝑐 < 𝑑 < ∞ (2.20)
2.4.3 Ekspektasi dan Varians Distribusi Gamma Teorema 2.1
Jika 𝑋 merupakan distribusi gamma dengan parameter 𝛼 dan 𝛽, maka:
𝜇 = 𝐸(𝑋) = 𝛼𝛽 (2.21) 𝜎2 = 𝑉(𝑋) = 𝛼𝛽2 (2.22) 2.5 Distribusi Sampel
Bidang statistika inferensi pada dasarnya berkenaan dengan penempatan dan prediksi, hasil suatu percobaan statistika dapat dicatat dalam bentuk numerik. Bila
sepasang dadu dilantumkan dan jumlahnya merupakan hal yang ingin diselidiki maka hasilnya dicatat dalam bentuk numerik.
Keseluruhan pengamatan yang ingin diteliti, berhingga atau tidak, membentuk apa yang disebut populasi atau universum. Kata populasi pengamatan yang diperoleh dari penelitian statistik yang menyangkut manusia. Sekarang statistikawan menggunakan kata tersebut untuk menyatakan seluruh pengamatan tentang hal yang ingin diselidiki, terlepas apa itu menyangkut orang, binatang, ataupun benda lainnya. Banyaknya pengamatan dalam populasi dinamakan ukuran. Suatu populasi terdiri atas keseluruhan pengamatan yang menjadi perhatian.
Dalam bidang inferensial statistik, statistikawan ingin menarik kesimpulan mengenai suatu populasi dalam hal tidak mungkin atau tidak praktis mengenai himpunan seluruh pengamatan yang membentuk populasi tersebut. Sebagai contoh dalam usaha menentukan rata-rata panjang umur bola lampu merk tersebut agar masih ada sisa dijual. Biaya yang amat tinggi juga merupakan kendala dalam memeriksa seluruh populasi. Karena itu peneliti menggunakan sebagaian pengamatan dari populasi dalam menarik inferensi tentang populasi tersebut.
Sampel adalah suatu bagian himpunan dari populasi (Ronald & Raymod, 1995).
Dalam mengambil sampel acak berukuran 𝑛 dari suatu populasi 𝑓(𝑥), didefinisikan variabel acak 𝑥𝑖, 𝑖 = 1, 2, ⋯ , 𝑛, sebagai pengukuran atau nilai sampel ke 𝑖 yang diamati, variabel acak 𝑥1, 𝑥2, ⋯ , 𝑥𝑛 merupakan suatu sampel acak populasi 𝑓(𝑥), dengan nilai numerik 𝑥1, 𝑥2, ⋯ , 𝑥𝑛, bila pengukuran dikerjakan dengan mengulangi percobaan n kali secara bebas dalam keadaan yang pada dasarnya sama, maka dapat dianggap bahwa ke-n variabel acak 𝑥1, 𝑥2, ⋯ , 𝑥𝑛 bebas dan masing-masing berdistribusi 𝑓(𝑥). Ini berarti bahwa 𝑥1, 𝑥2, ⋯ , 𝑥𝑛 masing-masing berdistribusi peluang 𝑓(𝑥1), 𝑓(𝑥1), ⋯ , 𝑓(𝑥𝑛) .
Misalkan 𝑥1, 𝑥2, ⋯ , 𝑥𝑛 merupakan n variabel acak bebas yang masing- masing berdistribusi peluang 𝑓(𝑥), 𝑥1, 𝑥2, ⋯ , 𝑥𝑛 didefinisikan sebagai sampel acak ukuran n dari populasi 𝑓(𝑥) dan distribusi peluang gabungannya ditulis sebagai: 𝑓(𝑥1, 𝑥2, ⋯ , 𝑥𝑛) = 𝑓(𝑥1), 𝑓(𝑥1), ⋯ , 𝑓(𝑥𝑛) (Ronald & Raymond, 1995).
18
2.6 Distribusi Bersyarat
Jika 𝑋1 dan 𝑋2 merupakan variabel random diskrit atau kontinu dengan fungsi densitas peluang bersama 𝑓(𝑥1, 𝑥2), maka fungsi densitas peluang bersyarat dari 𝑋2, jika diketahui 𝑋1= 𝑥1 didefinisikan dengan:
𝑓(𝑥2|𝑥1) =𝑓(𝑥1, 𝑥2)
𝑓1(𝑥1) (2.23) Untuk nilai 𝑥1 sedemikian hingga 𝑓1(𝑥1) > 0, dan nol untuk lainnya. Sedangkan fungsi densitas peluang bersyarat dari 𝑋1, jika diketahui 𝑋2 = 𝑥2 didefinisikan dengan:
𝑓(𝑥1|𝑥2) =𝑓(𝑥1, 𝑥2)
𝑓2(𝑥2) (2.24) Untuk nilai 𝑥2 sedemikian hingga 𝑓2(𝑥2) > 0, dan nol untuk lainnya.
2.7 Penaksiran Parameter
Statistika inferensi adalah statistika yang dengan segala informasi dari sampel digunakan untuk menarik kesimpulan mengenai karakteristik populasi darimana sampel itu diambil. Statistika inferensi digunakan untuk memprediksi keadaan dari suatu populasi berdasarkan sampel yang diambil dan berusaha untuk menyimpulkan karakteristik dari suatu populasi tersebut. Untuk ini kelakuan populasi dipelajari berdasarkan data yang diambil baik secara sampling ataupun sensus.
Dalam kenyataannya mengingat beberapa faktor, untuk keperluan tersebut diambil sebuah sampel yang representatif lalu berdasarkan pada hasil analisis terhadap data sampel yang kesimpulan mengenai populasi dibuat. Kelakuan populasi yang akan ditinjau hanyalah mengenai parameter populasi dan sampel yang digunakan adalah sampel acak. Data sampel dikumpulkan dan dianalisis, nilai-nilai yang perlu yaitu statistik, dihitung dan dari nilai-nilai statistik tersebut dapat disimpulkan bagaimana parameter bertingkah laku, dan parameter yang diduga adalah rata-rata dan variansi (Surwako, 2007).
Sebuah nilai 𝜃̂ bagi suatu statistik 𝜃̂ disebut suatu nilai dugaan bagi parameter populasi. Misalnya, nilai 𝑥̅ bagi statistik 𝑋̅, yang dihitung dari suatu contoh berukuran 𝑛, merupakan nilai dugaan bagi parameter populasi 𝜇. Begitu pula, 𝑝̂ = 𝑥
𝑛 merupakan suatu nilai dugaan bagi proporsi sebenarnya p dalam suatu percobaan binom. Statistik yang digunakan untuk memperoleh sebuah nilai dugaan disebut penduga atau fungsi keputusan. Jadi, fungsi keputusan 𝑆2, yang merupakan fungsi dari contoh acak yang bersangkutan, adalah suatu penduga bagi 𝜎2, sedangkan nilai dugaan 𝑠2 merupakan “realisasinya” (Walpole, 1997). Contoh yang berbeda pada umumnya akan menghasilkan nilai dugaan yang berbeda pula.
Pada teori estimasi dapat dilakukan dengan dua metode yaitu metode klasik dan metode bayes. Metode klasik sepenuhnya mengandalkan proses inferensi pada data sampel yang diambil dari populasi, sedangkan metode bayes disamping memanfaatkan data sampel yang diperoleh dari populasi juga memperhitungkan suatu distribusi awal yang disebut distribusi prior (Box & Tiao, 1973). Metode statistik klasik terdiri dari metode kuadrat terkecil (least square method), metode momen, dan metode kemungkinan maksimum (maximum likelihood method).
Salah satu metode yang paling sering digunakan untuk menaksir parameter suatu distribusi adalah metode kemungkinan maksimum (maximum likelihood method). Memaksimumkan fungsi likelihood biasanya dilakukan dengan metode derivatif (turunan). Pendugaan maksimum likelihood mempunyai sifat-sifat penting yaitu: tak bias secara asimtotik (ada kemungkinan akan berbias pada sampel kecil) tapi sangat baik pada sampel berukuran besar, konsisten, efisien secara asimtotis, invarian pada skala pengukuran (satuan pengukuran tidak mempengaruhi nilai dugaan parameter model) (Bollen, 1989).
2.7.1 Metode Maksimum Likelihood Definisi 2.6
Misalkan 𝑥1, 𝑥2, ⋯ , 𝑥𝑛 adalah sampel random dari populasi dengan densitas 𝑓(𝑥, 𝜃) di mana 𝜃(𝜃1, 𝜃2, ⋯ , 𝜃𝑘) merupakan parameter tak diketahui, fungsi likelihood dituliskan:
20
𝐿(𝜃1, 𝜃2, ⋯ , 𝜃3) = ∏ 𝑓(𝑥𝑖; 𝜃)
𝑛
𝑖=1
(2.25)
Fungsi likelihood adalah fungsi dari parameter yang tidak diketahui . Dalam aplikasi 𝐿(𝜃) menunjukkan fungsi densitas probabilitas bersama dari sampel random. Jika 𝑆 ruang parameter yang merupakan interval terbuka dan 𝐿(𝜃) merupakan fungsi yang dapat diturunkan serta diasumsikan maksimum pada 𝑆 maka persamaan maksimum likelihodnya adalah:
𝜕
𝜕𝜃𝐿(𝜃) = 0 (2.26)
Ketika menentukan nilai estimator kemungkinan maksimum, itu sering lebih mudah menentukan nilai dari parameter yang memaksimumkan logaritma natural dari fungsi likelihood daripada nilai parameter yang memaksimumkan fungsi likelihood itu sendiri. Karena fungsi logaritma natural adalah fungsi naik, dan solusinya akan sama. Sehingga persamaan logaritma natural likelihoodnya adalah:
𝜕
𝜕𝜃ln 𝐿(𝜃) = 0 (2.27)
Langkah-langkah penaksiran distribusi Gamma pada metode Maksimum Likelihood:
1. Menentukan fungsi padat peluang distribusi Gamma.
2. Membentuk fungsi padat peluang distribusi Gamma kedalam model 𝐿(𝑥|𝛼, 𝛽) yang dinamakan dengan fungsi likelihood.
3. Membentuk fungsi likelihood kedalam bentuk ln(𝑥|𝛼, 𝛽) yang dinamakan dengan fungsi maksimum likelihood (log likelihood).
4. Memaksimumkan fungsi maksimum likelihood dengan menurunkan fungsi maksimum likelihood terhadap parameter yang mengikutinya yakni 𝛼 dan 𝛽, dan menyamakan dengan 0.
2.8 Metode Newton Raphson
Apabila langkah mengestimasi parameter menggunakan metode maksimum likelihood menghasilkan persamaan yang tidak linier, maka penyelesaian
persamaan tersebut untuk memperoleh nilai penaksir parameternya akan digunakan pendekatan numerik yaitu metode Newton Raphson.
Definisi 2.7
Metode Newton Raphson merupakan salah satu metode iterasi yang digunakan untuk menyelesaikan permasalahan non linear. Secara umum metode Newton Raphson dikembangkan dari perluasan deret Taylor
𝑓(𝜃𝑖+1) = 𝑓(𝜃𝑖) + 𝑓′(𝜃𝑖)(𝜃𝑖+1− 𝜃𝑖) +𝑓′′(𝜃𝑖)
2! (𝜃𝑖+1− 𝜃𝑖)2+ ⋯ +𝑓𝑛(𝜃𝑖)
𝑛! (𝜃𝑖+1 − 𝜃𝑖)𝑛.
Persamaan log likelihood dengan parameter 𝜃 dapat diselesaikan sehingga memperoleh nilai taksiran 𝜃̂ dengan menggunkan metode newton raphson. Rumus penaksiran untuk parameter 𝜃̂ pada iterasi ke-(𝑖 + 1) dalam proses iterasi (𝑖 = 0,1,2, … ) dituliskan dalam bentuk berikut.
𝜃̂𝑖+1 = 𝜃̂𝑖 − (𝜕2𝐿
𝜕2𝜃𝑡)−1 𝜕𝐿
𝜕𝜃𝑡 (2.28)
Proses iterasi dengan menggunakan metode Newton Raphson sehingga didapatkan nilai 𝜃̂ yang konvergen yaitu sampai |𝜃̂𝑖+1−𝜃̂𝑖
𝜃̂𝑖+1 | < 𝜀, dengan 𝜀 bilangan yang sangat kecil tetapi lebih besar dari 0. Kekonvergenan ditentukan pada pemilihan tebakan awal. Tebakan yang terlalu jauh dari solusi akan menyebabkan iterasi divergen.
Definisi 2.8
Bila parameter dari fungsi likelihood 𝐿(𝜃) bergantung pada n buah parameter yaitu 𝜃1, 𝜃2, 𝜃3, … , 𝜃𝑛 maka penyelesaian dengan metode newton raphson adalah mengasumsikan bahwa 𝜃 = (𝜃1, 𝜃2, 𝜃3, … , 𝜃𝑛)𝑇 adalah vektor dari n buah parameter yang tidak diketahui dan fungsi likelihood 𝑙(𝜃1, 𝜃2, 𝜃3, … , 𝜃𝑛).
Kemudian, didefinisikan gradien matriks sebagai berikut.
22
𝐺(𝜃) =
[
𝜕𝐿
𝜕𝜃1
𝜕𝐿
𝜕𝜃2
𝜕𝐿
𝜕𝜃3
⋮
𝜕𝐿
𝜕𝜃𝑛] Dan matriks hessian didefinisikan sebagai berikut.
𝐻(𝜃) =
[
𝜕2𝑙
𝜕2𝜃1
𝜕2𝑙
𝜕𝜃1𝜕𝜃2 𝜕2𝑙
𝜕𝜃1𝜕𝜃3 … 𝜕2𝑙
𝜕𝜃1𝜕𝜃𝑛
𝜕2𝑙
𝜕𝜃2𝜕𝜃1
𝜕2𝑙
𝜕2𝜃2 𝜕2𝑙
𝜕𝜃2𝜕𝜃3 … 𝜕2𝑙
𝜕𝜃2𝜕𝜃𝑛
𝜕2𝑙
𝜕𝜃3𝜕𝜃1
⋮
𝜕2𝑙
𝜕𝜃𝑛𝜕𝜃1
𝜕2𝑙
𝜕𝜃3𝜕𝜃2
⋮
𝜕2𝑙
𝜕𝜃𝑛𝜕𝜃2
𝜕2𝑙
𝜕2𝜃2
⋮
𝜕2𝑙
𝜕𝜃𝑛𝜕𝜃3
… 𝜕2𝑙
𝜕𝜃3𝜕𝜃𝑛
⋮
𝜕2𝑙
𝜕2𝜃2 ]
Rumus taksiran untuk parameter 𝜃̂ pada iterasi ke (𝑖 + 1) dalam proses iterasi dituliskan dalam bentuk :
𝜃̂𝑖+1 = 𝜃̂𝑖− [𝐻(𝜃𝑡)]−1𝐺(𝜃𝑡)
Proses iterasi dilakukan sehingga didapatkan nilai 𝜃̂ yang konvergen yaitu sampai
|𝜃̂𝑖+1−𝜃̂𝑖
𝜃̂𝑖+1 | < 𝜀, dengan 𝜀 bilangan yang sangat kecil tetapi lebih besar dari 0.
Algoritma Metode Newton Raphson:
a. Tentukan nilai titik awal 𝜃̂𝑖 dan 𝜀 > 0 b. Hitung 𝜕𝐿
𝜕𝜃𝑡 c. Hitung (𝜕2𝐿
𝜕2𝜃𝑡)−1 d. Jika |𝜃̂𝑖+1−𝜃̂𝑖
𝜃̂𝑖+1 | > 𝜀, ulangi langkah 2 Jika |𝜃̂𝑖+1−𝜃̂𝑖
𝜃̂𝑖+1 | ≤ 𝜀, berhenti
Agar lebih mudah dalam memahami algoritma Newton Raphson, dibawah ini diberikan diagram alir metode Newton Raphson.
𝑖 = 𝑖 + 1
Tidak
Gambar 2.1 Diagram alir metode Newton Raphson Mulai
Tentukan 𝜃̂𝑖
dan 𝜀
Hitung 𝜕𝐿
𝜕𝜃𝑡
Hitung (𝜕2𝐿
𝜕2𝜃𝑡)−1
Hitung
𝜃̂𝑖+1 = 𝜃̂𝑖 − (𝜕2𝐿
𝜕2𝜃𝑡)−1 𝜕𝐿
𝜕𝜃𝑡
Apakah
|𝜃̂𝑖+1−𝜃̂𝑖
𝜃̂𝑖+1 |≤ 𝜀
Selesai
|𝜃̂𝑖+1− 𝜃̂𝑖 𝜃̂𝑖+1 |
24
BAB 3
HASIL DAN PEMBAHASAN
Bab ini berisikan tentang bagaimana cara menaksir parameter distribusi Gamma dengan 2 parameter yaitu dengan metode maksimum likelihood dan metode newton raphson, serta model distribusi untuk data curah hujan.
3.1 Penaksiran Parameter pada Distribusi Gamma
Distribusi gamma didapat dari fungsi gamma yang sudah dikenal luas, dan dipelajari dalam banyak bidang matematika. Fungsi gamma didefinisikan dengan :
Γ(𝛼) = ∫ 𝑥0∞ 𝛼−1𝑒−1𝑑𝑥 untuk 𝑎 > 0
Pada penelitian ini, peneliti akan melakukan penaksiran terhadap parameter pada distribusi Gamma dengan penaksiran titik. Beberapa metode penaksiran titik yang digunakan untuk menaksir parameter diantaranya adalah metode kuadrat kecil (last square method), metode momen, dan metode kemungkinan maksimum (maximum likelihood method).
Penaksiran titik yang digunakan pada penelitian ini adalah metode kemungkinan maksimum (maximum likelihood method). Memaksimumkan fungsi likelihood biasanya dilakukan dengan metode derivatif (turunan). Pendugaan maximum likelihood mempunyai sifat-sifat penting yaitu: unbias (tak bias), konsisten, dan efisien.
Berikut akan dilakukan penaksiran parameter pada distribusi Gamma dengan menggunakan metode maksimum likelihood.
3.1.1 Penaksiran Parameter Distribusi Gamma dengan Metode Maksimum Likelihood.
Distribusi Gamma merupakan salah satu alternatif model yang banyak digunakan dalam eksperimen yang menunjukkan distribusi yang tidak simetris. Meskipun distribusi normal memiliki peranan yang luas di berbagai bidang, dalam kenyatannya terdapat situasi di mana hasil-hasil eksperimen menunjukkan distribusi yang tidak simetris ataupun tidak menunjukkan kecendrungan simetris.
Dalam kasus-kasus semacam ini, model distribusi normal tidak dapat memberikan hasil yang tepat jika digunakan. Untuk eksperimen-eksperimen probabilitas yang hasilnya menunjukkan suatu bentuk distribusi yang mempunyai variasi ukuran kemencengan yang cukup signifikan. Dalam hal ini, peneliti akan melakukan penaksiran parameter terhadap distribusi gamma. Adapun fungsi padat peluang distribusi Gamma adalah sebagai berikut:
𝑓(𝑥|𝛼, 𝛽) = {
1
𝛽𝛼(α)𝑥𝛼−1𝑒 −𝑥
𝛽 ; 𝑥 > 0
0 ; 𝑥 𝑙𝑎𝑖𝑛𝑛𝑦𝑎 (3.1)
Distribusi Gamma mempunyai parameter 𝛼 dan 𝛽 yang belum diketahui dengan peubah acak bebas 𝑋 yang berukuran 𝑛. Maka parameter tersebut akan diestimasi dengan menggunakan metode Maksimum Likelihood yang mempunyai beberapa langkah estimasi. Adapun langkah-langkah estimasi dengan metode Maksimum Likelihood adalah:
Langkah 1:
Menentukan fungsi padat peluang distribusi Gamma.
Fungsi distribusi gamma adalah:
𝑓(𝑥|𝛼, 𝛽) = { 1
𝛽𝛼(α)𝑥𝛼−1𝑒 −𝑥 𝛽 0 Dengan 𝛼 > 0 dan 𝛽 > 0
26
Langkah 2:
Membentuk fungsi padat peluang distribusi Gamma kedalam model 𝐿(𝑥|𝛼, 𝛽) yang dinamakan dengan fungsi likelihood. Sehingga fungsi likelihood dari fungsi padat peluang distribusi Gamma adalah:
𝐿(𝑥|𝛼, 𝛽) = 𝐿(𝑓(𝑥)|𝛼, 𝛽)
= ∏ 1
𝛽𝛼(α)𝑒
∑𝑛𝑖=1𝑥
𝛽 (𝑥1, 𝑥2, … 𝑥𝑛)𝛼−1)
𝑛
𝑖=1
(3.2)
= 1
𝛽𝛼(α) 𝑒 −𝑥1
𝛽 (𝑥1𝛼−1) 1
𝛽𝛼(α) 𝑒 −𝑥2
𝛽 (𝑥2𝛼−1) … 1
𝛽𝛼(α) 𝑒 −𝑥𝑛
𝛽 (𝑥𝑛𝛼−1)
= ( 1
𝛽𝛼(α))
𝑛
𝑒
∑𝑛 𝑥𝑖 𝑖=1
𝛽 ((𝑥1, 𝑥2, … 𝑥𝑛)𝛼−1))𝑛
Langkah 3:
Membentuk fungsi likelihood kedalam bentuk ln(𝑥|𝛼, 𝛽) yang dinamakan dengan fungsi maksimum likelihood (log likelihood). Sehingga fungsi maksimum
likelihood dari fungsi likelihood adalah:
ln(𝑥|𝛼, 𝛽) = 𝑙𝑛(𝑓(𝑥)|𝛼, 𝛽)
= 𝑙𝑛 [( 1 𝛽𝛼(α))
𝑛
𝑒
∑𝑛𝑖=1𝑥
𝛽 ((𝑥1, 𝑥2, … 𝑥𝑛)𝛼−1))𝑛]
= ln((α)𝛽𝛼)−𝑛 𝑒
∑𝑛𝑖=1𝑥
𝛽 ((𝑥1, 𝑥2, … 𝑥𝑛)𝛼−1))𝑛
= −𝑛 ln ((α)𝛽𝛼)𝑒
∑𝑛𝑖=1𝑥
𝛽 ((𝑥1, 𝑥2, … 𝑥𝑛)𝛼−1))𝑛
= −𝑛 ln ((α)𝛽𝛼)𝑒
∑𝑛𝑖=1𝑥
𝛽 ((𝑥1, 𝑥2, … 𝑥𝑛)𝛼−1))𝑛𝑎−𝑛
= −𝑛 ln((α)𝛽𝛼) −∑𝑛𝑖=1𝑥
𝛽 + (𝑛𝛼 − 𝑛) ∑ ln (𝑥𝑖)
𝑛
𝑖=1
= −𝑛 ln((α)) − nα ln(β) −∑𝑛𝑖=1𝑥
𝛽 + 𝑛𝑎 ∑𝑛 ln(𝑥𝑖) − 𝑛
𝑖=1
∑𝑛 𝑙𝑛(𝑥𝑖)
𝑖=1
(3.3)
Misalkan 𝑥1, 𝑥2, … , 𝑥𝑛 merupakan sampel acak dari 𝑛 observasi dari populasi distribusi Gamma, maka fungsi maksimum likelihood untuk sampel tersebut yaitu dengan mencari turunan parsial pertama dari fungsi log likelihood-nya dan dimaksimumkan sebagai berikut.
Langkah 4:
Memaksimumkan fungsi maksimum likelihood (3.3) dengan menurunkan fungsi maksimum likelihood (3.3) terhadap parameter yang mengikutinya yakni 𝛼 dan 𝛽, dan menyamakan dengan 0.
Pada distribusi gamma ini mempunyai dua parameter yang tidak diketahui yakni 𝛼 dan 𝛽. Sehingga untuk nilai 𝛼 dan 𝛽 dapat dicari dengan mendifferensialkan persamaan (3.3) terhadap parameter yang mengikutinya yakni:
𝜕
𝜕𝛼ln 𝐿 (𝑥|𝛼, 𝛽) = 0 𝑑𝑎𝑛 𝜕
𝜕𝛽ln 𝐿 (𝑥|𝛼, 𝛽) = 0 (3.4)
1. Diturunkan terhadap 𝛼
𝜕
𝜕𝛼ln 𝐿 (𝑥|𝛼, 𝛽) = 0
𝜕 [−𝑛 ln((α)) −𝑛𝛼 ln(𝛽) − ∑𝑛𝑖=1𝑥
𝛽 + 𝑛𝑎 ∑𝑛𝑖=1ln(𝑥𝑖) − 𝑛∑𝑛𝑖=1𝑙𝑛(𝑥𝑖)]
𝜕𝛼 = 0
−𝑛 1
(α̂)′(α̂) − n ln(β̂) − 0 + n ∑ ln (𝑥𝑖)
𝑛
𝑖=1
− 0 = 0
−𝑛 1
(α̂)′(α̂) − n ln( (β̂) + n ∑ ln (𝑥𝑖)
𝑛
𝑖=1
= 0
′(α̂)
(α̂) + ln (β̂) − n ∑ ln (𝑥𝑖)
𝑛
𝑖=1
= 0 (3.5)