BAB I PENDAHULUAN Latar Belakang dan Permasalahan

(1)

1.1. Latar Belakang dan Permasalahan

Di dalam statistika, sebuah estimator adalah hasil perhitungan suatu estima-si terhadap kuantitas tertentu berdasarkan pada data terobservaestima-si atau sering disebut sampel. Kuantitas tertentu tersebut biasanya tidak diketahui nilainya, yang sering di-sebut parameter. Misal suatu variabel acak X diketahui berdistribusi normal dengan parameter mean µ dan variansi σ2. Akan tetapi, nilai parameter-parameter µ dan σ2 sering tidak diketahui di dalam dunia nyata. Untuk itu, diperlukan suatu estimator un-tuk mengestimasi parameter tersebut. Selanjutnya, diasumsikan telah tersedia sampel X1, X2, . . . , Xn dari variabel acak X. Berdasarkan sampel ini kemudian ditentukan

statistik Tn = T (X1, X2, . . . , Xn) untuk suatu fungsional T . Harapannya, statistik Tn

ini merupakan estimasi yang terbaik terhadap parameter tertentu yang tidak diketahui nilainya.

Beberapa permasalahan yang sering muncul dalam estimasi sebarang parame-ter tak diketahui θ meliputi: (1) Estimator bθ apa yang akan digunakan atau dipilih, (2) Setelah memilih estimator tertentu, bagaimana konsistensi estimator tersebut terha-dap parameter yang sebenarnya, dan (3) Bagaimana keakurasian estimator tersebut, dan (4) Bagaimana perilaku asimtotik dari estimator tersebut. Konsistensi dan keaku-rasian diperlukan untuk menjamin bahwa estimator bθ yang dipilih tersebut merupakan estimator terbaik sesuai yang diharapkan dalam ilmu statistika. Konsistensi suatu es-timator ditentukan oleh mode kekonvergenan (modes of convergence) seperti konver-gen dalam distribusi, konverkonver-gen dalam probabilitas ataupun konverkonver-gen hampir pasti. Sementara itu, untuk menyelidiki keakurasian suatu estimator perlu diselidiki standar error dari estimator tersebut atau dikonstruksi suatu interval konfidensi. Standar error menyatakan keakurasian estimator yang menggambarkan seberapa jauh estimator bθ menyimpang dari nilai parameter θ yang sebenarnya. Sedangkan interval konfidensi

(2)

menyatakan seberapa jauh estimator berada pada lingkungan parameter dengan de-rajad kepercayaan tertentu yang mana hal ini menggambarkan probabilitas cakupan (coverage probability) dari suatu parameter yang akan diestimasi.

Bootstrap, merupakan metode yang berbasis pada komputer-intensif, berkem-bang pesat sejak diperkenalkan pertama kali oleh Bradley Efron pada tahun 1979. Metode bootstrap didesain untuk bisa menjawab beberapa permasalahan di atas, khu-susnya permasalahan (3) dan (4) dengan tingkat akurasi yang tinggi [Efron dan Tib-shirani (1986)]. Selain itu, metode bootstrap dapat digunakan pada situasi dimana asumsi standar tidak dipenuhi, misal ukuran sampel n kecil dan data tidak berdistri-busi normal [Davison dan Hinkley (2006)]. Menurut Singh (1981), Hall (1992) dan DasGupta (2008), distribusi mean sampel bootstrap memiliki tingkat akurasi yang le-bih tinggi dibandingkan dengan aproksimasi distribusi limit normal. Secara teoritis mereka menunjukkan bahwa bootstrap memiliki keakurasian orde kedua, sementara aproksimasi distribusi limit normal hanya memiliki keakurasian orde pertama. Bic-kel dan Freedman (1981) mempelajari aproksimasi distribusi bootstrap dari statistik penting seperti mean dan statistik-t. Mereka menyimpulkan bahwa kedua statistik bersifat asimtotik.

Misalkan parameter θ adalah mean populasi. Estimator konsisten untuk θ ada-lah mean sampel bθ = X = 1_nPn

i=1Xi. Teori konsistensi kemudian dikembangkan

untuk menyelidiki konsistensi estimator mean bootstrap. Menurut terminologi boots-trap, jika ingin menyelidiki konsistensi dari estimator mean bootsboots-trap, maka harus diselidiki distribusi√n X − µ dan√nX∗− X. Variabel baru yang dinotasik-an dengdinotasik-an X∗ adalah sampel bootstrap yang diperoleh dengan cara sampling acak berukuran n dengan pengembalian dari sampel semula X. Konsistensi bootstrap di bawah metrik Kolmogorov didefinisikan sebagai

sup x PF √ n X − µ ≤ x− PFn √ n X∗− X ≤ x . (1.1)

Bickel and Freedman (1981) dan Singh (1981) telah menunjukkan bahwa (1.1) konvergen hampir pasti (converges almost surely) menuju 0 ketika n → ∞ .

(3)

Se-mentara itu, Suprihatin dkk (2012) melengkapi hasil-hasil tersebut dengan ilustrasi menarik hasil simulasi Monte Carlo. Selain estimator bootstrap untuk mean bersifat konsisten, secara teoritis metode bootstrap memiliki tingkat akurasi yang lebih ba-ik dibanding dengan teorema limit pusat yang telah dba-ikenal sebelumnya [lihat Bose (1988) dan Babu dan Singh (1983)]. Konsistensi bootstrap untuk mean sampel me-rupakan alat penting untuk menyelidiki konsistensi dari statistik lainnya yang lebih rumit.

Dalam disertasi ini, akan diselidiki konsistensi estimator bootstrap untuk para-meter proses autoregresif. Misal {Xt, t = 1, 2, . . . , n} adalah data runtun waktu (time

series) yang memenuhi proses (model) autoregresif orde p atau AR(p), yakni apabila {Xt, t = 1, 2, . . . , n} memenuhi persamaan Xt= θ1Xt−1+ θ2Xt−2+ . . . + θpXt−p+ εt= p X i=1 θiXt−i+ εt (1.2)

dengan θ = (θ1, θ2, . . . , θp)T adalah vektor parameter dan {εt} adalah barisan

varia-bel acak white noise yang berdistribusi independen dan identik (i.i.d.) N (0, σ2_).

Dia-sumsikan {Xt, t = 1, 2, . . . , n} stasioner. Topik tentang runtun waktu secara lengkap

dapat dijumpai misalnya pada Wei (1990) dan Brockwell and Davis (1991). Estima-tor untuk vekEstima-tor parameter θ adalah bθ = bθ₁, bθ₂, . . . , bθ_p

T

. Brockwell and Davis (1991) menunjukkan bahwa √ nθ − θb →dN 0, σ2Γ−1_p ,

dimana Γp adalah matriks kovariansi [γ(i − j)]pi,j=1. Dengan menggunakan prinsip

plug-in diperoleh vektor estimator bootstrap bθ∗ = θb₁∗, bθ₂∗, . . . , bθ_p∗ T

yang dihitung berdasarkan sampel bootstrap X∗. Konsistensi dari estimator bootstrap untuk mean sampel akan digunakan untuk menyelidiki konsistensi dan distribusi asimtotik dari bθ∗ dengan menggunakan metode delta.

(4)

1.2. Tujuan Penelitian

Secara umum penelitian ini terbagi menjadi dua kajian. Pertama, adalah kaji-an teoritis ykaji-ang berkaitkaji-an dengkaji-an pembuktikaji-an secara matematis konsistensi estimator bootstrap. Kedua, adalah kajian terapan yang berkaitan dengan implementasi hasil kajian teori untuk memperkuat hasil-hasil pada kajian teoritis. Pada kajian kedua ini disajikan simulasi Monte Carlo yang menggunakan data nyata, untuk mempero-leh standar error dari estimator bootstrap, interval konfidensi dan visualisasi estimasi fungsi densitas. Dengan demikian tujuan penelitian ini adalah:

1. Mengkonstruksi suatu fungsi terukur φjyang memenuhi bθj = φj(X1, X2, . . . , Xn),

dan bθ_j∗ = φj(X1∗, X ∗

2, . . . , X ∗

n), j = 1, 2, . . . , p, dengan bθj adalah estimator

un-tuk paremeter θj dan bθj∗adalah versi bootstrap dari bθj.

2. Menentukan estimator bootstrap untuk parameter proses autoregresif dan me-nyatakan estimator bootstrap tersebut sebagai fungsi terukur φj.

3. Menyelidiki distribusi asimtotik dari vektor estimator bootstrap untuk parame-ter proses autoregresif dengan menggunakan metode delta.

4. Membuat program komputasi aplikasi dan simulasi dengan menggunakan data nyata untuk menguatkan hasil-hasil pada kajian teoritis.

1.3. Manfaat Penelitian

Hasil penelitian ini diharapkan dapat memberikan beberapa manfaat sebagai berikut:

1. Sebagai sumbangan pemikiran untuk memperkuat dan mengembangkan keil-muan di bidang statistika, khususnya pada bidang bootstrap dan teori runtun waktu.

2. Memberikan landasan teori bagi peneliti berikutnya yang berminat mengem-bangkan penelitian ini.

(5)

3. Sebagai salah satu referensi bagi peneliti dan praktisi dalam pengkajian apli-kasi metode bootstrap yang cukup berkembang pesat sejak diperkenalkan oleh Bradley Efron pada tahun 1979.

4. Dapat menentukan konsistensi dan distribusi limit dari estimator bootstrap un-tuk parameter model autoregresif.

1.4. Tinjauan Pustaka

Sejak diperkenalkan pada akhir dekade tahun 1970an, metode bootstrap ber-kembang pesat. Banyak penelitian yang mengembangkan metode bootstrap seiring dengan berkembangnya teknologi komputasi. Hal ini dikarenakan metode bootstrap erat kaitannya dengan resampling yang melibatkan sampel bootstrap berukuran be-sar, yang tentu membutuhkan teknologi komputasi. Untuk kasus ukuran sampel ke-cil, Maritz dan Jarrett (1998) dan Fisher dan Hall (1991) memberikan estimasi yang baik untuk menentukan standar error dari median sampel. Namun, berdasarkan sam-pel berukuran kecil tersebut, dapat dibangkitkan samsam-pel-samsam-pel tiruan yang diperoleh dengan cara resampling dengan pengembalian dari sampel semula. Sampel tiruan ter-sebut dinamakan sampel bootstrap. Pada awal perkembangannya, Efron (1992), Hall (1986) dan Efron dan Tibshirani (1993) menyarankan untuk menggunakan sampel bootstrap berukuran paling sedikit 50 untuk menghitung standar error dan sedikitnya 200 untuk menentukan interval konfidensi. Saat ini, dimana alat komputasi sema-kin canggih, ukuran sebesar itu tidak menjadi kendala. Bahkan, seorang peneliti bisa membangkitkan sampel bootstrap berukuran ratusan bahkan ribuan sesuai dengan ke-butuhan.

Untuk menentukan standar error dan interval konfidensi yang melibatkan sam-pel berukuran besar tentu memerlukan program komputasi atau simulasi. Kedua ukuran ini menyatakan keakurasian suatu estimator bootstrap dalam mengestimasi parameter suatu model. Babu dan Singh (1983) mempelajari konsistensi estima-tor mean dengan menggunakan metode bootstrap. Selanjutnya, Brown dkk (2001) mempelajari median yang diperhalus dengan metode bootstrap. Kedua karya

(6)

ilmi-ah tersebut melaporkan bilmi-ahwa bootstrap memiliki tingkat akurasi yang baik. Secara teoritis, Bose (1988) mengkaji keakurasian estimator bootstrap dengan menggunak-an ekspmenggunak-ansi Edgeworth ymenggunak-ang diterapkmenggunak-an pada model autoregresif. Freedmmenggunak-an (1984) memberikan algoritma untuk memperoleh sampel bootstrap untuk data runtun wak-tu yang dikenal dengan bootstrap residual. Singh (1981) membuktikan konsistensi estimator bootstrap untuk mean dengan menggunakan metrik Kolmogorov, sementa-ra Bickel dan Freedman (1981) membuktikan hasil yang sama dengan menggunakan metrik Mallows-Wasserstein. Suprihatin dkk (2013) juga mempelajari keakurasian metode bootstrap untuk statistik yang lain, yakni median. Hasilnya menunjukkan bahwa bootstrap memberikan tingkat akurasi yang baik, yang ditunjukkan oleh stan-dar error dan interval konfidensi, dimana kedua ukuran tersebut memberikan hasil yang sangat dekat dengan versi standarnya.

Setelah estimator bootstrap terbukti konsisten, masih timbul permasalahan yang menarik untuk diteliti, yakni keakurasin estimator tersebut. Efron dan Tibshirani (1986) menerbitkan karya ilmiahnya yang menghasilkan ukuran-ukuran keakurasian estimator bootstrap, seperti standar error dan interval konfidensi. Sementara itu, Di-Ciccio dan Efron (1996), DiDi-Ciccio dan Tibshirani (1987) dan Hall (1988) membahas tentang interval konfidensi bootstrap dan menyimpulkan bahwa bootstrap merupakan metode resampling yang akurat dalam analisa statistika. DiCiccio dan Efron (1996) memperkenalkan beberapa interval konfidensi bootstrap, seperti bootstrap-t, boots-trap persentil, dan BCa (bias-corrected and accelerated). Dalam ulasannya, DiCiccio dan Romano (1988) memberikan penilaian bahwa interval-interval bootstrap tersebut memiliki tingkat akurasi yang baik. Untuk ukuran sampel kecil, yakni n = 5, disim-pulkan bahwa interval BCa memiliki tingkat akurasi yang paling baik. Hasil penting berkaitan dengan keunggulan metode bootstrap dikemukakan oleh Bose (1988). Ia menyimpulkan bahwa bootstrap memiliki tingkat keakurasian orde o(n−1/2) ketika diterapkan pada estimasi parameter proses autoregresif. Kesimpulan ini lebih baik dibandingkan dengan tingkat akurasi pada teorema limit pusat yang keakurasiannya orde O(n−1/2).

(7)

Karya Bickel dan Freedman (1981) dan Singh (1981) menjadi tonggak penemu-an ypenemu-ang spenemu-angat penting, karena berdasarkpenemu-an konsistensi estimator bootstrap mepenemu-an ini dapat digunakan untuk menyelidi konsistensi estimator statistik lain yang lebih rumit. Selanjutnya, Gine dan Zinn (1989) mempelajari syarat-syarat untuk mean bootstrap, yang menyimpulkan bahwa momen pusat kedua berhingga (EX2 _{< ∞) merupakan}

syarat agar mean bootstrap konsisten. Beberapa contoh pengembangan dari konsis-tensi estimator bootstrap dapat dilihat pada Hutson dan Ernst (2000) dan Sahinler dan Topuz (2007). Hutson dan Ernst (2000) menyelidiki mean dan variansi bootstrap untuk estimator-L, sementara Sahinler dan Topuz (2007) mempelajari algoritma dari estimasi bootstrap untuk parameter model regresi. Hardle dkk (2003) menerbitkan karya mereka tentang bootstrap dalam bidang runtun waktu. Dari kajian teoritis dan hasil simulasi, mereka melaporkan bahwa bootstrap memberikan hasil yang akurat tatkala metode bootstrap diterapkan pada model-model runtun waktu. Teori konsis-tensi untuk estimator bootstrap menjadi topik menarik untuk penelitian bidang sta-tistika. Cheng dan Huang (2010) mempelajari konsistensi esimator bootstrap untuk estimasi-M, yang merupakan pengembangan dari apa yang telah dihasilkan oleh Hu-tson dan Ernst (2000). Bibi dan Aknouche (2010) melaporkan konsistensi estimator Yule-Walker versi bootstrap, namun kesimpulannya hanya berdasarkan pada simu-lasi. Suprihatin dkk (2012) memberikan simulasi Monte Carlo untuk menjelaskan konsistensi estimator bootstrap untuk parameter pada proses autoregresif orde perta-ma. Sementara itu, Suprihatin dkk (2015a, 2015b) mempelajari aplikasi metode delta untuk menyelidiki distribusi asimtotik estimator bootstrap pada model autoregresif.

Konsistensi estimator pada model autoregresif dan regresi telah dipelajari oleh Politis (2003) dan Lamarche (2010). Politis (2003) mempelajari penerapan metode bootstrap pada analisis runtun waktu. Menurutnya, metode bootstrap residual bekerja dengan baik tatkala digunakan untuk meyelidiki konsistensi estimator mean sampel pada model autoregresif AR(p). Sementara itu, Lamarche (2010) menerapkan meto-de meto-delta untuk menyelidiki konsistensi estimator untuk parameter suatau mometo-del. Ia mempelajari metode delta dan metode bootstrap, dan menegaskan bahwa

(8)

konsisten-si estimator dapat diselidiki dengan menggunakan bootstrap rekonsisten-sidual yang biasanya diterapkan pada model runtun waktu dan regresi. Ia juga membahas metode delta pada bootstrap pasangan yang cocok diterapkan pada model regresi.

1.5. Metode Penelitian

Disertasi ini merupakan kajian yang didasarkan pada studi literatur. Untuk mendukung dapat diselesaikannya disertasi ini, langkah awal yang dilakukan adalah mempelajari literatur yang berupa buku dan karya ilmiah pendukung seperti jurnal. Literatur inilah yang dijadikan sebagai dasar untuk pengembangan yang dituangkan dalam disertasi ini. Pada tahap ini diperlukan ketelitian untuk mengamati dan mem-pelajari literatur tersebut yang diharapkan dapat menjembatani penyelesaian masalah inti yang akan dikerjakan dalam disertasi ini. Setelah menghasilkan proposal si, telah dihasilkan beberapa makalah awal untuk memperkuat hasil penelitian diserta-si ini. Ini merupakan sarana untuk berkomunikadiserta-si dan mendiskudiserta-sikan hadiserta-sil penelitian pada forum ilmiah yang diikuti matematikawan, statistikawan dalam kelompok ke-ahlian yang sama untuk diberikan masukan atau saran untuk perbaikan. Selanjutnya, adalah publikasi pada jurnal nasional terakreditasi atau jurnal internasional. Secara rinci untuk menyelesaikan disertasi ini dilakukan langkah-langkah sebagai berikut:

1. Pada Kajian Teoritis

(a) Menjabarkan estimator parameter pada proses autoregresif dan versi boots-trap dari estimator tersebut.

(b) Mengkonstruksi suatu fungsi terukur yang digunakan untuk menyatakan estimator pada poin (a).

(c) Menerapkan metode delta untuk menyelidiki limit distribusi dari estima-tor pada proses auestima-toregresif.

(d) Menerapkan metode delta untuk bootstrap untuk menyelidiki limit distri-busi versi bootstrap dari estimator pada proses autoregresif.

(9)

2. Pada Kajian Simulasi Aplikasi

(a) Memilih data nyata untuk melakukan simulasi dan menerapkan hasil-hasil secara teoritis pada data nyata.

(b) Membuat simulasi Monte Carlo yang menggunakan data nyata, untuk menguatkan hasil-hasil yang diperoleh.

Langkah-langkah konkret untuk menyelesaikan penelitian ini dijabarkan lebih lanjut pada Bab IV dan V.

1.6. Sistematika Penulisan

Disertasi ini terdiri dari enam Bab. Bab I membahas tentang latar belakang dan permasalahan, tujuan, manfaat, tinjauan pustaka, metode penelitian dan sistema-tika penulisan disertasi. Dalam Bab II, dibahas tentang teori yang mendukung tulisan ini, misalnya tentang mode kekonvegenan, model runtun waktu autoregresif, metode delta, metode resampling bootstrap, ekspansi Edgeworth, konsistensi estimator boots-trap mean dan laju kekonvergenannya serta beberapa konsep yang berkaitan dengan tujuan penulisan disertasi ini.

Sementara itu, pada Bab III dibahas tentang konsistensi estimator parameter pada model autoregresif dan distribusi peluang dari estimator tersebut. Bab IV me-rupakan hasil inti dari penelitian disertasi ini, yakni membuktikan kekonsistenan es-timator bootstrap untuk parameter model autoregresif dengan menggunakan metode delta. Pada Bab V disajikan hasil-hasil simulasi Monte Carlo sebagai aplikasi ka-jian teoritis yang diterapkan pada data nyata dengan menggunakan perangkat lunak S-Plus. Pada Bab VI, yang merupakan bab terakhir, penulis mencoba menyimpulk-an hasil pembahasmenyimpulk-an dari bab-bab sebelumnya dmenyimpulk-an memberikmenyimpulk-an beberapa masalah terbuka.