SUATU KAJIAN TERHADAP KETERBATASAN
METODE BOOTSTRAP
PADAUJIRATAANDUACONTOH
Oleh
JOKO RATONO
G 27.1049
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Pada akhir tahun 1978 berkembanglah metode uji yang menggunakan pendekatan lain dari metode uji sebelumnya. Metode uji rataan dua contoh Bootstrap lebih menyandarkan pada kehandalan kinerja komputer daripada asumsi-asumsi klasik. Metode ini juga tidak sepenuhnya mempercayakan pada kehandalan dalil limit pusat.
Meskipun untuk populasi normal dan ragam homogen kuasa uji-t masih lebih baik, namun bila ragam heterogen kuasa uji metode Bootstrap setaraf dengan uji-t kira-kira Satterthwaite dan uji-t kira-kira Cochran-Cox.
Metode Uji Bootstrap memiliki keunggulan dalam mendeteksi beda yang kecil pada ragam heterogen cukup besar,
serta
tidak memerlukan pemeriksaan asumsi sebaran populasi.Keterbatasan metode Bootstrap adalah masih diperlukan waktu yang relatif sedikit lebih lama untuk pemetikan contoh ulang (B) serta nilai ASL Boot yang tidak jarang berbeda.
R E N U N G A N
T'lah kulalui masa-masa yang kurasakan beginc berar dun r '/ah kupenuhi panggilan kelahiran dun n a m h . .
.
. Dalam titian yang kukenang sebagai lauran perjuangan, muara dari berbagai peristiwa yang mengemas kejengkelen,kebencian, kekesalan dun kelerihan yang reramar sangat.
..
Kubangun pondasi kehidupanku dun bem'up bersamanya angin barn yang '!an membawa khabar renrang ujiandun cobaan berikurnya.. . . yang kurahu pasri..
. . . .
akan lebih berarBersmna-Mu, ya Allah kusancknn senlangarku dalam kebesaran nama-MU
SUATU W A N
TERHADAP KETERBATASAN
METODE BOOTSTRAP
PADA UJI RATAAN DUA
CONTOH
Oleh
JOKO RATONO
G
27.1049
Karya Ilmiah
Sebagai Salah Satu Syarat untuk memperoleh Gelar
Sarjana Statistika
pada
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
JURUSAN STATISTIKA
Judul Karya Ilmiah
:Suatu Kajian Terhadap Keterbatasan Metode Bootstrap
pada Uji Rataan Dua Contoh
Nama Mahasiswa
:Joko Ratono
Nomor Pokok
:G 27.1049
Menyetujui
1.
Komisi Pembimbing
4
Prof.Dr.Ir. Artdi3Iakim Nasoetion
Ketua
Anggota
2. Ketua Jurusan
Penulis dilahirkan di kecamatan Plaosan, sebuah kota kecil yang terletak di lereng Lawu sebelah timur, kabupaten Magetan Jawa Timur pada tanggal 28 Oktober 1971. Penulis merupakan putra tunggal buah perkawinan Ayahanda Sukimun dan Ibunda Sani.
Pada tahun 1984 penulis menamatkan Sekolah Dasar di Plaosan I1 dan tahun 1987 menamatkan Sekolah Menengah Pertama di SMPN I Plaosan. Kemudian penulis memasuki SMA dan lulus tahun 1990 dari SMAN I Magetan. Pada tahun yang sama, penulis di terima di Institut Pertanian Bogor melalui jalur USMI. Setahun kemudian penulis memasuki jurusan Statistika.
Selama di Jurusan Statistika penulis aktif menjadi staf pengajar di Lembaga Bimbingan Belajar Bina Eksakta Pratama yang kemudian berganti nania LBB NETRO. Penulis juga pernah menjadi Asisten untuk mata kutiah Biologi Umum, Pengantar Matematika, Kalkulus dan Pengantar Ilmu Komputer.
KATA
PENGANTAR
Puji Syukur penulis ucapkan ke hadirat Allah SWT yang telah memberikan segenap kekuatan, sehingga penulis dapat menyelesaikan karya tulis ini.
Terima kasih penulis sampaikan kepada Bapak Prof.Dr.Ir. Andi Hakim Nasoetion yang telah berkenan membimbing penulis serta mengarahkan sampai terselesaikannya karya tulis ini. Terima kasih juga penulis sampaikan kepada Bapak Ir. Agus Buono yang berkenan pula memberikan perbaikan dan saran terhadap penulis.
Kepada Ketua Jurusan dan Staf Pengajar Statistika, yang telah membekali penulis selama penulis menimba ilmu, penulis juga mengucapkan terimakasih.
Secara khusus, penulis ingin mengucapkan terima kasih kepada Bapak Dr.Ir.A.A. Mattjik, Dr. Pallawarukka dan Ir. Abu Bakar Burniat yang telah banyak membantu penulis dalam kelanjutan studi di IPB.
Pendahuluan Latar Belakang Tujuan
Studi Pustaka
Fungsi Sebaran Empirik dan Prinsip Pencocokan Metode Bootstrap
Beberapa Uji Parameter Pernusatan Dua Contoh Metode Bootstrap
Uji-t
Uji-t bra-kira Satterthwaite Uji-t kira-kira Cochran-Cox
Uji-Wilcoxon-MannWhitney
Uji-Median Mood Kriteria Kebaikan Metode
Analisis Diskriminan Metode Tetangga Terdekat Galat Jenis I
Galat Jenis I1 Bahan dan Metode
Bahan Metode
Penentuan n dan B untuk uji ganda Penentuan Parameter uji ganda Algoritma uji ganda Bootstrap Hasil clan Pernbahasan
Hasil Pendahuluan
Hasil Analisis Diskriminan Metode Tetangga Terdekat Galat Jenis I dan I1
Kesimpulan Saran
DAFTAR TABEL
teks
-
no
judul1. Kondisi data
2. Rataan dan Simpangan Baku ASL Boot 3. Nilai Koefisien Keragaman
Lam~iran 1. Salah Klasifikasi
2. Galat Jenis I dan I1
3. Rataan dan Galat Baku ASL Boot
DAFTAR GRAFIK
teks -
no
j d u l1. Boxplot Nilai Tengah N=lOO 2 Boxplot Simpangan Baku N=lOO 3. Plot Dugaan Rataan Bootstrap N=5
4. Plot Dugaan Simpangan Baku Bootstrap N=5 5. Koefisien Keragaman pada berbagai n dan B
6 . Koefisien Keragaman B takhingga 7. Salah Klasifikasi a2 = 1
8. Salah Klasifikasi u2= 114 9. Salah Klasifikasi a2=2 10. Galat Jenis I(0) dan II(1)
11. Galat Jenis I(0) dan II(1) pada a2= 114 12. Galat Jenis L(0) dan II(1) pada a2=2 13. Plot Waktu terhadap B
Lampiran 1. Plot dugaan nilai ten& dan simpangan baku
2 . Boxplot ASL B50 3. Boxplot ASL BlOO 4. Boxplot ASL B200
5. Plot CV(seB) vs B pada n=5
6 . Plot CV(seB) vs B pada n= 10
PENDAHULUAN
Latar Belakang
Semakin pesatnya kemajuan kinerja komputer akhir-akhir ini menyehahkan terjadinya perkembangan teori statistika yang mengarah pada kehandalan komputer, terutama kecepatan dan kemampuan menghitungnya. Dengan demikian herkemhanglah metode-metode iteratif, yang seringkali tidak memerlukan syarat-syarat ketat mengenai parameter seharan populasinya. Salah satunyaadalah metode Bootstrap Non-parametrik yang tidak memerlukan asumsi seharan, karena didekati dengan seharan empirik, dan dapat diterapkan pada herhagai kondisi termasuk ragam heterogen.
Pada uji dua nilai tengah contoh, uji-Z memerlukan asumsi seharan populasi normal, ragam homogen dan n hesar. Uji-t memerlukan asumsi seharan populasi normal dan ragam homogen. Uji-t kira-kira Satterthwaite dan Cochran-Cox memerlukan asumsi seharan populasi normal dan uji Wilcoxon-Mann Whimey memerlukan asumsi seharan populasi simetrik. Uji yang tidak hanyak memerlukan asumsi adalah uji median Mood (Steel & Torrie, 1980), namun kuasa ujinya secara umum kurang haik.
Tujuan 1
Penelitian ini' mempakan studi empirik yang hertujuan :
- Mempelajari sifat-sifat Bootstrap pada contoh tunggal guna mendapatkan hatas ukuran contoh (n) dan hanyaknya contoh ulang (B) untuk melakukan uji dua nilai tengah dengan metode Bootstrap.
- Memhandingkan kekuatan uji Metode Bootstrap dengan heherapa uji ganda lainnya pada herhagai keadaan ragam
homogen maupun heterogen, serta melihat pada kondisi bagaimana metode uji tersehut mempunyai kuasa yang haik.
STUD1 PUSTAKA
Fungsi Seharan Empirik dan prinsip Pencocokan (Plug-In)
Fungsi Sebamn Empirik
Jika suatu contoh acak herukuran n diamhil dari suatu seharan peluang F.
F
->
(XI, ~ 2 ,..., 4
maka
E
disehut fungsi seharan empirik yang didefinisikan sehagai seharan diskrit yang memherikan peluang lln untuk setiap nilai xi, i= 1,....
n. Dengan demikian suatu gugus A dalam mang contoh x mempunyai peluang empirikP{A) =#{x,eA}/n, #= jumlah Prinsip Pencocokan
Prinsip pencocokan adalah suatu metode sederhana dalam pendugaan parameter dari contoh. Penduga p e n c o c o k a n p a r a m e t e r O = t ( F ) didetinisikan menjadi $=t(i?).
Dengan kata lain 8=t(F) dari seharan F diduga dengan
seharan empirik?,
Metode Bootstrap
Bootstrap mempakan metode pemetikan contoh ulang secara acak hemkuran sama dengan pengemhalian dari suatu contoh acak yang diper- kenalkan Efron.
Bila dilakukan pendekatan seharan empirik, maka metode Bootstrap yang dilakukan adalah non-parametrik.
Langkah pemhangkitan contoh acak Bootstrap non-parametrik.
1. Berikan peluang yang sama lln pada setiap pengamatan contoh berukuran n x=(x1.x2
,....
xJ.2. Amhil secara acak contoh ulang herukuran n dengan pengemhalian. X* = (x,*,
. .
.
,x.*). (Sebuah pengamatan hisa terpilih lebih dari satu kali)3. Dari contoh ulang yang didapat lakukan pendugaan statistik penting. 4. Ulangi Bootstrap hingga didapatkan B
huah penduga.
Efron (1993), menjelaskan hahwa dari pengalaman yang didapat untuk pendugaan simpangan baku atau pengujian hipotesis cukup diperlukan B antara 50-200 dan untuk pemhuatan selang kepercayaan diperlukan B ;r 1000.
Berikut skema rnetode Bootstrap
Sebaran F t i d a k d i k e t a h u i
bentuknya
A
F sebaran empirik
Beberapa Uji Parameter Pernusatan
Dua contoh
populasi 1 populasi 2
Bila x, contoh acak herukuran n, dan x, contoh acak berukuran n,, maka untuk contoh dari populasi normal yang herukuran relatif hesar uji-Z dapat digunakan untuk menguji nilai tengah dua contoh dengan hipotesis :
H,:
P l = hHI
: p, c h a t a u p , < k atau p i >Namun bila ukuran contoh relatif kecil atau ragam heterogen, uji-Z kurang tepat digunakan.
Berikut adalah uji-uji dua nilai pernusatan c o n t o h y a n g a k a n dihandingkan :
Metode Bootstrap
Bootstrap Non-parametrik mempunyai kriterium uji :
SUATU KAJIAN TERHADAP KETERBATASAN
METODE BOOTSTRAP
PADAUJIRATAANDUACONTOH
Oleh
JOKO RATONO
G 27.1049
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Pada akhir tahun 1978 berkembanglah metode uji yang menggunakan pendekatan lain dari metode uji sebelumnya. Metode uji rataan dua contoh Bootstrap lebih menyandarkan pada kehandalan kinerja komputer daripada asumsi-asumsi klasik. Metode ini juga tidak sepenuhnya mempercayakan pada kehandalan dalil limit pusat.
Meskipun untuk populasi normal dan ragam homogen kuasa uji-t masih lebih baik, namun bila ragam heterogen kuasa uji metode Bootstrap setaraf dengan uji-t kira-kira Satterthwaite dan uji-t kira-kira Cochran-Cox.
Metode Uji Bootstrap memiliki keunggulan dalam mendeteksi beda yang kecil pada ragam heterogen cukup besar,
serta
tidak memerlukan pemeriksaan asumsi sebaran populasi.Keterbatasan metode Bootstrap adalah masih diperlukan waktu yang relatif sedikit lebih lama untuk pemetikan contoh ulang (B) serta nilai ASL Boot yang tidak jarang berbeda.
R E N U N G A N
T'lah kulalui masa-masa yang kurasakan beginc berar dun r '/ah kupenuhi panggilan kelahiran dun n a m h . .
.
. Dalam titian yang kukenang sebagai lauran perjuangan, muara dari berbagai peristiwa yang mengemas kejengkelen,kebencian, kekesalan dun kelerihan yang reramar sangat.
..
Kubangun pondasi kehidupanku dun bem'up bersamanya angin barn yang '!an membawa khabar renrang ujiandun cobaan berikurnya.. . . yang kurahu pasri..
. . . .
akan lebih berarBersmna-Mu, ya Allah kusancknn senlangarku dalam kebesaran nama-MU
SUATU W A N
TERHADAP KETERBATASAN
METODE BOOTSTRAP
PADA UJI RATAAN DUA
CONTOH
Oleh
JOKO RATONO
G
27.1049
Karya Ilmiah
Sebagai Salah Satu Syarat untuk memperoleh Gelar
Sarjana Statistika
pada
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
JURUSAN STATISTIKA
Judul Karya Ilmiah
:Suatu Kajian Terhadap Keterbatasan Metode Bootstrap
pada Uji Rataan Dua Contoh
Nama Mahasiswa
:Joko Ratono
Nomor Pokok
:G 27.1049
Menyetujui
1.
Komisi Pembimbing
4
Prof.Dr.Ir. Artdi3Iakim Nasoetion
Ketua
Anggota
2. Ketua Jurusan
Penulis dilahirkan di kecamatan Plaosan, sebuah kota kecil yang terletak di lereng Lawu sebelah timur, kabupaten Magetan Jawa Timur pada tanggal 28 Oktober 1971. Penulis merupakan putra tunggal buah perkawinan Ayahanda Sukimun dan Ibunda Sani.
Pada tahun 1984 penulis menamatkan Sekolah Dasar di Plaosan I1 dan tahun 1987 menamatkan Sekolah Menengah Pertama di SMPN I Plaosan. Kemudian penulis memasuki SMA dan lulus tahun 1990 dari SMAN I Magetan. Pada tahun yang sama, penulis di terima di Institut Pertanian Bogor melalui jalur USMI. Setahun kemudian penulis memasuki jurusan Statistika.
Selama di Jurusan Statistika penulis aktif menjadi staf pengajar di Lembaga Bimbingan Belajar Bina Eksakta Pratama yang kemudian berganti nania LBB NETRO. Penulis juga pernah menjadi Asisten untuk mata kutiah Biologi Umum, Pengantar Matematika, Kalkulus dan Pengantar Ilmu Komputer.
KATA
PENGANTAR
Puji Syukur penulis ucapkan ke hadirat Allah SWT yang telah memberikan segenap kekuatan, sehingga penulis dapat menyelesaikan karya tulis ini.
Terima kasih penulis sampaikan kepada Bapak Prof.Dr.Ir. Andi Hakim Nasoetion yang telah berkenan membimbing penulis serta mengarahkan sampai terselesaikannya karya tulis ini. Terima kasih juga penulis sampaikan kepada Bapak Ir. Agus Buono yang berkenan pula memberikan perbaikan dan saran terhadap penulis.
Kepada Ketua Jurusan dan Staf Pengajar Statistika, yang telah membekali penulis selama penulis menimba ilmu, penulis juga mengucapkan terimakasih.
Secara khusus, penulis ingin mengucapkan terima kasih kepada Bapak Dr.Ir.A.A. Mattjik, Dr. Pallawarukka dan Ir. Abu Bakar Burniat yang telah banyak membantu penulis dalam kelanjutan studi di IPB.
Pendahuluan Latar Belakang Tujuan
Studi Pustaka
Fungsi Sebaran Empirik dan Prinsip Pencocokan Metode Bootstrap
Beberapa Uji Parameter Pernusatan Dua Contoh Metode Bootstrap
Uji-t
Uji-t bra-kira Satterthwaite Uji-t kira-kira Cochran-Cox
Uji-Wilcoxon-MannWhitney
Uji-Median Mood Kriteria Kebaikan Metode
Analisis Diskriminan Metode Tetangga Terdekat Galat Jenis I
Galat Jenis I1 Bahan dan Metode
Bahan Metode
Penentuan n dan B untuk uji ganda Penentuan Parameter uji ganda Algoritma uji ganda Bootstrap Hasil clan Pernbahasan
Hasil Pendahuluan
Hasil Analisis Diskriminan Metode Tetangga Terdekat Galat Jenis I dan I1
Kesimpulan Saran
DAFTAR TABEL
teks
-
no
judul1. Kondisi data
2. Rataan dan Simpangan Baku ASL Boot 3. Nilai Koefisien Keragaman
Lam~iran 1. Salah Klasifikasi
2. Galat Jenis I dan I1
3. Rataan dan Galat Baku ASL Boot
DAFTAR GRAFIK
teks -
no
j d u l1. Boxplot Nilai Tengah N=lOO 2 Boxplot Simpangan Baku N=lOO 3. Plot Dugaan Rataan Bootstrap N=5
4. Plot Dugaan Simpangan Baku Bootstrap N=5 5. Koefisien Keragaman pada berbagai n dan B
6 . Koefisien Keragaman B takhingga 7. Salah Klasifikasi a2 = 1
8. Salah Klasifikasi u2= 114 9. Salah Klasifikasi a2=2 10. Galat Jenis I(0) dan II(1)
11. Galat Jenis I(0) dan II(1) pada a2= 114 12. Galat Jenis L(0) dan II(1) pada a2=2 13. Plot Waktu terhadap B
Lampiran 1. Plot dugaan nilai ten& dan simpangan baku
2 . Boxplot ASL B50 3. Boxplot ASL BlOO 4. Boxplot ASL B200
5. Plot CV(seB) vs B pada n=5
6 . Plot CV(seB) vs B pada n= 10
PENDAHULUAN
Latar Belakang
Semakin pesatnya kemajuan kinerja komputer akhir-akhir ini menyehahkan terjadinya perkembangan teori statistika yang mengarah pada kehandalan komputer, terutama kecepatan dan kemampuan menghitungnya. Dengan demikian herkemhanglah metode-metode iteratif, yang seringkali tidak memerlukan syarat-syarat ketat mengenai parameter seharan populasinya. Salah satunyaadalah metode Bootstrap Non-parametrik yang tidak memerlukan asumsi seharan, karena didekati dengan seharan empirik, dan dapat diterapkan pada herhagai kondisi termasuk ragam heterogen.
Pada uji dua nilai tengah contoh, uji-Z memerlukan asumsi seharan populasi normal, ragam homogen dan n hesar. Uji-t memerlukan asumsi seharan populasi normal dan ragam homogen. Uji-t kira-kira Satterthwaite dan Cochran-Cox memerlukan asumsi seharan populasi normal dan uji Wilcoxon-Mann Whimey memerlukan asumsi seharan populasi simetrik. Uji yang tidak hanyak memerlukan asumsi adalah uji median Mood (Steel & Torrie, 1980), namun kuasa ujinya secara umum kurang haik.
Tujuan 1
Penelitian ini' mempakan studi empirik yang hertujuan :
- Mempelajari sifat-sifat Bootstrap pada contoh tunggal guna mendapatkan hatas ukuran contoh (n) dan hanyaknya contoh ulang (B) untuk melakukan uji dua nilai tengah dengan metode Bootstrap.
- Memhandingkan kekuatan uji Metode Bootstrap dengan heherapa uji ganda lainnya pada herhagai keadaan ragam
homogen maupun heterogen, serta melihat pada kondisi bagaimana metode uji tersehut mempunyai kuasa yang haik.
STUD1 PUSTAKA
Fungsi Seharan Empirik dan prinsip Pencocokan (Plug-In)
Fungsi Sebamn Empirik
Jika suatu contoh acak herukuran n diamhil dari suatu seharan peluang F.
F
->
(XI, ~ 2 ,..., 4
maka
E
disehut fungsi seharan empirik yang didefinisikan sehagai seharan diskrit yang memherikan peluang lln untuk setiap nilai xi, i= 1,....
n. Dengan demikian suatu gugus A dalam mang contoh x mempunyai peluang empirikP{A) =#{x,eA}/n, #= jumlah Prinsip Pencocokan
Prinsip pencocokan adalah suatu metode sederhana dalam pendugaan parameter dari contoh. Penduga p e n c o c o k a n p a r a m e t e r O = t ( F ) didetinisikan menjadi $=t(i?).
Dengan kata lain 8=t(F) dari seharan F diduga dengan
seharan empirik?,
Metode Bootstrap
Bootstrap mempakan metode pemetikan contoh ulang secara acak hemkuran sama dengan pengemhalian dari suatu contoh acak yang diper- kenalkan Efron.
Bila dilakukan pendekatan seharan empirik, maka metode Bootstrap yang dilakukan adalah non-parametrik.
Langkah pemhangkitan contoh acak Bootstrap non-parametrik.
1. Berikan peluang yang sama lln pada setiap pengamatan contoh berukuran n x=(x1.x2
,....
xJ.2. Amhil secara acak contoh ulang herukuran n dengan pengemhalian. X* = (x,*,
. .
.
,x.*). (Sebuah pengamatan hisa terpilih lebih dari satu kali)3. Dari contoh ulang yang didapat lakukan pendugaan statistik penting. 4. Ulangi Bootstrap hingga didapatkan B
huah penduga.
Efron (1993), menjelaskan hahwa dari pengalaman yang didapat untuk pendugaan simpangan baku atau pengujian hipotesis cukup diperlukan B antara 50-200 dan untuk pemhuatan selang kepercayaan diperlukan B ;r 1000.
Berikut skema rnetode Bootstrap
Sebaran F t i d a k d i k e t a h u i
bentuknya
A
F sebaran empirik
Beberapa Uji Parameter Pernusatan
Dua contoh
populasi 1 populasi 2
Bila x, contoh acak herukuran n, dan x, contoh acak berukuran n,, maka untuk contoh dari populasi normal yang herukuran relatif hesar uji-Z dapat digunakan untuk menguji nilai tengah dua contoh dengan hipotesis :
H,:
P l = hHI
: p, c h a t a u p , < k atau p i >Namun bila ukuran contoh relatif kecil atau ragam heterogen, uji-Z kurang tepat digunakan.
Berikut adalah uji-uji dua nilai pernusatan c o n t o h y a n g a k a n dihandingkan :
Metode Bootstrap
Bootstrap Non-parametrik mempunyai kriterium uji :