• Tidak ada hasil yang ditemukan

Pendekatan Winsor pada Analisis Regresi dengan Pencilan

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pendekatan Winsor pada Analisis Regresi dengan Pencilan"

Copied!
35
0
0

Teks penuh

(1)

PENDEKATAN WINSOR PADA ANALISIS REGRESI

DENGAN PENCILAN

MURIH PUSPARUM

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Pendekatan Winsor pada Analisis Regresi dengan Pencilan adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

(4)

ABSTRAK

MURIH PUSPARUM. Pendekatan Winsor pada Analisis Regresi dengan Pencilan. Dibimbing oleh ANANG KURNIA dan AAM ALAMUDI.

Analisis regresi adalah salah satu metode statistika yang digunakan untuk menduga hubungan antara dua peubah atau lebih. Metode kuadrat terkecil pada umumnya digunakan untuk melakukan pendugaan parameter pada model regresi linear, namun metode ini memiliki kelemahan yaitu rentan terhadap pencilan. Alternatif yang dapat digunakan untuk menangani regresi pada data yang mengandung pencilan, khususnya pencilan pada peubah respon, adalah dengan pendekatan Winsor. Untuk mengetahui keefektifan metode ini dalam menangani pencilan dilakukan kajian simulasi. Simulasi diterapkan pada berbagai macam ukuran contoh dan proporsi pencilan. Kajian simulasi ini secara keseluruhan menunjukkan bahwa metode Winsor 3 memberikan hasil paling baik dalam menangani pencilan, terutama pada ukuran contoh yang tidak terlalu besar. Metode Winsor 3 merupakan metode yang menerapkan prinsip iterasi pada galat baku sisaan dan menggunakan komponen konstanta tuning sebesar 1.345. Metode ini diterapkan pada data riil mengenai pengaruh ketinggian bukit terhadap waktu pendakian. Metode yang memberikan hasil paling baik berdasarkan nilai R2adj adalah metode Winsor 3. Hasil ini didukung oleh kajian yang dilakukan dengan teknik penarikan contoh berulang yang juga diterapkan pada data riil.

Kata kunci: Kajian simulasi, pencilan, pendekatan Winsor, regresi

ABSTRACT

Regression analysis is one of the statistical methods to estimate the relationship between two or more variables. Ordinary least squares is generally used to estimate parameters in linear regression, but it is susceptible to outliers. Winsor approach can be used to solve regression with outliers problem, especially outliers in response variables. To find out the effectiveness of this method on handling the outliers, we utilized simulation study. Simulation was applied in various sample sizes and outlier proportions. The result showed that Winsor 3 method was the best on handling outliers, particularly on medium sample size. Winsor 3 is a method that implements iterative principal on residual standard error and uses tuning constant values by 1.345. This method was applied to the real data about the height of hills againts the climbing time as well. The method which gave the best result based on R2adj value is Winsor 3 method. This result is supported by the study using resampling technique in the real data.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika

pada

Departemen Statistika

PENDEKATAN WINSOR PADA ANALISIS REGRESI

DENGAN PENCILAN

MURIH PUSPARUM

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(6)
(7)
(8)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala lindungan, rahmat, dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini ialah mengenai analisis regresi kekar, dengan judul Pendekatan Winsor pada Analisis Regresi dengan Pencilan.

Proses penyusunan karya ilmiah ini tidak lepas dari dukungan, saran, dan bantuan dari berbagai pihak. Oleh karena itu penulis menyampaikan terima kasih kepada:

1. Bapak Dr Anang Kurnia selaku ketua komisi pembimbing atas topik, saran dan bimbingan yang telah diberikan selama penulis melakukan penelitian.

2. Bapak Ir Aam Alamudi, MSi selaku anggota komisi pembimbing atas saran yang banyak membantu dalam penelitian yang penulis lakukan.

3. Teman-teman Statistika 48 atas diskusi-diskusi selama penyelesaian karya ilmiah ini, serta Rahmanda Wibowo atas dukungan dan bantuan yang diberikan selama penelitian.

4. Staf Tata Usaha Departemen Statistika atas bantuannya dalam kelancaran administrasi.

5. Yayasan Woman International Club Jakarta atas bantuan dana penelitian yang telah diberikan.

6. Papa dan Mama serta kakak-kakak dan seluruh keluarga atas segala doa dan kasih sayangnya yang selalu tercurah untuk penulis.

Besar harapan penulis semoga karya ilmiah ini bermanfaat.

(9)

DAFTAR ISI

DAFTAR TABEL viii

DAFTAR GAMBAR viii

DAFTAR LAMPIRAN viii

PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 1

TINJAUAN PUSTAKA 2

Pencilan pada Regresi 2

Regresi dengan Pendekatan Winsor 3

METODE 4

Sumber Data 4

Prosedur Simulasi dan Analisis Data 5

HASIL DAN PEMBAHASAN 7

Eksplorasi Data Simulasi 7

Kajian Simulasi dengan � = 9

Kajian Simulasi dengan � = 11

Aplikasi dan Kajian pada Data Riil 14

SIMPULAN DAN SARAN 16

DAFTAR PUSTAKA 17

LAMPIRAN 18

(10)

DAFTAR TABEL

1 Kriteria evaluasi regresi berdasarkan tiga metode 15 2 Kriteria evaluasi regresi pada data simulasi berdasarkan teknik

penarikan contoh berulang 16

DAFTAR GAMBAR

1 Tebaran data simulasi dengan � = 8

2 Tebaran data simulasi dengan � = 8

3 Bias relatif (i dan ii) dan KTG relatif (iii dan iv) di beberapa ukuran

contoh dan proporsi pencilan pada penduga 9

4 Bias relatif (i dan ii) dan KTG relatif (iii dan iv) di beberapa ukuran

contoh dan proporsi pencilan pada penduga 10

5 Rataan R2 di beberapa ukuran contoh dan proporsi pencilan untuk data

simulasi dengan � = 11

6 Bias relatif (i dan ii) dan KTG relatif (iii dan iv) di beberapa ukuran

contoh dan proporsi pencilan pada penduga 12

7 Bias relatif (i dan ii) dan KTG relatif (iii dan iv) di beberapa ukuran

contoh dan proporsi pencilan pada penduga 13

8 Rataan R2 di beberapa ukuran contoh dan proporsi pencilan untuk data

simulasi dengan � = 14

9 Hubungan antara ketinggian bukit dan waktu pendakian 15

DAFTAR LAMPIRAN

1 Bagan tahapan simulasi dan analisis data 18

2 Tabel evaluasi pendugaan dengan � = 1 pada berbagai ukuran

contoh dan proporsi pencilan 19

3 Tabel evaluasi pendugaan dengan � = 1 pada berbagai ukuran

contoh dan proporsi pencilan 20

4 Tabel evaluasi pendugaan dengan � = 3 pada berbagai ukuran

contoh dan proporsi pencilan 21

5 Tabel evaluasi pendugaan dengan � = 3 pada berbagai ukuran

contoh dan proporsi pencilan 22

6 Tabel rataan R2 kajian simulasi pada berbagai ukuran contoh dan

proporsi pencilan 23

7 Grafik bias relatif mutlak kajian simulasi pada berbagai ukuran contoh

(11)

PENDAHULUAN

Latar Belakang

Analisis regresi merupakan salah satu metode yang sering digunakan untuk menduga pola hubungan antara dua atau lebih peubah. Dugaan pola hubungan disajikan dalam dugaan model regresi atau yang disebut persamaan garis regresi. Persamaan garis ini umumnya diperoleh dari pendugaan dengan metode kuadrat terkecil (MKT) atau ordinary least square (OLS), namun metode ini memiliki kelemahan yaitu rentan terhadap adanya pencilan sehingga menjadi kurang tepat untuk digunakan.

Menurut Aunuddin (1989), pada regresi linear suatu amatan dianggap sebagai pencilan jika amatan tersebut memberikan nilai sisaan baku yang besar. Sisaan baku yang besar ini seringkali disebabkan oleh nilai amatan peubah respon atau peubah y yang jauh lebih besar atau lebih kecil dibanding nilai amatan lainnya. Amatan yang memiliki kondisi tersebut umumnya disebut sebagai pencilan-y (Srivastava et al. 2010). Rousseeuw dan Leroy (1987) dalam Srivastava et al. (2010) menyatakan bahwa pencilan-y akan memberikan pengaruh yang signifikan pada dugaan parameter regresi dengan MKT. Artinya nilai penduga parameter yang menyusun persamaan garis regresi akan menyimpang dari nilai seharusnya yaitu ketika data tidak mengandung pencilan. Penyimpangan ini membuat menurunnya koefisien determinasi dari model dan ukuran kebaikan model menjadi rendah.

Alternatif yang dapat dilakukan untuk mengatasi regresi pada data dengan pencilan salah satunya adalah dengan metode regresi dengan amatan terwinsorisasi (winsorized observation) atau selanjutnya disebut sebagai pendekatan Winsor. Pada metode ini nilai amatan y dengan sisaan yang besar akan ditangani atau diganti dengan nilai-nilai amatan y baru sehingga pengaruh dari pencilan, terutama pencilan-y, dapat diminimalisasi. Keefektifan pendekatan Winsor dalam melakukan pendugaan parameter pada regresi linear dapat diketahui dengan melakukan kajian simulasi. Pada kajian simulasi besarnya nilai parameter telah ditetapkan terlebih dahulu, sehingga perbandingan antara nilai parameter dengan dugaannya dapat diketahui. Metode Huber juga akan digunakan pada kajian simulasi sebagai pembanding. Metode ini menerapkan prinsip pembobotan dan akan memberikan hasil yang lebih baik dalam menduga parameter dibanding MKT ketika terdapat pencilan, baik pencilan yang berasal dari galat normal maupun galat bukan normal (Wang et al. 2007). Selain dengan kajian simulasi, penelitian ini pun akan diaplikasikan pada data riil untuk kemudian dilakukan analisis lebih lanjut.

Tujuan Penelitian

(12)

2

TINJAUAN PUSTAKA

Pencilan pada Regresi

Seperti telah disebutkan pada Latar Belakang, pencilan merupakan amatan yang memberikan nilai sisaan baku yang besar. Ukuran besarnya sisaan baku dapat dianggap sebagai pencilan adalah sebesar 2 atau −2 (Aunuddin 1989). Hal ini mengacu pada asumsi MKT bahwa sisaan atau � merupakan peubah acak normal dengan nilai tengah 0 dan ragam � . Pembakuan terhadap sisaan akan menghasilkan peubah acak �/� yang menyebar normal baku. Pada peubah acak normal baku, nilai-nilai dari peubah tersebut akan berada di antara −1.96 sampai 1.96 dengan peluang 95%. Atas dasar itulah jika nilai-nilai sisaan baku berada di luar selang −1.96 dan 1.96 (atau dengan pembulatan disebut −2 dan 2) akan dianggap sebagai pencilan.

Nilai � pada peubah acak �/� yang menyebar normal baku tidak diketahui karena merupakan komponen dari model regresi, sehingga diduga dengan . Nilai � merupakan selisih antara amatan-y dan dugaan-y ( �− ̂� , sedangkan � dapat diduga dengan yang merupakan akar kuadrat dari , dengan

= − �∑ �

�=

,

dan adalah jumlah amatan serta � adalah jumlah parameter dalam model regresi. Selanjutnya menurut Huber dan Ronchetti (2009), galat baku dari sisaan dapat diduga dengan = − ℎ / . Nilai ℎ merupakan nilai dari diagonal matriks � atau matriks hat, dengan uraian sebagai berikut:

�̂ = �

�̂ = ′ − ′�

�̂ = ��

sehingga

� = ′ − ′.

Dengan demikian persamaan untuk mendapatkan sisaan baku menjadi:

� = �

√ − ℎ� ,

dengan adalah sisaan baku pada amatan ke-� (� = , , … ).

Regresi yang mengandung nilai pencilan dapat ditangani oleh metode Huber atau penduga-M (M-Estimates). Wang et al. (2007) menuliskan fungsi tujuan dari metode Huber sebagai berikut:

� = = { , | |

| | − , | | > . (1)

(13)

3 Analisis Regresi menggunakan metode Huber pada prinsipnya adalah memberikan nilai pembobot pada matriks penduga parameter. Fungsi pembobot yang umum digunakan adalah:

= { , | |

| |

⁄ , | | > . (2)

Uraian sebelumnya menjelaskan bahwa nilai bergantung pada sebaran dari sisaan/galat. Efisiensi penduga sebesar 95% dan kekar terhadap pencilan dapat dihasilkan dengan nilai sebesar 1.345 ketika sisaan menyebar normal (Fox 2002). Selain itu, jika dibandingkan dengan nilai c sebesar 1.5, nilai c sebesar 1.345 menghasilkan dugaan parameter yang lebih baik terutama pada galat yang berasal dari sebaran normal (Wang et al. 2007).

Regresi dengan Pendekatan Winsor

Metode Winsor pertama kali diperkenalkan oleh Charles P. Winsor pada tahun 1946 sebagai salah satu alternatif untuk mengatasi permasalahan pada penghitungan statistik jika terdapat pencilan pada data/amatan. Kemudian Welsh (1987) menggunakan pendekatan ini untuk melakukan pendugaan parameter pada analisis regresi sehingga diperoleh penduga yang tidak terpengaruh oleh pencilan (kekar). Welsh menjelaskan bahwa pada metode ini nilai-nilai amatan peubah respon atau amatan-y ( ) diubah menjadi amatan-y terwinsorisasi ( ∗). Welsh (1987) dalam Chen et al. (2001) lebih rinci mendefinisikan nilai * sebagai berikut:

�∗ = �� �̂ � �̂ + �̂ � � < �̂ − +

Persamaan 4 selanjutnya disebut persamaan Winsor 1. Kemudian dilakukan pendugaan parameter dengan metode kuadrat terkecil pada peubah bebas (x) terhadap peubah respon ∗ atau secara matematis ditulis sebagai:

� = ′ − ′� .

(14)

4

dianggap sebagai pencilan jika nilai mutlak sisaan bakunya ( ) lebih besar dari 2, sehingga atas dasar definisi tersebut dapat diuraikan persamaan Winsor 2:

�∗ = {

� , − �

̂� + �̂ , � < −

̂� + �̂ , � >

.

Definisi lainnya mengenai amatan terwinsorisasi dikemukakan oleh Huber dan Ronchetti (2009), yaitu:

Persamaan 5 disebut persamaan Winsor 3 dan konstanta merupakan konstanta tuning serta merupakan galat baku dari sisaan yang diperoleh dari MKT. Jika nilai amatan ∗ telah diperoleh, pendugaan terhadap parameter dan sisaan serta galat baku yang baru juga dapat dilakukan. Selanjutnya prosedur iterasi diterapkan dengan menggunakan nilai sisaan dan galat baku yang baru agar diperoleh nilai ∗ yang konvergen terhadap nilai dugaan parameter.

METODE

Sumber Data

Data yang digunakan pada penelitian ini adalah data riil yang diambil dari literatur serta data simulasi. Data riil yang digunakan merupakan data pada kasus regresi yang terdiri atas 1 peubah bebas ( ) yaitu peubah jarak ketinggian bukit dan 1 peubah respon ( ) yaitu peubah waktu yang diperlukan untuk pendakian. Data ini diperoleh dari Chatterjee dan Hadi (2006) halaman 112 dan sebelumnya telah

digunakan oleh Mas’udah (2012) pada penelitian mengenai regresi least trimmed squares. Selain digunakan untuk menerapkan regresi dengan ketiga metode, data ini juga dianggap sebagai data populasi dari penarikan contoh berulang dengan pengembalian (resampling). Penarikan contoh berulang ini dilakukan dengan tujuan untuk melihat kekekaran metode yang digunakan secara simulasi pada kondisi data yang menyerupai kondisi data riil.

Data simulasi terdiri atas dua buah parameter ( dan ) dan 1 peubah bebas ( ) yang ditetapkan, serta galat (�) yang dibangkitkan dari peubah acak Normal(�,

(15)

5 Prosedur Simulasi dan Analisis Data

Penelitian ini, baik simulasi maupun terapan data riil, mengacu pada model regresi linear sederhana dengan satu peubah bebas. Selain itu, pada kajian simulasi digunakan dua gugus data dengan kondisi ragam berbeda. Gugus data pertama adalah gugus data untuk kondisi ragam rendah yang diwakili oleh data dengan simpangan baku sama dengan 1, dan gugus data kedua untuk data dengan ragam tinggi yang diwakili oleh data dengan simpangan baku sama dengan 3. Konstanta tuning yang digunakan pun hanya konstanta dengan nilai 1.345, baik untuk metode Huber maupun Winsor.

Tahapan analisis data yang dilakukan dalam penelitian untuk data simulasi adalah:

1. Menetapkan dan ( = 10, = 2).

2. Menetapkan peubah bebas ( ) yang terlebih dahulu dibangkitkan dari sebaran Normal(5, 3) dan Normal(5, 1) masing-masing sebanyak 2000 kemudian simpan, gugus data ini merupakan gugus data populasi dari peubah bebas. 3. Membangkitkan � ~ Normal(0, 3) dan � ~ Normal(0, 1) masing-masing

sebanyak 1600 kemudian simpan, gugus data ini merupakan gugus data populasi dari galat bukan pencilan.

4. Membangkitkan � ~ Normal(20, 3) dan � ~ Normal(20, 1) masing-masing sebanyak 400 kemudian simpan, gugus data ini merupakan gugus data populasi dari galat pencilan.

5. Mengambil contoh dari gugus data populasi peubah bebas dan galat yang telah dibangkitkan dengan ukuran 20, 40, 100, dan 500, kemudian mengombinasikan dengan berbagai macam ukuran pencilan (0%, 5%, 10%, 15%, dan 20%). 6. Menentukan nilai-nilai peubah respon ( ) berdasarkan data contoh peubah

bebas dan galat dengan persamaan:

= + + � ,

dengan � (galat) merupakan penggabungan dari � dan � sesuai dengan proporsi pencilan.

7. Meregresikan semua gugus data menggunakan MKT dengan rumus penduga parameter:

� = ′ − ′�.

8. Menyimpan nilai dugaan ( ), dugaan ( ), dugaan (̂), sisaan ( ), sisaan terbakukan ( ), dan galat baku sisaan ( ) dari hasi regresi setiap gugus data, serta � (koefisien determinasi) dan mean square error (MSE) atau kuadrat tengah galat (KTG).

(16)

6

10. Menyimpan nilai , , � , dan KTG.

11. Meregresikan semua gugus data menggunakan metode Winsor dengan algoritme sebagai berikut:

a. Tentukan nilai sebesar 0.05 dan sebesar 0.95. b. Hitung nilai kuantil dari dan (�̂ dan �̂ ).

c. Hitung nilai ∗ dengan menggunakan persamaan Winsor 1, 2, dan 3 kemudian simpan. Khusus pada persamaan Winsor 3, lakukan iterasi hingga diperoleh nilai yang konvergen.

d. Duga nilai parameter menggunakan MKT, namun nilai diubah menjadi �∗ sehingga persamaan menjadi:

� = ′ − ′�.

12. Menyimpan nilai , , � , dan KTG.

13. Melakukan ulangan dari tahapan nomor 5 hingga 12 sebanyak 1000 kali. 14. Mengevaluasi ketiga metode (MKT, metode Huber, dan metode Winsor)

berdasarkan nilai bias relatif, bias relatif mutlak, KTG relatif, dan rataan koefisien determinasi (� ) pada masing-masing ukuran contoh dan proporsi pencilan. Rumus untuk keempat kriteria tersebut adalah:

�� � = ∑ ̂�− × % merupakan koefisien determinasi dengan rumus:

� =∑�= ̂�− ̅

�− ̅

�= .

Metode yang dianggap dapat mengatasi pencilan dengan baik adalah metode yang memberikan nilai bias relatif, bias relatif mutlak, dan KTG relatif terkecil atau dekat dengan 0 dan nilai rataan R2 terbesar atau dekat dengan 1.

Selanjutnya tahapan analisis data yang dilakukan dalam penelitian untuk data riil adalah:

1. Menentukan peubah bebas ( ) dan peubah respon ( ) dari gugus data riil. 2. Melakukan eksplorasi untuk melihat banyaknya pencilan.

(17)

7 4. Meregresikan dengan metode Huber kemudian simpan nilai , , � , � adj,

JKG, serta KTG.

5. Meregresikan dengan metode Winsor (1, 2, dan 3) kemudian simpan nilai , , � , � adj, JKG, serta KTG.

6. Mengevaluasi ketiga metode tersebut (MKT, metode Huber, dan metode Winsor) berdasarkan , , � adj, JKG, serta KTG.

Prosedur analisis lainnya adalah prosedur pendugaan dengan metode penarikan contoh berulang, dengan tahapan sebagai berikut:

1. Menetapkan gugus data populasi peubah bebas ( ) dan peubah respon ( ) yang berasal dari peubah dan pada data riil.

2. Mengambil contoh acak dari gugus data populasi tersebut secara berpasangan ( dan ) dan dengan pengembalian dengan ukuran contoh sama dengan ukuran populasi yaitu sebesar 35.

3. Meregresikan gugus data contoh yang terambil dengan MKT, metode Huber, dan metode Winsor.

4. Menyimpan nilai dugaan ( ), dugaan ( ), R2adj dan KTG dari setiap

metode.

5. Melakukan ulangan dari tahapan 1 hingga 4 sebanyak 1000 kali.

6. Mengevaluasi ketiga metode berdasarkan rataan , rataan , rataan R2adj dan rataan KTG.

Ilustrasi mengenai tahapan analisis data dalam penelitian ini dapat dilihat pada Lampiran 1.

HASIL DAN PEMBAHASAN

Eksplorasi Data Simulasi

(18)

8

Gambar 1 Tebaran data simulasi dengan � =

(19)

9 Kajian Simulasi dengan � = �

Kajian simulasi yang diterapkan pada nilai � (simpangan baku) sama dengan 1 menghasilkan beberapa nilai dari kriteria yang menjadi bahan evaluasi yang dihitung pada setiap dugaan parameter ( dan ). Kriteria tersebut di antaranya adalah bias relatif dan KTG relatif. Pada dugaan parameter , kedua kriteria ini memiliki kemiripan pola peningkatan atau penurunan nilai bias dan nilai KTG seperti yang ditunjukkan pada Gambar 3. Pada MKT nilai bias yang dihasilkan cenderung meningkat seiring dengan peningkatan proporsi pencilan, sedangkan pada metode Huber, Winsor 1 dan Winsor 2 nilai bias cenderung konstan pada proporsi pencilan 5% dan akan meningkat ketika proporsi pencilan 10%, 15%, dan 20%. Metode Winsor 3 memiliki nilai bias terendah untuk setiap proporsi pencilan pada semua ukuran contoh, kecuali pada ukuran contoh 500. Selain itu, jarak (gap) antara nilai bias metode Winsor 3 dan metode Huber akan semakin mengecil ketika ukuran contoh semakin besar.

Hasil yang serupa juga diberikan pada kriteria KTG relatif. Perbedaannya, nilai KTG metode Winsor 1 dan 2 menjadi lebih besar dari MKT ketika proporsi pencilan lebih dari sama dengan ( ) 10%, kecuali pada ukuran contoh 500. Pada ukuran contoh ini, nilai KTG metode Winsor 1 dan 2 cenderung sama dengan MKT dan pada metode Winsor 3 nilai KTG yang dihasilkan tidak berbeda jauh dengan metode Huber.

Hasil kajian simulasi lainnya adalah dugaan parameter , yang kemudian digunakan untuk menghitung bias relatif, bias relatif mutlak, dan KTG relatif. Gambar 3 Bias relatif (i dan ii) dan KTG relatif (iii dan iv) di beberapa ukuran

(20)

10

Gambar 4 menunjukkan bahwa nilai bias yang dihasilkan oleh kajian simulasi beragam (positif dan negatif). Nilai bias yang positif menunjukkan bahwa dugaan parameter lebih besar dari nilai asli parameternya (over estimate), sedangkan jika nilai bias negatif artinya dugaan parameter lebih kecil dari nilai parameter aslinya (under estimate). Pada MKT saat ukuran contoh sebesar 500, nilai bias cenderung konstan di sekitar 0 hingga proporsi pencilan sebesar 15%, dan kemudian meningkat kembali pada proporsi pencilan 20%. Hal serupa juga terjadi pada metode Winsor 1 dan Winsor 2, walaupun pada metode ini nilai bias cenderung menurun pada proporsi pencilan 5%. Metode lainnya, yaitu metode Huber dan Winsor 3, memiliki pola yang hampir sama pada masing-masing ukuran contoh. Metode Winsor 3 cenderung paling dekat dengan 0 kecuali ketika proporsi pencilan sebesar 20%.

Kriteria lainnya adalah KTG relatif yang masih ditunjukkan oleh Gambar 4. Nilai KTG relatif menunjukkan metode Winsor 3 memiliki nilai terendah atau paling dekat dengan 0 untuk berbagai proporsi pencilan. ketika ukuran contoh diperbesar, nilai KTG metode Huber cenderung mendekati nilai KTG metode Winsor 3.

Selain dengan kriteria bias relatif, bias relatif mutlak, dan KTG relatif, evaluasi terhadap kajian simulasi pada analisis regresi juga dapat dilihat berdasarkan nilai koefisien determinasi (R2) yang dihasilkan. Koefisien determinasi

adalah koefisien yang menunjukkan proporsi keragaman total yang dapat dijelaskan oleh garis regresi dan merupakan salah satu alat penilai baik atau buruknya suatu model (Aunuddin 1989). Gambar 5 menunjukkan grafik dari rataan R2 untuk setiap proporsi pencilan pada semua ukuran contoh. Pada MKT, rataan R2 cukup tinggi

(21)

11 ketika tidak ada pencilan (proporsi pencilan 0%), namun menjadi sangat rendah ketika terdapat pencilan pada data. Hal sebaliknya ditunjukkan oleh metode Winsor 3. Pada metode ini, rataan R2 cenderung konstan pada proporsi pencilan 0 – 15%, kemudian menurun pada proporsi pencilan 20%. Sementara pada metode Winsor 1 dan 2, rataan R2 masih dapat dikatakan tinggi hingga proporsi pencilan sebesar 5%, namun menjadi sangat rendah di proporsi pencilan lainnya hingga mendekati rataan R2 pada MKT. Metode lainnya yaitu metode Huber, rataan R2 cenderung menurun seiring dengan peningkatan proporsi pencilan, walaupun penurunan yang terjadi tidak sebesar pada MKT. Uraian di atas menunjukkan bahwa berdasarkan kriteria rataan R2, jika proporsi pencilan tidak lebih dari 5%, metode Winsor 1 dan 2 akan memberikan nilai R2 yang cukup baik, sedangkan jika proporsi pencilan lebih dari

5%, metode yang memberikan nilai R2 terbaik adalah metode Winsor 3.

Kajian Simulasi dengan � = �

Simulasi dengan simpangan baku 3 dilakukan dengan tujuan membandingkan kelima metode jika data yang digunakan memiliki kondisi ragam (atau simpangan baku) yang besar. Sama halnya dengan kajian simulasi sebelumnya, kriteria evaluasi yang digunakan pada data simulasi dengan simpangan baku sama dengan 3 adalah bias relatif, bias relatif mutlak, KTG relatif, dan rataan R2. Pada dugaan parameter , nilai bias relatif pada kelima metode menunjukkan bahwa nilai bias semakin meningkat ketika proporsi pencilan juga meningkat seperti yang terlihat pada Gambar 6. Secara keseluruhan nilai bias terendah dihasilkan oleh metode Gambar 5 Rataan R2 di beberapa ukuran contoh dan proporsi pencilan untuk data

(22)

12

Winsor 3. Pada proporsi pencilan 5% nilai bias pada metode Huber, metode Winsor 1, 2, dan 3 memiliki nilai yang hampir sama untuk semua ukuran contoh. Ketika proporsi pencilan dan ukuran contoh semakin besar, metode Winsor 3 menghasilkan nilai bias yang mendekati metode Huber. Hasil lainnya yaitu KTG relatif menunjukkan pola yang relatif sama dengan pola KTG pada simulasi dengan simpangan baku 1. Hasil ini menunjukkan bahwa pada proporsi pencilan 5%, nilai KTG metode Huber, Winsor 1, 2, dan 3 cenderung di titik yang sama dan pada ukuran contoh 500 nilai KTG metode Winsor 3 akan mendekati hingga melebihi nilai KTG metode Huber.

\

Dugaan parameter pada kajian simulasi ini juga menghasilkan ketiga kriteria sebelumnya. Hasil untuk bias relatif yaitu pada ukuran contoh yang kecil nilai bias tidak memiliki perbedaan yang besar pada kelima metode. Nilai bias terendah dihasilkan oleh metode Winsor 3 untuk ukuran contoh 500, namun ketika proporsi pencilan semakin besar, nilai bias terendah dihasilkan oleh metode Huber. Kriteria lainnya yaitu KTG relatif kembali memiliki pola serupa dengan simulasi sebelumnya. Nilai KTG terendah dihasilkan oleh metode Winsor 3, dan jika proporsi pencilan cukup rendah (5%) metode Huber, Winsor 1, 2, dan 3 menghasilkan nilai bias dan KTG yang tidak jauh berbeda. Seperti pada dugaan parameter , ketika ukuran contoh semakin besar nilai bias dan KTG metode Huber dan Winsor 3 semakin dekat/mirip, dan ketika proporsi pencilan cukup besar (20%) metode Huberlah yang akan memberikan nilai bias dan KTG terendah. Grafik untuk kriteria ini disajikan pada Gambar 7.

(23)

13

Rataan koefisien determinasi (R2) juga digunakan untuk evaluasi kajian simulasi dengan simpangan baku sebesar 3. Perbedaan antara nilai rataan R2 pada

simulasi ini dengan nilai rataan R2 pada simulasi sebelumnya adalah pada data dengan simpangan baku yang lebih besar (yang juga berarti ragam lebih besar) nilai R2 terendah pada proporsi pencilan yang tidak sama dengan 0 akan semakin meningkat. Pada data dengan simpangan baku 1 nilai R2 terendah kurang lebih hanya sebesar 10%, namun pada data dengan simpangan baku 3 nilai R2 terendah mencapai 30 – 40%. Grafik dari rataan R2 dapat dilihat pada Gambar 8. Sementara itu untuk nilai R2 terbesar masih dihasilkan oleh metode Winsor 3 untuk setiap

proporsi pencilan pada ukuran contoh 20, 40, dan 100 sedangkan pada ukuran contoh 500 nilai R2 terbesar dihasilkan oleh metode Huber. Hasil ini membuat seolah-olah metode Winsor 3 tidak lebih baik dibanding metode Huber pada ukuran contoh yang besar, namun sebenarnya nilai R2 yang dihasilkan metode Winsor 3 sudah cukup baik (di atas 50%) dan juga perbedaan dengan nilai R2 metode Huber tidaklah terlalu besar.

Nilai-nilai yang dihasilkan dari kajian simulasi, yaitu nilai dari kriteria bias relatif, bias relatif mutlak, KTG relatif, dan rataan R2 secara keseluruhan disajikan pada Lampiran 2 hingga lampiran 6. Kriteria evaluasi bias relatif mutlak memiliki pola yang cenderung serupa dengan kriteria bias relatif dan KTG relatif. Hasil dari kriteria ini disajikan dalam bentuk grafik seperti kriteria lainnya dan dapat dilihat pada Lampiran 7. Secara umum, nilai bias relatif mutlak menunjukkan bahwa metode Winsor 1 dan 2 cukup baik untuk data dengan proporsi pencilan 5%, sedangkan jika proporsi pencilan lebih dari 5% dapat digunakan metode Huber dan metode Winsor 3.

(24)

14

Uraian sebelumnya menunjukkan bahwa metode Winsor 3 lebih kekar terhadap pencilan dibanding metode Winsor 1 dan 2. Hal ini disebabkan oleh prosedur iterasi yang diterapkan pada kriteria pengganti peubah respon, yang membuat nilai sisaan yang dihasilkan semakin rendah jika jumlah iterasi semakin besar. Prosedur iterasi tersebut di sisi lain membuat metode ini menjadi lebih kompleks dibanding metode lainnya, sehingga jika proporsi pencilan relatif rendah metode Winsor 1 dan 2 akan lebih efisien untuk diterapkan.

Aplikasi dan Kajian pada Data Riil

Data riil yang digunakan pada penelitian ini adalah data mengenai pengaruh ketinggian bukit (sebagai peubah bebas) terhadap waktu pendakian (sebagai peubah respon) pada 35 bukit di Skotlandia (Chatterjee dan Hadi 2006). Data ini

sebelumnya juga digunakan oleh Mas’udah (2005) pada penelitian mengenai

regresi least trimmed squares. Hasil plot tebaran antara peubah pengaruh ketinggian bukit dan waktu pendakian disajikan pada Gambar 8. Berdasarkan plot tebaran terlihat bahwa terdapat 3 titik yang terindikasi sebagai pencilan sehingga garis regresi yang dihasilkan oleh MKT memiliki kemungkinan telah terpengaruh oleh adanya pencilan. Setelah dilakukan analisis regresi dengan MKT pun ternyata ketiga titik tersebut memiliki nilai sisaan baku yang besar. Jika dipersentasekan, artinya data ini kurang lebih mengandung pencilan sebanyak 8%.

Gambar 8 Rataan R2 di beberapa ukuran contoh dan proporsi pencilan untuk data

(25)

15

Gambar 9 Hubungan antara ketinggian bukit dan waktu pendakian

Selanjutnya pada Tabel 1 disajikan kriteria evaluasi bagi data riil. Hasil dari kriteria evaluasi tersebut menunjukkan bahwa metode Winsor 3 memiliki nilai R2adj tertinggi dan metode Huber memiliki nilai JKG dan KTG terendah. Nilai JKG dan KTG yang rendah disebabkan oleh pembobotan yang menjadi prinsip utama pada metode Huber. Pembobot yang digunakan pada metode Huber memiliki nilai di antara 0 hingga 1, artinya jika sisaan yang dihasilkan semakin besar, bobot yang diberikan akan semakin dekat dengan 0. Pembobot yang bernilai 0 atau mendekati 0 akan menyebabkan amatan dengan sisaan yang besar memiliki kecenderungan untuk disisihkan dari gugus data amatan. Akibatnya, nilai sisaan atau JKG yang dihasilkan setelah pembobotan pada metode Huber menjadi sangat rendah.

Hasil lainnya yaitu penduga parameter regresi menunjukkan bahwa metode Winsor 3 memberikan nilai dugaan yang hampir sama dengan MKT dan metode Huber. Artinya, besarnya kemiringan pada garis regresi relatif sama baik dengan MKT maupun metode lainnya. Hal yang berbeda terjadi pada nilai dugaan , yaitu dugaan dengan metode Winsor 3 cenderung berbeda dari metode lainnya. Hal ini karena pada metode Winsor 3 nilai peubah respon digantikan dengan nilai-nilai baru yang cenderung dekat dengan pola tebaran data secara umum, sehingga nilai dugaan atau intersep pun menjadi berbeda dari MKT.

Kriteria MKT Huber Winsor 3

b0 −290.40 −281.15 −449.95

b1 499.83 491.93 492.51

Sb0 345.38 77.08 107.42

Sb1 37.17 13.17 11.56

JKG 4.7 x 107 3.2 x 104 4.6 x 106

KTG 1.4 x 106 9.7 x 102 1.4 x 105

R2(adj) 84.10% 97.62% 98.16%

(26)

16

Penelitian sebelumnya oleh Mas’udah (2012) menyatakan bahwa pada studi

kasus yang sama, regresi least trimmed squares (LTS) juga dapat diterapkan untuk mengatasi adanya pencilan pada data regresi. Hasil dari metode LTS ini adalah nilai penduga sebesar −300.13, penduga sebesar 427.23, dan R2adj sebesar 99.40%. Jika mengacu pada kriteria yang telah diuraikan di atas, selain metode Huber dan LTS, metode Winsor 3 juga memberikan nilai R2adj yang cukup tinggi

dan galat baku penduga parameter serta JKG dan KTG yang lebih rendah dibanding MKT. Artinya, metode ini juga dapat digunakan dalam analisis regresi untuk mengatasi adanya pencilan.

Aplikasi pada data riil menunjukkan bahwa metode Winsor memberikan hasil yang cukup baik. Hal ini sejalan pula dengan teknik penarikan contoh berulang yang diterapkan pada data riil. Hasil dari teknik ini disajikan pada Tabel 2. Berdasarkan Tabel 2, metode Winsor 3 sudah dapat dikatakan cukup baik dalam menangani pencilan. Hal ini terlihat pada nilai rataan R2adj yang dihasilkan yang sudah cukup besar bahkan hampir mendekati 100%. Selain itu juga nilai galat yang dihasilkan cenderung menurun dibanding jika menggunakan MKT.

Tabel 2 Kriteria evaluasi regresi pada data simulasi berdasarkan teknik penarikan contoh berulang

(27)

17 Saran untuk penelitian selanjutnya adalah agar dapat mempertimbangkan penggunaan kriteria pengganti peubah respon lainnya pada metode Winsor sehingga hasil yang diperoleh cukup baik untuk mengatasi pencilan pada ukuran contoh dan proporsi pencilan yang relatif besar. Kriteria pengganti lainnya di antaranya dengan melakukan proses optimasi nilai dan yang terdapat pada metode Winsor 1 atau melakukan proses iterasi pada kriteria metode Winsor 2.

DAFTAR PUSTAKA

Aunuddin. 1989. Analisis Data. Bogor (ID): IPB.

Chatterjee S, Hadi AS. 2006. Regression Analysis by Example 4th ed. New Jersey (US): John Wiley and Sons, Inc.

Chen L-A, Welsh AH, Chan W. 2001. Estimators for the linear regression model based on winsorized observation. Statistica Sinica. 11(1):147-172.

Fox J. 2002. An R and S-Plus Companion to Applied Regression. Thousand Oaks (CA): SAGE Publications, Inc.

Huber PJ, Ronchetti EM. 2009. Robust Statistics 2nd ed. New Jersey (US): John Wiley and Sons, Inc.

Mas’udah AM. 2012. Metode regresi least trimmed squares pada data yang mengandung pencilan [skripsi]. Bogor (ID): Institut Pertanian Bogor.

Srivastava DK, Pan J, Sarkar I, Mudholkar GS. 2010. Robust winsorized regression using bootstrap approach. Communication in Statistics – Simulation and Computation. 39(1):45-67.doi:10.1080/03610910903308423.

Wang YG, Lin X, Zhu M, Bai Z. 2007. Robust estimation using the huber function with a data-dependent tuning constant. Journal of Computational and Graphical Statistics. 16(2):1-14.doi:10.1198/106186007X180156.

(28)

18

Lampiran 1 Bagan tahapan simulasi dan analisis data

Regresikan dan dengan MKT

*� merupakan penggabungan � dan � , menyesuaikan dengan proporsi pencilan

(29)
(30)
(31)
(32)
(33)

23 Lampiran 6 Tabel rataan R2 kajian simulasi pada berbagai ukuran contoh dan

(34)

24

Lampiran 7 Grafik bias relatif mutlak kajian simulasi pada berbagai ukuran contoh dan proporsi pencilan

a. Penduga (i dan ii) dan penduga (iii dan iv) pada simpangan baku 1

(35)

25

RIWAYAT HIDUP

Penulis dilahirkan di Lampung Selatan pada tanggal 12 Maret 1993 dan merupakan putri ketiga dari tiga bersaudara dari Bapak Bejo Adhi Setyo dan Ibu Wati Prasetyo. Tahun 2008 penulis lulus dari SMP Negeri 2 Sragi, Lampung Selatan dan kemudian melanjutkan ke jenjang selanjutnya di SMA Negeri 5 Bogor dan lulus pada tahun 2011. Pada tahun yang sama penulis diterima sebagai mahasiswa Departemen Statistika, Institut Pertanian Bogor melalui jalur SNMPTN Undangan.

Referensi

Dokumen terkait

Uji pencilan dangan simpangan baku, uji pencilan dengan sisa ter- student dan uji pencilan dengan kriteria informasi, belum tentu memberikan kesimpulan yang sama

Analisis Regresi Robust pada Data Mengandung Pencilan dengan Menggunakan Metode Least Median Square ; Hufron Haditama; 051810101096; 2011; 33 Halaman; Jurusan Matematika

Analisis Regresi Robust pada Data Mengandung Pencilan dengan Menggunakan Metode Least Median Square ; Hufron Haditama; 051810101096; 2011; 33 Halaman; Jurusan Matematika

Saran yang dapat direkomendasikan pada penelitian selanjutnya dan untuk kebijakan pemerintah adalah perlunya dikembangkan regresi nonparametrik spasial karena adanya

Saran yang dapat diberikan penulis adalah pada penelitian selanjutnya dapat dilakukan penambahan variabel prediktor yang mempengaruhi angka putus sekolah usia SMA di

merupakan jumlah contoh yang diambil dari kelompok yang memiliki nilai peubah respon h, nilai peubah penjelas yang diamati pada tahap pertama proses pengambilan contoh , dan

Tujuan penelitian tugas akhir ini yaitu menganalisis dan memilih pemasok bahan baku tepung agar-agar terbaik dengan mempertimbangkan kriteria- kriteria dalam pemilihan

Berdasarkan rangkaian penjelasan tersebut, dapat terlihat bahwa nilai bias dan MSE yang dihasilkan oleh metode MCD lebih kecil dibandingkan dengan MKT serta nilai koefisien