• Tidak ada hasil yang ditemukan

Pengaruh Outlier Terhadap Estimator Parameter Regresi dan Metode Regresi Robust

N/A
N/A
Protected

Academic year: 2022

Membagikan "Pengaruh Outlier Terhadap Estimator Parameter Regresi dan Metode Regresi Robust"

Copied!
8
0
0

Teks penuh

(1)

Regresi Robust

I G

USTI

A

YU

M

ADE

S

RINADI

Jurusan Matematika Universitas Udayana, srinadiigustiayumade@yahoo.co.id

Abstrak. Metode kuadrat terkecil (MKT) adalah salah satu metode yang umum digunakan untuk mengestimasi parameter pada regresi linear. Akan tetapi estimasi dengan metode kuadrat terkecil mempunyai kelemahan ketika outlier/pencilan terdapat dalam data yang menyebabkan estimator dari parameter bersifat bias. MKT bukanlah prosedur regresi yang robust (tegar) terhadap adanya outliers. Sebagai alternatif, metode regresi robust dapat digunakan diantaranya: Maximum Likelihood Estimator (M-Estimator), Scale-Estimator (S-Estimator), dan Method of Moment Estimator (MM-Estimator). Pada penelitian ini digunakan data bangkitan beberapa kelompok data yang mengandung outliers minor maupun outliers mayor pada variabel respon sebesar 5%, 10%, dan 15%. M-Estimator dan S-Estimator menghasilkan estimator parameter yang bersifat bias, khususnya untuk jenis outliers minor/mayor 5% dan 15% pada M-Estimator, dan outliers minor/mayor 10% pada S-Estimator. Sedangkan MM-Estimator merupakan estimator yang memiliki sifat robust untuk estimasi parameter/koefisien regresi dan dapat mengatasi pengaruh outliers, karena metode ini menghasilkan estimator parameter yang tidak bias untuk tiap jenis pencilan.

Kata Kunci: Metode Kuadrat Terkecil, Regresi Robust, M-Estimator, S-Estimator, MM-Estimator

1. Pendahuluan

Outlier merupakan data yang tidak mengikuti pola umum atau pola data secara keseluruhan, Weisberg [1]. Outlier dapat memengaruhi hasil estimasi parameter regresi, juga dapat menimbulkan pelanggaran terhadap asumsi kenormalan data. Outliers dalam analisis regresi dapat menyebabkan sisaan yang besar dari model yang terbentuk, keragaman data menjadi lebih besar sehingga menyebabkan data tidak homogen, Montgomery [2]. Jika adanya outlier disebabkan karena kesalahan dalam mencatat amatan atau kesalahan menyiapkan peralatan, outlier tersebut dapat diabaikan atau dibuang sebelum dilakukan analisis data. Namun, bila outlier ada bukan karena kesalahan peneliti, tetapi memang merupakan informasi yang tidak bisa diberikan oleh data lainnya maka data outlier tersebut tidak bisa diabaikan dan harus disertakan dalam analisis data.

Metode Kuadrat Terkecil (MKT) atau Ordinary Least Square (OLS) sering digunakan dalam estimasi parameter model regresi linear. Estimator yang dihasilkan MKT akan bersifat tak bias dan efisien (Best Linear Unbiased Estimator/BLUE) jika komponen sisaan atau galat memenuhi beberapa asumsi klasik, yaitu: kenormalan, kehomogenan ragam, dan tidak terjadi autokorelasi, Myers [3]. Jika terdapat pelanggaran terhadap asumsi tersebut, estimator yang

(2)

diperoleh bersifat bias dan tidak efisien sehingga model regresi yang diperoleh tidak cocok (fit) terhadap data yang dimodelkan.

Metode yang digunakan untuk menghasilkan model regresi yang bersifat fit meskipun terdapat outlier dalam data adalah metode regresi robust. Menurut Ryan [4], metode regresi robust memiliki sifat : (1) sama baiknya dengan MKT ketika semua asumsi klasik terpenuhi; (2) dapat menghasilkan model yang lebih baik dari MKT ketika ada asumsi tidak terpenuhi; dan (3) estimasi dilakukan secara iteratif sampai diperoleh dugaan terbaik yang memiliki standar error parameter paling kecil. Dalam penelitian ini metode regresi robust yang digunakan adalah Scale-Estimator (S-Estimator), Maximum Likelihood Estimator (M-Estimator), dan Method of Moment Estimator (MM-Estimator).

Outlier pada analisis regresi dapat terjadi pada variabel bebas/independent, variabel tak bebas/dependent, atau pada kedua variabel tersebut. Pada penelitian ini perhatian dipusatkan untuk outlier pada variabel tak bebas, menurut jenisnya (minor – mayor outlier) dan banyaknya outlier (persentase outlier terhadap data keseluruhan).

Penelitian ini bertujuan untuk melihat ketegaran terhadap sifat kenormalan sisaan sera sifat ketakbiasan estimator parameter regresi linear sederhana dari S- Estimator, M-Estimator, dan MM-Estimator pada data simulasi yang mengandung outlier menurut jenis dan banyaknya.

2. Tinjauan Pustaka

2.1 Regresi Linear Sederhana

Regresi merupakan alat statistika yang memanfaatkan hubungan antara dua atau lebih variabel kuantitatif sehingga salah satu variabel dapat diramalkan dari variabel lainnya. Regresi linear yang hanya melibatkan satu variabel respon dan satu variabel bebas disebut regresi linear sederhana. Model setiap pengamatan dinyatakan dengan rumus 𝑌𝑌𝑖𝑖 = 𝛽𝛽0+ 𝛽𝛽1𝑋𝑋𝑖𝑖+ 𝜀𝜀𝑖𝑖 dengan 𝑌𝑌𝑖𝑖 adalah nilai variabel respon dalam amatan ke-i; 𝑋𝑋𝑖𝑖 adalah variabel bebas yang diketahui nilainya dalam amatan ke-i; 𝜀𝜀𝑖𝑖 adalah nilai sisaan/galat yang memiliki sifat saling bebas dan menyebar normal: 𝜀𝜀𝑖𝑖~𝑁𝑁(0, 𝜎𝜎2); 𝛽𝛽0 dan 𝛽𝛽1 adalah paremeter regresi.

Salah satu metode dalam analisis regresi yang digunakan untuk mengestimasi parameter-paremeternya adalah Metode Kuadrat Terkecil (MKT).

Prinsip dasar MKT adalah dengan meminimumkan jumlah kuadrat sisaan.

2.2 Outlier Dalam Regresi

Outlier adalah suatu data yang tidak biasa, tidak cocok dari data lainnya atau data yang tidak mengikuti pola umum dari keseluruhan, Weisberg [1]. Adanya outlier mungkin disebabkan karena kesalahan dalam melakukan observasi yang biasa disebut observasi terkontaminasi atau outlier merupakan data akurat dari kasus yang jarang.

Analisis regresi memberikan suatu model yang menggambarkan hubungan variabel independent (𝑋𝑋𝑖𝑖, 𝑖𝑖 = 1,2, … , 𝑛𝑛 ) dengan variabel dependent ( 𝑌𝑌𝑖𝑖, 𝑖𝑖 = 1,2, … , 𝑛𝑛 ). Model regresi yang diperoleh dengan MKT mensyaratkan asumsi bahwa sisaan/galat dari model yang dihasilkan harus berdistribusi normal. Tetapi dengan adanya outlier menyebabkan asumsi kenormalan tidak terpenuhi. Dalam analisis regresi, terdapat satu variabel dependent yang digambarkan pada

(3)

scatterplot sebagai arah y, dan satu atau beberapa variabel independent pada scatterplot digambarkan sebagai arah x. Keberadaan data outlier mungkin terdapat pada arah y, pada arah x, atau pada arah keduanya.

Outlier pada satu variabel, misalkan pada variabel dependent Y, dibedakan menjadi minor outlier dan mayor outlier yang didefinisikan sebagai berikut : 1. Minor Outlier (mild outlier)

Suatu nilai y dikatakan minor outlier jika nilai y tersebut berada pada:

𝑄𝑄1 − 3 𝐽𝐽𝐽𝐽 ≤ 𝑦𝑦 ≤ 𝑄𝑄1− 1,5 𝐽𝐽𝐽𝐽 atau 𝑄𝑄3+ 1,5 𝐽𝐽𝐽𝐽 ≤ 𝑦𝑦 ≤ 𝑄𝑄3+ 3 𝐽𝐽𝐽𝐽 2. Mayor Outlier (extreme outlier)

Suatu nilai y dikatakan mayor outlier jika nilai y tersebut berada pada:

𝑦𝑦 < 𝑄𝑄1− 3 𝐽𝐽𝐽𝐽 atau 𝑦𝑦 > 𝑄𝑄3+ 3 𝐽𝐽𝐽𝐽 dengan:

Q1 adalah kuartil pertama;

Q3 adalah kuartil ketiga;

JK adalah jangkauan antar kuartil (Q3 - Q1).

Data outlier dapat dikenali dengan pemeriksaan secara visual dari data mentah (raw data) atau dari dari diagram pencar/scatterplot variabel independent dan variabel dependent. Pada kasus ketika terdapat lebih dari dua variabel independen, beberapa outlier mungkin sangat sulit dideteksi dengan pemeriksaan visual, diperlukan alat bantu yang dikenal dengan regresi diagnostik yang dapat membantu dalam mendeteksi outlier.

2.3 Regresi Robust

Masalah outlier pada estimasi MKT dapat diatasi dengan menggunakan metode estimasi yang bersifat tegar terhadap outlier yang dikenal dengan regresi robust. Menurut Myers [3], regresi robust merupakan metode regresi yang digunakan ketika distribusi dari sisaan tidak normal dan adanya beberapa outlier yang berpengaruh pada hasil analisis regresi.

Prosedur regresi robust ditujukan untuk mengakomodasi adanya keanehan data, sekaligus meniadakan identifikasi adanya data outlier. Chen [6]

menyebutkan beberapa prosedur estimasi parameter dalam regresi robust, tiga diantaranya adalah M-Estimator (Maximum likelihood type estimator) yang diperkenalkan Huber tahun 1973, S-Estimator (Scale estimator) yang diperkenalkan oleh Rousseeuw dan Yohai pada tahun 1984 serta MM-Estimator (Method of Moment estimator) yang diperkenalkan oleh Yohai pada tahun 1987.

(a) M-Estimator

Estmasi parameter dengan metode ini menggunakan metode Iteratively Reweighted Least Squares (IRLS), meminimumkan fungsi 𝜌𝜌 (fungsi obyektif) dari sisaan.

TABEL 1. Fungsi objektif, Influence Function dan Fungsi Pembobot M-Estimator

Metode Fungsi Objektif Influence Function Fungsi Pembobot

Kuadrat

Terkecil 𝜌𝜌(𝜀𝜀𝑖𝑖

) =1

2(𝜀𝜀𝑖𝑖)2 𝜓𝜓(𝜀𝜀𝑖𝑖) = 𝜀𝜀𝑖𝑖 𝑤𝑤(𝜀𝜀𝑖𝑖) = 1

(4)

Sumber : Montgomery [2]

Nilai r pada fungsi objektif, influence dan pembobot pada Tabel 1 adalah tunning constant dan 𝜀𝜀𝑖𝑖 = 𝜀𝜀𝑖𝑖⁄ , dimana 𝜎𝜎� merupakan estimator skala sisaan yang sifatnya 𝜎𝜎�

robust (tegar). Kuzmic et.al [6] menyebutkan bahwa M-Estimator efektif digunakan pada α=5% dengan r = 1.345 untuk fungsi pembobot Huber dan r = 4,685 untuk pembobot Tukey Bisquare. Semakin besar r maka estimasi robust akan mendekati least square. M-Estimator dipandang baik dalam mengestimasi parameter yang disebabkan oleh data outlier dan memiliki breakdown point 1/n, dengan n adalah banyaknya data pengamatan. Breakdown point adalah proporsi minimal dari banyaknya data pencilan dibandingkan dengan seluruh data pengamatan. M-Estimator meminimumkan fungsi objektif :

𝑛𝑛𝑖𝑖=1𝜌𝜌(𝜀𝜀𝑖𝑖) = ∑ 𝜌𝜌(𝜀𝜀𝑛𝑛𝑖𝑖=1 𝑖𝑖⁄ )𝜎𝜎� = ∑𝑛𝑛𝑖𝑖=1𝜌𝜌((𝑦𝑦𝑖𝑖 − 𝑋𝑋𝑖𝑖𝒃𝒃)/𝜎𝜎�) (1) 𝜎𝜎� merupakan estimator skala sisaan yang sifatnya robust (tegar). Nilai 𝜎𝜎� diperoleh melalui iterasi:

𝜎𝜎�𝑙𝑙 = 𝑚𝑚𝑚𝑚𝑚𝑚|𝜀𝜀𝑖𝑖 − 𝑚𝑚𝑚𝑚𝑚𝑚𝜀𝜀𝑖𝑖|/0.6745 (2) dengan l (l = 1, 2, …) adalah iterasi. Bila n besar dan sisaan berdistribusi normal, maka dengan konstanta 0.6745 menyebabkan 𝜎𝜎� bersifat tak bias, Montgomery[2].

Dengan 𝜓𝜓 = 𝜌𝜌 adalah turunan pertama dari 𝜌𝜌 yang merupakan influence function, maka untuk meminimumkan persamaan (1) :

𝑛𝑛𝑖𝑖=1𝜓𝜓((𝑦𝑦𝑖𝑖− 𝑋𝑋𝑖𝑖𝒃𝒃)/𝜎𝜎�)𝑋𝑋𝑖𝑖 = 0 (3) 𝜓𝜓(. ) merupakan influence function yang digunakan dalam memperoleh bobot (weight). Dengan fungsi pembobot

𝑤𝑤

𝑖𝑖

=

𝜓𝜓�𝜀𝜀𝜀𝜀 𝑖𝑖

𝑖𝑖 maka persamaan (3) menjadi:

𝑛𝑛𝑖𝑖=1𝑤𝑤𝑖𝑖((𝑦𝑦𝑖𝑖− 𝑋𝑋𝑖𝑖𝒃𝒃)/𝜎𝜎�)𝑋𝑋𝑖𝑖 = 0 (4) Persamaan (4) dinotasikan ke dalam matrik :

𝑋𝑋𝑇𝑇𝑊𝑊𝑋𝑋𝒃𝒃 = 𝑋𝑋𝑇𝑇𝑊𝑊𝑦𝑦 (5) Persamaan (5) disebut weighted least. Weighted least squares tersebut dapat digunakan sebagai alat untuk mendapatkan M-Estimator, sehingga hasil dari estimasi parameter menjadi :

Huber

𝜌𝜌(𝜀𝜀𝑖𝑖) = � 1

2(𝜀𝜀𝑖𝑖)2 , |𝜀𝜀𝑖𝑖| ≤ 𝑟𝑟 𝑟𝑟|𝜀𝜀𝑖𝑖| −1

2 𝑟𝑟2, |𝜀𝜀𝑖𝑖| > 𝑟𝑟

𝜓𝜓(𝜀𝜀𝑖𝑖) = �𝜀𝜀𝑖𝑖, |𝜀𝜀𝑖𝑖| ≤ 𝑟𝑟 𝑟𝑟, 𝜀𝜀𝑖𝑖> 𝑟𝑟

– 𝑟𝑟, 𝜀𝜀𝑖𝑖< − 𝑟𝑟 𝑤𝑤(𝜀𝜀𝑖𝑖) = � 1, |𝜀𝜀𝑖𝑖| ≤ 𝑟𝑟 𝑟𝑟

�𝜀𝜀𝑖𝑖, |𝜀𝜀𝑖𝑖| > 𝑟𝑟

Tukey Bisquare 𝜌𝜌(𝜀𝜀

𝑖𝑖) =

⎧𝑟𝑟2

6 �1 − �1 − � 𝜀𝜀𝑖𝑖

𝑟𝑟 �

2

3

𝑟𝑟2

6 , |𝜀𝜀𝑖𝑖| > 𝑟𝑟

, |𝜀𝜀𝑖𝑖| ≤ 𝑟𝑟 𝜓𝜓(𝜀𝜀𝑖𝑖) = �𝜀𝜀𝑖𝑖�1 − �𝜀𝜀𝑖𝑖

𝑟𝑟 �

2

2

|𝜀𝜀𝑖𝑖| ≤ 𝑟𝑟2 0, |𝜀𝜀𝑖𝑖| > 𝑟𝑟

𝑤𝑤(𝜀𝜀𝑖𝑖) = � �1 − �𝜀𝜀𝑖𝑖

𝑟𝑟 �

2

2

, 0, |𝜀𝜀𝑖𝑖| > 𝑟𝑟

|𝜀𝜀𝑖𝑖| ≤ 𝑟𝑟

(5)

𝒃𝒃 = (𝑋𝑋𝑇𝑇𝑊𝑊𝑋𝑋)−1𝑋𝑋𝑇𝑇𝑊𝑊𝑦𝑦 (6) Secara umum prosedur untuk mendapatkan estimasi parameter dengan Iteratively Reweighted Least Squares (IRLS), adalah sebagai berikut:

1) Menaksir parameter regresi menggunakan least square, sehingga didapatkan 𝑦𝑦�𝑖𝑖,0 dan didapatkan residual 𝜀𝜀𝑖𝑖,0, dimana 𝜀𝜀𝑖𝑖,0= 𝑦𝑦𝑖𝑖 − 𝑦𝑦�𝑖𝑖,0 (i = 1, 2, ... n) yang diperlakukan sebagai nilai awal

2) Dari nilai-nilai residual tersebut ditentukan 𝜎𝜎�(0) dan fungsi pembobot awal 𝑤𝑤𝑖𝑖,0 = 𝜓𝜓𝜀𝜀𝜀𝜀𝑖𝑖,0∗ �

𝑖𝑖,0

.

Nilai 𝜓𝜓(𝜀𝜀𝑖𝑖) dihitung sesuai fungsi Huber

3) Mencari estimasi pada iterasi l ( l = 1, 2, … ) dengan weighted least square:

𝑏𝑏𝑙𝑙 = (𝑋𝑋𝑇𝑇𝑊𝑊𝑙𝑙−1𝑋𝑋)−1𝑋𝑋𝑇𝑇𝑊𝑊𝑙𝑙−1𝑦𝑦

dengan 𝑊𝑊𝑙𝑙−1 merupakan matriks diagonal dengan elemen diagonalnya adalah 𝑤𝑤𝑖𝑖,𝑙𝑙−1. Sehingga estimasi parameter pada iterasi pertama ( l = 1 ) menggunakan 𝜀𝜀𝑖𝑖,0 dan 𝑤𝑤𝑖𝑖,0

4) Menghitung ∑ �𝑦𝑦𝑛𝑛𝑖𝑖=1 𝑖𝑖 − 𝑦𝑦�𝑖𝑖,1� atau ∑ �𝜀𝜀𝑛𝑛𝑖𝑖=1 𝑖𝑖,1

5) Mengulang tahap 2 - 4 hingga didapatkan ∑ �𝜀𝜀𝑛𝑛𝑖𝑖=1 𝑖𝑖,𝑙𝑙� yang konvergen (selisih 𝑏𝑏𝑙𝑙+1 dan 𝑏𝑏𝑙𝑙 mendekati 0).

(b) S-Estimator (Scale-Estimator)

S-Estimator diperkenalkan oleh Rousseeuw dan Yohai pada tahun 1984. S- Estimator dapat mengidentifikasi bad observation yang berarti dapat membedakan good leverage point dan bad leverage point. Good leverage point merupakan pengamatan yang terpencil pada variabel X tetapi terletak dekat dengan garis regresi (pengamatan xi menjauh, tetapi yi cocok dengan garis regresi), sedangkan bad leverage point merupakan pengamatan yang terpencil pada variabel bebas X dan terletak jauh dari garis regresi. Untuk mengatasi hal tersebut diperlukan high breakdown point, Chen [5]. S-Estimator merupakan estimator yang memiliki high breakdown point untuk mengestimasi skala sisaan 𝜎𝜎�.

S-Estimator meminimumkan skala M-Estimator terhadap sisaan (𝜎𝜎�). Bentuk S- Estimator adalah:

𝒃𝒃�𝑆𝑆 = 𝑚𝑚𝑖𝑖𝑛𝑛𝛽𝛽𝜎𝜎�(𝜀𝜀1(𝒃𝒃), … , 𝜀𝜀𝑛𝑛(𝒃𝒃)) (6)

dimana 𝜎𝜎� adalah penduga skala robust yang memenuhi 𝑛𝑛1

𝑛𝑛𝑖𝑖=1

𝜌𝜌(

𝜀𝜀𝜎𝜎𝑖𝑖

) = 𝛿𝛿

,

dimana 𝛿𝛿 adalah konstanta yang didefinisikan sebagai 𝛿𝛿 = 𝐸𝐸(𝛷𝛷, 𝜌𝜌(∞)) dimana 𝛷𝛷 berdistribusi normal standar.

(c) MM-Estimator (Method of Moment Estimator)

MM-Estimator merupakan estimator yang mempunyai sifat robust yang tinggi dan efektif terhadap outlier. Metode MM-Estimator melalui dua tahap.

Pertama, mengestimasi parameter regresi awal dan menghitung scale estimate dengan metode S-Estimtor. Kedua, mengestimasi parameter regresi akhir dengan M-Estimator. pada umumnya MM-Estimator menggunakan metode Tukey Bisquare. MM-Estimator juga menggunakan IRLS (Iteratively Reweighted Least

(6)

Square) untuk mencari estimasi parameter regresi. Langkah-langkah estimasi parameter pada MM-Estimator adalah sebagai berikut:

1. Menghitung estimator awal 𝒃𝒃�𝑖𝑖,0 dan 𝜀𝜀𝑖𝑖,0 dengan menggunakan S-Estimator (high breakdown point)

2. Dari nilai residual 𝜀𝜀𝑖𝑖,0 yang diperoleh pada langkah 1, ditentukan estimator skala 𝜎𝜎�𝑠𝑠, dihitung pula pembobot awal 𝑤𝑤𝑖𝑖,0 =𝜓𝜓𝜀𝜀𝜀𝜀𝑖𝑖,0∗ �

𝑖𝑖,0 , 𝜀𝜀𝑖𝑖 = 𝜀𝜀𝑖𝑖⁄ , dan 𝑤𝑤𝜎𝜎�𝑠𝑠 𝑖𝑖,0

dihitung sesuai fungsi Tukey Bisquare

3. Nilai residual 𝜀𝜀𝑖𝑖,0 dengan estimator skala 𝜎𝜎�𝑠𝑠 pada langkah 2 digunakan dalam iterasi awal:

𝑏𝑏𝑙𝑙 = (𝑋𝑋𝑇𝑇𝑊𝑊𝑙𝑙−1𝑋𝑋)−1𝑋𝑋𝑇𝑇𝑊𝑊𝑙𝑙−1𝑦𝑦

dengan 𝑊𝑊𝑙𝑙−1 merupakan matriks diagonal dengan elemen diagonalnya adalah

𝑤𝑤𝑖𝑖,𝑙𝑙−1. Sehingga estimasi parameter pada iterasi pertama (nilai l = 1)

menggunakan 𝜀𝜀𝑖𝑖,0 dan 𝑤𝑤𝑖𝑖,0

4. Menghitung ∑ �𝑦𝑦𝑛𝑛𝑖𝑖=1 𝑖𝑖 − 𝑦𝑦�𝑖𝑖,1� atau ∑ �𝜀𝜀𝑛𝑛𝑖𝑖=1 𝑖𝑖,1

5. Mengulangi langkah 2 sampai 4 hingga didapatkan ∑ �𝜀𝜀𝑛𝑛𝑖𝑖=1 𝑖𝑖,𝑙𝑙� yang konvergen (selisih 𝑏𝑏𝑙𝑙+1 dan 𝑏𝑏𝑙𝑙 mendekati 0), dengan l adalah banyaknya iterasi.

3. Hasil dan Pembahasan

Berdasarkan tujuan dalam penelitian ini yaitu melihat sifat ketakbiasan estimator parameter regresi linear sederhana dari MKT, S-Estimator, M- Estimator, dan MM-Estimator pada data simulasi yang mengandung outlier menurut jenis dan banyaknya, dalam penelitian ini outlier hanya terjadi pada peubah dependent Y. Kumpulan data yang dianalisis mencakup data yang mengandung minor-outlier sebesar 5%, 10%, dan 15% serta data-data yang mengandung mayor-outlier sebesar 5%, 10%, dan 15%. Data simulasi awal (tanpa outlier) dibangkitkan data berdistribusi normal dengan 𝐸𝐸(𝑌𝑌|𝑋𝑋) = 2 + 𝑋𝑋, selanjutnya untuk memenuhi kriteria data mengandung jenis dan banyak outlier tertentu, dilakukan dengan mengganti sejumlah data dengan data outlier sesuai jenis dan banyaknya.

Karena MKT tidak memenuhi asumsi kenormalan, maka sifat ketakbiasan estimator dari parameter regresi dilihat pada S-Estimator, M-Estimator, dan MM- Estimator. Sifat ketakbiasan dilihat pada selang kepercayaan 95% parameter regresi, apabila nilai harapan parameter regresi, yaitu 𝐸𝐸�𝛽𝛽̂1� = 𝛽𝛽1 = 1 berada pada selang kepercayaan yang disusun berdasarkan nilai 𝛽𝛽̂1 maka dikatakan estimator 𝛽𝛽̂1 bersifat tidak bias. Demikian juga, apabila 𝐸𝐸�𝛽𝛽̂0� = 𝛽𝛽0 = 2 berada pada selang kepercayaan yang disusun berdasarkan nilai 𝛽𝛽̂0 maka estimator 𝛽𝛽̂0

bersifat tidak bias. Sifat ketakbiasan S-Estimator, M-Estimator, dan MM- Estimator secara rinci diuraikan pada Tabel 2, Tabel 3, dan Tabel 4.

TABEL 2. Selang Kepercayaan 95% 𝛽𝛽0 dan 𝛽𝛽1 dari S-Estimator Posisi

Outlier

Jenis Outlier 𝐵𝐵�0 Ket. 𝐵𝐵�1 Ket.

Batas Bawah

Batas Atas

Batas Bawah

Batas Atas

Bawah Minor 5% 1.4760 3.2763 T 0.9768 1.0081 T

(7)

TABEL 3. Selang Kepercayaan 95% 𝛽𝛽0 dan 𝛽𝛽1 dari M-Estimator

TABEL 4. Selang Kepercayaan 95% 𝛽𝛽0 dan 𝛽𝛽1 dari MM-Estimator

Minor 10% 2.0303 3.2917 T 0.9776 0.9990 B

Minor 15% 1.7979 3.2438 T 0.9791 1.0030 T

Mayor 5% 1.4760 3.2763 T 0.9768 1.0081 T

Mayor 10% 2.0303 3.2917 T 0.9776 0.9990 B

Mayor 15% 1.7979 3.2438 T 0.9791 1.0030 T

Atas Minor 5% 1.0317 2.9745 T 0.9859 1.0220 T

Minor 10% 1.5058 3.1398 T 0.9803 1.0125 T

Minor 15% 1.6087 3.0307 T 0.9822 1.0112 T

Mayor 5% 1.0317 2.9745 T 0.9859 1.0220 T

Mayor 10% 1.5058 3.1398 T 0.9803 1.0125 T

Mayor 15% 1.6087 3.0307 T 0.9822 1.0112 T

Tengah Minor 5% 1.6345 3.1979 T 0.9780 1.0058 T

Minor 10% 1.9382 2.9054 T 0.9828 0.9998 B

Minor 15% 1.6645 3.1322 T 0.9794 1.0052 T

Mayor 5% 1.6345 3.1979 T 0.9780 1.0058 T

Mayor 10% 1.9382 2.9054 T 0.9828 0.9998 B

Mayor 15% 1.6645 3.1322 T 0.9794 1.0052 T

Posisi Outlier Jenis Outlier 𝐵𝐵�0 Ket. 𝐵𝐵�1 Ket.

Batas Bawah

Batas Atas

Batas Bawah

Batas Atas

Bawah Minor 5% 1.3746 2.5260 T 0.9897 1.0087 T

Minor 10% 1.429 3.5460 T 0.9775 1.0069 T

Minor 15% 1.2348 2.9800 T 0.9828 1.0070 T

Mayor 5% 1.5610 2.9874 T 0.9833 1.0027 T

Mayor 10% -0.0488 3.3710 T 0.9928 1.0258 T Mayor 15% 1.2191 2.8305 T 0.9868 1.0094 T

Atas Minor 5% 1.9763 2.9340 T 0.9820 0.9967 B

Minor 10% 1.7865 2.7887 T 0.9850 1.0012 T Minor 15% 1.8579 2.8351 T 0.9826 0.9996 B

Mayor 5% 1.9763 2.9340 T 0.9820 0.9967 B

Mayor 10% 1.7865 2.7887 T 0.9850 1.0012 T Mayor 15% 1.8579 2.8351 T 0.9826 0.9996 B

Tengah Minor 5% 1.7467 2.9096 T 0.9842 1.0008 T

Minor 10% 1.1474 5.5850 T 0.9900 1.0098 T Minor 15% 1.1891 2.5953 T 0.9902 1.0092 T

Mayor 5% 1.1834 2.6773 T 0.9885 1.0095 T

Mayor 10% 1.1474 5.5850 T 0.9900 1.0098 T Mayor 15% 1.1891 2.5953 T 0.9902 1.0092 T

Posisi Outlier Jenis Outlier 𝐵𝐵�0 Ket. 𝐵𝐵�1 Ket.

Batas Bawah

Batas Atas

Batas Bawah

Batas Atas

Bawah Minor 5% 1.7685 2.6417 T 0.9879 1.0026 T

Minor 10% 1.9123 2.9307 T 0.9838 1.0004 T

Minor 15% 1.8497 2.9935 T 0.9829 1.0011 T

Mayor 5% 1.7685 2.6417 T 0.9879 1.0026 T

Mayor 10% 1.9123 2.9307 T 0.9838 1.0004 T

Mayor 15% 1.8497 2.9935 T 0.9829 1.0011 T

Atas Minor 5% 1.8481 2.6097 T 0.9885 1.0024 T

(8)

Ket. : T = tidak bias, B = bias

Berdasarkan hasil yang diuraikan dalam Tabel 2, 3, dan 4 maka terlihat bahwa ketiga metode regresi robust menghasilkan estimator tidak bias untuk parameter pada semua jenis dan banyak outlier dalam data.

Sedangkan untuk estimator parameter pada S-Estimator diperoleh estimator yang bias pada data yang mengandung outlier sebanyak 10% untuk jenis minor dan mayor pada posisi bawah dan tengah data. Pada M-Estimator, estimator yang bias untuk parameter diperoleh pada data yang mengandung outlier sebanyak 5% untuk jenis minor dan mayor pada posisi atas dari data.

Sedangkan MM-Estimator memberikan estimator tak bias untuk parameter pada semua jenis dan banyak outlier di semua posisi data. Hal ini memperlihatkan bahwa diantara ketiga metode regresi robust yang diamati, MM-Estimator merupakan metode yang memiliki kekekaran yang paling tinggi dalam mengatasi pengaruh outlier pada analisis regresi linier.

4. Kesimpulan

Adanya outlier pada suatu data dalam analisis regresi linier menga- kibatkan pelanggaran terhadap asumsi kenormalan, sehingga MKT tidak tepat digunakan dalam estimasi parameter. Metode regresi robust diguna - kan sebagai alternatifnya. Dari ketiga metode regresi robust, yaitu S- Estimator, M-Estimator, dan MM-Estimator diperoleh bahwa MM- Estimator merupakan metode yang memiliki kekekaran yang paling tinggi dalam mengatasi pengaruh outlier pada analisis regresi linier.

Daftar Pustaka

[1] Weisberg, S., Applied Linear Regression. John Wiley and Sons Inc., 2005.

[2] Montgomery,D.C. and Peck, E.A., Introduction to Linear Regression Analysis, 2ndEdition, John Wiley and Sons Inc., 1992.

[3] Myers, R.H., Classical and Modern Regression With Application, 2ndEdition, Duxbury/Thompson Learning, 1990.

[4] Ryan, T.P., Modern Regression Methods, A Wiley-Interscience Publication, 1997.

[5] Chen, C., The Robust Regression and Outlier Detection With The Robustreg Procedure. Paper 265-267. SAS Institute. Cary, NC, 2002.

[6] Kuzmic, Petr, et al., Practical Robust Fit of Enzyme Inhibition Data. Methods in Enzymology.

383:366-381, 2004.

Minor 10% 1.8691 2.6197 T 0.9880 1.0023 T

Minor 15% 1.8601 2.6301 T 0.9878 1.0032 T

Mayor 5% 1.8481 2.6097 T 0.9885 1.0024 T

Mayor 10% 1.8691 2.6197 T 0.9880 1.0023 T

Mayor 15% 1.8601 2.6301 T 0.9878 1.0032 T

Tengah Minor 5% 1.8968 2.6834 T 0.9874 1.0009 T

Minor 10% 1.8630 2.6841 T 0.9871 1.0010 T

Minor 15% 1.8905 2.7335 T 0.9861 1.0004 T

Mayor 5% 1.8968 2.6834 T 0.9874 1.0009 T

Mayor 10% 1.8630 2.6841 T 0.9871 1.0010 T

Mayor 15% 1.8905 2.7335 T 0.9861 1.0004 T

Gambar

TABEL 2. Selang Kepercayaan 95%
TABEL 3. Selang Kepercayaan 95%

Referensi

Dokumen terkait

Hasil wawancara, observasi dan dokumentasi yang dialakukan peneliti dalam mengetahui tentang kompetensi kerja siswa jurusan teknik sepeda motor memperoleh data sebagai

[r]

Herein, the stiffness of suspended InP membranes is locally measured by contact at several points of their surface, using a self-sensing quartz tuning fork probe controlled in

48 ASRM ASURANSI RAMAYANA Tbk BSRE1 - BSR INDONESIA PT... BSRE1 - BSR

Untuk itu dengan mengembangkan pencarian semantik berbasis ontologi menggunakan algoritma model ruang vektor diharapkan dapat lebih meningkatkan nilai presisi dan recall

Perhitungan biaya proses (process costing): sebuah sistem biaya yang menentukan biaya ke masing-masing proses atau pusat kerja dalam siklus produksi, dan kemudian menghitung

Temali: Jurnal Pembangunan Sosial, Volume 3 Nomor 1 Tahun 2020 183 pengairan untuk mencegah pengalihan pemanfaatan lahan produktif dengan meningkatkan peran serta masyarakat

(i) Penceramah bukan dari guru-guru yang mengajar mereka tetapi guru- guru agama yang mengajar darjah lain bagi menambah sambutan murid-murid (jika guru sekolah sendiri). (ii)