Regresi dengan Pencilan
Identifikasi Pencilan pada Y
Dalam beberapa analisis regresi seringkali ditemukan adanya amatan ekstrem, yaitu
bernilai jauh dengan amatan yang lain dalam sampel
Adanya amatan ekstrem atau pencilan ini
dapat menyebabkan residual yang besar dan seringkali memiliki efek yang besar pada
Pencilan harus diteliti dengan hati – hati apakah sebaiknya amatan ini dipertahankan atau dihilangkan.
Suatu amatan dapat menjadi pencilan pada Y atau pada X atau pada
Pendeteksian
Outlier
Untuk pendeteksian pencilan , diperlukan suatu matriks yang dinamakan hat matrix yang
Penduga Y dapat ditulis sebagai
Elemen diagonal dari matriks H
memberikan informasi tentang data observasi yang mempunyai nilai
leverage yang besar
Elemen diagonal ke-i dari matriks H
Dengan adalah vektor baris yang berisi nilai-nilai dari variabel bebas
atau independen dalam pengamatan ke-i.
Pada elemen diagonal matriks H, diperoleh
Pendeteksian pencilan pada X
Pendeteksian Pencilan pada
Y
Hipotesis yang digunakan untuk menguji adalah:
H0 : Pengamatan ke-i bukan outlier H1 : Pengamatan ke-i merupakan
outlier
Pendeteksian Pencilan pada
Y
Kriteria yang digunakan untuk
menguji ada tidaknya outlier adalah
Pendeteksian Pengamatan
Berpengaruh
Pengamatan berpengaruh
• merupakan pengamatan yang berpengaruh besar dalam
pendugaan koefisien regresi
• memiliki nilai galat atau sisaan yang besar atau mungkin pula tidak,
Metode untuk mendeteksi
pengamatan berpengaruh
1. Cook’s Distance
Cook’s Distance merupakan jarak
antara pendugaan parameter dengan MKT yang diperoleh dari n
pengamatan atau observasi yaitu dan pendugaan parameter yang
diperoleh dengan terlebih dahulu menghapus pengamatan atau
Jarak tersebut dapat dituliskan sebagai berikut:
Hipotesis untuk menguji adanya
pengamatan berpengaruh adalah sebagai berikut:
H0 : Pengamatan ke-i tidak berpengaruh
H1 : Pengamatan ke-i berpengaruh
kriteria yang digunakan untuk menguji hipotesis tersebut adalah sebagai
2. The Difference In Fits Statistic
(DFITS)
Hipotesis untuk menguji adanya
pengamatan berpengaruh adalah sebagai berikut:
H0 : Pengamatan ke-i tidak berpengaruh
H1 : Pengamatan ke-i berpengaruh merupakan pengaruh
pengamatan atau observasi ke-i pada nilai duga yang
Metode untuk Penanganan Pencilan
1. Metode Theil
Merupakan metode regresi nonparametrik Tidak terpengaruh terhadap adanya data
outlier atau pencilan Asumsi:
• Contoh yang diambil bersifat acak dan
kontinyu;
• Regresi bersifat linier;
Misalkan terdapat n pasangan pengamatan, (X1, Y1), (X2, Y2), …, (Xn, Yn), persamaan
regresi linier sederhana adalah:
Untuk satu pasangan (Xi, Yi) dan (Xj, Yj) slope-nya adalah
untuk i < j
Tugas 1
1. Deteksi pencilan pada X dan pada Y
2. Deteksi adakah pengamatan berpengaruh 3. Dugalah beta
menggunakan metode Theil
** Perhitungan dilakukan di Excell