• Tidak ada hasil yang ditemukan

Outlier Pada Analisis Regresi

N/A
N/A
Protected

Academic year: 2017

Membagikan "Outlier Pada Analisis Regresi"

Copied!
47
0
0

Teks penuh

(1)

Outlier Pada Analisis

Regresi

(2)

Pendahuluan

Tujuan dari Analisis Regresi adalah

mengepas persamaan pada peubah yang terobservasi

Model regresi linier klasik

mengasumsikan hubungan berikut :

Dimana n adalah ukuran contoh

(3)

Pada theori klasik diasumsikan eror ei menyebar normal dengan rata – rata nol dan ragam 2

Jadi dengan analisis regresi kita menduga parameter

(4)

Dengan menggunakan metode

penduga regresi pada data tersebut didapatkan

Dimana adalah koefisien regresi adalah nilai duga y yang didapat

(5)

Residual ri dari amatan ke I adalah selisih antara y observasi dan y dugaan

Metode Kuadrat Terkecil (MKT) atau

Ordinary Least Square (OLS) adalah metode paling populer untuk

(6)

Ide dasar metode OLS adalah mencari nilai duga paramete yang

(7)

Efek Outlier pada Regresi Linier

Sederhana

Model Regresi Linier Sederhana

(8)
(9)

Misalkan terdapat kesalahan penulisan y4, maka titik (x4,y4) akan terletak jauh dari garis idealnya.

(10)
(11)

Outlier juga dapat terjadi dalam X. Berikut adalah plot dari 5 titik

(12)

Misalkan kita membuat kesalahan

(13)

Titik (x1,y1) dinamakan outlier dalam arah x dan efeknya pada penduga LS sangat besar karena merubah garis LS.

(14)
(15)

Breakdown Point

Misalkan terdapat sample dengan n titik data

Dan misalkan T adalah penduga regresi sehingga

Misalkan Z’ adalah sample yang

didapat dari Z dimana m titik dalam Z diganti dengan titik – titik yang

(16)

Notasikan bias(m; T, Z) adalah bias maksimum yang dapat disebabkan oleh kontaminasi tersebut

Jika bias (m;T, Z) infinite berarti m outlier dapat memiliki efek yang

(17)

Breakdown point dari estimator T pada sample Z didefinisikan sebagai

Dengan kata lain, break down point

adalah proporsi kontaminasi terkecil

(18)

Breakdown point untuk MKT (OLS) adalah

Karena telah kita lihat bahwa satu outlier sudah dapat merubah nilai koefisien regresi

(19)

Identifikasi Pencilan pada Y

Dalam beberapa analisis regresi seringkali

ditemukan adanya amatan ekstrem, yaitu

bernilai jauh dengan amatan yang lain dalam sampel

Adanya amatan ekstrem atau pencilan ini

dapat menyebabkan residual yang besar dan seringkali memiliki efek yang besar pada

(20)

Pencilan harus diteliti dengan hati – hati apakah sebaiknya amatan ini dipertahankan atau dihilangkan.

(21)

Suatu amatan dapat menjadi pencilan pada Y atau pada X atau pada

(22)

Pendeteksian

Outlier

Untuk pendeteksian pencilan , diperlukan suatu matriks yang dinamakan hat matrix yang

(23)

Penduga Y dapat ditulis sebagai

(24)

Elemen diagonal dari matriks H

memberikan informasi tentang data observasi yang mempunyai nilai

leverage yang besar

Elemen diagonal ke-i dari matriks H

(25)

Dengan adalah vektor baris yang berisi nilai-nilai dari variabel bebas

atau independen dalam pengamatan ke-i.

Pada elemen diagonal matriks H, diperoleh

(26)

Pendeteksian pencilan pada X

Jika nilai lebih besar dari

2(p+1)/n maka pengamatan ke-i dikatakan sebagai outlier pada X

(27)

Pendeteksian Pencilan pada

Y

Hipotesis yang digunakan untuk menguji adalah:

H0 : Pengamatan ke-i bukan outlier H1 : Pengamatan ke-i merupakan

outlier

(28)

Pendeteksian Pencilan pada

Y

Kriteria yang digunakan untuk

menguji ada tidaknya outlier adalah

(29)

Pendeteksian Pengamatan

Berpengaruh

Pengamatan berpengaruh

merupakan pengamatan yang

berpengaruh besar dalam pendugaan koefisien regresi

memiliki nilai galat atau sisaan yang

besar atau mungkin pula tidak, tergantung pada model yang

(30)

Metode untuk mendeteksi

pengamatan berpengaruh

1. Cook’s Distance

Cook’s Distance merupakan jarak

antara pendugaan parameter dengan MKT yang diperoleh dari n

pengamatan atau observasi yaitu dan pendugaan parameter yang

diperoleh dengan terlebih dahulu menghapus pengamatan atau

(31)

Jarak tersebut dapat dituliskan sebagai berikut:

(32)

Hipotesis untuk menguji adanya

pengamatan berpengaruh adalah sebagai berikut:

H0 : Pengamatan ke-i tidak berpengaruh

H1 : Pengamatan ke-i berpengaruh

kriteria yang digunakan untuk menguji hipotesis tersebut adalah sebagai

(33)

2. The Difference In Fits Statistic

(DFITS)

Hipotesis untuk menguji adanya

pengamatan berpengaruh adalah sebagai berikut:

H0 : Pengamatan ke-i tidak berpengaruh

H1 : Pengamatan ke-i berpengaruh merupakan pengaruh

pengamatan atau observasi ke-i pada nilai duga yang

(34)
(35)

Metode untuk Penanganan Pencilan

1. Metode Theil

Merupakan metode regresi nonparametrik Tidak terpengaruh terhadap adanya data

outlier atau pencilan Asumsi:

Contoh yang diambil bersifat acak dan

kontinyu;

Regresi bersifat linier;

(36)

Misalkan terdapat n pasangan pengamatan, (X1, Y1), (X2, Y2), …, (Xn, Yn), persamaan

regresi linier sederhana adalah:

(37)

Untuk satu pasangan (Xi, Yi) dan (Xj, Yj) slope-nya adalah

untuk i < j

(38)

Penduga M (

M-Estimator)

dengan Fungsi Huber

Penduga M adalah solusi

(1)

(39)
(40)

Untuk mendapatkan penduga koefisien regresi maka fungsi kriteria diturunkan

dan disamakan dengan nol

Dimana adalah hasil diferensiasi dari

fungsi kriteria dan Xij adalah observasi

(41)

Bentuk umum dari persamaan (1) adalah

(42)

Fungsi kriteria Huber yang

(43)

Dan fungsi pengaruhnya adalah

(44)

Persamaan kedua dapat dituliskan

Dengan

(45)
(46)
(47)

Gambar

gambar berikut bukan leverage

Referensi

Dokumen terkait

bahwa berdasarkan pertimbangan sebagaimana dimaksud dalam huruf a, dipandang perlu menetapkan Peraturan Menteri Komunikasi dan Informatika tentang Organisasi dan Tata Kerja

Berdasarkan penelitian ini, model regresi nonparametrik spline terbaik dengan kombinasi titik knot (3,2,3,3,3) dengan semua variabel signifikan yaitu persentase balita gizi

Kompresor sentrifugal kawasaki K-2501 A adalah jenis kompresor sentrifugal yaitu kompresor dengan kedudukan poros horizontal yang berfungsi untuk untuk menaikkan tekanan

Hasil penelitian menunjukkan bahwa benih kacang panjang dengan perlakuan invigorasi menggunakan priming dengan pasir dan matriconditioning dengan serbuk gergaji yang dilakukan

Lombok Barat, memproduksi keripik paru. Namun kualitasnya masih perlu ditingkatkan terutama ketebalan irisan yang tidak merata/seragam dan cenderung tebal sehingga

dan keluarga, (2) Upaya sebagaimana dimaksud pada ayat (1) dilaksanakan melalui sensus, survei, dan pendataan keluarga, dan (3) Data dan informasi kependudukan dan

Berdasarkan analisis data diperoleh kesimpulan bahwa evaluasi pelaksanaan program rehabilitasi sosial rumah tidak layak huni di Jorong Kandang Melabung Nagari

Pertanyaan yang dapat diajukan guru kepada siswa meliputi pertanyaan pemahaman misalnya seorang guru memberikan permasalahan kepada siswa mengenai suatu materi,