• Tidak ada hasil yang ditemukan

ANALISIS SIFAT PENDUGA LEAST TRIMMED SQU

N/A
N/A
Protected

Academic year: 2018

Membagikan "ANALISIS SIFAT PENDUGA LEAST TRIMMED SQU"

Copied!
4
0
0

Teks penuh

(1)

305

ANALISIS SIFAT PENDUGA

LEAST TRIMMED SQUARES

(LTS) PADA

REGRESI LINIER BERGANDA YANG MENGANDUNG PENCILAN

DENGAN BERBAGAI UKURAN CONTOH

Amelia Nur Azizah, Rahma Fitriani, Solimun

Jurusan Matematika, F.MIPA, Universitas Brawijaya, Malang, Indonesia Email: amelia.memey02@gmail.com

Abstrak. Pendugaan parameter dalam model regresi dapat dilakukan dengan Metode Kuadrat Terkecil atau Ordinary Least Squares (OLS) yang memerlukan beberapa asumsi klasik tentang galat dalam model yang dihasilkan. Dalam beberapa kasus, data yang melandasi pembentukan model regresi memiliki pencilan (outlier) berupa pengamatan dengan nilai sisaan yang jauh lebih besar dibandingkan sisaan pengamatan lain atau jauh dari rata-rata sisaan. Penanganan menggunakan OLS menghasilkan nilai penduga parameter yang bersifat bias. Oleh karena itu, digunakan metode Least Trimmed Squares (LTS). Metode ini adalah salah satu metode pendugaan parameter regresi robust yang mempunyai prinsip pendugaan parameter yang sama dengan OLS, yaitu meminimumkan jumlah kuadrat galat. Hanya saja pada metode LTS jumlah kuadrat galat yang diminimumkan adalah jumlah kuadrat galat dari h pengamatan yang dianggap bukan pencilan. Analisis sifat penduga LTS dilakukan dengan melihat nilai bias, ragam, dan Mean Square Error (MSE) ketika diterapkan pada data yang mengandung pencilan dengan berbagai ukuran contoh untuk regresi linier berganda. Pertambahan banyaknya pencilan tidak mempengaruhi sifat penduga LTS karena penduga ini termasuk penduga yang kekar (robust) terhadap pencilan. Sedangkan pertambahan ukuran contoh mempengaruhi penduga LTS. Hal ini dikarenakan semakin besar ukuran contoh maka semakin kecil nilai bias, ragam, dan MSE penduga parameter. Oleh karena itu, metode LTS lebih baik digunakan pada data berukuran contoh besar yang mengandung pencilan berpengaruh pada regresi linier berganda.

Kata kunci: OLS, outlier, robust, LTS, MSE.

1. PENDAHULUAN

Regresi linier berganda merupakan suatu analisis yang digunakan untuk mengetahui hubungan antara satu variabel respon dengan lebih dari satu variabel prediktor. Pendugaan parameter dalam model regresi dapat dilakukan dengan Metode Kuadrat Terkecil atau Ordinary Least Square (OLS).

Dalam analisis regresi, penggunaan metode OLS memerlukan beberapa asumsi klasik tentang galat dalam model yang dihasilkan. Asumsi yang harus dipenuhi yaitu kenormalan galat, non autokorelasi, dan homoskedastisitas. Apabila asumsi galat terpenuhi maka penduga paramater yang diperoleh bersifat best linier unbiased estimator (BLUE). Data yang melandasi pembentukan model regresi kadang memiliki pencilan (outlier) berupa pengamatan dengan nilai sisaan yang jauh lebih besar dibandingkan sisaan pengamatan lain atau jauh dari rata-rata sisaan. Namun penanganan menggunakan OLS menghasilkan nilai penduga parameter yang bersifat bias Oleh karena itu diperlukan alternatif penduga parameter yang dapat mengatasi adanya pencilan, salah satunya dengan metode pendugaan Robust Least Trimmed Square (LTS).

Metode LTS merupakan metode yang memiliki kemampuan lebih baik dibandingkan dengan metode lainnya dalam mengatasi pencilan yang disebabkan baik oleh variabel prediktor maupun variabel respon. Metode ini hampir sama dengan metode OLS. Hanya saja LTS digunakan untuk meminimumkan jumlah kuadrat galat dari h pengamatan yang dianggap bukan pencilan, dengan h

merupakan konstanta pemotongan.

Sifat kebaikan penduga least trimmed square (LTS) pada regresi linier berganda dapat dilihat berdasarkan nilai bias dan ragam secara bersamaan, yaitu dari nilai Mean Square Error (MSE). Sifat ini dipelajari dari simulasi menggunakan data bangkitan pada regresi linier berganda yang mengandung pencilan berpengaruh sebanyak 4% dan 5% dengan berbagai ukuran contoh (n = 15, 30, 50, 100 dan 200).

2. TINJAUAN PUSTAKA

2.1 Analisis Regresi Linier Berganda

Dalam analisis regresi linier, apabila banyaknya peubah bebas lebih dari satu maka disebut regresi linier berganda. Penulisan model regresi linier berganda untuk n pengamatan data berpasangan , dapat dinyatakan dalam bentuk sebagai berikut.

(2)

306

dengan adalah peubah respon; i adalah1, 2, ..., n; (intersep) adalah titik potong garis regresi dengan sumbu Y; adalah koefisien regresi masing-masing peubah prediktor; adalah peubah-peubah prediktor; adalah sisaan ke-i; adalah banyak peubah prediktor; dan adalah banyak pengamatan (Draper dan Smith, 1981).

2.2 Pengujian Asumsi

Dalam analisis regresi, terdapat beberapa asumsi yang harus dipenuhi agar persamaan regresi yang diperoleh baik dan mampu menggambarkan data yang sebenarnya. Asumsi-asumsi yang harus dipenuhi dalam analisis regresi berganda yaitu (1) Kenormalan galat; (2) Homoskedastisitas (3) Non Autokorelasi; (4) Non Multikolinieritas.

2.3 Pencilan (Outlier)

Pencilan adalah pengamatan yang nilai sisaannya jauh lebih besar daripada sisaan pengamatan lain. Pencilan ini kadang-kadang terletak tiga atau empat simpangan baku, atau lebih jauh lagi dari rata-rata sisaannya. Keberadaan pencilan akan menimbulkan beberapa masalah, diantaranya pencilan akan mengubah atau mengaburkan kesimpulan yang dibuat oleh peneliti karena nilai penduga parameternya bersifat bias (Draper dan Smith, 1992).

Jenis pencilan dibedakan menjadi pencilan berpengaruh dan pencilan tidak berpengaruh. Pencilan berpengaruh merupakan pengamatan (pencilan) yang berpengaruh besar pada tanda dan besar nilai penduga parameter apabila pengamatan (pencilan) dibuang. Pencilan pada peubah prediktor dideteksi menggunakan Nilai Pengaruh (Leverage Value), sedangkan pada peubah respons menggunakan Studentized Deleted Residual (TRES). Pengamatan (pencilan) berpengaruh dapat diketahui menggunakan The Difference in Fit Statistics (DFITS) dan jarak Cook.

2.4 Metode RobustLeast Trimmed Square (LTS)

Salah satu metode pendugaan parameter model regresi terhadap data yang mengandung pencilan adalah metode penduga Least Trimmed Square (LTS). Metode ini merupakan salah satu metode pendugaan parameter pada regresi robust yang kekar terhadap keberadaan pencilan. Metode LTS mempunyai prinsip pendugaan parameter yang sama dengan Metode Kuadrat Terkecil, yaitu meminimumkan jumlah kuadrat galat. Hanya saja pada metode LTS, jumlah kuadrat galat yang diminimumkan adalah jumlah kuadrat galat dari h pengamatan yang dianggap bukan pencilan (Rousseeuw dan Hubert, 1997). Rumus penduga LTS sebagai berikut (Chen, 2002).

̂

= arg min

(1)

dengan adalah jumlah kuadrat galat dari h pengamatan yang telah diurutkan ( ∑ =

) dan h adalah konstanta pemotongan.

Persamaan (1) menunjukkan secara tidak langsung bahwa (n-h) pengamatan dengan galat yang besar tidak akan mempengaruhi penduga parameter model. Nilai h berada pada interval . Nilai h optimal yang digunakan dalam metode LTS adalah sebagai berikut.

[ ] + [ ] atau [ ] + [ ]

dengan p adalah banyak peubah prediktor dan n adalah banyak pengamatan (Wu, 2006).

2.5 Mean Square Error (MSE)

Penduga parameter dikatakan baik apabila memiliki nilai bias dan ragam yang kecil. Oleh karena itu, untuk melihat kebaikan penduga metode LTS dapat dilihat dari nilai Mean Square Error

(MSE). Semakin kecil nilai MSE yang dihasilkan maka semakin baik penduga parameter. Persamaan MSE diperoleh dengan menjumlahkan nilai bias kuadrat dengan varians sebagai berikut (Sembiring, 1995).

∑ ̂ dan ̂ ∑ ̅ ̂

(3)

307

3. METODOLOGI

3.1 Data

Data yang digunakan adalah data hasil bangkitan dengan parameter regresi , , dan sehingga membentuk model regresi linier berganda. Data yang dibangkitkan terdiri dari dua peubah prediktor dan galat yang kemudian digunakan untuk menentukan peubah respon. Peubah prediktor dibangkitkan sesuai model regresi linier berganda.

Data dibangkitkan berdasarkan data sekunder untuk mengetahui pengaruh dosis obat tertentu yang ada dalam hati tikus dengan hipotesis menentukan hubungan antara persentase dosis obat dalam hati tikus (Y) dengan berat badan tikus (X1), berat hati tikus (X2) dan dosis obat relatif (X3) (Weisberg,

1985). Data dibangkitkan dengan ukuran contoh (15, 30, 50, 100, dan 200) dan proporsi pencilan (4% dan 5%) untuk menciptakan pencilan pada data. Setiap kombinasi ukuran contoh dan proporsi pencilan dibangkitkan sebanyak 100 kali (m=100). Hal ini dapat digunakan untuk menganalisis data dengan ukuran contoh dan proporsi pencilan yang berbeda terhadap sifat kebaikan penduga Least Trimmed Square (LTS) dilihat dari nilai Mean Square Error (MSE) dengan prinsip-prinsip simulasi.

3.2 Metode Analisis

Metode analisis yang dilakukan dalam penelitian ini adalah menduga koefisien model regresi linier berganda menggunakan metode Least Trimmed Square (LTS) dengan data hasil bangkitan. Prosedur analisis terhadap data adalah (1) Menetapkan ukuran sampel (n); , , dan dengan ; nilai peubah prediktor X1 pada selang

nilai 144-202, X2pada selang nilai 5.2-9.9 dan pada selang nilai 0.73-0.99. (2)

Membangkitkan

sisaan dari sebaran normal

. (3) Menghitung peubah respons Y. (4) Data bangkitan tersebut dikontaminasi pencilan dengan menggantikan 4% dan 5% data pada peubah prediktor X1, X2

,

dan .

(5) Menghitung kembali peubah respon Y dengan data yang mengandung pencilan. (7) Melakukan pendugaan LTS ( ̂ . (8) Mengulangi pendugaan parameter sebanyak 100 kali dengan ukuran sampel dan nilai parameter yang telah ditetapkan. (9) Menghitung rata-rata nilai penduga parameter, bias dan ragam dari 100 kali pengulangan metode LTS. (10)

Menghitung nilai MSE (bias

2

+var)

untuk melihat kebaikan sifat penduga LTS.

4. HASIL DAN PEMBAHASAN

Penelitian ini menggunakan data simulasi yang dibangkitkan berdasarkan model regresi linier berganda dari data sekunder hasil percobaan penyelidikan sejumlah obat tertentu yang ada dalam hati tikus. Berdasarkan hasil pendeteksian pencilan dan pencilan berpengaruh, dapat diketahui bahwa pencilan berpengaruh terhadap koefisien regresi dan penduga Y ( ̂) karena memiliki nilai jarak Cook

yang lebih besar dari dan nilai DFITS yang lebih besar dari √ . Rata-rata dari 100

penduga parameter LTS untuk setiap kombinasi pencilan dan ukuran contoh disajikan pada Tabel 1.

Tabel 1. Rata-rata penduga parameter menggunakan metode LTS

n Pencilan

(%)

Rata-Rata Penduga Parameter

̂ ̂ ̂ ̂

15 4 0,2626596 -0,02386869 0,01559798 4,18330505

5 0,2626596 -0,02386869 0,01559798 4,18330505

30 4 0,2675404 -0,02222323 0,01527111 4,18025859

5 0,26379495 -0,02314848 0,01547455 4,17345051

50 4 0,26505455 -0,02190808 0,01369576 4,17637071

5 0,2675101 -0,02221616 0,01334646 4,17586566

100 4 0,2654404 -0,02169394 0,01469475 4,17700202

5 0,26690505 -0,02050101 0,01370404 4,17640202

200 4 0,26646465 -0,02166364 0,01392303 4,17701313

(4)

308

Berdasarkan penduga parameter pada tabel 1 maka dapat dibentuk model regresi linier berganda. Misalkan untuk ukuran contoh 15 dengan pencilan 4%:

̂

di mana adalah persentase dosis obat dalam hati tikus ke-i, adalah berat badan tikus ke-i, adalah berat hati tikus ke-i, adalah dosis obat relatif. Persamaan di atas didasarkan pada data simulasi yang menirukan hasil eksperimen pendeteksian komponen obat yang terdapat dalam hati tikus, dengan interpretasi:

a. Setiap kenaikan berat badan tikus sebesar 1g, akan menurunkan persentase dosis obat dalam hati tikus sebesar dengan menganggap berat hati tikus dan dosis obat relatif konstan.

b. Setiap kenaikan berat hati tikus sebesar 1g, akan meningkatkan persentase dosis obat dalam hati tikus sebesar dengan menganggap berat badan tikus dan dosis obat relatif konstan.

c. Setiap kenaikan dosis obat relatif tikus sebesar 1mg/kg berat badan, akan meningkatkan persentase dosis obat dalam hati tikus sebesar dengan menganggap berat badan tikus dan berat hati tikus konstan.

Sifat kebaikan penduga parameter model regresi dapat dilihat berdasarkan nilai bias dan ragam secara bersamaan, maka digunakan Mean Square Error (MSE). Semakin kecil nilai bias, ragam dan MSE penduga maka semakin baik penduga yang dihasilkan. Berdasarkan nilai bias, ragam dan MSE penduga LTS dapat disimpulkan bahwa pertambahan banyaknya pencilan tidak mempengaruhi penduga LTS karena metode pendugaan parameter ini merupakan salah satu alat pada regresi robust. Regresi robust dapat mengurangi pengaruh pencilan pada tanda dan besar nilai penduga parameter jika dibandingkan dengan regresi biasa. Hal ini dikarenakan model regresi yang dihasilkan sesuai dengan sebagian besar data (Kutner, 2004). Sedangkan pertambahan ukuran contoh mempengaruhi penduga LTS. Semakin besar ukuran contoh maka semakin kecil bias, ragam dan MSE penduga.

5. KESIMPULAN

Berdasarkan hasil analisis data dan pembahasan yang telah dilakukan, dapat disimpulkan bahwa Pertambahan banyaknya pencilan tidak mempengaruhi penduga LTS karena penduga ini termasuk penduga yang kekar (robust) terhadap pencilan. Hasil penelitian ini menunjukkan nilai bias penduga LTS yang relatif kecil, akan tetapi ada kecenderungan nilai ragam dan MSE yang semakin besar seiring pertambahan banyaknya pencilan. Sedangkan pertambahan ukuran contoh mempengaruhi penduga LTS karena semakin besar ukuran contoh maka semakin kecil nilai bias, ragam dan MSE penduga.

DAFTAR PUSTAKA

Chen, C., (2002), Robust Regression and Outlier Detection with ROBUSTREG Procedure, SAS Institute Inc.,

http://www.sas.com/proceedings/sugi27/p265-27.pdf,

Tanggal Akses: 2 Februari 2013.

Draper, N. R. dan Smith, H., (1992), Analisis Regresi Terapan, Edisi kedua, Alih bahasa oleh Sumantri, B., PT Gramedia Pustaka Utama, Jakarta.

Kutner, M. H, Nachtsteim, C. J., dan Neter, J., (2004), Applied Linier Statistical Methods, MC Graw Hill Company, Inc, New York.

Sembiring, R. K., (1995), Analisis Regresi, Edisi Kedua, Penerbit ITB, Bandung.

Rousseeuw, P. J. dan Hubert, M., (1997), Recent Development in Progress. Department of Mathematics and Computer Science, U.I.A., Universiteitsplein 1, B-2610 Antwerp, Belgium. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.30.4889, Tanggal Akses: 3 Februari 2013.

Weisberg, S., (1985), Applied Linier Regression, Second Edition, John Wiley and Sons, Canada. Wu, M., (2006), Timmed and Winsorized Estimators, http://www.msu.edu/~wumingxi/Papers/my

Gambar

Tabel 1. Rata-rata penduga parameter menggunakan metode LTS Rata-Rata Penduga Parameter

Referensi

Dokumen terkait

Informan dalam penelitian ini adalah anak- anak sekolah dasar yang mempunyai dan aktif.

Berdasarkan dari hasil pembahasan dapat disimpulkan bahwa pada bahasa Melayu dialek Serawai terdapat relasi semantik kata sebagai berikut: ada 39 pasang sinonim

Setiap Pemegang saham public DVLA yang secara tegas memberikan suara tidak setuju atas rencana Penggabungan Usaha pada saat RUPSLB DVLA dan bermaksud untuk

Hasil wawancara, observasi dan dokumentasi yang dialakukan peneliti dalam mengetahui tentang kompetensi kerja siswa jurusan teknik sepeda motor memperoleh data sebagai

[r]

Ruang lingkup penulisan tugas akhir ini berupa lingkup materi kegiatan perencanaan bangunan pantai pada proyek reklamasi pantai Marina yang dilaksanakan adalah :.. Memprediksi

setiap arsitektur bisnis yang mendukung perusahaan. Perusahaan tidak mendokumentasikan setiap

Hasil penelitian ini menunjukan: (a) Ber-usahatani bawang merah di lokasi penelitian telah dapat memberikan keuntungan bagi petani, namun keuntungan yang diperoleh