MODEL REGRESI KANDUNGAN BATUBARA
MENGGUNAKAN METODE LEAST MEDIAN OF SQUARES
Kankan Parmikanti1, Endang Rusyaman1 dan Emah Suryamah1
1Jurusan Matematika FMIPA Universitas Padjajaran, Jalan Raya Bandung – Sumedang km. 21, Jatinangor
ABSTRAK
MODEL REGRESI KANDUNGAN BATUBARA MENGGUNAKAN METODE LEAST MEDIAN OF SQUARES. Dalam makalah ini akan disajikan suatu metode untuk menentukan model regresi tentang kandungan batubara di lokasi dengan koordinat tertentu. Metode yang dimaksud adalah Least Median of Square (LMS) yaitu salah satu metoda estimasi dalam regresi robust yang bekerja dengan cara meminimumkan nilai median dari error kuadrat hasil dari taksiran parameter melalui Metode Kuadrat Terkecil (MKT). Akan diperlihatkan bagaimana metode ini memperlakukan pencilan yang terdapat dalam data, mengolahnya, dan kemudian mengieliminir pencilan tersebut sebagian demi sebagian melalui suatu proses iterasi. .
Kata kunci: LMS, MKT, pencilan, robust, kuadrat error
ABSTRACT
REGRESSION MODEL FOR COAL CONTENT USING LEAST MEDIAN OF SQUARES METHOD. In this paper presented a method to determine regression model about the coal deposits in a locations with spesific cordinates. The method is the Least Median of Square (LMS) that is estimation methode in robust regression in which work to minimaze the median value of the squared error of estimated parameter results through Least Square Method. It will be shown how this method treats outliers that present in the data, process it, and then eliminate it piecemeal with itteracy process.
Key words: LMS, Least Square Method, outlier, robust, error square
1. PENDAHULUAN
Dalam ilmu statistika, banyak sekali metode yang dapat digunakan untuk menentukan suatu model regresi yang didasarkan pada sekumpulan data. Salah satu metode yang paling banyak dikenal dalam masalah ini adalah Ordinary Least Square (OLS) atau yang lebih dikenal dengan nama Metode Kuadrat Terkecil (MKT).
Namun demikian, syarat bagi metode ini adalah bahwa sisaan atau eror harus berdistribusi normal, tidak terjadi autokorelasi, dan tidak ada pencilan data. Jika data mempunyai beberapa pencilan, maka dengan metode ini pencilan tersebut dibuang begitu saja. Hal ini sangat memungkinkan bahwa data tidak utuh dan sudah tidak mewakili populasi, sehingga model
yang tebentuk menjadi kurang valid.
Dalam banyak kasus, tidak jarang ditemui data yang diperoleh tidak sesuai dengan syarat- syarat di atas, sehingga metode kuadrat terkecil tidak cocok lagi digunakan. Sebagai alternatif metode yang dapat digunakan untuk data yang mengandung pencilan, dalam penelitian ini akan dikaji tentang sebuah metode yang disebut dengan Least Median of Square (LMS) salah satu metoda estimasi dalam regresi robust, di mana dengan metode ini data pencilan yang ada tidak dibuang begitu saja, tetapi diproses dan dieliminasi melalui sebuah iterasi.
Untuk menerapkan algoritma dalam metode ini, akan disajikan sekelompok data yang mengandung pencilan, kemudian diolah dengan metode LMS untuk mendapatkan model
regresinya. Data tersebut adalah produksi batubara pada lokasi tertentu, di mana lokasi tersebut dinyatakan dalam bentuk koordinat.
2. PEMBAHASAN
2.1 Least Median of Squares Estimator (LMS)
Prinsip dasar metode regresi robust penduga Least Median of Squares (LMS) adalah mencocokkan sebagian besar data setelah pencilan teridentifikasi sebagai titik yang tidak berhubungan dengan data (Rosseeuw dan Leroy, 1987). Jika pada MKT hal yang perlu dilakukan adalah meminimumkan kuadrat error ( ), maka pada LMS hal yang perlu dilakukan adalah meminimumkan median kuadrat error, yaitu
dengan adalah kuadrat error hasil taksiran dengan MKT
Untuk mendapatkan nilai M1, dicari himpunan bagian data dari matriks X sejumlah
pengamatan, yaitu :
di mana n adalah banyaknya data, dan p banyaknya parameter ditambah satu, dalam hal ini p=3.
Dalam proses perhitungan, nilai hi harus selalu dalam bentuk bilangan bulat oleh karena itu, jika nilai hi bukan dalam bentuk bilangan bulat maka dilakukan pembulatan ke atas.
Selanjutnya untuk mencari M2, ditentukan himpunan bagian data dari matriks X sejumlah
pengamatan, yaitu :
di mana n = h1 dan p = 3.
Demikian seterusnya, sampai iterasi berahir pada iterasi ke-s yaitu saat hs = hs+1 . Jadi akan diperoleh nilai Mj seperti pada persamaan (1).
Selanjutnya karena LMS merupakan penduga pada regresi robust, maka sama hal nya
dengan penduga lain pada regresi robust, prinsip dasar dari LMS adalah dengan memberikan bobot wiipada data sehingga data pencilan tidak mempengaruhi model parameter taksiran. Bobot wii ditentukan berdasarkan taksiran robust standard deviation yang didapat berdasarkan hasil perhitungan MJ dan .
Berdasarkan Rousseeuw (1987), bobot dirumuskan dengan ketentuan sebagai berikut :
dengan
. (2)
Setelah bobot dihitung, dapat dibentuk matriks W sebagai berikut :
11 12 1
21 22 2
1 2
n n
n n nn
w w w
w w w
w w w
W
(3)
dengan entri matriks wij= 0 , dimana i j. Setelah terbentuk matriks W, maka penaksir parameter regresi LMS dapat dihitung dengan menggunakan rumus
(4)
2.2 Hasil Implementasi
2.2.1. Model Regresi Kandungan Batubara dengan MKT
Analisis data tentang kaitan antara produktifitas/kandungan batubara dengan menggunakan MKT dan dibantu program R, menghasilkan estimasi parameter sebagai berikut:
yang berarti bahwa model regresinya adalah
(5) dengan scatter plot adalah
Gambar 1. Data Batu Bara 208 lokasi
2.2.2. Model Regresi Kandungan Batubara dengan Metode LMS
Untuk menentukan nilai Mj yaitu median dari error kuadrat pada iterasi ke-j, terlebih dahulu dicari nilai error kuadrat dari MKT dengan jumlah pengamatan pada iterasi ke-j.
Dengan demikian pada:
1. Iterasi ke-1 dengan n = 208 diperoleh (lampiran-2) dengan model MKT seperti pada (4). Dengan demikian diperoleh M1 = median { ei2 : i = 1, 2, . . ., 208}
= 4,64604, dan
h1 = = 106.
Artinya pada iterasi ke-2 akan diambil 106 pengamatan yang jarak nilai ei2 ke M1
nya minimum. Dengan kata lain akan dihilangkan sebanyak 102 pengamatan (dalam tabel diberi warna merah) yang jarak ei2 ke M1 nya maksimum.
Scatter plotnya terlihat pada gambar di bawah ini
Gambar 2. Hasil Iterasi 1
2. Iterasi ke-2 dengan n = 106 , melalui MKT diperoleh (lampiran-3), dengan model
Dengan
M2 = median { ei2 : i = 1, 2, . . ., 106}
= 0,117566, dan
h2 = = 55.
Artinya pada iterasi ke-3 akan diambil 55 pengamatan yang jarak nilai ei2 ke M2 nya minimum. Dengan kata lain akan dihilangkan sebanyak 51 pengamatan (dalam tabel diberi warna merah) yang jarak ei2 ke M2 nya maksimum. Scatter plotnya terlihat pada gambar di bawah ini
Gambar 3. Hasil Iterasi 2
3. Iterasi ke-3 dengan n = 55, melalui MKT diperoleh model regresi
dengan sebaran ei2 sebagai berikut No. ei 2 No. ei 2
1 0,0132 14 0,079
2 0,007 15 0,091
3 0,0735 16 0,0265 4 0,0971 17 0,0477 5 0,0934 18 0,165 6 0,0253 19 0,0178 7 0,0495 20 0,0788 8 0,0626 21 0,126 9 0,0892 22 0,096 10 0,1876 23 0,0578 11 0,0588 24 0,1025 12 0,0463 25 0,069 13 0,0001 26 0,0695
No. ei 2 No. ei 2
27 0,05 42 0,0569 28 0,0782 43 0,0211 29 0,1248 44 0,0312 30 0,0903 45 0,1478 31 0,1386 46 0,0573 32 0,1941 47 0,0494 33 0,113 48 0,14 34 0,0867 49 0,1334 35 0,0453 50 0,2938 36 0,0666 51 0,0861 37 0,0214 52 0,0079 38 0,0279 53 0,2626 39 0,1307 54 0,2498 40 0,0694 55 0,2216 41 0,0438
Dengan demikian
M3 = median { ei2 : i = 1, 2, . . ., 55}
= 0,07354, dan
h23 = = 30
(pembulatan ke atas).
Artinya pada iterasi ke-3 akan diambil 30 pengamatan yang jarak nilai ei2 ke M3
nya minimum. Dengan kata lain akan dihilangkan sebanyak 25 pengamatan (dalam tabel diberi warna merah) yang jarak ei2 ke M3 nya maksimum.
Demikian seterusnya sampai iterasi berahir pada iterasi ke-8, karena karena h8 = h9. Hasil dari iterasi ke-8 tersebut adalah 4. Iterasi ke-8 dengan n = 6, melalui MKT
diperoleh model regresi
dengan sebaran ei2 sebagai berikut No. ei2
1 0,0014 2 0,013393 3 0,006959 4 0,015237 5 0,006397 6 0,001465
Dengan demikian
M8 = median { ei2 : i = 1, 2, . . ., 6}
= 0,006678, dan
h8 = = 5.
Scatter plotnya terlihat pada gambar di bawah ini
Gambar 4. Hasil Iterasi 8
Dengan berakhirnya proses iterasi sebanyak delapan kali, maka diperoleh 8 buah nilai Mj yaitu:
M1 4,64604
M2 0,11757
M3 0,07354
M4 0,06623
M5 0,05594
M6 0,02506
M7 0,01213
M8 0,00668
Mj Min 0,00668
2.2.3. Penentuan Parameter Regresi LMS Penentuan parameter regresi LMS didapat berdasarkan hasil perhitungan MJ dan yang kemudian dihitung bobot .
Dengan mensubstitusikan nilai n = 208, p = 3, dan MJ = 0.00668 ke dalam persamaan (2) menghasilkan nilai .
Selanjutnya dengan menggunakan rumus (3) diperoleh nilai penaksir parameter
Dengan demikian model regresi menurut metode LMS adalah
3. KESIMPULAN
Apabila dibandingkan, model regresi hasil metode LMS ini lebih baik dari pada model hasil metode MKT. Dengan demikian metode LMS ini cukup layak untuk dijadikan alternatif dalam mencari model regresi untuk data yang mengandung pencilan.
4. DAFTAR PUSTAKA
1. EFRON, B. dan TIBSHIRANI, R.J , 1993,An Introduction to Bootstrap, Chapman and Hall, London
2. MIDI, H, 2009 , Dynamic Robust Bootstrap Method Based on LTS Estimators,
European Journal of Scientific Research ISSN 1450-216X Vol.32 No.3 (2009), pp.277-287© Euro Journals Publishing, Inc.
2009 ,
http://www.eurojournals.com/ejsr.htm , 2 - 10-2012.
3. REFNIWIDIALISTUTI, 2010,
perbandingan pengaruh pencilan terhadap Penduga Parameter Model Regresi dengan metode MKT dan MM-Robust, Universitas Andalas, Padang.
4. ROUSSEEUW, P.J , 1984 , Least Median of Squares Regression , Jurnal of American Statistical Association , (online) ,
http://web.ipac.caltech.edu/staff/finasci/hom e/statistics_refs/LeastMedianofSquares.pdf , 12/09/2011
5. ROUSSEEUW, P.J and LEROY, A.M, 1987, Robust Regression and Outlier Detection , John Wiley & Sons, Inc , Canada.
6. SOEMARTINI , 2007 , Pencilan (outlier) , (online) ,
http://resources.unpad.ac.id/unpad-content/ . . . /OUTLIER(PENCILAN).pdf , 20/11/2011 7. WEISSTEIN, ERIC, 2007 , Fractional
Derivative ,http://mathworld. wolfram.com /fractionalDerivative.html, Download 10/05/2007.