PENDETEKSIAN PENGAMATAN PENCILAN DAN BERPENGARUH DENGAN METODE PENGARUH LOKAL
GOSEN SITANGGANG
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
BOGOR
2006
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis yang berjudul “Pendeteksian Pengamatan Pencilan dan Berpengaruh dengan Metode Pengaruh Lokal”
adalah karya saya sendiri dan belum diajukan dalam bentuk apapun pada perguruan tinggi manapun. Semua data dan informasi yang dikutip dalam tesis ini telah dinyatakan dengan jelas sumbernya dan dicantumkan dalam daftar pustaka.
Bogor, Desember 2006
Gosen Sitanggang NRP. G151030011
ABSTRAK
GOSEN SITANGGANG. Pendeteksian Pengamatan Pencilan dan Berpengaruh dengan Metode Pengaruh Lokal. Dibimbing oleh BUNAWAN SUNARLIM dan AJI HAMIM WIGENA.
Pemodelan data akan mengalami kesulitan jika terdapat pencilan dan kolinieritas pada data. Kasus pencilan dan kolinieritas ditemui pada pemodelan regresi linier ganda. Penelitian ini difokuskan pada kajian penerapan metode pengaruh lokal dalam regresi linier ganda pada data yang mengandung pencilan dengan dan tanpa kolinieritas.
Suatu pembobot diperoleh dari metode pengaruh lokal yang digunakan untuk mendeteksi pengamatan pencilan dan peubah berpengaruh. Pembobot tersebut ditambahkan terhadap data sehingga diperoleh data terboboti. Model regresi linier ganda dengan data terboboti dapat menurunkan pengaruh pengamatan pencilan, namun masih tetap terdapat kolinieritas. Re gresi komponen utama digunakan untuk mengatasi kolinieritas pada data terboboti dan tanpa terboboti. Model regresi komponen utama dengan data terboboti lebih baik dari pada model regresi komponen utama dengan data tanpa terboboti.
PENDETEKSIAN PENGAMATAN PENCILAN DAN BERPENGARUH DENGAN METODE PENGARUH LOKAL
GOSEN SITANGGANG
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
BOGOR
2006
Judul Tesis : Pendeteksian Pengamatan Pencilan dan Berpengaruh dengan Metode Pengaruh Lokal
Nama : Gosen Sitanggang
NIM : G151030011
Disetujui Komisi Pembimbing
Ir. Bunawan Sunarlim, MS Dr. Ir. Aji Hamim Wigena, M.Sc
Ketua Anggota
Diketahui
Ketua Program Studi Statistika Dekan Sekolah Pascasarjana
Dr.Ir. Aji Hamim Wigena, M.Sc Prof. Dr.Ir. Khairil Anwar Notodiputro, MS
Tanggal Ujian : 19 September 2006 Tanggal Lulus :
PRAKATA
Puji syukur penulis panjatkan kepada Tuhan yang Maha Kuasa, atas berkat dan rahmatNya sehingga karya ilmiah yang berjudul “Pendeteksian Pengamatan Pencilan dan Berpengaruh dengan Metode Pengaruh Lokal” dapat penulis selesaikan.
Terima kasih penulis ucapkan kepada Bapak Ir. Bunawan Sunarlim, MS dan Bapak Dr. Ir. Aji Hamim Wigena, M.Sc selaku dosen pembimbing yang telah memberikan arahan, kritik, saran yang konstruktif dalam setiap konsultasi.
Ungkapan terima kasih juga disampaikan kepada ayah terkenang Soltan Sitanggang (almarhum) dan ibu tercinta Mangara Nelly br. Siagian yang mendidik dan memberikan dukungan doa dan kepada seluruh keluarga terima kasih atas doa dan dukungannya. Tuhan YESUS Memberkati kita.
Semoga karya ilmiah ini bermanfaat.
Bogor, Desember 2006 Gosen Sitanggang
© Hak cipta milik Institut Pertanian Bogor, tahun 2006 Hak cipta dilindungi
Dilarang mengutip dan memperbanyak tanpa izin tertulis dari Institut Pertanian Bogor, sebagian atau seluruhnya dalam Bentuk apa pun, baik cetak, fotokopi, mikrofilm, dan sebagainya
RIWAYAT HIDUP
Penulis dilahirkan di Rambebelang pada tanggal 08 Agustus 1977. Anak dari Soltan Sitanggang (almarhum) dan Mangara Nelly br. Siagian. Penulis merupakan putra ke-8 dari 9 bersaudara.
Penulis menyelesaikan Pendidikan Sekolah Dasar dan Sekolah Menengah Pertama di Rambebelang Provinsi Sumatera Utara, kemudian melanjutkan pendidikan di Sekolah Menengah Atas (SMA) Bina Kusuma Jakarta, lulus pada tahun 1995. Pada tahun yang sama penulis diterima di jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Riau, melalui jalur UMPTN. Kesempatan untuk melanjutkan pendidikan pada Sekolah Pascasarjana Institut Pertanian Bogor (IPB) diperoleh pada tahun 2003. Beasiswa pendidikan pascasarjana diperoleh dari Beasiswa BPPS-DIKTI.
DAFTAR ISI
Halaman
DAFTAR TABEL ... x
DAFTAR GAMBAR ... xi
DAFTAR LAMPIRAN ... xiii
PENDAHULUAN Latar Belakang ... 1
Tujuan Penelitian ... 3
TNJAUAN PUSTAKA Model Regresi Linier Ganda... 4
Kolinieritas ... 4
Pendeteksian Pencilan ... 5
Pendeteksian Pengamatan Berpengaruh ... 6
Pengaruh Lokal ... 6
Pendeteksian Peubah Berpengaruh ... 9
Pendeteksian Pengamatan Pencilan dan Berpengaruh ... 9
Regresi Komponen Utama ... 10
DATA DAN METODE Data ... 12
Metode ... 12
HASIL DAN PEMBAHASAN Data Konsentrasi Lemak Ikan ... 14
Pendugaan Model ... 14
Pendeteksian Pencilan dengan hii dan R-Student ... 14
Pendeteksian Pengamatan Berpengaruh dengan DFFITS dan Cook’s D ... 15
Pendeteksian Pencilan dengan Metode Pengaruh lokal ... 16
Pendugaan Model Terboboti ... 18
Regresi Komponen Utama dengan Data Tanpa Terboboti... 20
Regresi Komponen Utama dengan Data Terboboti ... 20
Data dengan Pembobotan ... 21
Data Peubah Ekonomi dan Peubah Kesejahteraan Rakyat ... 26
Pendugaan Model ... 26
Pendeteksian Pencilan dengan hii dan R_Student ... 26
Pendeteksian Pengamatan Berpengaruh dengan DFFITS dan Cook’s D ... 28
Pendeteksian Pencilan dengan Metode Pengaruh Lokal ... 29
Model Terboboti ... 31
Regresi Komponen Utama Data Terboboti ... 32
KESIMPULAN ... 35 DAFTAR PUSTAKA ... 36 LAMPIRAN ... 38
x
DAFTAR TABEL
Halaman 1 Akar ciri matriks Xs`Xs dari data konsentrasi lemak ikan ... 16 2 Vektor ciri matriks Xs`Xs dari data konsentrasi lemak ikan ... 17 3 Penduga koefisien regresi komponen utama dari data konsentrasi
lemak ikan ... 20 4 Akar ciri matriks Xs`Xs dari data konsentrasi lemak ikan
terboboti ... 21 5 Penduga koefisien regresi komponen utama dari data konsentrasi
lemak ikan terboboti ... 21 6 Perbandingan nilai y aktual , yˆ dari data terboboti dan yˆ dari
data tanpa terboboti pada pembelajaran konsentrasi lemak ikan .... 25 7 Akar ciri matriks Xs`Xs dari data kesejahteraan rakyat ... 29 8 Vektor ciri matriks Xs`Xs dari data kesejahteraan rakyat ... 29 9 Perbandingan yˆ dari data terboboti dan yˆ dari data tanpa
terboboti data kesejahteraan rakyat... 33
xi
DAFTAR GAMBAR
Halaman 1 Pencilan berdasarkan hii dari data konsentrasi lemak ikan ... 14 2 Pencilan berdasarkan R_Student dari data konsentrasi lemak ikan ... 15 3 Pengamatan berpengaruh berdasarkan nilai DFFITS dari data
konsentrasi lemak ikan... 15 4 Pengamatan berpengaruh berdasarkan Cook’s D dari data konsentrasi
lemak ikan ... 16 5 Peubah berpengaruh berdasarkan nilai [ ]ß
vmax dari data konsentrasi
lemak ikan... 17 6 Pencilan berdasarkan nilai Ci dari data konsentrasi lemak ikan ... 18 7 Pengamatan berpengaruh berdasarkan Cook’s D dari data konsentrasi
lemak ikan terboboti ... 19 8 Peubah berpengaruh berdasarkan [ ]ß
vmax dari data konsentrasi lemak
ikan terboboti ... 20 9 Plot nilai yˆ dengan y aktual dari data konsentrasi lemak ikan ... 22 10 Plot nilai yˆ dengan nomor pengamatan dari data konsentrasi lemak
ikan ... 23 11 Plot nilaiyˆ dengan y aktual dari data pembelajaran konsentrasi lemak
ikan ... 24 12 Plot nilai yˆ dengan nomor pengamatan dari data pembelajaran
konsentrasi lemak ikan ... 24 13 Plot nilai yˆ dengan y aktual data validasi konsentrasi lemak ikan .. 25 14 Plot nilai yˆ dengan nomor pengamatan dari data validasi konsentrasi
lemak ikan ... 26 15 Pencilan berdasarkan nilai hii dari data kesejahteraan rakyat ... 27 16 Pencilan berdasarkan nilai R_Student data kesejahteraan rakyat ... 27 17 Pengamatan berpengaruh berdasarkan nilai DFFITS dari data
kesejahteraan rakyat ... 28 18 Pengamatan berpengaruh berdasarkan nilai Cook’s D dari data
kesejahteraan rakyat ... 28 19 Peubah berpengaruh berdasarkan [ ]ß
vmax dari data kesejahteraan
rakyat ... 30
xii 20 Pencilan berdasarkan nilai Ci data kesejahteraan rakyat ... 31 21 Peubah berpengaruh berdasarkan nilai [ ]ß
vmax data kesejahteraan
rakyat terboboti ... 32 22 Plot nilai yˆ dengan nilai y aktual dari data kesejahteraan rakyat ... 33 23 Plot nilai y aktual, nilai yˆ dengan nomor pengamatan dari data
kesejahteraan rakyat ... 34
xiii
DAFTAR LAMPIRAN
Halaman 1 Data konsentrasi lemak ikan ... 38 2 Data peubah ekonomi dan peubah kesejahteraan rakyat dari 27
Provinsi di Indonesai tahun 1995 ... 39 3 Nilai T_Student, hii, Cook’s D, DFFITS dari data konsentrasi
lemak ikan ... 40 4 Hasil standarisasi dari data konsentrasi lemak ikan ... 41 5 Nilai [ ]ß
vmax dari data konsentrasi lemak ikan ... 42 6 Pembobot dari data konsentrasi lemak ikan ... 43 7 Nilai T_Student, hii, Cook’s D, DFFITS dari data peubah
ekonomi dan peubah kesejahteraan rakyat ... 44 8 Hasil standarisasi peubah ekonomi dan peubah kesejahteraan
rakyat ... 45 9 Nilai [ ]ß
vmax dari data Peubah ekonomi dan peubah kesejahteraan
rakyat ... 46 10 Pembobot dari data peubah ekonomi dan peubah kesejahteraan
rakyat ... 47 11 Program pendeteksian pengamatan pencilan dan berpengaruh dengan
menggunakan SAS IML ... 48
PENDAHULUAN
Latar Belakang
Masalah pendugaan parameter dalam analisis regresi ganda sering menjadi topik yang menarik untuk dibahas. Beberapa masalah yang timbul dalam analisis regresi ganda diantaranya gugus data yang mengandung pengamatan ekstrim atau pencilan dan kolinieritas.
Dalam analisis regresi ganda, hubungan antara dua atau lebih peubah bebas sering menjadi masalah. Peubah bebas yang saling berkorelasi disebut kolinieritas ganda (multicollinearity). Kolinieritas menimbulkan masalah dalam pemodelan regresi yaitu : (a) terjadi perubahan besar koefisien regresi dugaan bila suatu peubah bebas ditambah atau dibuang, atau bila suatu amatan diubah atau dibuang, (b) tanda koefisien regresi dugaan yang diperoleh bertentangan dengan yang diharapkan berdasarkan pertimbangan teoritis atau pengalaman sebelumnya, (c) uji- uji individu terhadap koefisien regresi bagi peubah bebas memberikan hasil yang tidak nyata (Neter et al.1990).
Seringkali juga di dalam penerapan analisis regresi, gugus datanya mengandung satu atau lebih kasus pengamatan pencilan, artinya pengamatan tersebut terpisah jelas dari kumpulan data lainnya. Kasus pencilan ini diperoleh dari hasil pengukuran tetapi mungkin saja diperoleh dari kesalahan pencatatan, kesalahan pengukuran atau kesalahan alat yang menghasilkan sisaan besar dan sering mempunyai pengaruh yang dramatis terhadap fungsi regresi. Oleh karena itu, sangat penting untuk menyelidiki pengamatan pencilan secara seksama dan kemudian memutuskan apakah pengamatan tersebut harus dibuang atau masih dapat dipertahankan. Setelah mengidentifikasi pengamatan pencilan, langkah selanjutnya adalah memastikan apakah pengamatan pencilan itu berpengaruh atau tidak berpengaruh. Suatu pengamatan akan berpengaruh jika penidaksertaan pengamatan ini akan menyebabkan perubahan besar pada dugaan fungsi regresi (Aunuddin 1989).
Pendeteksian pencilan pada model regresi satu peubah bebas dan satu peubah respon dapat dilakukan berdasarkan (a) diagram pencar atau (b) sisaan baku.
Untuk model regresi linier ganda dengan satu peubah respon dan lebih dari satu
2
peubah bebas, pendeteksian pencilan dilakukan berdasarkan leverage, yakni pencilan ditinjau dari nilai x. Cara lainnya yaitu berdasarkan studentized deleted residual (Neter et al.1990). Pendeteksian pencilan pada regresi ridge dapat dilakukan berdasarkan nilai leverage dan nilai R_Student (Masri 1999). Pada model regresi kuadrat terkecil parsial, pendeteksian pencilan dilakukan: (a) berdasarkan jarak Euclide dari setiap pengamatan terhadap model, baik terhadap x (dmodx) maupun terhadap y (dmody), (b) nilai leverage, (c) Fratio dan Studentized residual (Antou 2000). Sementara itu pendeteksian pencilan juga dapat dilakukan dengan mempertimbangkan pengaruh lokal (Littell et al. 2003)
Teknik pengaruh lokal diperkenalkan oleh Cook (1986) sebagai perangkat diagnosis untuk kemungkinan maksimum. Metode pengaruh lokal mengasilkan suatu pembobot. Pembobot tersebut digunakan untuk mendeteksi pengamatan pencilan dan peubah berpengaruh. Jika pembobot tersebut ditambahkan kedalam data akan diperoleh data terboboti yang tidak mengandung pencilan, namun kolinieritas masih tetap ada dalam data.
Pembobotan dalam teknik pengaruh lokal berbeda dengan pembobotan Tukey.
Pembobotan pada teknik pengaruh lokal adalah pembobotan terhadap peubah bebas yang digunakan untuk mengatasi pencilan, sedangkan pembobotan Tukey adalah pembobotan terhadap peubah respon yang digunakan apabila hubungan regresi yang tepat telah ditemukan namun ternyata ragamnya tidak homogen.
Pembobotan Tukey sulit dilakukan apabila ragam sisaannya berubah- ubah tidak sejalan dengan berubahnya suatu peubah bebas dalam pola yang tidak teratur (Neter et al.1990).
Salah satu metode untuk mengatasi kolinieritas adalah regresi komponen utama. Teknik pengaruh lokal diterapkan pada data kolinieritas untuk menurunkan pengaruh pengamatan pencilan dan selanjutnya digunakan regresi komponen utama untuk menghilangkan kolinieritas, sehingga diperoleh model yang lebih baik.
Liu (2000) menggunakan metode pengaruh lokal dalam model regresi linier eliptik lebih dari satu peubah respon untuk mengkaji pengamatan berpengaruh. Hossain dan Islam (2003) menggunakan metode pengaruh lokal dalam mengkaji pengamatan berpengaruh dalam regresi linier logistik, dan
3
Molenberghs (2004) mengkaji pencilan pada data hilang (missing data) dengan metode pengaruh lokal.
Tujuan Penelitian
Penelitian ini bertujuan mengkaji metode pengaruh lokal untuk mendeteksi pengamatan pencilan dan peubah bebas berpengaruh, mengkaji suatu pembobot yang diperoleh dari metode pengaruh lokal untuk mengatasi pengamatan pencilan dan menerapkan regresi komponen utama untuk mengatasi kolinieritas dalam regresi linier ganda.
TINJAUAN PUSTAKA
Model Regresi Linier Ganda
Hubungan antara y dan X dalam model regresi linier umum adalah
y = Xß + e (1)
dengan y merupakan vektor pengamatan pada peubah respon (peubah tak bebas) berukuran (n x 1) dan X adalah matriks berukuran (n x p) dengan p peubah bebas dan n pengamatan, ßadalah vektor koefisien regresi (parameter) berukuran (p x 1) dan ε adalah vektor sisaan berukuran (n x 1). Model regresi linier umum memiliki asumsi bahwa: (1) ε merupakan suatu peubah acak, i ε ~ N(0,i σ2), (2) ε dan i ε tidak berkorelasi, sehingga ragam-peragam (j ε ,i ε ) = 0, dengan i j ≠j (Draper & Smith 1981).
Metode kuadrat terkecil sering digunakan untuk menduga parameter.
Penduga yang dihasilkan metode kuadrat terkecil tidak berbias, terbaik dan konsisten. Ragam penduganya bernilai minimum dibandingkan dengan ragam penduga tak bias lainnya. Penggunaan metode kuadrat terkecil ini peka terhadap penyimpangan asumsi-asumsi yang diperlukan, sehingga adanya pengamatan pencilan dalam data dapat mengakibatkan persamaan regresi yang diperoleh memiliki penduga yang tidak tepat (Aunuddin 1989)
Kolinieritas
Kolinieritas pada regresi linier ganda terjadi karena adanya korelasi yang cukup tinggi di antara peubah bebas. Suatu metode formal untuk mendeteksi adanya kolinieritas adalah Variance Inflation Factors (VIF). VIF merupakan faktor yang mengukur seberapa besar kenaikan ragam koefisien regresi dugaan bk
dibandingkan terhadap peubah bebas lainnya yang saling ortogonal. VIF diformulasikan dalam bentuk :
VIFk =
) 1 (
1
2
Rk
− (Fox dan Monette 1992)
5
dengan R adalah koefisien determinasi dari peubah bebas Xk2 k diregresikan terhadap semua peubah bebas X yang lainnya di dalam model. Nilai VIF yang lebih besar dari 10 mengindikasikan bahwa terjadi kolinieritas dalam data (Neter et al. 1990).
Pendeteksian Pencilan
Pendeteksian pengamatan pencilan terhadap nilai- nilai X dapat digunakan matriks H (hat matrix) yang didefinisikan sebagai :
H = X(X’X)-1 X’ (2)
Unsur ke- i pada diagonal utama matriks H dinamakan h . Unsur diagonal ii h di ii dalam matriks H dapat diperoleh dari
h = ii xi' (X’X)-1 x i (3) nilai h berkisar antara 0 dan 1, dan ii
∑
= n i
hii 1
= p, dengan p adalah banyaknya koefisien regresi di dalam fungsi termasuk konstanta (intercept) (Neter et al.
1990). Unsur diagonal h dinamakan leverage ke- i yang merupakan ukuran jarak ii antara nilai X untuk pengamatan ke- i dan rataan X untuk semua pengamatan.
Nilai h yang lebih besar dari 2p/n dinyatakan sebagai pengamatan pencilan dan ii berpengaruh. Nilai h yang semakin besar menunjukkan semakin besar ii potensinya untuk berpengaruh (Aunuddin 1989).
Pendeteksian pencilan juga dapat dilakukan dengan menggunakan nilai R- student (externally studentized residual) yang didefinisikan sebagai :
t i =
ii i
i i
h s
y y
−
−
− 1
ˆ
) (
(4)
dengan yi adalah nilai peubah respon pada pengamatan ke-i, yˆ adalah nilai i dugaan ypada pengamatan ke- i, s(-i) merupakan dugaan simpangan baku tanpa pengamatan ke- i. R-student menyebar mengikuti sebaran t-student dengan derajat bebas (n-p-1). Suatu pengamatan dikatakan pencilan jika t > t(n-p-1;α/2) dalam taraf nyata α (Myers 1990).
6
Pendeteksian Pengamatan Berpengaruh
Pendeteksian pengamatan berpengaruh ditentukan berdasarkan nilai DFFITS dan Cook’s D. Nilai DFFITSi merupakan suatu ukuran pengaruh yang ditimbulkan oleh pengamatan ke-i terhadap nilai dugaan yˆ apabila pengamatan i ke-i dihapus. Nilai DFFITSi diperoleh dari rumus berikut :
(DFFITS)i =
ii i)
(
i , i i
h 1 s
y y
−
−
−
ˆ −
ˆ
(5)
dengan yˆi,−i adalah nilai dugaan yi tanpa pengamatan ke–i. Suatu pengamatan dikatakan berpengaruh apabila nilai
2 / 1
2
> n DFFITS p
i (Myers 1990).
Cook’s D merupakan suatu ukuran pengaruh pengamatan ke- i terhadap semua koefisien regresi dugaan. Pada Cook’s D, pengaruh pengamatan ke- i diukur oleh jarak Di. Jarak tersebut diperoleh dari rumus berikut :
Di =
( ) ( )( )
ps2
1 1' X' X b b b
b− − − −
(6) dengan b-i adalah vektor koefisien regresi dugaan tanpa pengamatan ke-i, b adalah vektor koefisien regresi dugaan termasuk pengamatan ke-i, p merupakan banyaknya parameter regresi di dalam model termasuk konstanta. Suatu pengamatan merupakan pengamatan berpengaruh apabila mempunya i nilai D >
F(p; n-p; α) dengan taraf nyata α (Myers 1990).
Pengaruh Lokal
Teknik pengaruh lokal diperkenalkan oleh Cook (1986) sebagai alat diagnosis umum untuk metode kemungkinan maksimum. Pada regresi linier ganda, metode pengaruh lokal berbeda dengan metode penghapusan (Cook’s D).
Metode pengaruh lokal digunakan untuk menaksir dampak pembobotan di titik pengamatan tertentu dalam suatu model, sedangkan Cook’s D menaksir dampak pengahapusan di titik pengamatan tertentu dalam suatu model. Metode pengaruh lokal menyatakan bahwa pengamatan yang pembobotnya lebih besar adalah pengamatan paling berpengaruh.
7
Misalkan βˆ merupakan penduga kemungkinan maksimum dari model regresi linier ganda dari persamaan (1), yang diperoleh dari fungsi kemungkinan maksimum L (β;y). Misalkan W adalah matriks pembobot berukuran n x p dituliskan sebagai berikut :
W =
+
− +
+
− +
+
pn n
n n
n p n
n p n
n
w w
w w
w w
w
w w
w w
L M O
M
L L
L
3 2
2 ) 1 ( 2
2
1 ) 1 ( 1
2 1 1
Pembobot W dimasukkan ke dalam model sehingga model regresi linier ganda menjadi
y = (X+ W)ß + e (7) Misalkan βˆw merupakan penduga kemungkinan maksimum dari persamaan (7) yang diperoleh dari kemungkinan maksimum Lw (β;y). Misalkan dalam ruang pembobot terdapat pembobot yang tidak berarti w0 (pembobot nol) sehingga
w0
L (β;y) = L (β;y), dengan demikian pembobot dapat ditulis sebagai w = w0 + a v (8) dengan v mewakili arah vektor dan a mewakili jarak w dari w0.
Ukuran dari pembobot dinya takan sebagai
||w – w0|| = |a| (9) Ukuran dari pembobot pada pendugaan kemungkinan maksimum adalah perpindahan kemungkinan (LD) :
LD (w) = 2 [L (βˆ;y) – L (βˆw; y)] (10) fungsinya mencapai nilai minimum nol pada pembobot nol. Penerapan pendekatan deret taylor orde kedua pada persamaan 10 menghasilkan
LD(w) ≈ ½ a2 v’ A&& v (11) dengan A&&
0 2
' ) ˆ ; 2 (
w w
y L w
∂
∂
= ∂ β , dengan |0 dinotasikan evaluasi pada β = βˆ, w = w0
v’ A&& v adalah matriks kuadrat yang menyatakan kurva normal dari grafik pengaruh di w0 mengarah ke v yang merupakan ukuran pembobot. Jika kurva mengarah ke v1, t kali lebih besar mengarah ke v2 , maka pembobot w = w0 + av1 , t kali lebih besar dibandingkan pembobot w = w0 + av2, oleh karena itu suatu
8
pembobot dikatakan berpengaruh jika pembobot pengamatan tersebut lebih besar dibandingkan pembobot pengamatan lainnya. C[maxβ] yang merupakan kurva terbesar yang bersesuaian dengan arah [ ]β
vmax, dapat dicari dengan menggunakan vektor ciri (eigenvector) dan akar ciri (eigenvalue) dari matriks A&& .
Matriks A&& mempunyai r ≤ minimum (p,q) akar ciri λ1 ≥ λ2 ≥ . . . ≥ λr ≥ 0 yang tidak nol, yang bersesuaian dengan vektor ciri v1, v2, . . ., vr dengan p adalah banyaknya peubah bebas dan q = n x p. Kurva terbesar adalah C[maxβ] = λ1, yang bersesuaian dengan arah [ ]β
vmax = v1. Kurva terbesar kedua adalah λ2 yang bersesuaian dengan arah v2, atau dapat ditulis kurva terbesar ke-r adalah λr yang bersesuaian dengan arah vr.
Untuk memperoleh pengaruh pada βˆ, Cook (1986) menunjukkan bahwa matriks A&&[ ]β yang berukuran np x np adalah :
[ ]β
A&& = 2 (Ip ⊗ r - βˆ ⊗ X) ((X’X)-1 ⊗ r’ - βˆ’ ⊗ (X’X)-1 X’) / σ2 (12) dengan ⊗ menunjukkan perkalian kronecker.
Matriks A&&[ ]β mempunyai p akar ciri yang tidak nol yaitu :
[ ]β
λj = 2 (n/δp-j+1 + ||βˆ ||2 / σ2 ), j = 1,2, …, p (13) dengan δj adalah akar ciri ke-j dari X’X. Untuk j = 1 diperoleh λj[ ]β = [ ]β
Cmax
[ ]β
Cmax = 2 (n/δj + ||βˆ||2 /σˆ2 ) (14) Matriks A&&[ ]β mempunyai p vektor ciri yang bersesuaian dengan akar ciri didefinisikan sebagai berikut :
[ ]ß
vj ∝ ϕp-j+1 ⊗ r - βˆ ⊗ X ϕp-j+1, dengan j = 1,2, …, p (15) dengan ϕj adalah vektor ciri ke-j dari X’X dan vektor Zj = Xϕj merupakan komponen utama ke-j. Komponen ini menjelaskan bagian terbesar dari keragaman yang dikandung oleh data. Komponen Z yang lain menjelaskan proporsi keragaman yang semakin kecil sampai semua keragaman datanya terjelaskan.
Untuk j = 1 maka v[ ]βj = [ ]β
vmax [ ]β
vmax ∝ ϕp ⊗ r - ߈ ⊗ Zp (16)
9
plot [ ]β
vmax terhadap nomor pengamatan akan mengidentifikasi xij yang paling berpengaruh terhadp ߈ berdasarkan pencaran data yang jauh dari titik nol.
Misalkan Wmax[ ]β dinotasikan sebagai ukuran pembobot dengan definisi :
[ ]β
Wmax ∝ [ϕp1 r - βˆ1 Zp ϕp2 r - βˆ2 Zp …. ϕpp r - βp Zp] (17) wij dari Wmax[ ]β berpengaruh jika pengamatan ke-i sebuah pencilan (|ri| besar) atau mempunyai leverage yang besar (|zpi| besar). Pembobot yang ditambahkan pada data dapat mengub ah penduga koefisien regresi linier ganda (Lesaffre & Verbeke 1998).
Pendeteksian Peubah Berpengaruh Nilai [ ]β
vmax digunakan untuk mendeteksi adanya peubah bebas berpengaruh. Nilai xij pada [ ]β
vmax yang semakin besar menunjukkan semakin besar potensi peubah bebas ke-j untuk berpengaruh. Suatu peubah bebas dikatakan berpengaruh apabila nilai [ ]β
vmax untuk pengamatan tersebut lebih besar dari
q
1 , dengan q menyatakan banyaknya anggota [ ]β
vmax dalam model yaitu sebesar n x p (Littell at al. 2003).
Pendeteksian Pengamatan Pencilan dan Berpengaruh
Pendeteksian pengamatan pencilan pada peubah bebas berpengaruh didasarkan oleh besarnya pengaruh dari setiap pengamatan (Ci) yang didefinisikan sebagai berikut :
Ci =
∑
= r j
ji j 1
2 λ ν2 , i= 1, 2, …, n (18)
dengan λ dan j ν akar ciri dan vektor ciri dari matriks ji A&&[ ]β (Zhu & Zhang 2004).
10
Suatu pengamatan dikatakan berpengaruh apabila ukuran pengaruh pengamatan (Ci) lebih besar dari
∑
= n i
i
n C
1
2 dengan n banyaknya pengamatan (Lesaffre & Verbeke 1998).
Regresi Komponen Utama
Regresi komponen utama merupakan salah satu metode untuk mengatasi masalah kolinieritas dalam data. Regresi komponen utama bermula dari analisis komponen utama pada peubah bebas yang akan menghasilkan komponen- komponen utama dari peubah bebas yang saling ortogonal. Komponen utama inilah yang kemudian diperlukan sebagai peubah bebas. Masing- masing komponen utama tidak berkorelasi sehingga tidak ada kolinieritas diantara komponen utama tersebut. Jika semua komponen utama diikutkan dalam regresi komponen utama, model yang dihasilkan ekuivalen dengan metode kuadrat terkecil, namun varian penduga yang besar akibat multikolinieritas tidak tereduksi. Untuk mereduksi varian tersebut tidak semua komponen utama diikutkan dalam regresi komponen utama. Berikut ini algoritma dari regresi komponen utama (Jolliffe 1986) :
a. Menentukan peubah Xs hasil dari standarisasi peubah X.
j j ij
ij S
X
Xs X −
= , i = 1,2,3, . . . , n dan j = 1,2,3, . . . , p.
b. Menentukan akar ciri dari persamaan |Xs’Xs - λI| = 0.
c. Menentukan nilai vektor ciri ϕj dari setiap akar ciri λj melalui persamaan (Xs’Xs-λjI) ϕj = 0.
d. Menentukan komponen utama Zj melalui prosedur seleksi akar ciri λj, Zj = ϕ1j Xs1 + ϕ2j Xs2 + . . . + ϕrj Xsr, di mana r < p dan r adalah banyaknya komponen yang terpilih.
e. Regresikan komponen utama Z1, Z2, Z3, . . . , Zr dengan peubah respon y.
f. Menghitung nilai yˆ
11
g. Melakukan transformasi model regresi dari yˆ = f (Z) ke yˆ = f (Xs) melalui suatu hubungan b = ϕj * a
b = adalah penduga koefisien regresi yˆ = f (Z) a = adalah penduga koefisien regresi yˆ = f (Xs) ϕj = adalah vektor ciri dari komponen yang ke-j
DATA DAN METODE
Data
Data yang digunakan dalam penelitian ini terdiri atas dua data sekunder.
Data pertama berasal dari Journal Technometrics (Naes 1985), tentang konsentrasi lemak ikan. Terdapat 45 contoh konsentrasi lemak ikan dan absorbannya dari sembilan panjang gelombang yang diukur dengan spektrofotometer NIR. Konsentrasi lemak ikan (%) sebagai peubah respon y dan absorban-absorbannya sebagai peubah bebas X. Diantara peubah bebas tersebut terdapat kolinieritas.
Data kedua tentang peubah ekonomi dan peubah kesejahteraan rakyat disetiap provinsi di Indonesia (Simamora 2002). Ukuran sampel 27 provinsi dan terdiri atas satu peubah respon y yaitu angka kematian bayi per 1000 kelahiran, dan sembilan peubah bebas X yaitu : X1 = Persentase Produk Domestik Regional Bruto (PDRB) sektor industri, X2 = Persentase PDRB sektor pertanian, X3 = Persentase pekerja sektor industri, X4 = Persentase pekerja sektor lainnya, X5 = Persentase pekerja keluarga, X6 = Persentase penduduk dengan pengeluaran di atas upah minimum regional per kapita per bulan, X7 = Angka kelahiran total, X8
= Angka harapan hidup waktu lahir, X9 = Beban tanggungan anak. Diantara peubah bebas tersebut tidak ada kolinieritas.
Metode
Penerapan metode pengaruh lokal dilakukan pada setiap gugus data dengan langkah – langkah sebagai berikut :
1. Menentukan nilai penduga koefisien regresi β dengan metode kuadrat terkecil.
2. Menentukan pencilan berdasarkan nilai h dan R-student, serta pengamatan ii berpengaruh berdasarkan nilai DFFITS dan Cook’s D.
3. Melakukan pemusatan terhadap vektor y menjadi ys dan pembakuan terhadap matriks X menjadi Xs untuk menghilangkan konstanta dalam regresi linier ganda.
4. Menentukan akar ciri dan vektor ciri dari Xs’Xs.
13
5. Menentukan nilai dugaan koefisien regresi dan sisaan, dengan meregresikan ys terhadap Xs.
6. Menentukan komponen utama Zj. 7. Menentukan [ ]β
vmax. 8. Membuat plot [ ]β
vmaxdengan nomor pengamatan, untuk menentukan peubah berpengaruh.
9. Menentukan ukuran pengaruh (Ci) dari setiap pengamatan.
10. Menentukan pengamatan pencilan dan berpengaruh berdasarkan nilai Ci. 11. Menentukan nilai W.
12. Regresikan y = (X+W) ß + e , kemudian periksa apakah model sudah baik atau masih ada kolinieritas.
13. Lakukan regresi komponen utama apabila ditemukan kolinieritas.
14. Uji kebaikan model dengan RMSE (Root Mean Square Error) yang diformulasikan sebagai berikut :
RMSE =
( )
n y
n
y
i∑ i i
=
−
1
ˆ
215. Menentukan korelasi antara y aktual dan yˆ yang diformulasikan sebagai berikut :
y
ryˆ =
( ) ( )
( ) ( )
∑
∑
=
=
−
−
−
−
n
i i i
i n
i i
y y y y
y y y y
1
2 2 1
ˆ ˆ
ˆ ˆ
Pendeteksian pencilan dan pengamatan berpengaruh menggunakan paket program SAS/IML, MINITAB 13 dan Excel.
HASIL DAN PEMBAHASAN
Data Konsentrasi Lemak Ikan
Pendugaan Model
Hasil analisis regresi dengan menggunakan metode kuadrat terkecil terhadap data pada Lampiran 1 adalah sebagai berikut :
yˆ = 30.44 + 27.54X1 – 47.76X2 + 13.14X3 – 64.68X4 - 52.06X5 – 1081.58X6 + 1077.88X7 + 8.63X8 + 155.17X9.
dengan nilai koefisien determinasi (R2) sebesar 92.7 %, simpangan baku sebesar 1.23 dan PRESS sebesar 173.79. Nilai VIF dari setiap peubah bebas lebih besar dari 10 menunjukkan adanya kolinieritas antar peubah bebas.
Pemeriksaan terhadap asumsi kenormalan dilakukan dengan uji formal Anderson-Darling. Hasil uji kenormalan menunjukkan bahwa asumsi kenormalan dipenuhi karena nilai P-Value sebesar 0.446 lebih besar dari 0.01.
Pendeteksian Pencilan dengan hii dan R_Student
Analisis regresi dengan metode kuadrat terkecil terhadap data pada Lampiran 1 menghasilkan ukuran pencilan dan pengamatan berpengaruh pada Lampiran 3. Ukuran pencilan berdasarkan nilai hii (Gambar 1) menunjukkan bahwa pengamatan ke-43, 44 dan 45 merupakan pengamatan pencilan karena nilai hii pengamatan tersebut melebihi batas kritis 2p/n = 0.44.
45 4344
0 0,111 0,222 0,333 0,444 0,555 0,666 0,777
0 5 10 15 20 25 30 35 40 45 50
Nomor Pengamatan
hii
Gambar 1 Pencilan berdasarkan hii dari data konsentrasi lemak ikan
15
Sementara itu berdasarkan nilai R_Student, pengamatan ke-1, 32, 43 dan 44 merupakan pencilan karena nilai mutlak R_Student pengamatan tersebut melebihi batas kritis t > t(n-p-1;α/2)) = 1.69 pada taraf nyata 5% (Gambar 2).
43 1
44 32
-5,07 -3,38 -1,69 0 1,69 3,38 5,07 6,76
0 5 10 15 20 25 30 35 40 45
Nomor Pengamatan
R_Student
Gambar 2 Pencilan berdasarkan R_Student data konsentrasi lemak ikan Berdasarkan nilai leverage dan R-Student pengamatan ke-1, 32, 43, 44 dan 45 merupakan pengamatan pencilan.
Pendeteksian Pengamatan Berpengaruh dengan DFFITS dan Cook’s D Berdasarkan nilai DFFITS pengamatan ke- 1, 43, 44, dan 45 merupakan pengamatan berpengaruh karena nilai DFFITS pengamatan tersebut melebihi batas kritis
2 / 1
2
n
p = 0.942, seperti terlihat pada Gambar 3.
1 45
43 44
-6 -4,5 -3 -1,5 0 1,5 3 4,5 6 7,5
0 5 10 15 20 25 30 35 40 45
Nomor Pengamatan
DFFITS
Gambar 3 Pengamatan berpengaruh berdasarkan nilai DFFITS data dari konsentrasi lemak ikan
16
Berdasarkan nilai Cook’s D pengamatan ke-44 merupakan pengamatan berpengaruh karena nilai Cook’s D melebihi batas kritis F(p;n -p;α) = 2.14, seperti terlihat pada Gambar 4.
43 44
0 0,7 1,4 2,1 2,8 3,5
0 5 10 15 20 25 30 35 40 45 50
Nomor Pengamatan
Nilai Cook's D
Gambar 4 Pengamatan berpengaruh berdasarkan Cook’s D dari data konsentrasi lemak ikan
Hasil pendeteksian pengamatan pencilan menunjukkan bahwa pengamatan ke-32 merupakan pengamatan pencilan tetapi tidak berpengaruh, sebaliknya tidak ada pengamatan yang berpengaruh terhadap nilai dugaannya tetapi bukan merupakan pencilan.
Pendeteksian Pencilan dengan Metode Pengaruh Lokal
Peubah respon dan peubah bebas terlebih dahulu distandarisasi untuk mengeliminasi intersept (konstanta). Selanjutnya peubah yang sudah distandarisasi digunakan pada metode pengaruh lokal. Hasil dari standarisasi peubah respon (ys) dan peubah bebas (Xs) dapat dilihat pada Lampiran 4. Akar ciri dan vektor ciri dari matriks Xs`Xs masing- masing tercantum pada Tabel 1 dan Tabel 2.
Tabel 1 Akar ciri matriks Xs`Xs dari data konsentrasi lemak ikan λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9
Akar ciri 8.9351 0.0556 0.0066 0.0022 0.0005 0.0000 0.0000 0.0000 0.0000 Proporsi 0.993 0.006 0.001 0.000 0.000 0.000 0.000 0.000 0.000 Kumulatif 0.993 0.999 1.0 1.0 1.0 1.0 1.0 1.0 1.0
17
Akar ciri yang diperoleh dari matriks Xs`Xs (Tabel 1) mengindikasikan adanya kolinieritas antar peubah bebas. Hal ini terlihat dari adanya akar ciri yang sangat kecil yang mendekati nol yaitu akar ciri ke- 6, 7, 8 dan 9. Akar ciri pertama 8.93 dengan proporsi 0.993 yang artinya komponen utama pertama dapat menjelaskan 99.3 % keragaman data.
Tabel 2 Vektor ciri matriks Xs`Xs dari data konsentrasi lemak ikan
Peubah PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 X1 -0.333 0.373 -0.312 -0.658 -0.150 0.331 -0.044 0.293 -0.008 X2 -0.333 0.380 -0.079 -0.169 0.176 -0.559 0.147 -0.583 0.071 X3 -0.333 0.326 0.223 0.352 0.375 0.516 -0.388 -0.217 -0.063 X4 -0.334 0.257 0.186 0.310 0.209 -0.264 0.389 0.650 -0.062 X5 -0.334 0.017 0.568 0.031 0.742 -0.007 -0.022 -0.103 0.044 X6 -0.334 -0.294 -0.298 0.209 -0.045 0.383 0.579 -0.210 0.377 X7 -0.334 -0.261 -0.354 0.172 -0.154 -0.066 -0.047 -0.073 -0.794 X8 -0.334 -0.216 -0.335 0.200 -0.085 -0.300 -0.579 0.210 0.461 X9 -0.331 -0.585 0.403 -0.452 0.421 -0.033 -0.035 0.031 -0.026
Komponen komponen vektor ciri pertama dari matriks Xs`Xs tidak jauh berbeda yang bermakna bahwa setiap peubah bebas x memberikan kontribusi yang hampir sama terhadap komponen utama pertama. Selanjutnya vektor ciri (ϕj) digunakan untuk menyusun persamaan Z melalui transformasi linier Zj = Xs ϕj. Komponen dari Z disebut sebagai komponen utama.
Pendeteksian peubah berpengaruh dilakukan dengan menentukan nilai [ ]ß
vmax (Lampiran 5) seperti pada Gambar 5.
-0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8
Nilai V-max
X1 X2 X3 X4 X5 X5 X7 X8 X9
Urutan Peubah
Gambar 5 Peubah berpengaruh berdasarkan nilai [ ]ß
vmax dari data konsentrasi lemak ikan
18
Gambar 5 menunjukkan bahwa peubah bebas yang paling berpengaruh adalah peubah X7 karena nilai [ ]ß
vmaxdari X7 lebih besar dari q
1 = 0.05 sebagai
batas kritis. Plot [ ]ß
vmax dengan nomor pengamatan menunjukkan bahwa peubah X7
sangat mempengaruhi koefisien regresi karena nilai [ ]ß
vmaxdari X7 lebih besar dari peubah bebas lainnya.
34 1
32
44
43 45
0 44564 89128 133692
0 5 10 15 20 25 30 35 40 45 50
Nomor Pengamatan
Nilai Ci
Gambar 6 Pencilan berdasarkan nilai Ci dari data konsentrasi lemak ikan Pendeteksian pengamatan yang berpengaruh pada peubah bebas X7
dilakukan dengan plot antara ukuran pengaruh Ci dengan nomor pengamatan.
Ukuran pengaruh (Ci) dari setiap pengamatan (Gambar 6) menunjukkan bahwa pengamatan ke-1, 32, 34, 43, 44 dan 45 merupakan pengamatan berpengaruh, karena ukuran pengaruh dari masing masing pengamatan tersebut melebihi batas kritis
∑
= n i
i
n C
1
2 = 44 564
Pendugaan Model Terboboti
Untuk menurunkan pengaruh pengamatan pencilan suatu pembobot W ditambahkan terhadap model regresi linier umum sehingga diperoleh model regresi linier ganda dengan data terboboti y = (X+W)ß+ e . Analisis regresi
19
dengan menggunakan metode kuadrat terkecil terhadap data terboboti menghasilkan persamaan sebagai berikut :
yˆ = 34.39 + 27.87X1 + 61.27X2 – 109.3X3 + 85.7X4 + 5.51X5 + 64.14X6 + 53.08X7 – 4.89X8 + 18.15X9
Model dengan data terboboti lebih baik dari model dengan data tanpa terboboti karena pembobot dapat menaikkan R-Square dari 0.92 menjadi 0.98, menurunkan simpangan baku dari 1.233 menjadi 0.548, menurunkan PRESS dari 173.79 menjadi 27.58. Model dengan data terboboti juga dapat menurunkan pengaruh pengamatan pencilan berdasarkan nilai Cook’s D (Gambar 7) dan nilai
[ ]ß
vmax . Namun model dengan data terboboti tidak dapat menghilangkan kolinieritas dalam data karena nilai VIF dari setiap peubah bebasnya lebih besar dari 10.
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5
0 5 10 15 20 25 30 35 40 45 50
Nomor Pengamatan
Nilai Cook's D
Gambar 7 Pengamatan berpengaruh berdasarkan Cook’s D dari data konsentrasi lemak ikan terboboti
Berdasarkan Nilai Cook’s D dengan batas kritis F(p; n -p; α) = 2.14 tidak ada pengamatan yang melebihi batas kritis, hal ini mengindikasikan tidak ada pengamatan yang dikategorikan sebagai pengamatan berpengaruh.
Dengan batas kritis nilai [ ]ß
vmax sebesar q
1 = 0.05, tidak ada peubah
yang dikategorikan sebagai peubah berpengaruh. Bila nilai [ ]ß
vmax dari data tanpa
20
terboboti (Gambar 5) dibandingkan dengan nilai [ ]ß
vmax dari data terboboti (Gambar 8), terlihat bahwa model dengan data terboboti lebih baik dari pada model dengan data tanpa terboboti.
-0,06 -0,04 -0,02 0 0,02 0,04 0,06 0,08
V-max
X1 X2 X3 X4 X5 X5 X7 X8 X9
Urutan Peubah
Gambar 8 Peubah berpengaruh berdasarkan [ ]ß
vmax dari data konsentrasi lemak ikan terboboti
Regresi Komponen Utama dengan Data Tanpa Pembobotan
Analisis regresi komponen utama dari data tanpa terboboti (Lampiran 1) memberikan 3 skor komponen utama yang berpengaruh nyata pada taraf α = 5 %.
Ketiga skor komponen utama dijadikan peubah baru yang digunakan untuk membentuk model. Umumnya komponen utama diurutkan berdasarkan nilai keragaman terbesar hingga terkecil. Beberapa komponen terakhir sering dieliminasi tanpa kehilangan suatu informasi yang penting karena dianggap memberikan sedikit keragaman. Penduga koefisien regresi ketiga komponen utama dapat dilihat pada Tabel 3.
Tabel 3 Penduga koefisien regresi komponen utama dari data konsentrasi lemak ikan
Peubah DB Penduga Parameter
Simpangan Baku
T- hitung
P VIF
Konstanta 1 41.3156 0.2297 179.90 0.000 -
Z1 1 0.9178 0.0777 11.81 0.000 1.0
Z2 1 9.6845 0.9850 9.83 0.000 1.0
Z3 1 -15.604 2.867 -5.44 0.000 1.0
21
Nilai VIF dari komponen utama tersebut sama dengan satu, hal ini mengindikasikan bahwa korelasi antara komponen utama sudah teratasi. Jika ditulis dalam bentuk persamaan regresi linier ganda, model regresi komponen utama dengan data tanpa terboboti adalah :
yˆ = 41.31 + 0.91Z1 + 9.68Z2 – 15.60Z3
Untuk mengembalikan koefisien regresi ke peubah asal X dilakukan transformasi.
Hasil transformasi balik dari koefisien regresi sebagai berikut :
yˆ = 30.44 – 1.56X1 – 2.13X2 – 6.32X3 – 5.09X4 – 8.72X5 + 7.80X6 + 8.36X7 + 7.62X8 - 0.32X9
Regresi Komponen Utama dengan Data Terboboti
Analisis regresi komponen utama dari data terboboti (Lampiran 6) memberikan 4 skor komponen utama yang berpengaruh nyata pada taraf α = 5 %.
Keempat skor komponen utama digunakan untuk membentuk model. Akar ciri λj
beserta proporsi kumulatif dan penduga koefisien regresi keempat komponen utama masing masing dicantumkan pada Tabel 4 dan Tabel 5.
Tabel 4 Akar ciri matriks Xs`Xs dari data konsentrasi lemak ikan terboboti λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9
Akar Ciri 8.8563 0.0767 0.0553 0.0066 0.0027 0.0020 0.0005 0.0000 0.0000 Proporsi 0.984 0.009 0.006 0.001 0.000 0.000 0.000 0.000 0.000 Kumulatif 0.984 0.993 0.999 1.0 1.0 1.0 1.0 1.0 1.0
Tabel 5 Penduga koefisien regresi komponen utama dari data konsentrasi lemak ikan terboboti
Peubah DB Penduga Parameter
Simpangan Baku
T- hitung
P VIF
Konstanta 1 41.3156 0.1890 218.61 0.000 -
Z1 1 6.1102 0.4260 14.34 0.000 1.0
Z2 1 22.516 4.579 4.92 0.000 1.0
Z3 1 64.344 5.391 11.93 0.000 1.0
Z4 1 97.99 15.66 6.26 0.000 1.0
Nilai VIF dari komponen utama tersebut sama dengan satu. hal ini mengindikasikan bahwa korelasi antar komponen utama sudah teratasi. Jika
22
ditulis dalam bentuk persamaan regresi linier ganda maka model regresi komponen utama dengan data terboboti adalah :
yˆ= 41.31 + 6.11Z1 + 22.51Z2 + 64.34Z3 + 97.99Z4
Untuk mengembalikan koefisien regresi ke peubah asal X dilakukan transformasi.
Hasil transformasi balik dari koefisien regresi sebagai berikut :
yˆ= 34.39 – 1.47X1 – 2.34X2 – 5.96X3 – 4.90X4 – 8.26X5 + 5.32X6 + 10.80X7 + 5.51X8 + 0.37X9
Jika dibandingkan nilai yˆ dari data tanpa terboboti dan nilai yˆ dari data terboboti, diperoleh bahwa antara kedua nilai dugaan berbeda seperti pada Gambar 9.
30 35 40 45 50 55
30 35 40 45 50
y aktual
y dugaan
Tanpa terboboti Terboboti
Gambar 9 Plot yˆ dengan y aktual dari data konsentrasi lemak ikan
Nilai RMSE pada model dengan data terboboti sebesar 1.40 lebih kecil dari nilai RMSE pada model dengan data tanpa diboboti yakni 1.69. Korelasi nilai y aktual dan nilai yˆ dengan data terboboti sebesar 0.952 lebih besar dari korelasi nilai y aktual dan nilai yˆ dengan data tanpa terboboti bernilai 0.93. Hal ini menunjukkan bahwa model regresi komponen utama dengan data terboboti lebih baik dari model regresi komponen utama dengan data tanpa terboboti.
Keterandalan model dengan data terboboti dapat dilihat berdasarkan plot yˆ dari data terboboti, yˆ dari data tanpa terboboti dan nilai y aktual terhadap nomor pengamatan. Nilai yˆ dari data terboboti lebih mendekati nilai y aktual dibandingkan dengan nilai yˆ data tanpa terboboti (Gambar 10).
23
0 5 10 15 20 25 30 35 40 45 50 55
0 5 10 15 20 25 30 35 40 45 50 55
Nomor Pengamatan
Nilai y
Aktual Tanpa terboboti Terboboti
Gambar 10 Plot nilai yˆ dengan nomor pengamatan dari data konsentrasi lemak ikan
Validasi Model
Data lemak ikan yang terdiri dari 45 penga matan dibagi menjadi dua bagian dengan proporsi yang berbeda untuk tujuan validasi. 30 pengamatan digunakan untuk pembelajaran dan 15 pengamatan untuk validasi.
Hasil pendugaan koefisien regresi untuk data pembelajaran dengan menggunakan regresi komponen utama dengan data tanpa terboboti adalah sebagai berikut :
yˆ = 25.9 + 2.09X1 – 2.05X2 – 6.67X3 – 5.46X4 – 9.62X5 + 8.20X6 + 8.74X7 + 7.99X8 - 0.57X9.
Hasil pendugaan koefisien regresi untuk data pembelajaran dengan menggunakan regresi komponen utama denga n data terboboti adalah sebagai berikut :
yˆ = 34.8 + 1.33X1 – 3.24X2 – 5.60X3 – 3.13X4 – 11.93X5 + 17. 22X6 + 12.20X7 – 2.68X8 – 1.13X9.
Nilai RMSE pada model dengan data terboboti sebesar 1.55 lebih kecil dari nilai RMSE pada model dengan data tanpa terboboti yakni 1.85. Korelasi nilai y aktual dan nilai yˆ data terboboti sebesar 0.958. lebih besar dari korelasi y aktual dan nilai yˆ data tanpa terboboti bernilai 0.82. Hal ini membuktikan bahwa model regresi komponen utama dengan data terboboti lebih baik dari model regresi komponen utama dengan data tanpa terboboti. Kebaikan model dengan data terboboti dapat dilihat berdasarkan plot nilai yˆ dari data terboboti, yˆ dari
24
data tanpa terboboti dan nilai y aktual terhadap nomor pengamatan seperti pada Gambar 11 dan Gambar 12.
25 30 35 40 45 50 55
25 30 35 40 45 50 55
Y Aktual
Y Dugaan
Terboboti Tanpa terboboti
Gambar 11 Plot nilai yˆ dengan y aktual dari data pembelajaran konsentrasi lemak ikan
0 10 20 30 40 50
0 5 10 15 20 25 30 35
Nomor pengamatan
Nilai Dugaan
Aktual Tanpa terboboti Terboboti
Gambar 12 Plot nilai yˆ dengan nomor pengamatan dari data pembelajaran konsentrasi lemak ikan
Model regresi yang diperoleh dari data pembelajaran digunakan pada data validasi untuk menduga nilai- nilai y. Plot nilai yˆ data tanpa terboboti dan nilai yˆ data terboboti terhadap y aktual (Gambar 13) menunjukkan bahwa yˆ data terboboti berbeda dengan nilai yˆ data tanpa terboboti.
25
30 32 34 36 38 40 42 44 46 48 50
30 32 34 36 38 40 42 44 46 48 50
y aktual
Y dugaan
Tanpa terboboti Terboboti
Gambar 13 plot yˆ dengan y aktual data validasi konsentrasi lemak ikan Tabel 6 Perbandingan nilai y aktual, yˆ dari data terboboti dan yˆdari data
tanpa terboboti pada data pembelajaran konsentrasi lemak ikan No Y aktual yˆterboboti No Y aktual yˆtanpa terboboti
1 31.6 34.32 1 31.6 39.26
2 35.9 37.10 2 35.9 39.58
3 36.0 37.62 3 36.0 39.72
4 36.4 38.00 4 36.4 39.78
5 37.1 38.74 5 37.1 39.97
6 38.7 39.81 6 38.7 40.02
7 39.1 40.00 7 39.1 39.99
8 40.8 41.95 8 40.8 40.11
9 41.6 40.53 9 41.6 39.92
10 41.8 41.72 10 41.8 40.25
11 41.8 41.03 11 41.8 40.20
12 43.3 43.71 12 43.3 40.29
13 43.3 46.03 13 43.3 40.37
14 44.8 43.69 14 44.8 40.53
15 45.2 47.24 15 45.2 40.73
RMSE = 1.183 RMSE = 2.625
Nilai RMSE model data terboboti sebesar 1.183 lebih kecil dari nilai RMSE pada model data tanpa terboboti yakni 2.625 (Tabel 6). Korelasi antara nilai y aktual dengan nilai yˆ dari data terboboti sebesar 0.958 lebih besar dari korelasi antara nilai y aktual dan nilai yˆ dari data tanpa terboboti yang bernilai 0.79 (Gambar 14). Hal ini menunjukkan bahwa model regresi komponen utama dengan data terboboti lebih baik dari model regresi komponen utama dengan data tanpa terboboti.
26
0 5 10 15 20 25 30 35 40 45 50
0 2 4 6 8 10 12 14 16
Nomor pengamatan
Nilai y
Aktual Tanpa terboboti Terboboti
Gambar 14 Plot nilai yˆdengan nomor pengamatan dari data validasi konsentrasi lemak ikan
Data Peubah Ekonomi dan Peubah Kesejahteraan Rakyat Pendugaan Model
Hasil analisis regresi dengan menggunakan metode kuadrat terkecil terhadap data peubah ekonomi dan peubah kesejahteraan rakyat adalah sebagai berikut :
yˆ = 331.77 – 0.063X1 + 0.004X2 + 0.087X3 + 0.011X4 – 0.034X5 + 0.054X6 + 0.003X7 – 4.376X8 – 0.146X9
dengan nilai koefisien determinasi (R2) sebesar 99.8 %, RMSE sebesar 0.67 dan PRESS sebesar 287.327. Tidak terdapat kolinieritas antara peubah bebas, karena nilai VIF dari setiap peubah bebas tidak lebih dari 10. Pemeriksaan terhadap asumsi kenormalan dilakukan dengan uji formal Anderson-Darling. Hasil uji kenormalan menunjukkan bahwa asumsi kenormalan dipenuhi karena nilai P- Value lebih besar dari 0.01.
Pendeteksian Pencilan dengan hii dan R_Student
Analisis regresi dengan metode kuadrat terkecil terhadap data pada Lampiran 2 menghasilkan ukuran pencilan dan pengamatan berpengaruh pada Lampiran 7. Ukuran pencilan berdasarkan nilai hii terdapat pada Gambar 15.
27
9
17
0 0,74 1,48
0 5 10 15 20 25 30
Nomor Pengamatan
Nilai hii
Gambar 15 Pencilan berdasarkan nilai hii dari data kesejahteraan rakyat Berdasarkan nilai h dengan batas kritis 2p/n = 0.7407 pengamatan ke-9 ii dan 17 merupakan pengamatan pencilan.
15 17
10
-3,492 -1,746 0 1,746 3,492 5,238
0 5 10 15 20 25 30
Nomor Pengamatan
R_Student
Gambar 16 Pencilan berdasarkan nilai R_Student dari data kesejahteraan rakyat
Berdasarkan nilai R_Studentnya, pengamatan ke-10, 15 dan 17 merupakan pencilan karena nilai mutlak R_Student pengamatan tersebut melebihi batas kritis t > t(n-p-1;α/2)) = 1.746 pada taraf nyata 5% (Gambar 16). Sehingga pencilan berdasarkan nilai leverage dan R-Student adalah pengamatan ke-9, 10, 15 dan 17.