BAB 2
LANDASAN TEORI
2.1 Analisis Regresi
Dalam beberapa masalah terdapat dua atau lebih variabel yang hubungannya tidak dapat dipisahkan, dan hal tersebut biasanya diselidiki sifat hubungannya. Analisis regresi adalah sebuah teknik statistika untuk memeriksa dan memodelkan hubungan diantara variabel-variabel. Tahapan regresi terdiri dari 2 yaitu regresi sederhana dan multiple regresi. Penerapannya dapat dijumpai secara luas di banyak bidang seperti teknik, ekonomi, manajemen, ilmu-ilmu biologi, ilmu-ilmu sosial, dan ilmu-ilmu pertanian. Analisis regresi berguna dalam menelaah hubungan dua variabel atau lebih, dan terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan sempurna, sehingga dalam penerapannya lebih bersifat eksploratif.
2.1.1 Regresi Linier
Regresi linier adalah metode statistika yang digunakan untuk membentuk model hubungan antara variabel terikat dengan satu atau lebih variabel bebas . Apabila banyaknya variabel bebas hanya ada satu, disebut sebagai regresi linier sederhana, sedangkan apabila terdapat lebih dari satu variabel bebas, disebut sebagai regresi linier berganda. Hubungan antara variabel terikat dengan variabel bebas ini dapat dirumuskan ke dalam suatu bentuk hubungan fungsional sebagai berikut:
; untuk
dengan : = variabel terikat ke = variabel bebas ke
= intersep (titik potong kurva terhadap sumbu ) = kemiringan (slope) kurva linier.
kesalahan (error)
Analisis regresi setidak-tidaknya memiliki 3 kegunaan, yaitu untuk tujuan deskripsi dari fenomena data atau kasus yang sedang diteliti, untuk tujuan kontrol, serta untuk tujuan prediksi. Regresi mampu mendeskripsikan fenomena data melalui terbentuknya suatu model hubungan yang bersifatnya numerik. Regresi juga dapat digunakan untuk melakukan pengendalian (kontrol)terhadap suatu kasus atau hal-hal yang sedang diamati melalui penggunaan model regresi yang diperoleh. Selain itu, model regresi juga dapat dimanfaatkan untuk melakukan prediksi untukvariabel terikat. Namun yang perlu diingat, prediksi di dalam konsep regresi hanya boleh dilakukan didalam rentang data dari variabel-variabel bebas yang digunakan untuk membentuk model regresi tersebut. Misal, suatu model regresi diperoleh dengan mempergunakan data variabel bebas yang memiliki rentang antara 5 s.d. 25, maka prediksi hanya boleh dilakukan bila suatu nilai yang digunakan sebagai input untuk variabel berada di dalam rentang tersebut. Konsep ini disebut sebagai interpolasi.
Di dalam suatu model regresi kita akan menemukan koefisien-koefisien. Koefisien pada model regresi sebenarnya adalah nilai duga parameter di dalam model regresi untuk kondisi yang sebenarnya (true condition), sama halnya dengan statistik mean (rata-rata) pada konsep statistika dasar. Hanya saja, koefisien-koefisien untuk model regresi merupakan suatu nilai rata-rata yang berpeluang terjadi pada variabel terikat bila suatu nilai bebas .
Koefisien regresi dapat dibedakan menjadi 2 macam, yaitu:
1. Intersep (intercept)
Intersep, definisi secara metematis adalah suatu titik perpotongan antara suatu garis dengan sumbu pada diagram/sumbu kartesius saat nilai . Sedangkan definisi secara statistika adalah nilai rata-rata pada variabel apabila nilai pada variabel
bernilai 0. Dengan kata lain, apabila X tidak memberikan kontribusi, maka secara rata-rata, variabel akan bernilai sebesar intersep. Perlu diingat, intersep hanyalah suatu konstanta yang memungkinkan munculnya koefisien lain di dalam model regresi. Intersep tidak selalu dapat atau perlu untuk diinterpretasikan. Apabila data pengamatan pada variabel X tidak mencakup nilai 0 atau mendekati 0, maka intersep tidak memiliki makna yang berarti, sehingga tidak perlu diinterpretasikan.
2. Slope
Secara matematis, slope merupakan ukuran kemiringan dari suatu garis. Slope adalah koefisien regresi untuk variabel (variabel bebas). Dalam konsep statistika, slope merupakan suatu nilai yang menunjukkan seberapa besar kontribusi (sumbangan) yang diberikan suatu variabel terhadap variabel . Nilai slope dapat pula diartikan sebagai rata-rata pertambahan (atau pengurangan) yang terjadi pada variabel untuk setiap peningkatan satu satuan variabel
2.1.2 Metode Kuadrat Terkecil (Ordinary Least Square – OLS)
Metode OLS biasa digunakan dalam menaksir nilai parameter pada persamaan tunggal yang bersifat satu arah. Pada persamaan tersebut, variabel bebas mempengaruhi variabel tak bebas. Metode OLS ialah suatu metode untuk menghitung 0 dan 1, sedemikian sehingga jumlah kesalahan kuadrat memiliki nilai terkecil. Dengan bahasa matematika, maka dinyatakan sebagai berikut:
;
Jadi metode kuadrat terkecil adalah metode untuk menghitung dan sedemikian
rupa sehingga terkecil (minimum). Caranya ialah dengan membuat turunan
parsial (partial differential) dari mula-mula terhadap kemudian terhadap dan menyamakannya dengan nol.
… (2.1)
… (2.2)
Persamaan (2.1) dibagi dengan
Sehingga
Sehingga
2.1.3 Regresi Kuadrat Terkecil
Metode ini didasarkan pada pemilihan 0 dan 1 sehingga meminimalkan jumlah kuadrat deviasi titik-titik data dari garis yang dicocokkan.
Jumlah dari kuadrat deviasi (JKD) dari garis adalah:
... (2.3)
n i n i i i i i Y X e JKD 1 1 2 0 2
Gambar 2.3 Suatu pengamatan (data) yang tidak tepat pada garis regresi
Kemudian akan ditaksir 0 dan 1 sehingga jika taksiran ini disubstitusikan ke dalam persamaan (2.3) maka jumlah deviasi kuadrat menjadi minimum. Dengan mendiferensialkan persamaan (2.3) terhadap 0 dan 1 dan menetapkan derivatif parsial yang dihasilkan sama dengan nol, diperoleh
i i
n i i n i i i X Y X SSD X Y SSD 1 0 1 1 1 0 1 0 2 2
... (2.4) Dan karenanya ... (2.5)
0 0 1 0 1 1 1 0
i i n i i n i i i X Y X X Y dari persamaan (2.5), diperoleh
... (2.6)
n i n i i i i n i i i n i n i i i Y X X X Y X n 1 1 2 1 0 1 1 1 0 persamaan (2.6) disebut dengan persamaan normal. Dari persamaan (2.6) diperoleh,
n X X n Y X Y X i i i i i i 2 2 1 ˆ dan ˆ0 Y ˆ1X, dimana Y dan X adalah n Y n
i i
1 dan X nn i i
1 . danyang diperoleh dengan cara ini disebut taksiran kuadrat terkecil masing-masing dari
0
ˆ
ˆ1
0
dan 1. Dengan demikian, taksiran persamaan regresi dapat ditulis sebagai, , yang disebut persamaan prediksi kuadrat terkecil.
X Yˆ ˆ0 ˆ1
Defenisi 1. Determinan dari suatu matriks bujur sangkar A, dinotasikan dengan |A| atau det(A) adalah fungsi skalar yang didefinisikan sedemikian rupa sehingga merupakan jumlah hasil kali unsur- unsur yang sejajar diagonal utama dikurangi jumlah unsur- unsur yang sejajar diagonal lain.
Contoh 2.1 (i) ; maka 22 21 12 11 a a a a A (ii) ; maka 33 32 31 23 22 21 13 12 11 a a a a a a a a a A
2.2.1 Menghitung Determinan dengan Reduksi Baris
Di bagian ini akan diperlihatkan bahwa determinan sebuah matriks dapat dihitung dengan mereduksi matriks tersebut kepada bentuk eselon baris. Metode ini penting karena metode ini menghindari perhitungan yang panjang yang terlibat di dalam pemakaian definisi determinan secara langsung.
Mula-mula ditinjau dua golongan matriks yang determinannya dapat dihitung dengan mudah, tak perduli berapapun besarnya ukuran matriks tersebut.
Teorema 1. Jika A adalah sebarang matriks kuadrat yang mengandung sebarisan bilangan nol, maka det(A) = 0.
Sebuah matriks kuadrat dinamakan segitiga atas (upper triangular) jika semua entri di bawah diagonal utama adalah segitiga bawah (lower triangular) jika semua entri di atas diagonal utama adalah nol. Sebuah matriks baik yang merupakan segitiga bawah dinamakan segitiga (triangular).
Contoh 2.2
44 34 33 24 23 22 14 13 12 11 0 0 0 0 0 0 a a a a a a a a a a A
Sebuah matriks segitiga bawah 4 x 4 yang umum mempunyai bentuk
44 43 42 41 33 32 31 22 21 11 0 0 0 0 0 0 a a a a a a a a a a A
Teorema 2. Jika A adalah sebuah matriks segitiga yang berukuran n x n, maka det(A) adalah hasil perkalian entri-entri pada diagonal utama yakni det
A a11a22ann . Contoh 2.3 4 0 0 0 0 8 9 0 0 0 6 7 6 0 0 1 5 7 3 0 3 8 3 7 2 A maka 1296 ) 4 )( 9 )( 6 )( 3 )( 2 ( 4 0 0 0 0 8 9 0 0 0 6 7 6 0 0 1 5 7 3 0 3 8 3 7 2 ATeorema 3. Anggap A adalah sebarang matriks n x n.
(a) Jika A adalah matriks yang dihasilkan bila sebuah baris tunggal dari A dikalikan oleh sebuah konstanta k, maka det
A k det
A(b) Jika A
A adalah matriks yang dihasilkan bila dua baris dari A dipertukarkan, maka
A detdet
(c) Jika A adalah matriks yang dihasilkan bila sebuah kelipatan dari satu baris dari A ditambahkan kepada baris lain, maka det
A det
A2.2.2. Sifat-sifat Fungsi Determinan
Jika A adalah sebarang matriks m x n, maka transposisi dari A (transpose of A) dinyatakan oleh dan didefinisikan sebagai matriks n x m yang kolom pertamanya adalah baris pertama dari A, yang kolom keduanya adalah baris kedua dari A, yang kolom ketiganya adalah baris ketiga dari A, dan seterusnya.
t
A
Sifat-sifat Operasi Transposisi
kA kA dimana k adalah sebarang skalar iii B A B A ii A A i t t t t t t t ; ) ( ) ( ) ( 2.2.3. Ekspansi Kofaktor dengan Kaidah Cramer
Definisi 2. Jika A adalah sebuah matriks kuadrat, maka minor entri dinyatakan oleh dan didefinisikan sebagai determinan dari submatriks yang tinggal setelah baris ke i dan kolom ke j dicoret dari A. Bilangan
ij a ij M
ij j i M 1 dinyatakan oleh dinamakan kofaktor entri .ij K ij a Contoh 2.4 Andaikan 8 4 1 6 5 2 4 1 3 A
Minor entri a11 adalah
16 8 4 6 5 11 M
1 11 11 16 1 1 11 M M KDefinisi 3. Jika A adalah sebarang matriks n x n dan adalah kofaktor , maka matriks ij K aij nn n n n n K K K K K K K K K 2 1 2 22 21 1 12 11
dinamakan matriks kofaktor dari A. Transposisi matriks ini dinamakan adjoin dari A dan dinyatakan dengan adj(A).
Teorema 4. Jika A adalah sebuah matriks yang dapat dibalik, maka
adj A A A det 1 1 Bukti. Mula-mula akan diperlihatkan bahwa Aadj
A det
A I
nn jn n n n j n j nn n n in i i n n K K K K K K K K K K K K a a a a a a a a a a a a A adj A 2 1 2 2 22 12 1 1 21 11 2 1 2 1 2 22 21 1 12 11Entri di dalam baris ke i dan kolom ke j dari A adj (A) adalah
ai1Kj1ai2Kj2 ainKjn ...
(2.7)
Jika i = j, maka (2.7) adalah ekspansi kofaktor dari det(A) sepanjang baris ke i dari A. Sebaliknya, jika i , maka koefisien-koefisien dan kofaktor-kofaktor j berasal dari baris-baris A yang berbeda, sehingga nilai dari (2.7) sama dengan nol.
A I A A A A adj A det det 0 0 0 det 0 0 0 det ... (2.8)Karena A dapat dibalik, maka det
A 0, maka persamaan (2.8) dapat dituliskan kembali sebagai
Aadj
A
I A det 1 atau
A adj A I A det 1Dengan mengalikan kedua ruas dari kiri dengan A1 maka akan menghasilkan
adj A A A det 1 1 ... (2.9) 2.3 Multiple RegresiMultiple regresi adalah analisis regresi yang meramalkan pengaruh dua variabel bebas atau lebih terhadap satu variabel terikat . Dapat juga digunakan untuk membuktikan ada atau tidaknya hubungan fungsional antara dua buah variabel bebas atau lebih dengan sebuah variabel terikat .
Bentuk persamaan umum multiple regresi adalah
n i i iX Y 1 0 i ki ki i i X X X Y 0 1 1 2 2 ... …(2.10)Apabila dinyatakan dalam bentuk matriks, akan diperoleh rumus berikut
X
kn n n ki i i k ki k i k i n i X X X X X X X X X X X X X Y Y Y Y Y 2 1 2 1 2 22 12 21 11 2 1 1 0 2 1 1 1 1 1
Koefisien harus diestimasi berdasarkan data hasil penelitian sampel acak. Prosedur estimasi tergantung pada asumsi mengenai variabel X dan kesalahan pengganggu ε. Beberapa asumsi yang penting adalah sebagai berikut:
1. nilai harapan setiap kesalahan pengganggu sama dengan nol E(i)0, untuk semua i. 0 0 0 0 0 ) ( ) ( ) ( ) ( 2 1 n i E E E E
2. Kesalahan pengganggu yang satu (εi) tidak berkorelasi (bebas) terhadap kesalahan
pengganggu lainnya (εj), akan tetapi mempunyai varians yang sama.
untuk semua i. 2 2) ( , , 0 ) (ij i j E i E
Apabila dinyatakan dalam bentuk matriks, maka asumsi tersebut menjadi sebagai berikut:
I E E E E E E E E E E E E E n n n n i i i n i 2 2 2 2 2 2 1 2 1 2 2 2 1 2 1 2 1 2 ' 0 0 0 0 0 0 0 0 0 0 0 0 '
= transpos dari vektor kolom ε, atau dengan kata lain, ' merupakan vektor baris '
= ( ε ... ε ... ε ... ε ) . I = matriks identitas, karena setiap kesalahan pengganggu mempunyai varians yang sama.
1 2 i n
3. X1i, X2i, ... , Xki merupakan bilangan real, tanpa mengandung kesalahan. Dengan
perkataan lain, matriks merupakan himpunan angka-angka konstan (fixed numbers).
4. Matriks X mempunyai rank k (ada k kolom dari matriks X yang bebas linear). n Jumlah observasi n harus lebih banyak dari jumlah variabel, atau lebih banyak dari koefisien regresi linear yang akan diestimasi.
... (2.11) k kX X X Yˆ ˆ0 ˆ1 1ˆ2 2 ...ˆ
Apabila ˆ0, ˆ1, ˆ2, ... , ˆk sudah dihitung sebagai penduga parameter
1
,2 , ... ,
k
, berdasarkan data dari sampel, maka Yˆ dapat digunakan untuk meramalkan , setelah X1, X2, ... , Xk diketahui nilainya.
2.3.1 Taksiran atau Pendugaan pada Koefisien Multiple Regresi
Misalkan sebagai penduga ˆ merupakan vektor kolom dengan k baris sebagai berikut: k ˆ ˆ ˆ ˆ 2 1 Y ˆ X Xˆ = + e e = Y
ˆ ˆ ˆ ˆ ˆ 1 1 1 1 2 1 0 2 1 2 1 2 22 12 1 21 11 2 1 2 1 _ k kn n n ki i i k k n i e n i X X X X X X X X X X X X X Y Y Y Y Y e e e e
2 2 2 1 1 0 2 2 2 1 1 0 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ki k i i i i ki k i i i i X X X Y e X X X Y e ... (2.12)Estimasi vektor dengan menggunakan kuadrat terkecil, ialah vektor sedemikian rupa sehingga jumlah kuadrat kesalahan pengganggu, e
ˆ
’e =
2i
e minimum. Caranya ialah dengan melakukan penurunan parsial
2i
e terhadap setiap komponen vektor dan menyamakannya dengan 0.
ˆ
ˆ ˆ ˆ ˆ
0 2 ˆ 0 1 ˆ ˆ ˆ ˆ 2 ˆ 1 2 2 1 1 0 1 2 2 2 1 1 0 0 2
i ki k i i i i ki k i i i i X X X X Y e X X X Y e
ˆ ˆ ˆ ˆ
0 2 ˆ 0 ˆ ˆ ˆ ˆ 2 ˆ 2 2 1 1 0 2 2 2 2 1 1 0 2 2
ki ki k i i i k i i ki k i i i i X X X X Y e X X X X Y e ... (2.13)
i ki ki k ki i ki i ki i i ki i k i i i i i i ki i k i i i i i ki k i i Y X X X X X X X Y X X X X X X X Y X X X X X X X Y X X X n 2 2 2 1 1 0 2 2 2 2 2 2 1 1 2 0 1 1 2 1 2 2 1 1 1 0 2 2 1 1 0 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ... (2.14)Persamaan di atas disebut persamaan normal.
Dengan meminimumkan e'e
Y Xˆ
YXˆ
maka dihasilkan :
ˆ ˆ ˆ 2 ˆ ˆ ' 1 2 X X Y X Y Y X Y X Y e e e n i i
dengan turunan parsial dari persamaan 0 ˆ e e , maka didapatkan : atau ...(2.15) ...(2.16) 0 ˆ 2 2 X Y X X