Regression
Ledhyane I. Harlyan
Fakultas Perikanan dan Ilmu Kelautan Universitas Brawijaya
2013
TUJUAN INSTRUKSIONAL KHUSUS
• Mahasiswa mampu melakukan analisis regresi
sederhana dengan menggunakan metode fit-
by eye dan metode kuadrat terkecil
Peramalan
“Meramalkan suatu peubah tak bebas (Y) lewat satu/lebih peubah bebas (X)” Persamaan REGRESI
Contoh: - Hubungan nilai UTS dengan skor intelegensia
- Hubungan jumlah pendapatan dengan tingkat kepuasan - Menduga kecerahan air dari konsentrasi klorofil
- Hubungan hasil tangkapan per unit effort dengan effort, dll.
HUBUNGAN FUNGSI
..”konsentrasi klorofil dapat dihubungkan dgn kecerahan air..”
Jika konsentrasi klorofil=C; kecerahan air=D
C = f (D) artinya: D digunakan sebagai indikator C
Manakah peubah/variabel bebas?? Manakah peubah tak bebas?
“D” atau “C”
X dan Y dalam populasi
X (peubah bebas) dan Y(peubah tak bebas) adalah anggota dari populasi Notasi dlm populasi : {xi,yi}; i= 1, 2, 3…n (x1,y1), (x2, y2),…(xn, yn)
- Jika data tiap anggota populasi diplotkan / disebarkan (Diagram Pencar) Analisa relasi antar variabel adalah dengan membuat diagram pencar (scatter diagram) yang menggambarkan titik-titik plot dari data yang diperoleh.
- Titik-titik akan “mengikuti “ garis lurus dua peubah (X & Y) berhubungan secara linear (Garis Regresi Linear)
Garis linier pada diagram pencar
Gambar Garis regresi linier pada diagram pencar
y (+)
y (+)
y (+)
y (+)
y (-)
y (-)
y (-)
y (-)
y (0)
y (0)
a
y a bxˆ
x y
Model Regresi (pangkat 1)
Model dugaan
ŷ = a + bx
ŷ = nilai ramalan hasil dari analisis regresi a = intercept/perpotongan sumbu tegak b = slope/kemiringan
Note: ŷ ≠ y !!
y = nilai pengamatan sesungguhnya
Model observasi
ẏ= α + βx
ẏ= nilai rata-rata observasi α = intercepts
β = slope/kemiringan εi= galat/sisa
Ĉ = a + b D
Ĉ = peubah tak bebas D= peubah bebas a = intercept
b = slope
yi = ŷ+ εi
Diagram pencar & Garis Regresi
70 75 80 85 90 95 100
45 50 55 60 65 70
Nilai UTS
Skor tes intelegensia
Diagram Pencar & Garis Regresi
Nilai pengamatan sesungguhnya
Tumpukan titik-titik ramalanŷ = a + bx (GARIS REGRESI)
Tumpukan titik2 ramalan/garis regresi
digunakan utk peramalan
Misal:
-skor tes 60, maka nilai UTS=83.86
-83.86 adalah nilai harapan bagi mahasiswa yg memiliki skor tes 60
Asumsi Penggunaan Regresi
• εi ~ N (0, δ2)
• εi bebas satu sama lain
• Setiap nilai x mempunyai sebaran bagi nilai y
• x bersifat non measurement error
Transformasi linier
1. EKSPONENSIAL
Y = a . e
bXy = peubah tak bebas x = peubah bebas
a, b= konstanta
e = bilangan natural = 2.71
Transformasi logaritmik
Log
e(Y) = Log
e(a) + bX; Log
ee = 1 Z = c + bX;
Z = Variabel tidak bebas yang nilainya = Log
e(Y);
c = Konstanta yang nilainya = Log
ea
Transformasi linier
2. KUADRATIK
Hubungan antara tekanan effort (F) dengan total hasil tangkapan (C) umumnya mengikuti persamaan kuadratik, dengan persamaan:
C = a + bF + cF2
• Jika F=0 C=0 maka a=0
• Jika penambahan F C meningkat, namun pada titik tertentu akan penurunan total C
C = f(F) nilai dari C adalah fungsi dari F
C = bF + cF2 Namun karena kurva ke arah “negatif” Kurva cembung ke atas C = bF - cF2
C/f = b- cF Y = b- cF
Beberapa metode regresi linier
1. Metode Fit-By Eye
Dilakukan jika:
a.Tidak tersedia kalkulator/komputer b.Jumlah data relatif sedikit
c.Keputusan memerlukan waktu yang relatif sedikit d.Tidak memerlukan tingkat akurasi/galat yg terukur
Kelemahan: tidak bisa menghitung galat, sehingga asumsi tidak terpenuhi Cara: 1. Plotkan titik-titik observasi
2. Buat garis dugaan, dimana jarak antara titik yg berada di atas dan garis dugaan sama dengan jarak antara titik yg berada di bawah dan garis dugaan
3. Teruskan garis hingga menyentuh sumbu Y notasi a ; saat x =0 4. Teruskan garis hingga menyentuh sumbu X notasi z ; saat y=0 5. Nilai konstanta b = (0 – a)
(z – 0)
Beberapa metode regresi linier
2. Metode Kuadrat Terkecil
X b
Y
a *
22
1
1 n X X
Y n X
XY b
22
1
Y
Y n JKT
X Y
XY n b
JKR 1
Kaidah Penarikan Kesimpulan
• F hit > F tab 5%
Tolak Ho, terima H1 artinya model regresi dapat dipercaya dengan selang kepercayaan 95%
• Fhit > F tab 1%
Tolak Ho, terima H1 artinya model regresi sangat dapat dipercaya dengan selang kepercayaan 99%
• Fhit < F tab 5%
Gagal tolak Ho artinya model regresi tidak dapat dipercaya
Uji Lanjutan
1. R2 (koefisien determinasi)
JKR x 100%
JKT
“berapa persen keragaman nilai Y dapat dijelaskan hubungan linearnya dgn X?”
2. r (koefisien korelasi)
Nilai rentang: -1 < r < 1
“ seberapa kuat hubungan antara dua peubah (bebas & tak bebas)? “
Koefisien korelasi
Linier positif Linier negatif
Uji Lanjutan
3. Uji t
t hitung = b
1bandingkan dengan t tab (tα/2; n-2) Sb
1Sb1 = S
2(atau KTS)
∑X
2- 1/n(∑X)
2Keputusan:
T hit < T tabel gagal tolak H0 x tidak mempengaruhi y
Contoh soal
Jika diketahui bahwa lama perendaman (X) akan
mempengaruhi kadar protein umpan (gr/100 gr umpan) (Y), maka berikut ini akan dibuktikan bahwa X
mempengaruhi Y!
7
81 . 15
2857 .
139
95 . 2730
7 . 110
8259 192175 975
2 2
n Y X
Y Y
XY
X
X
Pengerjaan dengan Ms. Excell
• Masuk ke Ms.excell
• Buka data analysis
NO
SECCHI DISH
CHLOROPH YLL
(cm) /X (TE/F)/ Y
1 45 28,0
2 250 3,2
3 130 14,7
4 270 0,5
5 65 20,4
6 35 35,0
7 180 8,9
INTERPRETASI
Setiap penambahan 1 cm secchi disk, maka konsentrasi klorofil akan berkurang sebesar 0.127 TE/F
Metode Kuadrat Terkecil
(Excell)Assignment!!
• Sebuah penelitian dilakukan untuk menentukan hubungan antara
kapasitas mesin kapal dengan produksi hasil tangkapan (dalam ton) per bulan dan hasil penjualannya.
Data yang diperoleh adalah sebagai berikut :
Kapasitas mesin (PK) 40 20 25 20 30 50 40 20 50 40 25 50 Produksi
(ton)
385 400 395 365 475 440 490 420 560 525 480 510
Tentukan :
1. Persamaan regresinya ?
2. Perkirakan besar produksi per bulan bila kapasitas mesin sebesar 35 ? 3. Koefisien korelasinya ( r ) ?
4. Bagaimanakah hasil dari uji t utk pengujian x variabel?
Model Dugaan
Mana pendekatan yang baik ?
Garis lurus yang sedemikian rupa sehingga melewati seluruh titik (data ) pada diagram pencar yang mendekati
0,00 2,00 4,00 6,00 8,00 10,00 12,00
0,00 1,00 2,00 3,00 4,00 5,00 6,00 Luas (Ha.)
Harga (Rp. juta)