STATISTIKA
STATISTIKA
PERTEMUAN 6
PERTEMUAN 6
ANALISIS KORELASI DAN
ANALISIS KORELASI DAN
REGRESI LINIER SEDERHANA
REGRESI LINIER SEDERHANA
Dosen Pengasuh :
Dosen Pengasuh :
NURYADI, M.Si
BAHASAN PERTEMUAN
BAHASAN PERTEMUAN
6
6
ARTI ANALISA KORELASI
ARTI ANALISA KORELASI
ARTI KOEFISIEN DETERMINASI
ARTI KOEFISIEN DETERMINASI
METODE
METODE
Lea
Lea
st
st
Square
Square
UNTUK REGRESI
UNTUK REGRESI
RAMALAN MENGGUNAKAN REGRESI DATA
RAMALAN MENGGUNAKAN REGRESI DATA
BERKELOMPOK
BERKELOMPOK
, RANK, DAN
, RANK, DAN
KUALITATIF
KUALITATIF
TUJUAN :
TUJUAN :
Menjelaskan pentingnya analisis hubungan
Menjelaskan pentingnya analisis hubungan
Menjelaskan dan Menghitung koefisien korelasi dan
Menjelaskan dan Menghitung koefisien korelasi dan
regresi sederhana
regresi sederhana
Memahami dan menerapkan regresi dan
Memahami dan menerapkan regresi dan
korelasi
korelasi
Menggunakan tehnik ramalan dari analisis regresi
(1) ARTI ANALISA KORELASI
Pada semua kejadian, baik ekonomi maupun lainnya, pasti ada
faktor yg menyebabkan terjadinya kejadian tsb (Misal : menurunnya hasil penjualan tektil, mungkin disebabkan karena kalah bersaing dengan tekstil impor; menurunnya produksi padi mungkin karena pupuknya berkurang; dll).
Kejadian tsb dapat dinyatakan dengan “perubahan nilai variabel” (Misal : jika X = variabel harga, maka naik-turunnya harga dapat dinyatakan dengan perubahan nilai X . Jika Y = variabel hasil
penjualan, maka naik-turunnya hasil penjualan dapat dinyatakan dengan perubahan nilai Y ).
Jadi, hubungan antara dua kejadian dapat dinyatakan dengan “hubungan dua variabel”.
Dalam pertemuan ini, hanya akan dibahas “ hubungan linier antara dua variabel X dan Y ” . Hubungan linier dan nonlinier lebih dari dua variabel akan dibahas pada pertemuan berikutnya.
ARTI ANALISA KORELASI (lanjutan)
Jika variabel X dan Y mempunyai hubungan, maka variabel X yang
sudah diketahui nilainya dapat digunakan untuk memperkirakan atau menaksir Y .
Variabel Y yang nilainya akan diperkirakan disebut “variabel tidak
bebas (d e p en d e n t v a r i ab l e )”, sedangkan nilai X yang digunakan untuk memperkirakan nilai Y disebut “variabel bebas (independent
variable)”.
Jadi, analisis korelasi memungkinkan “untuk menduga sesuatu”, baik secara “kualitatif ” (Misal : akan turun hujan, akan lulus ujian, harga beras akan naik, dll) maupun “ kuantitatif ” (Misal : produksi padi akan mencapai 16 juta ton, penerimaan negara naik 15%, dll). Salah satu cara untuk melakukan perkirakan dari dua variabel tsb adalah dengan menggunakan “garis regresi” .
(2) KOEFISIEN KORELASI DAN KEGUNAANNYA
Hubungan dua variabel ada “positif ” atau “negatif ”. Hubungan X dan Y dikatakan positif jika “kenaikan / penurunan nilai X ”
umumnya diikuti oleh “kenaikan / penurunan nilai Y ”. Sebaliknya, dikatakan negatif jika “kenaikan / penurunan nilai X ” diikuti oleh
“p e n ur u n a n / k e n a i k an n i l a i Y ”
Contoh Hubungan "Positif" Contoh Hubungan "Negatif"
Variabel X Variabel Y Variabel X Variabel Y
Pupuk Produksi Jumlah Akseptor Produksi
Biaya Iklan Hasil Penjualan Harga Barang Hasil Penjualan
Berat Badan Tekanan Darah Pendapatan Kejahatan
0 2 4 6 8 10 12 0 5 10 15 N I L A I Y NILAI X 0 2 4 6 8 10 12 0 5 10 15 N I L A I Y NILAI X
KOEFISIEN KORELASI DAN KEGUNAANNYA
Apabila bentuk diagram pencar “tidak teratur ” artinya “kenaikan / penurunan nilai X ” umumnya tidak diikuti oleh “kenaikan /
penurunan nilai Y ”, maka dikatakan X dan Y “ T I D A K
B E R K O R E L A S I ” . Artinya, “variabel X tidak mempengaruhi Y ”
dan dikatakan X dan Y bebas (i n de p e n d en t ).
1 2 3 4 5 6 7 0 1 2 3 4 N I L A I Y NILAI X X Y 1 4 3 4 2 2 1.5 3 2.5 3 2 6 2.5 5 1.5 5
KOEFISIEN KORELASI DAN KEGUNAANNYA
Kuat atau tidaknya hubungan antara X dan Y apabila dapat
dinyatakan dengan “ FUNG SI L INIER ” , diukur dengan suatu nilai yang disebut “KOEFISIEN KORELASI ( r ) ” dengan nilai paling sedikit -1 dan paling besar +1.
Jadi : -1 ≤ r ≤ +1
A r t i n y a :
r = +1, hubungan X dan Y sempurna dan positif (m endekati +1 m en gg a m b a r k an h u b u n g a n s a ng a t k u a t d a n p o s i ti f ).
r = -1, hubungan X dan Y sempurna dan negatif (m endekati -1 m en gg a m b a r k an h u b u n g a n s a n g at k u a t d a n n e g a t i f ).
r = 0, hubungan X dan Y lemah sekali (t i da k a d a h u b u n g a n ).
“Naik/turunnya nilai Y yang bervariasi” tidak semata-mata
disebabkan oleh X dan Y , karena masih ada “ F AK T O R L A IN ” .
Misal : jika Y = hasil penjualan, X = biaya iklan, maka naik/turunnya Y selain disebabkan oleh X, juga oleh faktor (variabel) lain seperti
KOEFISIEN KORELASI DAN KEGUNAANNYA
Terkait dengan hal tsb, muncul pertanyaan “ B E R A P A B E SA R N Y A KONTRB USI VA RIA BEL X TERHADA P NA IK/TURUNYYA NILA I Y ” .
Jawaban dari pertanyaan tsb, maka harus dihitung suatu koefisien yang disebut “KOEFISIEN PENENTUAN (c o ef f i c i e n t o f
d e te r m i n at i o n ” yang biasa disimbolkan (K P ) dengan rumus :
K P = r
2Contoh :
Jika r = 0.9 maka nilai KP = (0.9)2 = 0.81 (81%), yaitu besarnya sumbangan variabel X terhadap naik/turunnya Y adalah 81%.
(3) RUMUS KOEFISIEN KORELASI ( r )
n i i n i i n i i iy
x
y
x
r
1 2 1 2 1
n i i i Yi n i i i i Y n Y Y Y X n X X X x 1 1 1 , 1 ,Jika :
Rumus 1 :
2 1 1 2 1 2 1 2 1 1 1)
(
)
(
n i i n i i n i n i i i n i n i n i i i i iY
Y
n
X
X
n
Y
X
Y
X
n
r
Rumus 2 :
Contoh Hitung Koefisien Korelasi ( r )
Halaman 163 :
X adalah persentase kenaikan biaya iklan dan Y adalah persentase
kenaikan hasi penjualan, nilai keduanya seperti pada tabel. Hitung koefisien korelasi ( r ) ?
X 1 2 4 5 7 9 10 12 Y 2 4 5 7 8 10 12 14
Langkah menghitung, buatlah lembar kerja seperti tabel berikut yang disusun berdasarkan rumus r
X Y X-X r Y-Y r x 2 y 2 xy ( x ) ( y ) 1 2 -5.25 -5.75 27.5625 33.0625 30.1875 2 4 -4.25 -3.75 18.0625 14.0625 15.9375 4 5 -2.25 -2.75 5.0625 7.5625 6.1875 5 7 -1.25 -0.75 1.5625 0.5625 0.9375 7 8 0.75 0.25 0.5625 0.0625 0.1875 9 10 2.75 2.25 7.5625 5.0625 6.1875 10 12 3.75 4.25 14.0625 18.0625 15.9375 12 14 5.75 6.25 33.0625 39.0625 35.9375 Rata_2 6.25 7.75 Σ 0 0 107.5 117.5 111.5 X Y X2 Y2 XY 1 2 1 4 2 2 4 4 16 8 4 5 16 25 20 5 7 25 49 35 7 8 49 64 56 9 10 81 100 90 10 12 100 144 120 12 14 144 196 168 Σ 50 62 420 598 499 Untuk Rumus 1 : Untuk Rumus 2 :
Selanjutnya nilai-nilai tsb masukan dalam rumus :
n i i n i i n i i i y x y x r 1 2 1 2 199
.
0
5
.
117
5
.
107
5
.
111
r
Nilai r = 0.99, hubungan antara X dan Y sangat kuat dan positif,
artinya kenaikan biaya iklan umumnya menaikkan hasil penjualan. Selanjutnya, dari nilai r , dihitung nilai KP = r 2 = (0.99)2 = 0.9821 ≈
0.98 = 98%. Artinya : kontribusi biaya iklim terhadap variasi hasil penjualan adalah 98%, sedangkan sisanya 2% merupakan
kontribusi faktor lain, seperti daya beli masyarakat.
Rumus 1 : Rumus 2 : 2 1 1 2 1 2 1 2 1 1 1 ) ( ) (
n i i n i i n i n i i i n i n i n i i i i i Y Y n X X n Y X Y X n r 0.99 ) 62 ( ) 598 ( 8 ) 50 ( ) 420 ( 8 ) 62 )( 50 ( ) 499 ( 8 2 2 r(4) RUMUS KOEFISIEN KORELASI ( r )
(DATA BERKELOMPOK)
2 2 2 2 ) ( ) ( ) ( ) ( ) )( ( ) ( v v u u v u vf f v n uf f u n vf uf uvf n r Contoh (halaman 168) :100 mahasiswa AIS melaksanakan ujian statistik dan matematik. Asumsi : jika kemampuan matematik (X) rendah, maka kemampuan
statistik (Y) juga rendah, dan sebaliknya. Hasil nilai ujian yang diperoleh sebagai berikut :
Matematika 40-49 50-59 60-69 70-79 80-89 90-99 Jumlah Statistika (1) (2) (3) (4) (5) (6) (7) (8) 90-99 2 4 4 10 80-89 1 4 6 5 16 70-79 5 10 8 1 24 60-69 1 4 9 5 2 21 50-59 3 6 6 2 17 40-49 3 5 4 12
Menghitung Koefisien Korelasi ( r )
(Data Berkelompok)
Dari tabel sebelumnya, menunjukkan hubungan nilai matematik dan statistik merupakan dua tabel frekuensi berikut :
Kelas Nilai Nilai Tengah
Matematika (X) u f u 40-49 44.5 -2 7 50-59 54.5 -1 15 60-69 64.5 0 25 70-79 74.5 1 23 80-89 84.5 2 20 90-99 94.5 3 10
Kelas Nilai Nilai Tengah
Statistika (X) u f u 90-99 94.5 2 10 80-89 84.5 1 16 70-79 74.5 0 24 60-69 64.5 -1 21 50-59 54.5 -2 17 40-49 44.5 -3 12
Tabel menunjukkan bahwa u dan v masing-masing adalah skala baru dari X dan Y .
Kelas atau nilai tengah yang harus diberi “nilai 0” untuk kelas genap (seperti contoh), “pilihlah kelas yang dekat dengan nilai tengah”, yaitu untuk X (64.5 atau 74.5) diberi nilai 0, jadi u = 0.
Demikian juga untuk Y .
f adalah frekuensi untuk tiap sel, jadi f u = frekuensi untuk X atau u , dan = frekuensi untuk atau
Jika dua tabel frekuensi tersebut digabung, akan diperoleh tabel berikut :
Selenjutnya, untuk perhitungan r dibuat “tabel korelasi” seperti berikut (perhatikan perubahan letak u , v , f u dan f v ) :
u -2 -1 0 1 2 3 f v v (1) (2) (3) (4) (5) (6) (7) (8) 2 2 4 4 10 1 1 4 6 5 16 0 5 10 8 1 24 -1 1 4 9 5 2 21 -2 3 6 6 2 17 -3 3 5 4 12 f u 7 15 25 23 20 10 100
(I) (II) (III) (IV) (V) v f v vf v v 2 f v uvf 2 4 4 2 10 20 40 44 1 4 6 5 1 16 16 16 31 5 10 8 1 0 24 0 0 0 1 4 9 5 2 -1 21 -21 21 -3 3 6 6 2 -2 17 -34 68 20 3 5 4 -3 12 -36 108 33 (VI) u -2 -1 0 1 2 3 100 -55 253 125 (VII) f u 7 15 25 23 20 10 100 (VIII) uf u -14 -15 0 23 40 30 64 (IX) u2 f u 28 15 0 23 80 90 236 Keterangan : Cara menghitung nilai pada setiap baris dan kolom, dijelaskan pada halaman :
Berdasarkan nilai jumlah (Σ) pada kolom dan baris tabel tersebut diperoleh : Σu f u = 64, Σu 2 f u = 236, Σv f v = -55, Σv 2 f v = 253, Σu v f = 125, dan n = 100
2 2 2 2 ) ( ) ( ) ( ) ( ) )( ( ) ( v v u u v u vf f v n uf f u n vf uf uvf n r77
.
0
7686
.
0
)
55
(
)
253
(
100
)
64
(
)
236
(
100
)
55
)(
64
(
)
125
(
100
2 2
r
Kesimpulan : H u bu n g a n n i l ai m a t em a t ik d a n s t at i s t i k “ c u k u p k u a t d an p o s i t if ”. A r ti n y a , n i l a i m a tem a t ik y a n g di p e r o l eh a k an m e m pe n g a r u hi n i l ai statistik. P ad a um u m n y a , m a h a s i s w a d e n g a n n i l a i m a t em a t i k y an g r e n d a h a k an m em p e r ol e h n i l ai s t a t i s t i k y a ng r en d a h ; sebaliknya jika nilai(5) PENGERTIAN KORELASI RANK
KORELASI RANK ANALISIS DATA STATISTIK DITU-JUKAN UNTUK MENGETAHUI RANKING SUATU DATA, MINIMAL 2 DATARUMUS KOEFISEN RANK DINAMAKAN
RUMUS S P E A R M A N nganrank banyakpasa n nk pasanganra selisih d ana n n d r i n i i rank
, dim , ) 1 ( 6 1 21 2Contoh Soal dan Bahasan (Halaman 174)
NO NAMA ROKOK Rank JONI Rank TONO d d 2
1 Kansas 9 8 1 1 2 Jarum 5 3 2 4 3 555 10 9 1 1 4 Bentoel 1 2 (1) 1 5 Mascot 8 7 1 1 6 Salem 7 10 (3) 9 7 Gentong 3 4 (1) 1 8 Minakjinggo 4 6 (2) 4 9 Gudang Garam 2 1 1 1 10 Dunhill 6 5 1 1 ∑ 55 55 - 24
Koefisien Rank (Spearman ) :
85 , 0 ) 1 100 .( 10 24 6 1 ) 1 ( 6 1 21 2
x n n d r n i i rank(6) KORELASI DATA KUALITATIF
KORELASIKUALITATIF
UKURAN STATISTIK
UNTUK MENGUKUR KUATNYA HUBUNGAN BERSYARAT DATA
KUALITATIF (K OEFISIEN B ERSYA RAT )
RUMUS n C c 2 2
p i q j q j ij p i q i j p i i j n n n banyaknyaobservasi f i n 1 1 1 1 1 1 arapan frekuensih n n n eij
i. j
Besarnya C tergantung pada
banyaknya baris dan kolom (r), batas atas C dapat dirumuskan :
r r C c 1 RUMUS khikuadrat e e f p i q j ij ij ij
1 1 2 2 ( ) d i m a n a :f ij = n ij = frek.observasi (baris i kolom j )
i = 1, 2, ….., p i
Contoh Soal dan Penyelesaian (Hal. 178-179)
Pendidikan Kurang Cukup Sangat Cukup ∑
Tidak tamat SLA 82 65 12 159
Tamat SLTA 59 112 24 195
Pernah Masuk PT 37 94 42 173
∑ 178 271 78 527
Carilah Koefisien Bersyarat dari hasil penelitian hubungan antara Tingkat pendidikan ibu rumah tangga dengan konsumsi susu dari anggota keluarga?
PENDIDIKAN K (f) ẹ (f-e)^2 C (f) e (f-e)^2 SC(f) e (f-e)^2 ∑ TIDAK TAMAT SD 82,0 53,7 14,9 65,0 81,8 3,4 12,0 23,5 5,7 159,0 TAMAT SLTA 59,0 65,9 0,7 112,0 100,3 1,4 24,0 28,9 0,8 195,0 PERNAH MASUK PT 37,0 58,4 7,9 94,0 89,0 0,3 42,0 25,6 10,5 173,0 ∑ 178,0 178,0 23,49 271,0 271,0 5,1 78,0 78,0 17,0 527,0 arapan frekuensih n n n eij i. j khikuadrat e e f p i q j ij ij ij
1 1 2 2 ( ) Penyelesaian
45
)
(
1 1 2 2
p i q j ij ij ije
e
f
ategori
frekuensik
f
ij
arapan frekuensih n n n eij i j .
28
,
0
527
45
45
2 2
n
C
c Bentuk Umum Persamaan Regresi Linear
Bentuk Umum :
Keterangan :
Y = variabel terikat
X = Variabel Bebas;
a, dan b konstanta
bx
a
Y
2 2)
(
)
).(
(
x
x
n
y
x
xy
n
b
x
b
Y
a
(7) TEKNIK RAMALAN DAN
ANALISIS REGRESI
Contoh Soal dan Penyelesaian
SUATU PABRIK ROTI INGIN MENCARI KAITAN HUBUNGAN ANTARA
JUMLAH PRODUKSI ROTI (X ) DAN JUMLAH JAM KERJA (Y ).
DITANYA :
Hitung r , R, KOEFISIEN a, b, dan BERAPA JAM KERJA YANG DIBUTUHKAN
UNTUK MENGHASILKAN 75 PRODUK ?
NO
PRO (X ) JAKER (Y )
1 30 73 2 20 50 3 60 128 4 80 170 5 40 87 6 50 108 7 60 135 8 30 69 9 70 148 10 60 132 99 , 0 ) ( ) ( . . 1 1 2 2 1 1 2 1 2 1 1 1