“ DATA MENCERDASKAN BANGSA”
TEKNIK ANALISIS DATA
Ir. Sri Sayekti, M.Sc WIDYAISWARA AHLI MADYA PUSDIKLAT, BPS
Nama : Ir. Sri Sayekti, MSc
Tempat/tanggal lahir: Solo, 4 Maret 1963 Jabatan : Widyaiswara Madya
Pangkat/Golongan: Pembina Tk I (IV/b) Instansi : Badan Pusat Statistik
Alamat : Jln Statistik I Blok B-27 Komp. Statistik
Pondok Bambu, Jakarta Timur HP : 081399308022
E-mail : [email protected]
MATERI
Pendahuluan
1
Korelasi Spearmen Rank
2
Korelasi Pearson Product Moment
3
Regresi Sederhana
4
Chi-Square (Khi-Kuadrat)
PENDAHULUAN
Aktifitas kehidupan manusia
SEBAB
• MENDUNG • PACEKLIK • MISKIN • TIDAK BER-KB • KEKERINGAN • TIKET PESAWAT MURAHAKIBAT
• HUJAN • HARGA NAIK • PENYAKIT • BANYAK ANAK • PRODUKSI TURUN • ORANG NAIK PESAWATPEMBAGIAN ANALISIS STATISTIK
Statistik Sosial
Statistik Deskriptif
Statistik Inferensial
Non Parametrik
Skala
nominal
Skala
ordinal
Parametrik
Skala
interval
STATISTIK DESKRIPTIF
Statistik yang digunakan untuk
menggambarkan atau
menganalisis suatu statistik
hasil penelitian, tetapi tidak
digunakan untuk membuat
kesimpulan yang lebih luas
(generalisasi/inferensi).
PENYAJIAN DATA
Tabel
Distribusi frekuensi
Grafik (garis atau batang) Diagram lingkaran
Piktogram
Penjelasan kelompok melalui modus, median, dll
Variasi kelompok melalui rentang dan simpangan baku
STATISTIK INFERENSIA
Statistik yang digunakan untuk
menganalisis data sampel, dan
hasilnya akan digeneralisasikan
(diinferensikan) untuk populasi
dimana sampel diambil
Dapat dibagi menjadi dua
jenis yakni parametrik dan
non parametrik
STATISTIK NON
PARAMETRIK
KEKURANGAN STATISTIK NON PARAMETRIK
Hasil tidak sesuai harapan
Tidak efektif bila jumlah sampel besar
Tidak powerfull
KELEBIHAN STATISTIK NON PARAMETRIK
Tingkat kesalahan kecil
Perhitungan relatif sederhana dan mudah
Konsep mudah dimengerti Untuk analisis berupa hitungan maupun rank
Dapat digunakan pada skala data nominal dan ordinal
KAPAN NON PARAMETRIK DIGUNAKAN ???
NON PARAMETRIK KAPAN ? SAAT ? Tidak melibatkan parameter populasi Skala pengukuran dalam parametrik tidak terpenuhiSkala Data
Jenis analisis
Non paramtrik parametrik
Nominal
Ordinal Chi Kuadrat k Sampel
Dan korelasi spearman
Interval -
Regresi dan korelasi pearson
“ DATA MENCERDASKAN BANGSA”
Uji Satu Sampel
Chi-Square
Fungsi
Uji chi-square digunakan bila dalam populasi terdiri atas dua atau
lebih kategori, data diukur dengan skala nominal dan sampel besar.
Uji chi-square merupakan pengujian hipotesis tentang perbandingan antara frekuensi sampel yang benar-benar terjadi (selanjutnya disebut dengan frekuensi observasi; O) dengan frekuensi harapan yang
didasarkan pada hipotesis tertentu pada setiap kasus atau data (selanjutnya disebut dengan frekuensi harapan; E).
Prosedur (1)
Tentukan H
0, H
1dan α.
Letakkan frekuensi-frekuensi terobservasi dalam k kategori.
• Jumlah frekuensi seluruhnya harus N, yakni banyak observasi-observasi independen.
Dari H
0tentukan frekuensi yang diharapkan (E
i) untuk tiap-tiap
k sel itu.
• Manakala k>2, dan bila lebih dari 20% dari Ei kurang dari 5, gabungkanlah
kategori-kategori yang berdekatan apabila hal ini memungkinkan, dan dengan demikian kita mengurangi harga k serta sehingga meningkatkan
nilai Ei ≥ 5.
• Apabila k=2, tes 2 untuk kasus satu sampel dapat digunakan secara
Prosedur (2)
Contoh
Apakah jumlah telepon masuk ke call-center sama setiap
harinya dalam seminggu selama promo?
(i.e., do calls follow a uniform distribution?)
Data yang diperoleh:
Jumlah telepon masuk:
Senin
290
Selasa
250
Rabu
238
Kamis
257
Jumat
265
Sabtu
230
Minggu
192
∑=1722
Solusi
Jika jumlah telepon masuk mengikuti distribusi
uniform, maka 1722 telepon masuk diharapkan
sama untuk setiap hari dalam seminggu:
Chi-Square Goodness-of-Fit Test:
menguji
untuk melihat apakah hasil sampel konsisten
dengan hasil yang diharapkan
diharapkan
yg
hari
per
panggilan
rata
-rata
246
7
1722
Solusi
Frekuensi Observed vs. Expected
Observed
o
iExpected
E
iSenin
Selasa
Rabu
Kamis
Jumat
Sabtu
Minggy
290
250
238
257
265
230
192
246
246
246
246
246
246
246
TOTAL
1722
1722
Solusi
1. H0: Distribusi panggilan telepon adalah sama selama 7 hari
dalam seminggu: f1 = f2 = …. = f7
HA: Distribusi panggilan telepon adalah tidak sama selama seminggu (paling sedikit ada satu fi yang tidak sama)
3. Test statistik
2. Tingkat Signifikansi: Ditetapkan α = 0,05
Karena desainnya bertipe satu sampel (jumlah telepon masuk ke call-center), dan datanya skala nominal (7 hari dalam
seminggu), serta bertujuan untuk menguji perbedaan frekuensi populasi, maka uji yang dipilih adalah uji chi-square.
23.05
246
246)
(192
...
246
246)
(250
246
246)
(290
2 2 2 2
Solusi
4.Daerah penolakan
0 2 Reject H0 Do not reject H0 2
Reject H
0if:
2
α
2
Obs
Solusi
Solusi
Chi Square Tabel
k = 7 days of the week)
dof = k – 1 = 6 (7 days of the week) so use 6 dof
α = 5%
2 .05= 12.5916
0 = .05 Reject H0 Do not reject H0 2 2 .05 = 12.5916 23.05 5.
Keputusan
2= 23.05 >
2 = 12.5916
so reject H
0and conclude
that the distribution is not
Solusi
6.
Kesimpulan:
Berdasarkan data sampel yang ada dan dengan tingkat
signifikansi 5%, dapat dinyatakan bahwa terdapat cukup
bukti untuk menyatakan bahwa distribusi jumlah telepon
masuk ke layanan call-center selama seminggu promo
Distribusi Chi-Square
Distribusi khi-kuadrat yang kita gunakan
sebagai uji statistik mempunyai karakteristik
sebagai berikut:
• Nilai Khi-kuadrat tidak pernah negatif, karena selisih
dari frekuensi pengamatan dan frekuensi harapan
dikuadratkan.
• Ketajaman dari distribusi khi-kuadrat tidak tergantung
pada ukuran sampel tetapi tergantung pada
banyaknya kategori yang digunakan.
• Distribusi khi-kuadrat bersifat menceng kanan (nilai
positif), semakin meningkat jumlah derajat bebas maka
semakin mendekati distribusi normal.
UJI KOMPARATIF
DUA SAMPEL
INDEPENDEN
UJI INDEPENDENSI CHI KUADRAT
Dengan uji Independensi Chi Kuadrat dapat diketahui, apakah dua peubah saling berhubungan (tergantung, mempengaruhi, dependen) atau tidak saling berhubungan (tidak tergantung, tidak mempengaruhi, independen).
j i ij ij ijE
E
O
, 2 2(
)
Varaiabel 1 Variabel 2 Total Kategori 1 Kategori 2 … Kategori cKategori 1 O11 O12 … O1c n1. Kategori 2 O21 O22 … O2c n2. … … … Oij … ni. Kategori r Or1 Or2 … Orc nr. Total n.1 n.2 n.j n.c n Dengan:
Oij = frekuensi teramati pada sel ij Eij = frekuensi harapan pada sel ij Dengan derajat bebas = (r-1)(c-1)
CONTOH
Sebuah studi berminat meneliti hubungan antara persepsi tentang kerentanan terhadap penyakit dan pemilihan jenis pemberi pelayanan kesehatan. Dari universe pemakai pelayanan kesehatan modern dan tradisional dicuplik sebuah sampel. Persepsi kerentanan dibagi dua kategori, sangat serius dan kurang serius
Pelayanan
Persepsi Kerentanan Terhadap
Penyakit Total
Sangat serius Kurang serius
Rumah sakit 24 6 30
Dukun 8 12 20
Uji
Ho :Kedua peubah (persepsi kerentanan terhadap penyakit dan pemilihan jenis pemberi pelayanan kesehatan) tidak saling tergantung.
Tingkat kekeliruan, = 0.05 Statistik uji ialah :
E 11 = (30 x 32)/50 = 19.2 E12 = (30 x 18)/50 = 10.8 E21 = (20 x 32)/50 = 12.8 E22 = (20 x 18)/50 = 7.2 Statistik uji 2 adalah :
2 dengan derajat bebas (2-1)(2-1) = 1, dimana 2
tabel=21;0.05 = 3.84
Karena 2
hitung 2 tabel, maka Ho ditolak
Kesimpulan; terdapat hubungan yang bermakna antara persepsi pasien tentang kerentanan terhadap penyakit dan jenis pemberi pelayanan kesehatan yang dipilih.
33 . 8 2 . 7 ) 2 . 7 12 ( 8 . 12 ) 8 . 12 8 ( 8 . 10 ) 8 . 10 6 ( 2 . 19 ) 2 . 19 24 ( 2 2 2 2 2
Uji Khi-Kuadrat
k-sampel Independen
Pengembangan Uji Khi kuadrat dua sampel independen
Menguji signifikansi k sampel independen
Uji Khi-Kuadrat
k-sampel Independen
Derajat bebas= (k-1)(r-1) 2 2 1 1(
)
r k ij ij i j ijO
E
E
Oij = frekuensi teramati pada baris ke-i, kolom ke-j
Eij = frekuensi harapan pada baris ke-i, kolom ke-j
SMA
Uji Khi-Kuadrat
k-sampel Independen
SMK
MA
Penelitian untuk melihat perbedaan minat
melanjutkan pendidikan ke perguruan tinggi
Contoh :
Contoh :
Minat SMA SMK MA Melanjutkan 7 2 6 Tidak Melanjutkan 3 8 4 Total 15 15 Total 10 10 10 30 2 2 1 1(
)
r k ij ij i j ijO
E
E
2 2 2 2 2 2 (7 5) (2 5) (6 5) 5 5 5 (3 5) (8 5) (4 5) 5, 6 5 5 5 1110 15
5
30
x
E
1210 15
5
30
x
E
2210 15
5
30
x
E
2110 15
5
30
x
E
1310 15
5
30
x
E
2310 15
5
30
x
E
2 tabel=22;0,05 = 5,99Uji Khi-Kuadrat
k-sampel Independen
2<
2tabel
Tidak tolak H
0KORELASI SPEARMAN
Untuk dua variabel berjenis
ordinal, ukuran asosiasinya
adalah koefisien
korelasi
PROSEDUR SPEARMAN
Kalau terjadi nilai-nilai kembar baik diantara X maupun
diantara Y, maka rank-rank dari nilai kembar itu menjadi
sama dengan rata-rata dari nomor urutannya.
Tentukan rank (peringkat) pengamatan X dan Y dari
terbesar sampai terkecil
Susun data dari n pengamatan secara berpasangan
berbentuk : (X
1,Y
1), , (X
2,Y
2),…,(Xn,Yn)
PERINGKAT TAK ADA YANG SAMA
n
n
d
r
s i
3 26
1
Koefisien korelasi Spearman untuk sampel data X 34 33 31 35 32 36 Y 43 45 42 46 41 44 Data Peringkat d d2 X Y X Y 31 42 1 2 –1 1 32 41 2 1 1 1 33 45 3 5 – 2 4 34 43 4 3 1 1 35 46 5 6 – 1 1 36 44 6 4 2 4 n = 6 Jumlah 12
657
,
0
210
)
12
)(
6
(
1
6
1
3 2
n
n
d
r
sPERINGKAT ADA YANG SAMA
2 2 2 2 22
X
Y
d
Y
X
r
S
Y XT
n
n
Y
T
n
n
X
12
12
3 2 3 2Pasangan data adalah sebagai berikut
X 0 0 1 1 3 4 5 6 7 8 8 12 Y 42 46 39 37 65 88 86 56 62 92 54 81 Data Peringkat d d2 X Y X Y 0 42 1,5 3 1,5 2,25 0 46 1,5 4 2,5 6,25 1 39 3,5 2 1,5 2,25 1 37 3,5 1 2,5 6,25 3 65 5 8 3 9,00 4 88 6 11 5 25,00 5 86 7 10 3 9,00 6 56 8 6 2 4,00 7 62 9 7 2 4,00 8 92 10,5 12 1,5 2,25 8 54 10,5 5 5,5 30,25
Koreksi peringkat sama terdapat hanya pada X Peringkat t t3 T = (t3 – t) / 12 1,5 2 8 0,5 3,5 2 8 0,5 10,5 2 8 0,5 Σ TX = 1,5 sehingga 143 0 12 12 12 12 5 141 5 1 12 12 12 12 3 3 2 3 3 2
Y X T n n Y T n n X , ,615
,
0
)
143
)(
5
,
141
(
2
50
,
109
143
5
,
141
2
2 2 2 2 2
Y
X
d
Y
X
r
sSTATISTIK
PARAMETRIK
STATISTIK
PARAMETIK
STATISTIK PARAMETRIK
PARAMETRIK
Teknik statistika yang didasarkan atas
asumsi mengenai populasi yang diambil
sampelnya
Membutuhkan data kuantitatif dengan
level interval atau rasio
Menguji parameter populasi
Asumsi Data Guna
1. SAMPEL TUNGGAL
2. INDEPENDEN
3. DEPENDEN
STATISTIK
PARAMETRIK
BENTUK HUBUNGAN:HUBUNGAN
UKURAN HUBUNGAN:ANALISIS
REGRESI
ANALISIS
KORELASI
Korelasi hanya menunjukkan keeratan hubungan.
Dalam korelasi variabel tidak ada istilah tergantung dan variabel bebas.
Regresi menunjukkan hubungan pengaruh.
Dalam regresi terdapat istilah tergantung dan variabel
ANALISIS KORELASI
Contoh Hubungan Positif X Y
Pupuk Produksi Padi Berat Badan Tekanan Darah Pendapatan Konsumsi
Gaji/ Upah Harga Makanan Investasi Nasional Pendapatan Nasional
Contoh Hubungan Negatif X Y
Jumlah Akseptor Jumlah Kelahiran Harga Permintaan Pendapatan Masyarakat Kejahatan Ekonomi
Analisis Korelasi
Sederhana
ANALISA KORELASI digunakan untuk
mengukur kekuatan keeratan hubungan antara
dua variabel melalui sebuah bilangan yang
disebut koefisien korelasi.
Koefisien korelasi linier (Product Moment = r)
adalah ukuran hubungan linier antara dua
variabel/peubah acak X dan Y.
Bila dua peubah tidak berhubungan ;
korelasinya 0,
ANALISIS KORELASI
ANALISIS KORELASI
Kuat atau tidaknya hubungan antara X dan Y diukur dengan suatu nilai yang disebut Koefisien Korelasi (r)
r = 1, hubungan X dan Y sempurna dan positif
(mendekati 1, hubungan sangat kuat dan positif) r = -1, hubungan X dan Y sempurna dan negatif
(mendekati -1, hubungan sangat kuat dan negatif)
r = 0, hubungan X dan Y lemah sekali atau tidak ada hubungan
1
r
1
Penentuan r disesuaikan dengan jenis penelitian, sbg contoh -Bidang ekonomi, r>0,7 baru dianggap hub yg kuat
KORELASI PEARSON PRODUCT MOMENT
Ukuran asosiasi antara
dua variabel yang berjenis
interval atau rasio:
KORELASI PEARSON
Penghitungan korelasi Pearson untuk data tunggal
Rumus untuk menghitung nilai r :
1 2 2 1 1 n i i i n n i i i i
x y
r
x
y
i i x X X i i y Y Y 1 1 n i i X X n
1 1 n i i Y Y n
RUMUS KORELASI PEARSON
ΣXiYi = jumlah perkalian X dan Y
ΣXi
2= jumlah kuadrat X
ΣYi
2= jumlah kuadrat Y
n = banyak pasangan nilai
Di mana :
1 1 1 2 2 2 2 1 1 1 1 n n n i i i i i i i n n n n i i i i i i i in
X Y
X
Y
r
n
X
X
n
Y
Y
AtauCONTOH
Luas Panen 7 Produksi Jagung
Di Propinsi "Z" , 1988 - 1995
T a h u n '88 '89 '90 '91 '92 '93 '94 '95
LuasPanen
(l0.000Ha) 6.2 5,8 6,4 7.7 6,0 9,4 7,2 5,9
Produksi
(l0.000 Ton) 4,9 4,6 5,7 ll,l 7,9 ll,5 9,8 6,9
Untuk menghitung besar koefisien korelasi antara luas panen dan produksi jagung di Propinsi Z, disini dimisalkan bahwa luas panen sebagai peubah x dan Produk-si sebagai peubah yTahun X Y X.Y Y X2 X Y2 1988 6,2 4,9 30,38 38,44 24,01 1989 5,8 4,6 26,68 33,64 21,16 1990 6,4 5,7 36,48 40,96 32,49 1991 7,7 11,1 85,47 59,29 123,21 1992 6,0 7,9 47,40 36,00 61,41 1993 9,4 11,5 108,10 88,36 132,25 1994 7,2 9,8 70,58 51,84 96,04 1995 5,9 6,9 40,71 34,81 47,61 54,6 62,4 445,78 383,34 538,18
r
p
= 0,84 ; hubungan kuat positip
artinya jika luas panen ditambah, maka
produksi akan bertambah.
2
2
)
4
,
62
(
18
,
539
.
8
)
6
,
54
(
)
34
,
383
.
8
(
)
4
,
62
)(
6
,
54
(
78
,
445
)
8
(
P
r
84
,
0
49
,
189
2
,
159
)
68
,
419
)(
56
,
85
(
2
,
159
Perbedaan Analisis
Korelasi dan Regresi
• Bertujuan untuk mengetahui apakah diantara dua variabel terdapat hubungan atau tidak, dan jika ada
hubungan bagaimanakah arah hubungan dan seberapa besar hubungan tersebut.
Analisis
Korelasi
• Bertujuan untuk memprediksi besar Variabel Terikat (Dependent Variable) dengan menggunakan data Variabel Bebas (Independent Variable) yang sudah diketahui besarnya.
Analisis
Regresi
x y
Korelasi dua variabel ada yang positif dan negatif.
Korelasi dikatakan positif apabila kenaikan/penurunan suatu
variabel (X) pada umumnya menyebabkan kenaikan/penurunan variabel lainnya (Y). Begitupun sebaliknya
Korelasi Positif
Korelasi Negatif
REGRESI
Analisis
regresi
merupakan
studi
ketergantungan satu atau lebih variabel
bebas terhadap variabel tidak bebas.
Dengan maksud untuk meramalkan nilai
variabel tidak bebas.
POLA REGRESI
• Jika pola hubungannya dalam
bentuk linier (garis lurus),
• misal: y = 2 + 3X.
1. Regresi
Linier:
• Jika pola hubungannya
dinyatakan dalam bentuk bukan
linier (kwadratik, fungsi logaritma,
dan sebagainya),
• misal : y = e
a+bx2 . Regresi
non
REGRESI LINEAR
• Jika pola dari hubungan 2 peubah
mempunyai hubungan linier,
• misal y = a + b X
11. Regresi
Linier
Sederhana:
• Jika pola hubungan 3 peubah atau
lebih, misalnya
• y = a + b
1X
1+ b
2X
2+ .... + b
nX
n2. Regresi
Linier
Regresi Linier
Sederhana
Adalah suatu pola/model regresi yang meli-batkan
dua peubah kuantitatif saja untuk menggambarkan
pola hubungan ke dua peubah tersebut.
Dipergunakan untuk memperkirakan peubah yang
satu berdasarkan peubah yang lain.
•Suatu prosedur estimasi atau perkiraan untuk memprediksi nilai peubah bebas jika peubah tidak bebasnya diketahui atau
sebaliknya
•Peubah bebas ( independent )= X adalah peubah yang nilainya dipakai sebagai dasar untuk memperkirakan peubah yang lain •Peubah tidak bebas (dependent)=Y adalah peubah yang nilainya diperkirakan atas dasar nilai peubah bebas
Istilah & notasi
Y
Variabel tidak bebas/ tergantung
(Dependent Variable)
Variabel yang dijelaskan
(Explained Variable)
Variabel yang diramalkan
(Predictand)
Variabel yang diregresi
(Regressand) Variabel Tanggapan (Response)
X
Variabel bebas (Independent Variable)Variabel yang menjelaskan
(Explanatory Variable)
Variabel peramal (Predictor)
Variabel yang meregresi
(Regressor)
Variabel perangsang atau kendali
REGRESI LINIER
SEDERHANA
Untuk mendapatkan persamaan
regresi/model regresi antara variabel X
dan Y , pertama kali dibuat plot data
pada bidang xy.
Plot tersebut dinamakan diagram pencar.
Berdasarkan diagram pencar dapat dicari
garis atau lengkungan yang mendekati
titik-titik data tersebut.
POLA HUB X vs Y
0 1 2 3 4 5 6 7 8 9 0 2 4 X 6 8 10 YHUBUNGAN
KAUSAL
Hubungan X dan Y kuat Persamaan regresi baik, dapat digunakan untuk
prediksi Y
POLA HUB X vs Y
Hubungan X vs Y tidak linier dan lemah
0 1 2 3 4 5 6 7 8 9 10 0 5 10 15 20 25 30 X YHUBUNGAN
KAUSAL
Hubungan X dan Y TIDAK kuat
Persamaan regresi TIDAK baik, TIDAK TEPAT digunakan untuk prediksi Y
X
Y
Regresi
Model regresi linier
sederhana
,
i= 1,2,…,n
Dimana :
: variabel tak bebas
: variabel bebas
: parameter / koefisien regresi
: error diasumsikan saling bebas dan
Cat : Linier dalam hal ini adalah linier dalam
parameter ( ).
0 1 i i iY
X
i Y i X 0, 1 i
2 0, i N 0, 1 Regresi
Parameter dan tidak diketahui nilainya dan
harus diduga/ditaksir dari data sampel.
Salah satu cara untuk menduganya/
menaksirnya adalah menggunakan metode
kuadrat terkecil, yaitu suatu metode untuk
menaksir parameter regresi dengan
meminimumkan jumlah kuadrat error.
0
1Model regresi linier
sederhana
MODEL REGRESI
LINEAR SEDERHANA
persamaan garis lurus adalah:
y = a + b x,
dimana :
y = peubah tidak bebas (dependent)
x = peubah bebas (independent)
a = intercept
yaitu suatu bilan-gan konstanta yang berarti rata-rata nilai peubah y sama dengan a jika peubah x = 0.
b = koefisien regresi / slope
CONTOH I
y = produksi mangga (dalam kwintal) dikaitkan dengan x
yaitu banyaknya pupuk yang dipakai (puluhan kg)
tanaman tersebut.
Persamaan regresinya dalam bentuk linier adalah
y = 3 + 0,5 x,
arti dari nilai-nilai model ini adalah :
• a = 3 rata-rata produksi mangga jika tidak diberi pupuk (x=0)
• b = 0,5 jika jumlah pupuk dinaikkan 1 (satu) unit (yaitu 10 kg) maka produksi mangga diperkirakan akan naik 0,5 kwintal.
CONTOH II
y = jumlah penumpang pesawat terbang dikaitkan
dengan x yaitu banyaknya penerbangan yang tersedia
Persamaan regresinya dalam bentuk linier adalah
y = 5 454 493 + 184166 x,
arti dari nilai-nilai model ini adalah :
• a = 5 454 493 rata-rata jumlah penumpang bila tidak ada penambahan penerbangan (x=0)
• b = 184 166 jika jumlah penerbangan dinaikkan 1 (satu) unit maka jumlah penumpang diperkirakan akan naik 184 166 orang.
METODA REGRESI
Nilai a dan b diperoleh berdasarkan nilai observasi/
pengamatan contoh (sampel).
Dari sejumlah n pasangan pengamatan x dan y yang
diamati akan memberikan nilai a dan b tertentu.
Nilai a dan b dihitung berdasarkan metoda kuadrat terkecil
(MKT) atau
‘ordinary least square estimations (OLS)’
karena metode ini memberikan jumlah kuadrat simpangan
nilai perkiraan dengan nilai sebenarnya yang relatif lebih
kecil dibandingkan metode-metode lain (minimum).
RUMUS ESTIMASI
n i i n i i n i i n i i n ix
x
n
y
x
xy
n
b
1 2 1 2 1 1 1)
(
n
x
b
n
y
x
b
y
a
n
i
i
n
i
i
1
1
TELADAN III
386 302 70 , 0 ) 386 ( ) 25020 )( 8 ( ) 302 )( 386 ( ) 19044 )( 8 ( 2 b x = Pendapatan rumahtangga y = Pengeluaran rumahtangga Worksheet : x y x2 x.y 18 23 28 32 41 59 86 99 17 20 23 27 32 46 63 74 324 529 784 1024 1681 3481 7396 9801 306 460 644 864 1312 2714 5418 7326 386 302 25020 19044 n = 8 x = 386 x2 = 25020 y = 302 x y = 19044CONTOH III
PENDAPATAN RUMAHTANGGA (X) PENGELUARAN RUMAHTANGGA (Y) X 2 XY (1) (2) (3) (4) 18 17 324 306 23 20 529 460 32 27 1024 864 41 32 1681 1312 59 46 3481 2714 86 63 7396 5418 99 74 9801 7326 28 23 784 644 J U M L A H =386 302 25020 19044 n = 8 8 8 ∑ xi = 386 ∑ xi2 = 25020 i = 1 i = 1 8 8 ∑ yi = 302 ∑ xi yi = 19044 i = 1 i = 1 (8) (19044) - (386) (302) b = --- = 0,699319834 (8) (25020) - (386) (386) a= (302)/8 - (0,699319834) (386/8) = 4,007817997 x = 100000 y = 4,00+(0,69*100000)= 69935,99124CONTOH IV
PENGADAAN BUS (X) TRAYEK BUS (Y) X2 XY
(1) (2) (3) (4) 8 48 64 384 8 49 64 392 9 55 81 495 9 59 81 531 10 65 100 650 14 70 196 980 15 75 225 1125 19 99 361 1881 30 104 900 3120 31 124 961 3844 23 138 529 3174 31 143 961 4433 J U M L A H = 206 1027 4520 21005 n = 12 12 12 ∑ xi = 267 ∑ xi2 = 10483 i = 1 i = 1 12 12 ∑ yi = 1027 ∑ xi yi = 29453 i = 1 i = 1 (12) (29453) - (267) (1027) b = --- = 3,430870891 (12) (10483) - (267) (267) a = (1027)/12 - (1,453519731) (267/12) = 26,68672