Untitled Document

(1)

i

SOPAR M.H.

PARANGINAN 2016

BASI

C

ECO

N

OMETRI

C

S

bY

Shazam

(2)

ii

“Lihatlah Ibu Aku membuat semuanya menjadi baru”

(3)

iii

DAFTAR ISI

Table of Contents

BAB 1

...1

ANALISIS REGRESI DUA PEUBAH

...1

BAB 2

... 16

MODEL REGRESI DUA PEUBAH

... 16

BAB 3

... 39

ASUMSI KENORMALAN :

... 39

MODEL REGRESI LINIIR NORMAL KLASIK

... 39

BAB 4

... 42

PENAKSIRAN SELANG DAN PENGUJIAN HIPOTESIS

... 42

REGRESI DUA PEUBAH

... 42

BAB 5

... 61

ANALISIS REGRESI MAJEMUK (BERGANDA):

... 61

MASALAH PENAKSIRAN

... 61

5.9

Determined Betta Coeficients of Structural Equation By

Crammer ... 79

( Menentukan Parameter Model 100 Variabel /Peubah)

... 79

BAB 6

... 86

INFERENSI REGRESI MAJEMUK

... 86

BAB 7

... 98

(4)

iv

GLOSARIUM RISET

Ekonometrika adalah perpaduan 3 disiplin ilmu : Matematika, Statistika dan Ekonomi.

Ekonometrika digunakan Ahli Ekonomi untuk Riset-riset Ekonomi.

Tapi sekarang Ekonometrika sudah dugunakan semua bidang Ilmu dan pro fesi.

Ekonometrika ditambah disiplin ilmu Fisika menjadi Ekonofisika. Bagan Ekonometrika dibuat sbb.:

Time Series Cross-Section

Pan

e

l

Kualitatif

Deskripsi Eksplorasi

Analisis : Faktor Jalur SEM Cluster Manova General

(5)

v

Bidang Profesi seperti : Kedokteran, Kependidikan, Manjemen, Pertanian, Akuntansi melakukan Riset dengan data Cross-sectionmengguna

kan : Analisis Jalur’ Analisis Faktor, Structural Eqution Modelling (SEM),

Analisis Cluster, dan Manova.

Bidang Sains seperti : Ekonomi, Fisika, Matematika, Kimia, dll. Melakukan Risetdengan data Time-series menggunakan General Equilibrium, Simultan Equation.

Riset Pooling (Panel) perpaduan dari time-series dan cross-section al.

Time-series riset dengan data minimal 18 tahun, berisi ratusan sampai ribuan variable (peubah).

ARIMAX (auto regresif integration moving average) dengan data jangka pendek , untuk bursa saham menggunakan data per detik.

Cross-section dengan data bulanan , dan kurang dari 10 variabel (peubah).

Tahun 2006 Aku dari Bandung menuju Medan naik Bus Lintas Timur, mengisi liburan Program Doktor UNPAD.

Kadangkala padat nya perkuliahan membuat penat, bapalagi tiap hari Minggu semua Program Doktor Ekonomi UNPAD harus ke SESKOAD diskusi dengan Para Jenderal AD dalam acara coffe-morning.

Aku sengaja pilih Lintas Timur, rute TAPANULI, hanya untuk melihat bagaimana Tapanuli 2006 setelah 60 tahun merdeka .

Sejauh mata memandang yang ada rumah-rumah sederhana, seperti tidak ada pembangunan, hanya ada pertanian padi, dan sedikit perkebunan.

Yang terlintas di pikiran Ku hanya ratusan variable ekonomi yang ada di TA PANULI , kenapa pertumbuhan ekonominya lamban ?

Kalau jumpa di perhentian aku melihat bagaimana Sumber Daya Manusianya yang masih sederhana.

Melihat usaha mereka hanya melibatkan sedikit capital.

(6)

vi

DipikiranKu sepanjang jalan menuju Medan hanya menganalisis ratusan variable yang ada di TAPANULI.

Kok bisa ? Itulah kelebihan Ilmu Ekonometrik, Anda bisa meneliti apa saja bahkan yang tak nampak di mata.

Di Bandung, minggu pertama di UNPAD Aku complain, kok Program Doktor taka da Mata Kuliah Ekonomerik ?

Akhirnya setelah UNPAD Lokakarya, dimunculkan Mata Kuliah Ekonometri ka, dan semua S1,S2, S3 wajib ikut Kuliah Ekonometrika.

Memang Aku ancam balik ke Medan kalok taka da Ekonometrika di UNPAD.

Mungkin mereka malu, Aku dari UNSYIAH NAD sangat fasih de ngan EKONOMETRIKA.

Mau jadi apa Riset tanpa Ekonometrika, kata Ku ?

Di samping rasa malu mereka juga pasti benci dengan Anak Medan meracau di Bandung.

Jika Anda tak mau dituduh JADUL jangan pernah takut dengan EKONOMETRIKA !

Berkatalah Prof.Fatimah Dosen Filsafat : “Ributlah seluruh Eropa karena Francis Bacon dan Spinoza. Untung ada Immanuel Kant.

AKU BERPIKIR MAKA AKU ADA Versus PERSEPSI MEMBENTUK

SEGALANYA LEWAT PENCERAPAN INDERAWI“

Sebenarnya yang disebut IMMANUEL KANT adalah Ekonometrika: Teori tanpa Data tak mungkin bisa diterima.

WITZGEINSTEIN Filosof Modern meracau : Sekarang ini taka da lagi Filosof yang menguasai Matematika, padahal dahulu seorang Filsuf harus menguasai semua Ilmu. Sekarang ini semuanya sudah terspesialisasi, jadi untuk menguasai semua ILMU rasanya gak mungkin lagi bisa, yang ada

(7)

vii

(8)

1

BAB 1

ANALISIS REGRESI DUA PEUBAH

Istilah Regresi

Istilah regresi diperkenalkan oleh FRANCIS GALTON.

Penjelasannya adalah bahwa ada kecenderungan bagi rerata tinggi anak-anak dengan orang tua yang mempunyai tinggi tertentu untuk bergerak atau

mundur (regress) kea rah tinggi rerata seluruh populasi.

KARL PEARSON mengumpulkan lebih 1000 catatan tinggi anggota kelom pok keluarga. Ia menemukan bahwa rerata tinggi anak leleki kelompok ayah (yang) tinggi kurang daripada tinggi ayah mereka dan rerata tinggi anak lelaki kelompok ayah (yang) pendek lebih besar dari pada tinggi ayahnya,

jadi “mundurnya” (“regressing”) anak lelaki yang tinggi maupun yang

pendek serupa kea rah rerata tinggi semua lelaki.

Ketergantungan Statistik vs Fungsional

Dalam analisis regresi perhatian diarahkan pada apa yang dikenal dengan ketergantungan antara peubah yang bersifat statistic, bukannya

fungsional (bersifat fungsi) atau deterministic, seperti pada ilmu fisika klasik.

Dalam hubungan di antara peubah yang bersifat statistic pada dasarnya menghadapi peubah random (acak) atau stokastik, yaitu peubah yang mempunyai distribusi probabilistas.

(9)

2

Regresi VS Korelasi

Analisis korelasi tujuan utamanya adalah untuk mengukur kuat atau

derajat hubungan linier antara dua peubah.

Analisis regresi berusaha untuk menaksir atau meramal nilai rerata sebuah peubah atas dasar nilai yang tetap peubah-peubah lain (ceteris paribus).

Istilah dan Notasi

Dalam berbagai literature istilah peubah tak bebas (dependent varia ble) dan peubah yang menjelaskan (explanotary variable) digambarkan de ngan berbagai cara, sbb. :

Peubah tak bebas Peubah yang menjelaskan

(Depandentvariable) (Explanotory variable)

 

Peubah yang dijelaskan Peubah bebas

(Explained variablr) (Independent variable)

 

Yang diramalkan Peramal

(Predictand) (Predictor)

 

Yang diregresi Yang meregresi

(Regressand) (Regressor)

 

(10)

3

(Response) (Stimulus or control variable)

Contoh Hipotesis

Analisis regresi terutama berkenaan dengan penaksiran dan/atau peramalan nilai rerata hitung atau nilai rerata (pupulasi) peubah tak bebas atas dasar nilai peubah yang menjelaskan yang tetap (fixed) atau diketahui.

Bayangkanlah Negara hipotesis dengan total penduduk (populasi) 60 keluarga. Misalnya Anda ingin berminat mempelajari hubungan antara belanja konsumsi keluarga mingguan Y dan pendapatan keluarga yang dapat dibelanjakan (disposable) atau setelah dipotong pajak mingguan X.

Asumsikan Anda ingin meramalkan rerata (populasi) tingkat belanja konsumsi mingguan dengan mengetahui pendapatan mingguan keluarga itu.

Untuk tujuan itu, misalkan Anda membagi 60 keluarga ke dalam 10 kelompok dari keluarga yang pendapatannya kira-kira sama dan memeriksa belanja konsumsi keluarga yang pendapatannya kira-kira sama dan memeriksa belanja konsumsi keluarga dalam tiap kelompok pendapatan ini.

Tabel berikut berisi hanya tingkat pendapatan yang benar-benar diamati.

Tabel Pendapatan keluarga mingguan X,$

Y X 80 100 120 140 160 180 200 220 240 260

belanja konsumsi keluarga mingguan Y,$

55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 176 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185

115 162 191

(11)

4

Tabel ditafsirkan sbb. : Cocok (berhubungan) dengan pendapatan mingguan $80, misalnya ada 5 keluarga yang belanja konsumsi mingguan nya berkisar antara $55 dan $75.

Tabel di atas, memberikan distribusibersyarat (conditional distribution)Y tergantung pada nilai X tertentu.

Tabel di atas menyatakan populasi, sehingga dapat dihitung probabi litas bersyarat(conditional probabilities) Y, , probabilitas Y untuk X tertentu (given X), sbb. Untuk X $80, misalnya, ada 5 nilai

= $55, $560, $65, $70, $75 . Jadi, dengan = 80, probabilitas untuk mendapatkan yang manapun dari belanja konsumsi ini adalah 1

5 .

Menggunakan lambing, = 55 = 80 =1 5.

Probabilitas bersyarat untuk Tabel di atas diberikan :

Tabel Probabilitas bersyarat � �

X

80 100 120 140 160 180 200 220 240 260

Probabili tas bersya rat �

1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 5 1 6 1 5 1 7 1 6 1 6 1 5 1 7 1 6 1 7 1 6 1 7 1 6 1 6 1 7 1 6 1 7 1 7 1 7 1 7 Rerata bersyarat (dari) Y

65 77 89 101 113 125 137 149 161 173

Sekarang untuk tiap distribusi probabilitas bersyarat (dari) Y Anda da pat menghitung rerata hitung atau nilai reratanya, yang dikenal sebagai

(12)

5

expecta tion),dinyatakan dengan dan dibaca “nilai Y yang

diharapkan untuk X tertentu”. (Perhatikan : nilai yang diharapkan hanyalah suatu rerata hitung populasi).

Harapan bersyarat ini dapat dihitung dengan mengalikan nilai Y yang relevan dalam Tabel pertama dengan probabilitas bersyaratnya pada Tabel kedua dan menjumlahkan hasil perkalian tadi.

Contoh, rerata hitung bersyarat atau harapan Y untuk X = 80 adalah

1

5 55 + 60 + 65 + 70 + 75 = 65, disajikan padi baris akhir Tabel di atas.

Gambar Distribusi bersyarat belanja konsumsi untuk berbagai tingkat pendapatan

Diagram pencar di atas menunjukkan distribusi bersyarat Y yang ber hubungan dengan berbagai nilai X.

Meskipun ada variasi dalam belanja konsumsi perorangan, Gambar menujuk kan dengan syarat jelas bahwa belanja konsumsi secara rerata meningkat bersama dsengan peningkatan pendapatan.

80 100 ₁₂₀ ₁₄₀ ₁₆₀

100 150 200

Pendapatan Mingguan, $

Bel

an

ja Kko

n

sums

i mi

n

g

u

an

(13)

6

Diagram pencar menunjukkan bahwa nilai rerata hitung (bersyarat) Y meningkat bersama meningkatnya X.

Diagram pencar menunjukkan bahwa rerata bersyarat ini tepat terletak pada garis lurus dengan kemiringan positif. Garis ini dikenal sebagai garis regresi,

atau, lebih umum, kurva regresi. Lebih tepat lagi, garis tadi adalah kurva regresi Y atas X.

Jadi, kurva regresi hanyalah suatu tempat kedudukan rerata bersyarat

atau harapan (expectation) peubah tak bebas untuk nilai tetap (fixed) peubah yang menjelaskan.

80 140 220

65 101 149

Rereta yang sesuai

PEndapatan mingguan,$

B

e

lan

ja

ko

n

su

m

si

m

in

g

u

an

,

$

(14)

7

1.1 Konsep Fungsi Regresi Populasi ( Popolation Regression Function

= PRF )

Tiap rerata bersyarat merupakan fungsi dari .

Dengan mengunakan symbol ,

= (1)

dimana menggambarkan sebuah fungsi dari peubah yang menjelaskan .

Persamaan (1) dikenal sebagai fungsi regresi populasi (dua-peubah) (PRF).

Seorang ahli ekonomi mungkin menduga bahwa belanja konsumsi ber hubungan secara liniir dengan pendapatan . Dengan demikian diasumsikan bahwa PRF merupakan fungsi liniir dari , sebutlah, dari jenis

= ₀+ ₁ (2)

dimana 0 1 parameter yang tak diketahui (besarnya) tetapi tetap

(fixed) disebut sebagai koefisien regresi , 0 1juga secara berurut-urut

dikenal sebagai intercept dan koefisien kemiringan (slope coefficient).

Persamaan (2) dikenal sebagai regresi populasi liniir.

Liniiritas

Liniiritas dalam Peubah

= 0+ 1 2

(15)

8

Liniiritas dalam Parameter

Fungsi liniir dari parameter dari β , mungkin liniir atau tidak dalam

peubah X.

Dalam penafsiran ini,

= 0+ 1 2 adalah fungsi liniir.

= ₀+ ₁ bukan fungsi liniir (non liniir).

Fungsi yang liniir dalam parameter maupun peubah disebut LRM (Liniir Regression Model).

Sfesifikasi Stokhastik PRF

Dengan tingkat pendapatan , belanja konsumsi keluarga secara indi vidu berkelompok di sekitar konsumsi rerata semua keluarga pada pendapatan , yaitu di sekitar harapan bersyaratnya (conditional expectation).

Jadi dapat dinyatakan penyimpangan (deviation) suatu secara individu dari nilai yang diharapkannya sbb.:

= − atau

(16)

9

dimana penyimpanan merupakan peubah random yang tak bisa diamati yang bisa bernilai positif atau negatif.

Secara tehnis, dikenal sebagai gangguan stokhastik (stochastic disturbance) ,atau factor kesalahan stokhastik (stochastic error term).

Sekarang persamaan (3) dapat dituliskan menjadi

= 0+ 1 + (4)

Jadi,belanja konsumsi secara individu untuk X = $80 dapat dinyatakan sebagai :

1= 55 = 0+ 1 80 + 1

5= 75 = 0+ 1 80 + 5 (5)

Sekarang jika persamaan (3) diambil ekspektasinya, diperoleh

= +

= + (6)

di sini = 0 ,

karena dapat bernilai negatif atau positif, jumlah seluruh sama dengan 0.

1.2 Fungsi Regresi Sampel (Sample Regression Function =SRF)

(17)

10

Andaikan Tabel populasi di atas tak diketahuidan satu-satunya infor masi adalah suatu sampel nilai-nilai Y yang dipilih secara random untuk X yang tetap (fixed) sbb.:

Tabel Sebuah Sampel Random dari Populasi

Y X

70 80

65 100

90 120

95 140

110 160

115 180

120 200

140 220

155 240

150 260

Apakah dari tabel ini dapat meramal rerata belanja konsumsi ming guan Y dalam populasi keseluruhan sesuai dengan X yang dipilih random ?

Dapatkah PRF ditaksir dari data sampel ?

Secara akurat mungkin tidak, karena ada fluktuasi sampling lain sbb.:

Tabel Sampel Random lain dari Populasi

Y X

55 80

88 100

90 120

80 140

114 160

120 180

145 200

135 220

145 240

(18)

11

Diagram pencar kedua tabel di atas dapat dibuat sbb.:

Tak ada satu yang membuat yakin bahwa salah satu dari garis regresi yang ditunjukkan mewakili garis regresi populasi.

Jadi garis regresi sampel ini hanya pendekatan PRF yang sebenarnya.

80 100 120 140 160 180 200 220 260

100 150

200 SRF1

SRF2

Pendapatan mingguan,$

B

e

lan

ja ko

n

su

m

si

m

in

g

u

an

,

$

(19)

12

Dengan demikian dapat dikembangkan konsep fungsi regresi sampel (SRF) untuk menyatakan garis regresi sampel, sbb.:

= ₀+ ₁ (7)

di mana ∧ = hatatau cap ("topi")

=

0= 0

1= 1

Sebuah penaksir atau statistic(sampel), hanya suatu aturan atau formula, atau metode yang mengatakan bagaimana menaksir parameter populasi dari informasi yang diberikan oleh sampel yang dimiliki.

Sebuah nilai angka khusus yang diperoleh oleh penaksir dalam suatu penerap an disebut taksiran (estimate).

SRF dapat dinyatakan dalam bentuk stokhastik sbb.:

= 0+ 1 + (8)

di mana factor residual/sisi (sampel). Dan sebagai taksiran untuk .

Jadi tujuan utama analisis regresi adalah untuk menaksir PRF

= 0+ 1 +

atas dasar SRF

= 0+ 1 +

(20)

13

Perhatikan gambar berikut :

SRF :

= ₀+ ₁

PRF :

= ₀+ ₁

A

Pendapatan mingguan, $

Bel

an

ja ko

n

sums

i mi

n

g

u

an

, $

(21)

14

Dalam SRF, untuk = , diperoleh

= + (9)

dan dalam PRF, dapat dinyatakan

= + (10)

Soal

1.Banyaknya ahli ekonomi dikelompokkan atas dasar tahun pengalaman dan umur (hanya ahli ekonomi yang bekerja penuh secara profesional )

Tahun Pertama Kelom

Pok umur (tahun)

2 2-4 5-9 10-14 15-19 20-24 Total

20-24 24 13 1 38

25-29 121 405 184 710

30-34 77 407 825 197 3 1599

35-39 18 125 535 780 194 1 1653

40-44 6 36 161 652 761 235 1851

45-49 1 15 48 183 433 751 1431

50-54 1 5 19 52 119 784 980

55-59 1 2 10 18 27 612 670

60-64 1 3 6 8 382 400

65-69 1 1 2 4 206 214

70-74 1 27 28

(22)

15

Tabel memberikan frekuensi mutlak bersama (joint absolute frequencies) peubah umur dan tahun pengalaman. Dengan menggunakan frekuensi relatif (frekuensi mutlak dibagi jumlah total) sebagai ukuran probabilitas :

(a) Dapatkan distribusi probabilitas bersama (joint probabilities distribu tion) umur dan tahun pengalaman.

(b) Dapatkan distribusi probabilitas bersyarat (dari) umur untuk berbagai tahun pengalaman.

(c) Dapatkan distribusi probabilitas bersyarat (dari) tahun pengalaman untuk berbagai umur.

(d) Denan menggunakan titik tengah berbagai selang unur dan tahun pengalaman, dapatkan rerata bersyarat dari distribusi frekuensi yang diperoleh dalam (b) dan (c).

(e) Jika Anda menghubungkan rerata bersyarat yang ditunjukkan dalam (d), apa yang diperoleh ?

(f) Apa yang bisa Anda katakana mengenai hubungan antara tahun penga lamn dan umur ?

Petunjuk :

Probabilitas Gabungan (Joint Probability) . Untuk peubah diskrit :

, = = =

= 0 ≠ ≠

X mengambil nilai x dan Y mengambil nilai y.

(23)

16

= ,

= , ,

di mana berarti jumlah untuk semua nilai Y.

Harapan Bersyarat

= = =

2. Tentukan apakah model berikut liniir dalam parameter, atau dalam peubah, atau kedua-duanya. Yang mana dari model-model ini adalah model regresi liniir ?

(a) = ₀+ ₁ 1 + (b) = ₀+ _{1 1}+ (c) = ₀+ ₁ ₁+

(d) = ₀− ₁ ₁+

(e) = _{0 1} 1₊ (f) = ₀+ _{1 1}+

(g) = 0+ (0.75− 0) − 1 −2 +

BAB 2

MODEL REGRESI DUA PEUBAH

(24)

17

OLS dikemukakan oleh CARL FRIEDRICH GAUSS, Matematikawan Jer man.

PRF :

= ₀+ ₁ +

dengan Asumsi-asumsi :

Asumsi 1

= 0 (11)

Perhatikan Gambar berikut, tiap populasi Y yang berhubungan dengan suatu X tertentu didistribusikan di sekitar nilai rerata dengan beberapa nilai Y di atas nilai rerata dan beberapa di bawahnya.

Jarak-jarak ini dari rerata adalah , dimana nilai rerata hitung dari deviasi (simpangan) ini harus sama dengan nol.

Artinya dapat bernilai negatif atau positif, sehingga jumlah totalnya sama dengan 0.

Rerata

X1 _X

2 X3 X4

Y

∶ = 0+ 1

(25)

18

Asumsi 2

, = − −

= −0 −0

=

= ,

= 0 ≠ (12)

di mana i dan j dua pengamatan yang berbeda dan di mana cov berarti kova rians.

Ini artinya, gangguan tidak berkorelasi.

Asumsi ini dikenal sebagai tidak adanya korelasi berurutan, atau taka da

autokorelasi.

Artinya, untuk Xi tertentu, simpangan tiap dua Y yang manapun dari niali reratanya tidak menunjukkan pola positif , di mana u positif diikuti u lain yang positif, atau u negatifdiikuti u lain yang negatif, atau u positif diikuti u

yang negatif. Pola sistematis ini menunjukkan adanya autokorelasi.

(26)

19

Asumsi 3

= − 2

= −02₌ 2₌_�2 ₍₁₃₎

Artinya, varians untuk tiap Xiadalah konstan (tetap) sebesar �2. Menyatakan asumsi homoskedasitisitas, atau sama penyebaran (skedasticity).

Korelasi nol

u

(27)

20

Berarti populasi Y yang berhubungan dengan berbagai nilai X mempunyai varians yang sama.

Perhatikan Gambar berikut :

Sebaliknya, dari Gambar berikut, varians bersysrat populasi Y meningkat dengan menungkatnya X. Situasi ini disebut heteroskedastisitas,atau penyebaran yang tak merata, atau varians yang tak sama, dengan symbol ditulis :

=�2 (14)

tanda indeks i menunjukkan varians populasi Y tidak lagi konstan.

atan

p

ro

b

ab

il

itas

ui

Y

X1

X2

X3

∶ = 0+ 1

(28)

21

Dalam Gambar akhir, varians meningkat bersama dengan meningkatnya penda patan.

Artinya keluarga yang lebih kaya secara rerata mengkonsumsi lebih banyak dari pada keluarga yang lebih miskin, tapi variabilitas belanja konsumsi keluarga yang lebih kaya juga lebih besar.

Asumsi 4

, = − − = −0 −

= −

= 0. − = 0 (15)

Gangguan u dan peubah yang menjelaskan X tidak berkorelasi.

Diasumsikan bahwa X dan u ( semua peubah yang diabaikan) mempunyai pe ngaruh yang terpisah (dan bersifat penjumlahan)atas Y.

Jadi kalau X dan u berkorelasi secara positif, X meningkat pada saat u

(29)

22

Suatu model regresi yang memenuhi keempat asumsi tadi dikenal se bagai model regresi klasik, standar, atau liniir umum. Model ini klasik dikem bangkan GAUSS tahun 1821.

Tabel Asumsi model regresi liniir klasik Asumsi

no

Terhadap u Terhadap Y 1 = 0 = 0+ 1

2 , = 0

≠

, = 0

≠

3 =�2 =�2

Prinsip OLS

PRF tidak dapat diamati secara langsung. PRF ditaksir dari SRF.

SRF :

= 0+ 1 + (8)

= + (9)

= − ₀− ₁ (16)

Jika ada N pasang observasi atas Y dan X tertentu, ingin ditetapkan SRF sedemikian sehingga sedekat mungkin dengan nilai Y yang sebenarnya.

Pilih SRF sedemikian sehingga jumlah residual (sisa) = − sekecil mungkin.

Perhatikan Gambar di bawah.

Misalkan, ₁, ₂, ₃, ₄ 10,−2, +2,−10 0.

(30)

23

2= − 2

= − ₀− ₁ 2 (17)

sekecil mungkin, di mana 2 adalah residual kuadrat.

e1

e2 e3

e4

X1 X2 X3 X4

SRF

= ₀+ ₁

(31)

24

Untuk memperoleh kuadrat terkecil yang minimum, maka persamaan (17) di differensial, diperoleh :

�

2

� 0

=

−

2

−

0

−

1

�

2

� 1

=

−

2

− 0− 1

Syarat optimum, kedua persamaan tadi disamakan dengan nol.

−2 − 0− 1 = 0

− 0− 1 = 0

− ₀− ₁ = 0

= ₀+ ₁ (18)

−2 − ₀− ₁ = 0

− 0 − 1 2 = 0

− 0 − 1 2= 0

= ₀ + ₁ 2 (19)

Menyelesaikan persamaan (18) dan (19) secara simultan, diperoleh :

(32)

25

Karena = 0 , maka diperoleh :

₁

=

2

Dengan mengurangkan tiap nilai X dan Y dengan reratanya, diperoleh :

₁

=

− −

− 2

Dengan mengingat

−

=

,

−

=

,

maka

1

=

2

(20)

Dan

₀

=

2 − 2₋2

=

−

₁ (21)

Penaksir yang diperoleh disebut sebagai penaksir kuadrat terkecil

ka rena diperoleh dari prinsip kuadrat terkecil.

2.2 Koefisien Determinasi r2 :

Suatu Ukuran “Kebaikan Suai” (“Goodness of Fit”)

Sebaik mana garis regresi sampel mencocokkan data ?

Jika semua pengamatan terletak pada garis regresi, maka diperoleh

(33)

26

= + (9)

atau dalam bentuk simpangan

= + (22)

Mengkuadratkan persamaan (22) dan menjumlahkan untuk semua sampel, diperoleh

2= 2+ 2+ 2

2= 2+ 2+ 0

2= 2₊ 2

2= ₁2 2₊ 2 ₍₂₃₎

Di sini = 0, diperoleh dengan cara berikut.

= 1

Dikali dan dijumlahkan seluruhnya diperoleh :

= 1

= 1 − 1

= 1 − 1 2

= 1 − 1

2 ₂

(34)

27

karena ₁

=

₂

,

maka baris akhir menjadi

= 1

2 ₂

− 1

2 ₂

= 0

Berbagai jumlah kuadrat pada persamaan (23) dapat digambarkan sbb. :

2= − 2₌_{total variasi nilai Y sebenarnya di}

sekitar reratanya, disebut jumlah kuadrat total ( total sum of squares, TSS).

2= − 2= − 2= 1

2 ₂

=variasi

nilai Y yang ditaksir di sekitar reratanya = , yang disebut secara benar sebagai jumlah kuadrat akibat regresi ( karena peubah yang menjelaskan), atau dijelaskan oleh regesi, atau jumlah kuadrat yang dijelaskan (explained sum of squares, ESS ).

2=residual atau variasi yang tak terjelaskan (unexplain ed) dari nilai Y di sekitar garis regresi, atau jumlah kuadrat residual (residual sum of squares, RSS).

Atau = +

Total variasi dalam nilai Y yang diamati di sekitar nilai rerata nya dapat dipisahkan ke dalam 2 bagian, sebagian oleh garis regresi dan bagian lain oleh kekuatan random karena tak semua pengamatan Y yang sebenarnya terletak pada garis yang dicocokkan.

1 =

+

=

−

2

− 2

+

2

(35)

28

Didefinisikan 2

=

−

2

− 2

=

(25)

Besaran 2_disebut _{koefisien determinasi (sampel)}_{, digunsksn untuk}

mengukur kebeikan-suai(gooness of fit) garis regresi,

Secara verbal, 2mengukurproporsi (bagian) atau prosentase total variasi

dalam Y yang dijelaskan oleh model regresi.

Sifat 2

:

1. 2besaran non negatif 2.Batasnya 0≤ 2≤1.

2_{= 1}_{berarti suatu kecocokan sempurna, sedangkan} 2_{= 0}_berarti

tak ada hubungan antara peubah tak bebas dengan peubah yang menje

laskan.

Di sini 2_{dapat pula dihitung demikian :}

2

=

2

=

1

2 ₂

2

=

₁2

2

2 (26)

(36)

29

2

=

₁2

2

2 (27)

di mana 2 2adalah varians sampel Y dan X.

sebuah besaran yang berhubungan erat tapi berbeda konsep adalah

koefisien korelasi, yang merupakan ukuran tingkat hubungan antara dua pe ubah.

Besaran nya dihitung dengan rumus :

= ± 2 ₍₂₈₎

atau dari definisi nya

=

2 2

=

−

2₋2 2₋2

(29)

yang dikenal sebagai koefisien korelasi sampel.

Sifatr :

1.r dapat positif atau negatif, tandanya tergantung tanda pembilang persamaan (29), yang mengukur kovariasi kedua peubah.

2.−1≤ ≤+1

3. , yaitu koefisien korelasi antara X dan Y

sama dengan koefisien korelasi antara Y dan X .

4. tergantung pada titik asal (origin) dan skala; yaitu jika didefinisi kan ∗= + dan ∗= + , di mana > 0, > 0, konstan, maka r antara X* dan Y* adalah sama dengan r antara peubah asli X dan Y.

(37)

30

6. hanyalah sebuahnukuran hubungan liniir atau ketergantungan liniir

saja, r tadi tak mempunyai arti untuk menggambarkan hubungan nonliniir.

7. r adalah hubungan liniir antara dua peubah, tapi tak perlu adanya hubungan causalitas.

8. = dalam regresi majemuk (berganda) nilainya diragukan.

Contoh :

Diberikan data sampel seperti Tabel berikut. Asumsikan bahwa Y berhubungan liniir dengan X . Data mentah diperlukan untuk mendapatkan taksiran koefisien regresi, kesalahan standar, dsb.

Data hipotesis belanja konsumsi mingguan keluarga Y dan pendapatan mingguan keluarga X

Y($) X($)

70 80

65 100

90 120

95 140

110 160

115 180

120 200

140 220

155 240

150 260

(38)

31

0= 24,4545 0 = 41,137 0 = 6,4138

1= 0,5091 1 = 0,0013 1 = 0,0357

� 2_{= 42,1591} 2_{= 0,9621} _{= 0,9809}

= 8.

di mana

1 = �

2

2 1 = �2

₀

=

2

�

2

0

=

2

�

≡ ; �2_≡ _atau

homoskedastik (Asumsi 3).

Nilai

�

2dihitung dengan rumus

� 2₌ 2

−2

di mana � 2_{adalah penaksir OLS dari}_�2_{yang sebenarnya tak diketahui dan}

di mana −2 dikenal sebagai derajat kebebasan(number of degree of freedom, df), 2 adalah jumlah kudrat residual residual sum of squares (RSS).

Istilah derajat kebebasan berarti jumlah total pengamatan dalam sam pel ( = N) dikurangi banyaknya kendali liniir bebas atau pembatasan (restriksi)yang diletakkan atas pengamatan .

Untuk menghitung RSS (residusl sum of squares) terlebih dulu ditentukan

1 0, jadi ada −2 pengamatan bebas . Untuk regresi tiga peubah

mempunyai −3df pengamatan bebas, untuk model k peubah akan

dipilih − pengamatan bebas. Jadi df = banyaknya parameter yang ditaksir.

(39)

32

Diketahui = 0+ 1 +

Maka

=

₀

+

₁

+

___________________ _

= ₁ + −

Juga diketahui

=

−

₁

_________________ _

=

₁ + −

− ₁

=

₁− 1 + −

2

=

₁− 1 + −

2

=

₁− 1 + −

2

=

1− 1

2 ₂

+

−

2

−2 ₁− ₁

−

= ₁− 1

2

− 2₊ ₋2₋

2 ₁− 1 − −

=

+ ₁− ₁ 2 −2 ₁− ₁

Diketahui bahwa : = − = 1− ₁

(40)

33

2 = − ₁− ₁ 2

Di sini dihitung sbb.:

Jika sebuah sampel random ₁, ₂,… , ditarik dari sebuah populasi normal dengan rerata �2_{, maka varians sampel}

2= 1

−1 − 2

atau

−

1

2

/

�

2

=

−

2

/

�

2

~

�

−1 2

di sini Chi-kuadrat mempunyai df =N – 1, karena ( ) telah digantikan oleh

(

diketahui

).

Karena rerata �2 adalah jumlah derajat kebebasannya (df) sendiri, maka

�2₋₁ = − 2

�2 = −1

Jadi = −1 = −1 �2

Dan 1− ₁ 2

= �2

Jadi 2 = − ₁− ₁ 2

2 = −1 �2

−

�2

=

₋2 �2

(41)

34

Jadi jika didefinisikan

�

2

=

2

−2

Maka

�2 ₌ 2 −2

=

1 −2

2

=

1

−2 −2 �

2

=

�

2

Yang menunjukkan

�

2adalah penaksir tak bias dari

�

2yang sebenarnya.

Untuk mencari 2_{digunakan rumus}

2= 2− 1

2 ₂

.

Oleh karenanya garis regresi yang ditaksir adalah

= 24,4545 + 0,5091 .

Arti dari garis regresi :

1= 0,5091, mengukur kemringn garis regresi.

Dari data mentah, jangkauan sampel antara $80 dan $260 per minggu pada saat X meningkat, katakana dengan $1, kenaikan rerata tingkat belanja konsumen mingguan yang ditaksir kira-kira 51 sen.

Nilai 0= 24,4545 , yang merupakan titik potong garis regresi

dengan sumbu Y (intersep), menunjukkan rerata tingkat belanja konsumen mingguan ketika pendapatan mingguan adalah nol (pengangguran).

Nilai 2_{= 0,9621}_{berarti bahwa 96% dari variasi dalam belanja}

(42)

35

Koefisien korelasi, = 0,9809 menunjukkan kedua peubah, belanja konsumsi dan pendapatan, berhubungan secara positif dengan tingkat yang tinggi

Tabel Anatomi model regresi klasik dua-peubah

Yang diasumsikan Yang diamati Gak dapat diamati Yang dapat dinyatakan Yang harus dihitung 0 1 yang sebenarnya ada 0 1 yang sebe narnya Beberapa kriteria pe naksiran, mi salnya kua drat terkecil 0 1

ui sebenarnya ada

sifat ui : (i) = 0 (ii) 2 =

�2

(iii) , =

= 0 ≠

ui

sebenarnya

2

Residual ei

=

residual = 0

� 2₌

siran �2

Populasi Y untuk X terten tu di mana

= 0+

1 +

Y dan X da lam suatu sampel ter tentu Y yang taka da dalam sampel Soal

1. Buktikan kesamaan asumsi

(43)

36

= 0+ 1 + . Dengan batasan (restriksi) = 0 dan

= 0, dapatkan penaksir 0 dan 1 dan tunjukkan kedanya identic

dengan penaksir kuadrat terkecil. Metode untuk mendapatkan penaksir ini disebut prinsip analogi.

3. Misalkan secara berurut menyatakan kemiringan (gradient) regresi Y atas X dan X atas Y. Tunjukkan bahwa

= 2_{di mana}_r_{adalah koefisien korelasi antara X dan Y.}

4. Koefisien korelasi tingkatan (peringkat) dari SPEARMAN didefinisikan sbb.:

= 1

−

6

2

2₋₁

di mana d =perbedaan tingkatan (peringkat) yang diberikan pada indivi du atau fenomena yang sama dan N = banyaknya individu atau fenomena yang diberi tingkatan (diranking). Peroleh

.

Petunjuk: berikan peringkat nilai X dan Y dari 1 sampai N. Perhatikan bahwa jumlah peringkat X dan Y masing-masing N(N+1) /2 dan kar enanya reratanay adalah (N+1)/2.

5.Hitung peringkat Spearman dari

Mahasiswa

A B C D E F

Peringkat: Tengah Semester

1 3 7 10 9 5

Peringkat : Atas

3 2 8 7 9 6

G H I J

4 8 2 6

5 10 1 4

6.Tingkat ke luar dari pekerjaan dan pengangguran di sector Industri sbb.

(44)

37

pekerjaan per 100

buruh, Y

2003 1,3 6,2

2004 1,2 7,8

2005 1,4 5,8

2006 1,4 5,7

2007 1,5 5,0

2008 1,9 4,0

2009 2,6 3,2

2010 2,3 3,6

2011 2,5 3,3

2012 2,7 3,3

2013 2,1 5,6

2014 1,8 6,8

2015 2,2 5,6

Asumsikan tingkat ke luar pekerjan Y berhubungan secara liniir dengan tingkat pengangguran X dalam bentuk = 0+ 1 + .

Taksirlah 0, 1, ( ).

Hitung 2 dan r.

7. Tabel berikut menyajikan tingkat perubahan ( % per tahun) indeks harga saham (IHSG) dan indeks harga konsumen (IHK) di beberapa Negara pasca PD II (sampai 1969)

Tingkat perubahan, % per tahun

Negara Harga saham,Y Harga saham,X

1.Australia 5,0 4,3

2.Austria 11,1 4,6

3.Belgia 3,2 2,4

4.Kanada 7,9 2,4

(45)

38

6.Denmark 3,8 4,2

7.Finlandia 11,1 5,5

8.Perancis 9,9 4,7

9.Jerman 13,3 2,2

10.India 1,5 4,0

11.Irlandia 6,4 4,0

12.Israel 8,9 8,4

13.Italia 8,1 3,3

14.Jepang 13,5 4,7

15.Meksiko 4,7 5,2

16.Belanda 7,5 3,6

17.Selandia Baru 4,7 3,6

18.Swedia 8,0 4,0

19.Britania Raya 7,5 3,9

20.AS 9,0 2,1

(a) Taksirlah parameter regresi liniir tingkat perubahan harga sa ham terhadap tingkat perubahan harga konsumen dan dapat kan 2 nya.

(b) Apakah saham biasa merupakan pelindung (hedge) terhadap inflasi? Apakah saham biasa tadi merupakan pelindung yang sempurna?

8. Jika dalam model

ln = 0+ 1 +

dan = 0+ 1 +

Y menyatakan belanja konsumsi dan X menyatakan pendapatan, tunjuk kan bahwa elastisitas belanja konsumsi berkenaan dengan pendapatan ditunjukkan oleh 1= 1 dan 1= 1 / , di mana E1 dan E2 ada lah elastisitas. Bagaimana Anda akan menginterpretasikan elastisitas ini?

(46)

39

9. Kurva belanja ERNST ENGEL (1821-1896) ahli statistic Jerman, menghubungkan belanja konsumen untuk sebuah barang (Y) dengan total pendapatannya (X). Perhatikan model berikut :

= 0+ 1 +

= 0+ 1 1/ +

ln = ln 0+ 1ln +

ln = ln 0+ 1ln 1/ +

= 0+ 1ln +

Yang mana di antara model tadi yang Anda pilih untuk kurva belanja Engel?

Petunjuk : Interpretasikan berbagai koefisien arah (gradien); dapatkan bentuk yang menggambarkan elastisitas belanja yang berkenaan dengan pendapatan, dst.

BAB 3

ASUMSI KENORMALAN :

MODEL REGRESI LINIIR NORMAL KLASIK

Di sini gangguan populasi (disturbance) ui didistribusikan secara nor

mal. Model ini disebut model regresi liniir normal klasik dua-peubah.

3.1 Distribusi Probabilitas Disturbance ui

Dalam OLS sebelumnya, diasumsikan :

i. 1 = 0

ii. , = 0

iii. =�2

iv. Dengan 3 asumsi ini, penaksir OLS tidak bias dan varians mini mum(BLUE, best linear unbiased estimator).

v. Semua asumsi diringkas menjadi

(47)

40

Untuk dua peubah yang didistribusikan secara normal kovarians atau korelasi nol berarti dua peubah tadi independen (bebas). Jadi, dengan asumsi (30) , tidak hanya tak berkorelasi tetapi juga terdistribusikan secara independen.

1. Dalam central limit theorem yang hebat itu, jika ada sejumlah peubah random yang didistribusikan secara indenpenden dan identic,

dengan beberapa perkecualian , jumlah distribusinya cenderung ke

distribusi normaljika ba nyak peubah seperti itu meningkat tak terbatas., inilah justifikasi asumsi kenormalan ui.

2. Sebuah varians dari central limit theorem menyatakan, sekalipun banyak peubah tak sangat besar atau jika peubah ini tak independen

benar ( strictly independent), jumlahnya masih didistribusikan secara normal.

3. Sifat distribusi normal, setiap fungsi liniir dari peubah-peubah yang

didistribusikan normal dengansendirinya didistribusikan secara normal.

3.2 Sifat Penaksir OLS di bawah Asumsi Normal

Dengan asumsi normal, ₀

,

₁

,

_�2mampunyai sifat-sifat stati stic :

1.Penaksir tidak bias

2.Penaksir mempunyai varians minimum; ditambah sifat 1, penaksir menjadi efisien.

3.Konsisten, dengan meningkatnya ukuran sampel tak terbatas, penaksir mengarah ke (converge) nilai populasi sebenarnya.

4. ₀

,

₁didistribusikan normal dengan :

Rerata : ₁

=

₁

1

=

2

=

− 2

(48)

41

=

₂

= 0

=

₂

=

0

+

1

+

=

(

₀

+

)

=

0

+

1

+

=

0

₂

+

1

2

2 2

+

2

=

₀

−

2

+

1

2

+

−

2

=

₀

−

2

+

1

+

−

2

= 0 +

₁

+ 0 =

₁

(31)

0

:

�

₀ 2

=

2

�

2 (32)

atau,

0 0

,

�

0

2 ₍₃₃₎

5. −2 � 2_/_�2_{didistribusikan secara distribusi}_�2_{(Chi-kuadrat) de}

ngan derajat kebebasan = −2. 6. ₀

,

₁didistribusikan secarabebas dari � 2

7. ₀

,

1mempunyai varians minimum dalam seluruh kelas

(49)

42

Kareana ₁ ₀adalah fungsi liniir dari ui , dan ui terdistribusi

normal, maka 1 0 juga terdistribusi normal, dengan demikian Yi terdistribusi normal juga.

Rerata : = ₀

+

₁

(34)

=

�2 ₍₃₅₎

atau

₀

+

₁

,

�2 ₍₃₆₎

BAB 4

PENAKSIRAN SELANG DAN PENGUJIAN HIPOTESIS REGRESI DUA PEUBAH

Penaksiran Selang

Diperoleh kecenderungan konsumsi marjinal (MPC) yang ditaksir

1= 0,5091 , yang merupakan taksiran tunggal dari MPC populasi 1yang tak diketahui. Sampek di mana ini bisa dipercaya ?

Dalam statistic, penaksir dapat dipercaya diukur dengan kesalahanstandar

(se) atau varians nya .

Jadi penaksir itu harus berada di selang tertentu atau selang di sekitar parameter sebenarnya, misalnya dalam 2 atau 3 se.

(50)

43

Diusahakan, menemukan dua angka positif dan , dimana 0 < < 1, sede mikian sehingga probabilitas bahwa selang ₁

−

, ₁

+

berisi (mengandung) 1.sebenarnya adalah 1− .

Atau

₁

−

≤ 1.≤ ₁

+

= 1− (37)

Kalau selang ini ada disebut selang keyakinan (confidence interval); 1− disebut koefisien keyakinan;dan disebut tingkat penting (level of signi ficance). Titik ujung selang keyakinan disebut batas keyakinan/ confibence limits (nilai kritis), ₁

−

sebagai batas keyakinan bawah dan ₁+ sebagai batas atas keyakinan.

Dalam praktek digunakan 100 100 1− persen.

4.1 Distribusi Normal, t, � dan F : Sebuah Penyimpangan

Beberapa distribusi yang berhubungan dengan distribusi Normal.

Teorema 1 : Jika , ₂,… , peubah random yang didistribusikan se

cara bebas dan normal sedemikian sehingga 1,�2 , maka

jum

lah = , di mana konstan tidak semua nol, juga didistribusi

kan secara normal dengan rerata dan varians 2�2 ; yaitu

, 2�2 _.

Teorema 2: Jika , ₂,… , peubah random yang didistribusikan se

(51)

44

normal yang distandardisir , maka 2 mengikuti distribusi Chi-kua

drat dengan derajat kebebasan N. menggunakan symbol, 2 �2,

di mana N menggambarkan derajat kebebasan nya (df).

Teorema 3:Jika , 2,… , peubah random yang didistribusikan

se

cara bebas masing-masing mengikuti suatu distribusi Chi-kudrat de

ngan derajat kebebasan , maka jumlah juga mengikuti distribusi

Chi-kuadrat dengan = df, derajat kebebasan.

Teorema 4:jika Z1 peubah yan distandardisir 0,1 dan peu bah lain Z2menkikuti distribusi Chi-kuadrat dengan derajat kebebasan

k dan bebas terhadap Z1, peubah tadi didefinisikan sebagai

=

1

2/

=

1

2

(38)

mengikuti distribusi Student t dengan derajat kebebasan k.

Teorema 5 :Jika Z1 dan Z2 peubah Chi –kuadarat yang didistribusikan secara bebas dengan derajat kebebasan berurut-urut k1 dan k2, maka

peubah

=

1/ 1

2/ 2

(39)

(52)

45

4.2 Selang Keyakinan Untuk Koefisien Regresi � dan �

Jadi misalnya, peubah

=

1− 1

₁

= 1− 1 2

�

(40)

adalah peubah normal yang distandardisir. Distribusi Normal dapat digunakan untuk membuat pernyataan probabilistic 1 asalkan varians

populasi yang sebenarnya �2 diketahui. Jika �2 diketahui, sifst penting peubah yang didistribusikan secara normal dengan rerata dan varians �2, bahwa luas di bawah kurva normal antara ±� kira-kira 68%, antara batas

± 2� kira-kira 95%, dan antara �± �kira-kira 99,7%.

Tapi �2 jarang diketahui, dalam praktek ditentukan dengan penaksir tak bias � 2. Dengan menggantikan � dengan � , persamaan (40) menjadi

= 1− 1 2

�

(41)

di mana 1 sekarang menyatakan kesalahan standar yang ditaksir.

Persamaann (41) diturunkan sbb.:

Misalkan ₂

=

−

2

� 2

�2dan 1persamaan (40).

Asalkan

�

diketahui, 1 mengikuti distribusi normal yang distandardisasikan

; yaitu ₁

~

0,1

.

2mengikuti distribusi Chi-kuadrat dengan = − 2.

(53)

46

=

1 −2

2

Substitusi ₁ ₂diperoleh (41).

Ditunjukkan bahwa peubah t mengikuti distribusi t dengan derajat kebebasan

−2. Jadi distribusi normal tak digunakan, jadi selang keyakinan untuk 1

sbb. :

− /2≤ ≤ /2 = 1− (42)

di mana /2 adalah nilai peubah t yang diperoleh dari distribusi t untuk

tingkat arti (penting, signifikan) /2 dan derajat kebebasan −2.

substitusi (41) ke (42) diperoleh

− /2≤ 1− 1

1 ≤ /2 = 1− (43)

atau

1−

2 1 ≤ 1≤ 1

+ _/2 ₁ = 1−

(44)

Dengan ₁= 0,5091, ₁ = 0,0357, = 8,.

Jika diasumsikan = 5%, 95% , maka tabel t

menunjukkan bahwa derajat kebebasan 8, /2 = 0,025 = 2,306.

Substitusi ke (44) diperoleh :

0,4268≤ ₁≤0,5194

(54)

47

9,6643≤ ₀≤39,2545

4.3 Selang Keyakinan untuk �

Di bawah asumsi kenormalan, peubah

�

2

=

−

2

� 2

�2

(45)

mengikuti distribusi

�

2

dengan derajat kebebasan

−

2

df.

Jadi menggunakan distribusi

�

2untuk menetapkan selang keyakinan untuk

�

2

:

�

₁2₋ _/2

≤ �

2

≤ �

2_/2

= 1

−

(46)

di mana

�

₁2₋ _/2

�

2_/2diperoleh dari Tabel Chi-kuadrat untuk derajat kebebasan −2sehingga kedua nilai ini memotong 100 /2persen daerah ujung distribusi

�

2.

Substitusi (45) ke (46) diperoleh :

−2 �

2 �12− /2

≤ �

2

≤

₋₂ �2

�2/2

= 1− (47)

yang memberikan 100 1− persen selang keyakinan untuk

�

2

.

2,5%

2,5% 95%

�2

e

p

ad

(55)

48

Dari perhitungan diperoleh � 2_{= 42,1591}_{dan derajat kebebasan 8.}

Jika = 5% , Tabel Chi-kuadrat memberi nilai kritis �0,0252 = 17,5346dan

�0,9752 = 2,1797 . Nilai-nilai ini menunjukkan bahwa probabilitas nilai

Chi-kuadrat melebihi 17,5346 adalah 2,5% dan probabilitas 2,1797 adalah 97,5%.

Substitusi data ke (47) diperoleh

19,231≤�2≤154,7038

4.4 Pengujian Hipotesis : Pendekatan Selang Keyakinan

Untuk menggambarkan selang keyakinan, digunakan contoh terda hulu, konsumsi-pendapatan.

Di sini, MPC yang ditaksir ₁= 0,5091.

Missal sekarang diasumsikan

₀: ₁= 0,3

(56)

49

Hipotesis nol adalah hipotesis sederhana sedangkan hipotesis alterna tif adalah hipotesis gabungan. Apakah ₁ yang diamati sesuai dengan H0 ?

Selang jangka panjang seperti diperoleh sebelumnya

0,4268 , 0,5914 akan memuat 1 sebenarnya dengan probabilitas 95%.

Dalam jangka panjang (penyampelan berulang) selang demikian memberikan sebuah jangkauan (range) atau batas-batas mana 1 mungkin terletak,

ddengan koefisien keyakinan misalnya 95%.

Jadi selang keyakinan tadi memberikan sekelompok hipotesis nol yang masuk akal.

Karenanya, jia 1 dalam H0 berada dalam selang keyakinan 100 1− per sen, Anda bisa menerima H0, jika 1 terletak di luar selang, Anda akan meno

laknya.

Jadi, pendekatan selang keyakinan terhadap pengujian hipotesis terdiri dari pertama mendapatkan selang-keyakinan yang sesuai dankemudian menguji apakah nilai dalam H0 terletak di dalam atau di luar selang.

Untuk contoh hipotesis, 0: 1= 0,3jelas terletak di luar selang keyakinan

95% untuk 1. Jadi hipotesis tadi ditolak; probabilitas untuk mengamati 1

seperti itu ( dengan 1= 0,3) urang dari 2,5%.

4.5 Pengujian Hipotesis :

Pendekatan Pengujian Tingkat-Penting (Test-of Significance)

Melengkapi metode selang-keyakinan pengujian hipotesis statistic dengan pendekatan pengujian tingkat tingkat penting di sepanjang garis yang independen oleh R.A.FISHER dan NEYMAN dan PEARSON.

Pengujian tingkat-penting adalah prosedur dengan mana hasil sampel digunakan untuk menguji kebenaran atau kepalsuan sebuah hipotesis nol.

Ide dasar di belakang pengujian tingkat penting adalah pengujian atas statistic uji (estimator) dan distribusi sampling statistic seperti itu dalam hipotesis nol.

(57)

50

Sebagai ilustrasi, ingat bahwa dengan asumsi enormalan peubah

= 1− 1 2

�

mengikuti distribusi t dengan derajat kebebasan −2.

Jika nilai 1sebenarnya yang dispesifikasikan dalam hipotesis nol, nilai t da

pat segera dihitung dari sampel yang tersedia. Dan karenanya dapat berlaku se bagai statistic uji.

Karena statistic uji ini mengikuti distribusi t, pernyataan mengenai selang-ke yakinan spt.berikut ini dapat dibuat :

−

_/2

≤

1− 1∗

1

≤

/2

= 1

−

(48)

di mana ₁∗adalah nilai 1 dalam H0 dan di mana

−

_/2

_/2adalah nilai t yang diperoleh dari Tabel t untuk tingkat penting /2 dan derajat kebebasan −2 .

Mengatur kembali (48) diperoleh

1 ∗₋

2 1 ≤ 1≤ 1 ∗₊

/2 1 = 1−

(49)

yang memberikan selang dalam mana 1 akan berada dengan probabilitas

1− , dengan mengingat 1= ₁∗.

(58)

51

hipotesis nol) dan daerah (daerah-daerah) selang keyakinan disebut daerah (daerah-dae rah)penolakan (dari H0) atau daerah (daerah-daerah) kritis.

Batas keyakinan, titik ujung selang-keyakinan, juga disebut nilai-nilai kritis.

Dalam prosedur selang-keyakinan Anda mencoba untuk menetapkan batas dalam mana nilai 1 yang sebenarnya tetapi tak diketahui letaknya,

sedangkan dalam pengujian tingkat penting Anda menghipotesiskan beberapa nilai untuk 1 dan mencoba untuk melihat apakah 1 yang dihitung

terletak dalam batas (keyakinan ) yang layak di sekitar nilai yang dihipootesiskan.

Kembali pada Contoh sebelumnya, konsumsi-pendapatan.

Diketahui � = ,� � , � = 0,0357, dan derajat kebebasan = 8.

Asumsikan = 5% , _/2= 2,306.

Misalkan ₀: ₁= ₁∗= 0,3 ₁: ₁≠3, menjadi

0,2177≤ � ≤0,3823 = 0,95

perhatikan Gambar, Daerah kritis 2,5% � = ,� � � � � � � ,�% 0,3823 0,2177 � � K e p ad atan

Gambar Selang keyakinan 95% untuk � dengan hipote sis bahwa � = ,

(59)

52

Dapat pula dihitung nilai t di tengah ketidaksamaan ganda (48) dan melihat apakah t tadi terletak antara nilai-nilai t kritis atau di luarnya.

=

0,5091−0,3

0,0357

= 5,86

yang terletak dalam daerah kritis Gambar di atas; Kesimpulan menolak H0. Dalam bahasa pengujan tingkat arti, sebuah statistic dikatakan

penting secara statistic (statistically significant) jika nilai statistic uji terletak

dalamdaerah kritis. Dalam kasus ini hipotesis nol ditolak.

Dikatakan secara statistictidak penting jika nilai statistic uji terletak dalam daerah penerimaan. Hipotesis Nol diterima.

Pengujan di atas disebut pengujian dua-sisi (two-sided), atau dua ujung (two-tail) karena menunjukkan kedua ujung ekstrim distribusi probabilitas yang relevan, daerah penolakan, dan menolak hipotesis nol jika terletak di ujung manapun.

Ini karena H1 merupakan hipotesis gabungandua ujung,

1: 1≠3, baerarti 1 bisa lebih besar atau kurang dari 0,3.

Tetapi jika ₁: ₁> 0,3 , merupakan satu ujung.

(60)

53

= _0,05, yaitu tingkat 5%. Perhatikan Gambar berikut.

Perhatikan peubah berikut :

�

2

=

−

2

� 2 �2

dengan hipotesis di atas, � 2= 42,1591 dan derajat kebebasan 8. Jika didalil kan 0:

�

2

= 85

lawan 1:

�

2

≠

85

,

persamaan di atas memberikan

statistic uji untuk H0.

Substitusi nilai yang sesuai ke dalam persamaan diperoleh H0, �2= 3,97 . Asumsikan = 5%, nilai �2_{kritis adalah 2,1797 dan 17,5346.}

Karena �2_{dihitung terletak antara batas-batas ini, data mendukung hipotesis}

nol dan dapat diterima.

Pengujian ini disebut pengujian tingkat penting Chi-kuadrat.

0,3664 0,3

K

e

p

ad

atan

95% Daerah Penerimaan

1= 0,5091 terletak

dalam daerah kritis 5% 1

(61)

54

4.2 Analisis Regresi dan Analisis Varians

Analisis regresi dari segi pandangan anlisis varians melengkapi masa lah inferensi yang bersifat statistic.

Di depan telah diperoleh identitas :

(62)

55

yaitu, = + , mermecah kuadrat total ke dalam dua komponen;

jumlah kuadrat yang dijelaskan (ESS) dan kuadrat residual (RSS).

Studi ini disebut analisis varians (ANOVA) dari sudut pandang regresi.

Berkaitan dengan tiap jumlah kuadrat adalah derajat kebebasan (df

) banyaknya pengamatan independen yang mendasarinya.

TSS mempunyai derajat kebebasan −1 karena kehilangan 1 derajat kebebas an dalam menghitung rerata sampel .

RSS memiliki derajat kebebasan −2 .(Ini hanya benar untuk model regresi 2 peubah termasuk intersep 0).

ESS mempunyai 1 derajat kebebasan (hanya benar untuk kasus 2 peubah), karena = ₁2 2_{adalah fungsi dari}

1 saja karena 2 diketahui.

Peubah berikut diperoleh dari Tabel ANOVA ,

=

1

2 ₂

2_/ ₋₂ (50)

Persamaan (50) dapat diturunkan sbb.:

Persaman (40) menunjukkkan bahwa 1~ 0,1 . Mengunakan Teorema 2,

diperoleh, kuantitas

2== 1− 1

2

�

2

2= 1− 1

2 2

�2

(63)

56

₂

=

−2 � 2

�2

=

2

�2

juga mengikuti distribusi �2_{dengan derajat kebebasan} ₋₂_.

2didistribusikan secara independen dari 1

.

Maka menerapkan Teprema 5, diperoleh

= 2/1

2/ −2

=

1− 1

2 ₂

2_/ ₋₂

mengikuti distribusi F dengan derajat kebebasan berurut-urut 1 dan −2 .

Dengan anggapan berlaku hipotesis nol 0: 1= 0, F rasio bisa disederhana

kan menjadi persamaan (50)

=

1

2 ₂

2_/ ₋₂

Tabel ANOVA model regresi dua-peubah Sumber

variasi

SS df MSS = SS/df

Akibat Regresi

(ESS)

2₌

12 2 1 12 2

Akibat residual (RSS)

2 N –2 2

(64)

57

TSS 2 N –1

Dengan asumsi gangguan disturbance uididistribusikan secara nor

mal dan 0: 1= 0, dapat ditunjukkan bahwa F dari (50) memenuhi kondisi

Teorema 5.5 dan karenanya mengikuti distribusi F dengan derajat kebebbasan 1 dan N –2.

Dari (50) dapat ditunjukkan

₁2 2 ₌_�2₊

12 2 (51)

dan

2

−2

=

�

2

=

�

2 ₍₅₂₎

Pada ruas kanan (51) dan (52) parameter yang muncul 1 dan

�

2adalah yang

sebenarnya.

Jika pada kenyataannya 1 adalah nol, maka kedua persamaan memberikan

taksiran yang identic �2.

Dalam situasi ini, peubah yang menjelaskan X sama sekali tidak mempunyai pengaruh liniir atas Y dan seluruh variasi dalam Y dijelaskan oleh gangguan random ui .

Oleh karena itu , rasio F memberikan sebuah pengujian hipotesis nol

0: 1= 0 .

F dapat dihitung dari sampel yang tersedia, dan membandingkannya dengan nilai F kritis dari Tabel F.

Ada hubungan yang menarik antara pengujian tingkat penting F dengan pengujian t yang dijumpai sebelumnya.

(65)

58

Jika diasumsikan ₀: ₁= 0, maka contoh konsumsi-pendapatan dengan menerapkan nilai t yang diperoleh adalah 14,26. Nilai t ini mempunyai derajat kebebasan 8.

Dengan hipotesis yang sama nilai F adalah 202,87 dengan derajat kebebasan 1 dan 8. Jadi (14,26)2 = nilai F.

Soal

1. Menggunakan soal no.7 BAB 2

(a)Hitung kesalahan standar (se) taksiran parameter dan taksir �2. (b)Tetapkan selang keyakinan 95% untuk 0, 1, �2.

(c)Uji hipotesis berikut pada tingkat penting 5% : (i) 1= 0, (ii) 0= 0

(d)Dapatkah Anda menguji hipotesis bahwa 0= 1 secara simultan

de ngan menggunakan pengujian t ? Kenapa tidak ?

2. Tabel ANOVA untuk soal n0.6 BAB 2 adalah sbb.:

Sumber variasi SS df MSS

Karena regresi 2,153 1 2,153

Karena residual 1,144 11 0,104

Total 3297 12

Atas dasar data tadi, ujilah hipotesis nol bahwa tingkat keluarnya kar

yawan tidak berhubungan secara liniir dengan tingkat pengangguran.

(66)

59

Tahun dan triwulan

(kuartal)

Indeks kompensasi per jam (1967 =100)

Indeks hasil per jam (1967 -100)

1971-2 131,0 107,0

-3 133,3 108,4

4 134,1 107,9

1972-1 137,3 109,0

-2 138,9 110,6

-3 140,4 114,4

-4 143,0 113,1

1973-1 147,6 114,4

-2 149,5 113,2

-3 152,1 113,3

-4 155,5 113,2

1974-1 158,4 111,7

-2 163,4 111,0

-3 168,2 110,5

-4 172,1 109,4

1975-1 176,6 109,8

-2 179,3 114,4

-3 182,3 114,0

-4 185,6 114,3

(a)Gunakan model regresi liniir yang sesuai untuk mengetahui apakah ada hubungan antara produktivitas tenaga kerja rerata dan kompensasi rera ta.

Petunjuk : Petakan lebih dulu diagram pencarnya

(b)Gunakan pengujian t dan F untuk menguji hipotesis bahwa tidak ada hubungan antara produktivitas dengan kompensasi.

4. Tunjukkan bahwa koefisien determinasi r2yang didefinisikan dalam (26) dapat juga dihitung sbb.:

(67)

60

=

2

22

di mana Yi = Y sebenarnya, = , dan = = . Dengan menggunakan kata-kata, koefisien determinasi r2 adalah kuadrat koefisien korelasi antara Y sebenarnya dan Y taksiran.

Petunjuk : Terapkan definisi r yang diberikan dalam (29) dan ingat bahwa

= + = 2_.

Catatan : Hubungan tadi berlaku bahkan jika ada lebih dari satu peubah yang menjelaskan ( explanatory variable) dalam model; yaitu hubungan tadi berlaku untuk model regresi majemuk (berganda).

5. R.A.Fisher telah mendapatkan distribusi sampling koefisien korelasi yang didefinisikan dalam (29). Jika diasumsikan bahwa peubah X dan Y didistribusikan secara normal gabungan (jointly normally distributed), yaitu bila peubah-peubah tadi berasal dari distribusi normal

bivariate , maka dengan asumsi, maka dengan asumsi bahwa koefisien korelasi un tuk populasi �= 0, dapat ditunjukkan bahwa

= ₋2/ 1− 2_{mengikuti distribusi Student}_t_{dengan derajat}

kebebasan (df) sebesar −2 .

Tunjukkan bahwa nilai t ini indentik dengan nilai t yang diberikan dalam (41) dengan mengingat berlakunya hipotesis nol bahwa 1= 0. Jadi

tentukan bahwa dengan hipotesis nol yang sama = 2_.

6. Garis pasar modal (capital market line,CML) dari teori portofolio men dalilkan sebuah hubungan liniir antara tingkat hasil yang diharapkan dan risiko ( diukur dengan deviasi standarnyaa0 untuk portofolio yang efisien sbb.:

= 0+ 1�

di mana =

dan � = .

(68)

61

Nama dana bersama Tingkat hasil

tahunan rerata,%

Deviasi standar ting kat hasil tahunan,%

Boston Fund 12,4 12,1

Delaware Fund 14,4 21,4

Equity Fund 14,6 18,7

Fundamental Investors

16,0 21,7

Investors Mutual 11,3 12,4

Loomins-Sales Mutual Fund

10,0 10,4

Massashusetts Investors Trust

16,2 20,6

New England Fund 10,4 10,2

Putnam Fund of Bos ton

13,1 16,0

Wellington Fund 11,3 12,0

7. Misalkan persamaan indifference curve antara dua barang adalah:

= 0+ 1

Bagaimana Anda akan menaksir parameter model ini? Gunakan model tadi terhadap data berikut dan berikan komentar atas hasil Anda :

Konsumsi barang X : 1 2 3 4 5 Konsumsi barang Y : 4 3,5 2,8 1,9 0,8

BAB 5

ANALISIS REGRESI MAJEMUK (BERGANDA): MASALAH PENAKSIRAN

5.1 Model Tiga Peubah

(69)

62

= ₁+ _{2 2} + _{3 3} + (53)

i menyatakan observasi ke i.

YULE menulis dengan notasi demikian :

= 1,23+ 12,3 2 + 13,2 3 + (54)

di mana indeks bawah koefisien diinteroretasikan sbb.: indeks bawah satu menyatakan peubah tak bebas Y, 2 menyatakan peubah yang menjelaskan X2,

dan 3 menyatakan peubah yang menjelaskan X3. (Notasi lain untuk Yiadalah

X1i).

1,23 faktor intersep. Memberikan gambaran pengaruh (efek) rerata

semua peubah