PADA SAMPLING KELOMPOK
ARTIKEL
Oleh
ISWAHYUDI JOKO S, S.Si, M.Pd
PROGRAM STUDI PENDIDIKAN MATEMATIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS MUHAMMADIYANEGERI SEMARANG
ANALISIS PENAKSIRAN REGRESI LINIER
PADA SAMPLING KELOMPOK
Iswahyudi Joko Suprayitno
Abstrak
Analisis penaksiran regresi linier merupakan salah satu cara estimasi untuk meningkatkan ketelitian penaksiran dengan memanfaatkan hubungan antara variabel x dan y agar kedua variabel tersebut mendekati linier. Dalam skripsi ini akan dibicarakan analisis penaksiran regresi linier pada sampling kelompok.
Permasalahan dalam penelitian ini adalah:
1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada
sampling kelompok?
2. Berapakah besarnya bias dari penaksir regresi linier sederhana?
3. Apakah regresi linier sederhana lebih efisien bila dibandingkan dengan sampling
kelompok ( cluster sampling )?
Tujuan penelitian ini adalah untuk mengetahui besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok, mengetahui besarnya bias dari penaksir regresi linier sederhana dan menunjukkan secara teoritis bahwa penaksir regresi linier sederhana sebagai penaksir yang efisien pada kondisi tertentu. Penelitian ini meliputi ruang lingkup yaitu regresi linier sederhana dan sampling kelompok. Objek penelitiannya adalah perbedaan antara penaksiran regresi linier sederhana dengan penaksiran pada sampling kelompok. Variabel/fokus pembicaraan dari penelitian ini yaitu penaksiran variabel dependen pada regresi linier sederhana, penaksiran variabel dependen pada rata-rata sampel, penaksiran bias pada regresi linier, penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi linier sederhana. Teknik dan olah data dengan menggunakan studi pustaka, perumusan masalah, pengumpulan data dan penyelesaian masalah.
Simpulan dari penelitian ini yaitu besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok . Besarnya bias dari penaksir regresi linier pada
sampling kelompok adalah , bias ini akan menjadi kecil jika hubungan antara xi dan yi
mendekati linier. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok karena kecuali .
Kata kunci: Pembelajaran matematika realistik, turnamen belajar, LKS, ekspositori, dan ketuntasan belajar siswa.
PENDAHULUAN
Sampel adalah sebagian anggota dari populasi yang dipilih dengan menggunakan prosedur tertentu sehingga diharapkan dapat mewakili populasinya. Banyak anggota sutau sampel disebut ukuran sampel, sedangkan suatu nilai yang menggambarkan ciri sampel disebut statistik. Selain itu statistik juga berarti data yang berupa angka hasil pencatatan atas suatu kejadian.
)ˆ(1−= 21(−2) minlr nSy ρ f y V (2 ) 1 x i i S X x eE n f − −)( 21(2 )() 2 y y lr S Nn nN yV S Nn nN yV
ρ
==
−−ρ0
−=〈Dalam mengolah data peneliti akan selalu berkepentingan untuk menentukan hubungan antara dua atau lebih peubah. Hubungan tersebut mungkin renggang atau mungkin pula erat. Pada satu pihak, dua peubah mungkin bebas satu sama lain. Dalam keadaan seperti itu, korelasinya nol. Pada ekstrim yang lain, kedua peubah bergantung sepenuhnya pada yang lain. Bila kedua peubah tersebut linier keduanya disebut kolinear, maka harga mutlak korelasinya satu.
Dalam suatu keadaan model dapat menolong peneliti dalam menentukan hubungan kausal antara dua atau lebih peubah. Hubungan kausal tentu saja merupakan perhatian yang besar bagi tiap peneliti. Ada tidaknya hubungan kausal antara peubah tidak dapat diputuskan dengan hanya menggunakan data statistik.
Secara umum, model merupakan penyederhanaan dan abstraksi dari keadaan alam yang sesungguhnya. Keadaan alam yang ingin diteliti biasanya amat rumit dan kemampuan menelitinya secara keseluruhan amat terbatas, karena itu kita perlu menyederhanakannya, sesuai dengan kemampuan akal kita menghadapinya. Dari pengalaman dimasa lalu atau dari dugaan mengenai hubungan antara peubah dalam sistem yang diteliti, dirumuskan perkiraan kelakuan sistem tersebut dalam berbagai situasi. Peneliti mengharapkan bahwa model tersebut merupakan teori tentang cara kerja sistem yang dia teliti. Rumusan hubungan tersebut yang selanjutnya dinyatakan dalam bentuk hipotesis seterusnya diuji berdasarkan data statistik yang kemudian dikumpulkan. Pendekatan seperti ini sering disebut bersifat induksi, sebagai lawan dari yang bersifat aksioma (deduksi).
Model yang dibicarakan disini akan selalu berbentuk fungsi dan regresi merupakan alat yang ampuh dalam pembentukannya. Data yang dipakai mungkin berasal dari percobaan dalam laboratorium (ada kontrol) ataupun dari lapangan (survei). Kedua jenis data karena tidak lagi menggambarkan keadaan yang alamiah tapi dimanipulasikan sesuai dengan tujuan pencoba. Peubah yang mengganggu dibuat tidak berubah sehingga tidak berpengaruh. Jadi pengaruh peubah yang ingin diselidiki lebih bersih dapat dipisahkan. Data survei menggambarkan keadaan yang alamiah dan mengandung pengaruh banyak peubah yang bekerjasama secara amat rumit. Kesimpulan yang dapat diperoleh daripadanya sering bersifat sementara, sampai ada petunjuk lain yang lebih meyakinkan.
Teori statistika inferensi dapat didefinisikan sebagai metode untuk menarik inferensi atau keputusan mengenai populasi. Salah satu masalah penting statistika inferensi yang sering dijumpai dalam pengolahan data dari suatu percobaan atau penelitian adalah penaksiran parameter populasinya. Pada umumnya parameter populasi ini tidak diketahui. Penaksiran parameter bertujuan untuk memberikan taksiran dari parameter yang didasarkan pada sampel. Sebagai contoh, sebuah penelitian yang ingin mengetahui rata-rata berat badan anak-anak balita di Indonesia, maka untuk menjawab dengan tepat hal di atas harus dilakukan penimbangan berat badan terhadap seluruh anak-anak balita di Indonesia. Cara seperti ini dinamakan sensus. Dengan cara sensus memang dapat diperoleh data statistik yang tepat, tetapi biasanya sulit untuk dilakukan. Hal ini dikarenakan biaya yang terlalu mahal, waktu yang relatif lama dan memerlukan tenaga yang banyak, sehingga cara ini dianggap kurang ekonomis.
Berdasarkan hal di atas, maka dalam praktek sering digunakan sampel. Hasil perhitungan sampel disebut statistik. Dari statistik ini diharapkan dapat memberikan penaksiran yang baik dari parameternya, artinya nilai statistiknya tidak jauh menyimpang dari parameternya. Dalam pengambilan sampel terdapat beberapa metode antara lain; Sampling acak sederhana, sampling acak berlapis, sampling kelompok dan lain-lain. Pada penulisan skripsi ini akan dibahas tentang penaksiran, khususnya metode penaksiran regresi linier sederhana. Dalam pembahasannya dibatasi pada sampling kelompok.
Alasan menggunakan metode penaksiran regresi linier ini karena metode ini akan memberikan ketelitian penaksiran yang lebih baik dibandingkan dengan menggunakan rata-rata sampel pada sampling kelompok. Penaksiran regresi linier dapat dibuat untuk meningkatkan ketelitian dengan menggunakan variabel tambahan
xi yang berhubungan dengan yi, sedangkan lambang atau simbol yang digunakan
pada penulisan ini adalah huruf kapital untuk karakteristik populasi dan huruf kecil untuk sampel. Notasi “ ^ ” ( topi ) adalah notasi taksiran karakteristik populasi yang diperoleh dari sampel dan “” ( bar ) adalah notasi untuk rata-rata.
Dengan berdasarkan pada latar belakang di atas, maka perumusan masalah yang diambil sebagai berikut;
1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada
sampling kelompok?
2. Berapakah besarnya bias dari penaksir regresi linier sederhana?
3. Apakah penaksir regresi linier sederhana lebih efisien bila dibandingkan dengan
sampling kelompok ( cluster sampling )?
Tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut.
1. Mengetahui besarnya variansi minimum dari penaksir regresi linier pada
sampling kelompok.
2. Mengetahui besarnya bias dari penaksir regresi linier sederhana.
3. Menunjukkan secara teoritis bahwa penaksir regresi linier sebagai penaksir yang
efisien pada kondisi tertentu.
Teori – teori pembelajaran yang terkait dengan perangkat pembelajaran yang dikembangkan dalam penelitian ini.
Teori Penaksiran
Pengambilan sampel dari suatu populasi digunakan untuk menaksir parameter yang tidak diketahui. Penaksir tersebut antara lain: rata-rata populasi, variansi populasi, rasio populasi, dan total populasi, tetapi nilai statistik dari sampel tidaklah tepat sama dengan parameternya. Meskipun demikian diharapkan bahwa statistik ini dapat memberikan penaksiran terhadap parameter tersebut secara baik, artinya nilai taksirannya tidak terlalu jauh menyimpang dari parameter yang sebenarnya. Statistik yang digunakan untuk mendapat taksiran disebut sebagai penaksir. Jadi tidak dapat diharapkan suatu penaksir akan menaksir parameter populasi tanpa kesalahan.
Tidak beralasan mengharapkan rata-rata sampel dapat menaksir rata-rata populasi dengan tepat, tetapi tentunya diharapkan bahwa taksiran itu tidak terlalu jauh menyimpang. Untuk suatu sampel tertentu, mungkin saja diperoleh taksiran rata-rata populasi lebih dekat dengan mengambil median sampel sebagai penaksir. Sebagai contoh, sampel yang terdiri atas nilai 2, 7, dan 9 yang diambil dari suatu
x
µ
µ
~
x
ˆ
µ
Obj110 Obj111 Obj112 Obj113 Obj114 Obj115 Obj116populasi. Dimisalkan rata-ratanya tidak diketahui. Rata-rata populasi akan ditaksir dengan = 6 bila menggunakan rata-rata sampel sebagai penaksir, atau bila menggunakan median sampel sebagai penaksir. Dalam hal ini median sampel menghasilkan taksiran yang lebih dekat ke parameter sesungguhnya daripada rata-rata sampel . Sebaliknya bila sampel acaknya terdiri atas nilai 3, 6, dan 9, maka = 6 dan = 6, sehingga rata-rata samplesekarang menjadi penaksir yang lebih baik.
Penaksir berarti penduga suatu parameter dari populasi yang tidak diketahui. Pada umumnya suatu penaksir dikatakan baik apabila memenuhi kriteria seperti: tak bias, efisien dan konsisten.
a) Ketakbiasan
Misalkan suatu parameter dari populasi akan ditaksir dengan statistik . Tentunya diinginkan distribusi sampel mempunyai ekspektasi yang sama dengan yang ditaksir. Penaksir yang mempunyai sifat ini disebut penaksir tak bias. Menurut definisi: Statistik dikatakan penaksir tak bias dari parameter yang tidak diketahui bila E()=, sebaliknya statistik dikatakan bias dari parameter bila E(). Selanjutnya E()= menyatakan besarnya bias. Statistik dikatakan bias positif bila E() > dan bias negatif bila E() <.
Contoh :
a.1 Misalkan Y adalah suatu variabel random dengan rata-rata dan variansi 2.
Misalkan Y1, Y2, …, Yn adalah variabel random yang besarnya n dari Y, maka
rata-rata sampel adalah penaksir yang tak bias dari . Hal ini karena:
Karena , untuk semua i =1, 2, 3, …, n
Obj117 Obj118 Obj119 Obj120 Obj121 Obj122 Obj123 Obj124 Obj125 Obj126 Obj127 Obj128 Obj129 Obj130 Obj131 Obj132 Obj133 Obj134 Obj135 Obj136 Obj137 Obj138 Obj139 Obj140
Maka
a.2 Andaikan X1 , X2 , … , Xn variable random bebas, masing-masing
berdistribusi keduanya tidak diketahui. Carilah penaksir takbias untuk !
Penyelesaian: untuk.. Karena itu suatu penaksir takbias untuk .
b) Keefisienan
Sifat tak bias saja belum cukup selama variansi sebagai ukuran penyebaran dari suatu penaksir tidak diketahui. Ini berarti diperlukan sifat penaksir dengan variansi terkecil yang dinamakan sifat penaksir efisien.
Menurut definisi: Misalkan 1 dan 2 dua penaksir tak bias dari parameter
populasi yang sama. Bila variansi dari 1 lebih kecil daripada variansi 2 maka
dikatakan bahwa 1 penaksir yang lebih efisien daripada2.
Contoh :
Misalkan Y1, Y2, …, Yn adalah variabel random yang saling bebas dan
masing-masing mempunyai distribusi normal . Penaksir tak bias dari adalah
yaitu rata-rata dari sampel. Penaksir tak bias lainnya adalah yi untuk suatu
indeks i, yaitu sebuah observasi tunggal dari sampel tersebut. Tetapi adalah
penaksir dari yang lebih efisien daripada yi , karena:
. c) Kekonsistenan Obj141 Obj142 Obj143 Obj144 Obj145 Obj146 Obj147 Obj148 Obj149 Obj150 Obj151 Obj152 Obj153 Obj154 Obj155 Obj156 Obj157 Obj158 Obj159 Obj160 Obj161
Pada umumnya taksiran dari parameter yang dihitung dari sampel akan berbeda dengan nilai parameter sebenarnya, akan tetapi diharapkan perbedaan itu sangat kecil bila ukuran sampel diperbesar menjadi tak terbatas, dimana nilai peluang dari penaksir akan menuju kesatu.
Menurut Definisi: Misalkan suatu penaksir dari populasi dikatakan penaksir konsisten apabila: ( Walpole, R.E )
Biasanya sukar untuk membuktikan bahwa sebuah penaksir adalah konsisten dengan menggunakan definisi diatas. Tetapi jika suatu penaksir adalah tak bias dan mempunyai variansi yang cenderung menuju nol dengan sampel yang besarnya mendekati tak terbatas adalah konsisten.
Contoh:
Misalkan Y1, Y2,…,, Yn adalah variabel random dimana saling bebas dan
masing-masing berdistribusi normal, makasebuah penaksir yang konsisten pada rata-rata sebuah distribusi normal, karena adalah tak bias, maka
Untuk menaksir suatu parameter populasi yang tidak diketahui dapat dilakukan dengan dua cara, yaitu:
1. Menaksir parameter populasi dengan satu nilai tertentu, ini disebut sebagai
penaksiran titik dan hasil penaksirannya dinamakan dengan taksiran titik.
2. Menaksir parameter dengan suatu interval tertentu, ini disebut dengan
penaksiran interval dan hasil penaksirannya disebut dengan taksiran interval.
Taksiran selang (Interval) suatu parameter populasi adalah suatu interval
yang berbentuk 1 < < 2 ,dengan 1 dan 2 tergantung pada nilai statistik . sebagai
contoh: untuk parameter akan terlihat bahwa 1 = dan 2 = , k ditentukan dari distribusi
Obj162 Obj163 Obj164 Obj165 Obj166 Obj167 Obj168 Obj169 Obj170 Obj171 Obj172 Obj173 Obj174 Obj175 Obj176 Obj177 Obj178 Obj179 Obj180 Obj181 Obj182 Obj183 Obj184 Obj185 Obj186 Obj187 Obj188 Obj189 Obj190 Obj191 Obj192 Obj193 Obj194 Obj195 Obj196 Obj197 Obj198 Obj199 Obj200 Obj201 Obj202 Obj203 Obj204
sampel . Jadi . Misalkan dari distribusi sampel dapat ditentukan 1 dan 2 dengan 1 < 2
sedemikian hingga P(1 < < 2 ) sama dengan nilai yang di inginkan. Misalkan 1 dan 2
dicari sehingga memenuhi P(1 < < 2 ) = 0,95. Artinya bahwa dengan peluang 0,95
sampel random yang diambil akan menghasilkan suatu interval yang mengandung . Ini disebut interval kepercayaan 95%, artinya bahwa 95% interval mengandung parameter yang sesungguhnya dari populasi. Pada umumnya distribusi memungkinkan menghitung k sehingga: P( - k < < + k ) = 1 - dengan 0 < < 1.
Interval yang dihitung dari suatu sampel tetentu disebut interval kepercayaan (1 - ) = 100%. Jadi bila = 0,05 diperoleh interval kepercayaan 95% dan bila = 0,01 diperoleh interval kepercayaan 99%. Pecahan 1 - disebut koefisien kepercayaan dan - k dan + k disebut batas kepercayaan.
Sampling Kelompok (Cluster Sampling)
Sampel kelompok (Cluster sampling) ialah sampel acak sederhana dimana setiap sampling unit terdiri dari kumpulan atau kelompok elemen, seperti misalnya rumah tangga terdiri dari beberapa anggota rumah tangga, blok toko di pasar baru Jakarta terdiri dari toko-toko, rayon sekolah terdiri dari beberapa sekolah, segmen pasar terdiri dari banyak pembeli, bidang tanah terdiri dari ssbeberapa plot terdiri dari beberapa pohon dan lain sebagainya.
Pengambilan sampel secara blok/kelompok mempunyai beberapa keuntungan, antara lain: Tidak perlu disusun kerangka sampling di seluruh populasi yang ingin diteliti cukup dibuat blok-blok yang ada dan biaya pendataan lebih murah karena sampel yang terambil akan terletak pada jarak yang relatif berdekatan.
Sifat-sifat Penaksir
Ketelitian atau sering dinamakan dengan presisi dari suatu penaksir yang dibuat berdasarkan sampel, tergantung pada metode penaksiran dan rencana penarikan sampel. Sifat-sifat penaksir untuk sampling kelompok diberikan dalam teorema berikut ini:
Teorema 1 Obj205 Obj206 Obj207 Obj208 Obj209 Obj210 Obj211 Obj212 Obj213
Misalkanadalah rata-rata sampel yang dipilih n unit dari populasi berukuran N, maka adalah penaksir tak bias dari yaitu rata-rata dari populasi
Bukti :
a) Tanpa Pengembalian
Dari definisi ekspektasi ( nilai harapan ) bahwa:
, untuk suatu i.
Dengan: Yj adalah nilai-nilai yi yang mungkin ( peubah acak diskrit )
Pj adalah peluang dari Yj (unsur ke-j dari populasi) terpilih sebagai sampel,
j = 1,2,3,…,N
Perhatikan bahwa suku pertama persamaan diatas menunjukkan peluang
Yj tidak terpilih sebagai sample pada pengambilan pertama, suku kedua
menunjukkan peluang bahwa Yj tidak terpilih sebagai sampel pada pengambilan
sampel berikutnya dan suku terakhir menunjukkan peluang bahwa Yj terpilih
sebagai sampel dari N–I+1, sisa elemen pada pengambilan sampel ke-i.
Dari E(), E dan Pj didapatkan:
b) Dengan Pengembalian Obj214 Obj215 Obj216 Obj217 Obj218 Obj219 Obj220 Obj221
Ini berarti bahwa setiap unit akan muncul dalam jumlah sampel yang sama yaitu
Akibat dari Teorema 1
Misalkan adalah rata-rata sampel yang dipilih n unit dari populasi berukuran N, maka adalah penaksir tak bias sari total populasi Y.
Bukti :
E() = E(N) = N E() = N = Y.
Variansi dari Penaksir
Dari teori sampling dikenal dua definisi variansi dari yi yaitu:
(1)
(2)
Definisi (1) diatas digunakan untuk menurunkan hasil teoritis sedangkan definisi (2) banyak berkaitan dengan analisis variansi utamanya sifat ketakbiasan. Teorema 2
Misalkan adalah rata-rata sampel berukuran n yang diambil dari populasi berukuran N pada sampling kelompok, maka variansi dari adalah sebagi berikut: a) Tanpa Pengembalian Obj222 Obj223 Obj224 Obj225 Obj226 Obj227 Obj228 Obj229 Obj230 Obj231 Obj232 Obj233 Obj234
Dimana f = n / N adalah fraksi penarikan sampel. b) Dengan Pengembalian
Sedangkan Variansi dari penaksir total populasi adalah:
Untuk sampel berukuran n dari suatu populasi tak hingga, variansi rata-rata sampel adalah . Hasil ini akan berubah jika populasi terbatas yaitu dengan menambahkan yang disebut sebagai faktor koreksi populasi hingga (fpc). Untuk populasi hingga fraksi sampling sangat kecil, maka . Jadi ukuran populasinya tidak mempunyai pengaruh secara langsung terhadap kesalahan baku dari rata-rata sampel. Dalam praktek fpc dapat diabaikan apabila
Teorema 3
Jika (yi, xi) adalah pasangan variabel yang didefinisikan pada setiap unit
populasi dan , adalah rata-rata sampling kelompok berukuran n, maka kovarian darididefinisikan sebagai:
Dengan:
Penaksir Variansi
Rumus simpangan baku dari penaksir rata-rata populasi dan total populasi digunakan terutama untuk tiga tujuan:
Obj235 Obj236 Obj237 Obj238 Obj239 Obj240 Obj241 Obj242 Obj243 Obj244 Obj245 Obj246 Obj247
1) Membandingkan presisi (ketelitian) yang diperoleh dari sampling kelompok dengan metode sampling lainnya.
2) Untuk memperkirakan ukuran sampel yang dibutuhkan dalam suatu survei yang
telah direncanakan.
3) Untuk memperkirakan ketelitian sebenarnya yang didapat dalam suatu survei
yang telah dilaksanakan.
Pada umumnya dalam praktek S2 adalah variansi populasi tidak diketahui,
tetapi dapat ditaksir dari data sampel. Teorema 4
Untuk sampling kelompok adalah penaksir tak bias dari
Akibat Teorema 4
Penaksir tak bias dari variansi adalah:
Sehingga penaksir tak bias dari variansi adalah:
Penaksir tak bias dari simpangan baku adalah:
Obj248 Obj249 Obj250 Obj251 Obj252 Obj253 Obj254
Penaksir tak bias dari simpangan bakuadalah:
Interval Kepercayaan
Taksiran selang (interval) suatu parameter populasi adalah suatu interval yang berbentuk dengan dan tergantung pada nilai statistik. Bila sampel berasal dari populasi normal atau bila tidak n cukup besar, selang kepercayaan untuk dapat dibuat dengan menggunakan distribusi sampel. Dari teorema limit pusat dikatakan jika sebuah populasi mempunyai rata-rata dan simpangan bakuyang besarnya berhingga, maka untuk ukuran sampel random n cukup besar berdistribusi rata-rata sampel mendekati distribusi normal dengan rata-rata dan simpangan baku . Menurut teorema ini, distribusi sampel dapat diharapkan secara hampiran berdistribusi normal dengan rataan dan simpangan baku . Dari teorema limit pusat diketahui bahwa:, dengan Z merupakan distribusi normal dengan rataan nol dan variansi satu.
Rata-rata sampel diperoleh dari sampel berukuran n. Dari tabel normal diperoleh bahwa: Obj255 Obj256 Obj257 Obj258 Obj259 Obj260 Obj261 Obj262 Obj263 Obj264 Obj265 Obj266 Obj267 Obj268 Obj269 Obj270 Obj271 Obj272 Obj273 Obj274 Obj275
Suatu sampel random ukuran n diambil dari populasi dengan variansi yang diketahui dan rataan yang dihitung sehingga menghasilkan selang kepercayaan diberikan oleh: . Pada umumnya dalam praktek variansi populasi tidak diketahui, sehingga ditaksir dari data sampel. Taksiran dari adalah . Selang kepercayaan untuk rata-rata populasi pada sampling kelompok adalah:
, sebagai pendekatan dapat diambil: , dengan batas bawah kepercayaan untuk rata-rata populasi dan merupakan batas atas kepercayaan untuk rata-rata-rata-rata populasi.
Selang kepercayaanuntuk total populasi Y pada sampling kelompok adalah:
Sebagai pendekatan dapat diambil:
Dari persamaan: batas bawah kepercayaan untuk total populasi dan
batas atas kepercayaan untuk total populasi. Dalam penyelesaian soal yang diberikan pada skripsi ini menggunakan software Microsoft excel sebagai pendukung untuk mempercepat perhitungan.
METODE PENELITIAN Obj276 Obj277 Obj278 Obj279 Obj280 Obj281 Obj282 Obj283 Obj284 Obj285 Obj286 Obj287 Obj288 Obj289 Obj290 Obj291 Obj292
Ruang Lingkupnya adalah regresi linier sederhana dan sampling acak kelompok, Objek penelitian adalah perbedaan antara penaksiran regresi linier dengan penaksiran pada sampling kelompok, Variabel/Fokus pembicaraan pada skripsi ini mengenai penaksiran variable dependen pada regresi linier sederhana dan berdasar rata-rata sampel kelompok. Kemudian penaksiran bias regresi linier, penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi linier sederhana.
Taksiran berdasar regresi linier sederhana: , sedangkan berdasar rata-rata sample kelompok: . Penaksiran bias dari regresi linier sederhana .
Untuk sampling kelompok variansi adalah penaksir takbias dari sehingga penaksir variansi rata-rata sampel pada sampling kelompok adalah , sedangkan variansi penaksir variansi regresi linier sederhana adalah .
Teknik dan Olah data
Metode yang dipakai dalam penulisan skripsi adalah studi pustaka, merumuskan masalah, pengumpulan data, dan penyelesaian masalah.
HASIL DAN PEMBAHASAN Regresi Linier Sederhana
Sering dalam praktek orang diminta untuk memecahkan persoalan yang menyangkut sekelompok variabel bila diketahui bahwa diantara variabel tersebut terdapat suatu hubungan yang tidak terpisahkan. Variabel-variabel tersebut dinamakan variabel bebas dan variabel terikat atau respon. Hubungan antara variabel bebas dan respon yang dicocokkan pada data suatu percobaan, ditandai dengan persamaan prediksi yang disebut persamaan regresi. Bila y dan x masing-masing tunggal, persoalannya menjadi regresi y pada x. Rataan berkaitan linier
Obj293 Obj294 Obj295 Obj296 Obj297 Obj298 Obj299 Obj300 Obj301 Obj302 Obj303 Obj304 Obj305
dengan x dalam bentuk persamaan linier populasi: , dengan dan merupakan dua parameter yang akan ditaksir dari data sampel. Bila taksiran untuk kedua parameter itu masing-masing dinyatakan dengan a dan b, maka bentuk persamaan garis regresi berdasarkan sampel adalah:.
Bila hanya terdapat satu x dan satu y maka data berbentuk pasangan
pengamatan {(xi, yi) ; i= 1, 2, …, n}. Bila nilai x diatur, maka proses percobaan
menetapkan atau memilih nilai-nilai xi terlebih dahulu dan kemudian mengamati
nilai padananya yi . Bila dimisalkan bahwa semua rataan terletak pada satu garis
lurus, tiap Yi dapat ditulis sebagai model regresi linier sederhana yaitu: , dengan Ei
merupakan variabel random yang mempunyai rataan nol. Setiap pasangan
pengamatan (xi, yi) dalam sampel dengan distribusi normal, memenuhi hubungan:
dengan: nilai yang dicapai Ei bila Yi berharga yi . Jika menggunakan persamaan
regresi, estimasi dari y adalah , sehingga tiap pasangan pengamatan memenuhi: yi =
a + bxi + ei , dengan yang disebut sisa.
Untuk memperkirakan a dan b digunakan metode kuadrat terkecil sehingga jumlah kuadrat dari simpangan antara observasi-observasi dan garis regresi menjadi minimum. Dengan menggunakan metode kuadrat terkecil maka sifat dari penaksir
yang diperoleh adalah tak bias dan mempunyai variansi minimum: . Persamaan yi =
a + bxi + ei dapat juga ditulis sebagai berikut: , dengan . Dan jumlah sisanya menjadi
. Bila L diturunkan terhadap ai dan b, maka diperoleh: dan Penyederhanaan kedua
persamaan tersebut di atas menghasilkan: dan , karena , maka dari dua persamaan di atas diperoleh: , sehingga Dan, sehingga .
Penaksir Regresi Linier Sederhana
Penaksir terhadap karakteristik dari suatu populasi dapat dilakukan dengan menggunakan rata-rata sampel. Setelah suatu sampel dipilih dengan salah satu
Obj306 Obj307 Obj308 Obj309 Obj310 Obj311 Obj312 Obj313 Obj314 Obj315 Obj316 Obj317 Obj318 Obj319 Obj320 Obj321 Obj322 Obj323 Obj324 Obj325 Obj326 Obj327
metode sampling, kemudian dihitung rata-rata sampel yang digunakan untuk menaksir rata-rata populasi .
Pada bab pendahuluan telah disinggung salah satu alasan mengapa menggunakan metode penaksiran regresi linier, karena metode penaksiran regresi linier akan memberikan ketelitian yang lebih baik dibandingkan penaksiran dengan menggunakan rata-rata sampel . Hal ini akan dijelaskan pada sub bab 4.7 tentang efisiensi metode penaksiran regresi linier, dan akan diberikan contoh yang memperlihatkan bahwa penaksiran regresi linier memberikan ketelitian yang lebih baik dibandingkan penaksiran dengan menggunakan rata-rata sampel .
Misalkan populasi terdiri dari N unit dengan harga (xi , yi), dimana xi >0,
untuk . Dimisalkan bahwa xi dan yi masing-masing diperoleh untuk setiap unit
dalam sampel dan rata-rata populasi dari xi diketahui. Penaksir regresi linier ,
rata-rata populasi yi , didefinisikan sebagai: , dengan menyatakan regresi linier
danpenaksir perubahan y bila x bertambah. Penaksir jumlah populasi Y, didefinisikan sebagai .
Penaksir regresi linier dapat membantu menyelesaikan masalah penaksiran suatu parameter.
Contoh 1:
Tabel berikut ini menunjukkan jumlah penduduk (dalam ribuan) untuk setiap sample random dari 49 kota yang diambil dari populasi 196 kota. Misalkan xi menyatakan banyaknya penduduk pada tahun 1920 dan yi menyatakan banyaknya penduduk pada tahun 1930. Apabila jumlah penduduk tahun 1920. X diketahui yakni 22.919 jiwa. Berapakah perkiraan jumlah penduduk dari 196 kota tersebut pada tahun 1930? Jumlah seluruh penduduk yang sebenarnya pada tahun 1930 untuk 196 kota adalah 29.351 jiwa.
xi Yi xi Yi Xi yi Xi yi 76 80 2 50 243 291 138 143 507 634 87 105 67 67 179 260 30 111 29 50 121 113 71 79 Obj328 Obj329 Obj330 Obj331 Obj332 Obj333 Obj334 Obj335 Obj336
381 464 50 64 256 288 23 48 44 58 43 61 37 63 77 89 25 57 120 115 64 63 94 85 61 69 64 77 43 50 387 459 56 142 298 317 93 104 40 60 36 46 172 183 40 64 161 232 78 106 38 52 74 93 66 86 136 139 45 53 60 57 116 130 36 54 46 65 46 53 50 58 48 75
Dari data tersebut diatas diperoleh:
x = 5.054 y = 6.262 =103,1 = 127,8
n = 49 N = 196 X = 22.919 = 1,16
Penaksir regresi liniernya:
= 127,1 + 1,16(116,9 – 103,1) = 144 jiwa.
Taksiran total jumlah penduduk pada tahun 1930 untuk seluruh kota adalah:
= (196)(144) = 28.224 jiwa
Taksiran berdasarkan atas rata-rata sampel adalah:
= (196)(127,8) = 25.048 jiwa Contoh 2:
Sensus penduduk propinsi Jawa Tengah tahun 1980 versus tahun 1990. Misalkan xi menyatakan jumlah penduduk hasil sensus tahun 1980 dan yi menyatakan jumlah penduduk hasil sensus tahun 1980 yang diambil dari 15 kabupaten (dalam ribuan). Apabila jumlah penduduk hasil sensus tahun 1980, X
Obj337 Obj338 Obj339 Obj340 Obj341 Obj342
diketahui yakni 25.373 jiwa. Berapakah perkiraan jumlah penduduk hasil sensus tahun 1990? Jumlah seluruh penduduk yang sebenarnya pada tahun 1990 untuk 35 Kabupaten adalah 28.522 jiwa.
Xi Yi Xi Yi xi yi 1013 1148 674 823 706 786 536 631 697 701 556 617 123 123 1100 1239 700 828 1027 1251 652 700 600 666 976 1064 1225 1349 935 1016
Dari data tersebut diatas diperoleh:
x = 11.520 = 768 y = 12.942 = 862,8
n = 15 N = 35 = 1,13 X = 25.373
Penaksir regresi liniernya:
= 862,8 + 1,13(724,9 – 763) = 814 jiwa.
Taksiran total jumlah penduduk pada tahun 1990 untuk seluruh kabupaten adalah:
= (35)(814) = 28.490 jiwa.
Taksiran berdasarkan atas rata-rata sampel adalah:
= N = (35)(862,8) = 30.198 jiwa
Dari contoh diatas terlihat bahwa penaksir regresi linier memberikan ketelitian yang lebih baik bila dibandingkan dengan menggunakan rata-rata sampel.
Penkasiran Regresi Linier dengan telah ditentukan lebih dahulu
Obj343 Obj344 Obj345 Obj346 Obj347 Obj348 Obj349 Obj350
Meskipun dalam aplikasi, dihitung dari sampel, kadang-kadang bisa juga untuk memilih lebih dahulu. Dalam sampling berulang, perhitungan sebelumnya dapat memperkirakan bahwa nilai hampir konstan.
Teorema 4.3.1
Pada sampling kelompok, dimana bo adalah konstan yang ditentukan lebih dahulu,
penaksir regresi liniernya adalah: adalah tak bias, dengan variansinya adalah:
Bukti:
Setelah diketahui persamaan regresi liniernya dan b0 konstan pada penarikan sampel
berulang maka diperoleh:
Jadi menurut teorema 1 pada bahasan tentang sifat-sifat penaksir yang
mengatakan bahwa jika tanpa pengembalian dan dengan pengembalian . Ini berarti adalah penaksir tak bias dari.
Dengan dan , sehingga menurut teorema 2 diperoleh:
Obj351 Obj352 Obj353 Obj354 Obj355 Obj356 Obj357 Obj358 Obj359 Obj360 Obj361 Obj362 Obj363
Salah satu tujuan dari penaksiran adalah untuk meningkatkan ketelitian atau meminimumkan variansi. Nilai minimum bila:
,
b0 disebut sebagai koefisien regresi linier dari y pada x dalam populasi terbatas. Nilai
variansi minimumnya adalah: , dengan adalah koefisien korelasi antara y dan x.
Dari teorema 4.3.2 terlihat bahwa variansi dari penaksir regresi linier akan minimum jika . Dari persamaan , jika = 0, maka tidak terdapat hubungan linier antara variabel x dan y dan variansi dari penaksir regresi linier sama dengan penaksir pada sampling acak kelompok, tetapi jika = 1, maka terdapat hubungan linier sempurna antara variabel x dan y, dan variansi dari penaksir regresi linier besarnya nol. Ini berarti titik-titik sampel (xi, yi) terletak pada garis lurus yang menghubungkan antara variabel x dan y.
Obj364 Obj365 Obj366 Obj367 Obj368 Obj369 Obj370 Obj371 Obj372 Obj373 Obj374 Obj375
Penaksiran regresi linier jika dihitung dari sampel
Dari teori regresi linier diketahui bahwa penaksir sampel yang efektif adalah dengan metode kuadrat terkecil dari B, yaitu:
Dengan: xi = x1 , x2 , …, xn dan yi = y1 , y2 , …, yn adalah nilai sampel.
Teorema 4.3.3
Jika adalah penaksir kuadrat terkecil dari B dan pada sampling acak kelompok berukuran n, dengan n besar, maka:
dengan adalah koefisien korelasi antara y dan x.
Taksiran Variansi dari Sampel
Rumus di atas dihitung berdasarkan pada nilai-nilai dari populasi. Sekarang akan dicari taksiran dari yang dihitung berdasarkan atas nilai-nilai dari sampel. Di atas diketahui bahwa rumus variansi regresi linier yang dihitung berdasarkan pada nilai-nilai dari populasi adalah:
taksiran dari dinotasikan dengan, sehingga:
Obj376 Obj377 Obj378 Obj379 Obj380 Obj381 Obj382 Obj383 Obj384 Obj385 Obj386
Bias Dari Penaksir Regresi Linier
Pada umumnya penaksir regresi linier adalah suatu penaksir yang bias dari . Berikut ini akan dibahas bias dari penaksir regresi linier. Dari persamaan regresi linier diperoleh:
sehingga bias dari adalah
Misalkan variabel ei didefinisikan sebagai:
dari persamaan diatas substitusikan ke persamaan , diperoleh:
Obj387 Obj388 Obj389 Obj390 Obj391 Obj392 Obj393 Obj394 Obj395 Obj396 Obj397 Obj398
sehingga
ruas kanan persamaan diatas dimanipulasi didapatkan:
dan
setelah itu kita masukkan ke kovariannya
karena , maka dari persamaan diatas diperoleh:
misalkan maka diperoleh:
Obj399 Obj400 Obj401 Obj402 Obj403 Obj404 Obj405 Obj406 Obj407 Obj408 Obj409
dari teorema 2.2.3 diperoleh:
Suku ini merupakan komponen kuadaratik dari regresi linier yi pada xi . Jadi jika
diplot yi dan xi mendekati linier, maka bias dari menjadi kecil.
Efisiensi Metode Penaksiran Regresi Linier
Efisiensi suatu penaksir hanya dapat dilakukan dengan membandingkan variansinya. Suatu penaksir dikatakan lebih efisien bilamana variansinya lebih kecil. Dalam hal ini akan dilihat efisiensi dari metode penaksiran regresi linier bila dibandingkan dengan penaksiran pada sampling kelompok, yaitu pada rata-rata populasinya. Dan juga akan dilihat persyaratan apakah suatu penaksir regresi linier memberikan ketelitian yang lebih baik. Untuk perbandingan ini ukuran sample n harus cukup besar sehingga pendekatan rumus untuk variansi regresi berlaku.
Dari teorema 2.2.1 dan teorema 2.2.2 diperoleh bahwa adalah penaksir tak bias dari rata-rata populasi dan variansi dari didefinisikan sebagai:
. Sedangkan dari teorema 4.3.3 diperoleh bahwa variansi dari adalah:
Obj410 Obj411 Obj412 Obj413 Obj414 Obj415 Obj416 Obj417 Obj418 Obj419 Obj420 Obj421 Obj422 Obj423 Obj424
Penaksir regresi linier dikatakan lebih baik (efisien) dibandingkan penaksir pada sampling kelompok apabila Dari dua persamaan diatas diperoleh bahwa: . Dari persamaan ini terlihat bahwa: kedua variansi ini sama. Ini ekuivalen dengan mengatakan bahwa lebih efisien dibandingkan , kecuali . Jadi penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok. Apabila tidak ada hubungan linier antara variabel y dan x maka penaksir regresi linier sama dengan penaksir pada sampling kelompok.
Contoh 1.
Seorang pemilik perkebunan kopi membuat taksiran dengan melihat (tanpa ditimbang) berat kopi yang dihasilkan xi pada setiap pohon kopi dari N = 200. Dia memperoleh berat total X = 11.600. Dari suatu sampel acak yang terdiri atas 10 pohon kopi diperoleh hasil sebagai berikut:
Nomor Pohon 1 2 3 4 5 6 7 8 9 10 Total
Berat sebenarnya yi 61 42 50 58 67 45 39 57 71 53 543
Berat taksiran xi 59 47 52 60 67 48 44 58 76 58 569
Data dasar yang dipunyai adalah sebagai berikut:
Dari data tersebut diatas maka diperoleh: 1. Penaksir varians regresi linier
2. Penaksir varians rata-rata sampel
Contoh 2:
Data berikut menyatakan banyaknya penduduk dari suatu sampel acak terdiri dari 7 kota yang dipilih dari 28 kota. Misalkan xi menyatakan banyaknya penduduk pada tahun 1970 dan yi menyatakan banyaknya penduduk pada tahun
Obj425 Obj426
Obj427
1980 (dalam ribuan). Bila diketahui total penduduk tahun 1970 yakni sebesar X = 3.273
1 2 3 4 5 6 7
xi (1970) 76 138 67 29 381 23 37
yi (1980) 80 143 67 50 464 48 63
Data dasar yang dipunyai adalah sebagai berikut:
Dari data diatas diperoleh: 1. Penaksir varians regresi linier
2. Penaksir varians rata-rata sampel
Dari contoh diatas terlihat bahwa variansi penaksir regresi linier lebih kecil dibandingkan penaksir rata-rata sampel.
Interval kepercayaan Penaksir Regresi Linier
Taksiran selang (Interval) suatu parameter populasi adalah suatu interval yang berbentuk dengan dan tergantung pada nilai statistik. Pada bab teori pendukung telah disinggung tentang interval kepercayaan dari sampling kelompok. Sekarang akan dibahas tentang interval kepercayaan dari penaksir regresi linier.
Dengan dasar bahwa interval kepercayaan untuk rata-rata populasi pada sampling kelompok adalah:. Dari teorema 4.3.3 diketahui bahwa variansi dari
Obj429 Obj430 Obj431 Obj432 Obj433 Obj434 Obj435 Obj436 Obj437 Obj438 Obj439 Obj440
penaksir regresi linier untuk sampel berukuran n dengan n besar adalah: , selang kepercayaan 100 % untuk rata-rata populasi dari penaksir regresi linier adalah:
Sebagai pendekatan yang diambil:
batas bawah kepercayaan untuk rata-rata populasi dari penaksir regresi linier dan batas atas kepercayaan untuk rata-rata populasi dari penaksir regresi linier.
SIMPULAN DAN SARAN
Simpulan
Dari hasil pembahasan diatas diperoleh kesimpulan sebagai berikut:
1. Jika adalah penaksir kuadrat terkecil dari B, maka besarnya variansi dari
penaksir regresi linier pada sampling kelompok dengan sampel berukuran besar adalah , ini merupakan variansi minimum dari penaksir regresi linier.
2. Besarnya bias dari penaksir regresi linier pada sampling kelompok adalah , bias
ini akan menjadi kecil jika hubungan antara xi dan yi mendekati linier.
3. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling
kelompok karena kecuali .
Saran Obj441 Obj442 Obj443 Obj444 Obj445 Obj446 Obj447 Obj448 Obj449
1. Pada penulisan skripsi ini secara teoritis hanya ditunjukkan hubungan mengenai
xi dan yi sedangkan bagaimana garis yang menghubungkan antara xi dan yi perlu
penelitian lebih lanjut.
2. Pada penulisan skripsi ditunjukkan secara teoritis dan sofware Microsoft excel
bahwa penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok dan ini perlu penelitian lebih lanjut tentang studi empiris dengan menggunakan sofware komputer yang lain. Hal ini dimaksudkan untuk lebih mendalami dan menghayati tentang hasil-hasil yang diperoleh secara lebih baik.
DAFTAR PUSTAKA
Cochran, W.G. 1991. Sampling Tecniques. ( Terjemahan Rusdiansyah ). Jakarta: UI.
Darwis, Sutawanir. 1986. Buku Materi Pokok Survei Sampel 1-10. Jakarta: Karunika.
Djarwanto. 1993. Statistik Induktif. Yogyakarta: BPFE.
Hines, W.W. and Montgomery, D.C. 1990. Probability and Statistics in Engineering
and Management Science ( Terjemahans Rusdiansyah ). Jakarta: UI.
Sembiring, R.K. 1995. Analisis Regresi. Bandung: ITB.
Supranto, J. 1986. Pengantar Probabilitas dan Statistik Induktif. Jakarta: Erlangga.
Walpole, R.E. and Myers R.H. 1972 Probability and Statistics for Engineering and
Scientists. ( Terj. Sembiring ). Bandung: ITB.
Sugiarto, Dergibson Siagan, Lasmono Tri Sunaryanto dan Oetomo, Denny S.2001.
Teknik Sampling, Jakarta: PT Gramedia Pustaka Utama.
Sudjana. 1996. Metode Statistika. Bandung: Tarsito.
Sukatmi, Pandurang V and Balkrishna.1970. Sampling Theory of Surveys with
Applications, USA: Lowa State University Press.
Supranto, J. 2001. Statistik Teori dan Aplikasi. Jakarta: Erlangga.
Supranto, J.2000. Teknik Sampling Untuk Survey dan Eksperimen, Jakarta: PT Rineka