Oseana, Volume XXI, Nomor 3, 1996 : 33 - 43
ISSN 0216- 1877
PENDUGAAN NILAI DATA YANG HILANG
Oleh
Giyanto
1)
ABSTRAK
MISSING DATA ESTIMATION. Sometimes, the researcher is not
always lucky getting good data of his observations due to one or some of the
experimental animals may die (but not of the treatment), the equipment is out of
order or the bad weather condition. Those accidents result in the missing data.
Although the least squares procedure can be applied to the data that are present,
missing data destroy the symmetry and simplicity of the analysis. To avoid that
problem, the missing data is estimated With some modifications, the usual analysis
of variance can be applied and gives results that are correct enough for practical
purposes. Some formulas and some examples to estimate the missing data are
reviewed in this article.
PENDAHULUAN
Dalam melakukan suatu percobaan atau
penelitian. kita telah merencanakan untuk
pengambilan data pada tempat dan saat
tertentu dimana data tersebut diharapkan dapat
mendukung dalam analisa penelitiannya. Tapi
kenyataan di lapangan kerapkali berbeda
dengan yang telah direncanakan semula. Data
yang semula direncanakan dapat terambil
ternyata tidak dapat terambil karena sesuatu
di luar kekuasaan kita, seperti hewan
percobaan mati (tetapi bukan karena
perlakuan), alat pengukur yang digunakan
dalam percobaan tiba-tiba saja rusak atau
pecah, ataupun karena keadaan cuaca yang
tidak memungkinkan untuk pengambilan data
(seperti ombak besar). Adanya unit
pengamatan yang hilang (data hilang)
menyebabkan banyaknya unit pengamatan
tidak sama, kerapkali menimbulkan kesulitan
dalam analisa data. Walaupun prosedur
kuadrat terkecil dapat diterapkan untuk data
yang ada, tetapi data yang hilang dapat
merusak kesimetrian dan kesederhanaan dalam
analisa data (SNEDECOR & COCHRAN
1967).
Pada klasifikasi satu arah seperti pada
RAL (Rancangan Acak Lengkap = The
Complety Randomized Design) yang pada
1) Balitbang Biologi Laut, Pusat Penelitian dan Pengembangan Oseanologi - LIPI, Jakarta.
awalnya dirancang dengan banyak unit pengamatan sama untuk setiap perlakuannya, karena terdapat data yang hilang menyebabkan banyak unit pengamatan menjadi tidak sama. Analisa sidik ragam (Analysis of Variance) tetap dapat dilakukan pada rancangan tersebut dengan mengikuti aturan-aturan analisa sidik ragam yang berlaku untuk RAL dengan banyak unit pengamatan tidak sama untuk setiap perlakuan. Jadi dalam hal ini, tak ada pendugaan untuk nilai data yang hilang (SNEDECOR &
COCHRAN 1967). Tetapi bagaimana halnya bila data yang hilang tersebut terjadi pada bentuk rancangan dasar percobaan lainnya seperti pada RBAL (Rancangan Blok Acak Lengkap = The Randomized Complete Block Design) dan RBSL (Rancangan Bujur Sangkar Latin = The Latin Square Design) ?
Jika menghadapi hal yang demikian. dengan data pengamatan yang ada, kita meng-inginkan untuk menduga nilai data yang hilang tersebut. Beberapa ahli statistika telah mengembangkan beberapa prosedur analisa untuk menduga nilai data yang hilang tersebut. Tulisan ini akan mengulas tentang bagaimana cara menduga nilai data yang hilang pada
ber-bagai rancangan dasar percobaan, disertai contoh-contoh penerapannya dalam bidang kelautan.
PENDUGAAN NILAI DATA YANG
HILANG PADA RBAL
Jika perlakuan-perlakuan diterapkan pada materi yang relatif homogen dalam setiap blok atau kelompok dan diulangi pada blok atau kelo mpo k y ang lain ny a, rancangannya disebut dengan Rancangan Blok Acak Lengkap atau disingkat RBAL (FEDERER 1967). Dalam hal ini, semua perlakuan dilakukan secara acak (random) untuk setiap blok atau kelompok. Dalam RBAL ini, sebuah data yang hilang dapat diduga nilainya dengan suatu rumus yang diperkenalkan pertama kali oleh ALLAN & WISHART (dalam FEDERER 1967). YATES (dalam FEDERER 1967) memperlihatkan bahwa rumus tersebut diperoleh dengan meminimumkan jumlah kuadrat sesatannya (eror sum of squares). Misalkan X = hasil pengamatan, n = banyak blok, k = banyak perlakuan dan X11 = nilai data yang
hilang, maka Rancangan Blok Random Lengkapnya dapat dilihat pada Tabel 1.
Tabel 1. Rancangan Blok Random Lengkap dengan satu buah data yang hilang
Untuk kombinasi lain dari data yang hilang dapat dicari dengan prosedur seperti yang dilakukan di atas, tetapi hal ini tidaklah mudah, lebih-lebih bila ini melibatkan lebih banyak lagi unit data yang hilang. YATES (dalam FEDERER 1967); STEEL & TORRIE 1980; SUGANDI & SUGIARTO 1994 menggunakan prosedur berulang (prosedur iteratif) untuk menduga beberapa unit percobaan yang hilang.
Dalam prosedur berulang, pertama-tama ditetapkan nilai dugaan awal untuk semua data yang hilang, kecuali satu unit dihitung dari Rumus 1 (rumus untuk menduga satu nilai data yang hilang pada RBAL). Besarnya nilai dugaan awal itu bisa sembarang tetapi sebaiknya nilainya tidak terlalu jauh dengan rata-rata dari baris i dan kolom j yang hilang (FEDERER 1967). Sedangkan SUGANDI & SUGIARTO 1994 menyebutkan bahwa besarnya nilai dugaan awal berdasarkan rata-rata antara rata-rata nilai data yang ada dalam kelompok yang sama dengan data yang hilang. Adanya perbedaan dalam memberikan nilai dugaan awal akan mempengaruhi banyaknya siklus yang harus dilakukan agar diperoleh nilai dugaan yang stabil untuk data yang hilang tersebut. Jadi bila terdapat z unit data yang hilang, maka (z-1) buah data yang hilang tersebut nilainya diduga sembarang sedangkan satu nilai data hilang sisanya dihitung dengan Rumus 1. Setelah diperoleh nilai dugaan untuk nilai
data hilang dari Rumus 1 tersebut, maka dapat dicari nilai dugaan untuk data hilang yang lainnya yang sebelumnya diduga dengan nilai sembarang. Setelah melakukan satu siklus penuh, dimulai lagi siklus kedua dengan urutan seperti sebelumnya. Prosedur ini terus berlangsung sampai nilai yang diduga menjadi stabil untuk setiap unit data yang hilang. Biasanya tiga kali siklus atau ulangan akan menghasilkan nilai dugaan yang stabil, tetapi banyaknya siklus tergantung dari seberapa dekatnya kita memberikan nilai dugaan awal pada data yang hilang.
Untuk memperoleh gambaran yang lebih jelas tentang bagaimana caranya menduga nilai data yang hilang pada RBAL dapat dilihat pada contoh berikut ini.
Contoh 1 :
Seorang peneliti ingin menyelidiki apakah jumlah zooxanthella pada karang batu dari jenis
Acropora formosa dipengaruhi oleh kedalaman
dimana Acropora formosa tersebut hidup. Untuk itu sipeneliti membuat pengamatan terhadap
Acropora formosa dengan menganggap kedalaman sebagai perlakuan dan lokasi penelitian sebagai blok. Ada 3 buah taraf perlakuan yang dipilih dan masing-masing perlakuan secara acak dilakukan pada setiap blok yang dipilih. Jumlah zooxanthellae per cm2 (dalam jutaan) dicatat dan hasilnya disajikan seperti dalam Tabel 2.
Tabel 2. (data fiktif)
Lokasi (Blok)
Kedalaman
(meter)
St. I
St. II
St. III
St.IV
Jumlah
(tanpa data hilang)
1
21,34
20,73
22,52
21,09
85,68
5
21,54
X22
22,92
21,47
65,93
10
21,79
20,95
23,07
21,99
87,80
Jumlah (tanpa data hilang)
64,67
41,68
68,51
64,55
239,41
Karena sesuatu di luar kekuasaan si peneliti, tidak diperoleh data jumlah zooxanthella pada Lokasi
St. II di kedalaman 5 m, atau dengan kata lain, terjadi data hilang pada X
22.Dengan data yang ada,
si peneliti ingin menduga nilai dari data yang hilang tersebut. Maka dengan menggunakan rumus
1, nilai X
22dapat diduga yaitu :
Contoh 2 :
Lihat kembali contoh 1. Misalkan terdapat 2 buah data yang hilang yaitu X
13dan X
12sehingga
tabelnya menjadi seperti dalam Tabel 3.
Tabel 3. (data fiktif)
Lokasi (Blok)
Kedalaman
( meter )
St. I
St.II
St.II
St. IV
Jumlah
(tanpa data hilang)
1
21,34
20,73
X13
21,09
63,16
5
21,54
X22
22,92
21,47
65,93
10
21,79
20,95
23,07
21,99
87,80
Jumlah (tanpa data hilang)
64,67
41,68
45,99
64,55
216,89
Untuk menduga nilai X]3 dan X22 dapat dilakukan dengan dua cara sebagai berikut :
a. Cara 1 (menggunakan rumus yang meminimumkan JKS)
Rumus untuk menduga dua buah data yang hilang dengan meminimumkan JKS telah diketahui untuk kombinasi data X11 dan X21 (Rumus 2a dan 2b) serta kombinasi data X11 dan X22 (Rumus 3a dan
3b). Padahal kombinasi data yang hilang pada contoh 2 ini yaitu nilai X]3 dan X22. Bila kita
perhatikan kembali data pada Tabel 3, kedua data yang hilang tersebut sebenarnya dapat dicari dengan menggunakan Rumus 3a dan 3b bila susunan baris dan kolom dirubah sedemikian rupa sehingga rumus tersebut dapat diterapkan. Dalam hal ini X13 berubah menjadi X11 sedangkan X22 tak
berubah sehingga susunannya seperti dalam label 4.
Dengan menggunakan Rumus 3a dan 3b akan diperoleh :
dan
b. Cara 2 (dengan menggunakan prosedur berulang)
Lihat kembali Tabel 3. Untuk menduga nilai X13 dan X22,pertama-tama tetapkan nilai dugaan awal
untuk salah satu nilai dan data hilang. (i) Siklus 1
Misalkan dugaan awal untuk X13 = 22,02 (tentu saja dapat dipilih nilai-nilai yang lainnya, tetapi
itu akan mempengaruhi banyaknya siklus yang harus dilakukan untuk mendapatkan nilai dugaan yang stabil untuk data yang hilang).
Untuk menduga dua atau lebih data yang hilang, seperti halnya pada RBAL, prosedur meminimumkan JKS juga diterapkan pada RBSL. Misalkan,untuk dua buah data yang hilang yaitu X111
dan X221, maka nilainya dapat diduga menggunakan rumus berikut :
Sedangkan untuk kombinasi data hilang X111 dan X222 nilai dugaan yaitu
Untuk kombinasi data hilang lainnya, prosedur
yang sama seperti di atas dapat dilakukan.
YATES (dalam FEDERER 1967) juga
menggunakan prosedur berulang (prosedur
iteratif) untuk menduga beberapa nilai data
yang hilang pada RBSL. Adapun caranya
mirip seperti halnya pendugaan nilai data
yang hilang pada RBAL, yaitu menetapkan
nilai dugaan awal untuk semua data hilang,
kecuali satu nilai diduga menggunakan Rumus
4. Dari satu nilai yang diduga dengan
menggunakan Rumus 4 tersebut, nilai-nilai
lainnya dapat diduga kembali sehingga
diperoleh nilai dugaan yang stabil untuk
seluruh nilai data yang hilang tersebut.
Contoh 3 :
Seorang peneliti ingin mengetahui apakah
ada perbedaan persentase tutupan karang
hidup antara berbagai panjang transek garis
yang dilakukan (Panjang garis transek A
= 10m B= 30m ; C = 50 m ; D = 70 m dan
E = 100 m). Dalam penelitian ini, lokasi
penelitian dimasukkan ke dalam baris dan
pengambil data ke dalam kolom. Hasil
peng-ambilan datanya sepertinya dalam Tabel 5.
PENUTUP
PENUTUP
Pendugaan nilai data yang hilang pada rancangan dasar seperti pada RBAL dan RBSL seperti yang telah diuraikan diatas sangatlah membantu sekali pada pendugaan nilai data yang hilang pada bentuk rancangan lain yang menggunakan rancangan dasar tersebut, Sebagai contoh, pada rancangan faktorial yang disusun dari RBAL atau RBSL, maka teknik pendugaan nilai data hilangnya sama seperti cara-cara yang telah diuraikan pada masing-masing rancangan tersebut (FEDERER 1967).
Dengan adanya pendugaan nilai data yang hilang tidak menambah informasi pada peneliti, tetapi mengatasi kesulitan dalam analisa data. YATES (dalam FEDERER 1967) telah menyelidiki keabsahan dari analisa sidik ragam (Analisys of Variance) dan ternyata hanya ada sedikit gangguan bila proporsi nilai-nilai yang hilang tidak terlalu besar. Setelah nilai dugaan untuk data yang hilang diperoleh, pada analisa sidik ragam,
derajat bebas untuk total dan derajat bebas sesatan dikurangi dengan banyaknya data hilang yang diduga (SNE DE COR & COCHRAN 1967; SOKAL & ROHLF 1995). Hal ini disebabkan karena rumus pendugaan nilai data yang hilang menduga nilai tengah populasi sehingga tidak menyumbang apa-apa pada jumlah kuadrat sesatan (STEEL & TORRIE 1980).
Sebelum mengakhiri tulisan ini, satu hal yang perlu ditekankan yaitu data hilang bukanlah suatu kegagalan perlakuan. Jika perlakuan yang diterapkan pada suatu percobaan mengakibatkan matinya hewan percobaan ataupun hal-hal lain yang menyebabkan diperoleh nilai nol; maka nilai tersebut harus dimasukkan sebagai nilai nol. bukan sebagai data hilang.
DAFTAR PUSTAKA
FEDERER, W. T. 1967. Experimental
Design : Theory and Application.
Oxford & IBH Publishing Co., New Delhi : 544 pp.
SNEDECOR, G. W. and W.G. COHRAN.
1967. Statiscal Methods. 6th ed.
Iowa State Univ. Press, Ames, Iowa: 593pp.
STEEL, R. G. D. andJ. H. TORRIE. 1980.
Principles and Procedures ofStatitics. 2nd ed. McGraw-Hll, New York : 633 pp.
SUGANDI E. dan SUGIARTO. 1994.
Rancangan Percobaan : Teori dan Aplikasi Andi Offset, Yogjakarta: 236 pp.
SOKAL, R. R. and F. J. ROHLF. 1995.
Biometry : The Principles and
Prac-tice of Statistics in Biological Re-search. 3 rd ed. W. H. Freeman and Co., New York:887 pp.