BEBERAPA METODE ANALISIS DATA
13. Data Enumeras
Salah satu metode untuk analisis data enumerasi adalah "chi-kuadrat". Data enumerasi lazimnya melibatkan peubah-peubah diskrit yang lebih mengarah kepada ciri kualitatif daripada kuantitatif. Dengan demikian data berupa jumlah individu yang tergolong ke dalam kelas-kelas tertentu. Misalnya, suatu populasi diambil contohnya dan kemudian dihitung banyaknya individu jantan dan betina dari contoh tersebut. Dalam suatu populasi atau dalam suatu contoh, individu dapat diklasifikasikan menurut beberapa peubah. Misalnya penduduk di suatu kampung dapat dikelompokkan atas dasar kebiasaan merokok, dan kemudian dikelompokkan lagi berdasarkan kerentanan terhadap penyakit kanker. Berdasarkan kriteria di atas maka dapat disusun tabel dua arah seperti Tabel 7.
Tabel 7. Tabel kontingensi dua arah
Perokok Tidak merokok Jumlah
Rentan Kanker 200 300 500
Tidak rentan kanker 180 310 490
Jumlah 380 610 990
Dengan data seperti di atas kita dapat melakukan analisis lebih lanjut untuk mengetahui apakah ada hubungan antara kebiasaan merokok dengan kerentanan terhadap penyakit kanker. Kriteria uji Chi-kuadrat dapat dihitung dan kemudian dibandingkan dengan nilai Chi-kuadrat dalam tabel standar. Teladan lain misalnya hasil percobaan pemberian pakan kepada tikus (Tabel 8)
Data ini dapat dianalisis untuk mengetahui pengaruh bahan pakan terhadap kehidupan tikus, atau untuk mengetahui apakah sebenarnya peluang tikus untuk hidup sama besar setelah diberi kedua macam bahan pakan tersebut. Data binomial dalam tabel yang dimensinya lebih dari dua mengisyaratkan problematik statistik dan interpretasinya
yang rumit. Suatu teladan sederhana berikut ini adalah hasil percobaan pemberian pakan konsentrat terhadap kesehatan tubuh dua jenis kelinci (Tabel 9). Tujuan dari percobaan ini adalah untuk mengetahui apakah pengaruh konsentrat terhadap kesehatan tubuh kelinci jenis A berbeda dengan jenis B. Untuk menjawab pertanyaan tersebut data dapat dianalisis dengan menggunakan teknik-teknik Chi-kuadrat . Kriteria uji dapat dikembangkan dengan melibatkan peluang di masing-masing "Cel" dari tabel kontingensi.
Tabel 8. Tabel kontingensi dua arah (Hasil percobaan pemberian pakan pada tikus) _________________________________________________________
Perlakuan pakan Jumlah tikus yang: Hidup Mati Total
_________________________________________________________ Kaldu standar 8 12 20 Campur penisilin 48 62 110 _________________________________________________________ Total 56 74 130 ______________________________________________________ 14. Data Multivariate
Dalam perihal-perihal tertentu ternyata para pakar telah membuat pembedaan antara "variable" dan "variate". Suatu "variable" adalah "kuantita yang mempunyai nilai berbeda untuk individu yang berbeda, atau mempunyai nilai berbeda untuk individu yang sama pada kondisi yang berbeda". Sedangkan suatu "variate" didefinisikan sebagai "suatu kuantita yang dapat mempunyai salah satu nilai dari gugus nilai tertentu yang mempunyai frekuensi relatif atau peluang tertentu". "Variate" ini kadangkala juga dipandang sebagai peubah-acak, tetapi harus dipandang bukan hanya nilainya saja, tetapi juga harus dilibatkan fungsi peluangnya.
Tabel 9. Tabel kontingensi tiga arah
_________________________________________________________ Kelinci A Kelinci B Total
Sehat Sakit Sehat Sakit
_________________________________________________________ Kelinci A 12 15 20 10 57 Kelinci B 15 15 18 20 68 _________________________________________________________ Total 27 30 38 30 125 _________________________________________________________
Dalam bidang ekologi atau ilmu lingkungan, seringkali suatu model analisis harus mampu menangkap perilaku lebih dari satu variate. Model-model seperti ini secara kolektif disebut "multivariate", dan teknik analisisnya disebut "multivariate analysis". Pada hakekatnya analisis ini adalah analiis data multi variate dalam pengertian bahwa setiap anggota mempunyai nilai-nilai p variates. Teladan data seperti ini disajikan dalam Tabel 10.
_________________________________________________________ No. Kadar Fosfor Nitrogen Kepadatan Kerikil
Tanah air _________________________________________________________ 1 68 15 2.1 45 15 2 72 10 1.8 56 21 3 72 12 2.2 44 26 4 65 22 2.1 50 18 5 60 15 2.3 49 20 6 45 17 3.1 30 21 7 50 22 2.8 42 23 8 70 28 2.5 29 18 9 76 21 2.1 43 10 10 54 23 1.9 50 6 _________________________________________________________ 14.1. Model-model deskriptif
Model-model ini tidak melibatkan pendugaan variate degan menggu-nakan variate lainnya.
(a). Analisis Komponen Utama ("Principal Component Analysis, PCA")
Model ini merupakan bentuk yang cukup sederhana untuk mempelajari variasi multivariate. Analisis ini dapat digunakan untuk menganalisis data yang memenuhi syarat sbb:
1. Untuk setiap individu unit contoh diukur dan dicatat peubah- peubah yang sama. Dengan demikian semua pengukuran harus dilakukan untuk setiap individu unit pengamatan,
2. Peubah-peubah yang dipilih untuk analisis harus kontinyu atau kalau diskrit maka intervalnya harus cukup kecil sehingga dapat dianggap kontinyu
3. Tidak ada manipulasi peubah orisinal untuk membentuk peubah baru yang juga dilibatkan dalam analisis.
Metode analisis ini dilakukan untuk mencapai tujuan : 1. Pemeriksaan korelasi antara peubah-peubah yang separate
2. Reduksi dimensi variabilitas yang diekspresikan oleh unit-unit sampling individual hingga menjadi paling sedikit tetapi masih bermakna
3. Eliminasi peubah-peubah yang sumbangan informasinya kecil
4. Pemeriksaan pengelompokkan unit-unit sampling yang paling informatif
5. Penentuan pembobot obyektif bagi peubah-peubah dalam rangka untuk menyusun indeks variasi
6. Identifikasi unit-unit samling yang meragukan asal-usulnya
Metode analisis ini pada hakekatnya melibatkan ekstraksi eigenvalue dan eigenvector dari matriks koefisien korelasi peubah-peubah orisinalnya.
(b). Analisis Gerombol ("cluster analysis")
Analisis ini pada hakekatnya melibatkan berbagai macam teknik untuk menemukan struktur dari gugusan data yang sangat kompleks. Persyaratan database sama dengan
analisis PCA. Tujuannya tidak lain adalah untuk mengelompokkan unit-unit data atau peubah ke dalam gerombol-gerombol (kelompok) sehingga elemen-elemen dalam suatu gerombol mempunyai derajat "asosiasi alamiah" yang cukup tinggi, dan gerombol yang satu berbeda dengan gerombol lainnya. Hasil analisis gerombol ini dapat disajikan dalam bentuk dendrogram seperti Gambar 17.
14.2. Model Prediktif (a). Fungsi diskriminan
Model klasik Fisher tentang fungsi diskriminan berkaitan dengan permasalahan bagaimana mendiskriminasikan antara dua kelompok "a priori", dimana setiap individu anggota dalam kelompok mempunyai beberapa peubah yang telah diukur. Model ini menyediakan fungsi linear dari pengukuran setiap peubah sedemikian rupa sehingga individu dapat dimasukkan ke dalam salah satu kelompok dengan tepat.
Fungsi diskriminan ini ditulis sbb: z = a1x1 + a2x2 + ...+ amxm
dimana a adalah vektor koefisien diskriminan dan x adalah vektor pengukuran yang dilaukan pada individu yang harus dimasukkan ke dalam salah satu kelompok.
(b). Canonical Variate
Kalau kelompok (gerombol) yang dilibatkan lebih dari dua, maka analisis di atas perlu dikembangkan lebih lanjut dengan membentuk lebih dari satu fungsi diskriminan. Metode analisis seperti ini dikenal dengan nama "Canonical variate". Dengan demikian tujuannya adalah menderivasikan seperangkat fungsi deskriminan yang berbentuk:
d = a1x1 + a2x2 + a3x3 + ... + apxp
dimana a1,a2,a3, ... ap adalah koefisien deskriminan yang dihitung sedemikian rupa untuk meminimumkan konfuse di antara satu gerombol dengan gerombol lainnya.