2
2. Menentukan koleksi inti ubi kayu dan mengevaluasi kebaikan koleksi inti yang diperoleh.
METODE
Data
Data yang digunakan dalam penelitian ini berasal dari Kelompok Peneliti Pengelolaan Sumberdaya Genetik (Kelti PSDG) BB Biogen dengan total koleksi sebanyak 248 aksesi dengan 13 peubah. Warna kulit luar, warna kulit dalam, dan warna daging merupakan peubah kategorik. Indeks Panen (IP), panjang tangkai daun, jumlah lobus daun, panjang lobus, lebar lobus, tinggi tanaman, diameter batang, berat brangkasan, berat umbi besar, dan berat umbi kecil merupakan peubah numerik.
Warna kulit luar terdiri atas warna cokelat dan warna cokelat muda. Warna gading, warna merah, warna merah muda, dan warna putih merupakan bagian dari warna kulit dalam, sedangkan yang menjadi bagian dari warna daging adalah warna gading, warna kuning, dan warna putih. Indeks panen merupakan hasil dari bobot umbi yang dibagi dengan bobot tanaman, yang kemudian dikali 100%.
Gambar 1 menunjukkan jumlah lobus daun mulai dari tiga lobus daun sampai 11 lobus daun. Cara mengukur panjang lobus dan lebar lobus ditampilkan pada Gambar 2. Satuan dari panjang tangkai daun, panjang lobus, lebar lobus,
Gambar 2 Panjang lobus dan lebar lobus Gambar 1 Ilustrasi daun dengan berbagai jumlah lobus
3 tinggi tanaman, dan diameter batang adalah cm (centimeter). Satuan berat brangkasan, berat umbi besar, dan berat umbi kecil adalah kg (kilogram).
Prosedur Analisis Data Prosedur analisis data yang dilakukan adalah :
1. Melakukan analisis statistika deskriptif terhadap data ubi kayu.
2. Melakukan penggerombolan dengan menggunakan metode penggerombolan dua tahap dengan algoritma sebagai berikut :
a. Pembentukan gerombol awal
Melalui tahap ini data yang masuk akan diperiksa satu per satu dan diputuskan apakah data tersebut dapat ditambahkan ke salah satu gerombol yang telah terbentuk atau membentuk gerombol baru. Metode penggerombolan awal ini diterapkan dengan membentuk Cluster Features Tree (CF Tree). CF Tree terdiri dari beberapa cabang dan tiap cabang memiliki anak cabang. Tiap anak cabang memiliki daun entri yang merupakan anak gerombol. Ketika sebuah data yang masuk mencapai daun entri, data tersebut akan diperiksa jaraknya dengan daun entri dengan menggunakan ukuran jarak Log-likelihood. Jika data tersebut memiliki jarak yang dekat dengan daun entri, maka data tersebut akan ditambahkan ke dalam daun entri tersebut. Apabila data tersebut memiliki jarak yang jauh dengan daun entri, maka data tersebut akan membentuk daun entri baru. Jika tidak tersedia lagi ruang untuk menambahkan data baru, maka anak cabang tersebut terbagi menjadi dua. Kemudian, daun-daun entri sebelumnya dibagi ke dalam dua anak cabang tersebut dengan menggunakan pasangan daun terjauh sebagai penempatan, dan daun entri yang tersisa dibagi lagi berdasarkan kriteria kedekatan. Proses ini akan terus terjadi hingga semua amatan telah dimasukkan (SPSS Inc. 2001; Schiopu 2010).
b. Pembentukan gerombol akhir
Pembentukan gerombol akhir menggunakan metode penggerombolan berhierarki, yaitu agglomerative (penggabungan). Anak gerombol yang dihasilkan pada tahap pertama akan digabung berdasarkan kriteria kedekatan. Tiap anak gerombol yang memiliki jarak terdekat akan berada dalam satu gerombol dan menghasilkan gerombol optimal dengan menggunakan kriteria BIC (Bayesian’s Information Criterion) atau AIC (Akaike’s Information Criterion).
Ukuran Jarak
Ukuran jarak yang dapat menangani data bertipe kategorik dan numerik sekaligus adalah jarak Log-likelihood. Pada jarak Log-likelihood, diasumsikan bahwa peubah numerik menyebar normal dengan rata-rata is dan ragam is, peubah kategorik menyebar multinomial dengan probabilitas
4
antar peubah saling bebas (Bacher et al. 2004; Schiopu 2010). Jarak Log-likelihood antar gerombol i dan s adalah :
d(i,s) i s- i,s dengan,
i ni(∑ log( ̂ik ̂k) ∑ ∑ ̂ikllog ̂ikl mj l q j p k ) s ns(∑ log( ̂sk ̂k) ∑ ∑ ̂skllog ̂skl mj l q j p k ) v nv(∑ log( ̂ k ̂k) ∑ ̂vk K k KA k ) ̂vk ∑ vkl v log vkl v k l
v dapat diinterpretasikan sebagai bentuk penyebaran (ragam) dalam gerombol v (v i,s,〈i,s〉), d i,s adalah jarak antara gerombol i dan s. KA adalah banyaknya peubah numerik, K adalah banyaknya peubah kategorik,
k adalah jumlah kategori untuk peubah kategorik ke-k. v adalah banyaknya data pada gerombol v, vkl adalah banyaknya pengamatan pada gerombol ke-v untuk peubah kategorik ke-k dengan kategori ke-l, kl adalah banyaknya pengamatan untuk peubah kategorik ke-k dengan kategori ke-l, ̂k adalah ragam peubah kontinu ke-k untuk seluruh amatan, dan ̂vkadalah ragam peubah kontinu ke-k pada gerombol v (Schiopu 2010; Bacher et al. 2004).
Ukuran Penentuan Banyaknya Gerombol
Penentuan banyaknya gerombol dilakukan dalam dua tahap. Tahap pertama yaitu menghitung BIC (Bayesian’s Information Criterion) untuk setiap jumlah gerombol dari kisaran tertentu. Rumus BIC untuk J gerombol adalah sebagai berikut :
I ∑ j mjlog j dengan, mj { KA ∑( k ) K k }
Setelah mendapatkan hasil perhitungan BIC, maka hasil tersebut akan digunakan untuk menduga banyaknya gerombol. Banyaknya gerombol
5 maksimum sama dengan banyaknya gerombol yang memiliki rasio ⁄ lebih kecil dari c (berdasarkan SPSS Technical Support, nilai c ) untuk pertama kali. Tahap kedua menggunakan rasio perubahan jarak R(j) untuk gerombol j, yang didefinisikan (j) dj- ⁄ , dengan ddj j- adalah jarak jika gerombol j bergabung dengan gerombol j-1, dj lj- -lj , lv ( rv-AI v) ⁄ atau lv (rvlog n - I v) ⁄ , dan v = j, j-1. Perubahan rasio dihitung dengan menggunakan rumus R(j1)/R(j2) untuk dua nilai R(j) terbesar. Jika perubahan rasio lebih besar dari batas nilai c2 = 1.15, maka jumlah gerombol sama dengan j1. Jika perubahan rasio lebih kecil dari batas nilai c2, maka jumlah gerombol optimal sama dengan maksimum (j1, j2) (Bacher et al. 2004).
3. Mengevaluasi kebaikan koleksi inti untuk masing-masing koleksi inti dengan tahapan sebagai berikut :
a. Melakukan penarikan contoh acak berlapis dengan pengulangan sebanyak 10 kali tanpa pengembalian
b. Mengevaluasi kebaikan koleksi inti pada masing-masing contoh yang telah diperoleh dengan menghitung MD% dan VD% untuk peubah numerik, dan uji kebaikan suai khi-kuadrat untuk peubah kategorik
Mean Difference Percentage (MD%) dan Variance Difference Percentage (VD%)
Kriteria kebaikan koleksi inti yaitu persentase yang menunjukkan perbedaan antara koleksi inti dengan seluruh koleksi. MD% menunjukkan perbedaan rata-rata koleksi inti dan seluruh koleksi. VD% menunjukkan perbedaan ragam koleksi inti dan seluruh koleksi. Rumus MD% dan VD% sebagai berikut :
D ∑ |x̅ x̅ | x ̅ p p VD ∑ | ̂ ̂ | ̂ p p
Pada formula diatas, p adalah banyaknya peubah, x̅ adalah rataan koleksi inti pada peubah ke- , ̅ adalah rataan seluruh koleksi pada peubah ke- , ̂ adalah ragam koleksi inti pada peubah ke- , ̂ adalah ragam seluruh koleksi pada peubah ke- . Nilai terkecil yang dihasilkan MD% dan VD% menunjukkan kemampuan yang lebih baik dari strategi penarikan contoh untuk menentukan perwakilan koleksi inti. (Studnicki et al. 2010; Hu et al. 2000).
6
Uji Kebaikan Suai Khi-Kuadrat (Chi-Square Goodness of Fit Test) Uji kebaikan suai khi-kuadrat merupakan uji yang dilakukan untuk mengevaluasi apakah contoh yang terpilih mewakili populasi atau tidak. Hipotesis yang diuji pada penelitian ini adalah :
H0 : Proporsi warna kulit luar, warna kulit dalam, dan warna daging kategorik pada contoh sama dengan populasi.
H1 : Proporsi warna kulit luar, warna kulit dalam, dan warna daging kategorik pada contoh tidak sama dengan populasi.
Statistik ujinya adalah :
hitung ∑ [
( i i)
i ]
r
i Oi = frekuensi amatan pada kategori ke-i
Ei = npi ; yaitu nilai harapan pada kategori ke-i jika H0 benar n = ukuran contoh
pi = proporsi kategori ke-i ; i = 1,...,r r = banyaknya kategori
Kriteria penolakan H0 :
Tolak H0 jika hitung lebih besar dari tabel dengan derajat bebas (r – 1) dengan taraf nyata α (Daniel 1990).
HASIL DAN PEMBAHASAN
Deskripsi Data
Data yang digunakan dalam penelitian ini sebanyak 248 aksesi ubi kayu. Peubah yang diamati adalah peubah kategorik dan numerik. Peubah kategorik terdiri atas warna kulit luar, warna kulit dalam, warna daging. Peubah numerik terdiri atas Indeks Panen (IP), panjang tangkai daun, jumlah lobus daun, panjang lobus, lebar lobus, tinggi tanaman, diameter batang, berat brangkasan, berat umbi besar, dan berat umbi kecil.
a) Warna Kulit Luar b) Warna Kulit Dalam c) Warna Daging