• Tidak ada hasil yang ditemukan

CLUSTER ENSEMBLE DALAM PENGGEROMBOLAN VARIETAS PADI

N/A
N/A
Protected

Academic year: 2021

Membagikan "CLUSTER ENSEMBLE DALAM PENGGEROMBOLAN VARIETAS PADI"

Copied!
29
0
0

Teks penuh

(1)

CLUSTER ENSEMBLE DALAM PENGGEROMBOLAN

VARIETAS PADI

VIVI HERYANTI

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

RINGKASAN

VIVI HERYANTI. Cluster Ensemble dalam Penggerombolan Varietas Padi. Dibimbing oleh Bunawan Sunarlim dan Sutoro.

Salah satu metode statistika yang dapat digunakan untuk mengelompokkan varietas atau galur padi berdasarkan karakteristik yang ditentukan adalah analisis gerombol (clustering). Analisis gerombol terdiri dari beberapa metode. Tidak ada dasar penentuan metode yang paling tepat bagi pengguna analisis gerombol. Oleh karena itu maka dilakukan sebuah pendekatan dengan mengkombinasikan seluruh hasil dari penggerombolan yang dikenal dengan Cluster Ensemble. Cluster Ensemble adalah metode yang digunakan untuk menyelesaikan masalah penggerombolan dengan mengkombinasikan sekumpulan solusi gerombol yang berbeda yang diperoleh dari metode yang berbeda-beda menjadi satu solusi penggerombolan akhir. Karakteristik dari Cluster Ensemble adalah kekekaran, keakuratan, dan kestabilan hasil yang tinggi.

Cluster Ensemble menggerombolkan 19 varietas atau galur padi berdasarkan 15 peubah karakteristiknya menjadi solusi 2, 3, dan 4 gerombol. Kriteria nilai reproducibility adjusted yang diperoleh berturut-turut sebesar 0.8330, 0.8666, 0.8742. Berdasarkan kriteria nilai tersebut, maka dapat disimpulkan bahwa solusi yang paling baik dalam menggerombolkan varietas padi pada penelitian ini adalah solusi 4 gerombol.

(3)

PENERAPAN CLUSTER ENSEMBLE DALAM PENGGEROMBOLAN

VARIETAS PADI

VIVI HERYANTI

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar

Sarjana Statistika pada

Departemen Statistika

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2010

(4)

Judul : Cluster Ensemble dalam Penggerombolan Varietas Padi Nama : Vivi Heryanti

NRP : G14060361

Tanggal Lulus :

Menyetujui :

Pembimbing I, Pembimbing II,

Ir. Bunawan Sunarlim, MS. Dr. Ir. Sutoro, MS. (NIP. 19471024197303 1 001) (NIP. 19531208198203 1 001)

Mengetahui : Ketua Departemen Statistika

Dr. Ir. Hari Wijayanto, MS. (NIP. 19650421199002 1 001)

(5)

KATA PENGANTAR

Segala puji bagi ALLAH SWT atas segala karunia-Nya karena telah memperkenankan penulis untuk menyelesaikan karya tulisnya yang berjudul “Cluster Ensemble dalam Penggerombolan Varietas Padi” sebagai salah satu syarat memperoleh gelar Sarjana Statistika pada Program Studi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Salawat dan salam kepada junjungan kita Nabi Besar Muhammad SAW yang telah membawa kita dari jaman jahiliyah ke jaman yang terang benderang penuh dengan kemuliaan seperti saat ini.

Penulis sadar karya tulis ini tidak akan terselesaikan tanpa adanya bantuan dari berbagai pihak, karenanya pada kesempatan ini penulis ingin mengucapkan terima kasih sebesar-besarnya kepada :

1. Bapak, Ibu (orang tua penulis), adik, dan keluarga yang tak lelahnya selalu mendoakan, memberikan cinta kasihnya, dan dorongan kepada penulis.

2. Bapak Ir. Bunawan Sunarlim, MS. dan Bapak Dr. Ir. Sutoro, MS. selaku dosen pembimbing yang dengan sabar selalu memberikan arahan dan bimbingan kepada penulis.

3. Balai Besar Penelitian dan Pengembangan Teknologi dan Sumber Daya Genetik Pertanian yang berkenan untuk memberikan data penelitian kepada penulis.

4. Ibu Yenni Anggraini, MSi. selaku moderator dalam seminar penulis dan Ibu Utami Dyah Syafitri, MSi. selaku dosen penguji dalam sidang penulis yang telah memberikan masukan yang begitu berarti bagi penyempurnaan karya tulis ini.

5. Megawati STK 42 yang sangat begitu berjasa atas kesabarannya dalam memberikan arahan dan bimbingan kepada penulis dalam proses pengolahan data.

6. Teman-teman STK 43 khususnya (Cha-cha, Nure, dan Shofi serta TK Teguh Beriman), kakak tingkat STK 42, adik tingkat 44 atas kebersamaannya selama ini.

7. Penghuni wisma pelangi (Yuli, Marina, Putri, Nielma, Titis, Pipit, dan Dian) yang selalu menemani keseharian penulis dengan rasa kekeluargaannya.

8. Sulfan Ardiansyah yang tak henti-hentinya memberikan semangat, perhatian, kasih sayang dan doanya kepada penulis.

9. Seluruh dosen dan staf Departemen Statistika atas bantuannya selama ini.

Penulis berharap semoga karya tulis ini memberikan banyak manfaat bagi semua pihak yang membutuhkan. Penulis mohon maaf yang sebesar-besarnya apabila terdapat banyak kesalahan selama melakukan penelitian dan penyusunan karya tulis ini.

Bogor, 13 Agustus 2010

(6)

RIWAYAT HIDUP

Penulis dilahirkan di Jambi pada tanggal 15 Januari 1989 dari pasangan Bapak Hermanto dan Ibu Neng Hodijah. Penulis merupakan putri pertama dari dua bersaudara yaitu Reni Oktaviani.

Penulis memulai pendidikan dasarnya di SD AT-TAUFFIQ Jambi. Pada tahun 2000, penulis memasuki sekolah menengah pertama di SLTPN 1 Jambi, lalu melanjutkan pendidikannya pada tahun 2003 di SMAN 3 Jambi. Pada tahun 2006 penulis terdaftar sebagai mahasiswa di IPB melalui jalur USMI. Setelah satu tahun menempuh Tingkat Persiapan Bersama, akhirnya penulis diterima di Program Studi Statistika dengan minor Matematika Keuangan dan Aktuaria.

Selama menjalani kehidupan kampus di Program Studi Departemen Statistika, penulis ikut aktif di dalam Himpro Statistika atau yang lebih dikenal dengan GSB (Gamma Sigma Beta) sebagai staf Departement of Human Resourches Development pada tahun 2008 dan Kepala Departement of Human Resourches Development pada tahun 2009. Selain itu, penulis juga aktif di beberapa kepanitiaan baik di lingkungan departemen maupun fakultas seperti Ketua Field Trip STK 2008, Ketua Mukernas IHMSI 2009, anggota divisi acara Masa Perkenalan Fakultas 2008, anggota divisi humas Statistika Ria 2008, dan lain-lain. Penulis juga pernah menjadi asisten responsi Mata Kuliah Metode Statistika. Penulis menjalani praktek lapang di Balai Besar Penelitian Bioteknologika dan Pengembangan Sumber Daya Pertanian Cimanggu Bogor pada bulan Februari-April 2010.

(7)

DAFTAR ISI

Halaman

DAFTAR GAMBAR……….. viii

DAFTAR TABEL……….. viii

DAFTAR LAMPIRAN………. viii

PENDAHULUAN………. Latar Belakang………... 1

Tujuan………... 1

TINJAUAN PUSTAKA……… Analisis Komponen Utama………... 1

Analisi Gerombol………... 1

Cluster Ensemble……… 3

Fungsi Consensus………... 3

Matriks Indikator……… 4

Nilai Reproducibility……….. 4

DATA DAN METODE………... 5

Data………... 5

Metode……… 6

HASIL DAN PEMBAHASAN………. 6

Eksplorasi dan Deskripsi Peubah………... 6

Pemeriksaan Korelasi………... 7

Anggota Ensemble……….. 7

Solusi Consensus……… 8

Deskripsi Solusi Gerombol Akhir……….. 9

KESIMPULAN DAN SARAN……….……… 10

Kesimpulan………. 10

Saran……… 10

DAFTAR PUSTAKA………. 10

(8)

DAFTAR GAMBAR

Halaman

1 Kerangka Cluster Ensemble………... 4

2 Hasil eksplorasi peubah dengan diagram kotak garis……….. 7

DAFTAR TABEL

Halaman 1 Tabulasi solusi gerombol berganda………... 4

2 Matriks Indikator………... 4

3 Tabulasi silang solusi gerombol sebelum aturan penamaan……… 5

4 Tabulasi silang solusi gerombol setelah aturan penamaan………... 5

5 Daftar objek pengamatan………... 5

6 Daftar peubah karakteristik………... 6

7 Rataan peubah setiap gerombol……… 9

8 Rataan dan standar deviasi tiap peubah……….. 10

9 Hasil pengkategorian gerombol……… 10

DAFTAR LAMPIRAN

Halaman 1 Varietas atau galur padi dan peubah karakteristiknya………... 12

2 Hasil transformasi peubah ke dalam bentuk baku………... 13

3 Korelasi di antara peubah………... 14

4 Ukuran kemiripan solusi metode hierarki untuk tiap solusi gerombol……… 15

5 Anggota ensemble………. 16

(9)

PENDAHULUAN Latar Belakang

Produksi padi dunia menempati urutan ketiga dari semua serealia, setelah jagung dan gandum. Namun demikian, padi merupakan sumber karbohidrat utama bagi mayoritas penduduk dunia, khususnya di Indonesia. Pemuliaan padi secara sistematis baru dilakukan sejak berdirinya IRRI di Filipina. Sejak saat itu, berbagai macam tipe padi dengan kualitas berbeda-beda berhasil dikembangkan secara terencana untuk memenuhi kebutuhan pokok manusia. Dengan demikian diharapkan produksi padi dapat meningkat seiring dengan meningkatnya pertambahan penduduk di dunia.

Upaya pemenuhan permintaan petani terhadap varietas padi yang unggul harus dilakukan untuk memberikan hasil yang terbaik. Varietas atau galur padi memiliki karakteristik yang beragam. Karakter-karakter tersebut misalnya karakter morfologi, fisiologi, dan komponen tanaman padi lainnya. Varietas atau galur layak dipergunakan sebagai tetua persilangan dalam menghasilkan varietas unggul baru. Tetua dalam persilangan dapat dipilih sesuai dengan tujuan pemuliaan tanamannya. Varietas atau galur padi dapat dikelompokkan sehingga tiap kelompok dapat mewakili karakteristik tertentu.

Salah satu metode statistika yang dapat digunakan untuk mengelompokkan varietas atau galur padi berdasarkan karakteristik yang ditentukan adalah analisis gerombol (clustering). Analisis gerombol terdiri dari beberapa metode. Menurut Anggiani (2009), tidak ada dasar penentuan metode yang paling tepat bagi pengguna analisis gerombol. Oleh karena itu maka dilakukan sebuah pendekatan dengan mengombinasikan seluruh hasil dari penggerombolan yang dikenal dengan Cluster Ensemble (Strehl & Gosh 2002). Beberapa penelitian yang mengkaji metode ini seperti Strehl dan Gosh (2002), Retzer dan Shan (2007) menunjukkan bahwa metode Cluster Ensemble mampu meningkatkan kualitas dan kekekaran solusi gerombol.

Tujuan

Tujuan dari penelitian ini adalah menggerombolkan varietas padi berdasarkan beberapa karakteristiknya menggunakan Cluster Ensemble.

TINJAUAN PUSTAKA Analisis Komponen Utama

Analisis komponen utama merupakan pendekatan statistika untuk mereduksi gugus peubah asal berdimensi p menjadi gugus peubah baru (komponen utama) berdimensi q dimana q<p (Johnson & Winchern 2002). Bentuk komponen utama merupakan kombinasi linier dari peubah asal.

KU1 = a1’x = a11x1 + … + a1pxp

dimana vektor a1 merupakan vektor ciri matriks

ragam peragam yang berpadanan dengan akar ciri paling besar.

Misalkan λ1 ≥ λ2 ≥ … ≥ λp > 0 adalah akar ciri yang berpadanan dengan vektor ciri a1, a2,

…, ap dari matriks ragam peragam, dan panjang

dari setiap vektor itu masing-masing adalah 1, atau ai’ai =1 untuk i = 1, 2,…, p. Maka

KU1 = a1’x dengan var (KU1) = λ1, KU2 = a2’x dengan var (KU2) = λ2, … ,

KUp = ap’x dengan var (KUp) = λp,

berturut-turut adalah komponen utama pertama, kedua, …, ke-p dari x.

Analisis Gerombol

Analisis gerombol merupakan metode dengan analisis peubah ganda untuk mengelompokkan n objek ke dalam m gerombol (m≤n) berdasarkan karakteristiknya (Johnson & Winchern 2002). Pengelompokannya didasarkan pada sifat kemiripan atau sifat ketidakmiripan antar objek. Objek dalam kelompok lebih mirip dibandingkan dengan objek antar kelompok. Jarak yang sering digunakan sebagai ukuran kemiripan atau ketidakmiripan antar objek adalah jarak Euclid. Jarak ini didefinisikan sebagai berikut:

= [( − ) ( − )] /

dengan dij adalah jarak antara objek ke-i dan ke-j, xi adalah vektor peubah untuk objek ke-i,

dan xj adalah vektor peubah untuk objek ke-j.

Transformasi data ke dalam bentuk baku (Z) dilakukan jika satuan pengukuran tidak sama. Tujuannya adalah untuk mengurangi keragaman yang disebabkan oleh beda satuan. Penggunaan jarak ini dilakukan jika peubah yang diamati saling bebas atau tidak ada korelasi di antara peubah. Jika masalah korelasi muncul maka dapat dilakukan transformasi menggunakan Analisis Komponen Utama (AKU) atau menggunakan jarak Mahalanobis. Jarak

(10)

Mahalanobis dapat didefinisikan sebagai berikut:

= [( − ) ( )] /

dengan S adalah matriks ragam peragam contoh.

Metode penggerombolan terbagi ke dalam dua jenis yaitu:

1. Metode penggerombolan berhierarki

Metode ini biasanya digunakan bila banyaknya gerombol yang akan dibentuk tidak diketahui sebelumnya dan banyaknya objek amatan tidak besar. Terdapat dua prosedur pada metode berhierarki, yaitu prosedur aglomeratif dan prosedur divisif. Sedangkan beberapa ukuran kemiripan atau ketidakmiripan antar gerombol dapat dilihat dengan menggunakan Pautan Tunggal, Pautan Lengkap, Pautan Centroid, Pautan Rataan, dan Pautan Median. Hasil penggerombolan dengan metode berhierarki dapat digambarkan dalam sebuah diagram pohon yang biasa disebut dendogram. Banyak gerombol yang dihasilkan diperoleh dari pemotongan dendogram pada saat terjadi lompatan terjauh antar penggabungan atau jarak yang dianggap menghasilkan gerombol yang lebih bermakna.

a. Pautan Tunggal

Jarak dua gerombol diukur dengan jarak terdekat antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain.

( ) = max( , ) dimana d(uv)w adalah jarak antara gerombol (UV) dan gerombol W, duw dan dvw adalah jarak antara tetangga terdekat gerombol U dan W, serta gerombol V dan W.

b. Pautan Lengkap

Jarak dua gerombol diukur dengan jarak terjauh antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain.

( ) = max( , ) c. Pautan Centroid

Jarak antara dua buah gerombol diukur sebagai jarak Euclidian antara kedua rataan (centroid) gerombol.

d. Pautan Median

Jarak antar gerombol didefinisikan sebagai jarak antar median, dan gerombol-gerombol dengan jarak terkecil akan digabungkan.

e. Pautan Rataan

Jarak antara dua gerombol diukur dengan jarak rataa antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain.

( ) =

∑ ∑

( )

dimana dik adalah jarak antara objek ke-i dalam gerombol (UV) dan objek ke-k dalam gerombol ke W, dan N(UV) dan Nw adalah jumlah objek dalam gerombol (UV) dan W.

2. Metode Penggerombolan tak berhierarki Metode ini biasanya digunakan jika banyaknya gerombol yang akan dibentuk telah ditentukan jumlahnya. Salah metode yang paling sering digunakan adalah metode k-rataan. Algoritma yang digunakan dalam metode k-rataan adalah sebagai berikut:

a. Tentukan besarnya k, yaitu banyaknya gerombol, dan tentukan juga centroid di tiap gerombol.

b. Hitung jarak antara setiap objek dengan setiap centroid.

c. Hitung kembali rataan (centroid) untuk gerombol yang baru terbentuk.

d. Ulangi langkah b sampai tidak ada lagi pemindahan objek antar gerombol. Penentuan centroid pada langkah awal sangat mempengaruhi hasil penggerombolan yang diperoleh. Beberapa metode yang dapat digunakan untuk menentukan centroid awal adalah sebagai berikut:

1. K data awal

Metode ini adalah metode yang paling sederhana dibandingkan metode lainnya. Data yang dijadikan centroid awal adalah data yang berada pada urutan ke-1,…, k. 2. Distance Based Starting Point

Metode ini mencari centroid awal yang relatif jauh satu sama lain. Ide dasar metode ini adalah adanya anggapan bahwa pusat gerombol yang saling berjauhan kemungkinan besar akan menghasilkan gerombol yang berbeda. Tahapan dari metode ini adalah:

a. Mengambil n contoh acak dari pengamatan yang akan digerombolkan. Jika jumlah objek lebih besar dari 50 maka, diambil contoh sebesar 10% dari jumlah objek tersebut dan jika jumlah

(11)

objek kecil dari 50, maka diambil contoh sebesar jumlah objek tersebut.

b. Memilih k data awal dari contoh (n) tersebut sebagai centroid sementara dan menghitung jarak berpasangan antar centroid. Dua centroid dengan jarak minimum diberi tanda A dan B.

c. Menghitung jarak antara titik lain dalam contoh yang tidak terpilih sebagai centroid awal (misal titik C) dengan tiap centroid. Jika nilai minimum jarak tersebut lebih besar dari jarak minimum dua centroid awal (A dan B), masukkan C sebagai centroid baru dan centroid awal yang jaraknya lebih dekat dengan C dibuang.

d. Memperbaiki jarak minimum antar centroid.

e. Mengulangi tahap c-d hingga seluruh titik contoh teruji.

3. Density Based Starting Point Tahapan metode ini sebagai berikut:

a. Mengambil n contoh acak dari pengamatan yang akan digerombolkan. Jika jumlah objek lebih besar dari 50 maka, diambil contoh sebesar 10% dari jumlah objek tersebut dan jika jumlah objek kecil dari 50, maka diambil contoh sebesar jumlah objek tersebut. b. Menghitung jarak antar objek dalam

contoh.

c. Mentransformasi jarak tersebut ke dalam bentuk proximity (pij).

= 1

1 +

dengan pij adalah proximity objek ke-i dan ke-j dan dij adalah jarak objek ke-i dan ke-j

d. Menghitung jumlah proximity masing-masing objek.

e. Memilih objek dengan nilai proximity terbesar sebagai centroid awal pertama. f. Memperbaiki nilai proximity antar

objek. Misal nilai proximity terbesar pada objek 1, maka nilai proximity perbaikannya adalah

Pi,j = pi,j – (pi,1*p1,j/p1,1)

g. Mengulangi tahap d-f hingga k centroid awal diperoleh.

4. Hierarchical Starting Point

Tahap pertama metode ini sama dengan tahap pertama metode Distance Based Starting

Point. Tahap selanjutnya adalah

menggerombolkan contoh menggunakan metode Pautan Lengkap dan pusat gerombol yang diperoleh dijadikan centroid awal k-rataan.

Cluster Ensemble

Cluster Ensemble merupakan metode yang digunakan untuk menyelesaikan masalah penggerombolan dengan mengkombinasikan sekumpulan solusi gerombol yang berbeda yang diperoleh dari metode yang berbeda-beda menjadi satu solusi penggerombolan akhir.

Cluster Ensemble mengombinasikan

sekumpulan solusi tanpa melihat karakteristik asli data atau algoritma awal yang digunakan untuk membangun sekumpulan solusi tersebut. Karakteristik dari Cluster Ensemble adalah kekekaran, keakuratan, dan kestabilan hasil yang tinggi.

Cluster Ensemble terdiri dari dua tahap yaitu: 1. Membangun sekumpulan solusi gerombol berbeda sebagai anggota ensemble dengan menggerombolkan objek menggunakan metode berbeda. Apabila menggunakan k-rataan, dapat dicoba beragam nilai centroid awal. Selain itu, dapat dicoba menggerombolkan objek dengan jumlah gerombol yang beragam.

Menurut Strehl dan Gosh (2002), sekumpulan solusi gerombol berbeda dapat diperoleh dengan menggerombolkan objek menggunakan karakteristik yang berbeda.

2. Mengkombinasikan sekumpulan solusi

gerombol anggota ensemble menggunakan fungsi Consensus.

Fungsi Consensus

Dalam Cluster Ensemble dikenal sebuah fungsi bernama fungsi Consensus. Fungsi

Consensus didefinisikan sebagai fungsi Nnxr

→ Nn yang memetakan sekumpulan solusi gerombol menjadi satu solusi gabungan.

∶ ( ) {1, 2, … , }} →

Tujuan dari fungsi Consensus adalah mengombinasikan solusi gerombol dan mencari solusi gabungan yang memberikan informasi terbanyak. Fungsi Consensus memiliki beragam algoritma, salah satunya algoritma Meta-Clustering.

Strehl dan Gosh memperkenalkan algoritma Meta-Clustering pada tahun 2002. Ide dasar dari algoritma ini adalah menggerombolkan kembali solusi gerombol. Pada tahun 2008, Orme dan Johnson telah mengembangkan algoritma ini. Mereka menggunakan ide dasar algoritma ini

(12)

dan mengaplikasikannya menjadi bentuk yang lebih sederhana. Berikut algoritma yang dikembangkan oleh Orme dan Johnson (2008): 1. Mentransformasi hasil analisis gerombol ke

dalam bentuk matriks indikator.

2. Menggerombolkan objek dengan kolom-kolom matriks indikator sebagai peubah yang digunakan dalam analisis gerombol. Tahap ini disebut dengan Clustering on Cluster (CC).

Metode yang digunakan pada tahap dua (CC) adalah k-rataan. Penggerombolan tahap dua dilakukan secara berulang dengan inisialisasi acak menggunakan Distance Based Starting Point, Density Based Starting Point, dan

Hierarchical Starting Point. Tahap dua

menghasilkan sekumpulan solusi gerombol. Solusi yang dihasilkan pada tahap dua selanjutnya dikombinasikan kembali dengan melakukan tahap 1-2. Tahap kombinasi solusi yang diperoleh dari tahap dua disebut Clustering on cluster solution of cluster solution (CCC). Tahap CCC berhenti jika tidak ada objek yang berpindah kelompok dan sekumpulan solusi sebelumnya dijadikan solusi akhir.

X

Gambar 1 Kerangka Cluster Ensemble. X (pengamatan), Ф(i) = metode penggerombolan ke-i, λ(i) = solusi gerombol metode ke-i, Γ = fungsi Consensus, dan λ =solusi akhir.

Matriks Indikator

Tahap satu algoritma Meta-Clustering yaitu mentransformasi hasil gerombol ke dalam bentuk matriks indikator. Matriks indikator adalah matriks yang kolom-kolomnya menggambarkan gerombol dari setiap solusi. Baris-baris matriks indikator menggambarkan objek pengamatan. Matriks ini terdiri dari angka biner 1 dan 0. Objek bernilai 1 pada kolom tertentu jika merupakan anggota gerombol yang bersesuaian dengan kolom tersebut dan bernilai 0 jika sebaliknya.

Langkah mentransformasi hasil penggerombolan ke dalam bentuk matriks indikator sebagai berikut:

1. Tabulasi solusi gerombol seperti berikut: Tabel 1 Tabulasi solusi gerombol berganda

Objek ( ) ( ) ( ) A1 1 2 1 A2 1 2 1 A3 1 2 2 A4 2 3 2 A5 2 3 3 A6 3 1 3 A7 3 1 3

2. Untuk setiap solusi gerombol ke-i λ(i), buat matriks Hi berukuran n x y, dimana n adalah jumlah objek pengamatan dan y adalah jumlah gerombol.

3. Kolom ke-j pada matriks Hi menunjukkan gerombol ke-j pada λ(i).

4. Pengamatan akan bernilai 1 pada kolom tertentu jika pengamatan tersebut anggota gerombol yang bersesuaian dengan kolom dan bernilai 0 jika sebaliknya.

5. Lakukan langkah 2-4 untuk setiap λ(i). 6. Gabung matriks Hi seperti terlihat pada

Tabel 2

Tabel 2 Matriks indikator

H1 H2 H3 h1 h2 h3 h4 h5 h6 h7 h8 h9 a1 1 0 0 0 1 0 1 0 0 a2 1 0 0 0 1 0 1 0 0 a3 1 0 0 0 1 0 0 1 0 a4 0 1 0 0 0 1 0 1 0 a5 0 1 0 0 0 1 0 0 1 a6 0 0 1 1 0 0 0 0 1 a7 0 0 1 1 0 0 0 0 1 Nilai Reproducibility

Nilai reproducibility digunakan untuk menentukan solusi terbaik dari sekumpulan solusi yang dihasilkan oleh algoritma

Meta-Clustering. Nilai reproducibility

menggambarkan kekonsistenan solusi gerombol satu dengan gerombol lainnya. Solusi terbaik digambarkan dengan nilai reproducibility tertinggi. Nilai reproducibility dapat diperoleh dengan cara berikut:

1. Membuat tabulasi silang solusi gerombol ke-i dengan solusi gerombol ke-j untuk i ≠ j. Ф(1) Ф(2) Ф(r) λ(1) λ(2) λ(r) Γ λ

(13)

2. Rij = jumlah diagonal / jumlah objek. 3. Nilai reproducibility gerombol ke-i adalah

Ri = (Ri1 + Ri2 + … + Rij)/j

Misal akan dihitung nilai reproducibility solusi λ(1) pada Tabel 1. Sebagai contoh Tabel 3 menunjukkan tabulasi silang solusi λ(1) dan λ(2).

Pelabelan (labeling) gerombol yang bersifat arbitrary (terserah, tidak ada aturan pasti) berimplikasi pada pelabelan gerombol yang terlihat berbeda padahal sama (Anggiani 2009). Misal solusi λ(1) dan λ(2) yang menghasilkan solusi yang sama namun tampak berbeda. Perbedaan tersebut menimbulkan masalah ketika dilakukan tabulasi silang antar solusi sehingga mempengaruhi nilai reproducibility. Untuk mengatasi hal tersebut, maka perlu dilakukan penukaran posisi kolom ke posisi yang bersesuaian dengan posisi baris yang mempunyai nilai terbesar pada kolom tersebut sehingga dapat memaksimalkan jumlah diagonal. Setelah dilakukan penukaran posisi kolom maka tabulasi silang antara solusi λ(1) dan λ(2) berubah seperti pada Tabel 4.

Tabel 3 Tabulasi silang solusi gerombol sebelum aturan pelabelan

Solusi 1 Solusi 2

Group1 Group2 Group3 Total

Group1 0 3 0 3

Group2 0 0 2 2

Group3 2 0 0 2

Total 2 3 2 7

Tabel 4 Tabulasi silang solusi gerombol setelah aturan pelabelan

Solusi 1 Solusi 2

Group1 Group2 Group3 Total

Group1 3 0 0 3

Group2 0 2 0 2

Group3 0 0 2 2

Total 3 2 2 7

Nilai reproducibility antara solusi λ(1) dan λ(2) dapat dihitung dengan cara membagi jumlah diagonal dengan jumlah objek sehingga diperoleh nilai R12 = (3+2+2)/7 = 1. Untuk mengetahui nilai reproducibility total solusi λ(1) maka perlu dihitung juga nilai reproducibility antara solusi λ(1) dan λ(3) sehingga nilai reproducibility total solusi λ(1) diperoleh sebesar R1 = (R12 + R13)/2. Solusi yang memiliki nilai

reproducibility total tertinggi dipilih sebagai solusi terbaik.

Untuk membandingkan solusi dengan jumlah gerombol yang berbeda dapat menggunakan nilai reproducibility adjusted (RA). Nilai RA yang paling tinggi pada jumlah gerombol tertentu menunjukkan bahwa jumlah gerombol tersebut mampu mencirikan struktur data yang baik. Berikut perhitungan nilai RA:

RA = [(k*R) – 1] / (k-1)

Dimana k adalah jumlah gerombol dan R adalah nilai reproducibility.

DATA DAN METODE Data

Data yang digunakan dalam penelitian ini adalah data sekunder tahun 2009 yang diperoleh dari Balai Besar Penelitian dan Pengembangan Bioteknologi dan Sumberdaya Genetik Pertanian (BB-Biogen) Bogor. Objek yang digunakan dalam penelitian ini adalah galur atau varietas padi. Daftar objek dapat dilihat pada Tabel 5. Tabel 5 Daftar objek pengamatan

No. Varietas 1 Mahakam 2 Danau tempe 3 Jatiluhur 4 Nona bokra 5 B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 6 B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1 7 B11283-6C-PN-5-MR-34-1-1-3 8 B11742-RS-2-3-MR-34-1-1-3 9 B11742-RS-2-3-MR-34-1-1-4 10 B11742-RS-2-3-MR-34-1-1-5 11 B11742-RS-2-3-MR-34-1-2-1 12 B11742-RS-2-3-MR-34-1-2-3 13 B11742-RS-2-3-MR-34-1-4-1 14 B11742-RS-2-3-MR-34-1-4-3 15 Dodokan 16 Silugonggo 17 Sentani 18 Tondano 19 Singkarak

Peubah yang digunakan sebagai karakteristik penggerombolan adalah peubah-peubah yang diduga memiliki pengaruh terhadap hasil gabah padi. Daftar peubah dapat dilihat pada Tabel 6.

(14)

Tabel 6 Daftar peubah karakteristik

Kode. Keterangan

X1 Hasil gabah (kg/ha)

X2 Umur saat akar tembus lilin (HST) X3 Jumlah akar tembus

X4 Panjang akar tembus (cm) X5 Berat akar (gr)

X6 Laju asimilasi bersih (umur 40-50 HST) (mgr/cm2/hari)

X7 Laju pertumbuhan relatif (umur 40-50 HST) (mgr/hari)

X8 Laju pengisian biji (g/hari/rumpun)

X9 Specific leaf area (gr/cm2 daun)

X10 Leaf area ratio (cm2/ gr tanaman)

X11 Rata-rata tinggi tanaman (cm) X12 Anakan

X13 Panjang malai (cm) X14 Jumlah gabah per malai X15 Berat 200 butir (gr)

Metode

Galur atau varietas padi akan digerombolkan dengan menggunakan Cluster Ensemble. Tahapan yang dilakukan dalam penelitian ini adalah:

1. Mentransformasi semua data ke dalam bentuk baku (Z) untuk mengatasi perbedaan satuan.

2. Mengeksplorasi peubah.

3. Menghitung korelasi di antar peubah. Jika terbukti adanya korelasi maka dilakukan analisis komponen utama.

4. Membangun ensemble dengan menggerombolkan objek berdasarkan karakteristiknya menggunakan metode hierarki Pautan tunggal, Pautan lengkap, Pautan rataan, Pautan centroid, dan Pautan median dan metode tak berhierarki k-rataan yang terdiri dari k data awal, Distance Based Starting Point, Density Based Starting Point, Hierarchical Starting Point. Objek akan dibentuk menjadi 2, 3, dan 4 gerombol. Jarak yang digunakan sebagai ukuran kemiripan antar objek adalah jarak Euclid.

5. Membuat tabulasi solusi-solusi yang

terbentuk. Hal ini bertujuan untuk memudahkan dalam melihat solusi mana yang memiliki persamaan sehingga hanya salah satu solusi yang akan digunakan sebagai anggota ensemble.

6. Mengkombinasikan seluruh anggota

ensemble dengan menggunakan algoritma

Meta-Clustering. Tahap Clustering on

Cluster dalam algoritma ini akan

menggunakan metode k-rataan secara berulang yang terdiri dari Distance Based Starting Point, Density Based Starting Point, Hierarchical Starting Point. Dari masing-masing solusi akan dihitung nilai reproducibility-nya untuk melihat solusi mana yang paling baik. Algoritma Meta-Clustering ini dilakukan pada solusi 2, 3, dan 4 gerombol. Dengan demikian diperoleh tiga solusi terbaik berdasarkan jumlah gerombolnya. Lalu dilakukan perhitungan nilai reproducibility adjusted untuk memilih solusi dari jumlah gerombol mana yang paling baik sebagai solusi akhir Consensus. Seluruh tahapan ini dilakukan sebanyak dua kali , yaitu sebelum dan setelah pembuatan aturan pelabelan gerombol.

7. Tahapan akhir dari metode ini adalah mendiskripsikan masing-masing gerombol berdasarkan karakteristik peubah-peubahnya. Sebelum dilakukan pengkategorian, nilai peubah baku ditransformasi balik ke nilai peubah asal. Pengkategorian peubah pada gerombol tertentu adalah sebagai berikut:  Tinggi (T). Peubah ke-i pada gerombol ke-j

dikategorikan tinggi jika ̅ij > ̅i. + 1/2Si.

 Sedang (S). Peubah ke-i pada gerombol ke-j dikategorikan sedang jika

̅i. - 1/2Si.< ̅ij ≤ ̅i. + 1/2Si.  Rendah (R). Peubah ke-i pada gerombol ke-j

dikategorikan rendah jika ̅ij ≤ ̅i. - 1/2Si. HASIL DAN PEMBAHASAN Eksplorasi dan Deskripsi Peubah Gambar 2 menunjukkan hasil eksplorasi peubah dengan menggunakan diagram kotak garis. Lebar diagram kotak garis menunjukkan bahwa keragaman peubah tinggi, artinya karakteristik peubah tiap varietas heterogen. Dari gambar dapat dilihat bahwa pada beberapa peubah terdapat varietas yang menjadi pencilan atau memiliki nilai di luar batas atas dan batas bawah diagram kotak garis.

Pada peubah hasil gabah, varietas Sentani memiliki nilai yang paling rendah jika dibandingkan dengan varietas lainnya, sehingga varietas ini menjadi pencilan pada peubah hasil gabah. Selain pada peubah tersebut varietas

(15)

Gambar 2 Hasil eksplorasi peubah dengan diagram kotak garis Sentani pun menjadi pencilan pada peubah laju

pengisian biji. Varietas Danau tempe merupakan pencilan pada beberapa peubah seperti pada peubah laju asimilasi bersih, laju pertumbuhan relatif, dan panjang malai. Selain varietas Danau tempe, galur B11742-RS-2-3-MR-34-1-4-1juga menjadi sebuah pencilan pada peubah panjang malai. Selain varietas di atas, varietas lain yang menjadi pencilan adalah galur B11742-RS-2-3-MR-34-1-1-5 yang memiliki nilai tertinggi pada peubah berat akar, galur B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 pada peubah laju asimilasi bersih, galur B11283-6C-PN-5-MR-34-1-1-3 pada peubah laju pengisian biji, dan varietas Mahakam pada peubah jumlah gabah per malai.

Pemeriksaan Korelasi

Lampiran 3 menunjukkan hasil pemeriksaan korelasi di antara tiap peubah. Dari hasil yang diperoleh menunjukkan bahwa ada korelasi di antara beberapa peubah. Nilai korelasi yang diperoleh berkisar di bawah -0.4 dan di atas 0.4.

Nilai korelasi yang paling tinggi terjadi antara peubah laju asimilasi bersih dan laju relatif pertumbuhan, yaitu sebesar 0.959, sedangkan nilai korelasi yang paling rendah terjadi antara peubah jumlah akar tembus dan

laju pengisian biji sebesar -0.548. Selain itu, di antara peubah hasil gabah dan laju pengisian biji juga memiliki korelasi sebesar 0.636. Antara peubah berat akar dan rata-rata tinggi tanaman juga memiliki korelasi sebesar 0.758.

Dengan adanya korelasi di antara beberapa peubah, maka konsep jarak Euclid tidak dapat digunakan langsung. Untuk mengatasi masalah ini, maka dilakukan analisis komponen utama terlebih dahulu untuk menghilangkan korelasi di antara peubah. Dalam penelitian ini, seluruh skor komponen utama akan digunakan untuk penggerombolan varietas padi pada tahap selanjutnya.

Anggota Ensemble

Tahap awal dalam Cluster Ensemble adalah membentuk sekumpulan solusi gerombol dari metode yang berbeda sebagai anggota ensemble. Pada penelitian ini, anggota ensemble dibentuk dari hasil penggerombolan dengan menggunakan sembilan metode, yaitu: Pautan tunggal, Pautan lengkap, Pautan rataan, Pautan centroid, dan Pautan median, metode k-rataan dengan empat inisialisasi yang berbeda. Setiap metode penggerombolan menghasilkan solusi 2, 3, dan 4 gerombol. Hasil penggerombolan dengan

Z15 Z14 Z13 Z12 Z11 Z10 Z9 Z8 Z7 Z6 Z5 Z4 Z3 Z2 Z1 3 2 1 0 -1 -2 -3 D a ta Sentani

B11742-RS-2-3-MR-34-Danau tempeMahak am

B11742-RS-2-3-MR-34-1-1-5

B.10970C -MR-4-2-1-1-1-SI-3-2-4-1

Danau tempeDanau tempe

Sentani

B11283-6C -PN-5-MR-34-1-1-3

(16)

menggunakan metode hierarki menghasilkan ukuran kemiripan yang berbeda-beda untuk setiap metode penggerombolan. Besarnya tingkat kemiripan tersebut dapat dilihat pada Lampiran 4.

Hasil penggerombolan pada tahap awal dapat dilihat pada Lampiran 5. Dari lampiran tersebut diketahui bahwa ada beberapa metode yang menghasilkan gerombol yang hanya terdiri dari satu anggota gerombol. Hal ini mengindikasikan bahwa anggota gerombol tersebut merupakan sebuah pencilan yang memiliki karakteristik yang berbeda dengan anggota dari gerombol-gerombol lain. Selain itu, beberapa metode pun menghasilkan solusi yang sama yaitu:

1. Solusi 2 gerombol metode Pautan rataan, Pautan centroid, dan Pautan median. Metode Pautan lengkap dan k-rataan 4 memiliki solusi yang sama, namun berbeda dengan kelompok solusi di atas.

2. Solusi 3 gerombol metode Pautan tunggal, Pautan rataan, Pautan centroid, dan Pautan median.

3. Solusi 4 gerombol metode Pautan rataan dan Pautan median.

Tidak semua solusi yang dihasilkan akan digunakan sebagai anggota ensemble karena dari beberapa solusi yang sama, hanya akan diambil salah satu solusi saja. Dengan demikian solusi yang akan digunakan sebagai anggota ensemble berjumlah 20 solusi.

Solusi Consensus

Setelah membangun anggota ensemble, maka tahap selanjutnya adalah membentuk solusi consensus dengan mengombinasikan seluruh anggota ensemble dengan menggunakan algoritma Meta-Clustering. Solusi consensus yang dibentuk adalah solusi 2, 3, dan 4 gerombol.

Sebelum Aturan Pelabelan Gerombol

Solusi consensus yang dihasilkan sebelum adanya aturan pelabelan gerombol terdiri dari solusi 2, 3, dan 4 gerombol. Hasil penggerombolan beserta nilai reproducibility dan reproducibility adjusted dapat dilihat pada Lampiran 6.

Solusi 2 Gerombol

Gerombol satu terdiri dari 8 anggota gerombol dan gerombol dua terdiri dari 11 anggota gerombol. Struktur solusi dua gerombol

ini sama dengan yang dihasilkan oleh metode k-rataan 4 dengan inisialisasi menggunakan

Hierarchical Starting Point. Nilai

reproducibility dan reproducibility adjusted pada solusi dua gerombol berturut-turut adalah 0.8167 dan 0.6333. Hal ini menunjukkan bahwa terdapat 81.67% dari 19 varietas yang konsisten berada dalam gerombol tertentu untuk seluruh ulangan. Dengan kata lain ada 16 varietas yang memiliki hasil yang konsisten.

Solusi 3 Gerombol

Gerombol satu terdiri dari 11 anggota gerombol, gerombol dua terdiri dari 7 anggota gerombol, dan gerombol tiga terdiri dari 1 anggota gerombol. Anggota gerombol satu pada solusi tiga gerombol sama dengan anggota gerombol dua pada solusi dua gerombol. Anggota gerombol tiga merupakan pecahan dari gerombol satu pada solusi dua gerombol.

Nilai reproducibility dan reproducibility adjusted pada solusi tiga gerombol berturut-turut adalah 0.8275 dan 0.7413. Hal ini menunjukkan bahwa terdapat 82.75 % dari 19 varietas yang konsisten berada dalam gerombol tertentu untuk seluruh ulangan. Nilai reproducibility adjusted pada solusi tiga gerombol lebih tinggi dibandingkan pada solusi gerombol dua. Hal ini mengindikasikan bahwa solusi tiga gerombol dapat mencirikan struktur data yang lebih baik daripada solusi dua gerombol.

Solusi 4 Gerombol

Gerombol satu terdiri dari 11 anggota gerombol, gerombol dua terdiri dari 6 anggota gerombol, gerombol tiga dan empat terdiri dari 1 anggota gerombol. Varietas Danau tempe cenderung memisahkan diri dari varietas lainnya sehingga membentuk satu gerombol sendiri. Hal ini dapat terjadi karena varietas Danau tempe memiliki karakteristik yang berbeda dari varietas lainnya.

Nilai reproducibility dan reproducibility adjusted pada solusi empat gerombol berturut-turut adalah 0.8705 dan 0.8273. Hal ini menunjukkan bahwa terdapat 87.05 % dari 19 varietas yang konsisten berada dalam gerombol tertentu untuk seluruh ulangan. Nilai reproducibility adjusted pada solusi empat gerombol lebih tinggi dibandingkan dua solusi sebelumnya. Hal ini mengindikasikan bahwa solusi empat gerombol dapat mencirikan struktur data yang lebih baik daripada solusi dua gerombol dan solusi tiga gerombol.

(17)

Setelah Aturan Pelabelan Gerombol

Solusi consensus yang dihasilkan setelah adanya aturan pelabelan gerombol terdiri dari solusi 2, 3, dan 4 gerombol. Hasil penggerombolan beserta nilai reproducibility dan reproducibility adjusted dapat dilihat pada Lampiran 6.

Solusi 2, 3, dan 4 gerombol yang dihasilkan setelah adanya aturan pelabelan gerombol tidak berbeda dengan solusi sebelum adanya aturan pelabelan gerombol. Yang berbeda hanya nilai reproducibility dan reproducibility adjusted yang lebih tinggi daripada sebelumnya. Dapat dilihat pada Lampiran 6, nilai reproducibility untuk solusi 2, 3, dan 4 gerombol setelah aturan pelabelan gerombol berturut-turut adalah 0.9165, 0.9111, 0.9056. Dengan demikian, dengan adanya aturan pelabelan gerombol, maka kekonsistenan solusi gerombol semakin meningkat. Dari nilai reproducibility adjusted sebesar 0.8742, solusi empat gerombol memberikan hasil yang lebih baik dibandingkan solusi dua dan tiga gerombol.

Deskripsi Solusi Gerombol Akhir Solusi akhir dari Cluster Ensemble membagi varietas padi ke dalam empat gerombol. Nilai rataan tiap gerombol pada tiap peubah dihitung untuk mengkategorikan gerombol berdasarkan karakteristiknya. Nilai rataan tiap gerombol pada tiap peubah dapat dilihat pada Tabel 7, sedangkan untuk nilai rataan dan standar deviasi tiap peubah dapat dilihat pada Tabel 8.

Gerombol Satu

Varietas padi yang merupakan anggota dari gerombol satu adalah varietas Nona bokra, B.10970C-MR-4-2-1-1-1-SI-3-2-4-1, B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1, B11283-6C-PN-5-MR-34-1-1-3, B11742-RS-2-3-MR-34-1-1-3, MR-34-1-1-4, B11742-RS-2-3-MR-34-1-1-5, B11742-RS-2-3-MR-34-1-2-1, MR-34-1-2-3, B11742-RS-2-3-MR-34-1-4-1. Berdasarkan hasil yang diperoleh dari Tabel 9, gerombol satu merupakan gerombol yang memiliki karakteristik unik dalam peubah berat akar dan anakan yang tinggi, laju pengisian biji yang sedang, dan jumlah gabai per malai yang rendah.

Gerombol Dua

Varietas padi yang merupakan anggota dari gerombol dua adalah varietas Jatiluhur,

B11742-RS-2-3-MR-34-1-4-3, Dodokan, Silugonggo, Sentani, Singkarak. Berdasarkan hasil yang diperoleh dari Tabel 9, gerombol dua merupakan gerombol yang memiliki karakteristik yang unik dalam peubah hasil gabah, umur saat akar tembus lilin, berat akar, leaf area ratio , dan rata-rata tinggi tanaman yang rendah; panjang akar tembus lilin, panjang malai, dan berat 200 butir yang tinggi.

Tabel 7 Rataan peubah setiap gerombol

Peubah Rataan Gerombol

1 2 3 4 X1 5475.7 5099.7 5460.0 5831.0 X2 21.9 18.0 20.0 28.0 X3 2.7 4.7 2.0 4.0 X4 11.9 17.6 8.5 12.0 X5 32.1 25.4 28.2 29.5 X6 1.1 1.2 0.9 0.9 X7 112.5 117.2 76.5 87.7 X8 0.9 0.8 1.0 0.8 X9 194.2 197.5 217.0 189.0 X10 52.4 42.2 52.0 55.0 X11 119.1 101.2 110.0 119.0 X12 76.5 73.4 71.3 65.7 X13 23.8 24.1 23.8 23.8 X14 90.9 91.4 103.3 100.5 X15 3.8 4.7 3.9 3.4 Gerombol Tiga

Varietas padi yang merupakan anggota dari gerombol tiga adalah varietas Mahakam. Varietas Mahakam membentuk gerombol sendiri karena varietas ini memiliki karakteristik yang berbeda dengan anggota gerombol sebelumnya. Berdasarkan hasil yang diperoleh dari Tabel 9, gerombol tiga merupakan gerombol yang memiliki karakteristik yang unik dalam peubah panjang akar tembus lilin yang rendah; rata-rata tinggi tanaman yang sedang; laju pengisian biji dan specific leaf area yang tinggi. Gerombol Empat

Varietas padi yang merupakan anggota dari gerombol empat adalah varietas Danau tempe. Tidak berbeda dengan varietas Mahakam, varietas Danau tempe juga cenderung membentuk gerombol sendiri karena varietas ini merupakan pencilan di beberapa peubah seperti yang terlihat pada diagram kotak garis. Berdasarkan hasil yang diperoleh dari Tabel 8, gerombol empat merupakan gerombol yang

(18)

memiliki karakteristik yang unik dalam peubah hasil gabah, umur saat akar tembus lilin, dan leaf area ratio yang tinggi; specific leaf area, anakan, dan berat 200 butir yang rendah.

Setiap peubah karakteristik telah diwakili oleh tiap gerombol. Deskripsi penggerombolan di atas akan memudahkan para peneliti untuk memilih tetua dalam melakukan persilangan varietas padi sebagai upaya menciptakan varietas baru berdasarkan karakteristik tertentu.

Tabel 8 Rataan dan standar deviasi tiap peubah Peubah ̅ s ̅-1/2 s ̅ + 1/2 s X1 5466.6 298.6 5317.3 5615.9 X2 22.0 4.3 19.8 24.1 X3 3.4 1.2 2.8 4.0 X4 12.5 3.8 10.6 14.4 X5 28.8 2.8 27.4 30.2 X6 1.0 0.1 1.0 1.1 X7 98.5 19.5 88.7 108.3 X8 0.9 0.1 0.8 0.9 X9 199.4 12.2 193.3 205.5 X10 50.4 5.6 47.6 53.0 X11 112.3 8.6 108.0 116.6 X12 71.7 4.6 69.4 74.0 X13 23.9 0.2 23.8 23.9 X14 96.5 6.3 93.4 99.7 X15 3.9 0.4 3.7 4.1

Tabel 9 Hasil pengkategorian gerombol Peubah Kategori Gerombol

1 2 3 4 X1 S R S T X2 S R S T X3 R T R T X4 S T R S X5 T R S S X6 T T R R X7 T T R R X8 S R T R X9 S S T R X10 S R S T X11 T R S T X12 T S S R X13 S T R R X14 R R T T X15 S T S R

KESIMPULAN DAN SARAN Kesimpulan

Cluster Ensemble menggerombolkan 19 varietas atau galur padi berdasarkan 15 peubah karakteristiknya menjadi solusi 2, 3, dan 4 gerombol. Kriteria nilai reproducibility adjusted yang diperoleh berturut-turut sebesar 0.8330, 0.8666, 0.8742. Berdasarkan kriteria nilai tersebut, maka dapat disimpulkan bahwa solusi yang paling baik dalam menggerombolkan varietas padi pada penelitian ini adalah solusi 4 gerombol. Setiap gerombol yang diperoleh memiliki peubah yang menjadi karakteristik gerombol itu sendiri. Dengan demikian para peneliti akan lebih mudah dalam memilih perwakilan varietas padi yang dapat digunakan sebagai tetua persilangan berdasarkan karakteristik yang diinginkan.

Saran

Penelitian selanjutnya lebih baik mengkaji lagi solusi alternatif untuk jarak yang digunakan dalam tahap Clustering on Cluster. Penggunaan jarak Euclid kurang tepat dalam menggerombolkan data berbentuk biner. Dalam penelitian ini, hal tersebut belum bisa diperbaiki karena keterbatasan dalam masalah pemrograman untuk software yang digunakan.

DAFTAR PUSTAKA

Anggiani D. 2009. Penerapan Cluster Ensemble dalam Penggerombolan Kecamatan di Kabupaten Bogor [Skripsi]. Bogor : Departemen Statistika, Institut Pertanian Bogor.

Johnson RA, Winchern DW. 2002. Applied Multivariate Statistical Data Analysis. New Jersey : Prentice Hall.

Megawati. 2010. Penggerombolan Kabupaten di Jawa Barat Berdasarkan Indikator Ketahanan dan Kerentanan Pangan Menggunakan Cluster Ensemble [Skripsi]. Bogor : Departemen Statistika, Institut Pertanian Bogor.

Orme B. 2008. CCEA v3 Software for

Convergent Cluster and Ensemble

Analysis. Sawtooth Software.

Orme B, Johnson R. 2008. Improving K-Means Cluster Analysis: Ensemble Analysis

(19)

Instead Of Highest Reproducibility Replicates. Sawtooth Software.

Retzer J, Shan M. 2007. Cluster Ensemble Analysis and Graphical Depiction of Cluster Partitions. Proceedings of the 2007 Sawtooth Software Conference; California, 17-19 Oktober 2009. Sequim WA: 2008. 239-250.

Strehl A, Gosh J. 2002. A Knowledge Reuse Framework for Combining Partitionings. Austin: The University of Texas.

(20)
(21)

Lampiran 1 Varietas atau galur padi dan peubah karakteristiknya Varietas X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Mahakam 4330.00 24.00 1.00 14.00 37.44 1.10 119.20 0.80 218.00 75.00 123.00 60.33 22.50 168.50 3.71 Danau tempe 5926.00 21.00 3.00 21.30 31.39 0.10 36.30 0.90 181.00 57.00 126.00 59.67 28.25 90.25 3.11 Jatiluhur 4949.00 19.00 6.00 18.10 40.26 1.00 108.00 0.70 203.00 49.00 132.00 76.33 25.00 100.50 2.68 Nona bokra 4647.00 20.00 3.00 12.10 35.96 1.50 132.70 0.90 179.00 39.00 167.00 79.67 24.75 42.75 3.00 B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 5902.00 29.00 1.00 1.50 25.96 1.60 146.00 1.00 178.00 57.00 96.00 82.67 24.50 119.75 3.10 B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1 6036.00 19.00 1.00 0.70 30.40 1.20 120.10 0.90 218.00 59.00 109.00 85.67 23.00 56.75 4.21 B11283-6C-PN-5-MR-34-1-1-3 5636.00 24.00 2.00 8.40 28.57 1.10 110.10 1.10 199.00 57.00 124.00 74.00 23.00 105.50 4.68 B11742-RS-2-3-MR-34-1-1-3 5696.00 23.00 3.00 17.80 20.54 1.20 126.90 0.80 195.00 43.00 93.00 77.67 24.50 90.00 3.78 B11742-RS-2-3-MR-34-1-1-4 5607.00 17.00 7.00 18.30 29.15 1.20 126.00 0.90 188.00 50.00 89.00 87.67 21.75 50.75 3.74 B11742-RS-2-3-MR-34-1-1-5 5694.00 25.00 1.00 1.30 49.45 0.80 85.90 0.80 190.00 47.00 154.00 68.33 23.75 69.50 4.51 B11742-RS-2-3-MR-34-1-2-1 5810.00 20.00 2.00 17.00 23.48 1.20 126.60 0.90 187.00 43.00 97.00 89.33 20.50 105.50 5.19 B11742-RS-2-3-MR-34-1-2-3 6466.00 16.00 3.00 12.20 22.51 1.00 95.30 1.00 186.00 43.00 92.00 85.33 23.00 39.50 3.00 B11742-RS-2-3-MR-34-1-4-1 6007.00 17.00 4.00 18.70 23.26 1.20 127.70 0.80 194.00 30.00 97.00 75.33 28.00 109.75 4.15 B11742-RS-2-3-MR-34-1-4-3 4904.00 20.00 7.00 19.30 22.53 1.40 132.20 0.70 199.00 42.00 95.00 57.67 25.50 77.25 4.80 Dodokan 4949.00 18.00 4.00 10.70 29.06 1.20 115.60 0.80 208.00 43.00 98.00 73.33 23.25 116.25 4.72 Silugonggo 4971.00 18.00 5.00 23.30 30.40 1.10 115.80 0.70 215.00 43.00 100.00 76.33 21.75 105.00 5.22 Sentani 3301.00 19.00 5.00 21.20 24.37 1.10 116.40 0.60 183.00 52.00 125.00 72.33 23.25 100.75 4.26 Tondano 5460.00 20.00 2.00 8.50 28.23 0.90 76.50 1.00 217.00 52.00 110.00 71.33 23.75 103.25 3.88 Singkarak 5831.00 28.00 4.00 12.00 29.53 0.90 87.70 0.80 189.00 55.00 119.00 65.67 23.75 100.50 3.41 12

(22)

Lampiran 2 Hasil transformasi peubah ke dalam bentuk baku Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 Z11 Z12 Z13 Z14 Z15 -1.401 0.847 -1.215 0.073 1.097 0.017 0.332 -0.375 1.608 2.636 0.463 -1.529 -0.716 2.463 -0.310 0.739 0.029 -0.189 1.120 0.250 -3.137 -2.938 0.417 -1.116 0.792 0.601 -1.600 2.263 -0.063 -1.097 -0.571 -0.517 1.350 0.661 1.492 -0.299 -0.110 -1.166 0.504 -0.027 0.877 0.178 0.580 0.268 -1.651 -0.976 -0.244 -0.189 -0.200 0.890 1.278 0.864 0.417 -1.263 -1.051 2.489 0.533 0.450 -1.597 -1.233 0.707 2.211 -1.215 -1.722 -0.510 1.594 1.389 1.208 -1.336 0.792 -0.780 0.853 0.320 0.889 -1.104 0.887 -0.517 -1.215 -1.837 0.111 0.332 0.367 0.417 1.608 0.997 -0.182 1.173 -0.457 -1.145 0.328 0.350 0.847 -0.702 -0.731 -0.145 0.017 -0.027 1.999 0.209 0.792 0.509 -0.071 -0.457 0.429 0.933 0.431 0.574 -0.189 0.618 -1.269 0.332 0.636 -0.375 -0.085 -0.642 -0.919 0.320 0.320 -0.071 -0.219 0.311 -1.063 1.863 0.690 -0.064 0.332 0.600 0.417 -0.600 0.075 -1.103 1.387 -1.104 -1.339 -0.273 0.428 1.120 -1.215 -1.751 2.779 -0.930 -0.982 -0.375 -0.453 -0.232 1.890 -0.676 -0.068 -0.733 0.718 0.584 -0.244 -0.702 0.503 -0.858 0.332 0.624 0.417 -0.674 -0.642 -0.734 1.564 -1.752 0.429 1.593 1.463 -1.336 -0.189 -0.186 -0.993 -0.299 -0.611 1.208 -0.748 -0.642 -0.965 1.138 -0.457 -1.702 -1.233 0.848 -1.063 0.324 0.747 -0.888 0.332 0.667 -0.375 -0.159 -1.973 -0.734 0.071 2.134 0.566 0.257 -0.631 -0.244 1.863 0.833 -0.991 0.963 0.845 -1.166 0.209 -0.744 -0.826 -1.813 0.839 -0.483 1.089 -0.571 -0.790 0.324 -0.401 -0.076 0.332 0.190 -0.375 0.872 -0.642 -0.688 -0.142 -0.327 0.776 0.988 -0.542 -0.790 0.837 1.408 0.111 0.017 0.198 -1.166 1.387 -0.642 -0.596 0.178 -1.104 0.413 1.634 -2.781 -0.517 0.837 1.106 -0.733 0.332 0.221 -1.958 -0.968 0.280 0.555 -0.249 -0.327 0.276 0.391 0.114 -0.244 -0.702 -0.717 -0.192 -0.614 -1.353 1.208 1.534 0.280 -0.136 -0.356 -0.068 0.356 -0.103 0.612 1.939 0.324 -0.215 -0.010 -0.930 -0.911 -0.375 -0.527 0.588 0.279 -0.960 -0.068 0.268 -0.707 13

(23)

Lampiran 3 Korelasi di antara peubah Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 Z11 Z12 Z13 Z14 Z15 Z1 1.000 Z2 0.100 1.000 Z3 -0.315 -0.484* 1.000 Z4 -0.362 -0.472* 0.702* 1.000 Z5 -0.158 0.233 -0.220 -0.331 1.000 Z6 -0.249 -0.024 0.084 -0.172 -0.292 1.000 Z7 -0.229 -0.032 0.136 -0.044 -0.291 0.959* 1.000 Z8 0.636* 0.191 -0.548* -0.540* -0.116 -0.035 -0.136 1.000 Z9 -0.136 -0.197 -0.084 -0.090 0.144 0.003 0.009 -0.118 1.000 Z10 -0.160 0.498* -0.408 -0.300 0.292 -0.244 -0.228 0.187 0.276 1.000 Z11 -0.345 0.259 -0.249 -0.216 0.758* -0.217 -0.282 -0.076 -0.169 0.166 1.000 Z12 0.337 -0.311 -0.089 -0.195 -0.247 0.445 0.448 0.355 -0.170 -0.294 -0.298 1.000 Z13 0.143 0.035 0.105 0.152 -0.013 -0.312 -0.308 -0.090 -0.264 -0.226 0.178 -0.467* 1.000 Z14 -0.321 0.381 -0.218 0.111 0.009 -0.020 0.062 -0.18 0.365 0.431 -0.113 -0.406 -0.020 1.000 Z15 -0.144 -0.161 0.035 0.091 -0.168 0.174 0.223 -0.203 0.361 -0.209 -0.271 -0.021 -0.416 0.192 1.000

*Berkorelasi nyata pada taraf 0.05

(24)

Lampiran 4 Ukuran kemiripan solusi metode hierarki untuk tiap solusi gerombol Metode Jumlah cluster Ukuran kemiripan (%)

Pautan tunggal 2 43.4932 3 45.8211 4 46.6462 Pautan rataan 2 24.8128 3 28.5424 4 30.1816 Pautan centroid 2 53.3266 3 55.1856 4 55.8509 Pautan lengkap 2 8.4724 3 15.8614 4 18.1320 Pautan median 2 44.8954 3 47.4795 4 56.8901

(25)

Lampiran 5 Anggota ensemble

Varietas PautanTunggal Pautan Lengkap Pautan Rataan Pautan Centroid Pautan Median 2 3** 4 2’ 3 4 2* 3** 4*** 2* 3** 4 2* 3** 4*** Mahakam 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Danau tempe 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 Jatiluhur 2 3 3 1 1 1 1 3 3 1 3 3 1 3 3 Nona bokra 2 3 4 2 3 3 1 3 3 1 3 3 1 3 3 B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 2 3 3 2 3 4 1 3 4 1 3 3 1 3 4 B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 B11283-6C-PN-5-MR-34-1-1-3 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 B11742-RS-2-3-MR-34-1-1-3 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 B11742-RS-2-3-MR-34-1-1-4 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 B11742-RS-2-3-MR-34-1-1-5 2 3 3 2 3 3 1 3 3 1 3 4 1 3 3 B11742-RS-2-3-MR-34-1-2-1 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 B11742-RS-2-3-MR-34-1-2-3 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 B11742-RS-2-3-MR-34-1-4-1 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 B11742-RS-2-3-MR-34-1-4-3 2 3 3 1 1 1 1 3 3 1 3 3 1 3 3 Dodokan 2 3 3 1 1 1 1 3 3 1 3 3 1 3 3 Silugonggo 2 3 3 1 1 1 1 3 3 1 3 3 1 3 3 Sentani 2 3 3 1 1 1 1 3 3 1 3 3 1 3 3 Tondano 2 3 3 2 3 4 1 3 3 1 3 3 1 3 3 Singkarak 2 3 3 1 1 1 1 3 3 1 3 3 1 3 3 16

(26)

Lampiran 5 (lanjutan)

Varietas K-rataan 1 K-rataan 2 K-rataan 3 K-rataan 4

2 3 4 2 3 4 2 3 4 2’ 3 4 Mahakam 1 1 1 1 2 3 2 2 4 1 2 4 Danau tempe 2 2 2 1 3 1 2 2 2 1 3 3 Jatiluhur 1 3 3 1 1 4 1 1 1 1 2 4 Nona bokra 1 3 4 2 1 2 1 3 4 2 1 1 B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 1 1 4 2 1 3 2 2 4 2 1 2 B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1 1 3 4 2 1 3 1 2 4 2 1 2 B11283-6C-PN-5-MR-34-1-1-3 1 1 1 2 2 3 2 2 4 2 1 2 B11742-RS-2-3-MR-34-1-1-3 1 3 3 2 1 4 1 1 1 2 1 2 B11742-RS-2-3-MR-34-1-1-4 1 3 3 2 1 4 1 3 3 2 1 2 B11742-RS-2-3-MR-34-1-1-5 1 3 4 1 1 2 2 2 2 2 1 1 B11742-RS-2-3-MR-34-1-2-1 1 3 4 2 1 4 1 1 1 2 1 2 B11742-RS-2-3-MR-34-1-2-3 2 3 4 2 1 2 1 3 3 2 1 2 B11742-RS-2-3-MR-34-1-4-1 2 3 3 2 1 4 1 1 1 2 1 2 B11742-RS-2-3-MR-34-1-4-3 1 3 3 2 1 4 1 1 1 1 2 4 Dodokan 1 3 3 2 2 4 1 1 1 1 2 4 Silugonggo 1 3 3 2 2 4 1 1 1 1 2 4 Sentani 1 3 3 1 1 4 1 1 1 1 2 4 Tondano 1 3 1 2 2 3 2 2 4 2 1 2 Singkarak 2 3 1 1 3 1 2 2 2 1 2 4 Keterangan:

* dan ‘ Metode yang mempunyai solusi dua gerombol sama. ** Metode yang mempunyai solusi tiga gerombol sama. *** Metode yang mempunyai solusi empat gerombol sama.

(27)

Lampiran 6 Solusi gerombol akhir

Solusi 2 Gerombol Solusi 3 Gerombol

Gerombol 1 Gerombol 2 Gerombol 1 Gerombol 2 Gerombol 3

Mahakam Nona bokra Nona bokra Mahakam Danau tempe

Danau tempe B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 Jatiluhur

Jatiluhur B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1 B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1 B11742-RS-2-3-MR-34-1-4-3

B11742-RS-2-3-MR-34-1-4-3 B11283-6C-PN-5-MR-34-1-1-3 B11283-6C-PN-5-MR-34-1-1-3 Dodokan Dodokan B11742-RS-2-3-MR-34-1-1-3 B11742-RS-2-3-MR-34-1-1-3 Silugonggo Silugonggo B11742-RS-2-3-MR-34-1-1-4 B11742-RS-2-3-MR-34-1-1-4 Sentani Sentani B11742-RS-2-3-MR-34-1-1-5 B11742-RS-2-3-MR-34-1-1-5 Singkarak Singkarak B11742-RS-2-3-MR-34-1-2-1 B11742-RS-2-3-MR-34-1-2-1 B11742-RS-2-3-MR-34-1-2-3 B11742-RS-2-3-MR-34-1-2-3 B11742-RS-2-3-MR-34-1-4-1 B11742-RS-2-3-MR-34-1-4-1 Tondano Tondano

Sebelum aturan penamaan gerombol

Reproducibility = 0.8167 Reproducibility = 0.8275

Reproducibility Adjusted = 0.6333 Reproducibility Adjusted = 0.7413

Setelah aturan penamaan gerombol Setelah aturan penamaan gerombol

Reproducibility = 0.9165 Reproducibility = 0.9111

Reproducibility Adjusted = 0.8330 Reproducibility Adjusted = 0.8666

(28)

Lampiran 6 (lanjutan)

Solusi 4 Gerombol

Gerombol 1 Gerombol 2 Gerombol 3 Gerombol 4

Nona bokra Jatiluhur Mahakam Danau tempe

B.10970C-MR-4-2-1-1-1-SI-3-2-4-1 B11742-RS-2-3-MR-34-1-4-3 B.11283-6C-PN-5-MR-2-3-SI-1-2-1-1 Dodokan B11283-6C-PN-5-MR-34-1-1-3 Silugonggo B11742-RS-2-3-MR-34-1-1-3 Sentani B11742-RS-2-3-MR-34-1-1-4 Singkarak B11742-RS-2-3-MR-34-1-1-5 B11742-RS-2-3-MR-34-1-2-1 B11742-RS-2-3-MR-34-1-2-3 B11742-RS-2-3-MR-34-1-4-1 Tondano Reproducibility = 0.8705 Reproducibility Adjusted = 0.8273

Setelah aturan penamaan gerombol

Reproducibility = 0.9056

Reproducibility Adjusted = 0.8742

(29)

Gambar

Gambar 1 Kerangka Cluster Ensemble. X  (pengamatan), Ф (i)  = metode penggerombolan  ke-i, λ (i)  = solusi gerombol metode ke-i, Γ =  fungsi Consensus, dan λ =solusi akhir
Tabel 3 Tabulasi silang solusi gerombol sebelum  aturan pelabelan
Gambar 2 Hasil eksplorasi peubah dengan diagram kotak garis  Sentani  pun  menjadi  pencilan  pada  peubah  laju

Referensi

Dokumen terkait

Dari Gambar 5 menunjukkan bahwa semakin tebal lapisan material aktif maka densitas energi dan densitas power semakin kecil, karena kapasitas spesifik menurun dan konduktivitasnya

Pasal 1 Ayat 20 KUHAP menjelaskan bahwa “ Penangkapan adalah suatu tindakan penyidik berupa pengekangan sementara waktu kebebasan tersangka atau terdakwa apabila terdapat cukup

Proses review yang dilakukan untuk pemenuhan standar akreditasi JCI telah dibakukan dalam bentuk Kebijakan JCI, namun proses review terhadap seluruh proyek perubahan,

LDR, FBIR, dan ROA secara parsial mempunyai pengaruh negatif yang tidak signifikan terhadap CAR, sedangkan PDN dan BOPO secara parsial mempunyai pengaruh positif yang tidak

Kesalahan timbul dalam bentuk burst yaitu lebih dari satu bit terganggu dalam satu satuan waktu.Deteksi error dengan Redundansi, yaitu data tambahan yang tidak ada

Tujuan dari penelitian ini adalah untuk mengetahui pengaruh secara simultan dan secara parsial antara kualitas layanan dan harga terhadap kepuasan konsumen pada Coffee

Memberikan pemahaman tentang bagaimana film mengkonstruksikan perempuan Papua berkaitan dengan mitos suku perempuan yang dimunculkan dalam film Lost in Papua dan

Model yang digunakan dalam penelitian ini adalah A-B-A desgn , desain yang menggunakan dua kondisi control (baseline) sebelum dan sesudah intervensia. Dengan