• Tidak ada hasil yang ditemukan

METODE PENELITIAN Penelitian ini dilakukan melalui tiga tahap

utama seperti yang diilustrasikan pada Gambar 4, yaitu:

1 Praproses.

2 Pembentukan model taksonometri. 3 Analisis taksonometri.

Gambar 4 Diagram alir metode penelitian. Praproses

Diagram alir langkah praproses yang dilakukan dalam penelitian ini dapat diamati pada Gambar 5. Kegiatan yang dilakukan dalam praproses data adalah kodefikasi, seleksi karakter, dan analisis korelasi.

Data yang digunakan pada penelitian ini diperoleh dari basis data Divora yang dikelola oleh World Agroforestry Centre (ICRAF) yang berlokasi di Bogor. Di dalam basis data ini terdapat informasi spesimen daun dari hutan karet yang terletak di wilayah Jambi dan Lampung. Sebanyak 126 spesimen daun akan digunakan dalam penelitian ini. Lampiran 1 memuat contoh data spesimen daun yang didapatkan dari basis data Divora.

Gambar 5 Diagram alir praproses. , || || ) ( k k i i k c N C X Q s ∑ − = , ) , ( ) ( ) ( max 1 ) ( 1

=     + = nc k kl k l l c k c Q Q d Q s Q s n nc DB , ) , ( i ij n n j i CR = (, ) . j ij n n j i CP =

akan diambil satu subset untuk data pengujian dan sisanya untuk data pelatihan (Fu 1994). Indeks Davies-Bouldin

Indeks Davies-Bouldin (IDB) merupakan salah satu metode validasi cluster untuk evaluasi kuantitatif dari hasil clustering. Pengukuran ini bertujuan memaksimalkan jarak inter-cluster antara satu cluster dengan cluster yang lain (separation value) sekaligus meminimalkan jarak intra-cluster antara titik dalam sebuah cluster (compactness value) (Bolshakova & Azuaje 2002; Gunter & Bunke 2002).

Jarak inter-cluster dkl didefinisikan sebagai berikut:

dkl = ||Ck – Cl|| ,

dengan Ck dan Cl adalah centroid cluster k dan cluster l.

Jarak intra-cluster sc(Qk) dalam cluster Qk dihitung dengan rumus:

dengan Nk adalah banyak titik yang termasuk dalam cluster Qk, dan Ck adalah centroid dari cluster Qk.

Dengan demikian, Indeks Davies-Bouldin didefinisikan sebagai berikut:

dengan nc adalah banyaknya cluster. Dari beberapa percobaan, akan dicari skema cluster yang optimal, yaitu skema yang memiliki nilai IDB paling rendah (Salazar et al. 2002). Cluster Recall dan Precision

Evaluasi kualitatif terhadap hasil clustering dapat diperoleh dari nilai cluster recall (CR) dan cluster precision (CP). Cluster recall menunjukkan besarnya proporsi jumlah data yang tercluster dengan benar dibandingkan dengan jumlah data dalam kelas yang sebenarnya. Adapun cluster precision menunjukkan proporsi jumlah data yang tercluster dengan benar dibandingkan dengan jumlah data dalam kelas hasil clustering. Nilai dari CR dan CP akan semakin baik jika mendekati satu.

Pencarian CR dan CP dilakukan dengan rumus berikut, dengan nij adalah jumlah anggota kelas i dalam cluster j, ni adalah jumlah anggota kelas i, dan nj adalah jumlah anggota cluster j (Madarum 2006):

METODE PENELITIAN

Penelitian ini dilakukan melalui tiga tahap utama seperti yang diilustrasikan pada Gambar 4, yaitu:

1 Praproses.

2 Pembentukan model taksonometri. 3 Analisis taksonometri.

Gambar 4 Diagram alir metode penelitian. Praproses

Diagram alir langkah praproses yang dilakukan dalam penelitian ini dapat diamati pada Gambar 5. Kegiatan yang dilakukan dalam praproses data adalah kodefikasi, seleksi karakter, dan analisis korelasi.

Data yang digunakan pada penelitian ini diperoleh dari basis data Divora yang dikelola oleh World Agroforestry Centre (ICRAF) yang berlokasi di Bogor. Di dalam basis data ini terdapat informasi spesimen daun dari hutan karet yang terletak di wilayah Jambi dan Lampung. Sebanyak 126 spesimen daun akan digunakan dalam penelitian ini. Lampiran 1 memuat contoh data spesimen daun yang didapatkan dari basis data Divora.

Gambar 5 Diagram alir praproses. , || || ) ( k k i i k c N C X Q s ∑ − = , ) , ( ) ( ) ( max 1 ) ( 1

=     + = nc k kl k l l c k c Q Q d Q s Q s n nc DB , ) , ( i ij n n j i CR = (, ) . j ij n n j i CP =

Setiap spesimen daun dikotiledon pada basis data tersebut memiliki karakter-karakter tertentu yang melambangkan morfologinya. Secara keseluruhan terdapat 282 state yang terbagi ke dalam 10 level karakter. Pada level pertama, yaitu level primer, terdapat 21 karakter yang setiap karakternya memiliki state atau subkarakter pada level berikutnya. Level kedua memiliki 60 state dan satu state N.A. (Not Applicable). Level berikutnya memiliki lebih banyak jumlah state, demikian seterusnya hingga level terakhir. Contoh daftar karakter morfologi daun yang didapatkan dari basis data dapat diamati pada Lampiran 2.

Dalam penelitian ini hanya digunakan karakter-karakter daun yang terletak pada level pertama dan kedua, karena telah dapat mewakili karakter umum yang dimiliki oleh spesimen daun. Selain itu, tidak semua spesimen daun memiliki karakter-karakter pada level yang lebih dalam.

Untuk memudahkan pemrosesan data, perlu dilakukan pengubahan kode (kodefikasi) karakter yang terdapat pada basis data menjadi nilai yang dapat dikenali dan diproses oleh SOM Kohonen. Oleh karena itu, dibangun sistem kodefikasi yang khusus digunakan dalam penelitian ini.

Langkah selanjutnya adalah melakukan seleksi terhadap 21 karakter primer yang akan digunakan dalam proses clustering. Seleksi penting untuk dilakukan, karena ada kemungkinan tidak semua karakter dapat mewakili keunikan ciri dari masing-masing spesimen daun.

Hasil dari kodefikasi dan seleksi karakter adalah data spesimen daun yang siap digunakan untuk proses selanjutnya. Langkah berikutnya adalah melakukan analisis korelasi dari perhitungan terhadap koefisien korelasi Spearman, untuk mengetahui ada atau tidaknya korelasi antar karakter. Hasil dari analisis korelasi berguna untuk menentukan fungsi jarak yang akan digunakan pada jaringan SOM Kohonen.

Pembentukan Model Taksonometri

Proses pembentukan model taksonometri dapat diamati pada Gambar 6, meliputi: 1 Pembentukan data latih dan data uji. 2 Pelatihan dan pengujian.

3 Evaluasi IDB (Indeks Davies-Bouldin). 4 Penetapan model taksonometri.

Gambar 6 Diagram alir pembentukan model taksonometri.

Pembentukan data latih dan data uji didasarkan kepada metode k-fold cross validation. Dalam penelitian ini digunakan 3-fold cross validation, sehingga data spesimen daun akan dibagi ke dalam tiga subset dengan proporsi data setiap subset yang diusahakan mendekati proporsi data secara keseluruhan.

Proses pelatihan dan pengujian, evaluasi IDB, dan penetapan model taksonometri akan dilakukan sebanyak tiga kali, sesuai dengan jumlah model taksonometri yang ingin dibentuk. Model taksonometri yang pertama

akan melambangkan clustering untuk

tingkatan taksa family, sedangkan model taksonometri kedua dan ketiga masing-masing akan menggambarkan clustering untuk tingkat ordo dan subclass.

Topologi jaringan SOM Kohonen yang digunakan dalam pembentukan model taksonometri, yaitu SOM Kohonen satu dimensi, memiliki keunggulan berupa konvergensi terhadap data yang tinggi dan mudah beradaptasi, namun pada umumnya terdapat kesulitan dalam menentukan jumlah neuron output (Tirozzi et al. 2007). Oleh karena itu, jumlah neuron output dalam penelitian ini akan disesuaikan dengan jumlah taksa pada tingkatan tersebut. Sebagai contoh, untuk taksonometri family, jumlah neuron output yang digunakan adalah 21, sesuai dengan banyaknya family pada data spesimen daun. Taksonometri ordo memiliki neuron output sejumlah 17, dan taksonometri subclass sejumlah 4.

Pelatihan dan pengujian pada setiap model taksonometri menggunakan parameter yang tercantum pada Tabel 1, dengan n adalah jumlah neuron output, αi adalah laju pembelajaran awal, δi adalah lebar tetangga awal, dan tmax adalah iterasi maksimum. Tabel 1 Parameter pelatihan dan pengujian

model taksonometri.

Para-meter

Model Taksonometri

Family Ordo Subclass

n 21 17 4

αi 0.9, 0.5, 0.1 0.9, 0.5, 0.1 0.9, 0.5, 0.1

δi 20, 15, 10, 5 15, 10, 5 3, 2, 1

tmax 50 50 50

Metode inisialisasi nilai vektor bobot menggunakan nilai acak, dengan nilai maksimum setiap bobot diperoleh dari nilai maksimum karakter yang bersesuaian. Fungsi jarak yang digunakan adalah jarak Mahalanobis, karena adanya indikasi korelasi antar karakter. Kombinasi berbagai parameter tersebut akan diterapkan pada jaringan SOM Kohonen. Penetapan model taksonometri untuk setiap kategori didasarkan kepada jaringan dengan kinerja terbaik, yaitu jaringan yang menghasilkan nilai IDB minimum. Analisis Taksonometri

Model taksonometri yang telah

ditetapkan, bersama dengan data spesimen daun secara keseluruhan, selanjutnya akan diproses sebagai bahan untuk analisis taksonometri. Langkah-langkah dalam analisis ini dapat diamati pada Gambar 7.

Gambar 7 Diagram alir analisis taksono-metri.

Data spesimen daun yang telah diclusterkan menggunakan model taksono-metri family, ordo, dan subclass akan dievaluasi untuk mendapatkan nilai cluster precision (CP) dan cluster recall (CR). Selanjutnya, hasil taksonometri untuk setiap

tingkatan taksa akan diamati dan

dibandingkan dengan sistem taksonomi umum untuk mendapatkan representasi pengetahuan.

Spesifikasi Pengembangan

Dalam penelitian ini digunakan perangkat keras berupa laptop dengan prosesor Intel Centrino Duo 1.7 GHz dan memori 1 GB.

Model taksonometri dibangun pada

lingkungan pemrograman Java dengan Netbeans 6.0.1 sebagai IDE. SPSS 13.0 digunakan untuk analisis korelasi. Seluruh perangkat lunak berjalan pada sistem operasi Ubuntu ME 8.04.

HASIL DAN PEMBAHASAN

Dokumen terkait