• Tidak ada hasil yang ditemukan

Klasifikasi Dokumen Tumbuhan Obat Berbasis Famili Menggunakan Probalistic Neural Network

N/A
N/A
Protected

Academic year: 2017

Membagikan "Klasifikasi Dokumen Tumbuhan Obat Berbasis Famili Menggunakan Probalistic Neural Network"

Copied!
42
0
0

Teks penuh

(1)

KLASIFIKASI DOKUMEN TUMBUHAN OBAT BERBASIS FAMILI

MENGGUNAKAN

PROBALISTIC NEURAL NETWORK

ACHMAD MUCHLIS

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(2)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Dokumen Tumbuhan Obat Berbasis Dokumen menggunakan Probalistic Neural Network adalah benar karya saya dengan arahan dari pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

(3)

ABSTRAK

ACHMAD MUCHLIS. Klasifikasi Dokumen Tumbuhan Obat Berbasis Famili Menggunakan Probalistic Neural Network. Dibimbing oleh YENI HERDIYENI dan ERVIZAL AM ZUHUD.

Penelitian ini menyajikan sebuah sistem untuk ektraksi ciri dan klasifikasi dokumen tumbuhan obat menggunakan metode chi-square dan klasifikasi probalistic neural network (PNN). Otomasi identifikasi famili dilakukan berdasarkan pengelompokan karakteristik tanaman obat yang terkandung dalam dokumen. Tahapan terdiri dari pengumpulan dokumen tumbuhan, konversi dari dokumen hardcopy menjadi menjadi bentuk softcopy dengan format XML, pra proses dokumen, pemilihan fitur menggunakan chi-square, klasifikasi dokumen menggunakan PNN dan evaluasi sistem menggunakan confusion matrix.

Hasil klasifikasi dipengaruhi oleh jumlah kata penciri suatu famili. Jumlah kata penciri dari suatu famili dipengaruhi oleh jumlah kata yang sama pada tiap dokumen latih. Semakin banyak kata yang sama pada tiap dokumen latih semakin besar probabilitas kata tersebut menjadi kata penciri. Pada penelitian ini penciri dari suatu famili belum menggambarkan ciri-ciri taksonomi tumbuhan. Hal ini disebabkan oleh banyaknya kata yang sama pada tiap dokumen latih belum menggambarkan ciri-ciri taksonomi tumbuhan. Hasil evaluasi klasifikasi menggunakan algoritme probalistic neural network dengan bobot nilai 1 dan lapisan pola menggunakan ekstraksi ciri chi-square menggunakan nilai nilai alpha (α) 0.1 secara keseluruhan menghasilkan nilai 82.14 %. Hal tersebut dikarenakan dokumen latih terdapat banyak kata yang sama pada tiap dokumen yang bukan ciri-ciri taksonomi tumbuhan.

Penelitian ini merupakan sistem klasifikasi dokumen tumbuhan obat yang dapat digunakan untuk identifikasi famili tumbuhan. Sistem ini berguna dalam identifikasi famili secara otomatis dan klasifikasi dokumen tumbuhan obat. Sistem ini juga dapat meningkatkan pengetahuan masyarakat terhadap keragaman dan penggunaan tanaman obat.

(4)

ABSTRACT

ACHMAD MUCHLIS. Clasification of Medical Plant Document Based on Family by Feature Selection Clasification using Probalistic Neural Netwok. Supervised YENI HERDIYENI and ERVIZAL AM ZUHUD.

This research presents a system for the extraction of features and classification of the document medicinal plants using the chi-square method and neural network classification probalistic. Automation family identification by grouping characteristics medicinal plants contained in the document. In this research, the phase consists of collecting documents, doing conversion from hardcopy documents to softcopy into XML format, pre-process the document, featuring selection using the chi-square, document classification using PNN and evaluation using Confusion Matrix.

Classification results are influenced by the number of family identifier words. Number of words identifier of a family affected by the same number of words in each document training. The more same words in each document training, the greater probability of the word being said identifier. In this research, identifier of a family does not describe the characteristics of plant taxonomy. This is due to the same number of words in each document has not practically described the characteristics of plant taxonomy. The evaluation research of classification algorithm Probalistic Neural Network (PNN) with weight value 1 and layer patterns using feature extraction using the chi-square values of alpha (α) value of 0.1 overall result of classification is 82.14%.

This research represents a medical plant document system that can be used for automatic identification of families according to the taxonomy of plants.This system is useful to help users especially researchers and taxonomists in the identification document through labeling family automatically on each document, with the existing system, therefoe the users dont need to bring a book or a guide book to identify the field. Furthermore, it can overcome the limitations of people's knowledge of the diversity and the use of medicinal plants. That is because there are a lot of documents to train the same word in each document which is not characteristic of plant taxonomy.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer

pada

Departemen Ilmu Komputer

KLASIFIKASI DOKUMEN TUMBUHAN OBAT BERBASIS FAMILI

MENGGUNAKAN

PROBALISTIC NEURAL NETWORK

ACHMAD MUCHLIS

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(6)

Judul Skripsi : Klasifikasi Dokumen Tumbuhan Obat Berbasis Famili Menggunakan Probalistic Neural Network

Nama : Achmad Muchlis

NIM : G64104049

Disetujui oleh

Diketahui oleh

Dr. Ir. Agus Buono, M.Si, M.Kom Ketua Departemen

Tanggal Lulus:

Dr. Yeni Herdiyeni, S.Si, M.Kom Pembimbing I

(7)
(8)

PRAKATA

Segala puji bagi Allah subhanahu wata’ala atas segala limpahan rahmat dan karunia-Nya sehingga penulis mampu menyelesaikan skripsi yang berjudul

“Klasifikasi Dokumen Tumbuhan Obat Berbasis Famili Menggunakan Probalistic Neural Network” ini. Selawat dan salam senantiasa tercurah limpah kepada Rasulullah, Nabi Muhammad shalallahu ‘alaihi wasallam, serta keluarganya, sahabatnya, dan para pengikutnya yang tetap istiqomah hingga akhir zaman. Penulis juga menyampaikan terima kasih kepada seluruh pihak yang telah membantu dalam penelitian ini, yaitu:

1 Kedua orang tua penulis, Alm.H.Syatiri Achmad dan Alma.Hj.Munawaroh serta saudara-saudara penulis, atas doa, kasih sayang, dan dukungan yang luar biasa.

2 Ibu Dr. Yeni Herdiyeni, S.Si, M.Kom dan Bapak Prof. Dr. Ir. Ervizal A.M. Zuhud, M.S selaku dosen pembimbing yang telah banyak memberikan ide, saran, nasihat, dan dukungan.

3 Rekan-rekan satu bimbingan, Rahmat, Alrasyid, Hanung, Dedi, Yusrizal, Desta, pak Indra, mas Rizky dan Ngakan atas diskusi-diskusi dan suka-duka selama pembimbingan.

4 Rekan-rekan di AMN Indonesia.

5 Sahabat Ilkomerz angkatan 5 khususnya Wahyu Dyas.

Penulis menyadari penelitian ini masih banyak kekurangan. Harapannya, semoga hasil penelitian ini dapat bermanfaat.

(9)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 1

Manfaat Penelitian 2

Ruang Lingkup Penelitian 2

TINJAUAN PUSTAKA 2

Taksonomi 2

Chi-Square (χ2) 5

Probabilistic Neural Network 7

Confusion Matrix 8

METODE 9

Dokumen Tumbuhan Obat 9

Praproses 11

Ekstraksi Fitur Dokumen Menggunakan Chi-Square 12

Klasifikasi Probalistic Neural Network 12

Perhitungan Akurasi 13

Lingkungan Pengembangan 13

HASIL DAN PEMBAHASAN 13

Praproses 13

Ekstraksi Fitur Chi-Square 14

Klasifikasi Probalistic Neural Network 18

SIMPULAN DAN SARAN 25

Simpulan 25

Saran 25

DAFTAR PUSTAKA 25

(10)

DAFTAR TABEL

1 Tabel kontingensi 6

2 Nilai kritis derajat bebas satu dan taraf nyata α Manning et al

(2008). 6

3 Confusion Matrix 8

4 Jumlah dokumen tumbuhan 10

5 Kombinasi data dokumen per famili 10

6 Komposisi jumlah dokumen tumbuhan 14

7 Daftar jumlah kata per famili 14

8 Perbandingan kelas Apiaceae dengan kelas Euphorbiaceae 15 9 Kombinasi dokumen latih kelas Apiaceae dengan Euphorbiaceae 15

10 Hasil evalusi tiap famili 18

11 Confusion Matrix pada klasifikasi 19 12 Taksonomi famili Apiaceae dan Crassulaceae 19 13 Perbandingan term penciri famili Apiaceae dan Crassulaceae 19

14 Taksonomi Euphorbiaceae dan Crassulaceae 20

15 Perbandingan term dokumen, famili Euphorbiaceae dan

Crassulaceae 21

16 Taksonomi Lamiaceae dan Apiaceae 21

17 Perbandingan term dengan famili Apiaceae dan Lamiaceae 22

18 Taksonomi Myrtaceae dan Rutaceae 22

19 Perbandingan term dokumen dengan famili Myrtaceae dan

Rutaceae 23

20 Taksonomi Rutaceae dan Crassulaceae 24

21 Perbandingan term dokumen dengan famili Rutaceae dan

Crassulaceae 24

DAFTAR GAMBAR

1 Contoh spesies famili Apiaceae 2

2 Contoh spesies berfamili Crassulaceae 3

3 Contoh spesies berfamili Euphorbiaceae 3

4 Contoh spesies berfamili Lamiaceae 4

5 Contoh spesies berfamili Myrtaceae 4

6 Contoh spesies berfamili Rutaceae 5

7 Bagan algoritme Probalistic Neural Network Han dan Kamber

(2001) 7

8 Diagram alur penelitian 9

9 Akurasi pengujian 18

(11)

DAFTAR LAMPIRAN

1 Daftar term kelas Apiaceae 26

2 Daftar term kelas Crassulaceae 27

3 Daftar term kelas Lamiaceae 28

4 Daftar term kelas Euphorbiaceae 28

5 Daftar term kelas Myrtaceae 29

6 Daftar term kelas Rutaceae 30

(12)

PENDAHULUAN

Latar Belakang

Indonesia sebagai salah satu negara megabiodiversity memiliki banyak kekayaan alam. Menurut Groombridge dan Jenkins (2002), jumlah tumbuhan di Indonesia pada saat ini mencapai 22500 spesies. Sebanyak 4.4% dari keseluruhan spesies tumbuhan obat yang ada di Indonesia sudah diketahui manfaatnya. Salah satu cara meningkatkan pengetahuan tentang tumbuhan obat adalah dengan cara mengidentifikasikan tumbuhan tersebut. Penelitian tentang tumbuhan telah banyak dilakukan. Peneliti melakukan pengamatan secara langsung terhadap tumbuhan sehingga menghasilkan informasi dari tumbuhan seperti ciri-ciri morfologi, kandungan kimia, budidaya, manfaat dan informasi lainnya yang menggambarkan karakteristik tumbuhan tersebut. Identifikasi tumbuhan secara manual tidak efisien karena setiap kali melakukan proses identifikasi, peneliti menganalisis karakteristik secara langsung atau dengan mencocokan pada tiap dokumen tumbuhan yang sedang di identifikasi. Oleh karena itu, diperlukan adanya sistem informasi untuk mempermudah dan mempercepat proses identifikasi famili tumbuhan obat menggunakan informasi dokumen tumbuhan obat.

Pada penelitian sebelumnya telah dilakukan mengenai identifikasi famili menggunakan dokumen etnofitomedika dengan metode klasifikasi naïve bayes Suganda (2013). Saudari Suganda menggunakan sepuluh famili tumbuhan dalam hal pengklasifikasiannya. Metode yang digunakan yang oleh saudari Suganda adalah mengekstraksi kata-kata penting dari dokumen etnofitomedika menggunakan chi-square dan metode naive bayes sebagai metode pengklasikasiannya. Penelitian lain tentang klasifikasi tumbuhan obat juga dilakukan oleh Herawan (2011) yang menggunakan metode chi-square dan metode naive bayes. Penelitian tentang pengelompokan data juga dilakukan oleh Barnaghi (2012) dengan membandingkan beberapa metode klasifikasi meggunakan data darah. Pada penelitan Barnaghi (2012) rata-rata akurasi metode neural network lebih baik jika dibandingan dengan metode naive bayes.

Penelitian ini akan mengembangkan sistem klasifikasi dokumen tumbuhan obat berbasis famili menggunakan metode Probalistic Neural Network (PNN). Famili yang digunakan pada penelitian ini berjumlah enam famili yaitu Apiaceae, Crassulaceae, Euphorbiaceae, Lamiaceae, Myrtaceae dan Rutaceae. Pemilihan famili Apiaceae, Crassulaceae, Euphorbiaceae, Lamiaceae, Myrtaceae dan Rutaceae dikarenakan secara taksonomi famili tersebut terdapat dalam 1 kingdom yang sama yaitu Plantae.

Tujuan Penelitian

(13)

2

Manfaat Penelitian

Manfaat dari penelitian yaitu untuk mempermudah pencarian informasi tumbuhan berdasarkan ciri-ciri morfologi dari famili tumbuhan tersebut.

Ruang Lingkup Penelitian

Pada penelitian ini dilakukan pembatasan masalah pada:

1 Data tumbuhan obat terdiri atas enam famili yaitu Apiaceae, Crassulaceae, Euphorbiaceae, Lamiaceae, Myrtaceae dan Rutaceae.

2 Data tumbuhan obat dalam bentuk teks dengan ektensi XML dan berbahasa Indonesia.

TINJAUAN PUSTAKA

Taksonomi

Taksonomi tumbuhan merupakan ilmu yang mempelajari tentang berbagai penelusuran jenis tumbuhan, penyimpanan herbarium tumbuhan, pengenalan atau identifikasi tumbuhan, pengelompokan atau klasifikasi tumbuhan, dan pemberian nama tumbuhan Tjitrosoepomo (1994). Klasifikasi tumbuhan adalah penyusunan tumbuhan secara teratur ke dalam suatu sistem hierarki. Sistem penyusunan ini berasal dari kumpulan informasi tumbuhan secara individual salah satunya informasi ciri-ciri taksonomi yang dimiliki tumbuhan tersebut, dengan hasil akhir yang menggambarkan hubungan kekerabatan antar individual. Klasifikasi yang bertujuan untuk menyederhanakan objek studi pada hakekatnya adalah mencari keseragaman dalam keanekaragaman pada setiap individual. Berikut ciri-ciri famili yang digunakan pada penelitian ini :

a Famili Apiaceae

(Astrantia maxima) (Daucus carota) Gambar 1 Contoh spesies famili Apiaceae

(14)

3

pipih. Bunga majemuk berupa bunga payung. Bunga kecil, kebanyakan banci, aktinomorf atau sedikit zigomorf, berbilangan 5. Kelopak seringkali amat kecil, daun mahkota 5 dengan ujungnya yang melengkung ke dalam berwarna kuning atau keputih-putihan, jarang merah jambu atau lembayung. Benang sari 5, berseling dengan daun mahkota. Bakal buah tenggelam, tertutup oleh bantal tangkai putik yang berbagi 2 , beruang 2 dalam tiap ruang dengan 1 bakal biji yang bergantungan. Buahnya buah berbelah 2, tiap bagian buah berlekatan pada suatu karpofor. Dalam kulit buah terdapat saluran-saluran minyak atsiri. Biji dengan endosperm yang menyerupai tanduk Tjitrosoepomo (1994). Gambar 1 merupakan contoh spesies famili Apiaceae.

b Famili Crassulaceae

(Kalanchoe pinnata) (Kalanchoe pinnata) Gambar 22Contoh spesies berfamili Crassulaceae

Terna berbatang basah, daun tebal pinggir beringgit, banyak mengandung air, bentuk daunnya lonjong atau bundar panjang, panjang 5 - 20 cm, lebar 2.5-15 cm, ujung daun tumpul, pangkal membundar, permukaan daun gundul, warna hijau sampai hijau keabu-abuan. Posisi daun jarang yang berhadapan. Memiliki penumpu tangkai daun yang melebar. Bunga terdapat pada akhir batang bagian atas dan menghadap ke bawah Goldberg (2003). Gambar 2 merupakan contoh spesies famili Crassulaceae.

c Famili Euphorbiaceae

(15)

4

Pohon, perdu atau terna, kadang-kadang berupa sukulenta, kebanyakan menghasilkan getah yang berwarna putih seperti susu. Daun tersebar, kadang-kadang berhadapan, tunggal atau majemuk menjari, biasanya mempunyai penumpu. Ujung tangkai daun atau pangkal helaian daun seringkali mempunyai kelenjar. Bunga berkelamin tunggal, berumah satu atau dua, jantan dan betina besar perbedaannya. Bakal buah menumpang, biasanya beruang 3 masing-masing 1-2 bakal biji. Tangkai putik berjumlah 3 atau berlekatan. Biji dengan endosperm yang besar dan di pusat Tjitrosoepomo (1994). Gambar 3 merupakan contoh spesies famili Euphorbiaceae.

d Famili Lamiaceae

(Perilla frutescens)

Gambar 44Contoh spesies berfamili Lamiaceae

Spesies dari lamiaceae terutama merupakan herba atau semak-semak dalam berbagai ukuran, jarang berupa pohon. Batang biasanya persegi, terutama ketika muda, tegak atau berbaring di tanah. Bunganya biseksual, jarang berkelamin tunggal jarang yang berbentuk sebagai bunga sempurna. Buah terdiri atas empat nutlets, meskipun beberapa nutlets tersebut tidak dewasa, masing-masing dengan biji tunggal. Daun berberntuk sederhana dan letaknya berhadapan dengan daun yang lainnya. Penumpu tangkai daun menyebar tidak mengerucut ke dalam batang Golderg (2003). Gambar 4 merupakan contoh spesies famili Lamiaceae. e Famili Myrtaceae

(16)

5

Semak-semak atau pohon-pohonan yang berbatang berkayu, jarang sekali berupa terna dengan daun tunggal tanpa daun penumpu yang duduknya tersebar atau berhadapan. Bunga kebanyakan aktinomorf, banci dengan 4-5 daun kelopak dan 4-5 daun mahkota pula. Daun-daun mahkota itu sebelah atasnya seringkali berlekatan. Bakal buah tenggelam dengan 1 tangkai putik, beruang 1 dengan 3-tembuni yang menonjol ke dalam, dapat pula beruang lebih dari 1 (2, 5 sampai tak hingga) dengan 8 bakal biji dalam tiap ruang Tjitrosoepomo (1994). Gambar 5 merupakan contoh spesies famili Myrtaceae.

f Famili Rutaceae

(Clausena excavate) (Citrus reticulate) Gambar 66Contoh spesies berfamili Rutaceae

Tumbuhan yang berkayu, jarang berupa terna. Daun tunggal atau majemuk (beranak daun 3) yang duduk tersebar atau berhadapan. Dalam gelam dan daun terdapat kelenjar-kelenjar minyak yang terjadi secara skizolisigen. Bunga banci, aktinomorf atau zigomorf, berbilang 5 atau 4, di dalam benang sari kebanyakan terdapat suatu cakram. Kelopak berdaun bebas atau berlekatan. Buah dan biji amat berbeda-beda, biji dengan lembaga yang besar Tjitrosoepomo (1994). Gambar 6 merupakan salah satu contoh spesies famili Rutaceae.

Chi-Square(χ2)

Pemilihan fitur dokumen merupakan suatu proses memilih kata terbaik pada tiap dokumen. Kata tersebut merupakan himpunan dari semua kata yang ada pada data latih. Pemilihan fitur dokumen memiliki dua tujuan utama, yaitu membuat data latih yang diterapkan oleh sistem klasifikasi menjadi lebih sederhana serta untuk meningkatkan akurasi sistem klasifikasi. Peningkatan akurasi sistem klasifikasi disebabkan oleh dihilangkannya kata-kata yang bukan merupakan penciri dokumen yang dilakukan pada proses penghilangan fitur Manning et al (2008). Dalam penelitian ini, data yang digunakan adalah dokumen tumbuhan obat yang berasal dari beberapa dokumen hasil riset dan buku tumbuhan obat. Dokumen yang digunakan dibuat dalam format XML. Data dari ekstrasi fitur tersebut akan digunakan sebagai penciri dokumen yang akan diklasifikasikan.

(17)

6

frekuensi harapan yang didasarkan atas hipotesis tertentu pada setiap kasus atau data (frekuensi harapan atau ekspektasi). Sampel berukuran N diambil dari suatu populasi normal berdeviasi standar σ. Untuk setiap sampel dihitung nilai sehingga diperoleh distribusi sampling untuk yang disebut distribusi chi-square Manning et al (2008).

Perhitungan nilai chi-square dapat dibantu dengan tabel kontingensi. Nilai pada tabel kontingensi merupakan nilai frekuensi observasi dari suatu kata terhadap kelas. Tabel kontingensi dapat dilihat pada Tabel 1.

Tabel 1 Tabel kontingensi

Perhitungan nilai chi-square berdasarkan tabel kontingensi disederhanakan sebagai berikut:

t c = -

(1)

Dari rumus di atas, t merupakan kata yang sedang diujikan terhadap suatu kelas c. Jumlah dokumen latih dilambangkan dengan N. Banyaknya dokumen pada kelas c yang memuat kata t dilambangkan dengan A, banyaknya dokumen yang tidak berada di kelas c, Namun memuat kata t dilambangkan dengan huruf B,banyaknya dokumen yang berada di kelas c namun tidak memiliki kata t dilambangkan dengan huruf C, dan banyaknya dokumen yang bukan merupakan dokumen kelas c dan tidak memuat kata t dilambangkan dengan huruf D.

Pengambilan keputusan berdasarkan nilai dari masing-masing kata. Kata yang memiliki nilai di atas nilai kritis pada tingkat signifikasi α adalah kata yang dipilih sebagai penciri dokumen sehingga kata yang dipilih sebagai penciri dokumen merupakan kata yang memiliki pengaruh terhadap kelas c. Nilai kritis dengan derajat bebas satu dan taraf nyata ditunjukkan oleh Tabel 2.

(18)

7

Probabilistic Neural Network

Klasifikasi adalah proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui Han dan Kamber (2001).

Pada klasifikasi data yang digunakan dibagi menjadi data latih dan data uji. Data latih digunakan untuk membangun model dengan ekstrasi fitur menggunakan algoritme chi-square, sementara data uji digunakan untuk memvalidasi model yang telah dibangun dengan menggunakan algoritme probalistic neural network. Akurasi model ditentukan oleh hasil pengujian terhadap data uji.

Gambar 77Bagan algoritme Probalistic Neural Network Han dan Kamber (2001) PNN terdiri atas empat lapisan, yaitu lapisan masukan, lapisan pola, lapisan penjumlahan, dan lapisan keluaran. Struktur PNN selengkapnya ditunjukkan pada Gambar 7. Lapisan-lapisan yang menyusun PNN adalah sebagai berikut:

1 Lapisan Input (Input Layer)

Lapisan masukan merupakan input x yang terdiri atas nilai yang akan diklasifikasikan pada salah satu kelas dari n kelas.

2 Lapisan Pola (Pattern Layer)

(19)

8

Dengan demikian, persamaan yang digunakan pada lapisan pola adalah sebagai berikut:

g x e p(-( x -x i ) ( x -x i )

2σ2 ) (2)

dengan xAi menyatakan vektor bobot atau vektor latih kelas ke-A urutan ke-i. 3 Lapisan Penjumlahan (Summation Layer)

Pada lapisan penjumlahan, setiap pola pada masing-masing kelas dijumlahkan sehingga menghasilkan population density function untuk setiap kelas. Persamaan yang digunakan pada lapisan ini adalah:

p p x| 4 Lapisan keluaran (output layer)

Pada lapisan keluaran, input x akan diklasifikasikan ke kelas A jika nilai paling besar dibandingkan kelas lainnya.

Confusion Matrix

Confusion Matrix merangkum jumlah data yang diprediksi benar atau salah oleh mode klasifikasi. Confusion Matrix lebih sering disebut dengan tabel kontingensi seperti yang ditunjukan pada Tabel 3. Tabel 3 adalah Confusion Matrix untuk masalah dua kelas, yang diberi label kelas positif (+) dan kelas negative (-). Oleh karena itu Confusion Matrix berukuran 2 x 2. Jumlah data yang diklasifikasikan dengan benar adalah jumlah diagonal dalam matriks, sedangkan yang lainnya adalah yang salah diklasifikasikan Srinivasulu et al. (2009).

Tabel 3 Confusion Matrix

Keterangan untuk Tabel 3 dinyatakan sebagai berikut :

(20)

9

2 False negative (FN): jumlah data positif yang salah diprediksi sebagai negatif oleh model klasifikasi.

3 False positive (FP): jumlah data negatif yang salah diprediksi sebagai positif oleh model klasifikasi.

4 True negative (TN): jumlah data negatif yang dengan benar diprediksi oleh model klasifikasi

Akurasi adalah rasio antara jumlah data yang dapat diklasifikasikan dengan benar dan total jumlah data. Secara teknis dapat didefinisikan seperti pada Persamaan 6 Kumar dan Rathee (2011).

Perhitungan akurasi dinyatakan dalam Persamaan 4. Akurasi =

(4)

METODE

Ilustrasi tahapan proses penelitian disajikan dalam diagram alur pada Gambar 8.

(21)

10

tumbuhan obat sebelumnya dalam bentuk teks (hardcopy) dan diubah dalam bentuk file teks softcopy dengan format XML. Dokumen tumbuhan obat ini terdiri atas enam kelas yaitu Apiaceae, Crassulaceae, Euphorbiaceae, Lamiacea, Myrtaceae dan Rutaceae. Jumlah data dokumen tumbuhan obat yang digunakan pada penelitian ini dapat dilihat pada Tabel 4. Spesies-spesies yang digunakan pada penelitian ini dapat dilihat pada Tabel 5.

Tabel 4 Jumlah dokumen tumbuhan No. Nama famili Total dokumen

1 Apiaceae 19

Tabel 5 Kombinasi data dokumen per famili

Nama famili Nama species Jumlah dokumen

Apiaceae Centella asiatica 8

Coriandrum sativum 1

Foeniculum vulgane 4

Cuminum cyminum 2

Apium graveolens 3

Daucus carota 1

Crassulaceae Kalanchoe pinnata 14 Euphorbiaceae Eupharbia tirucalli 3

Excoecaria cochinchinensis 2

Lamiaceae Plectranthus amboinicius 3

Ocimum basilicum 3

Coleus scutellarioides 8

Orthosiphon aristatus 6

Myrtaceae Psidium guajava 6

(22)

11

Eugenia cumini 1

Tabel 5 Lanjutan

Nama famili Nama species Jumlah dokumen

Rutaceae Murraya paniculata 3

Euodia suaveolens 1

*Sumber „ aksonomi umbuhan Obat-obatan‟ Oleh Tjitrosoepomo (1994). *Sumber „Panduan Lengkap Manfaat anaman Obat‟ Oleh Fauzi (2008). *Sumber : Dokumen latih Suganda (2012)

Contoh format dokumen <dok>

tidak berbatang, dengan batang berongga sebelah dalam dan matahari

</deskripsi> </dok>

Praproses

Pada tahap praproses, terdapat 3 tahap yaitu lowercasing, tokenisasi dan pembuangan stopwords. Lowercasing adalah proses mengubah huruf non-capital agar menjadi case-insensitive pada saat dilakukan pemrosesan teks dokumen. Tokenisasi adalah pemrosesan teks masukan yang dibagi menjadi unit-unit kecil dapat berupa kata. Stopwords adalah daftar kata yang dianggap tidak memiliki pengaruh yang dominan terhadap suatu penciri suatu dokumen, jika pada dokumen terdapat kata yang terdapat pada daftar maka kata tersebut dibuang sebagai penciri dari suatu dokumen. Stopwords yang digunakan berjumlah 662 kata yang didapatkan dari penelitian sebelumnya Suganda (2012).

(23)

12

Biasanya jeruk nipis ditanam di pekarangan atau di

kebun, dapat tumbuh pada tanah yang kurang subur,

asalkan mudah dapat air dan mendapat sinar matahari “.

Dokumen setelah lowercasing

biasanya jeruk nipis ditanam di pekarangan atau di

kebun, dapat tumbuh pada tanah yang kurang subur,

asalkan mudah dapat air dan mendapat sinar matahari “.

Dokumen setelah tokenisasi

Dokumen setelah dilakukan pembuangan stopwords

jeruk nipis ditanam pekarangan kebun

tumbuh tanah kurang subur mudah

air sinar matahari

Ekstraksi Fitur Dokumen Menggunakan Chi-Square

Tiap dokumen latih akan diekstraksi menggunakan algoritme chi-square dengan nilai alpha (α) 0.1. Penelitian ini menggunakan nilai alpha sebesar 0.1 dengan tujuan jumlah penciri yang dihasilkan lebih sedikit sehingga komputasi lebih cepat dan hanya menghasilkan penciri yang lebih merepresentasikan dari dokumen tersebut. Proses ini bertujuan untuk menghasilkan kata-kata yang akan menjadi penciri dari dokumen tersebut. Setelah tiap dokumen memiliki kata-kata tertentu selanjutya dikelompokan ke dalam kelas atau famili dari dokumen tersebut.

Klasifikasi Probalistic Neural Network

Data dokumen tumbuhan dibagi menjadi 2 bagian yaitu data latih dan data uji dengan 75% untuk data latih dan 25% data uji per famili. Data latih digunakan sebagai lapisan pola pada algoritme Probalistic Neural Network (PNN) dengan menggunakan algoritme chi-square, sedangkan data uji digunakan untuk melakukan pengujian klasifikasi.

(24)

13

sampai 1 sebagai nilai probabilitasnya. Lapisan keputusan memiliki enam target kelas yaitu Apiaceae, Crassulaceae, Euphorbiaceae, Lamiacea, Myrtaceae dan Rutaceae.

Perhitungan Akurasi

Evaluasi dilakukan pada model klasifikasi. Evaluasi terhadap kinerja model pengklasifikasi probalistic neural network dilakukan dengan menghitung persentase ketepatan suatu dokumen masuk ke dalam kelas tertentu. Evaluasi untuk model pengklasifikasi probalistic neural network dinyatakan dalam bentuk confusion matrix.

Lingkungan Pengembangan

Sistem ini dikembangkan dan diimplementasikan dengan menggunakan perangkat keras dan perangkat lunak sebagai berikut:

1 Perangkat Keras

 Dell Studio tipe 1457

a Memory RAM 8GB DDR3 b Harddisk 500 GB

c Core i7 720QM 2 Perangkat Lunak

 Sistem Operasi Windows 7 Ultimate 64 bit

 Xampp-win32-1.7.2

Pada penelitian ini terdapat enam famili dokumen teks tumbuhan. Setiap famili memiliki jumlah dokumen yang berbeda-beda. Famili yang digunakan pada penelitian adalah Apiaceae, Crassulaceae, Euphorbiaceae, Lamiacea, Myrtaceae dan Rutaceae.

Praproses

(25)

14

dokumen tersebut. Kata yang terdapat dalam daftar stopwords akan dihilangkan dari dokumen tersebut sehingga hanya kata-kata yang tidak dalam daftar stopwords yang dapat dijadikan sebagai penciri dari dokumen tersebut. Sehingga jumlah kata dokumen berkurang setelah dilakukan pra-proses.

Ekstraksi Fitur Chi-Square

Setelah melalui tahap pra-proses selanjutnya dokumen latih akan di ekstraksi menggunakan metode chi-square sehingga menghasilkan penciri-penciri dokumen latih setiap familinya. Setiap dokumen latih akan menghasilkan penciri yang berbeda-beda tergantung dari isi dari dokumen tersebut. Pada penelitian ini proses ekstraksi fitur chi-square menggunakan nilai alpha (α) sebesar 0.1. Jumlah term yang dihasilkan tiap famili dapat dilihat pada Tabel 8.

Tabel 6 Komposisi jumlah dokumen tumbuhan No. Nama famili Jumlah dokumen latih

1 Apiaceae 14 dikarenakan pada kelas tersebut memiliki jumlah dokumen cukup banyak dan jumlah kata pada dokumen latih untuk kelas tersebut cukup banyak pula. Pada tabel terlihat kelas Apiaceae memiliki jumlah kata terbanyak dibandingkan dengan kelas lainnya.

Tabel 7 Daftar jumlah kata per famili No. Nama famili Jumlah kata seluruh

dokumen latih

(26)

15

tingkat kepentingan yang cukup besar dibandingkan dengan kata pada famili Apiaceae.

Tabel 8 Perbandingan kelas Apiaceae dengan kelas Euphorbiaceae Pembanding Apiaceae Euphorbiaceae Jumlah kata seluruh dokumen latih 3545 2778

Jumlah term hasil chi-square 38 64

Tabel 9 Kombinasi dokumen latih kelas Apiaceae dengan Euphorbiaceae

Nama famili Nama species Jumlah dokumen

Apiaceae Centella asiatica 8 Foeniculum vulgane 2

Cuminum cyminum 2

Apium graveolens 1

Coriandrum sativum 1 Euphorbiaceae Eupharbia tirucalli 3

Jatropha curcas 2

Kandungan kata yang terdapat pada tiap spesies famili Apiaceae sebagai berikut: 1 Spesies Centella asiatica

asiatica, baunya, bergantung, bonggol, cahaya, centella, disebut, india, jambu, karangan, lalab, membujur, merayap, padang, penampang, penutup, percabangan, perkebunan, pita, rimpang, roset, sawah, sejajar, selokan, serabut, stolon, sungai, teduh, terdiri dan ujungnya.

2 Spesies Foeniculum vulgane

baunya, berlubang, india, letak, letaknya, membujur, percabangan, terdiri.

3 Spesies Cuminum cyminum India dan pita.

4 Spesies Apium graveolens perkebunan

5 Spesies Coriandrum sativum jambu dan terdiri.

Kandungan kata yang terdapat pada tiap spesies famili Euphorbiaceae sebagai berikut:

1 Spesies Eupharbia tirucalli

(27)

16

herpes, hidung, jengkal, kaca, kapalan, karet, kautschuk, kerusakan, kusta, laktucerol, lalat, letaknya, melemparkan, melintang, membesar, membujur, mengusir, menimbulkan, meracun, nyamuk, pecah, pecahan, pencahar, penebalan, pensil, percabangan, pot, ringan, rongga, senyawaan, sifilis, sitosterol, susu, syaraf, tahi, tampak, tangkainya, taraksasterol, tawar, terpatah, tertusuk, tirucalli dan zoster.

2 Spesies Excoecaria cochinchinensis

betina, daging, euphorbiaceae, hutan, memanjang, percabangan, radix dan taman.

3 Spesies Jatropha curcas

beracun, bergetah, Betina, cacingan, Euphorbiaceae, kusta, lepra, menjari, pencahar, ringan, sitosterol dan terdiri.

4 Spesies Euphorbia resinifera euphorbiaceae dan malat 5 Spesies Mallotus philippinensis

betina, euphorbiaceae, india, memanjang, pecah dan pita. 6 Spesies Hevea brasiliensis

betina, euphorbiaceae, karet, letaknya, melemparkan, memanjang, menjari, pecah, sekali, susu dan terdiri.

7 Spesies Manihot utilissima

betina, euphorbiaceae, letaknya, membujur, menjari, sekali dan susu 8 Spesies Ricinus communis

betina, euphorbiaceae, india, letaknya, menjari, pencahar, sekali, susu, tadi dan terdiri.

9 Spesies Stilingsia sylvatica

betina, euphorbiaceae, letaknya, menjari, sekali dan susu.

Berikut penjelasan hasil chi-square pada penelitian ini berdasarkan famili : a Apiaceae

Terdapat beberapa term yang dapat menjadi penciri dari famili Apiaceae

berdasarkan buku “taksonomi tumbuhan obat-obatan” oleh Tjitrosoepomo (1994). yaitu :

Berikut kutipan dari buku “taksonomi tumbuhan obat-obatan” oleh Tjitrosoepomo (1994).

- “Terna berumur pendek atau panjang, dengan

batang berongga sebelah dalam”

- “bergerigi membujur pada permukaannya”

- “ujungnya yang melengkung ke dalam”

- “berwarna kuning atau keputih-putihan, jarang

merah jambu atau lembayung”

- “tiap ruang dengan 1 bakal biji yang

(28)

17

b Crassulaceae

Term yang dihasilkan chi-square dari dokumen latih tidak dapat mencirikan taksonomi dari famili tersebut dikarenakan dokumen latih yang digunakan hanya 1 spesies dan isi dari dokumen tersebut belum mereprentasikan ciri-ciri taksonomi khusus famili Crassulaceae.

c Euphorbiaceae

Terdapat beberapa term yang dapat menjadi penciri dari famili Euphorbiaceae berdasarkan buku “taksonomi tumbuhan obat-obatan” oleh Tjitrosoepomo (1994) yaitu :

- getah

- susu

- menjari

Berikut kutipan dari buku “taksonomi tumbuhan obat-obatan” oleh Tjitrosoepomo (1994)

- “Pohon, perdu atau terna, kadang-kadang berupa

sukulenta, kebanyakan menghasilkan getah yang

berwarna putih seperti susu”

- “Daun tersebar, kadang-kadang berhadapan,

tunggal atau majemuk menjari”

d Lamiacea

Term yang dihasilkan chi-square dari dokumen latih tidak dapat mencirikan taksonomi dari famili tersebut dikarenakan dokumen latih yang digunakan belum mereprentasikan ciri-ciri taksonomi khusus famili Lamiacea. e Myrtaceae

Terdapat beberapa term yang dapat menjadi penciri dari famili Myrtaceae

berdasarkan buku “taksonomi tumbuhan obat-obatan” oleh Tjitrosoepomo (1994) yaitu :

- berkayu

Berikut kutipan dari buku “taksonomi tumbuhan obat-obatan” oleh Tjitrosoepomo (1994)

- “Sebagian besar terdiri atas tumbuhan yang

berupa semak-semak atau pohon-pohonan yang

berbatang berkayu, jarang sekali berupa terna,

dengan daun tunggal tanpa daun penumpu yang

duduknya tersebar atau berhadapan”

f Rutaceae

Terdapat beberapa term yang dapat menjadi penciri dari famili Rutaceae

berdasarkan buku “taksonomi tumbuhan obat-obatan” oleh Tjitrosoepomo (1994) yaitu :

- aromatis

(29)

18

- “Tumbuhan yang berkayu, jarang berupa terna yang

aromatis

Klasifikasi Probalistic Neural Network

Hasil klasifikasi menggunakan metode probalistic neural network dengan metode ekstraksi ciri chi-square disajikan dalam diagram batang pada Gambar 9.

Gambar 99Akurasi pengujian

Pada Tabel 11 dapat dilihat bahwa famili Crassulaceae memiliki nilai terbesar diantara famili-famili yang lain yaitu dari empat dokumen uji, sistem dapat mengklasifikasikan semua dokumen uji secara benar ke dalam famili Crassulaceae. Hal tersebut dikarenakan pada famili Crassulaceae dokumen uji maupun dokumen latih hanya menggunakan 1 spesies yaitu Kalanchoe pinnata. Famili Rutaceae memiliki nilai terkecil dari empat dokumen uji, sistem hanya dapat tiga dokumen uji secara benar terklasifikasikan kedalam famili Rutaceae.

Tabel 10 Hasil evalusi tiap famili Nama Famili Nilai akurasi (%)

Apiaceae 80

(30)

chi-19

Tabel 11 Confusion Matrix pada klasifikasi

Famili Predicted Penjelasan hasil klasifikasi probalistic neural network tiap famili :

A Famili Apiaceae

Berdasarkan Tabel 12 terdapat empat dokumen uji famili Apiaceae yang terklasifikasikan secara benar masuk ke dalam famili Apiaceae. Namun, terdapat satu dokumen yang salah klasifikasi dan masuk ke dalam famili Crassulaceae. Hal tersebut terjadi dikarenakan famili Apiaceae dan Crassulaceae berada dalam satu divisi yaitu Magnoliophyta (lihat Tabel 13).

Tabel 12 Taksonomi famili Apiaceae dan Crassulaceae

Apiaceae Crassulaceae Kerajaan Plantae Plantae

Divisi Magnoliophyta Magnoliophyta

Kelas Magnoliopsida Eudicots (Core eudicots) Ordo Apiales Saxifragales

Tabel 13 Perbandingan term penciri famili Apiaceae dan Crassulaceae Term hasil ekstrasi

Membujur Membujur Membujur

Meningkatkan Meningkatkan Meningkatkan

Urat Urat Urat

Isi dari dokumen uji :

- “Batangnya biasanya sangat pendek, bersegi dan

beralur membujur

- “akar berkhasiat meningkatkan enzim pada organ

pencernaan”

(31)

20

Gambar 1010Bentuk morfologi daun famili Apiacea dan Crasslucase Gambar 10 menunjukkan salah satu ciri-ciri taksonomi famili Apiacea dan famili Crasslucase yang memiliki kesamaan pada bagian bentuk daun yang bergelombang pada sisinya. Jika dibandingkan dengan Tabel 14 kata penciri yang dihasilkan belum menggambarkan ciri-ciri taksonomi pada famili Apiacea dan famili Crasslucase. Pada Tabel 14 hanya kata penciri „membujur‟ yang dapat dijadikan sebagai ciri-ciri taksonomi untuk famili Apiacea dan famili Crasslucase. Kata ‘urat’ dan

‘meningkatkan’ tidak dapat dijadikan ciri-ciri taksonomi dari tumbuhan

walaupun kata tersebut dapat dijadikan penciri dari famili pada penelitian kali ini.

B Famili Crassulaceae

Berdasarkan Tabel 12 semua dokumen uji famili Crassulaceae dapat diklasifikasikan secara benar. Hal tersebut dikarenakan kombinasi dokumen uji maupun dokumen latih yang digunakan pada famili Crassulaceae hanya menggunakan satu jenis spesies yaitu sosor bebek atau Kalanchoe Pinnatae.

C Famili Euphorbiaceae

Berdasarkan Tabel 12 terdapat empat dokumen uji famili Euphorbiaceae yang terklasifikasikan secara benar masuk ke dalam famili Euphorbiaceae. Namun, terdapat satu dokumen yang salah klasifikasi dan masuk ke dalam famili Crassulaceae. Hal tersebut terjadi dikarenakan famili Euphorbiaceae dan Crassulaceae berada dalam satu kelas yaitu Eudicots (lihat Tabel 15).

Tabel 14 Taksonomi Euphorbiaceae dan Crassulaceae

Euphorbiaceae Crassulaceae Kerajaan Plantae Plantae

Divisi Angiosperms Magnoliophyta

(32)

21

Dokumen yang mengalami salah klasifikasi dikarenakan isi dari dokumen tersebut memiliki term yang terdapat pada penciri dari famili Euphorbiaceae dan Crassulaceae.

Tabel 15 Perbandingan term dokumen, famili Euphorbiaceae dan Crassulaceae

Term hasil ekstrasi dokumen

Term penciri dari famili Euphorbiaceae

Term penciri dari famili Crassulaceae

Percabangan Percabangan Percabangan

Isi dari dokumen uji :

- “Pada ujung batang atau dalam percabangan

Gambar 1111Posisi cabang famili Euphorbiaceae dan famili Crassulaceae. Gambar 11 menunjukkan kesamaan ciri taksonomi yang dimiliki oleh famili Euphorbiaceae dan famili Crassulaceae. Ciri taksonomi terdapat pada bagian cabang tumbuhan. . Jika dibandingkan dengan Tabel 16 kata penciri yang dihasilkan dapat menggambarkan ciri-ciri taksonomi pada famili Euphorbiaceae dan famili Crassulaceae yaitu terletak pada bagian cabang atau percabangannya.

D Famili Lamiaceae

Berdasarkan Tabel 12 terdapat empat dokumen uji famili Lamiaceae yang terklasifikasikan secara benar masuk ke dalam famili Lamiaceae. Namun, terdapat satu dokumen yang salah klasifikasi dan masuk ke dalam famili Apiaceae. Hal tersebut terjadi dikarenakan famili Lamiaceae dan Apiaceae berada dalam satu kelas yaitu Magnoliopsida (lihat Tabel 17).

Tabel 16 Taksonomi Lamiaceae dan Apiaceae Lamiaceae Apiaceae

Kerajaan Plantae Plantae

Divisi Magnoliophyta Magnoliophyta Kelas Magnoliopsida Magnoliopsida

(33)

22

Dokumen yang mengalami salah klasifikasi dikarenakan isi dari dokumen tersebut memiliki term yang terdapat pada penciri dari famili Lamiaceae dan famili Apiaceae.

Tabel 17 Perbandingan term dengan famili Apiaceae dan Lamiaceae Term hasil ekstrasi

Ujungnya Ujungnya Ujungnya

Isi dari dokumen uji :

- “Bunga berupa tandan yang keluar di

ujungnya

Gambar 1212Bunga famili Euphorbiaceae dan famili Crassulaceae Gambar 12 menunjukkan kesamaan ciri taksonomi yang dimiliki oleh famili Euphorbiaceae dan famili Crassulaceae. Ciri taksonomi terdapat pada letak bagian bunga yang keluar pada ujung batang. Jika dibandingkan dengan Tabel 18 kata penciri yang dihasilkan dapat menggambarkan ciri-ciri taksonomi pada famili Euphorbiaceae dan famili Crassulaceae yaitu bagian letak bunga yang terletak pada bagian ujung batang.

E Famili Myrtaceae

Berdasarkan Tabel 12 terdapat empat dokumen uji famili Myrtaceae yang terklasifikasikan secara benar masuk ke dalam famili Myrtaceae. Namun, terdapat satu dokumen yang salah klasifikasi dan masuk ke dalam famili Rutaceae. Hal tersebut terjadi dikarenakan famili Myrtaceae dan Rutaceae berada dalam satu kingdom yaitu Plantae (lihat Tabel 18).

Tabel 18 Taksonomi Myrtaceae dan Rutaceae Myrtaceae Rutaceae Kerajaan Plantae Plantae Divisi Magnoliophyta Angiosperms Kelas Magnoliopsida -

(34)

23

Dokumen yang mengalami salah klasifikasi dikarenakan isi dari dokumen tersebut memiliki term yang terdapat pada penciri dari famili Myrtaceae dan famili Rutaceae.

Tabel 19 Perbandingan term dokumen dengan famili Myrtaceae dan Rutaceae Term hasil ekstrasi

dokumen uji

Term penciri dari famili myrtaceae

Term penciri dari famili rutaceae

Kekuning Kekuning Kekuning

Kuningan Kuningan Kuningan

Memanjang Memanjang Memanjang

Isi dari dokumen uji :

- “Bunga tersusun dalam bulir yang keluar

dari ketiak-ketiak daun warna kuning gading”

- “berwarna kekuning-kuningan dapat menjadi

berwarna hijau”

- “Daun tunggal, bertangkai pendek, bangun

jorong atau memanjang

Gambar 1313Buah famili Myrtaceae dan famili Rutaceae

Gambar 13 menunjukkan kesamaan ciri taksonomi yang dimiliki oleh famili Myrtaceae dan famili Rutaceae. Ciri taksonomi terdapat pada warna dari buahnya. Jika dibandingkan dengan Tabel 19 kata penciri yang dihasilkan dapat menggambarkan ciri-ciri taksonomi pada famili Myrtaceae dan Rutaceae yaitu kata „kuning‟ yang terdapat pada warna buah dan bentuk daun yang „memanjang‟ pada famili Myrtaceae dan Rutaceae.

F Famili Rutaceae

(35)

24

Tabel 20 Taksonomi Rutaceae dan Crassulaceae Rutaceae Crassulaceae Kerajaan Plantae Plantae

Divisi Angiosperms Magnoliophyta

Kelas - Eudicots (Core)

Ordo Sapindales Saxifragales

Dokumen yang mengalami salah klasifikasi dikarenakan isi dari dokumen tersebut memiliki term yang terdapat pada penciri dari famili Rutaceae dan famili Crassulaceae.

Tabel 21 Perbandingan term dokumen dengan famili Rutaceae dan Crassulaceae Term hasil ekstrasi

Memanjang Memanjang Memanjang

Muncul Muncul Muncul

Isi dari dokumen :

- “daun bangun bulat telur atau memanjang

- “Bunga dalam malai dan muncul sesudah

daun-daunnya”

Gambar 1414Bentuk daun famili Rutaceae dan Crassulaceae. Gambar 14 menunjukkan kesamaan ciri taksonomi yang dimiliki oleh famili Rutaceae dan Crassulaceae. Ciri taksonomi terdapat pada bentuk daun yang bulat dan memanjang. Jika dibandingkan dengan Tabel 21 kata penciri yang dihasilkan dapat menggambarkan ciri-ciri taksonomi pada famili Myrtaceae dan Rutaceae yaitu kata „memanjang‟ yang terdapat pada bentuk daun. Kata „muncul‟ pada Tabel 21 tidak dapat dijadikan ciri-ciri taksonomi namun pada penelitian ini kata tersebut dapat dijadikan penciri dari famili Myrtaceae dan Rutacea.

(36)

25

SIMPULAN DAN SARAN

Simpulan

Penelitian klasifikasi dokumen tumbuhan obat berbasis famili menggunakan metode chi-square dan probalistic neural network. Metode chi-square dengan nilai alpha 0.1, digunakan untuk menghasilkan ciri-ciri taksonomi tumbuhan dari dokumen tumbuhan obat. Metode PNN dengan nilai bias 1 digunakan untuk klasifikasi dokumen tumbuhan obat. Penelitian ini menghasilkan akurasi sebesar 82.14 % yaitu dari lima dokumen per famili yang diujikan sistem dapat mengklasifikasikan empat dokumen yang sesuai dengan familinya secara benar.

Hasil klasifikasi dipengaruhi oleh jumlah kata penciri suatu famili. Jumlah kata penciri dari suatu famili dipengaruhi oleh jumlah kata yang sama pada tiap dokumen latih. Semakin banyak kata yang sama pada tiap dokumen latih semakin besar probabilitas kata terebut menjadi kata penciri. Pada penelitian ini penciri dari suatu famili belum menggambarkan ciri-ciri taksonomi tumbuhan. Hal ini disebabkan banyaknya kata yang sama pada tiap dokumen latih belum menggambarkan ciri-ciri taksonomi tumbuhan.

Penelitian ini sudah dapat mengklasifikasikan dokumen tumbuhan obat. Hasil ekstraksi penciri menggunakan metode chi-square pada penelitian ini belum dapat menghasilkan ciri-ciri taksonomi famili. Hal tersebut dikarenakan dokumen latih terdapat banyak kata yang sama pada tiap dokumen yang bukan ciri-ciri taksonomi tumbuhan.

Saran

Penelitian ini dapat dikembangkan lebih lanjut untuk mendapatkan hasil pengukuran akurasi yang lebih baik. Hal-hal yang dapat dilakukan misalnya: 1 Menambahkan jumlah dokumen latih.

2 Menambahkan dokumen dengan jenis famili lain.

DAFTAR PUSTAKA

Barnaghi PM, Sahzabi VA, Bakar AA, 2012. A Comparative Study for Various Methods of Classification. Singapura(SG): IACSIT Pr.

Damayanti EK, Zuhud EAM, Hikmat A. 2011. Indonesian Tropical Medicinal Plants Diversity: Problems and Challenges in Identification. Department of Forest Resources Conservation and Ecotourism, Bogor(ID): Fakultas Kehutanan, Institut Pertanian Bogor.

(37)

26

Groombridge B, Jenkins M, 2002. World atlas of biodiversity. Earth’s living resources in the 21st century. California(US):Berkeley University of California Press.

Han J, Kamber M. 2006. Data Mining : Concepts and Techniques. Massachusetts(US) : Morgan Kaufman Publishers.

Herawan Y. 2011. Ekstraksi Ciri Dokumen Tumbuhan Obat Menggunakan Chi-Kuadrat dengan Klasifikasi Naive Bayes [skripsi]. Bogor. Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Kumar V, Rathee N. 2011. Knowledge discovery from database using an integration of clustering and classification. Gurgaon (India) : ITM University. Manning CD, Raghavan P, Schutze H. 2008. Introduction to Information

Retrieval. Cambridge (GB): Cambridge University Press.

Srinivasulu P, Nagaraju D, Kumar PR, Rao KN. 2009. Classifying the network intrusion attacks using data mining classification methods and their performance comparison. IJCSNS International Journal of Computer Science and Network Security, Vol.9:11-18 No.6, Juni 2009.

Suganda R. 2013. Sistem Identifikasi Famili Secara Otomatis Berbasis Teks Menggunakan Dokumen Etnofitomedika [skripsi]. Bogor. Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Tjitrosoepomo Gembong. 1994. Taksonomi Tumbuhan Obat-Obatan. Yogyakarta: Gadjah Mada University Press.

Zuhud E A M. 2009. Potensi Hutan Tropika Indonesia sebagai Penyangga Bahan Obat Alam untuk Kesehatan Bangsa. Jurnal Bahan Alam Indonesia. Vol VI:1-8 No.6, Januari 2009.

(38)

27

(39)

28

Lampiran 3 Daftar term kelas Lamiaceae

Term Nilai chi-square

Lampiran 4 Daftar term kelas Euphorbiaceae

(40)

29

Lampiran 5 Daftar term kelas Myrtaceae

Term Nilai chi-square

myrtaceae 28.43

guajava 22.44

psidium 22.44

(41)

30

Lampiran 6 Daftar term kelas Rutaceae

(42)

36

Lampiran 77 Daftar perbedaan morfologi per famili

Habit Leaves Inflorescences

trees shrubs herbs alternate opposite simple compound entire not entire

raceme spike panicle head solitary flower

cyme

Apiaceae 2 2 1 1 2 2 1 2 1 1 0 1 2 0 1

Crassulaceae 0 1 1 1 2 1 2 1 1 0 0 0 0 0 1

Lamiaceae 2 2 1 2 1 1 0 1 1 2 2 0 2 2 1

Myrtaceae 1 1 0 1 1 1 0 1 2 1 0 1 0 2 0

Rutaceae 1 1 2 1 1 1 1 1 1 1 1 0 1 0 1

Euphorbiaceae 1 1 1 1 2 1 1 1 1 1 1 0 0 1 1

Sumber : Buku “Character Variaton in Angiosperm Families” Goldberg (2003) Keterangan :

- Angka 1 menunjukkan bahwa famili tersebut memiliki ciri-ciri morfologi kriteria pada kolom di atas.

Gambar

Gambar 4 4 Contoh spesies berfamili Lamiaceae
Tabel 4 Jumlah dokumen tumbuhan  No.  Nama famili  Total dokumen
Tabel 8 Perbandingan kelas Apiaceae dengan kelas Euphorbiaceae  Pembanding  Apiaceae  Euphorbiaceae  Jumlah kata seluruh dokumen latih  3545  2778
Gambar 9 9 Akurasi pengujian
+7

Referensi

Dokumen terkait

(4) Reproduksi dengan Bantuan atau Kehamilan di Luar Cara Alamiah sebagaimana dimaksud pada ayat (1) harus dilakukan oleh tenaga kesehatan yang mempunyai

Bencana alam yang sering terjadi di wilayah Indonesia antara lain banjir, kemarau panjang, tsunami, gempa bumi, gunung berapi dan tanah longsor.. Masih jelas dalam ingatan

Dari hasil simulasi WLS State Estimation pada lima penyulang jaringan distribusi 20 KV di Surabaya menunjukkan bahwa dengan metode ini, jumlah bus yang tegangannya dapat

Menurut peneliti saran yang sesuai untuk pegawai Balai Besar Pelatihan Pertanian (BBPP) adalah tingkatkan terus prestasi tentang upaya dalam pemenuhan kebutuhan pegawai

Penilaian (evaluasi) penerapan pendekatan kontekstual dalam meningkatkan karakter siswa, setidaknya dapat dilakukan menggunakan indikator berikut ini: sebuah proses

Hubungan antara variabel bebas yaitu lingkungan kerja fisik (X1) dan lingkungan kerja non fisik (X2) dengan keselamatan kerja dan kesehatan kerja bersifat

ersama ini kami sampaikan laporan mingguan realisasi penggunaan dana dan kema-uan &amp;isik  'ehabilitasi 'uang Kelas 'usak erat SD &#34;ahun 2012 %ang telah

Data pada tabel 4 di atas menunjukkan bahwa model pembelajaran kooperatif Talking Chips dan Fan-N-Pick dapat meningkatkan hasil belajar dilihat peningkatan hasil