Sistem Identifikasi Famili Secara Otomatis Berbasis Teks Menggunakan Dokumen Etnofitomedika

(1)

SISTEM IDENTIFIKASI FAMILI SECARA OTOMATIS

BERBASIS TEKS MENGGUNAKAN DOKUMEN

ETNOFITOMEDIKA

RYANTIE OCTAVIANI SUGANDA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

SISTEM IDENTIFIKASI FAMILI SECARA OTOMATIS

BERBASIS TEKS MENGGUNAKAN DOKUMEN

ETNOFITOMEDIKA

RYANTIE OCTAVIANI SUGANDA

Skripsi

sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(3)

ABSTRACT

RYANTIE OCTAVIANI SUGANDA. Text Based Automatic Family Identification System Using Etnofitomedika Document. Supervised by YENI HERDIYENI and ELLYN K. DAMAYANTI.

This research represents a text-based system that can be used for automatic identification of plant families according to the taxonomy of plants. The identification was done by utilizing information from etnofitomedika documents on plant characteristics that can represent the family of each plant including morphology, habitats, habitus, and biochemical compounds. The method used in this research is Chi-Square method to select important words in each document and Naïve Bayes method to classify the words. The experimental results showed that the critical value using significance level of 0,001 had better accuracy than the critical value using significance level of 0,01. The accuracy of classification systems based on family category using K-fold cross validation with significance value of 0,001 was 85,5%. It was found this system is useful in helping users especially researchers and taxonomists for plant family identification. Furthermore, it can help strengthening the knowledge on biodiversity and the use of medical plants.

(4)

Judul Skripsi : Sistem Identifikasi Famili Secara Otomatis Berbasis Teks Menggunakan Dokumen Etnofitomedika

Nama : Ryantie Octaviani Suganda

NIM : G64080030

Menyetujui:

Pembimbing Pembimbing

Dr. Yeni Herdiyeni, S.Si., M.Kom. Ellyn K. Damayanti,Ph.D.Agr.

NIP. 19750923 200012 2 001

Mengetahui:

Ketua Departemen Ilmu Komputer

Dr. Ir. Agus Buono, M.Si, M.Kom NIP.196607021993021001

(5)

PRAKATA

Puji dan syukur penulis panjatkan ke hadirat Allah subhanahu wa-ta'ala atas segala rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan tugas akhir dengan judul Sistem Identifikasi Famili secara Otomatis Berbasis Teks Terhadap Dokumen Etnofitomedika. Penelitian ini dilaksanakan mulai Desember 2011 sampai dengan Januari 2013 dan bertempat di Departemen Ilmu Komputer Institut Pertanian Bogor.

Penulis juga menyampaikan terima kasih kepada pihak-pihak yang telah membantu dalam penyelesaian tugas akhir ini,yaitu:

1 Ayahanda Suganda, Ibunda Dharma Astuti, adikku Ferdimas, dan MUSA big family yang

selalu memberikan kasih sayang, semangat, dan doa.

2 Ibu Dr. Yeni Herdiyeni, S.Si., M.Kom. dan Ibu Ellyn K. Damayanti, Ph.D.Agr. selaku dosen pembimbing yang telah memberikan arahan dan bimbingan dengan sabar kepada penulis dalam menyelesaikan skripsi ini.

3 Bapak Endang Purnama Giri,S.Kom, M.Kom selaku dosen penguji.

4 Mayanda Mega Santoni, Ni Kadek Sri Wahyuni, Oki Maulana, Siska Susanti, Kak Pauzi,

Pak Rico, Mbak Gibtha, Kak Rahmat, Kak Muchlis dan teman-teman satu bimbingan

yang selalu memberikan masukan, saran, dan semangat kepada penulis, specially for Ka

Desta yang telah banyak membantu dan memberi semangat dalam melakukan penelitian ini.

5 Para sahabat seperjuangan Hafizhia Dhikrul A, Ilman Dwi S, Putrantio J, Anita Dly, Tiara

Mitra Lia, Niken Eka, Meri Marliana, Cut Malisa Irwan, Annisa A, Ardini yang selalu mendukung dan selalu bersama penulis dikala senang maupun sedih.

6 Para sahabat Hutomo Triasmoro, M. Rifkiansyah, Rahmat Hafid, M.Wahyu, Jaka Ahmad,

Tenri T. Talkanda, dan Irvan Raditya Putra yang selalu member semangat dan motivasi.

7 Rekan-rekan di Departemen Ilmu Komputer IPB angkatan 45 atas segala kebersamaan,

canda tawa, dan kenangan indah yang telah mengisi kehidupan penulis selama di kampus.

8 Teman-teman Genggong, kostan putri Asy-Syifa, DBM F.L.C, DBM Depok, DBM

Timur, Transformatika, dan AGRIC IPB.

Penulis menyadari bahwa masih banyak kekurangan yang ditemukan dalam tugas akhir ini. Penulis berharap adanya saran dan kritik yang membangun dari semua pihak yang membaca tulisan ini. Semoga tulisan ini bermanfaat dan dapat menambah wawasan ilmu pengetahuan bagi penulis khususnya dan pembaca umumnya.

Bogor, Januari 2013

(6)

RIWAYAT HIDUP

Penulis dilahirkan di Tengerang pada tanggal 17 Oktober 1990 dari ayah Suganda dan ibu Dharma Astuti. Penulis merupakan putri pertama dari dua bersaudara. Penulis merupakan lulusan dari SMAN 101Jakarta (2005-2008), SMPN 142Jakarta (2002-2005), SDNSudimara 7 Ciledug (1996-2002) dan TK Islam Al-Azhar (1994-1996).

Saat ini penulis sedang menempuh studi S1 di Departemen Ilmu Komputer, Fakultas MIPA, Institut Pertanian Bogor, sejak tahun 2008 sampai dengan sekarang. Selama mengikuti perkuliahan, penulis aktif dalam kegiatan kampus seperti kepanitiaan dalam suatu acara di IPB maupun acara yang diselenggarakan oleh Departemen Ilmu Komputer. Penulis berkedudukan

sebagai staff Marketing and Relationship (MR) di HIMALKOM, dan anggota UKM Basket IPB.

(7)

v

DAFTAR ISI

Halaman

DAFTAR TABEL ...vi

DAFTAR GAMBAR ...vi

DAFTAR LAMPIRAN ...vi

PENDAHULUAN ...1

Latar Belakang ...1

Tujuan Penelitian ...1

Ruang Lingkup ...1

TINJAUAN PUSTAKA ...2

Etnofitomedika ...2

Taksonomi ...2

Pemilihan Fitur Dokumen ...2

Klasifikasi ...2

Chi-Kuadrat (χ2)...2

Naïve Bayes Classifier ...3

Confusion Matrix ...4

K-Fold Cross Validation ...4

METODE PENELITIAN ...4

Wawancara...5

Dokumen Etnofitomedika ...5

Praproses Data ...6

Pembagian Data...6

Pemilihan Fitur ...6

KlasifikasiNaive Bayes ...6

Evaluasi ...7

Lingkungan Pengembangan Sistem ...7

HASIL DAN PEMBAHASAN ...7

Dokumen Etnofitomedika ...7

Praproses Data ...7

Pemilihan Fitur ...7

Evaluasi Kinerja Sistem Klasifikasi ...7

Analisis Dokumen ... 7

Analisis waktu eksekusi... 9

Evaluasi K-fold cross validation... 10

KESIMPULAN DAN SARAN ... 10

Kesimpulan ... 10

Saran ... 10

DAFTAR PUSTAKA ... 10

(8)

vi

DAFTAR TABEL

Halaman

1 Kategori dan golongan tumbuhan ... 2

2 Tabel kontingensi ... 3

3 Nilai kritis χ2 dengan derajat bebas satu dan taraf nyata α ... 3

4 Confusion matrix untuk klasifikasi biner ... 4

5 Distribusi dokumen famili ... 7

6 Persamaan ciri pada famili Rutaceae dan Myrtacea ... 8

7 Ciri atau karakteristik ordo Rutales dan Myrtales (Tjitrosoepomo 1994)... 9

8 Hasil akurasi menggunakan k-fold ... 10

DAFTAR GAMBAR

Halaman 1 Metode penelitian ... 5

2 Format koleksi dokumen ... 5

3 Grafik hasil klasifikasi dokumen etnofitomedika ... 8

4 Grafik kinerja rataan pemilihan fitur ... 9

5 Alur taksonomi famili Rutacea dan famili Myrtaceae ... 10

DAFTAR LAMPIRAN

Halaman 1 Daftar jenis tumbuhan obat Indonesia yang digunakan dalam penelitian ... 13

2 Tabel distribusi chi-kuadrat pada berbagai tingkat signifikansi dan derajat bebas tertentu ... 16

3 Confusionmatrix untuk kelas family pada nilai signifikansi 0.001 ... 17

(9)

1

PENDAHULUAN

Latar Belakang

Indonesia sebagai negara tropis

memiliki keanekaragaman hayati yang tinggibaik secara kualitas maupun kuantitas, salah satunya yaitu tumbuhan obat. Terdapat 38.000 spesies tumbuhan di Indonesia dengan jumlah spesies endemik sebanyak

55% (Damayanti et al. 2011). Sampai tahun

2001, Laboratorium Konservasi Tumbuhan, Fakultas Kehutanan IPB hanya dapat mengidentifikasikan 2.039 spesies tumbuhan obat yang berasal dari ekosistem hutan Indonesia (Zuhud 2009). Keanekaragaman tumbuhan obat dapat dikategorikan kedalam

kelompok famili, habitat, habitus,

pemanfaatan, dan bagian tanaman yang

digunakan sebagai obat. Penggunaan

tumbuhan sebagai obat-obatan selalu dengan cara tradisional yaitu dengan resep yang diwariskan oleh nenek moyang bangsa Indonesia. Potensi tumbuhan obat di Indonesia sebagian besar disimpan dalam bentuk pengetahuan masyarakat tradisional atau etnis suatu daerah. Pengetahuan ini memunculkan bidang kajian baru dalam

dunia ilmu pengetahuan, yaitu

etnofitomedika yang merupakan

pengetahuan pemanfaatan potensi tumbuhan untuk obat tradisional yang erat kaitannya

dengan kebiasaan atau tradisi serta

kebudayaan setempat (Sangat

2000).Indonesia memiliki lebih dari 550 etnis yang menyebar dari bagian barat Pulau

Sumatera ke bagian timur Indonesia

(Damayanti et al. 2011). Antar etnis dapat menggunakan spesies dan bagian tumbuhan yang sama atau berbeda. Hal ini tergantung pada pengalaman mereka dan mewariskan resep dari nenek moyang mereka. Adapun

masalah yang ditemukan dalam

keanekaragaman tersebut yaitu dalam

pengidentifikasian spesies.

Keterbatasan pengetahuan penduduk

setempat akan keanekaragaman dan

penggunaan tumbuhan obat menjadi salah satu masalah dalam pengidentifikasian. Selain itu ada beberapa masalah lainnya, seperti terbatasnya jumlah buku identifikasi dan banyaknya halaman di setiap buku identifikasi atau buku panduan yang menyulitkan untuk dibawa kelapangan, terbatasnya jumlah instansi yang berwenang dan fasilitas untuk identifikasi tumbuhan, terbatasnya jumlah taksonom di setiap

instansi yang dapat mengidentifikasi

tumbuhan secara ilmiah, dan banyaknya tenaga, waktu, dan uang yang diperlukan untuk melakukan identifikasi tersebut. Saat ini sudah banyak riset yang meneliti tentang etnofitomedika. Banyak informasi yang terkandung dalam tiap dokumen, misalnya informasi mengenai deskripsi tumbuhan seperti ciri-ciri atau karakteristik dan famili

tumbuhan, manfaat tumbuhan, etnis,

kandungan kimia yang terkandung dalam tumbuhan dan masih banyak informasi lainnya. Saat ini klasifikasi dilakukan secara manual, yaitu dengan cara mengamati lingkungan sekitar dan menganalisa ciri atau karakteristik dari tumbuhan obat secara langsung atau mencocokkan pada tiap dokumen. Cara tersebut membutuhkan waktu lama dan merepotkan sehingga perlu adanya sistem pengidentifikasian otomatis pada dokumen etnofitomedika.

Pada penelitian sebelumnya telah

dilakukan perbandingan mengenai ekstraksi ciri dokumen tumbuhan obat menggunakan

Chi-Kuadratdan menggunakan teknik

document thresholding frequency (df)

dengan klasifikasi Naïve Bayes (Herawan

2011) dan ekstraksi ciri dokumen tumbuhan obat menggunakan Chi-Kuadrat dengan klasifikasi algoritma KNN Fuzzy (Paskianti 2011). Pengelompokan atau klasifikasi tumbuhan obat perlu dilakukan dengan cara mengembangkan teknologi untuk mengatasi masalah dalam identifikasi tumbuhan. Hal tersebut menjadi tantangan bagi ilmuwan di bidang komputer dan teknologi informasi untuk memahami bagaimana taksonomis mengidentifikasi tumbuhan. Oleh sebab itu, pada penelitian ini akan dikembangkan sistem identifikasi otomatis berdasarkan kelompok famili berbasis teks dengan menggunakan dokumen etnofitomedika. Tujuan Penelitian

Tujuan penelitian ini adalah

1 Mengembangkan sistem berbasis teks

yang dapat digunakan untuk

pengidentifikasian famili secara

otomatis sesuai dengan taksonomi.

2 Mengetahui akurasi kinerja sistem.

Ruang Lingkup

(10)

2

pengklasifikasian etnofitmedika hanya

berdasarkan kategori famili.

TINJAUAN PUSTAKA

Etnofitomedika

Menurut Damayanti (2010),

etnofitomedika adalah keterkaitan

pengetahuan lokal etnis tertentu yang

menghuni kawasan hutan dengan

keanekaragaman spesies tumbuhan yang dapat dijadikan bahan pengobatan yang berkaitan dengan tumbuhan obat. Sangat (2000) menyatakan bahwa etnofitomedika

merupakan pengetahuan pemanfaatan

potensi tumbuhan untuk obat tradisional yang erat kaitannya dengan kebiasaan atau tradisi serta kebudayaan setempat (local knowledge).

Taksonomi

Taksonomi tumbuhan merupakan ilmu

yang mempelajari tentang berbagai

penelusuran jenis tumbuhan, penyimpanan

herbarium tumbuhan, pengenalan atau

identifikasi tumbuhan, pengelompokan atau klasifikasi tumbuhan, dan pemberian nama tumbuhan (Tjitrosoepomo 1994). Taksonomi tumbuhan lebih banyak mempelajari aspek

penanganan sampel-sampel (spesimen)

tumbuhan dan pengelompokan (klasifikasi).

Ilmu taksonomi tumbuhan mengalami

banyak perubahan cepat semenjak

digunakannya berbagai teknik biologi

molekular dalam berbagai kajiannya. Contoh kategori dan golongan tumbuhan dapat dilihat pada Tabel 1.

Tabel 1 Kategori dan golongan tumbuhan

Kategori Golongan

Species Shorea pinanga

Pemilihan Fitur Dokumen

Pemilihan fitur dokumen merupakan suatu proses memilih kata terbaik pada tiap

dokumen. Kata tersebut merupakan

himpunan dari semua kata yang ada pada data latih. Pemilihan fitur dokumen memiliki dua tujuan utama, yaitu membuat data latih yang diterapkan oleh sistem klasifikasi

menjadi lebih sederhana serta untuk

meningkatkan akurasi sistem klasifikasi.

Peningkatan akurasi sistem klasifikasi

disebabkan oleh dihilangkannya kata-kata yang bukan merupakan penciri dokumen yang dilakukan pada proses penghilangan fitur (Manning et al.2008). Dalam penelitian ini, data yang digunakan adalah dokumen etnofitomedika yang berasal dari beberapa dokumen hasil riset dan buku tumbuhan obat. Dokumen yang digunakan dibuat dalam format xml. Data dari himpunan tersebut akan digunakan sebagai penciri dokumen yang akan diklasifikasikan. Klasifikasi

Klasifikasi adalah proses untuk

menentukan kelas dari suatu objek tertentu. Proses klasifikasi dibagi menjadi dua tahap, yaitu tahapan pembelajaran dan pengujian. Pada tahap pembelajaran, sebagian data yang telah diketahui kelasnya yang disebut sebagai data latih digunakan untuk membuat model klasifikasi. Tahap pengujian adalah tahap menguji data uji dengan model klasifikasi untuk mengetahui akurasi model klasifikasi tersebut. Jika akurasi cukup maka model tersebut dapat digunakan untuk

memprediksi kelas data yang belum

diketahui (Han dan Kamber 2006).

Pada klasifikasi dokumen,

permasalahan yang muncul adalah sebagai berikut: diberikan sebuah deskripsi d ∈ X

dari sebuah dokumen dimana X merupakan

ruang dokumen. Sebuah himpunan

tetapkelas C = c1, c2, c3, …,cj, dengan

menggunakan algoritma pembelajaran,

dilakukan proses pembelajaran terhadap

fungsi klasifikasi γ sehingga dapat

memetakan dokumen � pada kelas C.

γ: X→C Chi-Kuadrat (χ2₎

(11)

3

sampel dihitung nilai χ2_{sehingga diperoleh} distribusi sampling untuk χ2_{yang disebut} distribusi Chi-Kuadrat.

Distribusi Chi-Kuadrat tergantung pada satu parameter, yaitu derajat kebebasan (df). Berikut adalah rumus untuk menghitung besarnya jumlah derajat bebas dari suatu

menguji pengaruh antara frekuensi observasi dengan frekuensi harapan. Hipotesis nol berarti tidak ada perbedaan yang signifikan antara frekuensi observasi dengan frekuensi harapan. Hipotesis nol dapat diterima apabila nilai �2

< nilai kritis pada derajat bebas dan tingkat nilai signifikan tertentu, sedangkan hipotesis nol ditolak ketika nilai �2

> nilai kritis pada derajat bebas dan tingkat nilai signifikan tertentu.

Perhitungan nilai Chi-Kuadratdapat

dibantu dengan tabel kontingensi. Nilai pada tabel kontingensi merupakan nilai frekuensi

observasi dari suatu kata terhadap

kelas.Tabel kontingensi dapat dilihat pada Tabel 2.

Tabel 2 Tabel kontingensi Kelas

Kata Kelas = 1 Kelas = 0

Kata = 1 A B

Kata = 0 C D

Perhitungan nilai Chi-Kuadrat berdasarkan tabel kontingensi disederhanakan sebagai berikut:

X(t, c)2 = N(AD-CB)

2

A+C B+D A+B(C+D) (1)

Dari rumus diatas, t merupakan kata yang sedang diujikan terhadap suatu kelas c. Jumlah dokumen latih dilambangkan dengan N. Banyaknya dokumen pada kelas c yang

memuat kata t dilambangkan dengan A,

banyaknya dokumen yang tidak berada di kelas c namun memuat kata t dilambangkan dengan huruf B, banyaknya dokumen yang

berada di kelas c namun tidak memiliki kata

t dilambangkan dengan huruf C,

danbanyaknya dokumen yang bukan

merupakan dokumen kelas c dan tidak

memuat kata t dilambangkan dengan huruf D.

Pengambilan keputusan berdasarkan nilai χ2_{dari masing-masing kata. Kata yang} memiliki nilai χ2_{di atas nilai kritis pada} tingkat signifikasi α adalah kata yang dipilih sebagai penciri dokumen, sehingga kata yang dipilih sebagai penciri dokumen merupakan kata yang memiliki pengaruh terhadap kelas c. Nilai kritis �2

dengan

derajat bebas satu dan taraf nyata �

ditunjukkan oleh Tabel 3. Tabel distribusi

chi-kuadrat pada berbagai tingkat

signifikansi dan derajat bebas tertentu dapat dilihat pada Lampiran 2.

Tabel 3 Nilai kritis χ2_{dengan derajat bebas}

Metode klasifikasi yang

mengasumsikan seluruh atribut yang bersifat independent satu sama lain pada konteks

kelas yaitu metode Naïve Bayes (McCallum

dan Nigam 1998). Peluang Bayes dapat

digunakan untuk menghitung peluang

bersyarat, yaitu peluang kejadian apabila suatu kejadian diketahui. Metode ini dapat memprediksi kemungkinan anggota suatu kelas berdasarkan sampel yang berasal dari anggota kelas tersebut (Manning 2008).

(12)

4 c, dan P(d) adalah peluang awal kemunculan

dokumen d. Peluang awal kemunculan

dokumen d dapat diabaikan karena memiliki

nilai yang sama untuk seluruh kelas c, sehingga Persamaan 2 dapat disederhanakan dalam Persamaan 3:

P cd = P dc P c (3)

Rumus untuk menghitung nilai peluang

dokumen masuk ke dalam kelas c dan

peluang kemunculan dokumen d berada

pada kelas c adalah tinggi yaitu seperti ditunjukkan pada Persamaan 4:

max

c ∈C P dc P(c) (4)

Nilai peluang awal P(c) dapat diestimasi dengan melihat jumlah dokumen yang dimiliki oleh kelas c relatif terhadap jumlah seluruh dokumen yang ada.

Confusion Matrix

Confusion matrix merupakan sebuah tabel yang terdiri atas banyaknya baris data uji yang diprediksi benar dan salah oleh model klasifikasi, yang digunakan untuk menentukan kinerja suatu model klasifikasi. Data uji diujikan untuk mendapatkan tingkat akurasi hasil prediksi yang berupa jumlah true positive, true negative, false positive, dan false negative seperti yang dilihat pada Tabel 4 (Herawan 2011).

Tabel 4 Confusion matrix untuk klasifikasi biner

Keterangan untuk Tabel 4 dinyatakan sebagai berikut:

 F11, yaitu jumlah dokumen dari kelas 1

yang benar diklasifikasikan sebagai kelas 1.

yang benar diklasifikasikan sebagai kelas 0.

yang salah diklasifikasikan sebagai kelas 1.

 F10, yaitu jumlah dokumen dari kelas 1 yang salah diklasifikasikan sebagai kelas 0.

Perhitungan akurasi dinyatakan dalam

Persamaan 5.

Akurasi = _{F11+F10+F01+F00}F11+F00 (5)

K-Fold Cross Validation

Dalam K-fold cross validation data akan dibagi ke dalam k buah partisi dengan

ukuran yang sama

D1, D2, D3,…, Dk. Pelatihan dan pengujian dilakukan sebanyak k kali. Dalam iterasi ke-i, partisi �_�akan menjadi data uji, selainnya menjadi data latih. Pada iterasi pertama, D1 akan menjadi data uji, D2, D3, …, Dk akan menjadi data latih. Selanjutnya iterasi ke-2,

D2 akan menjadi data uji,

D1, D3, …, Dk menjadi data latih, dan seterusnya (Han dan Kamber 2006).

METODE PENELITIAN

Penelitian ini dilaksanakan dalam

beberapa tahapan. Tahap awal pada

penelitian ini yaitu peneliti melakukan tahap

wawancara kepada para pakar

etnofitomedika. Data yang diproses dalam

sistem ini adalah koleksi dokumen

etnofitomedika, seperti dokumen hasil riset

(13)

5

Dokumen tersebut diubah menjadi bentuk format xml. Daftar kata buang atau stopwords merupakan input lain yang akan digunakan pada tahapan praproses data.

Tahap selanjutnya adalah pembagian

dokumen yaitu data latih dan data uji yang dilakukan melalui dua cara yaitu dengan mebagi 70 : 30 dan dengan menggunakan metode K-fold cross validationdengan K=2, kemudian dilakukan proses pemilihan fitur pada dokumen latih dan hasilnya digunakan

sebagai landasan dalam pembuatan vector

space model yang akan dimanfaatkan untuk

melakukan pembobotan terhadap kata

sehingga akan merepresentasikan dokumen dalam bentuk vektor. Tahap berikutnya adalah melakukan klasifikasi menggunakan Naive Bayes pada dokumen uji yang belum diketahui kelasnya yang bertujuan untuk membangun model klasifikasi.Tahapan pada penelitian ini diilustrasikan pada Gambar 1.

Gambar 1 Metode penelitian

Wawancara

Pada penelitian ini dilakukan

wawancara terhadap salah satu pakar tumbuhan obat. (Hikmat Agus 3 Januari 2012, komunikasi pribadi) menyatakan bahwa etnofitomedika merupakan interaksi antara manusia dengan tumbuhan obat yang berhubungan dengan suatu etnis tertentu. Tiap entis memiliki tumbuhan obat yang beraneka ragam. Tidak semua penduduk setempat mengetahui jenis dan manfaat dari tumbuhan tersebut. Saat ini sudah banyak riset yang meneliti tentang etnofitomedika tetapi masih dalam bentuk laporan atau makalah dan tidak terstruktur. Masyarakat pada umumnya membutuhkan informasi mengenai tumbuhan obat di tiap etnis yang berbeda. Adapun informasi yang dibutuhkan untuk mengidentifikasikan etnofitomedika, yaitu berupa etnis, penyakit, nama lokal, nama ilmiah, famili, penggunaan, bagian, dan deskripsi.

Dokumen Etnofitomedika

Dokumen yang digunakan pada

penelitian ini adalah suatu data yang memuat informasi mengenai satu jenis tumbuhan obat. Informasi tersebut didapatkan dari beberapa laporan atau makalah hasil riset dan buku tumbuhan obat. Dokumen tersebut dibentuk dalam format xml. Koleksi dokumen dijadikan sebagai korpus. Tiap

dokumen merepresentasikan informasi

mengenai jenistumbuhan obat berdasarkan etnisyang berada di Indonesia yang meliputi etnis, penyakit, nama lokal, nama ilmiah, famili, penggunaan, bagian, dan deskripsi. Koleksi dokumen bertipe file.xml dengan contoh format dokumen yang terdapat pada Gambar 2.

(14)

6

 Dokumen dikelompokkan ke dalam tag

sebagai berikut:

 <dok></dok>, tag ini mewakili keseluruhan dokumen dan melingkupi tag-tag lain yang lebih spesifik.

 <id></id>, tag ini menunjukkan id dari dokumen.

 <etnis></etnis>, tag ini menunjukkan etnis dari tiap tumbuhan obat.

 <penyakit></penyakit>, tag ini menunjukkan penyakit yang dapat disembuhkan dari jenis tumbuhan obat.

 <namalokal></namalokal>, tag ini menunjukkan nama dari suatu jenis tanaman obat.

 <namailmiah></namailmiah>, tag ini

menunjukkan nama ilmiah dari

tumbuhan obat.

 <fam></fam>, tag ini menunjukkan nama famili dari tanaman obat.

 <penggunaan></penggunaan>, tag ini menunjukkan cara penggunaan dari tanaman obat.

 <bagian></bagian>, tag ini

menunjukkan bagian yang digunakan dari tanaman obat.

 <deskripsi></deskripsi>, tag ini mewakili isi dari dokumen meliputi deskripsi tumbuhan obat.

Praproses Data

Ada tiga tahap awal praproses data yaitu lowercasing, tokenisasi, dan pembuangan stopwords. Lowercasing adalah proses untuk

mengubah semua huruf menjadi

non-capital-agar menjadi case-insensitive pada saat

dilakukan pemrosesan teks dokumen,

sedangkan tahap pemrosesan teks masukan (input) yang dibagi menjadi unit-unit kecil (token atau term) dapat berupa suatu kata

atau angka disebut sebagai tokenisasi.

Stopwords adalah daftar kata yang dianggap tidak memiliki makna yaitu kata yang sering muncul di setiap dokumen dan tidak bisa dijadikan sebagai penciri suatu dokumen, lalu daftar kata tersebut dibuang dan tidak diikut sertakan pada tahap selanjutnya. Pembagian Data

Dokumen etnofitomedika yang telah melewati tahap praproses dibagi menjadi dua, yaitu data latih dan data uji. Pembagian

data tersebut menggunakan metode K-fold cross validation dengan K=2. Data latih digunakan sebagai input pelatihan dalam pengklasifikasian Naive Bayes dan data uji digunakan untuk menguji model hasil pelatihan Naive Bayes.

Pemilihan Fitur

Menurut Manning (2008), pemilihan fitur memilik dua tujuan, yaitu mengurangi jumlah kata yang digunakan dan meningkatkan akurasi hasil klasifikasi. Pemilihan fitur dilakukan pada vector term hasil dari tahap praproses dengan menggunakan metode uji chi-kuadrat, lalu fitur tersebut digunakan pada tahap klasifikasi dokumen. Teknik chi-kuadrat memilih fitur berpengaruh dengan menghitung nilai antara kata dengan kelas yang dinyatakan dalam Persamaan 1.

Pemilihan fitur dilakukan pada dua tingkat signifikansi, yaitu 0,01 dan 0,001. Kata yang terpilih pada tingkat signifikansi α=0,01 adalah kata yang memiliki nilai diatas nilai kritis 6,63, sedangkan kata yang terpilih pada tingkat signifikansi α=0,001 adalah kata yang memiliki nilai di atas nilai kritis 10,83. Fitur yang dihasilkan pada tahap ini akan

digunakan untuk membuat vector space

model. Model terdiri atas beberapa dokumen yang direpresentasikan sebagai vektor dari frekuensi kemunculan fitur.

KlasifikasiNaive Bayes

Ada 11 famili hasil klasifikasi

dokumen, yaitu:

1: Menispremaeceae 7: Apiaceae

2: Lamiaceae 8: Crassulaceae

3: Euphorbiaceae 9: Myrtaceae

4: Rutaceae 10: Araliaceae

5: Dioscoreaceae 11: Acanthaceae

6: Malvaceae

Pada Tabel 5 dijelaskan tentang distribusi dokumen pada kategori kelas famili. Hasil matriks kata pada vector space model yang dihasilkan pada pemilihan fitur digunakan untuk menglasifikasikan dokumen baru. Tahap awal yang dilakukan yaitu dengan menghitung peluang kata terhadap dokumen latih yang dicerminkan oleh suatu kelas. Nilai peluang kata yang diperoleh digunakan untuk

melakukan perhitungan Naive Bayes pada

(15)

7

dokumen uji. Dokumen yang ditampilkan diurutkan berdasarkan ranking dari tiap dokumen.

Tabel 5 Distribusi dokumen famili

No Kelas Jumlah

Dokumen

1 Menispremaeceae 12

2 Lamiaceae 26

Evaluasi dilakukan pada model

klasifikasi. Evaluasi terhadap kinerja model

penglasifikasi Naive Bayes dilakukan

dengan menghitung persentase ketepatan suatu dokumen etnofitomedika masuk ke dalam kelas tertentu. Evaluasi untuk model

penglasifikasi Naive Bayes dinyatakan

dalam bentuk confusion matrix. Perhitungan nilai akurasi terhadap model klasifikasi diperoleh melalui Persamaan 5.

Lingkungan Pengembangan Sistem

Penelitian ini menggunakan perangkat

lunak dan perangkat keras dengan

spesifikasi adalah sebagai berikut:

a. Perangkat lunak yang digunakan pada

penelitian ini adalah Sistem operasi Microsoft Windows 7, Notepad++

sebagai code editor, Server XAMPP,

Perangkat lunak MySQL untuk

database, Web Browser (melalui Local Area Connection): Mozilla Firefox dan Google Chrome

b. Perangkat keras yang digunakan pada

penelitian ini adalah Intel Core i3 @2.2

Ghz ,Memory 2GB RAM, harddisk

dengan kapasitas sisa 500GB, mouse

dan keyboard.

HASIL DAN PEMBAHASAN

Dokumen Etnofitomedika

Penelitian ini menggunakan 170

dokumen etnofitomedika yang mencangkup 18 jenis tumbuhan obat, dapat dilihat pada Lampiran 1. Dokumen tersebut terbagi menjadi dua jenis data yaitu data latih dan

data uji. Pembagian data dengan

menggunakan perbandingan 70 : 30

menghasilkan 117 data latih dan 53 data uji. Praproses Data

Praproses data menghasilkan daftar term yang sudah melewati tahap tokenisasi

dan pembuangan stopwords. Jumlah

stopwords sebanyak adalah 662 kata.Kata atau term akhir yang dihasilkan dari tahap praproses berjumlah 12.137 untuk data latih famili.

Pemilihan Fitur

Vektor kata unik yang telah dihasilkan dari tahap praproses kemudian diproses pada tahap pemilihan fitur dengan menggunakan

metode Chi-Kuadrat. Pemilihan fitur

dilakukan pada dua nilai signifikansi (Tabel 2), yaitu nilai signifikansi 0,01 dan 0,001. Berdasarkan teori terpenuhinya hipotesis, nilai signifikansi 0,01 diartikan sebagai kriteria kata yang dipilih adalah kata yang memiliki nilai χ2 diatas 6,63 dan nilai signifikansi 0,001 dapat diartikan bahwa kriteria kata yang dipilih adalah kata yang

memiliki nilai χ2 diatas 10,83. Tahap

pemilihan fitur menghasilkan 1.143 kata penciri untuk signifikansi 0,01dan 865 kata peciri untuk signifikansi 0,001. Kumpulan kata yang dihasilkan pada tahapan pemilihan fitur inilah yang kemudian akan diolah pada sistem klasifikasi.

Evaluasi Kinerja Sistem Klasifikasi

Pengelompokkan atau pengklasifikasian dokumen dilakukan pada kelas famili.Kelas tersebut dapat diidentifikasikan melalui

informasi yang memuat ciri atau

karakteristik dari suatu tumbuhan obat pada tiap dokumen. Akurasi yang dihasilkan pada klasifikasi dokumen dengan menggunakan nilai signifikansi 0,001 adalah 77,35%. Analisis Dokumen

(16)

8

baik, sehingga hasil klasifikasi dokumen tersebut bernilai 100%. Hal itu disebabkan oleh informasi yang terdapat pada tiap dokumen mengandung ciri atau karakteristik

famili Apiacae. Perbandingan antara

informasi ciri atau karakteristik yang

terkandung dalam dokumen dengan

informasi pada buku panduan mengenai ciri atau karakteristik famili tersebut disajikan pada Lampiran 4.

Jumlah dokumen yang benar dalam pengklasifikasian kelas famili dapat dilihat pada Gambar 3.

Gambar 3 Grafik hasil klasifikasi dokumen etnofitomedika

Pada kelas Acanthaceae, Araliaceae, dan Menispermaceae jumlah dokumen yang benar dalam pengklasifikasian kelas tersebut adalah 0. Kelas Acanthaceae bernilai 0 disebabkan oleh informasi yang terdapat pada dokumen tersebut memiliki beberapa kesamaan ciri pada dokumen yang memuat kelas Lamiaceae dan Myrtaceae, kelas Araliaceae bernilai 0 disebabkan oleh sedikitnya jumlah dokumen latih dan dokumen uji sehingga kurangnya fitur yang merepresentasikan kelas Araliacea, dan kelas Menispermaceae bernilai 0 disebabkan oleh informasi yang terdapat pada tumbuhan Arcangelisia flava L. memiliki beberapa kesamaan ciri dengan tumbuhan yang berada di kelas Apiaceae dan Euphorbiaceae.

Kesalahan pelabelan pada kelas famili disebabkan oleh informasi yang terdapat pada dokumen etnofitomedika tersebut, salah satunya adalah tumbuhan Jambu Biji yang memiliki kelas famili Myrtaceae.Pada sistem identifikasi, tumbuhan Jambu Biji masuk kedalam kelas Rutaceae. Hal tersebut

disebabkan oleh kemiripan ciri atau

karakteristik yang yang dimiliki oleh kelas famili Myrtaceae dan kelas famili Rutaceae. Persamaan ciri dari kedua famili tersebut dapat dilihat pada Tabel 6.

Tabel 6 Persamaan ciri pada famili Rutaceae dan Myrtacea

Kemiripan yang terdapat pada dokumen tersebut menyebabkan kesalahan dalam pelabelan pada kategori kelas family. Pada Tabel 1 telah dipaparkan contoh kategori

dan golongan tumbuhan. Pada buku

taksonomi tumbuhan obat-obatan (Gembong 1994), ada lima divisi pada tumbuhan obat yaitu divisi Schizophyta (tumbuhan belah), divisi Thallophyta (tumbuhan talus) yang mempunyai tiga anak divisi yaitu Algae (ganggang), Fungi (jamur, cendawan), dan Lichenes (lumut kulit), divisi Bryophyta (lumut), divisi Pteridophyta, dan divisi

Spematophyta yang mempunyai tiga

anakdivisi yaitu Coniferospermae,

Chlamydospermae, dan Angiospermae.

Ordo dari famili Rutaceae adalah Rutales dan ordo dari Myrtaceae adalah Myrtales.

Kedua ordo tersebut termasuk kedalam Dialypetaleae yang merupakan anak kelas

dari Dicotyledoneacea (tumbuhan biji

belah). Dicotyledoneacea adalah salah satu 1 2 3 4 5 6 7 8 9 10 11

Kategori Famili

1 Acanthaceae 2 Apiaceae

(17)

9

kelas dari Angiospermae yang merupakan anak divisi dari Spematophyta. Ciri dari Dialypetaleae yaitu adanya hiasan bunga yang ganda. Hiasan bunga tersebut terdiri atas kelopak dan mahkota, yang daun-daunnya saling bebas.Kedua ordo memiliki ciri atau karakteristik umum yang hampir sama yang disajikan pada Tabel 7.

Tabel 7 Ciri atau karakteristik ordo Rutales dan Myrtales (Tjitrosoepomo 1994)

Rutales Myrtales

2 Daun tunggal 2 Daun majemuk

3 Mempunyai

Begitu pula dengan ciri atau karakteristik dari famili Rutaceae dan Myrtaceae, kedua

famili tersebut memiliki beberapa

kemiripan. Kemiripan ciri atau karakteristik yang dimiliki menyebabkan kedua famili tersebut berada dalam satu jenjang takson yang sama. Kedua ordo masuk kedalam

Waktu eksekusi pada proses klasifikasi dipengaruhi oleh pemilihan nilai signifikansi taraf nyata (α). Perbandingan waktu rataan kinerja dalam pemilihan fitur disajikan pada Gambar 4.

Gambar 4 Grafik kinerja rataan pemilihan fitur

Pada grafik tersebut dapat disimpulkan bahwa semakin besar nilai taraf nyata (α) yang dipilih, maka semakin banyak kata atau

term penciri yang dihasilkan sehingga

semakin informatif tetapi waktu eksekusi yang dibutuhkan dalam proses klasifikasi atau pelabelan dokumen semakin banyak. Pada penelitian ini, proses klasifikasi untuk fitur dengan nilai signifikansi α=0,01 membutuhkan waktu yang lebih lama

dibandingkan dengan fitur yang

menggunakan nilai signifikansi α=0,001. Hal tersebut disebabkan karena jumlah kata atau term penciri yang dihasilkan oleh α=0,01 lebih banyak yaitu 1.1432 kata penciri dibandingkan dengan jumlah kata penciri yang dihasilkan oleh α=0,001 yang berjumlah 865 kata peciri. Jumlah kata atau term penciri akan sangat berpengaruh pada saat penghitungan nilai similaritas antara

dokumen uji dengan dokumen latih.

(18)

10

Gambar 5 Alur taksonomi famili Rutacea dan famili Myrtaceae

Evaluasi K-fold cross validation

Pada penelitian ini peneliti mencoba menggunakan model evaluasi menggunakan cross validation dengan metode K-fold atau disebut K-fold cross validation. K-fold cross validation bertujuan untuk menentukan sample yang terbaik.Nilai K yang digunakan yaitu dua (K=2). Hasil akurasi yang dihasilkan dapat dilihat pada Tabel 8.

Tabel 8 Hasil akurasi menggunakan k-fold

Nilai K Nilai Akurasi

K = 1 75,9%

K = 2 85,5%

Iterasi 1menghasilkan nilai akurasi

sebesar 75,9% dan iterasi dua menghasilkan nilai akurasi sebesar 85,5%. Oleh sebab itu, jika dilihat dari kedua nilai akurasi pada tiap iterasi maka sample dokumen yang dipilih adalah sample dokumen pada iterasi dua.

Nilai akurasi menggunakan K-fold cross

validation lebih tinggi dibandingkan dengan

nilai akurasi sebelum menggunkan

K-foldcross validation, hal ini disebabkan karena pada K-fold setiap data berperan sebagai data latih. Dari hasil yang sudah ada, maka akurasi sistem klasifikasi pada penelitian ini bernilai 85,5% dan pembagian data yang dipilih digunakan untuk mengidentifikasi famili secara otomatis sesuai dengan ilmu taksonomi tumbuhan.

 Akurasi kinerja sistem klasifikasi

pada kategori famili adalah sebesar 85,5% dengan menggunakan metode K-fold cross validation dalam pembagian datanya.

Saran

Hal yang perlu dikembangkan dalam penelitian ini adalah menambah jumlah korpus etnofitomedika.

DAFTAR PUSTAKA

Damayanti EK. 2010. Etnofitomedika. Bogor

(ID): Fakultas Kehutanan, Institut

Pertanian Bogor.

Damayanti EK, Hikmat A, Zuhud EAM. 2011. Indonesian tropical medicinal plants diversity: problems and challenges in

identification. Di dalam: 2011

(19)

11

Technology to Enhance Sustainable Utilization of Indonesian Tropical Medicinal Plants; Bogor, 11 Agu 2011. Bogor (ID): Institut Pertanian Bogor.

Han J, Kamber M. 2006. Data Mining:

Concepts and Techniques. San Francisco (US-CA): Morgan Kaufmann.

Herawan Y. 2011. Ekstraksi ciri dokumen tumbuhan obat menggunakan chi-kuadrat dengan klasifikasi naive Bayes [skripsi]. Bogor (ID): Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Manning CD, Raghavan P, Schütze H. 2009. An Introduction to Information Retrieval. Cambridge (UK): Cambridge University Press.

McCalum A, Nigam K. 1998. A comparison of event models for naïve Bayes text

classification. Di dalam: AAAI-98

Workshop on Learning for Text Categorization; Madison (US-WI), 27 Jul 1998. hlm 41-48.

Paskianti K. 2011. Klasifikasi dokumen tumbuhan obat menggunakan algoritme fuzzy KNN [skripsi]. Bogor (ID): Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor

Sangat HM, Zuhud EAM, Damayanti EK.

2000. Kamus Penyakit dan Tumbuhan

Obat Indonesia (Etnofitomedika). Jakarta (ID): Pustaka Populer Obor.

Tjitrosoepomo G. 1994. Taksonomi

Tumbuhan Obat-Obatan. Yogyakarta (ID): Gadjah Mada University Press. Zuhud EAM. 2009. Potensi hutan tropika

Indonesia sebagai penyangga bahan obat

alam untuk kesehatan bangsa. Jurnal

(20)

(21)

13

Lampiran 1 Daftar jenis tumbuhan obat Indonesia yang digunakan dalam penelitian

No NamaLatin Nama Etnis

1 Arcangelisia flava L.

Akar Kuning , Akar Kunyit

Talang Mamak, Ambon, Atoni, Anak Dalam (Orang Rimbo) AkarTigaTali,

Sokondo Urat Melayu Tradisional

Peron Sunda

MongkoLawak Saluan

Merkunyit Kutai

2 Ocimum basilicum Selasih Kutai, Samawa, Sunda

Sorawung Sunda

Telasih DayakTunjung

3 Coleusscutellarioides Linn, Benth

Serikati Rejang

Jawer Kotok Sunda

4 Orthosiphon aristatus (B1) Miq.

Kumis Kucing

Sakai, Melayu Tradisional, Ambon, Bolaangmongondow, Dayak, Bali, Jawa

Remujung Jawa

5 Jatropha curcas L.

Nawah Aceh

Jarak kandang Rejang

Jarak kosta Sunda

Jarak pagar Sunda

Kaliki Sunda

Damar Putih Atoni, Sumba

Belacai Saluan

Jarak Samawa,Bali, Madura

6 Citrus aurantifolia Swingle

Kuyun Padi Aceh

Lemon Nipis Ambon, Madura, Jawa

LimoAsam Atoni

Jeruk Lawar Samawa

Jeruk Nipis Jawa, Sunda, Melayu

Tradisional 7 Dioscorea hispida Dennst. Gadung Bali, Sunda

8 Urenalobata L

Pulut-pulut Melayu Tradisional

Pupuli Sakai

Pulutan Jawa

Apupuliut Mentawai

Celopai DayakTunjung

(22)

14

Pungpurutan Sunda

9 Centellaasiatica (Linn) Urban.

Pegagan Ambon, Melayu,

Madura, Jawa

Daun kaki kuda Ambon,

Bolaangmongondow

Antanan Rambat Sunda

Antanan Sunda

Ki Antanan Sunda

Kuku Kuda Menado

Pinduk, TapalKuda Bali

10 Kalanchoepinnata (Lam.)Pers

Sedingin Anak Dalam (Orang

Rimbo),TalangMamak

Bangun Muku Menado

Buntiris Sunda

CocorBebek Bolaangmongondow,

Punan Lisum, Bali

Buntianak Atoni

Dan Surga Kutai

Sedingin Anak Dalam(Orang

Rimbo)

Tumbuh Daun DayakKedayan

11 Psidium guajavaL.

Gelimah Aceh

JambuBatu Sunda, Sakai

JambuBiji Bali, Rejang,Menado,

Bolaangmongondow

Jambu Sunda

Jambu Klutuk Madura, Kutai

Kujawas Antoni

Kuncek DayakTunjung

12 Nothopanax scutellarium Merr

Mangkok Bali

Dadap Dayak Nganjuk

13 Clinacanthus nutans Lindau Kitajam Sunda

14 Acanthus ilicifoliusL Jaruju Sunda

15 Graptophyllumpictum Griffith

Puding Aceh

Susok Fatima Talang Mamak

Puding Hitam Melayu Tradisional

Hembalang Rejang

(23)

15

Handeuleum Sunda

Temen Bali

Wungu Jawa

16 Odiaeumveriegatum L. Kereta Emas Kutai

17 Coleusatropurpureus Benth

DaunMayana Ambon

Miana Bali

Jawer Kotok Sunda

18 Murraya paniculata [L.] Jack

Kemuning Bali

Kamuning Suda

(24)

16

Lampiran 2 Tabel distribusi chi-kuadrat pada berbagai tingkat signifikansi dan derajat bebas tertentu

d.f

1 1.32 2.71 3.84 5.02 6.63 7.88 10.8

2 2.77 4.61 5.99 7.38 9.21 10.6 13.8

3 4.11 6.25 7.81 9.35 11.3 12.8 16.3

4 5.39 7.78 9.49 11.1 13.3 14.9 18.5

5 6.63 9.24 11.1 12.8 15.1 16.7 20.5

6 7.84 10.6 12.6 14.5 16.8 18.5 22.5

7 9.04 12 14.1 16 18.5 20.3 24.3

8 10.2 13.4 15.5 17.5 20.1 22 26.1

9 11.4 14.7 16.9 19 21.7 23.6 27.9

10 12.5 16 18.3 20.5 23.2 25.2 29.6

11 13.7 17.3 19.7 21.9 24.7 26.8 31.3

12 14.8 18.5 21 23.3 26.2 28.3 32.9

13 16 19.8 22.4 24.7 27.7 29.8 34.5

14 17.1 21.1 23.7 26.1 29.1 31.3 36.1

15 18.2 22.3 25 27.5 30.6 32.8 37.7

16 19.4 23.5 26.3 28.8 32 34.3 39.3

17 20.5 24.8 27.6 30.2 33.4 35.7 40.8

18 21.6 26 28.9 31.5 34.8 37.2 42.3

19 22.7 27.2 30.1 32.9 36.2 38.6 32.8

20 23.8 28.4 31.4 34.2 37.6 40 45.3

21 24.9 29.6 32.7 35.5 38.9 41.4 46.8

22 26 30.8 33.9 36.8 40.3 42.8 48.3

23 27.1 32 35.2 38.1 41.6 44.2 49.7

24 28.2 33.2 36.4 39.4 32 45.6 51.2

25 29.3 34.4 37.7 40.6 44.3 46.9 52.6

26 30.4 35.6 38.9 42.9 45.6 48.3 54.1

27 31.5 36.7 40.1 43.2 47 49.6 55.5

28 32.6 37.9 41.3 44.5 48.3 51 56.9

29 33.7 39.1 42.6 45.7 49.6 52.3 58.3

30 34.8 40.3 43.8 47 50.9 53.7 59.7

40 45.6 51.8 55.8 59.3 63.7 66.8 73.4

50 56.3 63.2 67.5 71.4 76.2 79.5 86.7

60 67 74.4 79.1 83.3 88.4 92 99.6

70 77.6 85.5 90.5 95 100 104 112

80 88.1 96.6 102 107 112 116 125

80 98.6 108 113 118 124 128 137

100 109 118 124 130 136 140 149

Sumber: RonaldJ.Wonnacoltand Thomas H. Wonnacot.

(25)

17

Lampiran 3 Confusionmatrix untuk kelas family pada nilai signifikansi 0.001

Nama Famili

A B C D E F G H I J K

A 7

B 3 1

C 5 3

D 7

E 3

F 5

G 8

H 5

I

J 1

K 1

: Famili yang tidak terindentifikasi.

Keterangan :

A =Euphorbiaceae B = Menispermaceae C = Rutaceae D =Apiaceae E =malvaceae F =Crassulaceae G = Lamiaceae H = Myrtaceae I = Acanthaceae

J =Dioscoreaceae

(26)

18

Lampiran 4 Perbandingan antara dokumen dengan buku panduan

No Dokumen Buku Panduan (Tjitrosoepomo 1994)

1 Terna liar Terna berumur pendek atau panjang.

2

Akar keluar dari setiap bonggol, banyak bercabang yang membentuk tumbuhan baru

Bunya majemuk berupa bunga paying atau bunga paying bersusun (kapitulum).

3

Berada di Asia Tropis. terna menahun tanpa batang, tetapi dengan rimpang pendek dan stolon-stolon yang merayap dengan panjang 1-80 cm

Berada di daerah tropic, di Jawa terutama di bagian barat dari dataran rendah sampai 2500 m antara lai, tempat-tempat yang basah dan

mendapatkan cukup sinar atau sedikit

keteduhan.

4

Kadang-kadang ditanam sebagai penutup tanah di perkebunan atau sebagai tanaman sayuran (sebagai lalap), terdapat sampai ketinggian 2.500 meter di atas permukaan laut.

Daun tersebar, berseling atau berhadapan, majemuk ganda atau banyak berbagi. Tanpa daun penumpu. Mempunyai pelepah yang besar dan pipih yang disebut perikladium dan tidak membalut batang.

5

Menyukai tanah yang agak lembap dan cukup mendapat sinar matahari atau teduh, seperti di padang rumput, pinggir selokan, sawah, dan sebagainya.

Batang berongga sebelah dalam dan beralur atau bergerigi membujur pada permukaannya.

6

Helai daun tunggal, berbentuk ginjal. Tepinya bergerigi atau beringgit, dengan penampang 1 -7 cm tersusun dalam roset yang terdiri atas 2-10 helai daun, kadang-kadang agak berambut.

Bunga kecil, kebanyakan banci, aktinomorf atau sedikit zigomorf, berbilang 5. Kelopak seringkali amat kecil, daun mahkota 5 dengan ujungnya yang melengkung kedalam berwarna kuning atau keputih-putihan, jarang merah jambu atau lembayung.

7

Bunga berwarna putih atau merah muda, tersusun dalam karangan berupa payung, tunggal atau 3-5 bersama-sama keluar dari ketiak daun.