• Tidak ada hasil yang ditemukan

Data yang digunakan pada penelitian ini diperoleh dari PUSAT STUDI BIOFARMAKA IPB yang berisi 1133 records jenis tanaman obat yang dimanfaatkan oleh industri obat tradisional di Indonesia. Contoh data dapat dilihat pada Tabel 1. Data yang diperoleh menggunakan merupakan teks dalam bahasa

Tabel 1 Contoh data yang diperoleh id_herb herb_ name herb_ name _ id herb_ name _en Scien-ce_ name

position effect Referen-ce S0746 Pandanus conoideus Fructus Buah Merah Red Pandan Pandanus conoideus Lamk Fruit - S0001 Abelmoschus moschatus Folium Waron musk-mallo w, musk okra Abelmos-chus moscha-tus Medik Leaf Leaf : cough medicine. Seed : cosmetic raw materials. Center of research

12

Inggris, sehingga penelitian ini menggunakan bahasa Inggris dalam proses pengolahan data dan pengembangan sistem. Atribut dari data yang diperoleh ialah sebagai berikut :

 Id tanaman obat dengan nama field id_herb

 Nama ilmiah dari tanaman obat ditambah satu kata yang menyatakan nama ilmiah dari bagian tanaman yang berkhasiat dengan nama field herb_name

 Nama tanaman obat dalam bahasa Indonesia dengan nama field herb_name_id

 Nama tanaman obat dalam bahasa Inggris dengan nama field herb_name_en

 Nama ilmiah tanaman obat dengan nama field science_name

 Bagian tanaman obat yang memiliki khasiat dengan nama field position

 Daftar khasiat yang dimiliki tanaman obat dengan nama field effect

 Sumber informasi mengenai tanaman obat tersebut dengan nama field reference.

Terdapat kesalahan-kesalahan dari data yang diperoleh, antara lain terdapat tanaman obat yang tidak disebutkan khasiatnya atau atribut effect bernilai “-“, sehingga dilakukan pembersihan data berupa penghapusan records tanaman obat. Dari 1133 records tanaman obat terdapat 42 records (3.71%) yang tidak disebutkan khasiatnya. Pembersihan data menghasilkan data yang lengkap tanpa terdapat atribut effect yang bernilai “-“.

Selain itu, terdapat atribut effect yang masih berisi daftar khasiat dari setiap bagian tanaman yang mengandung khasiat, sedangkan id dari tanaman obat pada setiap record sudah berdasarkan pada atribut herb_name. Oleh sebab itu, perlu dilakukan proses penghapusan pada sebagian isi dari atribut effect yang dianggap tidak sesuai dengan nilai atribut position pada records tersebut. Proses tersebut dilakukan pada tahap data transformation.

Data Transformation Pengumpulan Data yang Akan Diindeks

Pengumpulan data yang akan diindeks merupakan tahap yang dilakukan pada atribut effect dari 1091 records tanaman obat hasil pembersihan data. Tahap ini diawali dengan tokenisasi kalimat pada atribut effect. Nilai atribut effect yang terdapat dalam data mentah masih berupa daftar bagian tanaman dan khasiat yang dimiliki tanaman obat per bagian. Daftar antarbagian tanaman dan khasiatnya tersebut dipisahkan dengan tanda “.”, sehingga dilakukan tokenisasi kalimat pada atribut effect. Setiap kali bertemu dengan tanda “.”, maka akan terbentuk record

id_herb herb_name position herb_name_en effect S0001 Abelmoschus mochatus Folium Leaf musk-mallow, musk okra Leaf : cough medicine. S0001 Abelmoschus mochatus Folium Leaf musk-mallow, musk okra

Seed : cosmetic raw materials.

13

baru yang memisahkan kalimat pada atribut effect. Setelah dilakukan pemisahan kalimat pada atribut effect, data yang dihasilkan berjumlah 1356 records. Contoh data hasil proses tokenisasi kalimat pada atribut effect dapat dilihat pada Tabel 2.

Selanjutnya, dilakukan tokenisasi kata bagian tanaman pada atribut khasiat. Pemisahan bagian tanaman dengan khasiatnya dilakukan dengan menggunakan token berupa tanda “:”. Hal ini dilakukan sebab setiap records menunjukkan bahwa atribut effect terdiri atas bagian tanaman yang berkhasiat kemudian dilanjutkan tanda “:” sebagai pemisah dengan khasiat dari bagian tanaman obat tersebut. Kata-kata yang berada sebelum titik dua akan disimpan pada kolom terpisah dengan khasiat, yakni pada kolom part_of_plant, sedangkan kata-kata yang berada setelah tanda “:” akan tetap berada pada kolom effect. Contoh data hasil dari proses tokenisasi kata bagian tanaman pada atribut effect dapat dilihat pada Tabel 3.

Kemudian, dilakukan tahap pencocokan field part_of_plant dengan position. Jika nilai kedua field tersebut sama, record tanaman obat tersebut dipertahankan. Di samping itu, jika nilai kedua field tersebut berbeda, record tanaman obat tersebut akan dihapus. Berdasarkan data hasil proses tersebut, atribut position terdiri atas 17 nilai yang berbeda, namun atribut part_of_plant terdiri atas 76 nilai yang berbeda. Oleh sebab itu, dilakukan pembuatan thesaurus untuk mencari nilai atribut part_of_plant yang memiliki makna sama dengan nilai atribut position pada record yang sama. Hal ini dilakukan sebab terdapat kemungkinan bahwa kata yang terdapat pada nilai atribut part_of_plant merupakan persamaan kata dari nilai position. Thesaurus yang dihasilkan pada proses tersebut ditunjukkan pada Lampiran 1.

Proses berikutnya ialah penerapan thesaurus pada pencocokan nilai atribut part_of_plant dengan atribut position. Jika kata pada atribut part_of_plant terdapat dalam thesaurus nilai atribut position tersebut, record tersebut akan dipertahankan. Namun, jika tidak terdapat dalam thesaurus, dilakukan penghapusan terhadap record tanaman obat tersebut. Contoh data sebelum proses pencocokan kedua field dengan thesaurus dapat dilihat pada Tabel 4.

Pada Tabel 4, record pertama menunjukkan atribut position bernilai “Leaf”, sedangkan part_of_plant bernilai “Leaf” juga. Oleh sebab itu, record pertama dipertahankan. Di samping itu, record kedua menunjukkan atribut position bernilai “Leaf”, sedangkan atribut part_of_plant bernilai Seed”. Kata “Seed” tidak terdapat dalam thesaurus kata “Leaf”, sehingga dilakukan penghapusan terhadap record tersebut. Jumlah data yang diperoleh dari proses pencocokan

id_herb herb_name position herb_name_ en part_of _plant effect S0001 Abelmoschus mochatus Folium Leaf musk-mallow, musk okra Leaf cough medicine S0001 Abelmoschus mochatus Folium Leaf musk-mallow, musk okra

Seed cosmetic raw materials Tabel 3 Contoh data hasil tokenisasi bagian tanaman pada atribut effect

14

kedua field dengan thesaurus ini ialah 949 records tanaman obat. Contoh data hasil proses tersebut dapat dilihat pada Tabel 5.

Data hasil proses tersebut merupakan data yang akan diindeks pada proses pembuatan inverted index berikutnya. Khasiat yang terdapat dalam database merupakan gabungan kata yang mengandung arti atau biasa disebut frasa, sehingga tokenisasi akan dilakukan dalam bentuk frasa khasiat.

Tokenisasi Frasa Khasiat

Tahap pembuatan inverted index yang kedua ialah tokenisasi khasiat per frasa. Token yang digunakan pada tahap ini ialah “,;/\(){}[]<>”. Tokenisasi frasa khasiat ini menghasilkan 3923 records tanaman obat. Contoh data sebelum tokenisasi frasa khasiat ini dapat dilihat pada Tabel 6, sedangkan contoh data setelah tokenisasi frasa khasiat dilakukan dapat dilihat pada Tabel 7.

Tabel 4 Contoh data sebelum pencocokan field part_of_plant dengan thesaurus dari field position

id_herb herb_name position herb_name_ en part_of _plant effect S0001 Abelmoschus mochatus Folium Leaf musk-mallow, musk okra Leaf cough medicine S0001 Abelmoschus mochatus Folium Leaf musk-mallow, musk okra

Seed cosmetic raw materials S00974 Smilax

zeylanica Tubera

Tuber kepuh Roots Rheumatic

drugs, gonorrhea, dysentery

Tabel 5 Contoh data setelah pencocokan field part_of_plant dengan thesaurus dari field position

id_herb herb_name position herb_name_ en part_of _plant effect S0001 Abelmoschus mochatus Folium Leaf musk-mallow, musk okra Leaf cough medicine S00974 Smilax zeylanica Tubera

Tuber kepuh Roots Rheumatic

drugs, gonorrhea, dysentery

15

Tahap tokenisasi frasa khasiat ini kemudian dilanjutkan dengan pembuatan posting list dari frasa khasiat. Pada tahap ini dilakukan penambahan atribut berupa id khasiat untuk membuat frasa khasiat menjadi atribut yang unik. Tahap ini menghasilkan data yang menunjukkan suatu frasa khasiat dan daftar tanaman obat yang memiliki frasa khasiat tersebut.

Data yang dihasilkan dari pembuatan posting list frasa khasiat masih berjumlah 3923 records tanaman obat, sebab tidak ada pengulangan frasa khasiat yang sama di dalam suatu record tanaman obat. Contoh posting list yang terbentuk dapat dilihat pada Tabel 8. Contoh data tersebut menunjukkan bahwa frasa khasiat “rheumatic drugs” dimiliki oleh tanaman obat dengan id S00974, S00010 dan S00028, sedangkan “dysentery” dimiliki oleh tanaman obat dengan id S00974 dan S00989.

Tabel 6 Contoh data sebelum tokenisasi frasa khasiat id_herb herb_name position herb_name_

en part_of _plant effect S00974 Smilax zeylanica Tubera

Tuber kepuh Roots Rheumatic

drugs, gonorrhea, dysentery Tabel 7 Contoh data setelah tokenisasi frasa khasiat

id_herb herb_name position herb_name_ en part_of _plant effect S00974 Smilax zeylanica Tubera

Tuber kepuh Roots Rheumatic

drugs S00974 Smilax

zeylanica Tubera

Tuber kepuh Roots gonorrhea

S00974 Smilax zeylanica Tubera

Tuber kepuh Roots dysentery

Tabel 8 Contoh data hasil pembuatan posting list frasa khasiat

id_effect effect id_herb

K0001 rheumatic drugs S00974

K0001 rheumatic drugs S00010

K0001 rheumatic drugs S00028

K0002 dysentery S00974

16

Modifikasi Token

Tahap modifikasi token terbagi ke dalam dua proses yaitu pembuatan stoplist dan penghapusan stopwords pada atribut effect, serta penanganan kesalahan pengetikan nilai pada atribut effect. Hal ini dilakukan untuk meminimalkan kesalahan dalam pencarian keterhubungan antarkhasiat akibat kesalahan pengetikan yang menimbulkan perbedaan makna khasiat.

1 Pembuatan stoplist

Pembuatan stoplist pada atribut effect dimulai dengan langkah tokenisasi kata pada atribut effect dengan token berupa spasi (“ “), koma (“,”), titik koma (“;”), titik dua (“:”), dan tanda kurung (“( )”). Tahap ini menghasilkan 9593 kata. Kemudian, seluruh kata diubah ke dalam lower case untuk mempermudah praproses data. Contoh data hasil tokenisasi kata di atribut effect ini dapat dilihat pada Tabel 9. Kemudian, dilakukan indexing kata pada atribut effect dan menghasilkan 1251 daftar kata berbeda yang berada di dalam atribut effect. Contoh data hasil indexing ini dapat dilihat pada Tabel 10.

Selanjutnya, dilakukan perhitungan frekuensi kata di seluruh records dalam database, sehingga dapat diketahui bahwa terdapat 5 kata dengan frekuensi tertinggi yang merupakan kata konjungsi, antara lain and, of, the, in, dan with. Kata-kata konjungsi tersebut merupakan kata yang dimasukkan ke dalam stoplist.

Tabel 9 Contoh data hasil tokenisasi kata di atribut effect

effect id_herb rheumatic S00974 drugs S00974 rheumatic S00010 drugs S00010 rheumatic S00028 drugs S00028 dysentery S00974 dysentery S00989

Tabel 10 Contoh data hasil indexing khasiat per kata

effect id_herb

rheumatic S00974, S00010, S00028

drugs S00974, S00010, S00028

dysentery S00974, S00989

Tabel 11 Contoh data hasil perhitungan frekuensi kata

effect id_herb frekuensi

rheumatic S00974, S00010, S00028 3

drugs S00974, S00010, S00028 3

17 Kemudian, kata-kata yang memiliki jumlah huruf kurang dari 3 dimasukkan pula ke dalam stoplist. Contoh data hasil perhitungan frekuensi kata ini dapat dilihat pada Tabel 11.

Selain itu, dilakukan pemeriksaan hasil token kata dengan kamus kedokteran Medline. Hal ini dilakukan sebab tidak ditemukan pola struktur bahasa yang dapat menentukan hasil token tersebut benar merupakan istilah penyakit atau bukan. Kata-kata yang tidak terdapat pada kamus Medline dianggap sebagai stopwords dan dimasukan ke dalam stoplist.

Kemudian, kata yang berarti obat seperti medicine dan drug serta kata-kata yang berarti penyakit seperti illness dan disease juga dimasukkan ke dalam stoplist, sebab ada atau tidaknya kata-kata tersebut tidak mengurangi maksud dari khasiat tanaman obat tersebut.

Oleh sebab itu, kata-kata yang masuk ke dalam stoplist terdiri atas kata konjungsi (kata penghubung), kata dengan jumlah huruf maksimal tiga, kata yang berarti obat (medicine, drug), kata yang berarti penyakit (illness, disease), dan kata-kata yang tidak terdapat pada Medline dictionary (kamus kedokteran). Kemudian, dihasilkan 358 kata yang dijadikan sebagai stopwords dan dimasukkan ke dalam stoplist. Stoplist tersebut dibuat dalam fail dengan format TXT.

2 Penghapusan stopwords dalam frasa khasiat

Setelah tahap pembuatan stoplist selesai, dilakukan proses penghapusan stopwords dari 3923 records frasa khasiat yang dihasilkan dari tahap tokenisasi frasa khasiat. Contoh data sebelum proses penghapusan stopwords ditunjukkan pada Tabel 12, sedangkan contoh data setelah proses penghapusan stopwords ditunjukkan pada Tabel 13. Proses ini akan menghasilkan frasa khasiat tanpa terdapat stopwords di dalamnya, namun menimbulkan nilai NULL pada atribut effect atau data menjadi tidak lengkap. Oleh sebab itu, dilakukan penghapusan

Tabel 12 Contoh data sebelum penghapusan stopwords

id_effect effect id_herb

K0001 rheumatic drugs S00974 K0001 rheumatic drugs S00010 K0002 dysentery S00974 K0005 cough medicine S00001 K0007 impairment of yin S00898 K0010 AP S00888

Tabel 13 Proses penghapusan stopwords

id_effect effect id_herb

K0001 rheumatic S00974 K0001 rheumatic S00010 K0002 dysentery S00974 K0005 cough S00001 K0007 - S00898 K0010 - S00888

18

records terhadap 452 records (11.52 %) yang memiliki nilai NULL pada atribut effect. Hasil dari tahap ini menghasilkan 3471 records dengan nilai atribut effect hanya berupa satu frasa khasiat. Contoh data hasil penghapusan records tanaman obat yang memiliki nilai NULL pada atribut effect dapat dilihat pada Tabel 14.

3 Penanganan kesalahan pengetikan

Kesalahan pengetikan pada pemasukan data dapat menyebabkan perbedaan makna dari kata yang dituliskan, misalnya coughs dan cough. Kedua kata tersebut dapat dianggap berbeda arti karena memiliki satu huruf yang berbeda pada pengejaannya. Oleh sebab itu, perlu dilakukan praproses data yang dapat menangani masalah kesalahan pengetikan tersebut menggunakan algoritme Levenshtein, sehingga coughs dan cough dapat tetap dianggap memiliki makna yang sama.

Data yang digunakan ialah posting list frasa khasiat tanpa stopwords berjumlah 3471 records. Kemudian dilakukan klusterisasi berdasarkan frasa khasiat. Proses klusterisasi ini menghasilkan 1185 records khasiat, kemudian dilakukan perhitungan jumlah tanaman obat yang memiliki khasiat tersebut. Perhitungan jumlah tanaman obat yang memiliki suatu khasiat dianggap sebagai frekuensi khasiat di dalam database. Contoh data sebelum penangan kesalahan pengetikan dan pengklusteran khasiat dapat dilihat pada Tabel 15, sedangkan contoh data hasil pengklusteran frasa khasiat dan perhitungan frekuensi tanaman obat di setiap frasa khasiat dapat dilihat pada Tabel 16.

Selanjutnya, dilakukan pembentukan pasangan dari seluruh khasiat yang ada dan diterapkan algoritme jarak Levenshtein untuk mendapatkan nilai kesalahan pengejaan khasiat. Algoritme jarak Levenshtein mencocokkan setiap pasangan khasiat yang terbentuk dan menghitung berapa banyak karakter yang berbeda dari pengetikan pasangan khasiat tersebut. Pada penelitian ini diberikan threshold

Tabel 14 Contoh data hasil penghapusan records yang tidak lengkap

id_effect effect id_herb

K0001 rheumatic S00974

K0001 rheumatic S00010

K0002 dysentery S00974

K0005 cough S00001

Tabel 15 Contoh data sebelum penanganan kesalahan pengetikan

id_effect effect id_herb

K0005 cough S00001 K0008 lactagoga S00198 K0008 lactagoga S00509 K0005 cough S00676 K0005 cough S00345 K0005 cough S00021 K0090 coughs S00852 K0045 laktagoga S00567

19 jarak minimal untuk mengoreksi khasiat yang dianggap memiliki kesalahan pengetikan. Hal tersebut diperlukan untuk meminimalisir kesalahan pengetikan. Threshold yang digunakan pada penelitian ini ialah 1, sebab kesalahan pengetikan diasumsikan hanya terjadi pada satu karakter. Selain itu, penggunaan threshold lebih dari 1 ternyata menyebabkan perubahan makna dari khasiat, misalnya penggunaan threshold 2 mendeteksi fever sebagai kesalahan pengetikan dari liver. Oleh sebab itu, threshold lebih dari 1 tidak diterapkan dalam penelitian ini. Contoh data hasil penerapan algoritme Levenshtein dapat dilihat pada Tabel 17.

Selanjutnya, dilakukan proses membandingkan frekuensi khasiat dari setiap pasangan frasa khasiat untuk pasangan khasiat yang memiliki jarak Levenshtein bernilai 1 berjumlah 25 records. Proses ini dimaksudkan untuk melakukan koreksi pada kesalahan pengetikan yang terjadi. Frasa khasiat yang memiliki nilai frekuensi kecil diganti dengan frasa khasiat yang memiliki nilai frekuensi lebih tinggi. Hal ini dilakukan dengan asumsi bahwa frasa khasiat dengan frekuensi kecil dianggap sebagai khasiat yang mengalami kesalahan pengetikan, sedangkan frasa khasiat dengan frekuensi yang lebih besar dianggap sebagai frasa khasiat yang benar dalam pengetikannya. Hasil dari proses tersebut merupakan 3471 records frasa khasiat yang tidak mengalami kesalahan pengetikan. Contoh data hasil penanganan kesalahan pengetikan dapat dilihat pada Tabel 18.

Tabel 16 Contoh data hasil pengklusteran frasa khasiat dan perhitungan frekuensi tanaman obat di setiap frasa khasiat

id_effect effect id_herb frekuensi

K0005 cough S00001, S00676, S00345, S00021 4 K0008 lactagoga S00198, S00509 2 K0090 coughs S00852 1 K0045 laktagoga S00567 1

Tabel 17 Contoh data hasil penerapan algoritme Levenshtein id_effect _1 Effect_2 frekuensi_ 1 id_effect _2 effect_2 Frekuensi _2 Levensh-tein K0005 cough 4 K0090 coughs 2 1 K0008 lactagoga 2 K0045 laktagoga 1 1

Tabel 18 Contoh data setelah penanganan kesalahan pengetikan

id_effect effect id_herb

K0005 cough S00001 K0008 lactagoga S00198 K0008 lactagoga S00509 K0005 cough S00676 K0005 cough S00345 K0005 cough S00021 K0006 cough S00852 K0008 lactagoga S00567

20

Indexing Frasa Khasiat dan Indexing Tanaman Obat

Tahap pembuatan inverted index yang terakhir ialah indexing frasa khasiat dan tanaman obat. Indexing frasa khasiat dan tanaman obat dilakukan terhadap 3471 records hasil tahap modifikasi token. Pada tahap indexing frasa khasiat, id tanaman obat yang memiliki frasa khasiat yang sama akan ditempatkan di satu record. Hasil dari tahap indexing ini merupakan inverted index yang berisi frasa khasiat beserta daftar id tanaman obat yang memiliki frasa khasiat tersebut. Di samping itu, pada tahap indexing tanaman obat, id khasiat yang dimiliki oleh satu id tanaman obat yang sama akan ditempatkan di satu record berdasarkan id tanaman obatnya. Hasil dari tahap indexing ini merupakan inverted index yang berisi id tanaman obat beserta daftar id khasiat yang dimiliki oleh tanaman obat tersebut.

Analytical Abstraction

Pada tahap ini telah diperoleh hasil dari data transformation, yaitu data yang telah mengalami pembersihan dan praproses data. Data yang dihasilkan dari proses tersebut berupa inverted index dari frasa khasiat dengan asumsi tanpa stopwords dan kesalahan pengetikan.

Data yang dihasilkan dari proses tersebut merupakan inverted index dari frasa khasiat berjumlah 1160 records dan inverted index dari tanaman obat berjumlah 891 records. Contoh data sebelum pembuatan inverted index dapat dilihat pada Tabel 19. Di samping itu, contoh data hasil indexing frasa khasiat dapat dilihat pada Tabel 20 dan contoh data hasil indexing tanaman obat dapat dilihat pada Tabel 21. Contoh data pada Tabel 20 tersebut menyatakan bahwa frasa khasiat cough terdapat pada id tanaman obat S00001, S00676, S00345, S00021, S00567 dan S00852. Selain itu, frasa khasiat lactagoga terdapat pada id tanaman S00198, S00509 dan S00567. Contoh data pada Tabel 21 tersebut menyatakan bahwa id tanaman obat S00567 memiliki khasiat cough, lactagoga dan diarrhea.

Tabel 19 Contoh data sebelum indexing

id_effect effect id_herb

K0005 cough S00001 K0008 lactagoga S00198 K0008 lactagoga S00509 K0005 cough S00676 K0005 cough S00345 K0005 cough S00021 K0005 cough S00852 K0008 lactagoga S00567 K0005 cough S00567 K0020 diarrhea S00567

21

Visualization Transformation

Pada tahap ini dilakukan proses perancangan visualisasi untuk menentukan hasil pengolahan data yang dibutuhkan untuk pembuatan aplikasi visualisasi. Selain itu, dilakukan pencarian keterhubungan antartanaman obat dengan khasiatnya.

Perancangan Visualisasi

Perancangan visualisasi dibagi menjadi dua tahap, yaitu pemilihan bentuk visual dasar dan perbaikan bentuk visual. Graf sering kali digunakan untuk mewakili data yang memiliki keterhubungan (Keim 2002). Oleh sebab itu, penelitian ini mencoba menampilkan keterhubungan tanaman obat dengan khasiatnya melalui representasi berupa graf. Sebuah graf terdiri atas sekumpulan objek, yang disebut nodes, dan keterhubungan antara objek-objeknya disebut edges (Keim 2002). Khasiat dan tanaman obat pada penelitian ini direpresentasikan dengan nodes dan keterhubungan antartanaman obat dengan khasiatnya direpresentasikan dengan edges (garis yang menghubungkan dua nodes). Bentuk visual dasar dari keterhubungan tanaman obat dengan khasiatnya ditunjukkan pada Gambar 6.

Tahap berikutnya pada perancangan visual merupakan perbaikan bentuk visual dasar (Gambar 7). Perbaikan bentuk pada bentuk visual dasar tersebut, yaitu:

1 ukuran node khasiat merepresentasikan bobot khasiat pada node tersebut. Semakin besar ukuran node dibanding nodes yang lain maka semakin besar bobot khasiat tersebut. Bobot khasiat ditentukan dengan banyaknya jumlah edges yang dimiliki oleh suatu node. Hal tersebut berarti semakin banyak keterhubungan node tersebut dengan nodes tanaman obat.

Tabel 20 Contoh data hasil indexing frasa khasiat

Id_effect effect Id_herb

K0005 cough S00001, S00676, S00345,

S00021, S00852

K0008 lactagoga S00198, S00509, S00567

K0020 diarrhea S00567

Tabel 21 Contoh data hasil indexing frasa tanaman obat

Id_herb Id_effect effect

S00001 K0005 cough S00198 K0008 lactagoga S00509 K0008 lactagoga S00676 K0005 cough S00345 K0005 cough S00021 K0005 cough S00852 K0005 cough

22

2 ukuran node tanaman obat merepresentasikan bobot tanaman obat pada node tersebut. Bobot tanaman obat merepresentasikan jumlah khasiat yang dimiliki oleh suatu tanaman obat. Semakin besar ukuran suatu node dibandingkan dengan nodes yang lain, maka semakin banyak khasiat yang dimiliki oleh tanaman obat tersebut.

3 pemilihan warna untuk nodes berdasarkan pengklusteran posisi tanaman yang berkhasiat dan node yang menunjukkan khasiat.

Pengolahan Data yang Akan Dipetakan

Pada tahap ini dilakukan pengolahan data untuk data yang akan dipetakan pada proses pembuatan visual mapping transformation. Data yang digunakan merupakan hasil indexing dari frasa khasiat dan hasil indexing dari tanaman obat. Pada pembuatan tabel nodes, frasa khasiat dan tanaman obat hasil indexing tersebut akan dimasukkan ke dalam tabel nodes untuk direpresentasikan sebagai nodes.

Gambar 6 Bentuk visual dasar

23 Nodes pada perancangan visualisasi merepresentasikan frasa khasiat dan tanaman obat yang terdapat di dalam database. Id dari frasa khasiat dan id dari tanaman obat akan menjadi id dari nodes serta frasa khasiat dan nama tanaman obat dalam bahasa Inggris digabung dengan posisi tanaman obat akan menjadi label dari nodes. Tabel nodes mengikutsertakan atribut position dari tanaman untuk pewarnaan graf berdasarkan kluster posisi tanaman. Selain itu, nodes khasiat akan diberikan warna yang berbeda dan menjadi kluster tersendiri pada graf, sehingga atribut position dari nodes khasiat akan bernilai NULL.

Dokumen terkait