• Tidak ada hasil yang ditemukan

Data Citra Daun Tumbuhan

Data citra daun yang digunakan terdapat sebanyak 660 citra dari 66 spesies tumbuhan. Data citra yang digunakan seimbang yaitu terdapat sepuluh citra untuk setiap kelas. Data citra tersebut dipisahkan menjadi dua bagian, sembilan citra dari setiap spesies digunakan untuk data pembentukan model, sedangkan satu citra dari setiap spesies digunakan sebagai data query yang dipilih secara acak (random). Berdasarkan pembagian tersebut, 594 data citra digunakan untuk pembentukan model dan 66 citra (satu citra untuk masing-masing spesies) digunakan untuk query. 594 data citra dibagi kembali menjadi 75% data latih dan 25% data uji menggunakan 4-fold cross validation. Daftar nama spesies/kelas dapat dilihat pada Lampiran 1 dan data citra query yang digunakan dapat dilihat pada Lampiran 2.

Ekstraksi Fitur Tekstur dengan FLBP

Sebelum dilakukan ektraksi fitur tekstur, citra dilakukan praproses dengan mengonversi citra asli menjadi citra keabuan. Setelah itu, citra diesktraksi cirinya dengan metode FLBP. Hasil dari proses ini berupa histogram kontribusi kode LBP. Hasil ciri direpresentasikan sebagai vektor dengan jumlah elemen sebesar 256. Tahapan ini dilakukan menggunakan program Python. Hasil dari tahapan ini berupa

dataset fitur tekstur dengan dimensi data adalah 257 kolom dan 594 baris, 256

variabel independen dan satu variabel dependen/kelas (spesies). Dataset dibuat dalam format comma separated value (csv) file.

Ekstraksi Fitur Geometri

Sebelum dilakukan ekstraksi fitur geometri, citra dilakukan praproses dengan mengonversi citra asli menjadi citra biner atau melakukan pendeteksian tepi Canny. Setelah itu, citra diekstraksi cirinya dengan menghitung geometri area, circularity,

eccentricity, dan centroid-radii. Ciri area, circularity, dan eccentricity

12

direpresentasikan dengan 36 vektor, sehingga jumlah elemen vektor sebanyak 39 buah. Tahapan ini dilakukan menggunakan program Python. Hasil dari tahapan ini berupa dataset fitur geometri dengan dimensi data adalah 40 kolom dan 594 baris, 39 variabel independen dan satu variabel dependen/kelas (spesies). Dataset dibuat dalam format comma separated value (csv) file.

Model Multinomial Logistic Regression

Dataset dari hasil ekstraksi fitur digunakan untuk membuat model klasifikasi

MLR. Setiap dataset menghasilkan satu model MLR (classifier) berdasarkan model terbaik. Dataset fitur tekstur digunakan untuk membuat classifier MLR tekstur,

dataset fitur geometri digunakan untuk membuat classifier MLR geometri. Classifier MLR dihasilkan menggunakan program Python dan library Scikit-Learn.

Nilai deviance dilihat pada model yang terbentuk untuk melihat kebaikan/kelayakan model. Evaluasi model menggunakan 4 cross-fold validation. Pemilihan model terbaik dari fold tersebut berdasarkan nilai akurasi fold yang paling dekat dengan rata-rata akurasi keempat fold tersebut.

Model Fitur Teksur

Nilai deviance dari model MLR dengan dataset tekstur adalah 0.02. Nilai

deviance tersebut mendekati 0 sehingga model layak digunakan. Berdasarkan hasil

pembentukan model fitur tekstur, akurasi rata-rata dari pembentukan model menggunakan fitur tekstur adalah 88.83%. Perbandingan akurasi pembentukan model untuk masing-masing fold dapat dilihat pada Gambar 4. Berdasarkan grafik tersebut, model yang dipilih untuk digunakan untuk temu kembali citra adalah model dari fold ke-2 dengan akurasi 89.39% karena akurasinya yang paling dekat dengan rata-rata akurasi seluruh fold. Hal tersebut dilakukan agar model yang dipakai tidak overfitting. Sementara itu, model disimpan dalam bentuk fungsi Python. Fungsi Python tersebut yang digunakan untuk mencari urutan kelas untuk temu kembali citra. Perbandingan akurasi per kelas dari model terpilih dapat dilihat pada Gambar 5.

Gambar 4 Grafik perbandingan akurasi model tekstur

83.33

89.39 90.91 91.67

Fold 1 Fold 2 Fold 3 Fold 4

Gambar 5 Grafik perbandingan akurasi model tekstur masing-masing kelas

0 0.2 0.4 0.6 0.8 1 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 A kur as i (x 100 % ) Kelas

13 Berdasarkan Gambar 5, terdapat dua kelas yang memiliki akurasi 0% yaitu kelas 15 (Coleus scutellarioides) dan kelas 30 (Indigofera suffuritosa). Gambar 6 merupakan contoh data citra dua kelas tersebut. Gambar 6 menunjukkan bahwa dua kelas tersebut, secara visual memiliki tingkat intensitas cahaya dan tekstur yang beragam. Hal tersebut, dikarenakan adanya perbedaan usia daun dalam pengambilan citra daun tersebut. Karena perbedaan tersebut, dapat menyebabkan sulit untuk klasifikasi dan akurasi menjadi buruk.

Sementara itu, terdapat 54 spesies yang memiliki akurasi sebesar 100%. Gambar 7 merupakan contoh data citra yang mempunyai akurasi tersebut. Gambar 7 menunjukkan bahwa data citra spesies 60 (Solanum sp) dan 45 (Piper anduncum), secara visual memiliki tingkat intensitas cahaya dan tekstur yang seragam dan hampir sama. Oleh karena itu, hasil akurasi dari query tersebut menjadi baik.

Model Fitur Geometri

Nilai deviance dari model MLR dengan dataset geometri adalah 11.07. Nilai

deviance tersebut tidak terlalu dekat dengan 0 dan juga tidak terlalu jauh dengan

nilai 0, artinya model cukup fit untuk semua data, sehingga model cukup baik untuk digunakan. Berdasarkan hasil pembentukan model fitur geometri, akurasi rata-rata dari pembentukan model menggunakan fitur geometri adalah 74.12%. Perbandingan akurasi pembentukan model untuk masing-masing fold dapat dilihat pada Gambar 8. Berdasarkan grafik tersebut, model yang dipilih untuk digunakan untuk temu kembali citra adalah model dari fold ke-2 dengan akurasi 72.73% karena Gambar 7 Contoh citra terklasifikasikan benar menggunakan fitur tekstur: (a)

kelas 60 (b) kelas 45

Gambar 6 Contoh citra terklasifikasikan salah menggunakan fitur tekstur: (a) kelas 15 (b) kelas 30

(a)

(b)

14

akurasinya yang paling dekat dengan rata-rata akurasi seluruh fold. Hal tersebut dilakukan agar model yang dipakai tidak overfitting. Model yang disimpan dalam bentuk fungsi Python. Fungsi Python tersebut yang digunakan untuk mencari urutan kelas untuk temu kembali citra. Perbandingan akurasi perkelas dari model terpilih dapat dilihat pada Gambar 9.

Berdasarkan Gambar 9, terdapat sembilan kelas yang memiliki akurasi 0% yaitu kelas 13 (Castaropsis Argantas), 17 (Dahlia), 21 (Eupatorium riparum), 25 (Gardenia augusta), 26, 28, 47, 49, dan 64. Gambar 10 menunjukkan bahwa kelas yang memiliki akurasi 0%, misalnya kelas 17 dan 21, secara visual memiliki bentuk daun yang berbeda dan beragam, terdapat daun dengan bentuk yang lebih kecil dan lebih besar, serta ada yang bentuknya lebih lebar dari daun yang lain. Hal tersebut yang menyebabkan sulit untuk klasifikasi dan akurasi menjadi buruk karena ciri geometri yang dihasilkan lebih mirip ke ciri geometri kelas lain.

Gambar 8 Grafik perbandingan akurasi model geometri

67.68

72.73

77.27 78.79

Fold 1 Fold 2 Fold 3 Fold 4

Gambar 9 Perbandingan akurasi model geometri masing-masing kelas

0 0.2 0.4 0.6 0.81 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 Ak u ras i (x 1 0 0 % ) Kelas

Gambar 10 Contoh citra terklasifikasikan salah menggunakan fitur geometri: (a) kelas 17 (b) kelas 21

15 Sementara itu, terdapat 38 spesies yang memiliki akurasi sebesar 100%. Gambar 11 merupakan contoh data citra kelas yang memiliki akurasi tersebut. Gambar 11 menunjukkan bahwa data citra spesies 7 (Antanan) dan 14 (Clidemia

hirta), secara visual memiliki bentuk geometri/bentuk yang seragam dan hampir

sama. Oleh karena itu, hasil akurasi dari query tersebut menjadi baik.

Penggabungan Fitur Hasil Classifier

Berdasarkan evaluasi model, terdapat beberapa kelas yang memiliki akurasi yang tinggi saat percobaan menggunakan fitur tekstur, namun rendah saat percobaan menggunakan fitur geometri, dan sebaliknya. Misalnya kelas 17 (Dahlia

sp), memiliki akurasi 100% saat percobaan menggunakan fitur tekstur, namun

akurasi menjadi 0% saat percobaan menggunakan fitur geometri. Sementara itu, kelas 30 (Indigofera suffuritosa) memiliki akurasi 0% saat percobaan menggunakan fitur tekstur, namun akurasi menjadi 100% saat percobaan menggunakan fitur geometri.

Oleh hal itu, dilakukan penggabungan dari beberapa fitur. Model classifier menghasilkan score atau peluang setiap spesies (hasil classifier), kemudian score tersebut digunakan untuk penggabungan hasil classifier berdasarkan fitur (satu fitur atau dua fitur). Penggabungan hasil beberapa classifier dilakukan menggunakan metode similarity-based combination (SC).

Penentuan Metode Penggabungan Fitur

Metode kombinasi peluang yang digunakan adalah weighted similarity-based

combination/WSC dengan 𝛼 = 0.5, average similarity-based combination/ASC dengan 𝛼 = 0, dan maximum similarity-based combination/MSC dengan 𝛼 = 1. Hasil akurasi terbaik dari metode kombinasi digunakan untuk penggabungan fitur. Persamaan yang digunakan dapat dilihat pada Persamaan 20, 21, dan 22.

𝑊𝑆𝐶 = 0.5 × max(𝑠1ℎ, 𝑠2ℎ) + 0.5 × (∑ 𝑠𝑐ℎ 2 2 1 ) (20) 𝑀𝑆𝐶 = max(𝑠1ℎ, 𝑠2ℎ) (21) 𝐴𝑆𝐶= (∑ 𝑠𝑐ℎ 2 2 1 ) (22) Penggunaan penggabungan hasil classifier MSC menerapkan nilai maksimum yang berarti sistem dapat secara otomatis memilih hasil classifier fitur yang besar. Sementara itu, ASC menerapkan rata-rata hasil classifer yang berarti sistem melihat keseluruhan nilai yang ada dari semua hasil classifier.

Gambar 11 Contoh citra terklasifikasikan benar menggunakan fitur geometri: (a) kelas 7 (b) kelas 14

16

 Percobaan Similarity-based Combination

Evaluasi menggunakan data citra query yaitu 66 citra dengan satu citra untuk masing-masing spesies. Evaluasi yang digunakan dilihat dari akurasi atau ketepatan dalam klasifikasi. Perbandingan evaluasi metode penggabungan dapat dilihat pada Tabel 2. Berdasarkan Tabel 2, akurasi penggabungan fitur lebih rendah dari akurasi fitur tekstur. Percobaan menggunakan fitur tekstur mengklasifikasi dengan benar 57 kelas/spesies, sedangkan ASC, MSC, WSC mengklasifikasi dengan benar 56 kelas. Terdapat satu kelas yang berbeda yaitu kelas 31 (Isotoma longiflora). Citra

query/kelas 31 dapat dilihat pada Gambar 12.

Kelas citra tersebut benar diklasifikasikan menggunakan fitur tekstur, sedangkan salah diklasifikasikan menggunakan fitur geometri. Hal tersebut dikarenakan peluang terbesar saat menggunakan fitur geometri lebih besar dari peluang terbesar menggunakan fitur tekstur, padahal fitur geometri salah mengklasifikasi, sehingga saat menggunakan ASC, MSC, dan WSC peluang terbesar menjadi salah klasifikasi. Selain itu, juga dikarenakan akurasi model klasifikasi geometri lebih kecil dari model klasifikasi tesktur. Misalnya citra query ke-31 (Isotoma longiflora), peluang terbesar menggunakan fitur tekstur adalah 0.9243 dengan hasil klasifikasi benar. Sementara itu, peluang terbesar menggunakan fitur geometri adalah 0.9903 dengan klasifikasi salah (kelas 62). Saat menggunakan ketiga metode SC diatas, hasil peluang terbesar mengikuti penggunaan fitur geometri. Oleh karena itu, hasil akhir menjadi salah klasifikasi. Hasil peluang citra query ke-31 dapat dilihat pada Tabel 3 dengan (B) adalah benar klasifikasi dan (S) adalah salah klasifikasi. Tabel perbandingan klasifikasi dan peluang menggunakan penggabungan fitur SC dapat dilihat pada Lampiran 3.

Gambar 12 Citra query/kelas 31 (Isotoma longiflora) Tabel 2 Percobaan penggabungan dua fitur menggunakan SC

Geometri Tekstur Penggabungan Fitur

ASC MSC WSC

69.70% 86.36% 84.85% 84.85% 84.85%

Tabel 3 Hasil peluang citra query ke-31 untuk kelas 31 Kelas

Prediksi

Peluang Kelas Prediksi Penggabungan Fitur

Tekstur Geometri ASC MSC WSC

31 0.9243 (B) 0.0097 0.4670 0.9243 0.6957

17  Percobaan Bobot Proporsi

Pecobaan kedua, kombinasi fitur menggunakan bobot proporsi dari akurasi pembentukan model. Pembobotan tersebut memodifikasi metode average

similarity-based combination (ASC). ASC menggunakan bobot yang sama untuk

setiap hasil classifier dengan persamaan 𝑆𝐶𝑘= 0.5 × 𝑠1𝑘+ 0.5 × 𝑠2𝑘, sedangkan kombinasi fitur ini menggunakan bobot proporsi dari akurasi pembentukan model seperti pada Persamaan 23, dengan 𝑎𝑐𝑐1 adalah akurasi pembentukan model fitur tekstur, 𝑎𝑐𝑐2 adalah akurasi pembentukan model fitur geometri, 𝑠1𝑘 adalah score

combination fitur tekstur untuk kelas k, dan 𝑠2𝑘 adalah score combination fitur geometri untuk kelas k.

𝑆𝐶𝑘 = 𝑎𝑐𝑐1

𝑎𝑐𝑐1+ 𝑎𝑐𝑐2× 𝑠1𝑘 +

𝑎𝑐𝑐1

𝑎𝑐𝑐1+ 𝑎𝑐𝑐2𝑠2𝑘 (23) Akurasi pembentukan model dengan fitur tekstur sebesar 89.39%, sedangkan dengan fitur geometri sebesar 72.73%. Akurasi pembentukan model dengan fitur tekstur lebih besar dari fitur geometri, maka bobot untuk peluang fitur tekstur dibuat lebih besar dari bobot peluang fitur geometri, dengan asumsi lebih mementingkan hasil dari classifier dengan akurasi pembentukan model yang besar. Oleh hal tersebut, percobaan ini menggunakan persamaan 𝑆𝐶 = 0.8939

0.8939+0.7273× 𝑠1ℎ+ 0.7273

0.8939+0.7273𝑠2ℎ= 0.6𝑠1ℎ+ 0.4𝑠2ℎ , dengan 𝑠1ℎ adalah peluang citra diklasifikasikan masuk kelas h menggunakan fitur tekstur dan 𝑠2ℎ adalah peluang citra diklasifikasikan masuk kelas h menggunakan fitur geometri. Perbandingan evaluasi menggunakan citra query dapat dilihat pada Tabel 4.

Berdasarkan Tabel 4, penggunaan bobot proporsi dapat meningkatkan akurasi dari ASC, WSC, dan MSC sehingga akurasi yang dihasilkan sama besar dari akurasi saat menggunakan fitur tekstur. Satu citra yang sebelumnya salah klasifikasi saat menggunakan geometri menjadi benar diklasifikasikan menggunakan penggabungan fitur bobot proporsi. Berdasarkan percobaan pertama dan kedua, penggabungan dua fitur dengan bobot proporsi adalah yang terbaik dari metode penggabungan lainnya.

Evaluasi Temu Kembali Citra

Evaluasi temu kembali citra menggunakan average precision dari query citra yang dimasukkan. Precision adalah rasio citra yang relevan terhadap jumlah total citra yang terambil. Precision digunakan untuk mengukur kebaikan sistem temu kembali citra untuk pengguna. Sementara itu, recall adalah rasio citra yang relevan terhadap jumlah citra relevan yang berada dalam basis data. Recall untuk mengukur kebaikan sistem dalam menampilkan citra yang relevan. Temu kembali citra yang baik, jika nilai precision dan recall mendekati atau sama dengan 1. Selain itu, dilihat juga grafik 11 titik average precision dari setiap penggunaan fitur. Citra query yang digunakan untuk evaluasi sebanyak 66 citra, satu citra dari masing-masing kelas.

Tabel 4 Percobaan Kombinasi Dua Fitur dengan bobot proporsi

Geometri Tekstur Bobot proporsi

18

Penggunaan Satu Fitur

Berdasarkan citra query yang digunakan, temu kembali citra daun tumbuhan menggunakan fitur tekstur menghasilkan hasil average precision masing-masing sebesar 0.84. Sementara itu, temu kembali citra daun tumbuhan menggunakan geometri menghasilkan average precision sebesar 0.56. Perbandingan grafik 11 titik average precision untuk penggunaan satu fitur dapat dilihat pada Gambar 13.

Berdasarkan Gambar 13, kinerja temu kembali citra daun tumbuhan dengan menggunakan satu fitur yang terbaik adalah menggunakan fitur tekstur, terlihat dari grafik 11 titik average precision untuk penggunaan fitur tekstur berada paling atas diantara fitur geometri. Sementara itu, berdasarkan Gambar 14 terlihat bahwa ada citra query yang benar diklasifikasikan atau kelas aktual muncul di urutan pertama menggunakan fitur tekstur, tetapi salah diklasifikasikan menggunakan fitur geometri dan sebaliknya.

Gambar 13 Grafik 11 titik average precision satu fitur

0 0.2 0.4 0.6 0.8 1 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 A ve rage pr ec is ion

Citra yang diambil tekstur geometri

Gambar 14 Perbandingan kelas aktual dan kelas prediksi penggunaan satu fitur

1 6 11 16 21 26 31 36 41 46 51 56 61 66 1 4 7 1 0 1 3 1 6 1 9 2 2 2 5 2 8 3 1 3 4 3 7 4 0 4 3 4 6 4 9 5 2 5 5 5 8 6 1 6 4 K el as pr edi ks i Kelas aktual tekstur geometri

19 Misalnya hasil temu kembali citra query kelas Altignia Excelsa yang dapat dilihat pada Gambar 15, citra yang relevan tetap dapat terambil pada citra teratas, walaupun tidak terdapat pada urutan pertama tetapi urutan kelas ketiga. Hal itu menyebabkan pengguna masih tetap mendapatkan citra yang relevan pada hasil pencarian. Selain itu, hasil dari pencarian citra query tersebut dapat menampilkan daun tumbuhan yang mempunyai fitur yang mirip.

Penggunaan Dua Fitur

Penggunaan dua fitur yaitu penggabungan fitur tekstur dan geometri. Berdasarkan temu kembali citra daun tumbuhan, penggabungan fitur tesktur dan geometri. menghasilkan nilai rata-rata precision sebesar 0.69. Grafik 11 titik

average precision penggunaan dua fitur dapat dilihat pada Gambar 16. Berdasarkan

rata-rata precision tersebut, nilai rata-rata precision penggunaan dua fitur lebih kecil dari penggunaan fitur tesktur, tetapi dengan melihat grafik 11 titik average

precision kinerja temu kembali citra daun tumbuhan penggunaan dua fitur tidak

terlalu berbeda pada titik 0, 0.1, 0.2, dan 0.3 dengan penggunaan fitur tekstur yang dapat dilihat pada Gambar 17. Selain itu, perbandingan average precision penggunaan satu fitur dan dua fitur dapat dilihat pada Tabel 5. Average precision dari penggunaan dua fitur menjadi lebih kecil dari penggunaan fitur tekstur, karena saat proses penggabungan, score combination yang lebih besar dari threshold

retrieval menjadi lebih banyak. Oleh karena itu, ada citra yang tidak relevan ikut

terambil.

Gambar 15 Hasil temu kembali citra teratas dengan data citra query kelas Altignia

excelsa

Tabel 5 Perbandingan average precision untuk penggunaan fitur

Geometri Tekstur Gabungan

20

Antarmuka Sistem Temu Kembali Citra

Halaman hasil dari temu kembali citra menampilkan citra daun yang relevan berdasarkan urutan kelas citra pada basis data. Urutan tersebut berdasarkan perhitungan vektor ciri citra query dengan model yang ada. Halaman pertama merupakan hasil temu kembali citra yang menampilkan citra teratas. Halaman hasil temu kembali menggunakan fitur tekstur dan geometri dari query kelas 1 (Aeglemarmelos) dapat dilihat pada Gambar 18. Selain itu, pengguna dapat melakukan temu kembali lagi menggunakan fitur berbeda dengan memilih fitur yang akan digunakan. Gambar 19 menampilkan hasil temu kembali citra query 1

Gambar 16 Grafik 11 titik average precision penggunaan dua fitur 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 A ve rage pr ec is ion

Citra yang diambil

Gambar 17 Perbandingan grafik 11 titik average precision penggunaan satu dan dua fitur

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 A ve rage pr ec is ion

Citra yang diambil

21 (Aeglemarmelos) dengan fitur geometri saja. Penggunaan fitur dapat menghasilkan temu kembali citra yang berbeda.

Gambar 18 Halaman hasil sistem temu kembali citra daun tumbuhan berdasarkan citra query 1 (Aeglemarmelos) dengan fitur tekstur dan geometri

Gambar 19 Halaman hasil sistem temu kembali citra daun tumbuhanberdasarkan citra query 1 (Aeglemarmelos) dengan fitur geometri

22

Dokumen terkait