Dalam bab ini akan dijelaskan mengenai teori – teori yang digunakan untuk mendukung penulisan tugas akhir pengenalan jenis buah dengan menggunakan metode Bayesian. Teori – teori yang akan dijelaskan adalah teori tentang pengolahan citra, pengenalan pola dan metode Bayesian.
II.1. Pengolahan Citra
Pengolahan citra digital merupakan proses yang bertujuan untuk memanipulasi dan menganalisis citra dengan bantuan komputer. Pengolahan citra digital dapat dikelompokkan dalam dua jenis kegiatan :
1. Memperbaiki kualitas suatu gambar, sehingga dapat lebih mudah diinterpretasi oleh mata manusia.
2. Mengolah informasi yang terdapat pada suatu gambar untuk keperluan pengenalan objek secara otomatis.
Bidang aplikasi yang kedua sangat erat hubungannya dengan ilmu pengetahuan pola (pattern recognition) yang umumnya bertujuan mengenali suatu objek dengan cara mengekstrak informasi penting yang terdapat pada suatu citra. Bila pengenalan pola dihubungkan dengan pengolahan citra, diharapkan akan terbentuk suatu sistem yang dapat memproses citra masukan sehingga citra tersebut dapat dikenali polanya. Proses ini disebut pengenalan citra atau image recognition.
Pengolahan citra dan pengenalan pola menjadi bagian dari proses pengenalan citra. Kedua aplikasi ini akan saling melengkapi untuk mendapatkan ciri khas dari suatu citra yang hendak dikenali. Secara umum tahapan pengolahan citra digital meliputi :
7
(Srini, 2006) 1. Akusisi citra
Pengambilan data dapat dilakukan dengan menggunakan berbagai media seperti kamera analog, kamera digital, handycam, scanner, optical reader dan sebagainya. Dalam proses akuisisi, citra yang akan diolah ditransformasikan ke dalam representasi numerik. Pada proses selanjutnya representasi numerik tersebut yang akan diolah dsecara digital oleh komputer.
2. Peningkatan kualitas citra
Tahap ini dikenal dengan proses pre-processing. Kualitas citra dapat meningkatkan kemungkinan dalam keberhasilan pada tahap pengolahan citra berikutnya. Untuk meningkatkan kualitas citra dapat dilakukan beberapa hal, seperti perbaikan kontras gelap – terang, penajaman dan pemberian warna semu. 3. Segmentasi citra
Segmentasi bertujuan untuk memilih dan memisahkan suatu objek dari keseluruhan citra dengan suatu kriteria tertentu.
4. Representasi dan uraian
Representasi mengacu pada data konversi dari hasil segmentasi ke bentuk yang lebih sesuai untuk proses pengolahan pada komputer. Setelah data telah direpresentasikan ke bentuk tipe yang lebih sesuai, tahap selanjutnya adalah membentuk ulang data dari beberapa citra hasil segmentasi.
5. Pengenalan dan interpretasi
Pengenalan pola tidak hanya bertujuan untuk mendapatkan citra dengan suatu kualitas tertentu, tetapi juga untuk mengklasifikasikan bermacam-macam citra. Dari sejumlah citra diolah sehingga citra dengan ciri yang sama akan dikelompokkan pada suatu kelompok tertentu. Interpretasi meliputi penekanan
8
dalam mengartikan objek yang dikenali.
II.2. Pengenalan Pola
II.2.1. Pengertian pola dan ciri
Pola adalah entitas yang terdefinisi dan dapat diidentifikasikan melalui ciri – cirinya (features). Ciri – ciri tersebut akan digunakan untuk membedakan pola yang satu dengan pola yang lain. Ciri yang bagus adalah ciri yang mempunyai tingkat pembedaan yang tinggi, sehingga pengelompokan suatu pola dengan ciri yang dimiliki dapat dilakukan dengan menghasilkan nilai keakuratan yang tinggi.
Sebagai contoh :
Pola Ciri
Huruf Tebal, tinggi, titik sudut, lengkungan garis, dll
Tanda tangan Panjang, kerumitan, tekanan, dll
Suara Frekuensi, amplitudo, intonasi, warna, nada, dll Sidik jari Jumlah garis, lengkungan, dll
Ciri pada suatu pola dapat diperoleh dari hasil pengukuran terhadap suatu obyek yang diuji. Khusus pada pola yang terdapat di dalam citra, ciri – ciri dapat diperoleh dari informasi seperti dibawah ini :
• Spasial : intensitas pixel,histogram,dll
• Tepi : arah, kekuatan, dll
• Kontur : garis, elips, lingkaran, dll
• Wilayah / bentuk : keliling, luas,pusat masa,dll
9
II.2.2. Pengenalan Pola
Pengenalan pola merupakan suatu aktivitas yang sudah biasa dilakukan oleh manusia. Manusia melakukannya hampir setiap saat, baik secara sadar maupun tidak sadar. Informasi diperoleh melalui berbagai organ sensor yang diproses secara langsung oleh otak, agar dengan segera manusia mampu mengidentifikasi sumber informasi tersebut tanpa perlu usaha yang berarti. Hampir setiap aktivitas manusia berdasarkan pada keberhasilan dalam berbagai kegiatan pengenalan pola. Salah satu aplikasinya adal klasifikasi teks dokumen dalam kategori (contoh. surat-E spam/bukan-spam), surat, atau sistem menggunaka
Disiplin pengenalan pola pada dasarnya berkenaan dengan masalah pengembangan algoritma dan metodologi yang memungkinkan implementasi oleh komputer terhadap berbagai kegiatan pengenalan yang biasa dilakukan manusia. Motivasinya adalah untuk menjalankan kegiatan pengenalan tersebut dengan lebih akurat, atau lebih cepat, dan mungkin lebih ekonomis dari manusia. Ruang lingkup dari pengenalan pola ini juga termasuk hal-hal yang tidak biasa dilakukan oleh manusia, seperti membaca bar code.
Adapun langkah – langkah dari pengenalan pola adalah sebagai berikut : a. Pengumpulan data.
Pengumpulan data adalah proses pengambilan data gambar buah. b. Feature Analisis.
10
menjadi file yang siap diekstraksi cirinya dengan cara konversi data mentah ke data digital dalam format *.JPG.
c. Pengenalan.
Ekstraksi ciri adalah tahap untuk mendapatkan frekuensi kemunculan dari masing-masing pola.
d. Pengambilan keputusan.
Tahap ini merupakan tahap penentuan keputusan, yang didasarkan pada perhitungan yang dilakukan pada tahap ekstraksi ciri pola jenis buah. e. Keputusan.
Tahap keputusan adalah tahap akhir dari proses pengelompokan jenis buah yang diharapkan dapat memberikan hasil yang tepat.
II.2.3. Teknik Pengenalan Pola
Pengenalan pola bertujuan untuk menentukan kelompok atau kategori pola berdasarkan ciri yang dimiliki oleh pola tersebut. Dengan kata lain pengenalan pola akan membedakan suatu obyek dengan obyek yang lain. Terdapat tiga pendekatan yang dilakukan dalam pengenalan pola, yaitu pendekatan melalui jaringan saraf tiruan, pendekatan secara sintatik atau struktural dan pendekatan secara statistik. (Eri Sasmadi, 2008)
i) Pendekatan melalui jaringan saraf tiruan
Pendekatan dengan pola jaringan saraf tiruan adalah pendekatan dengan menggabungkan pendekatan sintaks dan statistik. Pendekatan melalui pola-pola ini meniru cara kerja otak manusia. Pada pola ini sistem membuat rule-rule tertentu disertai dengan data statistik sebagai dasar untuk pengambilan keputusan.
11
Untuk pengenalan pola dengan pendekatan jaringan saraf tiruan seolah – olah dibuat sebuah sistem yang kinerjanya sama dengan otak manusia. Agar sitem tersebut bisa menjadi cerdas, harus diberikan pelatihan selama rentang waktu yang ditentukan. Karena dengan melatih sistem maka akan menambah rule-rule serta data statistik yang digunakan oleh sistem untuk mengambil keputusan.
ii) Pendekatan secara sintatik
Pendekatan secara sintaks adalah pendekatan dengan menggunakan aturan - aturan tertentu atau menggunakan teori bahasa formal. Pengenalan pola secara sintatik lebih dekat ke strategi pengenalan pola yang dilakukan oleh manusia, namun secara praktek penerapannya relatif sulit bila dibandingkan dengan pendekatan secar statistik.
Misalnya baju si mamat mempunyai rule sebagai berikut, selalu berwarna Biru, bahannya kaos, bermerek adidas, lengannya lengan panjang dan berkerah. Jika ada sebuah baju dengan ciri-ciri 90% lebih dari ciri-ciri tersebut dapat dikatakan bajunya mamat, dengan toleransi sekitar 10%.
iii) Pendekatan secara statistik
Pendekatan secara statistik menggunakan teori-teori ilmu peluang dan statistik. Ciri-ciri yang dimiliki oleh suatu pola ditentukan distribusi statistiknya. Pola yang berbeda memiliki distribusi yang berbeda pula. Dengan menggunakan teori keputusan di dalam statistik, kita menggunakan distribusi ciri untuk mengklasifikasikan pola.
12
Contoh teori keputusan:
Misalkan ada N pola yang dikenali, yaitu w1, w2, …, wN dan fungsi peluang atau kerapatan dari ciri-ciri pada pola diketahui. Jika x merupakan hasil pengukuran ciri-ciri, maka
p(x wi ) , i = 1, 2, …, N
dapat dihitung. Sebagai contoh, misalkan diketahui fungsi kerapatan dari diameter buah jeruk dan apel yang diperlihatkan pada Gambar 2.1 dibawah :
Gambar 2.1 : fungsi kerapatan
Jika sebuah objek diukur dan diperoleh diameternya adalah a cm, maka kita mengklasifikasikan objek tersebut sebagai “jeruk”, karena
p(a | jeruk) > p(a | apel)
dan jika hasil pengukuran diameter adalah b cm, kita mengklasifikasikan objek tersebut sebagai “apel”, karena
13
II.3. Metode Bayesian
Teori keputusan Bayesian adalah pendekatan statistik yang fundamental dalam pengenalan pola (pattern recognition). Pendekatan ini didasarkan pada kuantifikasi
trade-off antara berbagai keputusan klasifikasi dengan menggunakan probabilitas dan ongkos yang ditimbulkan dalam keputusan – keputusan tersebut. (Budi Santoso, 2007)
Dalam pembelajaran akan ditentukan hipotesis yang terbaik dari space H, dengan data yang diamati x. Untuk menetapkan hipotesis yang terbaik diperlukan hipotesis yang paling mungkin, data x sebagai pengetahuan awal tentang kemungkinan dari berbagai hipotesis dalam H. Teorema Bayes menyediakan suatu jalan/cara untuk mengkalkulasi kemungkinan suatu hipotesis berdasar pada kemungkinan awalnya, kemungkinan dalam pengamatan berbagai data dapat memberikan hipotesis.
P(h) untuk menandakan kemungkinan awal bahwa hipotesis h dipegang. P(h) sering disebut dengan prior probablity (probabilitas prior) dari h, P(x) merupakan kemungkinan awal bahwa data training x akan diamati. P(x|h) untuk menandakan kemungkinan dimana data training x memberi banyak hipotesis h.
Dalam banyak kasus, keputusan diambil dengan menggunakan informasi yang lebih banyak tidak hanya dengan probabilitas prior saja. Fungsi likelihood juga bisa digunakan sebagai tambahan informasi dalam pengambilan keputusan. Dalam Bayes
learning akan dimaksimalkan hipotesis yang paling mungkin, h, atau maximum apriori
(MAP).
Langkah – langkah perhitungan menggunakan metode Bayesian adalah sebagai berikut:
1. Penghitungan mean dan standar deviasi (ditentukan dari nilai masing – masing feature setiap jenis buah).
14
2. Penghitungannilai probability density function
(2.1)
3. Penghitungan nilai likelihood
(2.2)
4. Penghitungan nilai probabilitas
(2.3)
5. Penentuan probabilitas maksimum
(2.4)
II.3.1. Contoh perhitungan menggunakan metode Bayesian
Untuk lebih memahami perhitungan menggunakan metode Bayesian, akan diberikan sebuah contoh dan langkah – langkahnya :
15 o Terdapat data training sebagai berikut
Tabel 2.1
Tabel Contoh Perhitungan
Outlook Temperature Humidity Windy Play
Y N Y N Y N Y N Y N Sunny 2 3 83 70 68 64 69 75 75 72 81 85 86 96 80 65 70 80 70 90 75 85 False 6 2 9 5 Overcast 4 0 80 90 True 3 3 Rainy 3 2 65 70 72 95 71 91
Sunny 2/9 3/5 Mean 73 74.6 Mean 79.1 86.2 False 6/9 2/5 9/14 5/14 Overcast 4/9 0/5 St.dev 6.2 7.9 St.dev 10.2 9.7 true 3/9 3/5
Rainy 3/9 2/5
o Data testing yang digunakan
Outlook Temperature Humidity Windy Play
Sunny 66 90 True ?
o Pertanyaan : Berapa probabilitas yes? Berapa probabilitas no?
16 o Jawab :
1. Nilai mean dan standar deviasi sudah dihitung dalam tabel training.
2. Perhitungan nilai probability density function
3. Perhitungan nilai likelihood
Likelihood of yes =2/9 x 0.1216 x 0.0692 x 3/9 x 9/14 = 0.00040
Likelihood of no =3/5 x 0.0913 x 0.0444 x 3/5 x 5/14 = 0.00052
17
4. Perhitungan nilai probabilitas
o Jadi probabilitas yes adalah 43.48% dan probabilitas untuk no adalah 56.52%.
18