• Tidak ada hasil yang ditemukan

BAB II LANDASAN TEORI

N/A
N/A
Protected

Academic year: 2022

Membagikan "BAB II LANDASAN TEORI"

Copied!
28
0
0

Teks penuh

(1)

5

BAB II

LANDASAN TEORI

2.1. Computer Aided Detection (CADe) and Diagnosis (CADx) Mammogram

Sejak 1998, teknologi CADe telah disetujui oleh FDA (Food and Drug Administration) untuk digunakan dalam mammography screening (Fenton et al, 2007). Computer Aided Detection (CADe) digunakan oleh radiolog untuk mencari dan menandai wilayah yang mengandung lesi abnormal (Mohamed & Kadah, 2007). Untuk menghasilkan diagnosa yang efektif, dibutuhkan workstation solution yang dapat “berkomunikasi” dengan citra mammogram. Perangkat yang dapat membantu radiolog dalam melakukan pengamatan antara lain (Karellas, Vedantham, & Lewin, 2009):

1. Tools untuk menampilkan / menyembunyikan hasil deteksi CAD secara interaktif

2. Tools untuk memperbesar citra dari ukuran aslinya.

3. Fungsi-fungsi yang dapat diatur untuk menyesuaikan radiolog dalam mengamati.

Selanjutnya, wilayah yang dicurigai pada CADe akan didiagnosa oleh Computer Aided Diagnosis. Computer Aided Diagnosis merupakan diagnosa seorang radiolog yang menggunakan hasil analisa komputer pada gambar medical sebagai “second opinion”, dalam mengkaji penyakit lebih dalam, dan membuat keputusan diagnosa (Giger, Karssemeijer, & Armato, 2002). Pada mammogram, CADx berfungsi untuk menentukan wilayah yang dicurigai atau ROI (Region of

(2)

Interest) kedalam kategori benign (tidak berbahaya bagi kesehatan) atau malignant (berbahaya). Hasil diagnosa ini akan membantu radiolog dalam menentukan langkah selanjutnya, apakah diperlukan biopsy atau follow-up mammography jangka pendek. (Elfarra & Abuhaiba, 2012).

CADe secara garis besar terdiri dari 2 tahap. Pada tahap pertama, CADe bertujuan untuk mendeteksi lesi yang berbahaya dengan nilai sensitivity yang tinggi. Pada tahap kedua, CADe bertujuan untuk mengurangi false positive tanpa mengurangi sensitivity secara drastis. Sedangkan CADx secara garis besar mempunyai 1 tahap yang terdiri dari 5 langkah yaitu, pengolahan citra, segmentasi, ekstrasi fitur, pemilihan fitur dan klasifikasi. Proses CADx diawali dengan menginput bagian lesi yang abnormal (ROI) dan diakhiri dengan output berupa kecenderungan malignant atau saran untuk penanganan lebih lanjut.

Gambar 2. 1. Tahap-tahap dalam CADe dan CADx (Bovik, 2005)

(3)

2.2. Pengolahan Citra

Pengolahan citra adalah sebuah istilah untuk operasi awal yang dilakukan pada citra. Pengolahan citra bertujuan agar meningkatkan data pada citra yang terdistorsi. Pengolahan citra tidak meningkatkan informasi pada gambar. Banyak citra digital terkadang buram atau blur karena noise sehingga gambar tersebut perlu diolah agar noise hilang dan citra menjadi lebih tajam. (Roopashree.S, Saini, & Singh, 2012).

Dalam mammogram, pengolahan citra sangat dibutuhkan dalam menentukan orientasi pada mammogram, menghilangkan noise dan meningkatkan kualitas citra (Bandyopadhyay, 2010). Sebelum citra diproses, tahap pengolahan citra sangatlah penting untuk mempersingkat pencarian lesi abnormal tanpa terpengaruh background mammogram. Salah satu operasi dalam pengolahan citra yang sering dilakukan adalah cropping. Dengan cropping, bagian yang tidak relevan pada gambar seperti background dapat dihilangkan sehingga dapat fokus terhadap wilayah yang relevan (Miljkovi`c, 2009).

2.2.1. Contrast Enhancement

Contrast Enhancement adalah salah satu jenis operasi dalam pengolahan citra. Pada citra mammogram, contrast enhancement adalah proses memanipulasi citra mammogram untuk meningkatkan kekontrasan gambar tersebut dan dapat mengurangi noise pada saat mendeteksi bagian lesi yang abnormal (Biltawi, Al- Najdawi, & Tedmori, 2012). Tujuan dari contrast enhancement ini ialah untuk menghilangkan pixel-pixel gelap yang terdapat pada daerah abnormal (Mencattini,

(4)

Rabottino, Salmeri, Lojacono, & Colini, 2008). Nilai kontras yang terdapat pada daerah ROI dapat ditingkatkan dengan menggunakan persamaan:

(2. 1)

di mana k = 2,3,4,… dan merupakan nilai intensitas pixel pada citra asli , merupakan hasil peningkatan masing-masing citra. Sedangkan

merupakan intensitas maksimum dari citra asli.

Gambar 2. 2. Gambar Sebelum dan Sesudah Dilakukan Contrast Enhancement (MathWorks, 2015)

2.2.2. Histogram Equalization

Histogram equalization merupakan salah satu teknik peningkatan kontras citra yang sering digunakan pada gambar terang atau gelap dalam domain spasial (Patel, Maravi, & Sharma, 2013). Dengan histogram equalization, kontras gambar akan meningkat secara menyeluruh (global). Kontras gambar dimodifikasi dengan dengan cara melebarkan puncak dan memampatkan palung histogram (Sasi &

(5)

Jayasree, 2013) . Proses ini dilakukan dengan menggunakan cummulative density function menggunakan persamaan berikut:

(2. 2)

dimana N adalah jumlah pixel citra dengan L level intensitas dan adalah jumlah pixel pada intensitas level .

Gambar 2. 3. Gambar Original dan Gambar Hasil Histogram Equalization (Fishbaugh, 2015)

2.2.3. Contrast Limited Adaptize Histogram Equalization

Teknik Contrast Limited Adaptize Histogram Equalization (CLAHE) merupakan teknik peningkatan kontras yang sering digunakan pada medical images (Reza, 2004). CLAHE merupakan peningkatan dari histogram equalization karena dapat beradaptasi dengan kontras lokal. Puncak histogram (peaks) pada citra bisa saja merupakan area yang tidak diinginkan, sehingga histogram equalization dapat keliru dan menyebabkan wilayah yang tidak diingikan meluas (noise).

(6)

Dalam Contrast Limited Adaptize Histogram Equalization (CLAHE), citra dipotong menjadi beberapa citra kecil dan kemudian dilakukan equalization pada setiap potongan citra (Min, Lim, Kim, & Lee, 2013). Blocking artifacts antar potongan citra dihilangkan dengan cara dilakukan bilinear interpolation. Dengan CLAHE, kontras pada wilayah yang homogen dapat dibatasi sehingga noise amplification dapat dihindarkan.

Gambar 2. 4. Gambar Original dan Gambar Hasil CLAHE (MathWorks, 2015)

2.2.4. Modified Seed Region Growing

Seed Region Growth adalah sebuah proses dimana sebuah pixel atau kumpulan pixel berkembang menjadi wilayah yang lebih besar dengan menentukan kriteria diawal. Metode dasar dari SRG dimulai dari kumpulan seed yang ditaruh, kemudian pixel-pixel tetangga disekitar nya yang memiliki kemiripan karakteristik dengan seed akan membuat satu wilayah. Untuk pemilihan karakteristik seed, bergantung pada fitur dari masalah yang ingin diselesaikan. Apabila tidak ada pixel lagi yang memiliki karakteristik mirip dengan seed, maka wilayah yang berkembang akan berhenti (Shengjun, Houjin, &

Jupeng, 2011).

(7)

Gambar 2. 5. Region Sebelum dan Sesudah Seed Growthing (Marshall, 2015)

Pada umumnya, seed akan berkembang jika selisih antara mean dari wilayah seed dengan pixel atas, kiri, kanan, atau bawah masih lebih besar dari batas T yang ditentukan. Namun pada modified seed region growing, seed juga akan berkembang jika intensitas pixel disekitar wilayah masih lebih besar dari P dimana P merupakan intensity threshold.

2.2.5. Divide and Conquer Homogeneity Enhancement Algorithm

DHCEA merupakan sebuah algoritma enhancement citra dengan melihat kesamaaan pixel disekelilingnya pada digital mammogram (Maitra, Nag, &

Bandyopadhyay, Detection of Abnormal Masses using Divide and Conquer Algorithm in Digital Mammogram, 2011). Pada metode ini akan ditentukan nilai perbedaan threshold maksimum / maximum difference threshold (MDT) yang didapatkan berdasarkan observasi. Algoritma ini melakukan scanning dari kiri ke kanan serta atas ke bawah dari gambar mammogram. Jika pada saat scanning, ditemukan pixel yang memiliki selisih lebih besar dari MDT, maka kumpulan pixel akan dipecah menjadi 2 bagian berdasarkan pixel yang berbeda tersebut.

Pada kumpulan pertama pixel akan dihitung nilai modus dari himpunan tersebut.

Nilai intensitas modus ini akan disebarkan ke seluruh posisi setelah memodifikasi

(8)

nilai tersebut menggunakan teknik uniform color quantization pada ruang warna yang dipecah menjadi skala 16 level. Proses ini akan berlangsung terus sampai mencapai ujung kanan dari baris terakhir citra mammogram. Proses yang sama juga akan dilakukan secara vertikal yang diikuti dengan uniform color quantization.

Berikut algoritma untuk proses horizontal :

1. Scan citra dari pixel paling kiri ke paling kanan 2. Cek apakah nilai pixel,

MDT-nilai pixel < intensitas pixel < MDT + nilai pixel

3. Jika nilai tidak sesuai, kelompokkan kumpulan pixel dari awal sampai akhir berdasarkan pixel yang berbeda pada langkah 2.

4. Dari kumpulan pixel yang mirip tersebut (dari pixel awal sampai pixel berbeda ), cari nilai modus dari semua pixel yang memiliki intensitas yang sama dan ubah semua pixel dari kumpulan tersebut setelah melakukan uniform color quantization pada kumpulan pixel.

5. Lanjutkan ke langkah 2 sampai ke pixel paling kanan dari baris terakhir citra.

Algoritma ini juga akan dilakukan untuk proses scanning secara vertical dari pixel paling atas sampai pixel paling bawah.

(9)

Gambar 2. 6. Pixel dengan Intensitas Berbeda (Kiri), Pixel Setelah Scanning Horizontal (Tengah), dan Pixel Setelah Scanning Vertical (Kanan) (Maitra, Nag,

& Bandyopadhyay, Detection of Abnormal Masses using Divide and Conquer Algorithm in Digital Mammogram, 2011)

2.2.6. Edge Detection Algorithm

Algoritma ini digunakan untuk mendeteksi edge pada citra mammogram setelah menjalan algoritma DCEHA. Proses pendeteksian edge ini dilakukan dalam 3 tahap. Pertama-tama dilakukan proses scanning citra secara horizontal dengan mengambil pixel pertama sebagai nilai threshold adaptif (Δt). Nilai ini akan dibandingkan dengan pixel berikutnya sampai mencapai ujung kanan. Jika terjadi perubahan intensitas pixel antara 2 pixel yang melebihi nilai threshold adaptif maka algortima ini akan menandakan pixel terakhir sebagai edge dan mengubah warna pixel tersebut menjadi hitam pada citra mammogram di tahap akhir.

(2. 3)

Selanjutnya algoritma ini akan dilakukan juga untuk vertical scanning.

Teknik yang sama pada horizontal dilakukan juga pada vertical scanning dengan menentukan pixel pertama sebagai nilai threshold adaptif. Jika terjadi perubahan intensitas pixel antara 2 pixel yang melebihi nilai threshold adaptif maka

(10)

algoritma ini akan menandakan pixel terakhir sebagai edge dan mengubah warna pixel tersebut menjadi hitam pada citra mammogram di tahap akhir.

(2. 4)

Setelah selesai melakukan horizontal dan vertical scanning maka akan dilakukan operasi penggabungan antara pixel hasil horizontal scanning dan vertical scanning untuk menghasil edge pada gambar mammogram.

Edge = ƒ(h) ∪ ƒ(v)

(2. 5)

(a) (b)

(c) (d)

Gambar 2. 7. Pixel setelah horizontal scanning (a), Pixel setelah vertical scanning (b), Pixel setelah gabungan vertical dan horizontal (c), Tampilan Pixel akhir dengan background putih (d) (Maitra, Nag, & Bandyopadhyay, Detection of Abnormal Masses using Divide and Conquer Algorithm in Digital Mammogram,

2011)

(11)

2.2.7. Seeded Region Growing Algorithm

Algoritma ini merupakan algorithma lanjutan dari Edge Detection Algorithm. Proses segmentasi yang dilakukan oleh Edge Detection Algorithm menyebabkan terbentuknya beberapa region dimana pixel didalamnya memiliki intensitas yang sama. Pada tahap ini, intensitas pixel pada sebuah region akan di ubah dengan modus dari pixel-pixel pada region tersebut dengan menggunakan intensitas citra awalnya (sebelum dilakukan DCHEA).

Algoritma ini diawali melakukan scanning secara horizontal dari kiri ke kanan untuk mencari bagian yang belum diwarnai. Jika ditemukan region yang belum diwarnai maka akan di taruh sebuah seed yang akan bertumbuh selama belum mencapai edge dengan memanfaatkan stack. Setelah seed selesai bertumbuh, dihitung modus dari wilayah tersebut namun memakai intensitas pixel pada citra awal sebelum dilakukan DCHEA. Nilai modus ini kemudian digunakan untuk mewarnai region tersebut. Jika sudah mencapai pojok kanan gambar, maka posisi scanning akan turun secara sumbu y dan melakukan horizontal scanning lagi diawal sampai mencapai ujung bawah kanan citra (Maitra, Nag, &

Bandyopadhyay, Detection of Abnormal Masses using Divide and Conquer Algorithm in Digital Mammogram, 2011). Berikut ini langkah-langkah melakukan SRGA:

1. Lakukan scan dari kiri citra pada baris pertama

2. Jika pixel belum di warnai dan bukan boundary edge, maka push seed tersebut kedalam Seed Stack

3. Cek pixel pada atas, kiri, bawah dan kanan dari seed tersebut

(12)

4. Jika pixel belum di warnai dan bukan boundary edge, maka push seed seed tersebut kedalam Seed Stack

5. Pop sebuah seed dari stack tersebut dan masukkan ke dalam Color List yang nantinya akan diwarnai.

6. Ulangi selama seed stack belum kosong dan sampai tidak ada lagi terdapat pixel yang belum diwarnai pada region tersebut, kemudian ulangi step 2 7. Setelah mendapatkan Color List, scan intensitas pada citra asli dan

hitunglah modus

8. Warnai region tersebut dengan modus pada tahap sebelumnya

9. Kosongkan Color List dan kembali ke tahap pertama sampai seluruh wilayah diwarnai.

2.3. Robust Regression

Linear regression telah menjadi salah satu alat statistik terpenting untuk menganalisa data. Akan tetapi, linear regression tidak dapat berfungsi dengan baik ketika distribusi error tidak normal. Untuk mengatasi permasalah ini, munculah robust regression, yang dapat membuat fitting criterion sehingga tidak rentan terhadap data noise.

Metode paling umum yang digunakan untuk robust regression ialah M- estimation (Fox & Weisberg, 2011). Asumsikan linear model

(2. 6)

untuk observasi ke i dari n observasi. Maka fitted modelnya ialah

(13)

(2. 7)

M-estimator akan meminimalisasi fungsi objektif

(2. 8)

dimana fungsi berisi kontribusi setiap residual kepada fungsi objektif. Fungsi harus memiliki karakteristik berikut :

 Selalu positif,

 Bernilai 0 jika argument yang berikan juga 0,

 Simetris,

Sebagai contoh, untuk estimasi least-square.

Asumsikan yang merupakan turunan dari . Turunan dari fungsi objektif dengan koefisien b dan dengan partial derivatives 0 akan menghasilkan sistem dengan k + 1 yang dapat mengestimasi persamaan terhadap koefisien- koefisien:

(2. 9)

Jika fungsi bobot w(e) = (e)/e, dan wi = w(ei) maka estimasi equation dapat dituliskan sebagai berikut

(2. 10)

(14)

Persamaan diatas merupakan problem weigted least-square, dengan tujuan meminimalkan Pada problem ini, bobot bergantung pada residual, namun residual bergantung pada estimated koefisien dan estimated koefisien bergantung pada bobot. Untuk mengatasinya dibutuhkan sebuah solusi iteratif ( yang dikenal iteratively reweighted least-squares) yang memiliki tahap-tahap berikut:

1. Tentukan nilai awal b(0)

2. Setiap iterasi t, hitunglah residual dan bobot dari iterasi sebelumnya.

3. Hitung weighted least squares yang baru

(2. 11) dimana X adalah matriks model, dengan untuk baris ke i dan W(t-1) = diag merupakan bobot dari matriks.

Ulangi tahap kedua dan ketiga sampai estimated koefisien menjadi konvergen. Matriks kovarians asymptotic dari b didefinisikan sebagai berikut

(2. 12)

Dengan menggunakan untuk mengestimasi E( ) dan untuk mengestimasi dapat menghasilkan estimated matriks kovarians asymptotic, (namun tidak baik jika sampel terlalu sedikit).

(15)

Tabel 2. 1. Fungsi Objektif dan Fungsi Bobot untuk Least-squares, Huber, dan Bisquare Estimator

Metode Fungsi Objektif Fungsi Bobot

Least-Squares

Huber

Bisquare

2.4. Shape Descriptor

Sebuah descriptor yang baik dapat menggambarkan karakteristik dari sebuah shape. Shape descriptor yang paling umum digunakan ialah area, circularity, eccentricity, major axis orientation dan bending energy (Yong, Walker, & Bowie, 1974). Shape descriptor tersebut hanya bisa membedakan shape yang memiliki perbedaan besar, oleh karena itu descriptor ini biasa digunakan sebagai filter yang bertujuan menghilangkan false hits shape atau dikombinasikan dengan descriptor lainnya agar dapat membedakan shape.

2.4.1. Eccentricity

Eccentricity merupakan pengukuran berdasarkan perbandingan/rasio antara major dan minor axis dari suatu objek. Eccentricity ini biasa diukur dengan menggunakan minimum bounding rectangular box.

(16)

Gambar 2. 8. Minimum Bounding Rectangular Box (Park, 2011)

Setelah terbentuk minimum bounding rectangular box, akan didapatkan L dan W sebagai panjang dan lebar kotak tersebut yang digunakan untuk menghitung dengan persamaan berikut :

Eccentricity = L / W

(2. 13) 2.4.2. Circularity

Circularity merupakan indikator seberapa mirip objek dengan lingkaran (Park, 2011). Objek dengan bentuk yang sangat rumit akan memiliki nilai circularity yang kecil.

Circularity ini diukur dengan menggunakan persamaan berikut : Circularity = perimeter2 / 4 * Pi * Area

(2. 14) 2.4.3. Solidity

Solidity merupakan indikator kepadatan dari sebuah objek (Sarfraz &

Ridha, 2007). Solidity diukur berdasarkan pebandingan/rasio antara luas objek dengan convex hull area dari objek tersebut yang didefinisikan sebagai persamaan berikut:

Solidity = Areashape / Areaconvex hull

(2. 15)

(17)

2.5. Ekstrasi Fitur

Ekstraksi fitur mendeskripsikan informasi relevan yang terkandung dalam sebuah pola sehingga pekerjaan klasifikasi akan menjadi lebih mudah. Dalam pengenalan pola dan pengolahan citra, ekstraksi fitur merupakan sebuah bentuk special dari reduksi dimensi. Tujuan utama dari fitur ekstraksi adalah mendapatkan informasi yang paling relevan dari data asli dan menampilkan informasi tersebut didalam dimensi yang lebih rendah. Ketika sebuah data yang dimasukkan kedalam algoritma terlalu besar untuk diproses maka data tersebut akan direduksi agar menghasilkan vektor fitur. Proses mengubah data input menjadi vektor fitur ini disebut proses ekstraksi fitur. Apabila proses ekstraksi fitur dilakukan secara hati-hati, maka dapat diharapkan vektor fitur akan berisikan informasi relevan dari data input sehingga pekerjaan yang menggunakan fitur ini tidak perlu menggunakan input dengan ukuran yang besar (Kumar & Bhatia, 2014).

2.5.1. Gray Level Co-occurrence Matrix

Gray Level Co-occurrence Matrix adalah sebuah teknik untuk mengevaluasi tekstur berdasarkan relasi spasial antar pixel pada citra. Metode ini menghitung banyaknya pasangan pixel dalam berbagai intensitas, yang saling berelasi spasial. Relasi spasial ini berarti relasi antara sebuah pixel dengan intensitas tertentu terhadap pixel lain pada jarak ( 1, 2 ..) dan sudut (0, 45, 90 , 135) tertentu. Kumpulan relasi spasial akan membentuk sebuah matriks yang disebut matriks kookurensi pada skala keabuan (gray level co-ocurence matrix).

(18)

Setelah mendapatkan matriks kookurensi, maka dapat dilakukan ekstraksi fitur dengan melakukan perhitungan statistik. Haralik menunjukan bahwa terdapat 14 fitur tekstur yang didefinisikan dalam persamaan dibawah ini (Haralick, Shanmugam, & Dinstein).

Notasi:

adalah nilai ke (i,j) pada matriks kookurensi adalah jumlah dari elemen matriks pada baris ke i adalah jumlah dari elemen matriks pada kolom ke j

Ng adalah tingkat kuantisasi keabuan pada citra

k = 2,3,…,2Ng (2.

16)

k = 0,1,…, Ng – 1. (2.

17) Fitur Tekstur:

1. Angular Second Moment

f1 =

(2.

18) 2. Contrast

f2 =

(2.

19) 3. Correlation

(19)

f3 =

(2. 20)

dimana dan adalah rata-rata dan standar deviasi dari px dan py. 4. Sum of Squares: Variances

f4 =

(2. 21) 5. Inverse Difference Moment

f5 =

(2. 22) 6. Sum Average

f6 =

(2. 23) 7. Sum Variance

f7 =

(2. 24) 8. Sum Entropy

f8 =

(2. 25) 9. Entropy

f9 =

(2. 26) 10. Difference Variance

f10 =

(2. 27) 11. Different Entropy

f11 =

(2. 28)

(20)

12. & 13. Information Measures of Correlation

f12 =

(2. 29)

f13 =

(2. 30)

(2. 31)

dimana HX dan HY adalah entropy dari px dan py, dan

(2. 32)

(2. 33)

2.6. Retrieval Citra Berbasis Konten

Retrieval Citra Berbasis Konten (Content Image Based Retrieval) memanfaatkan konten dari gambar untuk merepresentasikan dan melakukan indexing data (Wei & C.T. Li, Design of content-based multimedia retrieval, 2005).

(21)

Gambar 2. 9. Kerangka Konseptual untuk CBIR (Wei & C.T. Li, Design of content-based multimedia retrieval, 2005)

Sistem pencarian berbasis konten pada umumnya di bagi menjadi dua tahap, yakni tahap offline dan tahap online. Dalam tahap offline, dilakukan proses ekstraksi vektor fitur multi-dimensional, yang juga dikenal dengan descriptor.

Vektor fitur ini merupakan sebuah dataset fitur yang disimpan di dalam database.

Pada tahap online, user akan mengirimkan contoh query ke sistem pencarian gambar untuk mendapatkan gambar yang diinginkan. Distance atau similaritas yang dihasilkan antara fitur vektor pada contoh query dan fitur vektor yang terdapat dalam database akan digunakan untuk diurutkan. Proses retrieval dilakukan dengan menerapkan skema indexing untuk menyediakan sebuah cara yang efisien dalam melakukan pencarian dalam database citra. Setelah itu, sistem akan mengurutkan hasil pencarian yang paling sesuai dengan contoh query yang dikirimkan. Jika hasil tidak sesuai harapan, maka user dapat memberikan

(22)

feedback kepada sistem pencarian konten (Wei & C.T. Li, Design of content- based multimedia retrieval, 2005).

2.7. Kd-Tree Indexing

Kd-tree merupakan struktur data yang umum digunakan untuk mengatur titik-titik pada ruang multidimensional yang memiliki k dimensi (Otair, 2013).

Proses searching pada K-d tree bersifat binary dengan limitasi didalamnya. Kd- tree sangat membantu untuk melakukan pencarian seperti nearest neighbor dan range.

Pada K-D Tree, setiap node level akan menyimpan data dari dimensi pertama, kemudian node anaknya akan menyimpan data dari dimensi kedua, dan berulang seterusnya sampai k dimensi. Titik yang akan dimasukkan dipilih berdasarkan median dari titik-titik yang akan dimasukkan kedalam subtree. Proses ini akan berhenti ketika sebuah node mencapai nilai maximum jumlah titik yang telah ditentukan.

Gambar 2. 10. Ilustrasi Kd Tree

(23)

Pada saat melakukan pencarian titik sebanyak k terdekat dari query, kd- tree melakukan proses sebagai berikut (dengan ilustrasi Gambar 2. 9. ) :

1. Mencari lokasi node yang tepat untuk query. ( Node ke 4 )

2. Mencari k titik terdekat yang terletak didalam node sebelumnya pada proses pertama

3. Mencari nodes lain yang memiliki jarak yang sama dengan k points terdekat pada proses kedua. (Node ke 3)

4. Dari semua nodes, cari k titik terdekat dengan query.

2.8. Neural Network

Neural Network digunakan untuk men-generate kecenderungan peta untuk setiap mammogram dengan menggunakan fitur-fitur pada gabor sebagai input dari classifier. Nilai yang terdapat kecenderungan peta menunjukkan kemungkinan pixel tersebut untuk diklasifikasi sebagai pixel macrocalcification dimana semakin tinggi nilai pixel, maka kecenderungan pixel tersebut untuk diklasifikasi sebagai pixel macrocalcification semakin besar (Dheeba.J & Jiji.G, 2010).

Model yang terdapat pada multilayer perceptron (MLP) terdiri dari sebuah atau lebih hidden layer dan fungsi node-node yang terdapat pada hidden layer adalah sebagai penengah antara input dan output pada neural network. Pertama, sebuah vektor input dimasukkan ke dalam layer input pada neural network.

Selanjutnya, node yang terdapat pada layer input memberikan sinyal kepada node yang terdapat pada hidden layer. Sinyal output yang diberikan oleh hidden layer dapat dijadikan inputan bagi hidden layer selanjutnya atau output layer. Apabila terdapat error pada output, akan sangat sulit untuk menentukan berapa banyak

(24)

error yang ada dalam layer input, hidden, maupun output serta bagaimana cara menyesuaikan bobot untuk menghasilkan output yang sesuai (Sid-Ahmed, 1995).

Permasalahan ini dapat diselesaikan dengan mencari efek dari keseluruhan bobot dengan menggunakan algoritma backpropagation (Alginahi, 2004) yang merupakan generalisasi dari algoritma Least Mean Square (LMS). Nilai dari Mean Square Error (MSE) dapat dilihat pada persamaan berikut:

(2. 34)

di mana m merupakan jumlah data pada training set, k merupakan jumlah output, Tij merupakan nilai target output dari output ke-i untuk data training ke-j, dan Oij merupakan nilai output yang sebenarnya pada output ke-i untuk data training ke-j (Islam, Ahmadi, & Sid-Ahmed, 2010).

2.8.1. Radial Basis Function Neural Network

Secara umum, Radial basis function neural nework (RBF NNs) memiliki 3 layer yaitu input layer, hidden layer dan output layer (Yoo, Oh, & Pedrycz, 2015).

Gambar 2. 11. Arsitektur RBF Neural Network (Mathworks, 2016)

(25)

RBF Neural Network hanya memiliki satu hidden layer dan satu output linear layer. Setiap node pada hidden layer menentukan level aktivasi bagian reseptif (radial basis function) (x) yang diberikan input x. Output yj(x) merupakan kombinasi linear dengan bobot dari beberapa level aktivasi bagian reseptif dengan persamaan berikut

yj (x) =

(2. 35) dengan j = 1 , … , s dimana s berarti jumlah output ( sebanyak class yang ingin diklasifikasikan pada RBF NN). Pada level aktivasi akan digunakan Gaussian dengan persamaan berikut

(2. 36)

dimana x adalah input vector dengan dimensi n [x1, …, xn]T, dan vi = [vi1,

…, vin] merupakan pusat ke i dari fungsi basis sementara c merupakan jumlah node pada pada hidden layer. Distance yang digunakan pada persamaan 2.26 merupakan ecludian distance (Staiano, Tagliaferri, & Pedrycz, 2006).

2.9. Studi yang relevan

Penelitian mengenai pendeteksian kanker payudara pada citra mammogram telah dilakukan sebelumnya. Pada tahun 2008, Hanmandu, M et al mengusulkan sebuah computer aided detection untuk mendeteksi mass dan microcalcification menggunakan MIAS dataset dengan algoritma yang terpisah.

Pertama-tama Hanmandu melakukan segmentasi microcalcification dengan menggunakan filtering Laplacian of Gaussian (LoG) dan kemudian disegmentasi

(26)

menggunakan kontras lokal thresholding. Pada bagian mass, akan dilakukan segmentasi menggunakan enthropy thresholding. Penelitian ini dapat menghasilkan segmentasi yang baik namun tidak disertakan akurasi dari penelitian. (Hanmandlu, Vineel, Madasu, & Vasikarla, 2008)

Pada tahun 2011, Indra Kanta Maitra et al mengusulkan metode baru untuk melakukan segmentasi mass menggunakan Binary Homogeneity Enhancement Algorithm (BHEA). Metode ini sudah terautomisasi sehingga tidak membutuhkan parameter. Penelitian ini dilakukan menggunakan MIAS dataset dan mendapatkan akurasi 99.87% dengan sensitivity 94.21% dan specificity 92.99%. (Maitra, Nag, & Bandyopadhyay, AUTOMATED DIGITAL MAMMOGRAM SEGMENTATION FOR DETECTION OF ABNORMAL

MASSES USING BINARY HOMOGENEITY ENHANCEMENT

ALGORITHM, 2011)

Pada tahun 2011, Indra Kanta Maitra et al mengusulkan metode baru untuk melakukan segmentasi mass menggunakan Divide and Conquer Homogeneity Enhancement Algorithm (DCHEA). Metode ini sudah terautomisasi sehingga tidak membutuhkan parameter. Penelitian ini dilakukan menggunakan MIAS dataset dan mendapatkan akurasi 99.90% dengan sensitivity 96.06% dan specificity 95.21%. (Maitra, Nag, & Bandyopadhyay, Detection of Abnormal Masses using Divide and Conquer Algorithm in Digital Mammogram, 2011)

Pada tahun 2011, Zhang et al mengusulkan metode baru untuk melakukan segmentasi microcalcification menggunakan multi-resolution region growth dan segmentasi berdasarkan image difference. Metode ini menggunakan MIAS dataset

(27)

dan menghasilkan akurasi 94.78% dengan false positive 1.93. (Shengjun, Houjin,

& Jupeng, 2011).

Adapun beberapa penelitian lain yang telah dilakukan dapat dilihat pada Tabel 2.2.

Tabel 2. 2. Perbandingan Beberapa Penelitian terhadap Digital Mammogram

Publikasi Masalah Metode

Deteksi

Metode Diagnosis

Metode CBIR (Luwinda &

Santika, 2012)

Ekstraksi fitur menggunakan NMF, LNMF dan

nsNMF pada

Klasifikasi Mammogram)

- NMF, LNMF

dan nsNMF dengan

Classifier Neural Network

-

(David &

Santika, 2012)

Computer Aided Diagnosis System untuk Digital Mammogram

- Dual Tree

Complex Wavelet

Transform (DT CWT) dengan Classifier Neural

Network (NN) -

(Sanjaya, Putra, &

Santika, 2012)

Sistem Klasifikasi Mammogram

- Law’s Texture

En

ergy Measures (LTEM)

dengan

Classifier KNN (K Nearest Neighbour)

-

(Kosasi, Setiawan, Sudarsan, &

Santika, 2012)

Diagnosis Kanker Payudara

berdasarkan Microcalcification

- Gray Level Co-

Occurrence Matrix (GLCM) dengan Classifier Support Vector Machine

(SVM)

-

(28)

(Angries &

Santika, 2012)

Klasifikasi Kanker Payudara pada Mammogram

- GLCM, GL

RLM, dan Chip Histogram dengan

Classifer Naïve Bayes

-

(Diana &

Santika, 2012)

Sistem

pengambilan Citra Mammogram

- - NMF dan

DT CWT (Pratiwi,

Alexander, Harefa, &

Nanda, 2015)

Komparasi

Classifier BPNN dan RBFNN pada Mammogram

- GLCM dengan

Classifier

BPNN dan

RBFNN

-

(Alexander

& Santika, 2016)

Sistem CADD untuk Deteksi, Diagnosa dan Similarity Search

Seed Growing, Robust Regression dan Shape Descriptor

GLCM dengan Classifier RBFNN

GLCM dengan KD-Tree Indexing

Jika dilihat dari perbandingan Tabel 2.2, penelitian sebelumnya hanya menerapkan sistem diagnosis ataupun sistem CBIR pada gambar mammogram.

Tidak ada penelitian yang menggabungkan metode deteksi, diagnosis serta similarity search. Mayoritas dari penelitian telah mampu mendeteksi kanker payudara dengan akurasi yang cukup tinggi namun rata-rata penelitian hanya berpusat pada satu jenis kanker yaitu mass atau microcalcification. Melihat dari banyaknya penelitian yang hanya berpusat pada satu jenis kanker dan tidak adanya penggabungan antara metode deteksi, diagnosis dan similarity search, penelitian saat ini akan membangun sebuah sistem CADD yang dapat digunakan untuk mendeteksi, men-diagnosis serta melakukan pencarian kanker sejenis baik

mass maupun microcalcification.

Gambar

Gambar 2. 1. Tahap-tahap dalam CADe dan CADx (Bovik, 2005)
Gambar 2. 2. Gambar Sebelum dan Sesudah Dilakukan Contrast Enhancement  (MathWorks, 2015)
Gambar 2. 3. Gambar Original dan Gambar Hasil Histogram Equalization  (Fishbaugh, 2015)
Gambar 2. 4. Gambar Original dan Gambar Hasil CLAHE (MathWorks, 2015)
+7

Referensi

Dokumen terkait

Pada proses pemanasan, pelat baja dipanaskan hingga temperatur austenit dengan tujuan antara lain untuk melarutkan berbagai paduan yang terdapat dalam baja, dan untuk

Aplikasi ini nantinya hanya akan mencatat informasi tentang member antara lain nama, alamat, nomor handphone, nomor telepon, nomor identitas yang berupa KTP, SIM atau pasport,

Dalam penelitian ini, Penulis akan m eneliti seni bonsai yang ada di Jepang dengan m enghubungkan konsep ajaran Buddha te nta ng ke hidupan dan kem atian yang ditinja u

Jika gambar 3.1 menggambar konfigurasi untuk layanan voice, gambar 3.6 menggambarkan konfigurasi PT Grand Asia Brilliant China untuk layanan Data dengan bandwidth yang

1) Administrator mempunyai tugas untuk melakukan plotting dan melihat laporan. Plotting adalah proses pemasangan antara data pengajuan mahasiswa dan data panelis

Cairan yang mudah terbakar didefinisikan oleh peraturan barang berbahaya sebagai cairan, campuran cairan atau cairan yang mengandung padatan dalam larutan atau

Hal ini menunjukkan bahwa kompensasi yang diberikan oleh perusahaan dirasakan sudah cukup adil dan layak serta seuai dengan yang diharapkan karyawan sehingga memberikan dampak

Perempuan sangat terkekang dalam adat budaya Jawa yang harus di anut, dari.. situ adat budaya Jawa memunculkan sedemikian kuat sebuah