Analisis kinerja metode entropy dalam penentuan bobot awal learning vector quantization pada proses klasifikasi Chapter III V

(1)

BAB 3

METODOLOGI PENELITIAN

Bab ini menjelaskan tahapan-tahapan yang dilakukan dalam penelitian, mulai dari dataset yang digunakan dalam melatih dan menguji LVQ, arsitektur jaringan pada

LVQ dengan menggunakan Entropy sebagai penentuan vektor bobot awalnya, dan contoh dari perhitungan penelitian.

3.1. Tahapan Penelitian

Tahapan penelitian ditunjukkan pada Gambar 3.1 di bawah ini :

Gambar 3.1 Tahapan Penelitian

3.2. Dataset yang Digunakan

Pada penelitian ini digunakan dataset (kumpulan data) yang berasal dari UCI Machine Learning Repository yaitu dataset breast cancer. Dataset ini terdiri dari 699 jumlah

Dataset yang digunakan

Rancangan Arsitektur

JST LVQ

Normalisasi dan Pembobotan dengan

Entropy

Training & Testing JST

LVQ

(2)

data pasien, dengan klasifikasi 458 (65,5%) pasien kanker jinak dan 241 (34,5%) pasien kanker ganas. Pada dataset tersebut terdapat satu atribut sebagai kode pasien, 9 kriteria/atribut yang masing-masing atribut memiliki skala data dari 1-10 dan satu atribut lagi sebagai output dari kesembilan kriteria sebelumnya yaitu klasfikasi sebagai tumor jinak atau ganas. Namun dataset ini memiliki nilai yang hilang (missing value) beberapa atribut dan akan diganti dengan metode median yaitu dengan mencari nilai tengah, metode ini adalah metode yang paling baik untuk kasus dataset tersebut (Nurul et al, 2012). Adapun atribut/kriteria dan nilai dari dataset breast cancer dapat dilihat pada Tabel 3.1

Tabel 3.1 Atribut Data

No. Atribut/Kriteria Nilai

1 Sample code number Kode Pasien

2 Clump Thickness (X1) 1 sampai 10

3 Uniformity of Cell Size (X2) 1 sampai 10 4 Uniformity of Cell Shape (X3) 1 sampai 10

5 Marginal Adhesion (X4) 1 sampai 10

6 Single Epithelial Cell Size (X5) 1 sampai 10

7 Bare Nuclei (X6) 1 sampai 10

8 Bland Chromatin (X7) 1 sampai 10

9 Normal Nucleoli (X8) 1 sampai 10

10 Mitoses (X9) 1 sampai 10

11 Class (target) kanker jinak,

kanker ganas

Dataset pasien dipisah sesuai target kelas untuk masuk ke dalam proses perhitungan Entropy untuk menentukan vektor bobot terbaik yang dijadikan perwakilan setiap kelasnya. Adapun contoh dataset breast cancer ditunjukkan pada Tabel 3.2 , Tabel 3.3 dan Tabel 3.4.

Tabel 3.2 Dataset Kelas Kanker Jinak

No. Kode Pasien Atribut/Kriteria

X1 X2 X3 X4 X5 X6 X7 X8 X9

1 1000025 5 1 1 1 2 1 3 1 1

2 1002945 5 4 4 5 7 10 3 2 1

3 1015425 3 1 1 1 2 2 3 1 1

(3)

Tabel 3.3 Dataset Kelas Kanker Jinak (lanjutan)

X1 X2 X3 X4 X5 X6 X7 X8 X9

Tabel 3.4 Dataset Kelas Kanker Ganas

X1 X2 X3 X4 X5 X6 X7 X8 X9

3.3. Perancangan Arsitektur JST LVQ

Arsitektur JST LVQ yang dibangun (lihat Gambar 3.2) memiliki satu lapisan input dan satu lapisan output dengan parameter sebagai berikut.

1. Jumlah Node pada Lapisan Input (Input Layer)

(4)

yaitu atribut ke-2 sampai ke-10, karena kesembilan atribut tersebut merupakan kriteria-kriteria yang dapat menentukan output dari klasifikasi. Sedangkan atribut ke-1 hanya sebagai inisial kode dari setiap pasien.

2. Jumlah Node pada Lapisan Output (Output Layer)

Lapisan output pada LVQ merupakan lapisan untuk memproses data input yang kemudian mencari jarak antara data input dan bobot awal secara kompetitif yang kemudian dijadikan sebagai output untuk menentukan pada kelas mana data input tersebut berada. Jumlah node pada lapisan output terdiri dari 2 node karena didapat dari target dataset yang dihasilkan memiliki 2 kelas yang berbeda yaitu kanker jinak dan kanker ganas. Untuk arsitektur JST pada penelitian ini ditunjukkan pada Gambar 3.2.

Gambar 3.2 Arsitektur JST LVQ

Selanjutnya dalam penentuan parameter-parameter pada JST yaitu nilai laju pembelajaran (learning rate), penururan tingkat pembelajaran (decrease rate), dan maksimum iterasi (epoch). Untuk learning rate (α), jika nilai terlalu besar, amak algoritma akan menjadi tidak stabil, sebaliknya jika terlalu besar makan proses nya akan terlalu lama, oleh karena itu nilai learning rate haruslah 0 < α < 1 (Safwandi,

X2

X3

X5

X4

X7

X6

║x - w1║

║x – w2║

Kanker Jinak

Kanker Ganas X1

X8

(5)

2016). Pada penelitian tesis ini, penentuan konstanta learning rate mengacu pada penelitian sebelumnya, dimana penelitian tersebut menggunakan dataset yang sama pada penilitian tesis ini. Peneliti sebelumnya mendapatkan parameter yang memiliki hasil terbaik dalam klasifikasi breast cancer menggunakan JST LVQ standar, yaitu 0,1 untuk learning rate dan 0,3 untuk penurunan tingkat pembelarajan (Nurdiyanto, 2015).

3.4. Penentuan Bobot Awal menggunakan Metode Entropy

Pada proses penentuan vektor bobot awal dengan metode Entropy dilakukan dengan dua cara yaitu :

1. Penentunan vektor bobot awal langsung dihasilkan dari perhitungan menggunakan Entropy dari dataset pasien dalam setiap kelasnya. Alur dalam penentuan bobot awal dengan cara pertama dapat dilihat pada Gambar.3.3.

Gambar 3.3 Penentuan Bobot Awal Cara Pertama

Berikut contoh perhitungan penentuan bobot awal menggunakan Entropy cara pertama dengan dataset pasien kanker jinak yang ditampilkan pada Tabel 3.5.

Start

Nilai Data Pasien setiap

Kelas

Normalisasi Nilai Setiap Atribut

Jumlahkan Nilai yang Telah Dinormalisasikan Setiap

Atribut

Hitung Konstanta Entropy

Hitung Entropy Setiap Atribut

Hitung Total Entropy

Hitung Bobot Entropy Setiap Atribut

Stop A

(6)

Tabel 3.5 Contoh Dataset Entropy Cara Pertama

X1 X2 X3 X4 X5 X6 X7 X8 X9

a. Normalisasi Nilai Setiap Atribut Xi

Hasil normalisasi dari Tabel 3.5 dapat dilihat pada Tabel 3.6. Tabel 3.6 Contoh Normalisasi Entropy Cara Pertama

Kode Pasien

(7)

Dengan :

∑ , maka :

c. Perhitungan Bobot Entropy untuk setiap kriteria ke-i

̅ [ ] ̅ 

maka didapatkan :

̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅

d. Dataset pasien breast cancer memiliki nilai range dari 1 hingga 10 maka bobot Entropy dikalikan 10, maka vektor bobot yang dihasilkan dapat dilihat pada Tabel 3.7

Tabel 3.7 Contoh Vektor Bobot Entropy Cara Pertama

Atribut X1 X2 X3 X4 X5 X6 X7 X8 X9

Bobot 0,4986 1,7396 1,5499 1,0347 0,5592 1,8347 0,1531 1,5355 1,0947

(8)

Gambar 3.4 Penentuan Bobot Awal Cara Kedua

Berikut contoh perhitungan penentuan bobot awal menggunakan Entropy cara pertama dengan beberapa dataset pasien kanker ganas yang dilihat pada Tabel 3.8.

Tabel 3.8 Contoh Dataset Entropy Cara Kedua

X1 X2 X3 X4 X5 X6 X7 X8 X9

a. Normalisasi Nilai Setiap Atribut Xi

(9)

Tabel 3.9 Contoh Normalisasi Entropy Cara Kedua

b. Perhitungan Entropy untuk setiap kriteria ke-i

c. Perhitungan Bobot Entropy untuk setiap kriteria ke-i

̅ [ ] ̅ 

maka didapatkan :

(10)

̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅

d. Bobot Entropy dikalikan dengan nilai dari setiap data pasien dan diranking sehingga menghasilkan pasien yang memiliki nilai tertinggi, maka vektor bobot yang dihasilkan dapat dilihat pada Tabel 3.10.

Tabel 3.10 Contoh Vektor Bobot Entropy Cara Kedua

Atribut X1 X2 X3 X4 X5 X6 X7 X8 X9

Bobot 8 10 10 8 7 10 9 7 1

Penentuan vektor bobot menggunakan Entropy dan pemilihan data pasien sebagai vektor bobot tersebut diharapkan dapat menghasilkan proses pembelajaran dan tingkat akurasi dapat lebih baik dibandingkan LVQ standar.

3.5. Training JST LVQ

Setelah menentukan arsitektur dan penentuan vektor bobot awal pada JST LVQ maka langkah selanjutnya adalah melakukan proses training dan testing dataset. Training

dataset bertujuan untuk pembelajaran dari setiap masukkan data pasien agar jaringan mengenali pola masukkan sehingga dapat mengklasifikasikan data pasien sesuai kelasnya. LVQ akan mengenali pola masukkan berdasarkan pada pendekatan jarak antara dua vektor yaitu vektor dari unit masukkan dengan vektor bobot. Karena dalam penelitian ini mengharapkan tingkat pembelajran dan tingkat akurasi yang cepat makan data yang digunakan pada saat traning akan bervariasi. Hal itu dilakukan untuk mengetahui cara penentuan vektor bobot awal yang mana akan menghasilkan proses pembelajaran data yang cepat. Dalam penenlitian ini data yang digunakan untuk proses traning adalah sebanyak 697 dan 2 data pasien pertama pada kelas yang berbeda digunakan sebagai vektor bobot pada LVQ standar.

Dalam traninig JST LVQ membutuhkan sejumlah data training. Data training

(11)

pembelajaran ataupun pengelanan pola dataset. Pada penelitian ini jumlah data pasien yang akan dilatih bervariasi, yaitu 20, 50, 100, dan 350 data dari 697 dataset pasien. Dataset training tersebut juga akan dijadikan sebagai data masukan dari proses perhitungan algoritma JST LVQ. Untuk menentukan data pasien mana yang akan menjadi data training, maka digunakan metode statistik yaitu standar deviasi. Standar deviasi sendiri memiliki kemampuan dalam mencari tingkat keberagaman yang baik pada suatu sekumpulan dataset.

√ ∑ ∑

(3.1)

dimana,

s = standar deviasi n = ukuran sampel

Penentuan jumlah data training sebanyak 20 dilakukan dengan membagi 697 dataset ke dalam 20 data pasien sehingga menghasilkan 35 dataset. Kemudian 35 dataset tersetbut yakan dihitungan masing-masing standar deviasinya dan dibandingkan nilai standar deviasi. Dataset yang menghasilkan standar deviasi tertinggi akan dijadikan perwakilan sebagai data traninng (data masukan). Begitu juga untuk mencari jumlah data training 50, 100 dan 350. Untuk jumlah data training

sebanyak 50 maka ada 14 dataset yang akan dihitung dan dibandingkan nilai standar deviasinya. Pada jumlah data training sebanyak 100 maka ada 7 dataset yang akan dihitung dan dibandingkan nillai standar deviasinya. Begitu juga untuk jumlah data

training 350 maka ada 2 dataset yang akan dihitung dan dibandingkan standar deviasinya. Penentuan jumlah data training tersebut diharapkan menghasilkan data

training yang memiliki tingkat keberagaman yang tinggi sehingga dapat mewakili keseluruhan dataset. Flowchart training JST LVQ dapat dilihat pada Gambar 3.5.

Begitu juga untuk jumlah iterasi, pada penelitian ini memilki jumlah data yang beravariatif yakni sebanayak 5, 10, dan 20 iterasi. Setiap vektor bobot akhir yang dihasilkan dalam setiap proses pembelajaran data, akan digunakan dalam setiap proses

training pada data selanjutnya hingga akhir iterasi.

(12)

Gambar 3.5 Flowchart Training JST LVQ Start

Data Input (X), Target, dan Parameter (MaxEpoch, α)

Penetuan Vektor Bobot Awal dengan Entropy

Epoch = Epoch + 1

Baca Xi

Hitung Jarak ║Xi - Wj║

Temukan Jarak Terpendek Xi

Sesuai Target ?

Wj’ = Wj + α (Xi – Wj) Wj’ = Wj - α (Xi – Wj) Tidak Ya

Mengurangi nilai α = α - Deca atau α = α * Deca

Ya

Bobot Akhir

Ya

Stop Epoch = 0

Xi = n Tidak

(13)

3.6. Testing JST LVQ

Setelah dilakukan pelatatihan terhadap semua data maka akan diperolah vektor bobot akhir (w). Bobot tersebut selanjutnya akan digunakan untuk melakukan proses simulasi atau testing data. Data untuk proses testing terdiri dari sisa data pada setiap jumlah data training. Untuk jumlah data training sebanyak 20 maka jumlah data

testing sebanyak 677 data. Untuk jumlah data training sebanyak 50 maka jumlah data

testing sebanyak 647 data. Untuk jumlah data training sebanyak 100 maka jumlah data testing sebanyak 597 data. Kemudian untuk jumlah data training sebanyak 350 maka jumlah data testing sebanyak 347. Flowchat testing JST LVQ pada penelitian ini dapat dilihat pada Gambar 3.6.

Gambar 3.6 Flowchart Testing JST

Start

Data Input Testing (Xi), Target, dan Vektor Bobot

Akhir (Wj)

Hitung Jarak Xi-Wj

Temukan Jarak Terpendek

Jumlah Kelas yang Dikenali dan Tidak

Dikenali

Stop Baca Xi

Sesuai Target

Kelas Sesuai

Target Sesuai TargetKelas Tidak Tidak Ya

Xi = n Input? Tidak

(14)

3.7. Perhitungan Nilai Akurasi

Pada evaluasi penelitian ini, untuk mengentahui seberapa tingkat akurasi pengklasifikasian pasien breast cancer akan dilakukan dengan cara membandingkan dengan LVQ standar. Dalam menentukan vektor bobot awalnya diambil dari data pasien pertama dan kedua sesuai kelasnya tanpa menormalisasikan data, serta learning rate yaitu 0,1 dan penururan tingkat pembelajaran yaitu 0,3. Kemudian untuk parameter pengujian nilai dalam penelitian ini akan digunakan parameter seperti pada Tabel 3.11.

Tabel 3.11 Parameter Pengujian Nilai

Parameter Pengujian Nilai

Jumlah Iterasi 5,10,20

Jumlah Data Training 20, 50, 100, 350

Proses perhitungan dalam penelitian ini dimulai dari pembagian dataset pasien ke dalam dua kelas yaitu 457 data pasien kanker jinak sebanyak dan 240 data kanker ganas. Kedua kelas dataset tersebut selanjutnya diproses menggunakan metode

Entropy untuk menentukan vektor bobot awal pada masing-masing kelas. Pada proses metode Entropy, dimulai dengan menormalisasikan keseluruhan dataset pada setiap kelas. Kemudian masuk ke dalam proses perhitungan Entropy untuk setiap atirbut/kriteria.

 Proses Perhitungan Entropy pada Kelas Kanker Jinak

o _Perhitungan_Entropy_{untuk setiap kriteria ke-i}

(15)

Dengan :

∑ , maka :

o _{Perhitungan Bobot}_Entropy_{untuk setiap kriteria ke-i}

̅ [ ] ̅ 

 Proses Perhitungan Entropy pada Kelas Kanker Ganas

(16)

o _{Perhitungan Bobot}_Entropy_{untuk setiap kriteria ke-i}

̅ [ ] ̅ 

maka didapatkan :

̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅ ̅

 Perhitungan Penentuan Vektor Bobot Awal dengan Entropy

o _{Perhitungan Cara Pertama}

Nilai Bobot Entropy dikalikan dengan 10 pada setiap atributnya karena nilai pada setiap dataset breast cancer memiliki range nilai antara 1 sampai 10. Maka vektor bobot awal yang dihasilkan ditunjukkan pada Tabel 3.12.

Tabel 3.12 Contoh Perhitungan Vektor Bobot Cara Pertama

Kelas W1 W2 W3 W4 W5 W6 W7 W8 W9

JINAK 1,2920 1,1585 1,2977 1,3003 0,5335 1,6575 0,9206 1,4248 0,4151

GANAS 0,4990 0,7371 0,6389 1,4459 0,8266 0,8327 0,6031 1,4767 2,9501

o _{Perhitungan Cara Kedua}

Bobot Entropy dikalikan dengan nilai dari setiap data pasien dan diranking sehingga menghasilkan pasien yang memiliki nilai tertinggi. Maka vektor bobot yang dihasilkan ditunjukkan pada Tabel 3.13.

Tabel 3.13 Contoh Perhitungan Vektor Bobot Cara Kedua

JINAK 1 1 1 1 1 1 1 1 1

(17)

 Penentuan Dataset Training menggunakan Standar Deviasi

Dalam contoh ini, jumlah data training yang digunakan sebanyak 20 data dari 697 data pasien dan 2 data pasien pada kelas berbeda digunakan sebagai vektor bobot awal untuk LVQ biasa. Untuk menentukan data pasien mana yang akan dijadikan data training maka dilakukan dengan cara perhitungan statistik yaitu perhitungan standar deviasi. Dengan standar deviasi akan didapatkan data yang mempunyai keberagaman yang lebih baik. Maka 697 akan dibagi dengan 20 sehingga menghasilkan 35 dataset . Kemudian 35 dataset tersebut dihitung standar deviasinya dan nilainya dibandingkan. Dataset yang memiliki nilai standar deviasi

yang tertinggi akan dijadikan dataset dalam proses training. Maka dataset yang dihasilkan dapat dilihat pada Tabel 3.13.

Tabel 3.13 Data Training 20 Pasien dari Hasil Standar Deviasi

No. Kode

 Perhitungan Proses Training pada JST LVQ

(18)

10 iterasi(epoch). 20 dataset yang telah ditentukan pada proses sebelumnya akan digunakan sebagai inputan pada proses training.

o _Training_pada_Entropy_{Cara Pertama}

Iterasi ke-1

Data inputan ke-1 : (1,1,1,1,2,1,3,1,1) Jarak pada :

 Bobot Ke-1 =√

= 3,1993

 Bobot Ke-2 =√

= 4,3788

Jarak terkecil didapat pada Bobot Ke-1 dan target data 1 = 2, maka data ke-1 sesuai dengan target.

Bobot ke-1 baru adalah

W(baru) = W(lama) + α (X – W(lama)) = (1,4628 ; 1,1427 : 1,2679 : 1,2703 ; 0,6802 ; 1,6918 ; 1,1285 ; 1.3823 ; 0.4736)

Data inputan ke-2 : (5,1,1,1,2,1,3,1,1) Jarak pada :

 Bobot Ke-1 =√

= 12,6115

 Bobot Ke-2 =√

= 13,8691

Bobot ke-1 baru adalah

W(baru) = W(lama) + α (X – W(lama)) = (1,9165; 1,8284: 1,9411: 1,2433; 0, 9121; 1,9226; 1,3157; 1.9441; 0.5262)

(19)

Bobot ke-1 baru : (2,6852 ; 0,9497 ; 0,9648 ; 0,9664 ; 1,7996 ; 1,6832 ; 2,4115 ; 0,8536 ; 1,2657)

Bobot ke-2 baru : (6,9302 ; 4,5274 ; 4,4022 ; 6,2760 ; 4,8983 ; 6,4282 ; 4,7865 ; 4,2461 ; 2,4632)

o _Training_pada_Entropy_{Cara Kedua}

Proses training dilakukan dengan cara yang sama pada Entropy Cara Pertama. Dihitung hingga data ke-20 dan epoch ke-10. Sehingga menghasilkan bobot ke-1 dan bobot ke-2 yang baru, yaitu :

Bobot ke-1 baru : (2,2369; 0,6734; 0,4669; 0,6685; 1,4827; 1, 9035; 2,2541; 0,5663; 1,3718)

Bobot ke-2 baru : (8,3314 ; 6,8984 ; 6,3763 ; 8,5513 ; 6,9803 ; 9,8767 ; 6,7225 ; 6,2892 ; 4,2076)

o Training pada LVQ Biasa

Proses training dilakukan dengan cara yang sama pada Entropy Cara Pertama. Dihitung hingga data ke-20 dan epoch ke-10. Sehingga menghasilkan bobot ke-1 dan bobot ke-2 yang baru, yaitu :

Bobot ke-1 baru : (2,3430 ; 0,5943 ; 0,3868 ; 0, 6675 ; 1,4976 ; 1,8332 ; 2,3076 ; 0,4978 ; 1,3734)

Bobot ke-2 baru : (8,2117 ; 5,4951 ; 4,9668 ; 7,7992 ; 6,6472 ; 10,1771 ; 5,6753 ; 5,3569 ; 2,2533)

 Perhitungan Proses Testing

Proses testing dilakukan dengan sisa jumlah datapasien yang belum diolah yaitu 697 – 20 = 677 data pasien. Proses testing akan mencari berapa banyak data pasien yang sesuai dengan kelasnya.

o Testing pada Entrpopy Cara Pertama Data testing ke-1 : (5,4,4,5,7,10,3,2,1) Jarak pada :

 Bobot Ke-1 =√

(20)

 Bobot Ke-2 =√

= 11,2074

Proses tersebut dilakukan hingga data ke-677, sehingga diperoleh jumlah data yang sesuai pada kelasnya ada sebanyak 658 data dan yang tidak sesuai sebanyak 17 data pasien. Maka diperoleh tingkat akurasi pada Entropy cara Pertama sebesar 660/677 = 97,48 %.

o _Testing_pada_Entropy_{Cara Kedua}

Proses testing dilakukan dengan cara yang sama juga dengan cara Entropy

Pertama. Sehingga meghasilkan jumlah data yang sesuai dengan kelasnya sebanyak 643 data dan yang tidak sesuai sebanyak 34 data pasien. Maka diperoleh tingkat akurasi pada Entropy cara Kedua sebesar 643/677 = 94,97 %.

o _Testing_pada_LVQ_Standar

Proses testing dilakukan dengan cara yang sama juga dengan cara Entropy

(21)

BAB 4

HASIL DAN PEMBAHASAN

4.1. Pendahuluan

Pada bab ini menjelaskan bagaimana hasil penelitian dan pembahasan dari kinerja metode Entropy untuk menentukan vektor bobot awal pada LVQ terhadap tingkat akurasi yang dihasilkan. Vektor bobot awal yang dihasilkan oleh metode Entropy

diharapkan mendapatkan tingkat akurasi yang lebih baik pada proses klasifikasi jika dibandingkan dengan cara LVQ standar.

Penelitian dilakukan dengan menggunakan daataset pasien breast cancer yang didapat UCI Machine Learning Repository yang disumbang oleh Rumah Sakit University of Wisconsin Madison. Dataset yang digunakan sebanyak 699 data pasien

yang terdiri dua kelas yaitu 458 data pasien kanker jinak dan 241 pasien kanker ganas. Kemudian dataset tersebut dilakukan proses training LVQ untuk mengenali data agar dapat diuji pada proses testing. Dalam proses pengujian ini, penelitian ini diimplementasikan menggunakan aplikasi Matlab 6.1 pada sistem operasi Windows 7.

4.2.Vektor bobot Awal yang Dihasilkan

Penentuan vektor bobot awal pada penelitian ini dilakukan dengan tiga cara yaitu hasil perhitungan bobot dengan metode Entropy, data pasien terbaik dari perhitungan metode Entropy dan vektor bobot yang diiambil dari data pasien pertama pada setiap kelasnya.

4.2.1. Perhitungan Bobot dengan Metode Entropy (Entropy Cara Pertama)

Penentuan vektor bobot awal dilakukan dengan menggunakan metode Entropy dari dataset yang telah terbagi atas dua kelas yang berbeda, yaitu data pasien kanker jinak

(22)

Tabel 4.1 Vektor Bobot dengan Entropy Cara Pertama

JINAK 1,2920 1,1585 1,2977 1,3003 0,5335 1,6575 0,9206 1,4248 0,4151

GANAS 0,4990 0,7371 0,6389 1,4459 0,8266 0,8327 0,6031 1,4767 2,9501

4.2.2. Data Pasien Terbaik dari Perhitungan Entropy (Entropy Cara Kedua)

Penentuan vektor bobot awal dilakukan dengan perhitungan hasil metode Entropy

dikali dengan dataset pada setiap kelasnya sehingga didapatkan data pasien mana yang memiliki nilai terbaik yang akan digunakan sebagai vektor bobot awal. Dari hasil perhitungan diperoleh data dengan nomor pasien 1158247 untuk kelas kanker jinak dan nomor pasien 877291 untuk kelas kanker ganas. Maka vektor bobot awal yang

dihasilkan dapat dilihat pada Tabel 4.2.

Tabel 4.2 Vektor Bobot dengan Entropy Cara Kedua

JINAK 1 1 1 1 1 1 1 1 1

GANAS 6 10 10 10 10 10 8 10 10

4.2.3. LVQ standar

Penentuan vektor bobot awal pada LVQ standar dilakukan dengan mengambil data pertama dalam dataset pada setiap kelasnya. Maka dari dataset, pasien yang memiliki nilai pertama adalah nomor pasien 1000025 untuk kelas kanker jinak dan nomor pasien 1017122 untuk kelas kanker ganas. Maka vektor bobot awal yang dihasilkan dapat dilihat pada Tabel 4.3.

Tabel 4.3 Vektor Bobot dengan LVQ standar

JINAK 5 1 1 1 2 1 3 1 1

(23)

4.3. Hasil Penelitian

Dalam melakukan pengujian pada penelitian ini dilakukan sebanyak 12 kali pengujian terhadap tiga vektor yang telah dihasilkan. Ketiga vektor masuk ke dalam proses

trainingLVQ sehingga menghasilkan bobot yang akan digunakan sebagai pada proses

testing. Proses training dilakukan terhadap parameter varian jumlah data training dan jumlah iterasi. Untuk menentukan data pasien mana yang akan dijadikan data training

maka dilakukan dengan cara perhitungan statistik yaitu perhitungan standar deviasi. Dengan standar deviasi akan didapatkan data training yang mempunyai keberagaman yang lebih baik. Pada proses testing akan dilakukan dengan menggunakan sisa data pada setiap proses training sehingga menghasilkan berapa persentase tingkat akurasi dalam pengklasifikasian breast cancer. Dan hasil dari proses testing, akan dilakukan perbandingan sejauh mana tingkat akurasi yang dihasilkan.

Untuk jumlah data training sebanyak 20 maka jumlah data testing sebanyak 677 data. Untuk jumlah data training sebanyak 50 maka jumlah data testing sebanyak 647 data. Untuk jumlah data training sebanyak 100 maka jumlah data testing

sebanyak 597 data. Kemudian untuk jumlah data training sebanyak 350 maka jumlah data testing sebanyak 347. Pada setiap masing-masing jumlah data traininng akan dilakukan iterasi sebanyak 20, 50, 100, dan 350 sehingga total pengujian pada penelitian ini sebanyak 12 jumlah pengujian.

Adapun hasil pengujian dilakukan dengan menggunakan parameter pada tabel terhadap pengklasifikasian pasien breast cancer ditampilkan pada Tabel 4.4 dan Tabel 4.5.

Tabel 4.4 Hasil Pengujian

No DT I

Bobot Entropy 1 Bobot Entropy 2 Bobot LVQ Standar

S TS P S TS P S TS P

1 20 5 660 17 97,48 643 34 94,97 652 25 96,30

2 20 10 658 19 97,19 643 34 94,97 650 27 96,01

3 20 20 658 19 97,19 643 34 94,97 650 27 96,01

4 50 5 614 33 94,89 613 34 94,74 613 34 94,74

5 50 10 611 36 94,43 611 36 94,43 611 36 94,43

6 50 20 611 36 94,43 611 36 94,43 611 36 94,43

(24)

Tabel 4.5 Hasil Pengujian (lanjutan)

No DT I

Bobot Entropy 1 Bobot Entropy 2 Bobot LVQ standar

S TS P S TS P S TS P

8 100 10 572 25 95,81 572 25 95,81 572 25 95,81

9 100 20 572 25 95,81 572 25 95,81 572 25 95,81

10 350 5 343 4 98,56 343 4 98,56 343 4 98,56

11 350 10 343 4 98,56 343 4 98,56 343 4 98,56

12 350 20 343 4 98,56 343 4 98,56 343 4 98,56

Tingkat Akurasi 96,59 95,99 96,28

Keterangan Tabel :

DT = Jumlah Data Training I = Jumlah Iterasi

S = Jumlah pasien yang SESUAI dengan kelasnya TS = Jumlah pasien yang TIDAK sesuai dengan kelasnya. P = Presentase Tingkat Akurasi Pengklasifikasian (%)

Dari tabel dan grafik di atas bisa dilihat bahwa vektor bobot awal diperoleh dari cara Entropy pertama memiliki tingkat akurasi yang lebih baik dalam mengklasifikasi jika dibandingkan cara yang lain yakni sebesar 96,59 %. Penentuan vektor bobot awal dengan cara pertama juga menghasilkan tingkat pembelajaran yang cepat dalam mengenali dataset. Hal itu dilbuktikan dari hasil pengujian pada jumlah data training sejumlah 20 dan jumlah iterasi sebanyak 5 iterasi, yakni sebesar 97,48 % , lebih baik dari cara penentuan bobot awal yang lainnya. Namun apabila semakin besar jumlah data training dan jumlah iterasinya maka ketiga cara penentuan vektor bobot awal tersebut memiliki tingkat akurasi yang sama baiknya.

4.4. Pembahasan

(25)

training yang sedikit yaitu hanya 20 data walaupun dengan jumlah iterasi sebanyak 5. Namun dengan iterasi yang lebih banyak lagi yaitu sebanyak 20 iterasi, proses pemebelajaran semakin baik pula. Sehingga vektor bobot awal tersebut juga menghasilkan tingkat akurasi yang lebih baik jika dibandkingkan dengan vektor bobot awal yang dihasilkan metode Entropy cara kedua dan vektor bobot awal yang dihasilkan dengan mengambil data pasien pertama dari setiap kelas. Hal ini disebabkan oleh sifat dari perhitungan metode Entropy yang mampu menyelidiki tingkat keserasian dalam sekumpulan data dan mampu beradaptasi dengan sekumpulan data beratribut jamak yang memiliki variasi nilai yang berbeda antara satu data pasien dengan data pasien lainnya. Sehingga vektor bobot awal yang didapat mampu mempelajari dan mewakili data pasien dari setiap kelas jinak ataupun ganas dengan cepat. Oleh karena itu, vektor bobot awal sangatlah mempengaruhi dari proses pembelajaran data dan tingkat akurasi yang didapat.

Selain itu dalam hasil penelitian ini juga diperoleh bahwa semakin besar jumlah data training yang dilakukan maka tingkat akurasi yang didapat semakin baik pula. Hal ini dibuktikan pada ketiga cara penentuan vektor bobot awal tersebut yang memiliki tingkat akurasi yang sama baiknya yaitu sebesar 98,56 % dengan jumlah data training sebesar 350. Hal ini disebabkan oleh proses pembelajaran yang dilakukan semakin banyak sehingga menghasilkan vektor bobot yang baik pula untuk mengenali kelas pada proses testing. Namun secara keseluruhan pengujian, vektor bobot awal yang dihasilkan dengan metode Entropy cara pertama memiliki tingkat keberhasilan dalam pengklasifikasian data pasien breast cancer dibandkingkan dengan cara yang lainnya. Maka dapat disimpulkan bahwa vektor bobot awal sangatlah mempengaruhi dari proses pembelajaran data dan tingkat akurasi yang didapat. Kemudian penentuan vektor bobot awal pada JST LVQ dengan menggunakan metode

(26)

BAB 5

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Kesimpulan dari hasil penelitian yang telah dilakukan yaitu :

1. Metode Entropy dalam penentuan vektor bobot awal pada Jaringan Syaraf Tiruan Learning Vector Quantization membantu kinerja proses pembelajaran

Learning Vector Quantization dan menghasilkan tingkat akurasi yang lebih baik dalam proses klasifikasi.

2. Dengan jumlah data training lebih sedikit, vektor bobot awal yang dihasilkan metode Entropy mampu mempelajari data dengan baik dan menghasilkan tingkat akurasi lebih tinggi, hal ini disebabkan sifat metode Entropy mampu menyelidiki keserasian dari sekumpulan dataset sehingga menghasilkan vektor bobot yang dapat mewakili setiap dataset pada setiap kelas.

5.2. Saran

Adapun saran yang diberikan oleh penulis yaitu :

1. Untuk hasil yang lebih akurat lagi dapat menggunakan metode penentuan bobot selain metode Entropy ataupun mengkombinasikan JST LVQ dengan metode lainnya.