V-1
Implementasi merupakan tahapan dimana hasil perancangan yang telah dibangun mulai diterapkan pada kondisi yang menyerupai kondisi yang sebenarnya. Lingkungan implementasi meliputi lingkungan perangkat lunak (software) dan lingkungan perangkat keras (hardware).
5.1.1 Lingkungan Perangkat Keras (Hardware)
Spesifikasi minimal dari hardware yang diperlukan pada saat implementasi diantaranya adalah :
a. Microprosesor : Intel Pentium 4
b. Harddisk : 4GB
c. Memori : RAM 128 MB
d. Monitor : 1024 x 768 ”
5.1.2 Lingkungan Perangkat Lunak (Software)
Spesifikasi software yang digunakan untuk membangun sistem ini adalah :
a. Sistem Operasi : Windows
b. Program Aplikasi : MS Visual Basic 6.0
c. Perangkat Tambahan : PHPMyAdmin
5.2 Implementasi Komponen
Implementasi komponen merupakan daftar dari perancangan yang telah diimplementasikan. Implementasi komponen algoritma C4.5 pada data pasien liver adalah sebagai berikut :
No Nama Form File Fisik File Executable
1 Menu Utama frmUtama.frm daming.exe
2 Latih Data frmLatihData.frm daming.exe
3 Pohon Keputusan frmPohon.frm daming.exe
4 Aturan frmAturan.frm daming.exe
5 Hasil Penghitungan Entropy dan Gain frmTampilHitung.frm daming.exe 6 Pengujian Data (Data Masukan) frmUjiDataInput.frm daming.exe 7 Pengujian Data (Data Master) frmUjiDataMaster.frm daming.exe 5.3 Struktur Menu
Struktur dari simulasi implementasi algoritma C4.5 pada data pasien liver digambarkan pada Gambar 5.1.
MENU UTAMA
LATIH DATA KEPUTUSANPOHON TERBENTUKATURAN
PENGHITUNGAN ENTROPI DAN GAIN UJI DATA (INPUT DATA) UJI DATA
(MASTER DATA) KELUAR
PRA PROSES DATA
PROSES DATA
5.4 Implementasi Tampilan
Tampilan antarmuka simulasi implementasi algoritma C4.5 pada data pasien liver digambarkan pada Gambar 5.2 sampai dengan Gambar 5.8.
5.4.1 Tampilan Menu Utama
Pada tampilan Gambar 5.2, terdapat opsi-opsi untuk melakukan latih data, menampilkan pohon keputusan, menampilkan daftar aturan, menampilkan penghitungan entropy dan gain, melakukan pengujian dengan data masukan, serta pengujian data master dan penghitungan akurasi. Melakukan latih data merupakan proses wajib yang harus dilalui apabila ingin memasuki opsi yang lain.
Gambar 5.2 Tampilan Menu Utama
5.4.2 Tampilan Latih Data
Tampilan Gambar 5.3 akan muncul setelah pengguna memilih opsi latih data. Pada latih data terdapat pengaturan data yang meminta pengguna untuk mengisi persentase data untuk data latih dan data uji. Setelah mengatur data, pengguna memilih akan melakukan praproses data menggunakan rumus GINI atau berdasarkan referensi kesehatan yang menjadi acuan. Setelah melakukan praproses, pengguna memilih tombol perintah proses data yang meliputi penghitungan entropy dan gain serta pembentukan pohon keputusan.
Gambar 5.3 Tampilan Latih Data
5.4.3 Tampilan Pohon Keputusan
Tampilan Gambar 5.4 akan muncul secara otomatis setelah proses data selesai dilakukan. Tampilan ini berfungsi untuk menampilkan hasil penghitungan entropy dan gain secara visual berupa pohon keputusan.
Gambar 5.4 Tampilan Pohon Keputusan
5.4.4 Tampilan Daftar Aturan
Tampilan Gambar 5.5 akan muncul setelah pengguna memilih opsi untuk menampilkan daftar aturan pada tampilan menu utama. Tampilan ini berfungsi untuk menampilkan daftar aturan sesuai dengan silsilah pada pohon keputusan.
Gambar 5.5 Tampilan Daftar Aturan
5.4.5 Tampilan Hasil Penghitungan
Tampilan Gambar 5.6 akan muncul setelah pengguna memilih opsi untuk menampilkan hasil penghitungan. Tampilan ini berfungsi untuk menampilkan hasil penghitungan entropy dan gain dengan kondisi baris penentu tertentu.
5.4.6 Tampilan Uji Data (Data Masukan)
Tampilan uji Gambar 5.7 akan muncul setelah pengguna memilih opsi uji data dengan data masukan. Tampilan ini berfungsi untuk mengetahui hasil keputusan pasien liver berdasarkan pohon keputusan yang telah terbentuk.
Gambar 5.7
Tampilan Uji Data dengan Data Masukan
5.4.7 Tampilan Uji Data (Data Master) dan Akurasi
Tampilan Gambar 5.8 akan muncul setelah pengguna memilih opsi uji data master dan penghitungan akurasi. Tampilan ini berfungsi untuk menampilkan perbandingan pengujian data berdasarkan pohon keputusan dengan data liver, menampilkan jumlah data terklasifikasi dan tidak terklasifikasi serta menampilkan persentase akurasi.
Gambar 5.8
Tampilan Uji Data dengan Data Master dan Akurasi
5.5 Implementasi Basis Data
Implementasi algoritma C4.5 menggunakan 1 (satu) basis data bernama db_liver yang terdiri dari 15 (lima belas) buah tabel. Struktur tabel bisa dilihat pada Gambar 5.9 sampai dengan Gambar 5.23.
1) Tabel data pasien liver (tb_liver) berisi record pasien liver
2) Tabel atribut (tb_atribut) menyimpan atribut-atribut yang terdapat pada data pasien liver beserta split atributnya.
Gambar 5.10 Struktur Tabel Atribut
3) Tabel perbandingan pengujian (tb_comparetesting) menyimpan hasil pengujian data master pasien liver dengan hasil pengujian data berdasarkan pohon keputusan
Gambar 5.11 Struktur Tabel Perbandingan Pengujian Data
4) Tabel entropi (tb_entopy) menyimpan hasil penghitungan entropi sampai terbentuknya pohon keputusan
Gambar 5.12 Struktur Tabel Entropi
5) Tabel gain (tb_gain) berisi menyimpan hasil penghitungan gain sampai terbentuknya pohon keputusan
Gambar 5.13 Struktur Tabel Gain
6) Tabel hasil pengujian (tb_hasiltesting) menyimpan hasil pengujian data pasien liver berdasarkan pohon keputusan
Gambar 5.14 Struktur Tabel Hasil Pengujian Data
7) Tabel penghitungan (tb_hitung) menyimpan penghitungan jumlah kasus berdasarkan baris penentu
Gambar 5.15 Struktur Tabel Penghitungan
8) Tabel klasifikasi atribut (tb_klas_atribut) menyimpan hasil klasifikasi atribut
9) Tabel praproses (tb_pra) menyimpan hasil praproses data pasien liver
Gambar 5.17 Struktur Tabel Praproses Data
10) Tabel pra-GINI (tb_pre_gini) menyimpan data pasien liver untuk menentukan split atribut
Gambar 5.18 Struktur Tabel Pra Gini
11) Tabel aturan (tb_rules) menyimpan daftar aturan yang terbentuk dari pohon keputusan
Gambar 5.20 Struktur Tabel Pengujian
13) Tabel simpul pohon keputusan (tb_tree_atribut) menyimpan simpul dan atribut yang terlibat pada pohon keputusan
Gambar 5.21 Struktur Tabel Simpul Pohon Keputusan
14) Tabel simpul pohon detail (tb_trklasdetail) menyimpan klasifikasi atribut yang terlibat pada pohon keputusan beserta hasil kelanjutannya sampai menemukan hasil keputusan akhir.
5.6 Pengujian Implementasi
Pada penelitian ini, akan digunakan 3 (tiga) skenario dalam proses pengujian :
1) Skenario (1)
Pengujian implementasi dilakukan dengan urutan sebagai berikut : a) Mengatur persentase data latih dan data uji
b) Melakukan praproses data dengan menggunakan rumus GINI c) Proses data
d) Menghitung tingkat akurasi 2) Skenario (2)
Pengujian implementasi dilakukan dengan urutan sebagai berikut : a) Mengatur persentase data latih dan data uji
b) Melakukan praproses data dengan mengklasifikasikan data pasien liver berdasarkan referensi kesehatan
c) Proses data
d) Menghitung tingkat akurasi
Skenario (1) dan (2) dilakukan masing-masing sebanyak 10 (sepuluh) kali dengan pengaturan persentase data latih dan data uji terbagi pada Tabel 5.2.
Tabel 5.2 Pengaturan Persentase Data Latih dan Data Uji Latih Data Ke- Persentase Data Latih Persentase Data Uji 1 10 % 90 % 2 20 % 80 % 3 30 % 70 % 4 40 % 60 % 5 50 % 50 % 6 60 % 40 % 7 70 % 30 % 8 80 % 20 % 9 90 % 10 % 10 100 % 100 %
pengujian skenario (2).
5.6.1 Skenario (1)
Berdasarkan Tabel 5.3, diperoleh rata-rata persentase akurasi pengujian data dengan praproses menggunakan rumus GINI adalah 39,00 %. Dengan akurasi tertinggi yaitu 56,22% dan akurasi terendah yaitu 22,41%.
Tabel 5.3 Hasil Pengujian Data (Praproses Menggunakan Rumus GINI)
Latih Data Ke- Jumlah Data Latih Jumlah Data Uji Jumlah Data Terklasifikasi (YES) Jumlah Data Terklasifikasi (NO) Jumlah Data Tidak Terklasifikasi 1 58 525 222 151 152 2 117 466 271 78 117 3 175 408 217 70 121 4 233 350 159 27 164 5 292 291 133 20 138 6 350 233 71 12 150 7 408 175 50 8 117 8 466 117 49 7 61 9 525 58 13 4 41 10 583 583 173 21 389 Latih Data Ke- Jumlah Hasil Sesuai Jumlah Hasil Tidak Sesuai Persentase Akurasi (%) Persentase Kesalahan (%) 1 268 257 51.05 48.95 2 262 204 56.22 43.78 3 215 193 52.70 47.30 4 141 209 40.29 59.71 5 113 178 38.83 61.17 6 69 164 29.61 70.39 7 46 129 26.29 73.71 8 46 71 39.32 60.68 9 13 45 22.41 77.59 10 194 389 33.28 66.72 Rata-rata Persentase 39.00 61.00
5.6.2 Skenario (2)
Berdasarkan Tabel 5.4, diperoleh rata-rata persentase akurasi pengujian data dengan praproses berdasarkan referensi kesehatan adalah 54,89 %. Dengan akurasi tertinggi yaitu 67,75% dan akurasi terendah yaitu 45,92%.
Tabel 5.4
Hasil Pengujian Data (Praproses Berdasarkan Referensi Kesehatan)
Latih Data Ke- Jumlah Data Latih Jumlah Data Uji Jumlah Data Terklasifikasi (YES) Jumlah Data Terklasifikasi (NO) Jumlah Data Tidak Terklasifikasi 1 58 525 289 167 69 2 117 466 227 145 94 3 175 408 225 80 103 4 233 350 217 51 82 5 292 291 161 46 84 6 350 233 117 40 76 7 408 175 99 23 53 8 466 117 76 8 33 9 525 58 38 5 15 10 583 583 320 75 188 Latih Data Ke- Jumlah Hasil Sesuai Jumlah Hasil Tidak Sesuai Persentase Akurasi (%) Persentase Kesalahan (%) 1 284 241 54.10 45.90 2 232 234 49.79 50.21 3 208 200 50.98 49.02 4 193 157 55.14 44.86 5 146 145 50.17 49.83 6 107 126 45.92 54.08 7 90 85 51.43 48.57 8 68 49 58.12 41.88 9 38 20 65.52 34.48 10 395 188 67.75 32.25 Rata-rata Persentase 54.89 45.11
dengan praproses berdasarkan referensi kesehatan cenderung meningkat sedangkan tingkat akurasi pengujian data dengan praproses menggunakan rumus GINI cenderung menurun.
Gambar 5.23 Grafik Perbandingan Hasil Pengujian Data
54,10 49,79 50,98 55,14 50,17 45,92 51,43 58,12 65,52 67,75 51,05 56,22 52,70 40,29 38,83 29,61 26,29 39,32 22,41 33,28 -10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 10 20 30 40 50 60 70 80 90 100 Pe rse nt ase A ku ra si (%)
Persentase Data Latih (%)
Grafik Perbandingan Hasil Uji Data
Hasil Uji Data (Referensi Kesehatan) Hasil Uji Data (Gini)
5.7 Evaluation Phase
Tingkat keakuratan pengujian data dengan praproses menggunakan rumus GINI cenderung menurun, hal ini kemungkinan terjadi karena dipengaruhi oleh penghitungan GINI untuk split atribut bernilai kontinyu hanya menghasilkan 2 (dua) klasifikasi atribut yaitu lebih kecil dari sama dengan (<=) dan lebih besar (>) dari split atribut, sedangkan data-data pada atribut bernilai kontinyu itu beragam sehingga berpengaruh pada pengujian data dan tingkat akurasi. Adapun kelebihan dari aplikasi ini adalah :
1. Pengguna bisa memilih cara melakukan praproses data, yaitu menggunakan rumus GINI atau berdasarkan referensi kesehatan.
2. Aplikasi ini menyimpan hasil penghitungan entropy dan gain
5.8 Deployment Phase
Hasil akhir dari implementasi algoritma C4.5 pada data pasien liver ini berupa pohon keputusan dan daftar aturan yang terbentuk. Berikut adalah contoh hasil implementasi tersebut :
1) Nama : Deployment (1)
Jumlah Data Latih : 5% dari 583 data (29 data) Jumlah Data Uji : 95% dari 583 data (554 data)
Praproses : Rumus GINI
Atribut dan Split :
Gambar 5.24
Gambar 5.25
Pohon Keputusan Simpul 1.1 untuk Deployment (1)
Gambar 5.26
Daftar Aturan : 20 (dua puluh) aturan terbentuk
Gambar 5.27
Daftar Aturan Deployment (1)
2) Nama : Deployment (2)
Jumlah Data Latih : 5% dari 583 data (29 data) Jumlah Data Uji : 95% dari 583 data (554 data)
Praproses : Berdasarkan Referensi Kesehatan
Atribut dan Split :
Gambar 5.28
Gambar 5.29
Pohon Keputusan Simpul 1.1 – 1.3 untuk Deployment (2)
Pohon Keputusan Simpul 1.4 – 1.5 untuk Deployment (2)
Daftar Aturan : 40 (empat puluh) aturan terbentuk
Gambar 5.31 Daftar Aturan Deployment 2 (1)