HASIL DAN PEMBAHASAN
4.1. Hasil Pengujian
Hasil pengujian diukur dari seberapa besar nilai akurasi serta kecepatan dari proses
training dan testing data. Pengukuran akurasi dilakukan dengan menggunakan tabel klasifikasi yang disebut dengan confusion matrix dan kecepatan proses diukur dari lama waktu yang dibutuhkan dalam proses training dan testing data. Jumlah data
training terdiri dari 195 baris data (2/3 dari jumlah baris data penelitian) dan jumlah data testing terdiri dari 101 baris data (1/3 dari jumlah baris data penelitian).
4.1.1. Hasil Pengujian Tahap Pertama
Pengujian pada tahap pertama menggunakan seluruh atribut data rekam medis penyakit jantung dalam pelatihan data dan tugas klasifikasi dalam memprediksi penyakit jantung. Dari data training yang diproses dengan algoritma Naive Bayes diperoleh hasil pelatihan yang disebagai berikut:
Tabel 4.1 Hasil Training Data Pada Tahap Pertama
Atribut Nilai Hasil Training Data
Yes No Age >43 0.920455 0.841121 <=43 0.0795455 0.158879 Sex Male 0.840909 0.616822 Female 0.159091 0.383178 Cp typ_angina 0.0227273 0.121495 atyp_angina 0.0568182 0.121495 non_anginal 0.170455 0.420561 Asympt 0.75 0.224299 Trestbps >122 0.738636 0.64486 <=122 0.261364 0.35514 Chol >271 0.397727 0.224299 <=271 0.602273 0.775701 Fbs T 0.147727 0.186916 F 0.852273 0.813084 Restecg Normal 0.340909 0.523364 left_vent_hyper 0.659091 0.476636 st_t_wave_abnorma 0 0 Thalach >150 0.340909 0.747664 <=150 0.659091 0.252336 Exang Yes 0.545455 0.158879 No 0.454545 0.841121 Oldpeak Zero 0.170455 0.364486 >0 0.829545 0.635514 Slope Flat 0.670455 0.28972 Down 0.102273 0.0747664 Up 0.227273 0.635514 Ca 0 0.318182 0.794393 1 0.329545 0.130841 2 0.193182 0.046729 3 0.159091 0.0280374 Thal Norm 0.204545 0.775701 fixed_defect 0.0681818 0.0373832 reversable_defect 0.727273 0.186916
Waktu proses pelatihan data dengan melibatkan seluruh atribut yang ditampilkan pada tabel di atas adalah 0,38135 detik.
Berdasarkan hasil dari training data dilakukan pengujian terhadap data testing dan diperoleh hasil prediksi yang ditampilkan dalam tabel confusion matrix berikut:
Tabel 4.2 Hasil Pengujian Data Testing Pada Tahap Pertama Prediksi
Sakit Tidak Sakit
Aktual (Yang Sebenarnya) Sakit 38 10
Tidak Sakit 7 46
Dari tabel di atas diperoleh nilai prediksi yang benar untuk yang sakit ada 38 orang dan untuk yang tidak sakit ada 46 orang. Sementara prediksi yang salah terdiri dari 10 orang diprediksi tidak sakit (sebenarnya sakit) dan 7 orang diprediksi sakit (sebenarnya tidak sakit). Nilai akurasi dan error dapat diperoleh sebagai berikut:
Akurasi tahap pertama = ��+��
�+� =
38+46
101 = 0,83168 = 83,17% Error tahap pertama = ��+��
�+� =
10+7
101 = 0,16831 = 16,83%
Waktu proses pengujian dari data testing yang melibatkan seluruh atribut dari tabel 4.1 adalah: 0.57582 detik.
4.1.2. Hasil Pengujian Tahap Kedua
Pengujian pada tahap kedua menggunakan beberapa atribut data rekam medis penyakit jantung yang dipilih berdasarkan nilai informasi Gain untuk pelatihan data dan tugas klasifikasi dalam memprediksi penyakit jantung. Atribut diurutkan berdasarkan nilai informasi Gain yang paling tinggi ke yang paling rendah.
Pada tahap ini atribut dengan nilai terkecil (fbs) tidak diikutkan dalam proses
training dan testing data. Kemudian dilihat nilai akurasi yang dihasilkan dari hasil pengujian.
Tabel 4.3 Peringkat Atribut Berdasarkan Nilai Informasi Gain
Atribut Nilai Info Gain
thal 0.252023 cp 0.213794 ca 0.178469 slope 0.128463 thalach 0.123182 exang 0.123127 sex 0.0460524 oldpeak 0.0346693 chol 0.0254546 restecg 0.0243425 age 0.0107875 trestbps 0.00736819 fbs 0.00196676
Pada percobaan ini untuk hasil data training sama dengan tabel 4.1 namun tanpa atribut fbs. Untuk waktu proses training data yang melibatkan 12 atribut adalah: 0,35456 detik.
Berdasarkan hasil dari training data tanpa menggunakan atribut fbs dilakukan pengujian terhadap data testing dan diperoleh hasil prediksi yang ditampilkan dalam tabel confusion matrix berikut:
Tabel 4.4 Hasil Pengujian Data Testing Tahap Kedua Prediksi
Sakit Tidak Sakit
Aktual (Yang Sebenarnya) Sakit 38 10
Tidak Sakit 6 47
Dari tabel di atas diperoleh nilai prediksi yang benar untuk yang sakit ada 38 orang dan untuk yang tidak sakit ada 47 orang. Sementara prediksi yang salah terdiri dari 10 orang diprediksi tidak sakit (sebenarnya sakit) dan 6 orang diprediksi sakit (sebenarnya tidak sakit). Nilai akurasi dan error dapat diperoleh sebagai berikut:
Akurasi tahap kedua = ��+��
�+� =
38+47
101 = 0,84158 = 84,16% Error tahap kedua = ��+��
�+� =
10+6
101 = 0,15841 = 15,84%
Waktu proses pengujian dari data testing yang melibatkan 12 atribut dari tabel 4.1 adalah: 0.65077 detik.
4.1.3. Percobaan Tahap Ketiga
Pada tahap ketiga ini dua atribut dengan nilai informasi gain terendah tidak diikutsertakan yaitu fbs dan trestbps. Untuk hasil data training sama dengan tabel 4.1, namun tanpa atribut fbs dan trestbps. Untuk waktu proses training data yang melibatkan 11 atribut adalah: 0,24825 detik.
Berdasarkan hasil dari training data tanpa menggunakan atribut fbs dan trestbps dilakukan pengujian terhadap data testing dan diperoleh hasil prediksi yang ditampilkan dalam tabel confusion matrix berikut:
Tabel 4.5 Hasil Pengujian Data Testing Tahap Ketiga Prediksi
Sakit Tidak Sakit
Aktual (Yang Sebenarnya) Sakit 37 11
Tidak Sakit 6 47
Dari tabel di atas diperoleh nilai prediksi yang benar untuk yang sakit ada 37 orang dan untuk yang tidak sakit ada 47 orang. Sementara prediksi yang salah terdiri dari 11 orang diprediksi tidak sakit (sebenarnya sakit) dan 6 orang diprediksi sakit (sebenarnya tidak sakit). Nilai akurasi dan error dapat diperoleh sebagai berikut:
Akurasi tahap ketiga = ��+��
�+� =
37+47
101 = 0,83168 = 83,17% Error tahap ketiga = ��+��
�+� =
11+6
Waktu proses pengujian dari data testing yang melibatkan 12 atribut dari tabel 4.1 adalah: 0.55844 detik.
4.1.4. Percobaan Tahap Keempat
Pada percobaan di tahap keempat ini tiga atribut dengan nilai informasi gain terendah tidak diikutsertakan yaitu fbs, trestbps dan age. Untuk hasil data training sama dengan tabel 4.1 namun tanpa atribut fbs, trestbps dan age. Untuk waktu proses training data yang melibatkan 10 atribut adalah: 0,25818 detik.
Berdasarkan hasil dari training data tanpa menggunakan atribut fbs, trestbps dan
age dilakukan pengujian terhadap data testing dan diperoleh hasil prediksi yang ditampilkan dalam tabel confusion matrix berikut:
Tabel 4.6 Hasil Pengujian Data Testing Percobaan Tahap Keempat Prediksi
Sakit Tidak Sakit
Aktual (Yang Sebenarnya) Sakit 36 12
Tidak Sakit 7 46
Dari tabel di atas diperoleh nilai prediksi yang benar untuk yang sakit ada 36 orang dan untuk yang tidak sakit ada 46 orang. Sementara prediksi yang salah terdiri dari 12 orang diprediksi tidak sakit (sebenarnya sakit) dan 7 orang diprediksi sakit (sebenarnya tidak sakit). Nilai akurasi dan error dapat diperoleh sebagai berikut:
Akurasi tahap keempat = ��+��
�+� =
36+46
101 = 0,81188 = 81,19% Error tahap keempat = ��+��
�+� =
12+7
101 = 0,18811 = 18,81%
Waktu proses pengujian dari data testing yang melibatkan 10 atribut dari tabel 4.1 adalah: 0.52098 detik.
4.1.5. Percobaan Tahap Kelima
Pada percobaan di tahap kelima ini dilakukan percobaan dengan tidak mengikutsertakan satu atribut yang memiliki nilai informasi gain tertinggi yaitu thal. Untuk hasil data training sama dengan tabel 4.1 namun tanpa atribut thal. Untuk waktu proses training data yang melibatkan 12 atribut adalah: 0,29258 detik.
Berdasarkan hasil dari training data tanpa menggunakan atribut thal dilakukan pengujian terhadap data testing dan diperoleh hasil prediksi yang ditampilkan dalam tabel confusion matrix berikut:
Tabel 4.6 Hasil Pengujian Data Testing Percobaan Tahap Kelima Prediksi
Sakit Tidak Sakit
Aktual (Yang Sebenarnya) Sakit 36 12
Tidak Sakit 7 46
Dari tabel di atas diperoleh nilai prediksi yang benar untuk yang sakit ada 36 orang dan untuk yang tidak sakit ada 46 orang. Sementara prediksi yang salah terdiri dari 12 orang diprediksi tidak sakit (sebenarnya sakit) dan 7 orang diprediksi sakit (sebenarnya tidak sakit). Nilai akurasi dan error dapat diperoleh sebagai berikut:
Akurasi tahap kelima = ��+��
�+� =
36+46
101 = 0,81188 = 81,19% Error tahap kelima = ��+��
�+� =
12+7
101 = 0,18811 = 18,81%
Waktu proses pengujian dari data testing yang melibatkan 10 atribut dari tabel 4.1 adalah: 0.70086 detik.
4.2.Pembahasan
Dari hasil pengujian di atas dapat dilihat perbandingan nilai akurasi, error dan waktu proses pada tahap pertama sampai tahap kelima yang ditampilkan pada tabel berikut:
Tabel 4.7 Hasil Pengujian Percobaan Tahap Pertama Sampai Kelima
Pengujian Atribut yang Jumlah Akurasi Error Waktu Waktu
Direduksi Atribut Testing (detik) Training (detik)
Tahap I - 13 83,17% 16,83% 0,57582 0,38135
Tahap II Fbs 12 84,16% 15,84% 0,65077 0,35456
Tahap III Fbs dan trestbps 11 83,17% 16,83% 0,55844 0,24825
Tahap IV
Fbs, trestbps dan
age 10 81,19% 18,81% 0,52098 0,25818
Tahap V Age 12 81,19% 18,81% 0,70086 0,29258
Gambar 4.1 Perbandingan Akurasi, Error dan Waktu Proses Pengujian
Dari grafik di atas dapat dilihat bahwa hasil pengujian pada tahap kedua dimana atribut fbs tidak diikutsertakan memiliki nilai akurasi yang lebih baik yaitu 84,16%
83,17% 84,16% 83,17% 81,19% 81,19% 16,83% 15,84% 16,83% 18,81% 18,81% 0,57582 0,65077 0,55844 0,52098 0,70086 0,00% 10,00% 20,00% 30,00% 40,00% 50,00% 60,00% 70,00% 80,00% 90,00%
Tahap I Tahap II Tahap III Tahap IV Tahap V