19
BAB IV
HASIL PENELITIAN DAN PEMBAHASAN
4.1. Hasil Penelitian
Pada penelitian ini digunakan metode C4.5. Kasus yang diambil adalah data penggunaan listrik rumah tangga dengan jumlah populasi data yaitu 116 data. Untuk sampel nya ada 82 data dari jumlah keseluruhan data pengguna listrik. Data sampel ini yang akan dihitung probabilitas nya, kemudian akan dicari tingkat akurasi tertinggi dari data tersebut dan akan diimplementasikan pada Rapid Miner.
4.2. Pembahasan
Seperti yang sudah dijelaskan pada hasil penelitian diatas, data yang telah didapat yaitu data yang terdapat pada tabel III.1. Maka data tersebut akan dijadikan data testing, kemudian akan dibuat pohon keputusan untuk mempediksi rendah atau tidak nya penggunaan listrik rumah tangga berdasarkan Jumlah Keluarga, Luas Rumah, Lama Dirumah, Daya Listrik dan Perlengkapan Elektronik. Berikut ini adalah table data testing:
Tabel IV.I Data Testing Jumlah Keluarga Luas Rumah Lama dirumah Daya Listrik Perlengkapan elektronik Penggunaan Listrik Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi
Sedikit Kecil Sebentar Kecil Sedikit Rendah Sedikit Sedang Sebentar Kecil Sedikit Rendah Sedikit Sedang Sebentar Besar Sedikit Rendah Sedikit Sedang Sebentar Besar Sedikit Rendah Sedikit Sedang Sebentar Besar Sedikit Rendah Sedikit Sedang Lama Kecil Banyak Tinggi Sedikit Sedang Lama Kecil Banyak Tinggi Sedikit Kecil Lama Kecil Banyak Tinggi Sedikit Kecil Lama Kecil Sedikit Rendah Sedikit Kecil Lama Kecil Sedikit Rendah Sedikit Kecil Lama Kecil Sedikit Rendah Sedikit Kecil Sebentar Kecil Sedikit Rendah Banyak Sedang Lama Besar Banyak Rendah Banyak Sedang Lama Besar Banyak Tinggi Banyak Sedang Lama Besar Banyak Tinggi Banyak Sedang Lama Besar Banyak Tinggi Sedikit Besar Sebentar Besar Banyak Tinggi Sedikit Besar Sebentar Besar Banyak Tinggi Sedikit Besar Sebentar Besar Banyak Tinggi Sedikit Besar Sebentar Besar Banyak Tinggi Sedikit Besar Sebentar Besar Banyak Tinggi Sedikit Besar Sebentar Besar Banyak Tinggi Sedikit Kecil Sebentar Kecil Sedikit Rendah Sedikit Kecil Sebentar Kecil Sedikit Rendah Sedikit Kecil Sebentar Kecil Sedikit Rendah Sedikit Kecil Sebentar Kecil Sedikit Rendah Sedikit Kecil Sebentar Kecil Sedikit Rendah Sedikit Kecil Sebentar Kecil Banyak Tinggi Sedikit Sedang Lama Besar Banyak Rendah Sedikit Sedang Lama Besar Banyak Rendah Sedikit Sedang Lama Besar Banyak Rendah Banyak Sedang Lama Kecil Banyak Tinggi Banyak Sedang Lama Kecil Banyak Tinggi Banyak Sedang Lama Kecil Banyak Tinggi Banyak Sedang Lama Kecil Banyak Tinggi Banyak Sedang Sebentar Besar Sedikit Rendah Banyak Sedang Sebentar Besar Sedikit Rendah Banyak Kecil Sebentar Kecil Sedikit Rendah Banyak Kecil Sebentar Kecil Sedikit Rendah Banyak Kecil Sebentar Kecil Sedikit Rendah Banyak Kecil Sebentar Kecil Sedikit Rendah Banyak Kecil Sebentar Kecil Banyak Tinggi Banyak Kecil Lama Besar Banyak Tinggi
Banyak Kecil Lama Besar Banyak Tinggi Sedikit Sedang Sebentar Kecil Sedikit Rendah Sedikit Sedang Sebentar Kecil Sedikit Rendah Sedikit Sedang Sebentar Kecil Sedikit Rendah Sedikit Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Kecil Sebentar Kecil Sedikit Rendah Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Banyak Besar Lama Besar Banyak Tinggi Sedikit Kecil Sebentar Besar Sedikit Rendah Sedikit Kecil Sebentar Besar Sedikit Rendah Sedikit Kecil Sebentar Besar Sedikit Rendah Sedikit Kecil Sebentar Besar Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Sebentar Kecil Sedikit Rendah Banyak Sedang Lama Kecil Banyak Tinggi Sedikit Sedang Lama Besar Sedikit Rendah Sedikit Sedang Lama Besar Sedikit Rendah Sedikit Sedang Lama Besar Sedikit Rendah Sedikit Sedang Lama Besar Sedikit Rendah Sumber: Warga Kampung Lebaksiuh 01
Data diatas akan diuji pada aplikasi Rapid Miner untuk mengetahui akurasi dan pohon keputusan nya. Kemudian akan dihitung manual di Microsoft Excel. Berikut ini adalah perhitungan manual untuk mengetahui Entropy dan Gain: Tabel IV.2 Perhitungan Node 1 Jumlah Rendah (s1) Tinggi
(s2) Entropy (y) Gain
1 total 82 46 36 0.297792507 Jumlah Keluarga 0.027375646 Sedikit 39 29 10 0.247230198 Banyak 43 17 26 0.291446625 Luas Rumah 0.118395635 Kecil 24 19 5 0.22224589 Sedang 37 27 10 0.253422761 Besar 21 0 21 0 Lama Dirumah 0.065502051 Sebentar 43 35 8 0.208652143 Lama 39 11 28 0.258353212 Daya Listrik 0.027375646 Kecil 39 29 10 0.247230198 Besar 43 17 26 0.291446625 Perlengkapan Elktronik 0.22892337 Sedikit 42 42 0 0 Banyak 40 4 36 0.141181742 Sumber: Ramadhan, 2020
Pada tabel diatas diketahui total nilai Entropy yang didapat dari perhitungan sebagai berikut:
Entropy Total = (-46/82*LOG (46/82)) + (-36/82*LOG (36/82)) Entropy Total = 0.297792507
Pada tabel IV.2 juga diketahui nilai gain terbesar adalah Perlengkapan Elektronik yaitu 0.22892337 yang diperoleh dari hasil perhitungan sebagai berikut:
GainTotal Perlengkapan Elektronik = 0.297792507 - ((42/82*0) + (40/82*0.141181742)) = 0.22892337
Dengan demikian perlengkapan elektronik dapat menjadi akar, karena perlengkapan elektronik memiliki Gain terbesar pertama. Ada dua kelas pada perlengkapan elektronik yaitu Sedikit dan Banyak. Dari kedua kelas tersebut kelas
Sedikit memiliki nilai Entropy 0, maka kelas Sedikit sudah tidak perlu dilakukan perhitungan kembali, sedangkan kelas Banyak masih harus dilakukan perhitungan kembali. Berikut ini adalah tabel perhitungan node 2:
Tabel IV.3 Perhitungan Node 2 Jumlah Rendah (s1) Tinggi
(s2) Entropy (y) Gain node total-perlengkapan- 2 banyak 40 4 36 0.141181742 Jumlah Keluarga 0.018496381 Sedikit 13 3 10 0.234607678 Banyak 27 1 26 0.068796836 Luas Rumah 0.050242928 Kecil 5 0 5 0 Sedang 14 4 10 0.259825181 Besar 21 0 21 0 Lama Dirumah -23.85881826 Sebentar 8 0 8 0 Lama 32 4 28 0.163629202 Daya Listrik 0.019987539 Kecil 10 0 10 0 Besar 26 4 22 0.186452619 Sumber: Ramadhan, 2020
Melihat dari tabel IV.3. dapat diketahui total Entropy menjadi 0.141181742. Pada node 2 ini Gain tertinggi didapat pada atribut Luas Rumah yang memiliki 3 kelas atribut yaitu Kecil, Sedang dan Besar. Dari ke 3 kelas tersebut kelas Kecil dan Besar memiliki nilai Entropy 0. Maka kelas Kecil dan Besar tidak perlu dilakukan perhitungan kembali. Sedangkan untuk kelas Sedang masih harus dilakukan perhitungan kembali. Berikut ini adalah tabel perhitungan node 3:
Tabel IV.4 Perhitungan Node 3
node total-perlengkapan- (s1) (s2) 3 banyak-luas rumah- 14 4 10 0.259825181 sedang Jumlah Keluarga 0.0580474 Sedikit 5 3 2 0.292285253 Banyak 9 1 8 0.151495854 Lama Dirumah -9.74017482 Sebentar 0 0 0 0 Lama 14 4 10 0.259825181 Daya Listrik 0.1115336 Kecil 7 0 7 0 Besar 7 4 3 0.296583222 Sumber: Ramadhan, 2020
Pada tabel node 3 nilai Gain tertinggi adalah atribut Daya Listrik yang memiliki 2 kelas yaitu Kecil dan Besar. Pada kelas Kecil hasil perhitungan didapat Entropy 0, maka kelas Kecil tidak perlu dihitung kembali tetapi untuk kelas Besar masih dihitung kembali. Berikut ini tabel perhitungan node 4.
Tabel IV.5 Perhitungan Node 4 Jumlah Rendah (s1) Tinggi (s2) Entropy (y) Gain node total-perlengkapan-banyak- 4 luas rumah-sedang- 7 4 3 0.2965832 daya listrik-besar Jumlah Keluarga 0 Sedikit 3 3 0 0 Banyak 4 1 3 0.2442191 Lama Dirumah -2.7034168 Sebentar 0 0 0 0 Lama 7 4 3 0.2965832 Sumber: Ramadhan, 2020
Pada tabel node 4 nilai Gain dari atribut Jumlah Keluarga adalah 0. Maka dari itu tidak perlu dilakukan perhitungan kembali dan perhitungan selesai sampai node 4.
Setelah perhitungan probabilitas selesai, barulah data diuji di Rapid Miner untuk mengetahui pohon keputusan dan mengtahui kebenaran dari hasil perhitungan yang sudah dilakukan diatas. Berikut ini adalah uji Validasi menggunakan Rapid Miner 5.2:
Sumber: Ramadhan, 2020
Gambar IV.1 Prose Awal
Pada proses awal ini dilakukan Import data dengan menggunakan Read Excel, kemudian dihubungkan ke Validation. Setelah itu double klik X-Validation lalu akan muncul tampilan sebagai berikut:
Sumber: Ramadhan, 2020
Gambar IV.2 Prose Validasi
Setelah muncul tampilan diatas masukan Decision Tree dibagian Training, lalu masukan Apply Model dan Performance dibagian Testing yang nantinya akan menghasilkan Pohon keputusan dan PerformanceVector yang menghasilkan Accuracy, Precision, Recall, AUC (optimistic), AUC dan AUC (Pessimistic). Dibawah ini adalah gambar Pohon keputusan yang dihasilkan oleh Rapid Miner 5.2:
Sumber: Ramadhan, 2020
Gambar IV.3 Pohon Keputusan
Dari gambar IV.3 dapat dilihat pohon keputusan yang mempunyai akar pertama yaitu Perlengkapan Elektronik, Perlengkapan Elektronik mempunyai dua cabang yaitu kelas Banyak dan Sedikit. Pada kelas Sedikit dinyatakan bahwa penggunaan listrik Rendah, sedangkan untuk kelas Banyak menghasilkan akar baru yaitu Luas rumah.
Pada Luas Rumah terdapat 3 kelas yaitu Besar, Sedang dan Kecil. Dari ketiga kelas tersebut kelas Banyak dan Kecil dinyatakan bahwa penggunaan listrik Tinggi, sedangkan kelas Sedang membentuk akar baru yaitu Daya Listrik. Untuk
Daya listrik memiliki 2 kelas yaitu Besar dan Kecil, dengan kelas Kecil dinyatakn bahwa penggunaan listrik Tinggi. Sedangkan kelas Besar menjadi akar baru yaitu Jumlah Kelurga. Atribut Jumlah kelurga memiliki dua kelas yaitu Banyak dan Sedikit, untuk kelas Banyak penggunaan listrik Tinggi dan kelas Sedikit penggunaan listrik Rendah.
Dari pohon keputusan tersebut bisa disimpulkan bahwa pohon keputusan ini sesuai dengan hasil perhitungan manual tadi. Jadi pada prediksi penggunaan listrik ini jika Perlengkapan Elektronik Sedikit penggunaan listrik pun Rendah. Tetapi jika Perlengkapan Elektronik Banyak maka bisa dilihat lagi dari sisi Luas Rumah nya, jika Perlengkapan Elektronik Banyak dan Luas Rumah Besar atau Kecil maka penggunaan listrik nya Tinggi. Untuk Luas Rumah yang Sedang ditinjau kembali dari Daya Listrik yang dipakai. Jika Luas Rumah Sedang dengan Daya Listrik yang Kecil maka penggunaan listrik nya Tinggi. Tetapi jika Daya Listrik Besar masih ditinjau kembali dari Jumlah Keluarga. Jika Daya Listrik Besar dan Jumlah Keluarga Banyak maka penggunaan nya akan Tinggi, sebaliknya jika Daya Listrik Besar dan Jumlah Keluarga Sedikit maka penggunaan listrik pun Rendah.
Sumber: Ramadhan, 2020
Gambar IV.4 Text View
Selain pohon keputusan ada juga akurasi dari data tersebut. Berikit adalah gambar hasil akurasi yang diuji di Rapid Miner:
Sumber: Ramadhan, 2020
Gambar IV.5
Accuracy
Hasil accuracy dari penelitian ini adalah sebesar 96.25%. Hasil accuracy ini dapat dihitung dengan menggunankan perhitungan manual sebagai berikut: Diketahui: Tr = 43, Tt = 36, Fr = 0 dan Ft = 3
Accuracy = Keterangan:
Tr = True rendah, Tt = True tinggi Fr = False rendah/, Ft = False tinggi
Hasil perhitungan manual Accuracy sama dengan hasil dari pengujian di Rapid Miner. Selain Accuracy Ada juga hasil Precision pada penelitian ini adalah 100%. Berikut ini gambar hasil Precision yang diuji dengan Rapid Miner:
Sumber: Ramadhan, 2020
Gambar IV.6
Precision
Perhitungan Precision ini dapat dilakukan secara manual. Berikut adalah perhitungan manual Precision:
Diketahui: Tt = 36 dan Fr = 0. Precision = Keterangan:
Tr = True Tinggi dan Fr = False Rendah
Hasil perhitungan diatas sama dengan hasil yang ada di Rapid Miner. Selain Precision ada juga hasil Recall dari penelitian ini yaitu sebesar 93.%. berikut ini adalah gambar dari hasil Recall:
Sumber: Ramadhan, 2020
Recall
Hasil Recall diatas bisa didapat dari perhitungan manual, yaitu sebagai berikut:
Diketahui: Tr = 43 dan Ft = 3 Recall = Keterangan:
Tr = True Rendah dan Ft = False Tinggi
Hasil AUC (Optimistic) yang ada pada Rapid Miner yaitu 1.000, dengan positive class = Rendah. AUC (Optimistic) bias dilihat pada gambar berikut ini:
Sumber: Ramadhan, 2020
Gambar IV.8 AUC (Optimistic)
Untuk AUC pada penelitian adalah 0.600. hasil tersebut dapat dilihat pada gambar berikut:
Sumber: Ramadhan, 2020
Gambar IV.9
AUC
Untuk AUC (Pessimistic) pada penelitian ini yang diperoleh yaitu 0.930, hasil nya bias dilihat sebagai berikut:
Sumber: Ramadhan, 2020
Gambar IV.10 AUC (Pessimistic)