24
BAB IV
HASIL PENELITIAN DAN PEMBAHASAN
4.1 Hasil Penelitian
Pada penelitian ini digunakan metode C4.5. Kasus yang diambil adalah data anggaran pengeluaran perusahaan yang berjumlah 36 data. Data sampel ini yang akan dihitung probabilitasnya, kemudian akan dicari tingkat akurasi tertinggi dari data tersebut dan akan diimplementasikan pada RapidMiner.
4.2 Pembahasan
Data mentah yang telah diperoleh dari perusahaan kemudian diolah menjadi data testing, yang selanjutnya akan dibuat pohon keputusan untuk mempediksi anggaran dengan atribut keputusan profit dan defisit berdasarkan data anggaran dari pengeluaran biaya staf, tenaga ahli, tenaga teknis, operasional, peralatan, laporan, dan biaya mobilitas. Berikut dibawah ini adalah tabel data testing yang telah diolah dari data mentah:
Tabel IV.1 Data Testing
No Staf Tenaga Ahli
Tenaga
Teknis Operasional Peralatan Laporan Mobilitas
Tingkat Profit 1 Budget Enough Enough Enough Enough Budget Budget Profit 2 Past Budget Past Enough Enough Past Past Defisit 3 Budget Enough Budget Budget Past Past Enough Profit 4 Enough Enough Past Past Past Enough Past Defisit 5 Budget Enough Past Budget Enough Past Budget Profit 6 Budget Budget Budget Enough Budget Budget Enough Profit 7 Budget Enough Budget Budget Budget Budget Budget Profit 8 Budget Budget Budget Past Enough Budget Budget Profit 9 Budget Enough Budget Past Budget Budget Enough Profit 10 Past Enough Enough Budget Past Budget Budget Profit 11 Budget Past Budget Enough Budget Budget Budget Profit 12 Budget Enough Enough Budget Budget Enough Enough Profit 13 Budget Enough Budget Enough Budget Budget Enough Profit
14 Budget Budget Enough Enough Past Budget Budget Profit 15 Past Enough Budget Past Past Past Enough Defisit 16 Past Past Enough Budget Budget Budget Enough Profit 17 Enough Enough Enough Budget Enough Enough Budget Profit 18 Budget Budget Budget Budget Budget Budget Budget Profit 19 Budget Budget Budget Budget Budget Budget Enough Profit 20 Budget Enough Budget Budget Enough Budget Budget Profit 21 Budget Enough Past Budget Past Past Budget Profit 22 Enough Enough Past Past Past Enough Past Defisit 23 Enough Budget Budget Enough Budget Budget Budget Profit 24 Budget Enough Enough Budget Budget Budget Budget Profit 25 Budget Enough Budget Enough Past Budget Enough Profit 26 Enough Budget Enough Past Enough Budget Budget Profit 27 Past Enough Budget Past Past Budget Past Defisit 28 Past Enough Enough Budget Enough Budget Enough Defisit 29 Past Enough Enough Enough Enough Enough Budget Profit 30 Budget Budget Budget Budget Enough Budget Budget Profit 31 Budget Budget Enough Budget Budget Budget Enough Profit 32 Enough Enough Budget Enough Enough Budget Budget Profit 33 Budget Budget Budget Budget Enough Budget Budget Profit
34 Past Past Enough Past Past Enough Past Defisit
35 Enough Enough Budget Enough Budget Budget Budget Profit 36 Budget Budget Budget Budget Budget Budget Budget Profit Data diatas akan diuji pada aplikasi RapidMiner untuk mengetahuiakurasi dan pohon keputusan nya, kemudian akan dihitung manual di Microsoft Excel. Berikut ini adalah perhitungan manual untuk mengetahui Entropy dan Gain
Tabel IV.2 Perhitungan Node 1 Jumlah Kasus (J) Profit (S1) Defisit (S2) Entropy (S) Gain Node 1 Total 36 29 7 0,21393505 Biaya Staf 0,099566095 Budget 21 21 0 0 Enough 7 5 2 0,259825181 Past 8 3 5 0,287313264 Biaya Tenaga Ahli 0,010324088 Budget 12 11 1 0,124571285 Enough 21 16 5 0,238373116 Past 3 2 1 0,276434591
Biaya Tenaga Teknis 0,030985939 Budget 19 17 2 0,146138251 Enough 12 10 2 0,195676247 Past 5 2 3 0,292285253 Biaya Operasional 0,063781228 Budget 17 16 1 0,097159526 Enough 11 10 1 0,132301776 Past 8 3 5 0,287313264 Biaya Peralatan 0,065090191 Budget 14 14 0 0 Enough 12 10 2 0,195676247 Past 10 5 5 0,301029996 Biaya Laporan 0,03909321 Budget 25 23 2 0,121068 Enough 6 3 3 0,301029996 Past 5 3 2 0,292285253 Biaya Mobilitas 0,151016246 Budget 20 20 0 0 Enough 11 9 2 0,205916087 Past 5 0 5 0
Pada tabel diatas diketahui total nilai entropy yang didapat dari perhitungan sebagai berikut:
Entropy (S) = ((-9/11*LOG(9/11)+ (-2/11*LOG(2/11)) = 0,151016246
Pada tabel tersebut juga diketahui nilai gain terbesar dari biaya mobilitas yaitu sebagai berikut:
Gain = 0,151016246- ((20/36*0) + (11/36*0,205916087) + (5/36*0)) = 0,151016246
Dengan demikian biaya mobilitas dapat menjadi akar, karena biaya mobilitas memiliki gain terbesar pertama. Ada 3 kelas pada biaya mobilitas yaitu budget, enough, dan past. Dari ketiga kelas tersebut kelas enough memiliki nilai Entropy paling tinggi yaitu 0,151016246 maka kelas enough perlu dilakukan perhitungan
kembali, sedangkan kelas budget dan past tidak perlu dilakukan perhitungan kembali. Berikut ini adalah tabel perhitungan node 2:
TabelIV.3 Perhitungan Node 2 Jumlah Kasus (J) Profit (S1) Defisit (S2) Entropy (S) Gain Node 1 Total Biaya Mobilitas Enough 11 9 2 0,205916087 Biaya Staf 0,130524835 Budget 8 8 0 0 Past 3 1 2 0,276434591 Biaya Tenaga Ahli 0,04057279 Budget 3 3 0 0 Enough 7 5 2 0,259825181 Past 1 1 0 0 Biaya Tenaga Teknis 0,003765635 Budget 7 6 1 0,178111254 Enough 4 3 1 0,24421905 Biaya Operasional 0,044450863 Budget 6 5 1 0,195676247 Enough 3 3 0 0 Past 2 1 1 0,301029996 Biaya Peralatan 0,130524835 Budget 7 7 0 0 Enough 1 0 1 0 Past 3 2 1 0,276434591 Biaya Laporan 0,032180305 Budget 8 7 1 0,163629202 Enough 1 1 0 0 Past 2 1 1 0,301029996
Setelah perhitungan menggunakan Microsoft Excel selesai, barulah data diuji pada Rapidminer untuk mengetahui pohon keputusan dan kebenaran dari hasil perhitungan yang sudah dilakukan diatas.
Berikut ini adalah uji validasi menggunakan Rapidminer 5.
GambarIV.1 Proses Awal
Pada proses awal ini dilakukan Import atau masukan data dengan menggunakan Read Excel, kemudian dihubungkan ke X-Validation. Setelah itu klik dua kali pada X-Validation, maka akan muncul tampilan sebagai berikut:
GambarIV.2 Uji Validasi
Setelah muncul tampilan diatas masukan decision tree dibagian training, kemudian masukan apply model dan performance dibagian testing yang nantinya akan menghasilkan pohon keputusan dan performance vector yang menghasilkan accuracy, precision, recall, AUC (optimistic), dan AUC (pessimistic). Dibawah ini adalah gambar Pohon keputusan yang dihasilkan oleh Rapidminer 5.2:
Gambar IV.3 Hasil Decision Tree
Tujuan utama dari menganalisis data dengan menggunakan algoritma Decision Tree ini yaitu mendapatkan rules atau aturanyang akan dimanfaatkan untuk pengambilan keputusan pada data baru, pohon keputusan di atas menghasilkan atribut yang berpengaruh pada keputusan nanti.Rules ini akan didapat berdasarkan dari model pohon keputusan yaitu text view sebagai berikut :
Mobilitas = Budget: Profit {Profit=20, Defisit=0} Mobilitas = Enough
| Staf = Budget: Profit {Profit=8, Defisit=0} | Staf = Past: Defisit {Profit=1, Defisit=2} Mobilitas = Past: Defisit {Profit=0, Defisit=5}
Rules tersebut dapat dijelaskan sebagai berikut :
1. Jika Mobilitas = Budget maka Profit,dengan aturan banyak nilai Profit = 20 dan Defisit = 0.
2. Jika Mobiltas enough maka muncul akar baru,akar baru tersebut adalah Staf yang didapat dari gain tertinggi pada perhitungan node ke 2.
3. Dimana jika Staf = Budget maka profit, dengan aturan banyak nilai Profit = 8 dan Defisit = 0.
4. Jika Staf = Past maka Defisit,dengan aturan banyak nilai Profit = 1 dan Defisit = 2.
5. Kemudian melanjutkan dari akar Mobilitas, jika Mobilitas = Past maka Defisit,dengan aturan banyak nilai Profit = 0 dan Defisit = 5.
4.3 Pengujian Model 4.3.1 Akurasi Data
Hasil akurasi data merupakan tingkat seberapa akurat hasil keputusan yang di proses menggunakan aplikasi RapidMiner dengan data perusahaan.
Gambar IV.4 Accuracy
Dengan mengetahui hasil jumlah data yang di klasifikasikan secara benar maka dapat diketahui hasil akurasi dari Rapid Miner adalah sebesar 93.33% dari hasil data testing.
Hasil akurasi ini dapat dihitung dengan menggunakan perhitungan manual sebagai berikut:
Diketahui: Td = 5, Tp = 29, Fd = 0 dan Fp = 2
Accuracy = Keterangan:
Td = True Defisit/Defisit, Tp = True Profit/Profit Fd = False Defisit/Defisit, Ft = False Profit/Profit
4.3.2 ROC
ROC (Receivier Operating Characteristic) Curve adalah grafik antara sensitifitas untuk merepresentasikan grafis yang menentukan klasifikasi mana yang lebih baik, digunakan metode yang menghitung luas daerah dibawah kurva ROC yang disebut AUC
(Area Under the ROC Curve) yang diartikan sebagai probabilitas. (Vinanti, 2019 : 15) AUC atau Area Under Curveyang merupakan perhitungan untuk mengukur perbedaan performansi metode yang digunakan untukmengekspresikan data confusion matrix. Garishorizontal mewakili nilai false positives (FP) dan garis vertikal mewakili nilai true positives (TP), AUC terdiri dari AUC Optimistic, dan AUC Pessimistic AUC mengukur kinerja diskriminatif dengan memperkirakan probabilitas output dari sampel yang dipilih secara acak dari populasi positif atau negatif, semakin besar AUC, semakin kuat klasifikasi yang digunakan. Karena AUC adalah bagian dari daerah unit persegi, nilainya akan selalu antara 0,0 dan 1,0. (Akbar R., ett.all, 2019)
AUC optimistic adalah perhitungan pengukuran perbedaan performasi metode yang digunakan untuk menghasilkan nilai yang sesuai dengan kriteria yang
ditentukan (Akbar R., ett.all, 2019). Bentuk dari hasil proses AUC tersebut dibawah ini :
Gambar IV.5 AUC (Optimistic)
Hasil AUC (Optimistic) yang ada pada Rapid Miner yaitu 0.850, dengan positive class = Defisit.
AUC pessimistic adalah perhitungan pengukuran perbedaan performasi metode yang digunakan untuk menghasilkan nilai yang tidak sesuai dengan kriteria yang ditentukan (Akbar R., ett.all, 2019). Bentuk dari hasil proses AUC tersebut dibawah ini :
Gambar IV.6 AUC (Pessimistic)
Hasil AUC (Pessimistic) yang ada pada Rapid Miner yaitu 0.800, dengan positive class = Defisit.
4.4 GUI (Grafic User Interface)
GUI atau Grafic User Interface merupakan jenis program antarmuka pengguna yang menggunakan metoda interaksi pada piranti elektronik secara grafis (bukan perintah teks) antara pengguna dan komputer (Didi, 2016)
Dalam penerapan pada GUI (Grafic User Interface) yang di buat, data yang di gunakan sebanyak 36 record, diambil dari data anggaran perusahaan 3 tahun terakhir. Hasil dari perhitungan tersebut didapat atribut keputusan 29 Profit dan 7 Defisit, kemudian dibawah ini digambarkan GUI untuk prediksi anggaran dengan atribut keputusan profit dan defisit sebagai acuan pembuatan anggaran pengeluaran untuk waktu yang akan datang.
GambarIV.7