BAB VI HASIL DAN PEMBAHASAN
6.4 Pembuatan Model Klasifikasi dengan Metode Naive
Pada penelitian ini dilakukan pembuatan model klasifikasi untuk setiap unsur polutan udara yakni 5 unsur polutan yang diantaranya adalah CO, NO2, O3, PM10, SO2. Pembuatan model menggnakan metode Naive Bayes dengan K-Fold cross validation untuk menemukan pembagian data training dan
testing yang cocok dengan model.
6.4.1 Klasifikasi Unsur Karbon Monoksida
Pada Tabel 6.33 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Karbon Monoksida dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 80% dan testing data 20% yakni dengan akurasi 99,8% pada proses pelatihan model dan 100%
akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 80% dan 20%.
Model prediksi klasifikasi dengan proporsi data training & testing 80% dan 20% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 100% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 100% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka semua jumlah data telah terpediksi kelas dengan benar dan tidak ada prediksi yang salah.
Tabel 6.33 Perbandingan Akurasi Model Unsur Karbon Monoksida (CO)
Percobaan Data Akurasi data
training
Akurasi data testing Training 60% & testing 40% 99,7% 99,1% Training 70% & testing 30% 98,1% 98,4% Training 80% & testing 20% 99,8% 100%
Pada Tabel 6.34 menunjukkan hasil confussion matrix prediksi data pengujian dari proporsi data terbaik yakni data training
80% dan data testing 20%. Dapat ditunjukkan dari matriks bahwa semua total data terklasifikasi dengan benar.
Tabel 6.34 Confussion matrix data testing unsur polutan udara CO
Pada Tabel 6.35 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas yang terklasifikasi benar sesuai dengan kelasnya adalah semua data benar. Sedangkan specivity semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya benar.
Tabel 6.35 Statistik Hasil Klasifikasi dengan data testing 20% unsur polutan CO
6.4.2 Klasifikasi Unsur Nitrogen Dioksida
Pada Tabel 6.36 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Nitrogen Dioksida dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 70% dan testing data 30% yakni dengan akurasi 99,5% pada proses pelatihan model dan 99,4% akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 70% dan 30%.
Model prediksi klasifikasi unsur NO2 dengan proporsi data
training & testing 70% dan 30% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 99,4% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 99,4% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka jumlah yang terpediksi kelas dengan benar adalah sebanyak 317 data dan hanya dua data terprediksi salah.
Tabel 6.36 Perbandingan Akurasi Model Unsur Nitrogen Dioksida (NO2)
Percobaan Data Akurasi data
training
Akurasi data testing Training 60% & testing 40% 99,1% 98,4% Training 70% & testing 30% 99,5% 99,4% Training 80% & testing 20% 99,8% 97,2%
Pada Tabel 6.37 menunjukkan hasil confussion matrix prediksi data pengujiandari proporsi data terbaik dari unsur NO2 yakni
data training 70% dan data testing 30%. Dapat ditunjukkan dari matriks bahwa data yang terprediksi salah tidak sesuai dengan aktual terdapat 5 data yakni 1 data terprediksi salah pada label kelas baik dan 4 data pada label kelas sedang.
Tabel 6.37 Confussion matrix data testing unsur polutan udara NO2
Pada Tabel 6.38 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas yang terklasifikasi benar sesuai dengan kelasnya adalah semua
label kelas kecuali pada label ‘sangat tidak baik’. Sedangkan
specivity semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya benar kecuali pada label kelas ‘baik’ dan ‘sedang’. Tabel 6.38 Statistik Hasil Klasifikasi dengan data testing 30% unsur polutan
NO2
6.4.3 Klasifikasi Unsur Ozon
Pada Tabel 6.39 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Ozon dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 80% dan
testing data 20% yakni dengan akurasi 99,4% pada proses pelatihan model dan 100% akurasi pada pengujian model. Oleh
karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 80% dan 20%.
Model prediksi klasifikasi O3 dengan proporsi data training & testing 80% dan 20% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 100% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 100% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka semua jumlah data telah terpediksi kelas dengan benar dan tidak ada prediksi yang salah.
Tabel 6.39 Perbandingan Akurasi Model Unsur Ozon (O3)
Percobaan Data Akurasi data
training
Akurasi data testing Training 60% & testing 40% 99,1% 98,6% Training 70% & testing 30% 99,2% 88,7% Training 80% & testing 20% 99,4% 100%
Pada Tabel 6.40 menunjukkan hasil confussion matrix prediksi data pengujian dari proporsi data terbaik dari unsur O3 yakni data training 80% dan data testing 20%. Dapat ditunjukkan dari matriks bahwa semua data terprediksi benar sesuai dengan label kelas masing-masing.
Tabel 6.40 Confussion matrix data testing unsur polutan udara O3
6.4.4 Klasifikasi Unsur Partikulat Matter
Pada Tabel 6.41 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Partikulat Matter dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun
menguji model adalah dengan proporsi data training data 70% dan testing data 30% yakni dengan akurasi 99,2% pada proses pelatihan model dan 99,4% akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 70% dan 30%.
Model prediksi klasifikasi unsur PM10 dengan proporsi data
training & testing 70% dan 30% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 99,4% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 99,1% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka jumlah yang terpediksi kelas dengan benar adalah sebanyak 316 data dan hanya 3 data terprediksi salah.
Tabel 6.41 Perbandingan Akurasi Model Unsur Partikulat Matter (PM10)
Percobaan Data Akurasi data
training
Akurasi data testing Training 60% & testing 40% 98,6% 98,6% Training 70% & testing 30% 99,3% 99,1% Training 80% & testing 20% 99,2% 98,6%
Pada Tabel 6.42 menunjukkan hasil confussion matrix prediksi data pengujiandari proporsi data terbaik dari unsur NO2 yakni data training 70% dan data testing 30%. Dapat ditunjukkan dari matriks bahwa data yang terprediksi salah tidak sesuai dengan aktual terdapat 3 data yakni 2 data terprediksi salah pada label kelas baik dan 1 data pada label kelas sedang.
Tabel 6.42 Confussion matrix data testing unsur polutan udara PM10
Pada Tabel 6.43 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas
yang terklasifikasi benar sesuai dengan kelasnya adalah semua
label kelas kecuali pada label ‘sangat baik’ dan ‘sangat tidak baik’. Sedangkan specivity semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya benar kecuali pada label kelas
‘baik’ dan ‘sedang’.
Tabel 6.43 Statistik Hasil Klasifikasi dengan data testing 30% unsur polutan PM10
6.4.5 Klasifikasi Unsur Sulfur Dioksida
Pada Tabel 6.44 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Sulfur Dioksida dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 70% dan testing data 30% yakni dengan akurasi 98,9% pada proses pelatihan model dan 99,1% akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 70% dan 30%.
Model prediksi klasifikasi unsur SO2 dengan proporsi data
training & testing 70% dan 30% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 99,4% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 99,1% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka jumlah yang terpediksi kelas dengan benar adalah sebanyak 316 data dan hanya 3 data terprediksi salah.
Tabel 6.44 Perbandingan Akurasi Model Unsur Sulfur Dioksida (SO2)
Percobaan Data Akurasi data
training
Akurasi data testing Training 60% & testing 40% 98,9% 98,1% Training 70% & testing 30% 98,9% 99,1% Training 80% & testing 20% 98,7% 98,1%
Pada Tabel 6.45 menunjukkan hasil confussion matrix prediksi data pengujiandari proporsi data terbaik dari unsur NO2 yakni data training 70% dan data testing 30%. Dapat ditunjukkan dari matriks bahwa data yang terprediksi salah tidak sesuai dengan aktual terdapat 3 data yakni data terprediksi salah pada label
kelas ‘sedang’.
Tabel 6.45 Confussion matrix data testing unsur polutan udara SO2
Pada Tabel 6.46 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas yang terklasifikasi benar sesuai dengan kelasnya adalah semua label kelas kecuali pada label ‘sedang’. Sedangkan specivity
semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya
Tabel 6.46 Statistik Hasil Klasifikasi dengan data testing 30% unsur polutan SO2