Pembuatan Model Klasifikasi dengan Metode Naive

BAB VI HASIL DAN PEMBAHASAN

6.4 Pembuatan Model Klasifikasi dengan Metode Naive

Pada penelitian ini dilakukan pembuatan model klasifikasi untuk setiap unsur polutan udara yakni 5 unsur polutan yang diantaranya adalah CO, NO2, O3, PM10, SO2. Pembuatan model menggnakan metode Naive Bayes dengan K-Fold cross validation untuk menemukan pembagian data training dan

testing yang cocok dengan model.

6.4.1 Klasifikasi Unsur Karbon Monoksida

Pada Tabel 6.33 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Karbon Monoksida dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 80% dan testing data 20% yakni dengan akurasi 99,8% pada proses pelatihan model dan 100%

akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 80% dan 20%.

Model prediksi klasifikasi dengan proporsi data training & testing 80% dan 20% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 100% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 100% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka semua jumlah data telah terpediksi kelas dengan benar dan tidak ada prediksi yang salah.

Tabel 6.33 Perbandingan Akurasi Model Unsur Karbon Monoksida (CO)

Percobaan Data Akurasi data

training

Akurasi data testing Training 60% & testing 40% 99,7% 99,1% Training 70% & testing 30% 98,1% 98,4% Training 80% & testing 20% 99,8% 100%

Pada Tabel 6.34 menunjukkan hasil confussion matrix prediksi data pengujian dari proporsi data terbaik yakni data training

80% dan data testing 20%. Dapat ditunjukkan dari matriks bahwa semua total data terklasifikasi dengan benar.

Tabel 6.34 Confussion matrix data testing unsur polutan udara CO

Pada Tabel 6.35 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas yang terklasifikasi benar sesuai dengan kelasnya adalah semua data benar. Sedangkan specivity semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya benar.

Tabel 6.35 Statistik Hasil Klasifikasi dengan data testing 20% unsur polutan CO

6.4.2 Klasifikasi Unsur Nitrogen Dioksida

Pada Tabel 6.36 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Nitrogen Dioksida dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 70% dan testing data 30% yakni dengan akurasi 99,5% pada proses pelatihan model dan 99,4% akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 70% dan 30%.

Model prediksi klasifikasi unsur NO2 dengan proporsi data

training & testing 70% dan 30% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 99,4% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 99,4% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka jumlah yang terpediksi kelas dengan benar adalah sebanyak 317 data dan hanya dua data terprediksi salah.

Tabel 6.36 Perbandingan Akurasi Model Unsur Nitrogen Dioksida (NO2)

Percobaan Data Akurasi data

training

Akurasi data testing Training 60% & testing 40% 99,1% 98,4% Training 70% & testing 30% 99,5% 99,4% Training 80% & testing 20% 99,8% 97,2%

Pada Tabel 6.37 menunjukkan hasil confussion matrix prediksi data pengujiandari proporsi data terbaik dari unsur NO2 yakni

data training 70% dan data testing 30%. Dapat ditunjukkan dari matriks bahwa data yang terprediksi salah tidak sesuai dengan aktual terdapat 5 data yakni 1 data terprediksi salah pada label kelas baik dan 4 data pada label kelas sedang.

Tabel 6.37 Confussion matrix data testing unsur polutan udara NO2

Pada Tabel 6.38 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas yang terklasifikasi benar sesuai dengan kelasnya adalah semua

label kelas kecuali pada label ‘sangat tidak baik’. Sedangkan

specivity semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya benar kecuali pada label kelas ‘baik’ dan ‘sedang’. Tabel 6.38 Statistik Hasil Klasifikasi dengan data testing 30% unsur polutan

NO2

6.4.3 Klasifikasi Unsur Ozon

Pada Tabel 6.39 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Ozon dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 80% dan

testing data 20% yakni dengan akurasi 99,4% pada proses pelatihan model dan 100% akurasi pada pengujian model. Oleh

karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 80% dan 20%.

Model prediksi klasifikasi O3 dengan proporsi data training & testing 80% dan 20% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 100% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 100% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka semua jumlah data telah terpediksi kelas dengan benar dan tidak ada prediksi yang salah.

Tabel 6.39 Perbandingan Akurasi Model Unsur Ozon (O3)

Percobaan Data Akurasi data

training

Akurasi data testing Training 60% & testing 40% 99,1% 98,6% Training 70% & testing 30% 99,2% 88,7% Training 80% & testing 20% 99,4% 100%

Pada Tabel 6.40 menunjukkan hasil confussion matrix prediksi data pengujian dari proporsi data terbaik dari unsur O3 yakni data training 80% dan data testing 20%. Dapat ditunjukkan dari matriks bahwa semua data terprediksi benar sesuai dengan label kelas masing-masing.

Tabel 6.40 Confussion matrix data testing unsur polutan udara O3

6.4.4 Klasifikasi Unsur Partikulat Matter

Pada Tabel 6.41 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Partikulat Matter dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun

menguji model adalah dengan proporsi data training data 70% dan testing data 30% yakni dengan akurasi 99,2% pada proses pelatihan model dan 99,4% akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 70% dan 30%.

Model prediksi klasifikasi unsur PM10 dengan proporsi data

training & testing 70% dan 30% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 99,4% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 99,1% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka jumlah yang terpediksi kelas dengan benar adalah sebanyak 316 data dan hanya 3 data terprediksi salah.

Tabel 6.41 Perbandingan Akurasi Model Unsur Partikulat Matter (PM10)

Percobaan Data Akurasi data

training

Akurasi data testing Training 60% & testing 40% 98,6% 98,6% Training 70% & testing 30% 99,3% 99,1% Training 80% & testing 20% 99,2% 98,6%

Pada Tabel 6.42 menunjukkan hasil confussion matrix prediksi data pengujiandari proporsi data terbaik dari unsur NO2 yakni data training 70% dan data testing 30%. Dapat ditunjukkan dari matriks bahwa data yang terprediksi salah tidak sesuai dengan aktual terdapat 3 data yakni 2 data terprediksi salah pada label kelas baik dan 1 data pada label kelas sedang.

Tabel 6.42 Confussion matrix data testing unsur polutan udara PM10

Pada Tabel 6.43 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas

yang terklasifikasi benar sesuai dengan kelasnya adalah semua

label kelas kecuali pada label ‘sangat baik’ dan ‘sangat tidak baik’. Sedangkan specivity semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya benar kecuali pada label kelas

‘baik’ dan ‘sedang’.

Tabel 6.43 Statistik Hasil Klasifikasi dengan data testing 30% unsur polutan PM10

6.4.5 Klasifikasi Unsur Sulfur Dioksida

Pada Tabel 6.44 menunjukkan hasil perbandingan akurasi model klasifikasi unsur Sulfur Dioksida dengan menggunakan beberapa pembagian proporsi data. Hasil menunjukkan bahwa akurasi terbaik ketika melakukan pelatihan model maupun menguji model adalah dengan proporsi data training data 70% dan testing data 30% yakni dengan akurasi 98,9% pada proses pelatihan model dan 99,1% akurasi pada pengujian model. Oleh karena itu model yang akan digunakan adalah model dengan hasil pengujian model terbaik yakni dengan proporsi data 70% dan 30%.

Model prediksi klasifikasi unsur SO2 dengan proporsi data

training & testing 70% dan 30% merupakan model terbaik karena memiliki akurasi di atas 80% yakni akurasi pengujian model sebesar 99,4% yang berarti dapat dikatakan model untuk memprediksi tersebut sangat baik. Akurasi sebesar 99,1% menunjukkan berarti dari total pengujian data sebesar 319 data dari model, maka jumlah yang terpediksi kelas dengan benar adalah sebanyak 316 data dan hanya 3 data terprediksi salah.

Tabel 6.44 Perbandingan Akurasi Model Unsur Sulfur Dioksida (SO2)

Percobaan Data Akurasi data

training

Akurasi data testing Training 60% & testing 40% 98,9% 98,1% Training 70% & testing 30% 98,9% 99,1% Training 80% & testing 20% 98,7% 98,1%

Pada Tabel 6.45 menunjukkan hasil confussion matrix prediksi data pengujiandari proporsi data terbaik dari unsur NO2 yakni data training 70% dan data testing 30%. Dapat ditunjukkan dari matriks bahwa data yang terprediksi salah tidak sesuai dengan aktual terdapat 3 data yakni data terprediksi salah pada label

kelas ‘sedang’.

Tabel 6.45 Confussion matrix data testing unsur polutan udara SO2

Pada Tabel 6.46 menunjukkan hasil sensivity dari masing-masing kelas yang bernilai 1 atau berarti sama dengan 100% yang berarti tingkat kebenaran dari masing-masing label kelas yang terklasifikasi benar sesuai dengan kelasnya adalah semua label kelas kecuali pada label ‘sedang’. Sedangkan specivity

semua kelas menunjukkan nilai 1 yang berarti semua prediksi yang terklasifikasi selain pada kelasnya atau negatif semuanya

Tabel 6.46 Statistik Hasil Klasifikasi dengan data testing 30% unsur polutan SO2

Dalam dokumen VISUALISASI DARI KLASTERISASI DAN PERAMALAN KUALITAS UDARA KOTA SURABAYA MENGGUNAKAN METODE KLASTERISASI K-MEANS DAN PERAMALAN ARTIFICIAL NEURAL NETWORK VISUALIZATION OF AIR QUALITY CLUSTERING AND FORECASTING IN SURABAYA CITY USING K-MEANS CLUSTERING METH (Halaman 188-196)