ix
Institut Teknologi Nasional
DAFTAR ISI
Halaman LEMBAR JUDUL
HALAMAN PERNYATAAN ORISINALITAS ... ii
LEMBAR PENGESAHAN ... iii
KATA PENGANTAR / UCAPAN TERIMAKASIH ... iv
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI UNTUK KEPENTINGAN AKADEMIS ... vi
ABSTRAK ... vii
DAFTAR ISI ... ix
DAFTAR TABEL ... xi
DAFTAR GAMBAR ... xii
BAB I PENDAHULUAN ... 1
A. LATAR BELAKANG ... 1
B. RUMUSAN MASALAH ... 3
C. RUANG LINGKUP PENELITIAN ... 4
D. TUJUAN PENELITIAN ... 4
E. SISTEMATIKA PENULISAN ... 4
BAB II STUDI LITERATUR ... 6
A. KUALITAS ... 6
B. PREDIKSI KUALITAS ... 7
C. IMBALANCE DATA ... 7
D. METODE RESAMPLING ... 8
a. Randon Under Sampling ... 8
b. Random Over Sampling ... 9
c. Synthetic Minority Over Sampling ... 10
E. ALGORITMA PENGKLASIFIKASI... 11
a. Algoritma Naïve Bayes ... 11
b. Algoritma Random Forest ... 11
c. Algoritma C 4.5 ... 12
F. PENGUKURAN PERFORMA ... 14
a. Confusion Matrix ... 14
b. Accuracy ... 14
c. Precision ... 14
d. Sensitivity ... 15
e. Specificity ... 15
f. F-Measure ... 15
g. G-Mean ... 16
x
Institut Teknologi Nasional
G. PENELITIAN SEBELUMNYA ... 16
H. POSISI PENELITIAN ... 19
BAB III METODOLOGI PENELITIAN ... 20
A. LANGKAH PENELITIAN... 20
B. DATA UNDERSTANDING ... 21
C. DATA PREPARATION ... 21
D. MODELLING ... 21
a. Pendekatan Level Data... 21
b. Pendekatan Algoritmik/Algoritma Pengklasifikasi ... 22
c. Validasi ... 22
d. Menghitung Nilai Performa ... 23
e. Pemilihan Metode Terbaik ... 23
E. EVALUASI ... 24
F. ANALISIS ... 24
BAB IV HASIL DAN PEMBAHASAN ... 25
A. DATA UNDERSTANDING ... 25
B. DATA PREPARATION ... 26
a. Data Cleansing ... 26
b. Data Transformasi ... 27
C. PREPROCESSING ... 27
a. Randon Oversampling (ROS) ... 28
b. Random Undersampling (RUS) ... 28
c. Synthetic Minority Over Sampling Technique (SMOTE) 100% ... 29
d. Synthetic Minority Over Sampling Technique (SMOTE) 300% ... 29
e. Kombinasi Synthetic Minority Over Sampling Technique (SMOTE) dengan Random Undersampling (RUS) ... 30
D. ALGORITMA PERNGKLASIFIKASI ... 31
a. Accuracy ... 32
b. G-Mean ... 32
c. F-Measure ... 33
E. MODELLING ... 36
F. EVALUASI ... 38
BAB V PENUTUP ... 41
A. KESIMPULAN ... 41
B. SARAN ... 42
DAFTAR PUSTAKA ... 43
LAMPIRAN ... 45
xi
Institut Teknologi Nasional
DAFTAR TABEL
Tabel 2.1 Posisi Penelitian ... 19
Tabel 3.1 Confusion Matrix ... 23
Tabel 4.1 Dataset Semiconductor ... 25
Tabel 4.2 Hasil Perhitungan Performansi Algoritma Pengklasifikasi ... 31
Tabel 4.3 Tabel Hasil Prediksi ... 38
xii
Institut Teknologi Nasional
DAFTAR GAMBAR
Gambar 2.1 Classification with and without using undersampling ... 9
Gambar 4.1 Dataset Sebelum Auto Cleansing ... 26
Gambar 4.2 Dataset Sesudah Auto Cleansing ... 27
Gambar 4.3 Grafik Dataset Semikonduktor ... 28
Gambar 4.4 Grafik Dataset Metode Random Oversampling ... 28
Gambar 4.5 Grafik Dataset Metode Random Undersampling ... 29
Gambar 4.6 Grafik Dataset Metode SMOTE 100% ... 29
Gambar 4.7 Grafik Dataset Metode SMOTE 300% ... 30
Gambar 4.8 Grafik Dataset Metode Kombinasi SMOTE+RUS ... 30
Gambar 4.9 Grafik Performansi Accuracy ... 32
Gambar 4.10 Grafik Performansi G-Mean ... 32
Gambar 4.11 Grafik Performansi F-Measure ... 33
Gambar 4.12 Output proses kombinasi metode ROS dengan random forest .. 34
Gambar 4.13 Grafik Rekapitulasi Hasil Uji Parameter Performansi ... 35
Gambar 4.14 Visualisasi Kombinasi Model ROS dengan Random Forest... 37
Gambar 4.15 Visualisasi Prediction Margin ... 39
Gambar 4.16 Visualisasi Fail/Pass ... 40
Gambar 4.17 Visualisasi Hasil Prediksi ... 40