4.1 Hasil
Tahapan-tahapan pada sub bab 3.3 diimplementasi dengan menggunakan bahasa pemograman MATLAB®, dimana semua proses pengimplementasian dilakukan hanya melalui console pada program MATLAB® tersebut.
Pengimplementasian ini bertujuan untuk menpermudah proses perhitungan dalam pengujian terhadap seluruh data yang digunakan dalam penelitian ini. Adapun hasil output dari pengujian terhadap dataset ionosphare dapat dilihat pada gambar 4.1.
Gambar 4.1 Output Akurasi Pengujian Pada Dataset Ionosphare
Adapun hasil output dari pengujian terhadap dataset iris dapat dilihat pada gambar 4.2.
Gambar 4.2 Output Akurasi Pengujian Pada Dataset Iris
Adapun hasil output dari pengujian terhadap dataset voice genre dapat dilihat pada gambar 4.3.
Gambar 4.3 Output Akurasi Pengujian Pada Dataset Voice Genre
27
Adapun hasil output dari pengujian terhadap dataset lower back pain symptomps dapat dilihat pada gambar 4.4.
Gambar 4.4 Output Akurasi Pengujian Pada Dataset Lower Back Pain Symptomps
Adapun hasil output dari pengujian terhadap dataset new thyroid dapat dilihat pada gambar 4.5.
Gambar 4.5 Output Akurasi Pengujian Pada Dataset New Thyroid
Adapun hasil output dari pengujian terhadap data penjurusan siswa dapat dilihat pada gambar 4.6.
Gambar 4.6 Output Akurasi Pengujian Pada Data Penjurusan Siswa
4.2 Pengujian
Pengujian dilakukan dengan menggunakan beberapa data yang didapat dari UCI Repository, Kaggle Repository, Keel Repository dan data yang merupakan hasil studi lapangan secara langsung yang dialaukan oleh penulis.
Pada saat pengujian, sebanyak 80% dari data akan dijadikan sebagai data latih dan sebanyak 20% dari data akan dijadikan data uji yang dilakukan secara random.
Adapun rincian data yang digunakan dapat dilihat pada tabel 4.1.
Tabel 4.1 Rincian Dataset Yang Digunakan
Data Atribut Tipe Kelas Jumlah Data
Ionosphere 34 Integer/Real 2 351
Iris 4 Integer/Real 3 150
Voice Genre 21 Integer/Real 2 3168
Lower Back Pain Symptomps 13 Integer/Real 2 310
Thyroid 5 Integer/Real 3 215
Penjurusan Siswa 9 Integer/Real 2 167
29
Pengujian ini bertujuan untuk melihat kinerja metode Local Mean dan Distance Weight pada K-NN. Pengukuran kinerja dilihat berdasarkan dari hasil akurasi yang didapati dari K-NN yang menggunakan Local Mean dan Distance Weight terhadap K-NN konvensional.
4.1.1 Pengujian Terhadap Dataset Ionosphare
Pengujian pertama dilakukan menggunakan dataset ionosphere, dimana dataset ini berjumlah 351 record dengan 34 atribut dan terdiri dari 2 kelas data. Pada pengujian menggunakan dataset ionosphere ini, data latih berjumlah 281 data, dan data uji berjumlah 70 data. Adapun rincian dari distribusi data ionoshpere dapat dilhat pada tabel 4.2, dan untuk melihat data latih dan data uji yang digunakan dapat dilihat pada tabel 4.3.
Tabel 4.2 Distribusi Data Ionosphare
No Kategori Kelas Jumlah
Tabel 4.3 Rincian Data Ionosphare Yang digunakan Data Latih
Selanjutnya dilakukan perhitungan jarak antara data latih dan data uji menggunakan model jarak Euclaudien (persamaan 2.10). Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.4. Selanjutnya dilakukan pengurutan jarak antar data secara ascending, adapun urutan jarak terdekat antar data dapat dilihat pada tabel 4.5.
Tabel 4.4 Jarak Antara Data Pada Dataset Ionosphare
Data Uji Data Latih
Tabel 4.5 Urutan Jarak Terdekat Pada Dataset Ionosphare Data
Untuk K-NN konvensional akan ditentukan kelas mayoritasnya berdasarkan K tetangga terdekat dan akan menjadian kelas mayoritas sebagai kelas bagi data uji, sedangkan tahap selanjutnya untuk gabungan LMKNN dan DWKNN akan menghitung nilai rata-rata bobot dari jarak sebanyak K tetangga terdekat untuk setiap
31
kelas data, dan akan menjadikan rata-rata bobot tertinggi sebagai kelas bagi data uji, adapun hasil yang didapati dari K-NN konvensional dan Gabungan Metode yang diusulkan dapat dilihat pada tabel 4.6.
Tabel 4.6 Perbandingan Akurasi Pada Dataset Ionosphare
No K
Rata-rata 84.57% 86.86% LMKNN+DWKNN
Adapun grafik yang dihasilkan dari perbadingan akurasi K-NN konvesional dengan metode yang diusulkan dapat dilhat pada gambar 4.7.
Gambar 4.7 Grafik Perbandingan Akurasi Pada Dataset Ionosphare
85.71% 85.71%
Merujuk dari tabel 4.6 dan gambar 4.7 terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN tidak pernah sekalipun berada dibawah dari nilai akurasi yang dihasilkan oleh K-NN konvensional. Nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 85.71% yaitu pada saat K bernilai 1 dan 3, sedangkan pada K-NN konvensional nilai akurasi terendah dihasilkan sebesar 82.86% saat K bernilai 6 dan 8. Nilai Tertinggi yang dihasilkan oleh gabungan LMKNN dan DWKNN adalah sebesar 88.57% saat K bernilai 4, sedangkan K-NN hanya mampu menghasilkan nilai akurasi tertinggi sebesar 85.7% saat K bernilai 1 sampai dengan 4.
4.1.2 Pengujian Terhadap Dataset Iris
Pengujian selanjutnya menggunakan dataset iris, dimana dataset merupakan salah satu dataset yang populer, hal ini salah satunya disebabkan karena dataset iris memiliki sebaran data yang baik. Data set ini ini berjumlah 150 record dengan 4 atribut dan terdiri dari 3 kelas data. Pada pengujian ini, data latih berjumlah 120 data, dan data uji berjumlah 30 data. Adapun rincian dari distribusi dataset iris ini dapat dilhat pada tabel 4.7, dan untuk rincian dari data yang digunakan sebagai data latih dan data uji dapat dilihat pada tabel 4.8.
Tabel 4.7 Distribusi Data Iris
No Kategori Kelas Jumlah
Data Setosa Versicolor Virginica
1 Data Latih 37 41 42 120
2 Data Uji 13 9 8 30
Total 50 50 50 150
Tabel 4.8 Rincian Data Iris Yang digunakan Data Latih
No Id X1 X2 X3 X4 Kelas
1 L1 6.80 2.80 4.80 1.40 Versicolor 2 L2 6.10 2.80 4.00 1.30 Versicolor 3 L3 6.50 3.00 5.50 1.80 Virginica 4 L4 5.20 2.70 3.90 1.40 Versicolor 5 L5 6.30 2.80 5.10 1.50 Virginica 6 L6 5.10 3.30 1.70 0.50 Setosa
… … … …
120 L120 5.10 3.50 1.40 0.30 Setosa
33
Tabel 4.8 Rincian Data Iris Yang digunakan (Lanjutan) Data Uji
No Id X1 X2 X3 X4 Kelas
1 U1 5.20 3.40 1.40 0.20 Setosa 2 U2 7.20 3.60 6.10 2.50 Virginica 3 U3 6.20 2.90 4.30 1.30 Versicolor
… … … …
30 U30 5.40 3.90 1.30 0.40 Setosa
Selanjutnya dilakukan perhitungan jarak antara data latih dan data uji menggunakan model jarak Euclaudien dengan menggunakan persamaan 2.10. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.9. Selanjutnya dilakukan pengurutan jarak antar data secara ascending, adapun urutan jarak terdekat antar data dapat dilihat pada tabel 4.10.
Tabel 4.9 Jarak Antara Data Pada Dataset Iris
Data Uji Data Latih
L1 L2 L3 L4 L5 … L281
U1 3.990 3.023 4.607 2.860 4.117 … 0.173
U2 1.924 2.775 1.304 3.295 1.857 … 5.599
U3 0.794 0.332 1.338 1.100 0.837 … 3.314
… … … …
U30 4.052 3.130 4.650 3.040 4.204 … 0.520
Tabel 4.10 Urutan Jarak Terdekat Pada Dataset Iris Data
Uji
Urutan Jarak Terdekat
1st 2nd 3rd 4th 5th … 120th
U1 L75 L120 L69 L81 L37 … L97
U2 L57 L47 L45 L82 L98 … L10
U3 L2 L83 L39 L118 L58 … L10
… … … …
U30 L46 L117 L71 L34 L51 … L97
Untuk K-NN konvensional akan ditentukan kelas mayoritasnya berdasarkan K tetangga terdekat dan akan menjadian kelas mayoritas sebagai kelas bagi data uji, sedangkan tahap selanjutnya untuk gabungan LMKNN dan DWKNN akan menghitung nilai rata-rata bobot dari jarak sebanyak K tetangga terdekat untuk setiap kelas data, dan akan menjadikan rata-rata bobot tertinggi sebagai kelas bagi data uji,
adapun hasil yang didapati dari K-NN konvensional dan Gabungan Metode yang diusulkan dapat dilihat pada tabel 4.11.
Tabel 4.11 Perbandingan Akurasi Pada Dataset Iris
No K
Rata-rata 96.67% 98.33% LMKNN+DWKNN
Adapun grafik yang dihasilkan dari perbadingan akurasi K-NN konvesional dengan metode yang diusulkan dapat dilhat pada gambar 4.8.
Gambar 4.8 Grafik Perbandingan Akurasi Pada Dataset Iris
96.67% 96.67% 96.67%
35
Merujuk dari tabel 4.16 dan gambar 4.8 terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN tidak pernah sekalipun berada dibawah dari nilai akurasi yang dihasilkan oleh K-NN konvensional. Nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 96.67% yaitu pada saat K bernilai 1 sampai dengan K bernilai 5, sedangkan pada K-NN konvensional nilai akurasi terendah yang dihasilkan juga sebesar 93.33% saat K bernilai 9. Nilai Tertinggi yang dihasilkan oleh gabungan LMKNN dan DWKNN adalah sebesar 100% saat K bernilai 6 sampai dengan K bernilai 10, sedangkan K-NN hanya mampu menghasilkan nilai akurasi tertinggi sebesar 100% hanya saat K bernilai 8.
4.1.3 Pengujian Terhadap Dataset Voice Genre
Data voice genre digunakan untuk mengidentifikasi jenis kelamin berdasarkan suara melalui sifat akustik dari suara dan ucapan. Data set ini terdiri dari 3168 sampel dengan 20 atribut yang merupakan ektrasi fitur menggunakan R. Adapun sebaran dari data voice genre pada pengujian ini dapat dilihat pada tabel 4.12.
Tabel 4.12 Distribusi Data Voice Genre
No Kategori Kelas Jumlah
Data
Male Female
1 Data Latih 1278 1256 2534
2 Data Uji 306 328 634
Total 1584 1584 3168
Adapun rincian dari data voice genre yang digunakan sebagai data latih dapat dilihat pada tabel 4.13, dan data uji dapat dilihat pada tabel 4.14.
Tabel 4.13 Rincian Data Latih Voice Genre
No Id X1 X2 X3 X4 … X20 Kelas
1 L1 0.235 0.042 0.242 0.212 … 0.103 Female 2 L2 0.190 0.069 0.213 0.162 … 0.071 Female
3 L3 0.165 0.046 0.181 0.127 … 0.205 Male
4 L4 0.190 0.053 0.175 0.148 … 0.095 Female 5 L5 0.173 0.072 0.176 0.141 … 0.201 Female 6 L6 0.222 0.031 0.226 0.200 … 0.131 Female 7 L7 0.209 0.033 0.209 0.197 … 0.106 Female 8 L8 0.127 0.088 0.155 0.028 … 0.135 Female
Tabel 4.13 Rincian Data Latih Voice Genre (Lanjutan)
No Id X1 X2 X3 X4 … X20 Kelas
9 L9 0.201 0.052 0.218 0.158 … 0.163 Male
10 L10 0.171 0.068 0.145 0.131 … 0.273 Male
… … … …
2534 L2534 0.215 0.034 0.217 0.198 … 0.067 Female
Tabel 4.14 Rincian Data Uji Voice Genre
No Id X1 X2 X3 X4 … X20 Kelas
1 U1 0.152 0.059 0.129 0.107 … 0.160 Male
2 U2 0.243 0.031 0.246 0.229 … 0.112 Female 3 U3 0.181 0.053 0.186 0.161 … 0.286 Female
4 U4 0.151 0.076 0.156 0.102 … 0.349 Male
5 U5 0.162 0.062 0.185 0.104 … 0.420 Male
6 U6 0.217 0.040 0.215 0.185 … 0.123 Female 7 U7 0.200 0.067 0.214 0.182 … 0.192 Female 8 U8 0.214 0.035 0.223 0.194 … 0.043 Female
… … … …
634 U634 0.155 0.091 0.190 0.052 … 0.253 Female Dengan menggunakan model jarak Euclaudien (persamaan 2.10) dilakukan perhitungan jarak antara data uji dan data latih. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.15, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.16.
Tabel 4.15 Jarak Antara Data Pada Dataset Voice Genre
Data Uji Data Latih
L1 L2 L3 L4 L5 … L2534
U1 12.925 10.893 8.776 25.785 42.612 … 10.569
U2 2.439 3.372 7.829 16.685 54.400 … 4.499
U3 5.213 2.665 4.829 19.788 50.780 … 3.109
U4 13.864 8.639 5.880 28.207 55.365 … 7.569
U5 13.687 8.697 4.227 28.443 50.324 … 7.598
U6 6.346 6.202 10.128 17.374 58.921 … 6.867
U7 6.145 2.883 6.292 19.828 56.061 … 3.196
U8 14.428 19.662 23.890 1.026 59.341 … 20.788
… … … …
U634 13.782 8.608 6.188 28.004 55.982 … 7.576
37
Tabel 4.16 Urutan Jarak Terdekat Pada Dataset Voice Genre Data
Pada K-NN konvensional penentuan kelas berdasarkan pada sistem vote majority sebanyak K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji. Sedangkan tahapan selanjutnya pada gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga terdekat sebanyak K dari setiap kelas data, kelas dengan nilai rata-rata bobot tertinggi akan dijadikan sebagai kelas bagi data uji, adapun hasil yang didapati dari K-NN konvensional dan Gabungan LMKNN dan DWKNN dapat dilihat pada tabel 4.17.
Tabel 4.17 Perbandingan Akurasi Pada Dataset Voice Genre
No K antara LMKNN dan DWKNN dapat dilihat pada gambar 4.9.
Gambar 4.9 Grafik Perbandingan Akurasi Pada Dataset Voice Genre
Merujuk dari tabel 4.17 dan gambar 4.9 terlihat bahwa nilai akurasi dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1, dimana nilai akurasi dari gabungan LMKNN dan DWKNN sama dengan K-NN konvensional. Nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 69.72% yaitu pada saat K bernilai 1, sedangkan pada K-NN konvensional nilai akurasi terendah yang dihasilkan juga sebesar 68.61% saat K bernilai 9. Nilai Tertinggi yang dihasilkan oleh gabungan LMKNN dan DWKNN adalah sebesar 72.71% saat K bernilai 7, sedangkan pada K-NN konvensional hanya mampu menghasilkan nilai akurasi tertinggi sebesar 70.98%
saat K bernilai 4.
4.1.4 Pengujian Terhadap Dataset Lower Back Pain Symptomps
Pengujian selanjutnya dengan menggunakan dataset lower back pain symptops, dimana data ini dikumpulkan dengan tujuan untuk mengidentifikasi seseorang yang mengidap penyakit punggung berdasarkan detail/data fisik tulang belakang. Data set ini terdiri dari 310 sampel dengan 12 atribut. Adapun sebaran dari data lower back pain symptomps pada pengujian ini dapat dilihat pada tabel 4.18.
69.72%
39
Tabel 4.18 Distribusi Dataset Lower Back Pain Symptomps
No Kategori Kelas Jumlah
Adapun rincian dari data lower back pain symptomps yang digunakan sebagai data latih dapat dilihat pada tabel 4.19 dan data uji dapat dilihat pada tabel 4.20.
Tabel 4.19 Rincian Data Latih Lower Back Pain Symptomps
No Id X1 X2 X3 X4 … X12 Kelas
Tabel 4.20 Rincian Data Uji Lower Back Pain Symptomps
No Id X1 X2 X3 X4 … X12 Kelas
Dengan menggunakan model jarak Euclaudien (persamaan 2.10) dilakukan perhitungan jarak antara data uji dan data latih. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.21, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.22.
Tabel 4.21 Jarak Antara Data Pada Dataset Lower Back Pain Symptomps
Data Uji Data Latih
Tabel 4.22 Urutan Jarak Terdekat Pada Dataset Lower Back Pain Symptomps Data
Tahapan selanjutnya pada K-NN konvensional adalah penentuan kelas dengan sistem vote majority berdasarkan K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji, sedangkan tahapan selanjutnya dari gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga
41
terdekat sebanyak parameter K dari setiap kelas data, selanjutnya penentuan kelas bagi data uji berdasarkan rata-rata nilai bobot tertinggi, adapun hasil akurasi dari K-NN konvensional dan Gabungan LMKNN dan DWKNN dapat dilihat pada tabel 4.23.
Tabel 4.23 Perbandingan Akurasi Pada Dataset Lower Back Pain Symptomps
No K
Rata-rata 77.42% 81.13% LMKNN+DWKNN
Adapun grafik dari nilai akurasi yang diperoleh pada dataset lower back pain symptomps dapat dilihat pada gambar 4.10.
Gambar 4.10 Grafik Akurasi Pada Dataset Lower Back Pain Symptomps
70.97%
Berdasarkan tabel 4.23 dan gambar 4.10 terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1, dimana nilai akurasi yang didapati dari kedua metode ini sebesar 70.97% yang mana nilai ini merupakan nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN maupun K-NN konvensional. Sedangkan nilai akurasi tertinggi yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 83.87% pada saat K bernilai 3, 6 dan 7, sedangkan pada K-NN konvensional nilai akurasi tertinggi yang mampu dihasilkan hanya sebesar 82.26% saat K bernilai 5.
4.1.5 Pengujian Terhadap Dataset New Thyroid
Pengujian terakhir dengan menggunakan dataset new thyroid, dimana data ini dikumpulkan dengan tujuan untuk mengidentifikasi seseorang yang mengidap penyakit tiroid. Data set ini terdiri dari 215 sampel dengan 5 atribut dan memiliki 3 kelas, yaitu normal (C1), hipertiroidisme (C2), dan hipotiroidisme (C3). Adapun sebaran dari data new thyroid dalam pengujian ini dapat dilihat pada tabel 4.24.
Tabel 4.24 Distribusi Dataset New Thyroid
No Kategori Kelas Jumlah
Data
C1 C2 C3
1 Data Latih 123 24 25 172
2 Data Uji 27 11 5 43
Total 150 35 30 215
Adapun rincian dari data New Thyroid yang digunakan sebagai data latih dapat dilihat pada tabel 4.25, dan data uji dapat dilihat pada tabel 4.26.
Tabel 4.25 Rincian Data Latih New Thyroid
No Id X1 X2 X3 X4 X5 Kelas
1 L1 130.00 9.50 1.70 0.40 3.20 C1
2 L2 112.00 5.90 1.70 2.00 1.30 C1
3 L3 103.00 8.10 1.40 0.50 3.80 C1
4 L4 129.00 1.50 0.60 12.50 2.90 C3
5 L5 97.00 15.10 1.80 1.20 -0.20 C2
6 L6 91.00 8.00 1.70 2.10 4.60 C1
43
Tabel 4.25 Rincian Data Latih New Thyroid (Lanjutan)
No Id X1 X2 X3 X4 X5 Kelas
Tabel 4.26 Rincian Data Uji New Thyroid
No Id X1 X2 X3 X4 X5 Kelas
Dengan menggunakan model jarak Euclaudien (persamaan 2.10) selanjutnya dilakukan perhitungan jarak antara data uji dan data latih. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.27, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.28.
Tabel 4.27 Jarak Antara Data Pada Dataset New Thyroid
Data Uji Data Latih
Tabel 4.27 Jarak Antara Data Pada Dataset New Thyroid (Lanjutan)
Tabel 4.28 Urutan Jarak Terdekat Pada Dataset New Thyroid Data
Tahapan selanjutnya untuk metode K-NN konvensional adalah penentuan kelas dengan menggunakan system vote majority dari K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji, sedangkan tahapan dari gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga terdekat sebanyak parameter K dari setiap kelas data, kemudia dilakukan penentuan kelas bagi data uji berdasarkan rata-rata nilai bobot tertinggi, adapun hasil akurasi pada dataset new thyroid dapat dilihat pada tabel 4.29.
Tabel 4.29 Perbandingan Akurasi Pada Dataset New Thyroid
No K
45
Tabel 4.29 Perbandingan Akurasi Pada Dataset New Thyroid (Lanjutan)
No K
Rata-rata 89.07% 91.86% LMKNN+DWKNN
Adapun grafik hasil akurasi pada dataset new thyroid dapat dilihat pada gambar 4.11.
Gambar 4.11 Grafik Perbandingan Akurasi Pada Dataset New Thyroid
Berdasarkan hasil dari perbandingan akurasi antara K-NN konvesional dan gabungan antara LMKNN dan DWKNN (tabel 4.29 dan gambar 4.11) terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1, dimana nilai akurasi yang didapati dari kedua metode ini sebesar 88.37% yang mana nilai ini merupakan nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN, sedangkan nilai terendah yang dihasilkan oleh K-NN konvensional adalah sebesar 86.05% yaitu saat K bernilai 9. Sedangkan nilai akurasi tertinggi yang dihasilkan dari
88.37%
gabungan LMKNN dan DWKNN adalah sebesar 93.02% pada saat K bernilai 2 sampai dengan K bernilai 7, sedangkan pada K-NN konvensional hanya mampu mencapai nilai tertinggi sebesar 93.02% saat K bernilai 4.
4.1.6 Pengujian Terhadap Data Penjurusan Siswa
Dari semua pengujian yang dilakukan menggunakan dataset, terlihat bahwa gabungan dari LMKNN dan DWKNN mampun meningkatkan nilai akurasi, oleh sebab itu untuk mengetahui secara pasti apakah gabungan LMKNN dan DWKNN ini juga mampu meningkatkan akurasi dari K-NN konvesional pada data penjurusan siswa SMAN 2 Tualang, maka akan dilakukan pengujian kembali, dimana sebaran dari data pengujian ini dapat dilihat pada tabel 4.30.
Tabel 4.30 Distribusi Data Penjurusan Siswa
No Kategori Kelas Jumlah
Data
IPA IPS
1 Data Latih 64 70 134
2 Data Uji 15 18 33
Total 79 88 167
Adapun rincian dari data real dari penjurusan siswa yang digunakan sebagai data latih dapat dilihat pada tabel 4.31, dan data uji dapat dilihat pada tabel 4.32.
Tabel 4.31 Rincian Data Latih Penjurusan Siswa
No Id X1 X2 X3 X4 X5 X6 X7 X8 X9 Kelas
1 L1 89 96 96 93 88 84 96 127 1 IPA
2 L2 88 95 95 90 90 85 92 115 1 IPA
3 L3 83 93 94 87 89 82 90 109 1 IPA
4 L4 89 90 92 83 89 85 86 118 1 IPA
5 L5 83 90 86 89 76 82 91 118 1 IPA
6 L6 80 88 90 85 78 82 91 118 1 IPA
7 L7 82 84 84 89 91 84 90 100 1 IPA
8 L8 82 87 80 90 79 85 87 106 1 IPA
9 L9 79 88 90 81 84 81 86 118 1 IPA
10 L10 84 78 85 89 83 84 90 112 1 IPA
… … … …
134 L134 70 76 70 76 75 78 78 93 2 IPS
47
Tabel 4.32 Rincian Data Uji Penjurusan Siswa
No Id X1 X2 X3 X4 X5 X6 X7 X8 X9 Kelas
1 U1 80 88 90 85 78 82 91 118 1 IPA
2 U2 79 88 90 81 84 81 86 118 1 IPA
3 U3 84 85 87 80 83 83 85 82 1 IPS
4 U4 82 84 84 82 82 82 90 106 1 IPA
5 U5 75 84 80 81 75 81 86 93 1 IPS
6 U6 82 90 90 80 84 84 85 112 1 IPA
7 U7 82 82 77 77 74 78 81 94 1 IPA
8 U8 70 70 70 72 70 71 80 97 2 IPS
9 U9 70 70 74 72 70 75 73 96 1 IPS
10 U10 70 70 70 74 72 81 79 100 1 IPA
… … … …
33 U33 70 76 71 75 74 77 82 93 1 IPS
Selanjutnya dilakukan perhitungan kemiripan antara data uji dan data latih berdasarkan model jarak Euclaudien (persamaan 2.10). Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.33, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.34.
Tabel 4.33 Jarak Antara Data Pada Data Penjurusan Siswa
Data Uji Data Latih
L1 L2 L3 L4 L5 … L134
U1 21.33 18.06 16.03 15.75 7.00 … 39.31
U2 23.45 18.25 14.70 12.37 13.78 … 37.82
U3 50.68 38.35 30.89 37.70 38.60 … 29.02
U4 31.22 22.36 16.28 19.18 16.46 … 28.62
U5 46.63 36.84 29.09 34.89 29.19 … 16.97
U6 25.53 16.76 11.75 11.18 15.43 … 35.83
U7 49.07 39.56 32.53 35.34 31.40 … 15.56
U8 61.68 54.43 47.18 49.00 42.83 … 12.08
U9 62.10 54.18 46.81 48.17 43.53 … 11.70
U10 57.94 50.64 43.99 44.77 39.18 … 10.44
… … … …
U33 57.51 48.89 41.24 44.63 39.00 … 4.58
Tabel 4.34 Urutan Jarak Terdekat Pada Data Penjurusan Siswa
Tahapan selanjutnya untuk metode K-NN konvensional adalah penentuan kelas dengan menggunakan system vote majority dari K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji, sedangkan tahapan selanjutnya dari gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga terdekat sebanyak parameter K dari setiap kelas data, kemudia barulah dilakukan penentuan kelas bagi data uji berdasarkan rata-rata nilai bobot tertinggi, adapun hasil akurasi pada data penjurusan siswa dapat dilihat pada tabel berikut.
Tabel 4.35 Perbandingan Akurasi Pada Data Penjurusan Siswa
No K
Rata-rata 82.42% 87.58% LMKNN+DWKNN
49
Adapun grafik perbandingan akurasi K-NN konvesional dan gabungan LMKNN dan DWKNN pada data penjurusan siswa, dapat dilihat pada gambar 4.12.
Gambar 4.12 Grafik Perbandingan Akurasi Pada Data Penjurusan Siswa
Berdasarkan hasil perbandingan akurasi antara K-NN konvesional terhadap gabungan LMKNN dan DWKNN (tabel 4.35 dan gambar 4.12) dapat disimpulkan bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1 dan K bernilai 3, dimana nilai akurasi yang didapati dari gabungan LMKNN dan DWKK hanya sebesar 84.85%, dimana nilai ini merupakan akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN, sedangkan nilai terendah yang dihasilkan oleh K-NN konvensional adalah sebesar 78.79% yaitu saat K bernilai 5. Sedangkan nilai akurasi tertinggi yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 90.91% pada saat K bernilai 10, sedangkan pada K-NN konvensional hanya mampu mencapai nilai tertinggi sebesar 84.85% yaitu pada saat K bernilai 1, 2 dan 10.
4.3 Pembahasan
Untuk melihat dengan jelas rata-rata dari nilai akurasi yang didapati K-NN konvensional dan gabungan dari LMKNN dan DWKNN pada seluruh data yang digunakan dalam pengujian dapat dilihat pada gambar 4.13.
84.85%
Gambar 4.13 Grafik Rata-rata Nilai Akurasi Dari Seluruh Data
Dari gambar 4.13 terlihat bahwa gabungan LMKNN dan DWKNN mampu memberikan nilai akurasi yang lebih baik dari pada K-NN konvensional. Dimana penigkatan nilai akurasi tertinggi didapati pada dataset Lower Back Pain Symptomps yaitu sebesar 3.71%, sedangkan peningkatan nilai akurasi terendah didapati pada dataset iris yaitu sebesar 1.66%. Adapun peningkatan rata-rata nilai akurasi dari seluruh dataset yang digunakan adalah sebesar 2.452%.
Sedangkan pada data penjurusan siswa di SMAN 2 Tualang, gabungan LMKNN dan DWKNN mampu meningkatkan nilai akurasi tertinggi sebesar 9.09% pada saat K bernilai 5. Adapun peningkatan rata-rata nilai akurasi yang dihasilkan pada data penjurusan siswa adalah sebesar 5.15%. Sedangkan rata-rata peningkatan yang dihasilkan dari seluruh data yang digunakan pada penelitian ini adalah sebesar 2.903%.
Berdasarkan pengujian yang telah dilakukan pada seluruh data, terlihat bahwa gabungan dari LMKNN dan DWKNN mampu memberikan nilai akurasi yang lebih baik dari pada nilai akurasi yang dihasilkan oleh K-NN konvensional.
0.00%
Ionosphere Iris Voice Genre Lower Back Pain