HASIL DAN PEMBAHASAN - PENINGKATAN AKURASI PADA METODE KLASIFIKASI K-NEAREST NEIGHBOR MENGGUNAK

4.1 Hasil

Tahapan-tahapan pada sub bab 3.3 diimplementasi dengan menggunakan bahasa pemograman MATLAB^®, dimana semua proses pengimplementasian dilakukan hanya melalui console pada program MATLAB^® tersebut.

Pengimplementasian ini bertujuan untuk menpermudah proses perhitungan dalam pengujian terhadap seluruh data yang digunakan dalam penelitian ini. Adapun hasil output dari pengujian terhadap dataset ionosphare dapat dilihat pada gambar 4.1.

Gambar 4.1 Output Akurasi Pengujian Pada Dataset Ionosphare

Adapun hasil output dari pengujian terhadap dataset iris dapat dilihat pada gambar 4.2.

Gambar 4.2 Output Akurasi Pengujian Pada Dataset Iris

Adapun hasil output dari pengujian terhadap dataset voice genre dapat dilihat pada gambar 4.3.

Gambar 4.3 Output Akurasi Pengujian Pada Dataset Voice Genre

Adapun hasil output dari pengujian terhadap dataset lower back pain symptomps dapat dilihat pada gambar 4.4.

Gambar 4.4 Output Akurasi Pengujian Pada Dataset Lower Back Pain Symptomps

Adapun hasil output dari pengujian terhadap dataset new thyroid dapat dilihat pada gambar 4.5.

Gambar 4.5 Output Akurasi Pengujian Pada Dataset New Thyroid

Adapun hasil output dari pengujian terhadap data penjurusan siswa dapat dilihat pada gambar 4.6.

Gambar 4.6 Output Akurasi Pengujian Pada Data Penjurusan Siswa

4.2 Pengujian

Pengujian dilakukan dengan menggunakan beberapa data yang didapat dari UCI Repository, Kaggle Repository, Keel Repository dan data yang merupakan hasil studi lapangan secara langsung yang dialaukan oleh penulis.

Pada saat pengujian, sebanyak 80% dari data akan dijadikan sebagai data latih dan sebanyak 20% dari data akan dijadikan data uji yang dilakukan secara random.

Adapun rincian data yang digunakan dapat dilihat pada tabel 4.1.

Tabel 4.1 Rincian Dataset Yang Digunakan

Data Atribut Tipe Kelas Jumlah Data

Ionosphere 34 Integer/Real 2 351

Iris 4 Integer/Real 3 150

Voice Genre 21 Integer/Real 2 3168

Lower Back Pain Symptomps 13 Integer/Real 2 310

Thyroid 5 Integer/Real 3 215

Penjurusan Siswa 9 Integer/Real 2 167

Pengujian ini bertujuan untuk melihat kinerja metode Local Mean dan Distance Weight pada K-NN. Pengukuran kinerja dilihat berdasarkan dari hasil akurasi yang didapati dari K-NN yang menggunakan Local Mean dan Distance Weight terhadap K-NN konvensional.

4.1.1 Pengujian Terhadap Dataset Ionosphare

Pengujian pertama dilakukan menggunakan dataset ionosphere, dimana dataset ini berjumlah 351 record dengan 34 atribut dan terdiri dari 2 kelas data. Pada pengujian menggunakan dataset ionosphere ini, data latih berjumlah 281 data, dan data uji berjumlah 70 data. Adapun rincian dari distribusi data ionoshpere dapat dilhat pada tabel 4.2, dan untuk melihat data latih dan data uji yang digunakan dapat dilihat pada tabel 4.3.

Tabel 4.2 Distribusi Data Ionosphare

No Kategori Kelas Jumlah

Tabel 4.3 Rincian Data Ionosphare Yang digunakan Data Latih

Selanjutnya dilakukan perhitungan jarak antara data latih dan data uji menggunakan model jarak Euclaudien (persamaan 2.10). Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.4. Selanjutnya dilakukan pengurutan jarak antar data secara ascending, adapun urutan jarak terdekat antar data dapat dilihat pada tabel 4.5.

Tabel 4.4 Jarak Antara Data Pada Dataset Ionosphare

Data Uji Data Latih

Tabel 4.5 Urutan Jarak Terdekat Pada Dataset Ionosphare Data

Untuk K-NN konvensional akan ditentukan kelas mayoritasnya berdasarkan K tetangga terdekat dan akan menjadian kelas mayoritas sebagai kelas bagi data uji, sedangkan tahap selanjutnya untuk gabungan LMKNN dan DWKNN akan menghitung nilai rata-rata bobot dari jarak sebanyak K tetangga terdekat untuk setiap

kelas data, dan akan menjadikan rata-rata bobot tertinggi sebagai kelas bagi data uji, adapun hasil yang didapati dari K-NN konvensional dan Gabungan Metode yang diusulkan dapat dilihat pada tabel 4.6.

Tabel 4.6 Perbandingan Akurasi Pada Dataset Ionosphare

No K

Rata-rata 84.57% 86.86% LMKNN+DWKNN

Adapun grafik yang dihasilkan dari perbadingan akurasi K-NN konvesional dengan metode yang diusulkan dapat dilhat pada gambar 4.7.

Gambar 4.7 Grafik Perbandingan Akurasi Pada Dataset Ionosphare

85.71% 85.71%

Merujuk dari tabel 4.6 dan gambar 4.7 terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN tidak pernah sekalipun berada dibawah dari nilai akurasi yang dihasilkan oleh K-NN konvensional. Nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 85.71% yaitu pada saat K bernilai 1 dan 3, sedangkan pada K-NN konvensional nilai akurasi terendah dihasilkan sebesar 82.86% saat K bernilai 6 dan 8. Nilai Tertinggi yang dihasilkan oleh gabungan LMKNN dan DWKNN adalah sebesar 88.57% saat K bernilai 4, sedangkan K-NN hanya mampu menghasilkan nilai akurasi tertinggi sebesar 85.7% saat K bernilai 1 sampai dengan 4.

4.1.2 Pengujian Terhadap Dataset Iris

Pengujian selanjutnya menggunakan dataset iris, dimana dataset merupakan salah satu dataset yang populer, hal ini salah satunya disebabkan karena dataset iris memiliki sebaran data yang baik. Data set ini ini berjumlah 150 record dengan 4 atribut dan terdiri dari 3 kelas data. Pada pengujian ini, data latih berjumlah 120 data, dan data uji berjumlah 30 data. Adapun rincian dari distribusi dataset iris ini dapat dilhat pada tabel 4.7, dan untuk rincian dari data yang digunakan sebagai data latih dan data uji dapat dilihat pada tabel 4.8.

Tabel 4.7 Distribusi Data Iris

No Kategori Kelas Jumlah

Data Setosa Versicolor Virginica

1 Data Latih 37 41 42 120

2 Data Uji 13 9 8 30

Total 50 50 50 150

Tabel 4.8 Rincian Data Iris Yang digunakan Data Latih

No Id X1 X2 X3 X4 Kelas

1 L1 6.80 2.80 4.80 1.40 Versicolor 2 L2 6.10 2.80 4.00 1.30 Versicolor 3 L3 6.50 3.00 5.50 1.80 Virginica 4 L4 5.20 2.70 3.90 1.40 Versicolor 5 L5 6.30 2.80 5.10 1.50 Virginica 6 L6 5.10 3.30 1.70 0.50 Setosa

… … … …

120 L120 5.10 3.50 1.40 0.30 Setosa

Tabel 4.8 Rincian Data Iris Yang digunakan (Lanjutan) Data Uji

No Id X1 X2 X3 X4 Kelas

1 U1 5.20 3.40 1.40 0.20 Setosa 2 U2 7.20 3.60 6.10 2.50 Virginica 3 U3 6.20 2.90 4.30 1.30 Versicolor

… … … …

30 U30 5.40 3.90 1.30 0.40 Setosa

Selanjutnya dilakukan perhitungan jarak antara data latih dan data uji menggunakan model jarak Euclaudien dengan menggunakan persamaan 2.10. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.9. Selanjutnya dilakukan pengurutan jarak antar data secara ascending, adapun urutan jarak terdekat antar data dapat dilihat pada tabel 4.10.

Tabel 4.9 Jarak Antara Data Pada Dataset Iris

Data Uji Data Latih

L1 L2 L3 L4 L5 … L281

U1 3.990 3.023 4.607 2.860 4.117 … 0.173

U2 1.924 2.775 1.304 3.295 1.857 … 5.599

U3 0.794 0.332 1.338 1.100 0.837 … 3.314

… … … …

U30 4.052 3.130 4.650 3.040 4.204 … 0.520

Tabel 4.10 Urutan Jarak Terdekat Pada Dataset Iris Data

Uji

Urutan Jarak Terdekat

1^st 2^nd 3^rd 4^th 5^th … 120^th

U1 L75 L120 L69 L81 L37 … L97

U2 L57 L47 L45 L82 L98 … L10

U3 L2 L83 L39 L118 L58 … L10

… … … …

U30 L46 L117 L71 L34 L51 … L97

adapun hasil yang didapati dari K-NN konvensional dan Gabungan Metode yang diusulkan dapat dilihat pada tabel 4.11.

Tabel 4.11 Perbandingan Akurasi Pada Dataset Iris

No K

Rata-rata 96.67% 98.33% LMKNN+DWKNN

Adapun grafik yang dihasilkan dari perbadingan akurasi K-NN konvesional dengan metode yang diusulkan dapat dilhat pada gambar 4.8.

Gambar 4.8 Grafik Perbandingan Akurasi Pada Dataset Iris

96.67% 96.67% 96.67%

Merujuk dari tabel 4.16 dan gambar 4.8 terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN tidak pernah sekalipun berada dibawah dari nilai akurasi yang dihasilkan oleh K-NN konvensional. Nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 96.67% yaitu pada saat K bernilai 1 sampai dengan K bernilai 5, sedangkan pada K-NN konvensional nilai akurasi terendah yang dihasilkan juga sebesar 93.33% saat K bernilai 9. Nilai Tertinggi yang dihasilkan oleh gabungan LMKNN dan DWKNN adalah sebesar 100% saat K bernilai 6 sampai dengan K bernilai 10, sedangkan K-NN hanya mampu menghasilkan nilai akurasi tertinggi sebesar 100% hanya saat K bernilai 8.

4.1.3 Pengujian Terhadap Dataset Voice Genre

Data voice genre digunakan untuk mengidentifikasi jenis kelamin berdasarkan suara melalui sifat akustik dari suara dan ucapan. Data set ini terdiri dari 3168 sampel dengan 20 atribut yang merupakan ektrasi fitur menggunakan R. Adapun sebaran dari data voice genre pada pengujian ini dapat dilihat pada tabel 4.12.

Tabel 4.12 Distribusi Data Voice Genre

No Kategori Kelas Jumlah

Data

Male Female

1 Data Latih 1278 1256 2534

2 Data Uji 306 328 634

Total 1584 1584 3168

Adapun rincian dari data voice genre yang digunakan sebagai data latih dapat dilihat pada tabel 4.13, dan data uji dapat dilihat pada tabel 4.14.

Tabel 4.13 Rincian Data Latih Voice Genre

No Id X1 X2 X3 X4 … X20 Kelas

1 L1 0.235 0.042 0.242 0.212 … 0.103 Female 2 L2 0.190 0.069 0.213 0.162 … 0.071 Female

3 L3 0.165 0.046 0.181 0.127 … 0.205 Male

4 L4 0.190 0.053 0.175 0.148 … 0.095 Female 5 L5 0.173 0.072 0.176 0.141 … 0.201 Female 6 L6 0.222 0.031 0.226 0.200 … 0.131 Female 7 L7 0.209 0.033 0.209 0.197 … 0.106 Female 8 L8 0.127 0.088 0.155 0.028 … 0.135 Female

Tabel 4.13 Rincian Data Latih Voice Genre (Lanjutan)

No Id X1 X2 X3 X4 … X20 Kelas

9 L9 0.201 0.052 0.218 0.158 … 0.163 Male

10 L10 0.171 0.068 0.145 0.131 … 0.273 Male

… … … …

2534 L2534 0.215 0.034 0.217 0.198 … 0.067 Female

Tabel 4.14 Rincian Data Uji Voice Genre

No Id X1 X2 X3 X4 … X20 Kelas

1 U1 0.152 0.059 0.129 0.107 … 0.160 Male

2 U2 0.243 0.031 0.246 0.229 … 0.112 Female 3 U3 0.181 0.053 0.186 0.161 … 0.286 Female

4 U4 0.151 0.076 0.156 0.102 … 0.349 Male

5 U5 0.162 0.062 0.185 0.104 … 0.420 Male

6 U6 0.217 0.040 0.215 0.185 … 0.123 Female 7 U7 0.200 0.067 0.214 0.182 … 0.192 Female 8 U8 0.214 0.035 0.223 0.194 … 0.043 Female

… … … …

634 U634 0.155 0.091 0.190 0.052 … 0.253 Female Dengan menggunakan model jarak Euclaudien (persamaan 2.10) dilakukan perhitungan jarak antara data uji dan data latih. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.15, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.16.

Tabel 4.15 Jarak Antara Data Pada Dataset Voice Genre

Data Uji Data Latih

L1 L2 L3 L4 L5 … L2534

U1 12.925 10.893 8.776 25.785 42.612 … 10.569

U2 2.439 3.372 7.829 16.685 54.400 … 4.499

U3 5.213 2.665 4.829 19.788 50.780 … 3.109

U4 13.864 8.639 5.880 28.207 55.365 … 7.569

U5 13.687 8.697 4.227 28.443 50.324 … 7.598

U6 6.346 6.202 10.128 17.374 58.921 … 6.867

U7 6.145 2.883 6.292 19.828 56.061 … 3.196

U8 14.428 19.662 23.890 1.026 59.341 … 20.788

… … … …

U634 13.782 8.608 6.188 28.004 55.982 … 7.576

Tabel 4.16 Urutan Jarak Terdekat Pada Dataset Voice Genre Data

Pada K-NN konvensional penentuan kelas berdasarkan pada sistem vote majority sebanyak K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji. Sedangkan tahapan selanjutnya pada gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga terdekat sebanyak K dari setiap kelas data, kelas dengan nilai rata-rata bobot tertinggi akan dijadikan sebagai kelas bagi data uji, adapun hasil yang didapati dari K-NN konvensional dan Gabungan LMKNN dan DWKNN dapat dilihat pada tabel 4.17.

Tabel 4.17 Perbandingan Akurasi Pada Dataset Voice Genre

No K antara LMKNN dan DWKNN dapat dilihat pada gambar 4.9.

Gambar 4.9 Grafik Perbandingan Akurasi Pada Dataset Voice Genre

Merujuk dari tabel 4.17 dan gambar 4.9 terlihat bahwa nilai akurasi dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1, dimana nilai akurasi dari gabungan LMKNN dan DWKNN sama dengan K-NN konvensional. Nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 69.72% yaitu pada saat K bernilai 1, sedangkan pada K-NN konvensional nilai akurasi terendah yang dihasilkan juga sebesar 68.61% saat K bernilai 9. Nilai Tertinggi yang dihasilkan oleh gabungan LMKNN dan DWKNN adalah sebesar 72.71% saat K bernilai 7, sedangkan pada K-NN konvensional hanya mampu menghasilkan nilai akurasi tertinggi sebesar 70.98%

saat K bernilai 4.

4.1.4 Pengujian Terhadap Dataset Lower Back Pain Symptomps

Pengujian selanjutnya dengan menggunakan dataset lower back pain symptops, dimana data ini dikumpulkan dengan tujuan untuk mengidentifikasi seseorang yang mengidap penyakit punggung berdasarkan detail/data fisik tulang belakang. Data set ini terdiri dari 310 sampel dengan 12 atribut. Adapun sebaran dari data lower back pain symptomps pada pengujian ini dapat dilihat pada tabel 4.18.

69.72%

Tabel 4.18 Distribusi Dataset Lower Back Pain Symptomps

No Kategori Kelas Jumlah

Adapun rincian dari data lower back pain symptomps yang digunakan sebagai data latih dapat dilihat pada tabel 4.19 dan data uji dapat dilihat pada tabel 4.20.

Tabel 4.19 Rincian Data Latih Lower Back Pain Symptomps

No Id X1 X2 X3 X4 … X12 Kelas

Tabel 4.20 Rincian Data Uji Lower Back Pain Symptomps

No Id X1 X2 X3 X4 … X12 Kelas

Dengan menggunakan model jarak Euclaudien (persamaan 2.10) dilakukan perhitungan jarak antara data uji dan data latih. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.21, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.22.

Tabel 4.21 Jarak Antara Data Pada Dataset Lower Back Pain Symptomps

Data Uji Data Latih

Tabel 4.22 Urutan Jarak Terdekat Pada Dataset Lower Back Pain Symptomps Data

Tahapan selanjutnya pada K-NN konvensional adalah penentuan kelas dengan sistem vote majority berdasarkan K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji, sedangkan tahapan selanjutnya dari gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga

terdekat sebanyak parameter K dari setiap kelas data, selanjutnya penentuan kelas bagi data uji berdasarkan rata-rata nilai bobot tertinggi, adapun hasil akurasi dari K-NN konvensional dan Gabungan LMKNN dan DWKNN dapat dilihat pada tabel 4.23.

Tabel 4.23 Perbandingan Akurasi Pada Dataset Lower Back Pain Symptomps

No K

Rata-rata 77.42% 81.13% LMKNN+DWKNN

Adapun grafik dari nilai akurasi yang diperoleh pada dataset lower back pain symptomps dapat dilihat pada gambar 4.10.

Gambar 4.10 Grafik Akurasi Pada Dataset Lower Back Pain Symptomps

70.97%

Berdasarkan tabel 4.23 dan gambar 4.10 terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1, dimana nilai akurasi yang didapati dari kedua metode ini sebesar 70.97% yang mana nilai ini merupakan nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN maupun K-NN konvensional. Sedangkan nilai akurasi tertinggi yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 83.87% pada saat K bernilai 3, 6 dan 7, sedangkan pada K-NN konvensional nilai akurasi tertinggi yang mampu dihasilkan hanya sebesar 82.26% saat K bernilai 5.

4.1.5 Pengujian Terhadap Dataset New Thyroid

Pengujian terakhir dengan menggunakan dataset new thyroid, dimana data ini dikumpulkan dengan tujuan untuk mengidentifikasi seseorang yang mengidap penyakit tiroid. Data set ini terdiri dari 215 sampel dengan 5 atribut dan memiliki 3 kelas, yaitu normal (C1), hipertiroidisme (C2), dan hipotiroidisme (C3). Adapun sebaran dari data new thyroid dalam pengujian ini dapat dilihat pada tabel 4.24.

Tabel 4.24 Distribusi Dataset New Thyroid

No Kategori Kelas Jumlah

Data

C1 C2 C3

1 Data Latih 123 24 25 172

2 Data Uji 27 11 5 43

Total 150 35 30 215

Adapun rincian dari data New Thyroid yang digunakan sebagai data latih dapat dilihat pada tabel 4.25, dan data uji dapat dilihat pada tabel 4.26.

Tabel 4.25 Rincian Data Latih New Thyroid

No Id X1 X2 X3 X4 X5 Kelas

1 L1 130.00 9.50 1.70 0.40 3.20 C1

2 L2 112.00 5.90 1.70 2.00 1.30 C1

3 L3 103.00 8.10 1.40 0.50 3.80 C1

4 L4 129.00 1.50 0.60 12.50 2.90 C3

5 L5 97.00 15.10 1.80 1.20 -0.20 C2

6 L6 91.00 8.00 1.70 2.10 4.60 C1

Tabel 4.25 Rincian Data Latih New Thyroid (Lanjutan)

No Id X1 X2 X3 X4 X5 Kelas

Tabel 4.26 Rincian Data Uji New Thyroid

No Id X1 X2 X3 X4 X5 Kelas

Dengan menggunakan model jarak Euclaudien (persamaan 2.10) selanjutnya dilakukan perhitungan jarak antara data uji dan data latih. Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.27, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.28.

Tabel 4.27 Jarak Antara Data Pada Dataset New Thyroid

Data Uji Data Latih

Tabel 4.27 Jarak Antara Data Pada Dataset New Thyroid (Lanjutan)

Tabel 4.28 Urutan Jarak Terdekat Pada Dataset New Thyroid Data

Tahapan selanjutnya untuk metode K-NN konvensional adalah penentuan kelas dengan menggunakan system vote majority dari K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji, sedangkan tahapan dari gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga terdekat sebanyak parameter K dari setiap kelas data, kemudia dilakukan penentuan kelas bagi data uji berdasarkan rata-rata nilai bobot tertinggi, adapun hasil akurasi pada dataset new thyroid dapat dilihat pada tabel 4.29.

Tabel 4.29 Perbandingan Akurasi Pada Dataset New Thyroid

No K

Tabel 4.29 Perbandingan Akurasi Pada Dataset New Thyroid (Lanjutan)

No K

Rata-rata 89.07% 91.86% LMKNN+DWKNN

Adapun grafik hasil akurasi pada dataset new thyroid dapat dilihat pada gambar 4.11.

Gambar 4.11 Grafik Perbandingan Akurasi Pada Dataset New Thyroid

Berdasarkan hasil dari perbandingan akurasi antara K-NN konvesional dan gabungan antara LMKNN dan DWKNN (tabel 4.29 dan gambar 4.11) terlihat bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1, dimana nilai akurasi yang didapati dari kedua metode ini sebesar 88.37% yang mana nilai ini merupakan nilai akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN, sedangkan nilai terendah yang dihasilkan oleh K-NN konvensional adalah sebesar 86.05% yaitu saat K bernilai 9. Sedangkan nilai akurasi tertinggi yang dihasilkan dari

88.37%

gabungan LMKNN dan DWKNN adalah sebesar 93.02% pada saat K bernilai 2 sampai dengan K bernilai 7, sedangkan pada K-NN konvensional hanya mampu mencapai nilai tertinggi sebesar 93.02% saat K bernilai 4.

4.1.6 Pengujian Terhadap Data Penjurusan Siswa

Dari semua pengujian yang dilakukan menggunakan dataset, terlihat bahwa gabungan dari LMKNN dan DWKNN mampun meningkatkan nilai akurasi, oleh sebab itu untuk mengetahui secara pasti apakah gabungan LMKNN dan DWKNN ini juga mampu meningkatkan akurasi dari K-NN konvesional pada data penjurusan siswa SMAN 2 Tualang, maka akan dilakukan pengujian kembali, dimana sebaran dari data pengujian ini dapat dilihat pada tabel 4.30.

Tabel 4.30 Distribusi Data Penjurusan Siswa

No Kategori Kelas Jumlah

Data

IPA IPS

1 Data Latih 64 70 134

2 Data Uji 15 18 33

Total 79 88 167

Adapun rincian dari data real dari penjurusan siswa yang digunakan sebagai data latih dapat dilihat pada tabel 4.31, dan data uji dapat dilihat pada tabel 4.32.

Tabel 4.31 Rincian Data Latih Penjurusan Siswa

No Id X1 X2 X3 X4 X5 X6 X7 X8 X9 Kelas

1 L1 89 96 96 93 88 84 96 127 1 IPA

2 L2 88 95 95 90 90 85 92 115 1 IPA

3 L3 83 93 94 87 89 82 90 109 1 IPA

4 L4 89 90 92 83 89 85 86 118 1 IPA

5 L5 83 90 86 89 76 82 91 118 1 IPA

6 L6 80 88 90 85 78 82 91 118 1 IPA

7 L7 82 84 84 89 91 84 90 100 1 IPA

8 L8 82 87 80 90 79 85 87 106 1 IPA

9 L9 79 88 90 81 84 81 86 118 1 IPA

10 L10 84 78 85 89 83 84 90 112 1 IPA

… … … …

134 L134 70 76 70 76 75 78 78 93 2 IPS

Tabel 4.32 Rincian Data Uji Penjurusan Siswa

No Id X1 X2 X3 X4 X5 X6 X7 X8 X9 Kelas

1 U1 80 88 90 85 78 82 91 118 1 IPA

2 U2 79 88 90 81 84 81 86 118 1 IPA

3 U3 84 85 87 80 83 83 85 82 1 IPS

4 U4 82 84 84 82 82 82 90 106 1 IPA

5 U5 75 84 80 81 75 81 86 93 1 IPS

6 U6 82 90 90 80 84 84 85 112 1 IPA

7 U7 82 82 77 77 74 78 81 94 1 IPA

8 U8 70 70 70 72 70 71 80 97 2 IPS

9 U9 70 70 74 72 70 75 73 96 1 IPS

10 U10 70 70 70 74 72 81 79 100 1 IPA

… … … …

33 U33 70 76 71 75 74 77 82 93 1 IPS

Selanjutnya dilakukan perhitungan kemiripan antara data uji dan data latih berdasarkan model jarak Euclaudien (persamaan 2.10). Adapun jarak yang dihasilkan dapat dilihat pada tabel 4.33, kemudian berdasarkan jarak antar data dilakukan pengurutan secara ascending, adapun urutan jarak antar data dapat dilihat pada tabel 4.34.

Tabel 4.33 Jarak Antara Data Pada Data Penjurusan Siswa

Data Uji Data Latih

L1 L2 L3 L4 L5 … L134

U1 21.33 18.06 16.03 15.75 7.00 … 39.31

U2 23.45 18.25 14.70 12.37 13.78 … 37.82

U3 50.68 38.35 30.89 37.70 38.60 … 29.02

U4 31.22 22.36 16.28 19.18 16.46 … 28.62

U5 46.63 36.84 29.09 34.89 29.19 … 16.97

U6 25.53 16.76 11.75 11.18 15.43 … 35.83

U7 49.07 39.56 32.53 35.34 31.40 … 15.56

U8 61.68 54.43 47.18 49.00 42.83 … 12.08

U9 62.10 54.18 46.81 48.17 43.53 … 11.70

U10 57.94 50.64 43.99 44.77 39.18 … 10.44

… … … …

U33 57.51 48.89 41.24 44.63 39.00 … 4.58

Tabel 4.34 Urutan Jarak Terdekat Pada Data Penjurusan Siswa

Tahapan selanjutnya untuk metode K-NN konvensional adalah penentuan kelas dengan menggunakan system vote majority dari K tetangga terdekat, dimana kelas mayoritas akan dijadikan sebagai kelas bagi data uji, sedangkan tahapan selanjutnya dari gabungan LMKNN dan DWKNN adalah menghitung nilai rata-rata bobot dari jarak tetangga terdekat sebanyak parameter K dari setiap kelas data, kemudia barulah dilakukan penentuan kelas bagi data uji berdasarkan rata-rata nilai bobot tertinggi, adapun hasil akurasi pada data penjurusan siswa dapat dilihat pada tabel berikut.

Tabel 4.35 Perbandingan Akurasi Pada Data Penjurusan Siswa

No K

Rata-rata 82.42% 87.58% LMKNN+DWKNN

Adapun grafik perbandingan akurasi K-NN konvesional dan gabungan LMKNN dan DWKNN pada data penjurusan siswa, dapat dilihat pada gambar 4.12.

Gambar 4.12 Grafik Perbandingan Akurasi Pada Data Penjurusan Siswa

Berdasarkan hasil perbandingan akurasi antara K-NN konvesional terhadap gabungan LMKNN dan DWKNN (tabel 4.35 dan gambar 4.12) dapat disimpulkan bahwa nilai akurasi yang dihasilkan dari gabungan LMKNN dan DWKNN selalu lebih tinggi dari pada K-NN konvensional kecuali pada saat K bernilai 1 dan K bernilai 3, dimana nilai akurasi yang didapati dari gabungan LMKNN dan DWKK hanya sebesar 84.85%, dimana nilai ini merupakan akurasi terendah yang dihasilkan dari gabungan LMKNN dan DWKNN, sedangkan nilai terendah yang dihasilkan oleh K-NN konvensional adalah sebesar 78.79% yaitu saat K bernilai 5. Sedangkan nilai akurasi tertinggi yang dihasilkan dari gabungan LMKNN dan DWKNN adalah sebesar 90.91% pada saat K bernilai 10, sedangkan pada K-NN konvensional hanya mampu mencapai nilai tertinggi sebesar 84.85% yaitu pada saat K bernilai 1, 2 dan 10.

4.3 Pembahasan

Untuk melihat dengan jelas rata-rata dari nilai akurasi yang didapati K-NN konvensional dan gabungan dari LMKNN dan DWKNN pada seluruh data yang digunakan dalam pengujian dapat dilihat pada gambar 4.13.

84.85%

Gambar 4.13 Grafik Rata-rata Nilai Akurasi Dari Seluruh Data

Dari gambar 4.13 terlihat bahwa gabungan LMKNN dan DWKNN mampu memberikan nilai akurasi yang lebih baik dari pada K-NN konvensional. Dimana penigkatan nilai akurasi tertinggi didapati pada dataset Lower Back Pain Symptomps yaitu sebesar 3.71%, sedangkan peningkatan nilai akurasi terendah didapati pada dataset iris yaitu sebesar 1.66%. Adapun peningkatan rata-rata nilai akurasi dari seluruh dataset yang digunakan adalah sebesar 2.452%.

Sedangkan pada data penjurusan siswa di SMAN 2 Tualang, gabungan LMKNN dan DWKNN mampu meningkatkan nilai akurasi tertinggi sebesar 9.09% pada saat K bernilai 5. Adapun peningkatan rata-rata nilai akurasi yang dihasilkan pada data penjurusan siswa adalah sebesar 5.15%. Sedangkan rata-rata peningkatan yang dihasilkan dari seluruh data yang digunakan pada penelitian ini adalah sebesar 2.903%.

Berdasarkan pengujian yang telah dilakukan pada seluruh data, terlihat bahwa gabungan dari LMKNN dan DWKNN mampu memberikan nilai akurasi yang lebih baik dari pada nilai akurasi yang dihasilkan oleh K-NN konvensional.

0.00%

Ionosphere Iris Voice Genre Lower Back Pain

BAB 5

Dalam dokumen PENINGKATAN AKURASI PADA METODE KLASIFIKASI K-NEAREST NEIGHBOR MENGGUNAKAN LOCAL MEAN BASED DAN DISTANCE WEIGHT K-NEAREST NEIGHBOR TESIS (Halaman 41-67)