15 BAB III
METODELOGI PENELITIAN Inisialisasi Penelitian
3.1.1 Studi Literatur
Studi literatur merupakan acuan teori yang digunakan untuk mengerjakan sebuah penelitian. Pada penelitian ini peneliti menggunakan metode improved k-nearest neighbor yang ditemukan oleh Wei Yuan pada tahun 2004 [3].
3.1.2 Wawancara
Kegiatan wawancara dilakukan kepada sekertaris prodi teknik informatika institut teknologi sumatera yaitu Bapak Amirul Iqbal, S.Kom,. M.Eng. mengenai kurikulum dan kelompok keilmuan.
3.1.3 Pengumpulan Data
Pada tahapan ini peneliti akan mengumpulkan data yang digunakan dan diolah untuk penelitian. Pengumpulan data akan dilakukan melalui sebuah kuisioner. Target responden yaitu mahasiswa teknik informatika angkatan 2016 yang telah melakukan seminar proposal. Kriteria pemilihan responden yang telah melakukan seminar proposal dikarenakan untuk mengetahui kelompok keilmuan dari tugas akhir yang dikerjakan sudah pasti. Adapun data yang dikumpulkan merupakan nilai-nilai mata kuliah wajib prodi teknik informatika.
Persiapan Data 3.2.1 Pembersihan Data
Pada tahapan ini akan dilakukan pemeriksaan mengenai kelengkapan data yang dibutuhkan dan penghapusan data dupliklat.
3.2.2 Transformasi Data
Pada tahapan ini akan dilakukan penyesuain mata kuliah terkait perbedaan mata kuliah wajib pada kurikulum 2016 yang disesuaikan dengan kurikulum 2020 dan konversi data penelitian menjadi bentuk data numerik. Hal ini diperlukan supaya data dapat diolah pada tahapan selanjutnya. Pada tabel 3.1 merupakan konversi data nilai yang akan digunakan dalam penelitian.
16
Tabel 3.1 Konversi Data Nilai
Nilai Konversi
A 4
AB 3,5
B 3
BC 2,5
C 2
D 1
E 0
Pada tabel 3.2 merupakan keterangan kode singkatan nama mata kuliah yang digunakan dalam dataset penelitian ini.
Tabel 3.2 Data Mata Kuliah
Mata Kuliah Kode
Pengantar Teknologi Informasi B PTI
Dasar Pemrograman Daspro
Matriks dan Ruang Vektor MRV
Logika Informatika LogIf
Matematika Diskrit MD
Teori Bahasa Formal dan Otomata TBFO
Algoritma dan Struktur Data ASD
Organisasi dan Arsitektur Komputer OAK
Strategi Algoritma SA
Probabilitas dan Statistika PS
Basis Data BS
Pemrograman Berorientasi Objek PBO
Sistem Operasi SO
Dasar Rekayasa Perangkat Lunak DRPL
Inteligensi Buatan IB
Jaringan Komputer JK
Interaksi Manusia dan Komputer IMK
Sistem Informasi SI
Information Retrieval IR
Data Warehouse / Data Mining DM
Manajemen Basis Data MBD
Pengolahan Citra Digital PCD
Teknologi Basis Data TBD
17
Tabel 3.3 Data Mata Kuliah (Lanjutan)
Mata Kuliah Kode
Teknologi Game TG
Pengolahan Sinyal Digital PSD
Jaringan Komputer Lanjut JKL
Pengembangan Aplikasi Mobile PAM
Kriptografi KRPT
Pemrograman Web Web
Sistem Tertanam ST
Sistem / Teknologi Multimedia TM
Pemrograman Web Lanjut WebL
Pervasive Computing Pervasif
Keamanan Jaringan KEJAR
Manajemen Proyek Teknologi Informasi MPTI
Proyek Teknologi Informasi PPL
Sistem Informasi Lanjut SIL
Adapun penyesuain mata kuliah wajib 2016 yang disesuaikan dengan kurikulum 2020 dapat dilihat pada Tabel 3.4.
Tabel 3.4 Penyesuaian Mata Kuliah
Mata Kuliah Kurikulum 2020 Mata Kuliah Kurikulum 2016
Algoritma Pemrograman I Pengantar Teknologi Informasi B Algoritma Pemrograman II Dasar Pemrograman
Matematika diskrit Logika Informatika
Matematika Diskrit
Penyesuain mata kuliah ini berdasarkan ekuivalensi antara kurikulum sebelumnya dengan kurikulum 2020
Perancangan Sistem
Pada tahap ini dilakukan perancangan sistem yang akan diterapkan sebelum diimplementasikan. Tahapan ini sebagai gambaran dari proses model klasifikasi yang digunakan dalam penelitian. Perancangan sistem prediksi kelompok keilmuan tugas akhir menggunakan metode KNN+ ditunjukkan pada Gambar 3.1.
18
Gambar 3.1 Perancangan Sistem
Pada perancangan sistem Gambar 3.1 terdiri dari 3 blok yaitu input, proses, dan output. Input dari sistem ini berupa data nilai mata kuliah wajib teknik informatika dan mata kuliah pilihan yang telah dikumpulkan dari kuisioner.
Kemudian pada tahap proses dilakukan pengolahan data dengan menggunakan metode KNN+, dimana tahapan awal yaitu menghitung euclidean distance antara data uji dengan semua data latih. Tahapan selanjutnya mengurutkan nilai euclidean distance dari yang terkecil dan mengambil data latih yang memiliki jarak terdekat sebanyak nilai k yang telah ditentukan.
Sebelum masuk ke tahap perhitungan nilai voting, akan terlebih dahulu dicari koefisien korelasi data uji terhadap dataset untuk masing-masing kelompok keilmuan dan nilai bobot setiap kelompok keilmuan yang dimiliki data uji. Nilai bobot didapatkan dari perhitungan nilai mata kuliah yang tergolong pada suatu kelompok keilmuan. Pada hasil perhitungan nilai voting dari masing-masing label, nilai voting tertinggi/maksimal akan digunakan untuk menentukan label data uji[9].
Selanjutnya pada proses output yaitu sistem akan memberikan hasil prediksi kelompok keilmuan tugas akhir pada mahasiswa.
3.3.1 Proses Klasifikasi Metode Improved k-Nearest Neighbor (KNN+)
Pada proses awal dari improved k-nearest neighbor tidak berbeda dengan proses k-nearest neighbor yang biasa. Tahapan ini dimulai dengan perhitungan jarak antara data latih dan data uji dengan menggunakan rumus euclidean distance.
Setelah didapatkan nilai euclidean distance, nilai tersebut diurutkan dari nilai terkecil. Berikut ini diberikan sebuah contoh data yang akan menggambarkan
19
proses prediksi untuk memperjelas proses improved k-nearest neighbor. Pada tabel 3.5 dan tabel 3.6 merupakan contoh data latih dan data uji yang akan digunakan dalam proses perhitungan. Pada Tabel 3.7 dan tabel 3.8 merupakan hasil konversi data latih dan data uji ke bentuk data numerik untuk memudahkan proses perhitungan.
20
Tabel 3.5 Contoh Data Latih
NO NIM Mata Kuliah Wajib IF
KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-1 RPLSI D C B B B BC AB AB C B BC A B B A B A
2 2016-2 RPLSI AB AB B A AB A A A BC AB A A B BC A B A
3 2016-3 KSP C BC BC B A AB A A BC A AB AB C C AB BC AB
4 2016-4 AIDE C A B B B BC A B C BC BC B BC BC B AB A
5 2016-5 AIDE D D C C B BC B C C BC BC BC BC C B B AB
6 2016-6 RPLSI D D AB B A BC A A C B BC A BC B AB B A
7 2016-7 AIDE C B C BC BC BC A AB C AB A A BC C A C A
8 2016-8 AIDE BC A B AB A A A A AB A A A A B A AB A
9 2016-9 RPLSI D C BC C C C C D C C C BC AB C B BC BC
10 2016-10 KSP D D C C D BC C BC C C BC BC BC C BC BC B
11 2016-11 RPLSI D B B BC BC AB B BC B BC C B BC C A AB AB
12 2016-12 AIDE C B B AB C AB AB AB B AB B B BC B A A A
13 2016-13 KSP D BC B B C C C C D BC C B BC D B AB AB
14 2016-14 KSP C BC B AB B BC A B AB C BC BC C C A BC AB
Tabel 3.6 Contoh Data Uji
NO NIM KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-20 ? C A B B BC AB A A C AB A A B C A BC AB
21
Tabel 3.7 Contoh data latih yang telah dikonversi
NO NIM Mata Kuliah Wajib IF
KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-1 RPLSI 1 2 3 3 3 2,5 3,5 3,5 2 3 2,5 4 3 3 4 3 4
2 2016-2 RPLSI 3,5 3,5 3 4 3,5 4 4 4 2,5 3,5 4 4 3 2,5 4 3 4
3 2016-3 KSP 2 2,5 2,5 3 4 3,5 4 4 2,5 4 3,5 3,5 2 2 3,5 2,5 3,5
4 2016-4 AIDE 2 4 3 3 3 2,5 4 3 2 2,5 2,5 3 2,5 2,5 3 3,5 4
5 2016-5 AIDE 1 1 2 2 3 2,5 3 2 2 2,5 2,5 2,5 2,5 2 3 3 3,5
6 2016-6 RPLSI 1 1 3,5 3 4 2,5 4 4 2 3 2,5 4 2,5 3 3,5 3 4
7 2016-7 AIDE 2 3 2 2,5 2,5 2,5 4 3,5 2 3,5 4 4 2,5 2 4 2 4
8 2016-8 AIDE 2,5 4 3 3,5 4 4 4 4 3,5 4 4 4 4 3 4 3,5 4
9 2016-9 RPLSI 1 2 2,5 2 2 2 2 1 2 2 2 2,5 3,5 2 3 2,5 2,5
10 2016-10 KSP 1 1 2 2 1 2,5 2 2,5 2 2 2,5 2,5 2,5 2 2,5 2,5 3
11 2016-11 RPLSI 1 3 3 2,5 2,5 3,5 3 2,5 3 2,5 2 3 2,5 2 4 3,5 3,5
12 2016-12 AIDE 2 3 3 3,5 2 3,5 3,5 3,5 3 3,5 3 3 2,5 3 4 4 4
13 2016-13 KSP 1 2,5 3 3 2 2 2 2 1 2,5 2 3 2,5 1 3 3,5 3,5
14 2016-14 KSP 2 2,5 3 3,5 3 2,5 4 3 3,5 2 2,5 2,5 2 2 4 2,5 3,5
Tabel 3.8 Contoh data uji yang telah dikonversi
NO NIM Mata Kuliah Wajib IF
KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-20 ? 2 4 3 3 2,5 3,5 4 4 2 3,5 4 4 3 2 4 2,5 3,5
22 3.3.1.1 Menghitung Euclidean Distance
Selisih jarak atau euclidean distance ini bertujuan untuk mengetahui kedekatan nilai antara setiap data latih dan data uji. Proses perhitungan euclidean distance dilakukan sebanyak jumlah data uji. Berikut ini merupakan salah satu contoh mencari euclidean distance antara data uji pada Tabel 3.8 dengan data latih pertama pada Tabel 3.7.
𝑑(1,1) = √
(2 − 1)2+ (4 − 2)2+ (3 − 3)2+ (3 − 3)2+ (2,5 − 3)2+ (3,5 − 2,5)2+ (4 − 3,5)2+ (4 − 3,5)2+ (2 − 2)2+ (3,5 − 3)2+ (4 − 2,5)2+ (4 − 4)2+
(3 − 3)2+ (2 − 3)2+ (4 − 4)2+ (2,5 − 3)2+ (3,5 − 4)2 𝑑(1,1) = 3,278719262151
Setelah dilakukan perhitungan euclidean distance dengan seluruh data uji, hasilnya dapat dilihat pada Tabel 3.9.
Tabel 3.9 Hasil Perhitungan Euclidean Distance
NO NIM Nilai ED KK TA
1 2016-1 3,278719 RPLSI
2 2016-2 2,397916 RPLSI
3 2016-3 2,645751 KSP
4 2016-4 3,041381 AIDE
5 2016-5 5,024938 AIDE
6 2016-6 4,242641 RPLSI
7 2016-7 2,061553 AIDE
8 2016-8 2,95804 AIDE
9 2016-9 5,700877 RPLSI
10 2016-10 5,567764 KSP
11 2016-11 3,708099 RPLSI
12 2016-12 2,95804 AIDE
13 2016-13 4,898979 KSP
14 2016-14 3,840573 KSP
3.3.1.2 Mengurutkan Euclidean Distance
Setelah mengetahui jarak antar kedekatan data uji dan data latih, hal selanjutnya yang dilakukan yaitu mengurutkan nilai euclidean distance dari yang terkecil. Kedekatan jarak ini akan berpengaruh pada pengambilan data latih terdekat sebanyak nilai k. Hasil urutan nilai euclidean distance dapat dilihat pada Tabel 3.10.
23
Tabel 3.10 Urutan nilai euclidean distance data uji terhadap data latih NO NIM NILAI ED KK TA
1 2016-7 2,061553 AIDE 2 2016-2 2,397916 RPLSI 3 2016-3 2,645751 KASPER 4 2016-8 2,95804 AIDE 5 2016-12 2,95804 AIDE 6 2016-4 3,041381 AIDE 7 2016-1 3,278719 RPLSI 8 2016-11 3,708099 RPLSI 9 2016-14 3,840573 KASPER 10 2016-6 4,242641 AIDE 11 2016-13 4,898979 KASPER 12 2016-5 5,024938 AIDE 13 2016-10 5,567764 KASPER 14 2016-9 5,700877 RPLSI
3.3.1.3 Mengambil Data Latih Sesuai Nilai K
Nilai euclidean distance yang telah diurutkan dari jarak terdekat akan berpengaruh pada pengambilan data latih sebanyak nilai k yang telah ditentutkan.
Pada contoh ini k yang digunakan adalah 5, maka pada Tabel 3.11 merupakan kelima data latih yang memiliki jarak terdekat dengan data uji.
Tabel 3.11 Euclidean distance terdekat k=5
No NIM NILAI ED KK TA
1 2016-7 2,061553 1
2 2016-2 2,397916 3
3 2016-3 2,645751 2
4 2016-8 2,95804 1
5 2016-12 2,95804 1
Pada metode K-Nearest Neighbor yang biasa hasil prediksi label kelas ditentukan melalui label kelas paling dominan pada data terdekat sebanyak nilai k.
Misalnya melalui tabel 3.11 dapat diketahui bahwa kelompok keilmuan 1 atau Artificial Intelegence dan Data Engineering (AIDE) merupakan label dominan pada kelima data terdekat. Berbeda dengan Improved K-Nearest Neighbor dimana untuk menentukan label data uji akan dilakukan perhitungan nilai voting terhadap atribut data.
24 3.3.1.4 Menentukan Nilai Bobot
Dalam menentukan nilai bobot untuk setiap kelompok keilmuan dari sebuah data uji, pada penelitian ini peneliti menggunakan cara menghitung nilai IPK pada setiap kelompok keilmuan. Perhitungan IPK suatu kelompok keilmuan dilakukan dengan cara mengelompokkan mata kuliah yang sesuai dengan kode kelompok keilmuan yang telah ditentukan oleh prodi. Berikut ini merupakan contoh perhitungannya :
a. Nilai bobot untuk kelas/label kelompok keilmuan AIDE 𝑚1 = ∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝐵𝑅𝐷𝑡
𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆
𝑚1 = (3𝑥3) + (4𝑥3) + (3𝑥2,5) + (3𝑥4) + (3𝑥2) + (3𝑥3,5) + (3𝑥2) 22
𝑚1 = 63
22= 2,86
b. Nilai bobot untuk kelas kelompok keilmuan KSP 𝑚2 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝑆𝑃𝑡
𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆
𝑚2 = (3𝑥2) + (3𝑥4) + (4𝑥3,5) + (3𝑥4) + (4𝑥4) + (3𝑥4) + (3𝑥4) 23
𝑚2 = 84
23= 3,65
c. Nilai bobot untuk kelas kelompok keilmuan RPLSI
𝑚3 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝑅𝑃𝐿𝑆𝐼𝑡 𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆
𝑚3 = = (2𝑥3) + (2𝑥2,5) + (2𝑥3,5) 6
𝑚3 = 18 6 = 3
25 3.3.1.5 Menghitung Koefisien Korelasi
Untuk menemukan nilai voting, terlebih dahulu menentukan nilai koefisien korelasi (𝑘𝑡𝑖) dari data latih terhadap data uji [3]. Adapun rumus mencari koefisien korelasi yaitu 𝑘𝑡𝑖 = ∑𝑖=1
𝑛 (𝑥𝑖−𝑥̅)(𝑦−𝑦̅)
√Σ𝑖=1𝑛 (𝑥𝑖−𝑥̅)2(𝑦−𝑦̅)2
. Proses perhitungan koefisien korelasi akan dibagi menjad menjadi dua bagian, dimana yang pertama menemukan nilai dari
∑𝑖=1𝑛 (𝑥𝑖 − 𝑥̅)(𝑦 − 𝑦̅) dan yang kedua √Σ𝑖=1𝑛 (𝑥𝑖 − 𝑥̅)2(𝑦 − 𝑦̅)2.
Pada bagian pertama proses awal yang dilakukan yaitu menentukan nilai rata-rata dari setiap atribut data latih ditambah data yang diuji. Misalnya untuk menemukan rata-rata nilai atribut dari PTI pada data yang diuji adalah sebagai berikut
𝑥𝑃𝑇𝐼̅̅̅̅̅̅̅ =𝑑𝑎𝑡𝑎1 + 𝑑𝑎𝑡𝑎2 + ⋯ + 𝑑𝑎𝑡𝑎14 + 𝑑𝑎𝑡𝑎𝑢𝑗𝑖 𝑡𝑜𝑡𝑎𝑙𝑑𝑎𝑡𝑎
𝑥𝑃𝑇𝐼̅̅̅̅̅̅̅ = (1+3,5+2+2+1+1+2+2,5+1+1+1+2+1+2+2)
15 = 1,66666666666667
Pada Tabel 3.12 merupakan hasil perhitungan nilai rata-rata dari setiap atribut.
Tabel 3.12 Nilai rata-rata pada setiap atribut
NO PTI Daspro MRV MD TBFO ASD OAK SA
1 1 2 3 3 3 2,5 3,5 3,5
2 3,5 3,5 3 4 3,5 4 4 4
3 2 2,5 2,5 3 4 3,5 4 4
4 2 4 3 3 3 2,5 4 3
5 1 1 2 2 3 2,5 3 2
6 1 1 3,5 3 4 2,5 4 4
7 2 3 2 2,5 2,5 2,5 4 3,5
8 2,5 4 3 3,5 4 4 4 4
9 1 2 2,5 2 2 2 2 1
10 1 1 2 2 1 2,5 2 2,5
11 1 3 3 2,5 2,5 3,5 3 2,5
12 2 3 3 3,5 2 3,5 3,5 3,5
13 1 2,5 3 3 2 2 2 2
14 2 2,5 3 3,5 3 2,5 4 3
15 2 4 3 3 2,5 3,5 4 4
X̅ 1,667 2,6 2,767 2,9 2,8 2,9 3,4 3,1
26
Tabel 3.13 Nilai rata-rata pada setiap atribut (lanjutan)
PS BD PBO SO DRPL IB JK IMK SI
2 3 2,5 4 3 3 4 3 4
2,5 3,5 4 4 3 2,5 4 3 4
2,5 4 3,5 3,5 2 2 3,5 2,5 3,5
2 2,5 2,5 3 2,5 2,5 3 3,5 4
2 2,5 2,5 2,5 2,5 2 3 3 3,5
2 3 2,5 4 2,5 3 3,5 3 4
2 3,5 4 4 2,5 2 4 2 4
3,5 4 4 4 4 3 4 3,5 4
2 2 2 2,5 3,5 2 3 2,5 2,5
2 2 2,5 2,5 2,5 2 2,5 2,5 3
3 2,5 2 3 2,5 2 4 3,5 3,5
3 3,5 3 3 2,5 3 4 4 4
1 2,5 2 3 2,5 1 3 3,5 3,5
3,5 2 2,5 2,5 2 2 4 2,5 3,5
2 3,5 4 4 3 2 4 2,5 3,5
2,333 2,933 2,9 3,3 2,7 2,267 3,567 2,967 3,633
Setelah menemukan nilai rata-rata pada setiap atribut, tahapan selanjutnya menghitung selisih antara setiap nilai dari data suatu atribut dengan nilai rata- ratanya. Misalnya pada atribut PTI untuk menemukan selisih pada data pertama yaitu sebagai berikut
𝑃𝑇𝐼1 − 𝑥𝑃𝑇𝐼̅̅̅̅̅̅̅ = 1 − 1,667 = −0,667
Tabel 3.14 merupakan nilai selisih antara data setiap atribut dengan nilai rata- ratanya.
Tabel 3.14 Hasil selisih data atribut dengan nilai rata-rata
NO PTI-x̅ Dp-x̅ MRV-
x̅ MD-x̅ TBFO-x̅ ASD-x̅ OAK-x̅ SA-x̅
1 -0,67 -0,6 0,233 0,1 0,2 -0,4 0,1 0,4
2 1,833 0,9 0,233 1,1 0,7 1,1 0,6 0,9
3 0,333 -0,1 -0,27 0,1 1,2 0,6 0,6 0,9
4 0,333 1,4 0,233 0,1 0,2 -0,4 0,6 -0,1
... ... ... ... ... ... ... ... ...
15 0,333 1,4 0,233 0,1 -0,3 0,6 0,6 0,9
27
Tabel 3.15 Hasil selisih nilai atribut dengan nilai rata-rata (lanjutan)
PS-x̅ BD-x̅ PBO-x̅ SO-x̅ DRPL-x̅ IB-x̅ JK-x̅ IMK-x̅ SI-x̅ -0,33 0,067 -0,4 0,7 0,3 0,733 0,433 0,033 0,367 0,167 0,567 1,1 0,7 0,3 0,233 0,433 0,033 0,367 0,167 1,067 0,6 0,2 -0,7 -0,27 -0,07 -0,47 -0,13 -0,33 -0,43 -0,4 -0,3 -0,2 0,233 -0,57 0,533 0,367
... ... ... ... ... ... ... ... ...
-0,33 0,567 1,1 0,7
0,3 -0,27 0,433 -0,47 -0,13
Tahapan selanjutnya setelah menemukan nilai selisih dari data setiap atribut yaitu melakukan perkalian nilai selisih pada setiap atribut. Berikut ini merupakan contoh perkalian pada data pertama dari Tabel 3.15. Kemudian hasil perkalian seluruh data dapat dilihat pada Tabel 3.16.
(𝑃𝑇𝐼 − 𝑥̅)𝑥(𝐴𝑃2 − 𝑥̅)𝑥(𝑀𝑅𝑉 − 𝑥̅)𝑥(… )𝑥(𝐽𝐾 − 𝑥̅)𝑥(𝐼𝑀𝐾 − 𝑥̅)𝑥(𝑆𝐼 − 𝑥̅)
= (−0,67)𝑥(−0,6)𝑥(0,23)𝑥(… )𝑥(0,43)𝑥(0,033)𝑥(0,367)
= 2,16535E − 10
Tabel 3.16 Hasil perkalian dari atribut (𝑷𝑻𝑰 − 𝒙̅)𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)
No (PTI-x̅)x(… )x(SI-x̅)
1 -2,16535E-10
2 4,74761E-06
3 -5,70891E-09
4 4,68502E-09
5 -1,60848E-07
6 -1,50765E-08
7 1,40302E-06
8 0,009012511
9 0,002910381
10 -0,000745112
11 -1,37829E-07
12 -9,78118E-08
13 2,74676E-06
14 3,9284E-08
15 -3,32051E-07
JMLH 0,011185972
Pada bagian kedua yaitu melakukan pemangkatan untuk hasil selisih data atribut dengan nilai rata-rata (Tabel 3.14). Adapun contoh perhitungannya yaitu
28
sebagai berikut (𝑷𝑻𝑰𝟏− 𝒙̅)2 = (−0,67)2= 0,4489. Pada Tabel 3.17 merupakan hasil selisih data atribut dipangkatkan dua.
Tabel 3.17 Hasil selisih data atribut dengan rata-rata dipangkatkan dua
NO (PTI-x̅)2 (Dp-x̅)2 (MRV-x̅)2 (MD-x̅)2 (TBFO-x̅)2 (ASD-x̅)2 (OAK-x̅)2 (SA-x̅)2 (PS-x̅)2
1 0,445 0,360 0,054 0,010 0,040 0,160 0,010 0,160 0,111
2 3,349 0,810 0,054 1,210 0,490 1,210 0,360 0,810 0,028
3 0,109 0,010 0,071 0,010 1,440 0,360 0,360 0,810 0,028
4 0,111 1,960 0,054 0,010 0,040 0,160 0,360 0,010 0,111
... ... ... ... ... ... ... ... ... ...
11 0,444 0,160 0,054 0,160 0,090 0,360 0,160 0,360 0,444
12 0,111 0,160 0,054 0,360 0,640 0,360 0,010 0,160 0,444
13 0,444 0,010 0,054 0,010 0,640 0,810 1,960 1,210 1,778
14 0,111 0,010 0,054 0,360 0,040 0,160 0,360 0,010 1,361
15 0,111 1,960 0,054 0,010 0,090 0,360 0,360 0,810 0,111
Tabel 3.18 Hasil selisih data atribut dengan rata-rata dipangkatkan dua (lanjutan) (BD-x̅)2 (PBO-x̅)2 (SO-x̅)2 (DRPL-x̅)2 (IB-x̅)2 (JK-x̅)2 (IMK-x̅)2 (SI-x̅)2
0,004 0,160 0,490 0,090 0,538 0,188 0,001 0,134 0,321 1,210 0,490 0,090 0,054 0,188 0,001 0,134 1,138 0,360 0,040 0,490 0,071 0,004 0,218 0,018 0,188 0,160 0,090 0,040 0,054 0,321 0,284 0,134
... ... ... ... ... ... ... ...
0,188 0,810 0,090 0,040 0,071 0,188 0,284 0,018 0,321 0,010 0,090 0,040 0,538 0,188 1,068 0,134 0,188 0,810 0,090 0,040 1,604 0,321 0,284 0,018 0,871 0,160 0,640 0,490 0,071 0,188 0,218 0,018 0,321 1,210 0,490 0,090 0,071 0,188 0,218 0,018
Setelah hasil pemangkatan ditemukan, selanjutnya yaitu mengkalikan data hasil pemangkatan antar setiap atribut. Adapun contoh proses yang dimaksud adalah sebagai berikut
(𝑷𝑻𝑰 − 𝒙̅)𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)𝟐= 0,445 x … x 0,134 = 4,69341E − 20
Pada Tabel 3.19 merupakan hasil perkalian dari selisih atribut yang telah dipangkatkan.
Tabel 3.19 Hasil perkalian dari (𝑷𝑻𝑰 − 𝒙̅)𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)𝟐 No (PTI-x̅)2x(… )x(SI-x̅)2
1 4,69341E-20
2 2,24579E-11
29
Tabel 3.20 Hasil perkalian dari (𝑷𝑻𝑰 − 𝒙̅)𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)𝟐 (lanjutan) No (𝑷𝑻𝑰 − 𝒙̅)𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)𝟐
3 3,19431E-17
4 2,19494E-17
5 2,5872E-14
6 2,27301E-16
7 1,96847E-12
8 8,12253E-05
9 8,47032E-06
10 5,55192E-07
11 1,8997E-14
12 9,56714E-15
13 7,54469E-12
14 1,54323E-15
15 1,10258E-13
Jumlah 9,02509E-05
Setelah mendapatkan hasil pada bagian pertama (Tabel 3.16) dan bagian kedua (Tabel 3.20), nilai koefisien korelasi dapat dihitung dengan sebagai berikut : 𝑘𝑡1 = ∑𝑖=115 (𝑷𝑻𝑰 − 𝒙̅)𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)
√Σ𝑖=115 (𝑷𝑻𝑰 − 𝒙̅)𝟐𝒙(…)𝒙(𝑺𝑰 − 𝒙̅)𝟐 𝑘𝑡1 = −3,0948E − 37
√9,57776E − 74 𝑘𝑡1 =−1
Berdasarkan contoh hasil perhitungan koefisien korelasi (𝑘𝑡𝑖) pada data uji t dengan data latih yang memiliki label AIDE (𝑘𝑡1) , maka nilai 𝑘𝑡1 yang digunakan untuk perhitungan nilai voting terhadap data yang diujikan adalah -1.
3.3.1.6 Menghitung Nilai Voting
Nilai voting (𝑉𝑡→𝑖) dihitung dengan cara sebagai berikut (𝑉𝑡→𝑖) = ∑𝑐𝑙𝑎𝑠𝑠(𝑗)=𝑖
𝑚𝑖 𝑥 𝑘𝑡𝑖 𝑑𝑡𝑗2
Pada data pertama berdasarkan Tabel 3.11, untuk menemukan nilai (𝑉𝑡→1) atau nilai voting nilai voting KK AIDE yaitu sebagai berikut:
𝑚1= 2,86 𝑘𝑡1= -1
30 𝑑𝑡12 = 2,0615532
𝑑𝑡42 = 2,958042 𝑑𝑡52 = 2,958042 (𝑉𝑡→1) = 2,86𝑥−1
2,0615532+ 2,86𝑥−1
2,958042+ 2,86𝑥−1
2,958042 = -1,328342246
Untuk menemukan nilai (𝑉𝑡→2) atau nilai voting KK KSP diketahui 𝑚2 = 3,65
𝑘𝑡2= -1
𝑑𝑡𝑗2= 2,6457512 (𝑉𝑡→2) = 3,65𝑥−1
2,6457512 =-0,52173913
Untuk menemukan nilai (𝑉𝑡→3) atau nilai voting KK RPLSI diketahui 𝑚3 = 3
𝑘𝑡3= 1
𝑑𝑡𝑗2= 2,3979162 (𝑉𝑡→3) = 3𝑥1
2,3979162 = 0,52173913
3.3.1.7 Menentukan Hasil Prediksi Data Uji
Hasil prediksi dari data uji, ditentukan nilai maksimum dari perhitungan nilai voting. Hal ini karena nilai voting merupakan refleksi hubungan antara data uji dengan label data latih. Berikut ini merupakan contoh untuk menentukan hasil prediksi :
(𝑉𝑡→1) = −1,328342246 (𝑉𝑡→2) = −0,52173913 (𝑉𝑡→3) = 0,52173913
𝐶𝑙𝑎𝑠𝑠(𝑡) = max{−1,328342246 , −0,52173913, 0,52173913}= 0,52173913 Berdasarkan contoh tersebut diketahui bahwa nilai maksimum dari nilai voting yaitu 0,52173913 yang merupakan hasil dari (𝑉𝑡→3). Jadi hasil prediksi label dari data uji tersebut adalah 3 atau Rekayasa Perangkat Lunak dan Sistem Informasi (RPLSI).
31
3.3.2 Implementasi Metode Improved k-Nearest Neighbor (KNN+) Pada tahap implementasi yaitu dimana sistem akan dibangun dari tahapan perancangan. Implementasi program dalam penelitian ini menggunakan bahasa pemrograman PHP dan MySQLi, dimana proses manualisasi data menggunakan microsoft excel.
Perancangan Pengujian
Rancangan pengujian pada penelitian ini menggunakan metode leave one out cross validation (LOOCV) yang terdiri dari pengujian perbedaan nilai K pada dataset yang digunakan, pengujian seleksi atribut, dan membandingkan hasil pengujian seleksi atribut antara metode KNN+ dan KNN. Tujuan dari pengujian ini untuk mengevaluasi kemampuan metode KNN+ dalam melakukan prediksi kelompok keilmuan.
3.4.1 Pengujian Perbedaan Nilai K
Kinerja metode Improved K-Nearest Neighbor (KNN+) dipengaruhi oleh nilai K atau nilai ketetanggaan. Oleh sebab itu, pada pengujian ini akan dilakukan pengujian terhadap nilai K dengan rentan 1 sampai 20.
3.4.2 Pengujian Seleksi Atribut
Pengujian ini bertujuan untuk memperbaiki atau meningkatkan kemampuan sistem dengan cara menghapus atribut-atribut yang tidak relevan dalam proses klasifikasi. Adapun teknik seleksi atribut yang digunakan dalam penelitian ini yaitu information gain, dimana proses perhitungannya dilakukan dengan perangkat lunak Weka.
3.4.3 Pengujian Model Dataset untuk Memprediksi KK Tugas Akhir Pada pengujian ini model dataset yang berisi kelompok keilmuan, nilai mata kuliah wajib mahasiswa, dan mata kuliah pilihan pendukung tugas akhir akan diujikan dengan beberapa data uji yang berisi nilai mata kuliah wajib mahasiswa serta riwayat mata kuliah pilihan yang pernah diambil mahasiswa. Pengujian ini bertujuan untuk mengetahui bagaimana hasil klasifikasi kelompok keilmuan tugas akhir mahasiswa terhadap hasil klasifikasi sistem.