BAB III METODELOGI PENELITIAN

(1)

15 BAB III

METODELOGI PENELITIAN Inisialisasi Penelitian

3.1.1 Studi Literatur

Studi literatur merupakan acuan teori yang digunakan untuk mengerjakan sebuah penelitian. Pada penelitian ini peneliti menggunakan metode improved k-nearest neighbor yang ditemukan oleh Wei Yuan pada tahun 2004 [3].

3.1.2 Wawancara

Kegiatan wawancara dilakukan kepada sekertaris prodi teknik informatika institut teknologi sumatera yaitu Bapak Amirul Iqbal, S.Kom,. M.Eng. mengenai kurikulum dan kelompok keilmuan.

3.1.3 Pengumpulan Data

Pada tahapan ini peneliti akan mengumpulkan data yang digunakan dan diolah untuk penelitian. Pengumpulan data akan dilakukan melalui sebuah kuisioner. Target responden yaitu mahasiswa teknik informatika angkatan 2016 yang telah melakukan seminar proposal. Kriteria pemilihan responden yang telah melakukan seminar proposal dikarenakan untuk mengetahui kelompok keilmuan dari tugas akhir yang dikerjakan sudah pasti. Adapun data yang dikumpulkan merupakan nilai-nilai mata kuliah wajib prodi teknik informatika.

Persiapan Data 3.2.1 Pembersihan Data

Pada tahapan ini akan dilakukan pemeriksaan mengenai kelengkapan data yang dibutuhkan dan penghapusan data dupliklat.

3.2.2 Transformasi Data

Pada tahapan ini akan dilakukan penyesuain mata kuliah terkait perbedaan mata kuliah wajib pada kurikulum 2016 yang disesuaikan dengan kurikulum 2020 dan konversi data penelitian menjadi bentuk data numerik. Hal ini diperlukan supaya data dapat diolah pada tahapan selanjutnya. Pada tabel 3.1 merupakan konversi data nilai yang akan digunakan dalam penelitian.

(2)

16

Tabel 3.1 Konversi Data Nilai

Nilai Konversi

A 4

AB 3,5

B 3

BC 2,5

C 2

D 1

E 0

Pada tabel 3.2 merupakan keterangan kode singkatan nama mata kuliah yang digunakan dalam dataset penelitian ini.

Tabel 3.2 Data Mata Kuliah

Mata Kuliah Kode

Pengantar Teknologi Informasi B PTI

Dasar Pemrograman Daspro

Matriks dan Ruang Vektor MRV

Logika Informatika LogIf

Matematika Diskrit MD

Teori Bahasa Formal dan Otomata TBFO

Algoritma dan Struktur Data ASD

Organisasi dan Arsitektur Komputer OAK

Strategi Algoritma SA

Probabilitas dan Statistika PS

Basis Data BS

Pemrograman Berorientasi Objek PBO

Sistem Operasi SO

Dasar Rekayasa Perangkat Lunak DRPL

Inteligensi Buatan IB

Jaringan Komputer JK

Interaksi Manusia dan Komputer IMK

Sistem Informasi SI

Information Retrieval IR

Data Warehouse / Data Mining DM

Manajemen Basis Data MBD

Pengolahan Citra Digital PCD

Teknologi Basis Data TBD

(3)

17

Tabel 3.3 Data Mata Kuliah (Lanjutan)

Mata Kuliah Kode

Teknologi Game TG

Pengolahan Sinyal Digital PSD

Jaringan Komputer Lanjut JKL

Pengembangan Aplikasi Mobile PAM

Kriptografi KRPT

Pemrograman Web Web

Sistem Tertanam ST

Sistem / Teknologi Multimedia TM

Pemrograman Web Lanjut WebL

Pervasive Computing Pervasif

Keamanan Jaringan KEJAR

Manajemen Proyek Teknologi Informasi MPTI

Proyek Teknologi Informasi PPL

Sistem Informasi Lanjut SIL

Adapun penyesuain mata kuliah wajib 2016 yang disesuaikan dengan kurikulum 2020 dapat dilihat pada Tabel 3.4.

Tabel 3.4 Penyesuaian Mata Kuliah

Mata Kuliah Kurikulum 2020 Mata Kuliah Kurikulum 2016

Algoritma Pemrograman I Pengantar Teknologi Informasi B Algoritma Pemrograman II Dasar Pemrograman

Matematika diskrit Logika Informatika

Matematika Diskrit

Penyesuain mata kuliah ini berdasarkan ekuivalensi antara kurikulum sebelumnya dengan kurikulum 2020

Perancangan Sistem

Pada tahap ini dilakukan perancangan sistem yang akan diterapkan sebelum diimplementasikan. Tahapan ini sebagai gambaran dari proses model klasifikasi yang digunakan dalam penelitian. Perancangan sistem prediksi kelompok keilmuan tugas akhir menggunakan metode KNN+ ditunjukkan pada Gambar 3.1.

(4)

18

Gambar 3.1 Perancangan Sistem

Pada perancangan sistem Gambar 3.1 terdiri dari 3 blok yaitu input, proses, dan output. Input dari sistem ini berupa data nilai mata kuliah wajib teknik informatika dan mata kuliah pilihan yang telah dikumpulkan dari kuisioner.

Kemudian pada tahap proses dilakukan pengolahan data dengan menggunakan metode KNN+, dimana tahapan awal yaitu menghitung euclidean distance antara data uji dengan semua data latih. Tahapan selanjutnya mengurutkan nilai euclidean distance dari yang terkecil dan mengambil data latih yang memiliki jarak terdekat sebanyak nilai k yang telah ditentukan.

Sebelum masuk ke tahap perhitungan nilai voting, akan terlebih dahulu dicari koefisien korelasi data uji terhadap dataset untuk masing-masing kelompok keilmuan dan nilai bobot setiap kelompok keilmuan yang dimiliki data uji. Nilai bobot didapatkan dari perhitungan nilai mata kuliah yang tergolong pada suatu kelompok keilmuan. Pada hasil perhitungan nilai voting dari masing-masing label, nilai voting tertinggi/maksimal akan digunakan untuk menentukan label data uji[9].

Selanjutnya pada proses output yaitu sistem akan memberikan hasil prediksi kelompok keilmuan tugas akhir pada mahasiswa.

3.3.1 Proses Klasifikasi Metode Improved k-Nearest Neighbor (KNN+)

Pada proses awal dari improved k-nearest neighbor tidak berbeda dengan proses k-nearest neighbor yang biasa. Tahapan ini dimulai dengan perhitungan jarak antara data latih dan data uji dengan menggunakan rumus euclidean distance.

Setelah didapatkan nilai euclidean distance, nilai tersebut diurutkan dari nilai terkecil. Berikut ini diberikan sebuah contoh data yang akan menggambarkan

(5)

19

proses prediksi untuk memperjelas proses improved k-nearest neighbor. Pada tabel 3.5 dan tabel 3.6 merupakan contoh data latih dan data uji yang akan digunakan dalam proses perhitungan. Pada Tabel 3.7 dan tabel 3.8 merupakan hasil konversi data latih dan data uji ke bentuk data numerik untuk memudahkan proses perhitungan.

(6)

20

Tabel 3.5 Contoh Data Latih

NO NIM Mata Kuliah Wajib IF

KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI

1 2016-1 RPLSI D C B B B BC AB AB C B BC A B B A B A

2 2016-2 RPLSI AB AB B A AB A A A BC AB A A B BC A B A

3 2016-3 KSP C BC BC B A AB A A BC A AB AB C C AB BC AB

4 2016-4 AIDE C A B B B BC A B C BC BC B BC BC B AB A

5 2016-5 AIDE D D C C B BC B C C BC BC BC BC C B B AB

6 2016-6 RPLSI D D AB B A BC A A C B BC A BC B AB B A

7 2016-7 AIDE C B C BC BC BC A AB C AB A A BC C A C A

8 2016-8 AIDE BC A B AB A A A A AB A A A A B A AB A

9 2016-9 RPLSI D C BC C C C C D C C C BC AB C B BC BC

10 2016-10 KSP D D C C D BC C BC C C BC BC BC C BC BC B

11 2016-11 RPLSI D B B BC BC AB B BC B BC C B BC C A AB AB

12 2016-12 AIDE C B B AB C AB AB AB B AB B B BC B A A A

13 2016-13 KSP D BC B B C C C C D BC C B BC D B AB AB

14 2016-14 KSP C BC B AB B BC A B AB C BC BC C C A BC AB

Tabel 3.6 Contoh Data Uji

NO NIM KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI

1 2016-20 ? C A B B BC AB A A C AB A A B C A BC AB

(7)

21

Tabel 3.7 Contoh data latih yang telah dikonversi

KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI

1 2016-1 RPLSI 1 2 3 3 3 2,5 3,5 3,5 2 3 2,5 4 3 3 4 3 4

2 2016-2 RPLSI 3,5 3,5 3 4 3,5 4 4 4 2,5 3,5 4 4 3 2,5 4 3 4

3 2016-3 KSP 2 2,5 2,5 3 4 3,5 4 4 2,5 4 3,5 3,5 2 2 3,5 2,5 3,5

4 2016-4 AIDE 2 4 3 3 3 2,5 4 3 2 2,5 2,5 3 2,5 2,5 3 3,5 4

5 2016-5 AIDE 1 1 2 2 3 2,5 3 2 2 2,5 2,5 2,5 2,5 2 3 3 3,5

6 2016-6 RPLSI 1 1 3,5 3 4 2,5 4 4 2 3 2,5 4 2,5 3 3,5 3 4

7 2016-7 AIDE 2 3 2 2,5 2,5 2,5 4 3,5 2 3,5 4 4 2,5 2 4 2 4

8 2016-8 AIDE 2,5 4 3 3,5 4 4 4 4 3,5 4 4 4 4 3 4 3,5 4

9 2016-9 RPLSI 1 2 2,5 2 2 2 2 1 2 2 2 2,5 3,5 2 3 2,5 2,5

10 2016-10 KSP 1 1 2 2 1 2,5 2 2,5 2 2 2,5 2,5 2,5 2 2,5 2,5 3

11 2016-11 RPLSI 1 3 3 2,5 2,5 3,5 3 2,5 3 2,5 2 3 2,5 2 4 3,5 3,5

12 2016-12 AIDE 2 3 3 3,5 2 3,5 3,5 3,5 3 3,5 3 3 2,5 3 4 4 4

13 2016-13 KSP 1 2,5 3 3 2 2 2 2 1 2,5 2 3 2,5 1 3 3,5 3,5

14 2016-14 KSP 2 2,5 3 3,5 3 2,5 4 3 3,5 2 2,5 2,5 2 2 4 2,5 3,5

Tabel 3.8 Contoh data uji yang telah dikonversi

KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI

1 2016-20 ? 2 4 3 3 2,5 3,5 4 4 2 3,5 4 4 3 2 4 2,5 3,5

(8)

22 3.3.1.1 Menghitung Euclidean Distance

Selisih jarak atau euclidean distance ini bertujuan untuk mengetahui kedekatan nilai antara setiap data latih dan data uji. Proses perhitungan euclidean distance dilakukan sebanyak jumlah data uji. Berikut ini merupakan salah satu contoh mencari euclidean distance antara data uji pada Tabel 3.8 dengan data latih pertama pada Tabel 3.7.

𝑑(1,1) = √

(2 − 1)²+ (4 − 2)²+ (3 − 3)²+ (3 − 3)²+ (2,5 − 3)²+ (3,5 − 2,5)²+ (4 − 3,5)²+ (4 − 3,5)²+ (2 − 2)²+ (3,5 − 3)²+ (4 − 2,5)²+ (4 − 4)²+

(3 − 3)²+ (2 − 3)²+ (4 − 4)²+ (2,5 − 3)²+ (3,5 − 4)² 𝑑(1,1) = 3,278719262151

Setelah dilakukan perhitungan euclidean distance dengan seluruh data uji, hasilnya dapat dilihat pada Tabel 3.9.

Tabel 3.9 Hasil Perhitungan Euclidean Distance

NO NIM Nilai ED KK TA

1 2016-1 3,278719 RPLSI

2 2016-2 2,397916 RPLSI

3 2016-3 2,645751 KSP

4 2016-4 3,041381 AIDE

5 2016-5 5,024938 AIDE

6 2016-6 4,242641 RPLSI

7 2016-7 2,061553 AIDE

8 2016-8 2,95804 AIDE

9 2016-9 5,700877 RPLSI

10 2016-10 5,567764 KSP

11 2016-11 3,708099 RPLSI

12 2016-12 2,95804 AIDE

13 2016-13 4,898979 KSP

14 2016-14 3,840573 KSP

3.3.1.2 Mengurutkan Euclidean Distance

Setelah mengetahui jarak antar kedekatan data uji dan data latih, hal selanjutnya yang dilakukan yaitu mengurutkan nilai euclidean distance dari yang terkecil. Kedekatan jarak ini akan berpengaruh pada pengambilan data latih terdekat sebanyak nilai k. Hasil urutan nilai euclidean distance dapat dilihat pada Tabel 3.10.

(9)

23

Tabel 3.10 Urutan nilai euclidean distance data uji terhadap data latih NO NIM NILAI ED KK TA

1 2016-7 2,061553 AIDE 2 2016-2 2,397916 RPLSI 3 2016-3 2,645751 KASPER 4 2016-8 2,95804 AIDE 5 2016-12 2,95804 AIDE 6 2016-4 3,041381 AIDE 7 2016-1 3,278719 RPLSI 8 2016-11 3,708099 RPLSI 9 2016-14 3,840573 KASPER 10 2016-6 4,242641 AIDE 11 2016-13 4,898979 KASPER 12 2016-5 5,024938 AIDE 13 2016-10 5,567764 KASPER 14 2016-9 5,700877 RPLSI

3.3.1.3 Mengambil Data Latih Sesuai Nilai K

Nilai euclidean distance yang telah diurutkan dari jarak terdekat akan berpengaruh pada pengambilan data latih sebanyak nilai k yang telah ditentutkan.

Pada contoh ini k yang digunakan adalah 5, maka pada Tabel 3.11 merupakan kelima data latih yang memiliki jarak terdekat dengan data uji.

Tabel 3.11 Euclidean distance terdekat k=5

No NIM NILAI ED KK TA

1 2016-7 2,061553 1

2 2016-2 2,397916 3

3 2016-3 2,645751 2

4 2016-8 2,95804 1

5 2016-12 2,95804 1

Pada metode K-Nearest Neighbor yang biasa hasil prediksi label kelas ditentukan melalui label kelas paling dominan pada data terdekat sebanyak nilai k.

Misalnya melalui tabel 3.11 dapat diketahui bahwa kelompok keilmuan 1 atau Artificial Intelegence dan Data Engineering (AIDE) merupakan label dominan pada kelima data terdekat. Berbeda dengan Improved K-Nearest Neighbor dimana untuk menentukan label data uji akan dilakukan perhitungan nilai voting terhadap atribut data.

(10)

24 3.3.1.4 Menentukan Nilai Bobot

Dalam menentukan nilai bobot untuk setiap kelompok keilmuan dari sebuah data uji, pada penelitian ini peneliti menggunakan cara menghitung nilai IPK pada setiap kelompok keilmuan. Perhitungan IPK suatu kelompok keilmuan dilakukan dengan cara mengelompokkan mata kuliah yang sesuai dengan kode kelompok keilmuan yang telah ditentukan oleh prodi. Berikut ini merupakan contoh perhitungannya :

a. Nilai bobot untuk kelas/label kelompok keilmuan AIDE 𝑚₁ = ∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝐵𝑅𝐷_𝑡

𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆

𝑚₁ = (3𝑥3) + (4𝑥3) + (3𝑥2,5) + (3𝑥4) + (3𝑥2) + (3𝑥3,5) + (3𝑥2) 22

𝑚₁ = 63

22= 2,86

b. Nilai bobot untuk kelas kelompok keilmuan KSP 𝑚₂ =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝑆𝑃_𝑡

𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆

𝑚₂ = (3𝑥2) + (3𝑥4) + (4𝑥3,5) + (3𝑥4) + (4𝑥4) + (3𝑥4) + (3𝑥4) 23

𝑚₂ = 84

23= 3,65

c. Nilai bobot untuk kelas kelompok keilmuan RPLSI

𝑚₃ =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝑅𝑃𝐿𝑆𝐼_𝑡 𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆

𝑚₃ = = (2𝑥3) + (2𝑥2,5) + (2𝑥3,5) 6

𝑚₃ = 18 6 = 3

(11)

25 3.3.1.5 Menghitung Koefisien Korelasi

Untuk menemukan nilai voting, terlebih dahulu menentukan nilai koefisien korelasi (𝑘_𝑡𝑖) dari data latih terhadap data uji [3]. Adapun rumus mencari koefisien korelasi yaitu 𝑘_𝑡𝑖 = ^∑^𝑖=1

𝑛 (𝑥_𝑖−𝑥̅)(𝑦−𝑦̅)

√Σ_𝑖=1^𝑛 (𝑥_𝑖−𝑥̅)²(𝑦−𝑦̅)²

. Proses perhitungan koefisien korelasi akan dibagi menjad menjadi dua bagian, dimana yang pertama menemukan nilai dari

∑_𝑖=1^𝑛 (𝑥_𝑖 − 𝑥̅)(𝑦 − 𝑦̅) dan yang kedua √Σ_𝑖=1^𝑛 (𝑥_𝑖 − 𝑥̅)²(𝑦 − 𝑦̅)².

Pada bagian pertama proses awal yang dilakukan yaitu menentukan nilai rata-rata dari setiap atribut data latih ditambah data yang diuji. Misalnya untuk menemukan rata-rata nilai atribut dari PTI pada data yang diuji adalah sebagai berikut

𝑥𝑃𝑇𝐼̅̅̅̅̅̅̅ =𝑑𝑎𝑡𝑎1 + 𝑑𝑎𝑡𝑎2 + ⋯ + 𝑑𝑎𝑡𝑎14 + 𝑑𝑎𝑡𝑎𝑢𝑗𝑖 𝑡𝑜𝑡𝑎𝑙𝑑𝑎𝑡𝑎

𝑥𝑃𝑇𝐼̅̅̅̅̅̅̅ = (1+3,5+2+2+1+1+2+2,5+1+1+1+2+1+2+2)

15 = 1,66666666666667

Pada Tabel 3.12 merupakan hasil perhitungan nilai rata-rata dari setiap atribut.

Tabel 3.12 Nilai rata-rata pada setiap atribut

NO PTI Daspro MRV MD TBFO ASD OAK SA

1 1 2 3 3 3 2,5 3,5 3,5

2 3,5 3,5 3 4 3,5 4 4 4

3 2 2,5 2,5 3 4 3,5 4 4

4 2 4 3 3 3 2,5 4 3

5 1 1 2 2 3 2,5 3 2

6 1 1 3,5 3 4 2,5 4 4

7 2 3 2 2,5 2,5 2,5 4 3,5

8 2,5 4 3 3,5 4 4 4 4

9 1 2 2,5 2 2 2 2 1

10 1 1 2 2 1 2,5 2 2,5

11 1 3 3 2,5 2,5 3,5 3 2,5

12 2 3 3 3,5 2 3,5 3,5 3,5

13 1 2,5 3 3 2 2 2 2

14 2 2,5 3 3,5 3 2,5 4 3

15 2 4 3 3 2,5 3,5 4 4

X̅ 1,667 2,6 2,767 2,9 2,8 2,9 3,4 3,1

(12)

26

Tabel 3.13 Nilai rata-rata pada setiap atribut (lanjutan)

PS BD PBO SO DRPL IB JK IMK SI

2 3 2,5 4 3 3 4 3 4

2,5 3,5 4 4 3 2,5 4 3 4

2,5 4 3,5 3,5 2 2 3,5 2,5 3,5

2 2,5 2,5 3 2,5 2,5 3 3,5 4

2 2,5 2,5 2,5 2,5 2 3 3 3,5

2 3 2,5 4 2,5 3 3,5 3 4

2 3,5 4 4 2,5 2 4 2 4

3,5 4 4 4 4 3 4 3,5 4

2 2 2 2,5 3,5 2 3 2,5 2,5

2 2 2,5 2,5 2,5 2 2,5 2,5 3

3 2,5 2 3 2,5 2 4 3,5 3,5

3 3,5 3 3 2,5 3 4 4 4

1 2,5 2 3 2,5 1 3 3,5 3,5

3,5 2 2,5 2,5 2 2 4 2,5 3,5

2 3,5 4 4 3 2 4 2,5 3,5

2,333 2,933 2,9 3,3 2,7 2,267 3,567 2,967 3,633

Setelah menemukan nilai rata-rata pada setiap atribut, tahapan selanjutnya menghitung selisih antara setiap nilai dari data suatu atribut dengan nilai rata- ratanya. Misalnya pada atribut PTI untuk menemukan selisih pada data pertama yaitu sebagai berikut

𝑃𝑇𝐼₁ − 𝑥𝑃𝑇𝐼̅̅̅̅̅̅̅ = 1 − 1,667 = −0,667

Tabel 3.14 merupakan nilai selisih antara data setiap atribut dengan nilai rata- ratanya.

Tabel 3.14 Hasil selisih data atribut dengan nilai rata-rata

NO PTI-x̅ Dp-x̅ MRV-

x̅ MD-x̅ TBFO-x̅ ASD-x̅ OAK-x̅ SA-x̅

1 -0,67 -0,6 0,233 0,1 0,2 -0,4 0,1 0,4

2 1,833 0,9 0,233 1,1 0,7 1,1 0,6 0,9

3 0,333 -0,1 -0,27 0,1 1,2 0,6 0,6 0,9

4 0,333 1,4 0,233 0,1 0,2 -0,4 0,6 -0,1

... ... ... ... ... ... ... ... ...

15 0,333 1,4 0,233 0,1 -0,3 0,6 0,6 0,9

(13)

27

Tabel 3.15 Hasil selisih nilai atribut dengan nilai rata-rata (lanjutan)

PS-x̅ BD-x̅ PBO-x̅ SO-x̅ DRPL-x̅ IB-x̅ JK-x̅ IMK-x̅ SI-x̅ -0,33 0,067 -0,4 0,7 0,3 0,733 0,433 0,033 0,367 0,167 0,567 1,1 0,7 0,3 0,233 0,433 0,033 0,367 0,167 1,067 0,6 0,2 -0,7 -0,27 -0,07 -0,47 -0,13 -0,33 -0,43 -0,4 -0,3 -0,2 0,233 -0,57 0,533 0,367

... ... ... ... ... ... ... ... ...

-0,33 0,567 1,1 0,7

0,3 -0,27 0,433 -0,47 -0,13

Tahapan selanjutnya setelah menemukan nilai selisih dari data setiap atribut yaitu melakukan perkalian nilai selisih pada setiap atribut. Berikut ini merupakan contoh perkalian pada data pertama dari Tabel 3.15. Kemudian hasil perkalian seluruh data dapat dilihat pada Tabel 3.16.

(𝑃𝑇𝐼 − 𝑥̅)𝑥(𝐴𝑃2 − 𝑥̅)𝑥(𝑀𝑅𝑉 − 𝑥̅)𝑥(… )𝑥(𝐽𝐾 − 𝑥̅)𝑥(𝐼𝑀𝐾 − 𝑥̅)𝑥(𝑆𝐼 − 𝑥̅)

= (−0,67)𝑥(−0,6)𝑥(0,23)𝑥(… )𝑥(0,43)𝑥(0,033)𝑥(0,367)

= 2,16535E − 10

Tabel 3.16 Hasil perkalian dari atribut (𝑷𝑻𝑰 − 𝒙̅)𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)

No (PTI-x̅)x(… )x(SI-x̅)

1 -2,16535E-10

2 4,74761E-06

3 -5,70891E-09

4 4,68502E-09

5 -1,60848E-07

6 -1,50765E-08

7 1,40302E-06

8 0,009012511

9 0,002910381

10 -0,000745112

11 -1,37829E-07

12 -9,78118E-08

13 2,74676E-06

14 3,9284E-08

15 -3,32051E-07

JMLH 0,011185972

Pada bagian kedua yaitu melakukan pemangkatan untuk hasil selisih data atribut dengan nilai rata-rata (Tabel 3.14). Adapun contoh perhitungannya yaitu

(14)

28

sebagai berikut (𝑷𝑻𝑰_𝟏− 𝒙̅)² = (−0,67)²= 0,4489. Pada Tabel 3.17 merupakan hasil selisih data atribut dipangkatkan dua.

Tabel 3.17 Hasil selisih data atribut dengan rata-rata dipangkatkan dua

NO (PTI-x̅)² (Dp-x̅)² (MRV-x̅)² (MD-x̅)² (TBFO-x̅)² (ASD-x̅)² (OAK-x̅)² (SA-x̅)² (PS-x̅)²

1 0,445 0,360 0,054 0,010 0,040 0,160 0,010 0,160 0,111

2 3,349 0,810 0,054 1,210 0,490 1,210 0,360 0,810 0,028

3 0,109 0,010 0,071 0,010 1,440 0,360 0,360 0,810 0,028

4 0,111 1,960 0,054 0,010 0,040 0,160 0,360 0,010 0,111

... ... ... ... ... ... ... ... ... ...

11 0,444 0,160 0,054 0,160 0,090 0,360 0,160 0,360 0,444

12 0,111 0,160 0,054 0,360 0,640 0,360 0,010 0,160 0,444

13 0,444 0,010 0,054 0,010 0,640 0,810 1,960 1,210 1,778

14 0,111 0,010 0,054 0,360 0,040 0,160 0,360 0,010 1,361

15 0,111 1,960 0,054 0,010 0,090 0,360 0,360 0,810 0,111

Tabel 3.18 Hasil selisih data atribut dengan rata-rata dipangkatkan dua (lanjutan) (BD-x̅)² (PBO-x̅)² (SO-x̅)² (DRPL-x̅)² (IB-x̅)² (JK-x̅)² (IMK-x̅)² (SI-x̅)²

0,004 0,160 0,490 0,090 0,538 0,188 0,001 0,134 0,321 1,210 0,490 0,090 0,054 0,188 0,001 0,134 1,138 0,360 0,040 0,490 0,071 0,004 0,218 0,018 0,188 0,160 0,090 0,040 0,054 0,321 0,284 0,134

... ... ... ... ... ... ... ...

0,188 0,810 0,090 0,040 0,071 0,188 0,284 0,018 0,321 0,010 0,090 0,040 0,538 0,188 1,068 0,134 0,188 0,810 0,090 0,040 1,604 0,321 0,284 0,018 0,871 0,160 0,640 0,490 0,071 0,188 0,218 0,018 0,321 1,210 0,490 0,090 0,071 0,188 0,218 0,018

Setelah hasil pemangkatan ditemukan, selanjutnya yaitu mengkalikan data hasil pemangkatan antar setiap atribut. Adapun contoh proses yang dimaksud adalah sebagai berikut

(𝑷𝑻𝑰 − 𝒙̅)^𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)^𝟐= 0,445 x … x 0,134 = 4,69341E − 20

Pada Tabel 3.19 merupakan hasil perkalian dari selisih atribut yang telah dipangkatkan.

Tabel 3.19 Hasil perkalian dari (𝑷𝑻𝑰 − 𝒙̅)^𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)^𝟐 No (PTI-x̅)²x(… )x(SI-x̅)²

1 4,69341E-20

2 2,24579E-11

(15)

29

Tabel 3.20 Hasil perkalian dari (𝑷𝑻𝑰 − 𝒙̅)^𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)^𝟐 (lanjutan) No (𝑷𝑻𝑰 − 𝒙̅)^𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)^𝟐

3 3,19431E-17

4 2,19494E-17

5 2,5872E-14

6 2,27301E-16

7 1,96847E-12

8 8,12253E-05

9 8,47032E-06

10 5,55192E-07

11 1,8997E-14

12 9,56714E-15

13 7,54469E-12

14 1,54323E-15

15 1,10258E-13

Jumlah 9,02509E-05

Setelah mendapatkan hasil pada bagian pertama (Tabel 3.16) dan bagian kedua (Tabel 3.20), nilai koefisien korelasi dapat dihitung dengan sebagai berikut : 𝑘_𝑡1 = ∑_𝑖=1¹⁵ (𝑷𝑻𝑰 − 𝒙̅)𝒙(… )𝒙(𝑺𝑰 − 𝒙̅)

√Σ_𝑖=1¹⁵ (𝑷𝑻𝑰 − 𝒙̅)^𝟐𝒙(…)𝒙(𝑺𝑰 − 𝒙̅)^𝟐 𝑘_𝑡1 = −3,0948E − 37

√9,57776E − 74 𝑘_𝑡1 =−1

Berdasarkan contoh hasil perhitungan koefisien korelasi (𝑘_𝑡𝑖) pada data uji t dengan data latih yang memiliki label AIDE (𝑘_𝑡1) , maka nilai 𝑘_𝑡1 yang digunakan untuk perhitungan nilai voting terhadap data yang diujikan adalah -1.

3.3.1.6 Menghitung Nilai Voting

Nilai voting (𝑉_𝑡→𝑖) dihitung dengan cara sebagai berikut (𝑉_𝑡→𝑖) = ∑𝑐𝑙𝑎𝑠𝑠(𝑗)=𝑖

𝑚𝑖 𝑥 𝑘𝑡𝑖 𝑑_𝑡𝑗²

Pada data pertama berdasarkan Tabel 3.11, untuk menemukan nilai (𝑉_𝑡→1) atau nilai voting nilai voting KK AIDE yaitu sebagai berikut:

𝑚₁= 2,86 𝑘_𝑡1= -1

(16)

30 𝑑_𝑡1² = 2,061553²

𝑑_𝑡4² = 2,95804² 𝑑_𝑡5² = 2,95804² (𝑉_𝑡→1) = ^2,86𝑥−1

2,061553²+ ^2,86𝑥−1

2,95804²+ ^2,86𝑥−1

2,95804² = -1,328342246

Untuk menemukan nilai (𝑉_𝑡→2) atau nilai voting KK KSP diketahui 𝑚₂ = 3,65

𝑘_𝑡2= -1

𝑑_𝑡𝑗²= 2,645751² (𝑉_𝑡→2) = ^3,65𝑥−1

2,645751² =-0,52173913

Untuk menemukan nilai (𝑉_𝑡→3) atau nilai voting KK RPLSI diketahui 𝑚₃ = 3

𝑘_𝑡3= 1

𝑑_𝑡𝑗²= 2,397916² (𝑉_𝑡→3) = ^3𝑥1

2,397916² = 0,52173913

3.3.1.7 Menentukan Hasil Prediksi Data Uji

Hasil prediksi dari data uji, ditentukan nilai maksimum dari perhitungan nilai voting. Hal ini karena nilai voting merupakan refleksi hubungan antara data uji dengan label data latih. Berikut ini merupakan contoh untuk menentukan hasil prediksi :

(𝑉_𝑡→1) = −1,328342246 (𝑉_𝑡→2) = −0,52173913 (𝑉_𝑡→3) = 0,52173913

𝐶𝑙𝑎𝑠𝑠(𝑡) = max{−1,328342246 , −0,52173913, 0,52173913}= 0,52173913 Berdasarkan contoh tersebut diketahui bahwa nilai maksimum dari nilai voting yaitu 0,52173913 yang merupakan hasil dari (𝑉_𝑡→3). Jadi hasil prediksi label dari data uji tersebut adalah 3 atau Rekayasa Perangkat Lunak dan Sistem Informasi (RPLSI).

(17)

31

3.3.2 Implementasi Metode Improved k-Nearest Neighbor (KNN+) Pada tahap implementasi yaitu dimana sistem akan dibangun dari tahapan perancangan. Implementasi program dalam penelitian ini menggunakan bahasa pemrograman PHP dan MySQLi, dimana proses manualisasi data menggunakan microsoft excel.

Perancangan Pengujian

Rancangan pengujian pada penelitian ini menggunakan metode leave one out cross validation (LOOCV) yang terdiri dari pengujian perbedaan nilai K pada dataset yang digunakan, pengujian seleksi atribut, dan membandingkan hasil pengujian seleksi atribut antara metode KNN+ dan KNN. Tujuan dari pengujian ini untuk mengevaluasi kemampuan metode KNN+ dalam melakukan prediksi kelompok keilmuan.

3.4.1 Pengujian Perbedaan Nilai K

Kinerja metode Improved K-Nearest Neighbor (KNN+) dipengaruhi oleh nilai K atau nilai ketetanggaan. Oleh sebab itu, pada pengujian ini akan dilakukan pengujian terhadap nilai K dengan rentan 1 sampai 20.

3.4.2 Pengujian Seleksi Atribut

Pengujian ini bertujuan untuk memperbaiki atau meningkatkan kemampuan sistem dengan cara menghapus atribut-atribut yang tidak relevan dalam proses klasifikasi. Adapun teknik seleksi atribut yang digunakan dalam penelitian ini yaitu information gain, dimana proses perhitungannya dilakukan dengan perangkat lunak Weka.

3.4.3 Pengujian Model Dataset untuk Memprediksi KK Tugas Akhir Pada pengujian ini model dataset yang berisi kelompok keilmuan, nilai mata kuliah wajib mahasiswa, dan mata kuliah pilihan pendukung tugas akhir akan diujikan dengan beberapa data uji yang berisi nilai mata kuliah wajib mahasiswa serta riwayat mata kuliah pilihan yang pernah diambil mahasiswa. Pengujian ini bertujuan untuk mengetahui bagaimana hasil klasifikasi kelompok keilmuan tugas akhir mahasiswa terhadap hasil klasifikasi sistem.