• Tidak ada hasil yang ditemukan

SISTEM PENENTUAN PENERIMA BEASISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DAN VIŠEKRITERIJUMSKO KOMPROMISNO RANGIRANJE (VIKOR) SKRIPSI

N/A
N/A
Protected

Academic year: 2022

Membagikan "SISTEM PENENTUAN PENERIMA BEASISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DAN VIŠEKRITERIJUMSKO KOMPROMISNO RANGIRANJE (VIKOR) SKRIPSI"

Copied!
70
0
0

Teks penuh

(1)

SISTEM PENENTUAN PENERIMA BEASISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DAN VIŠEKRITERIJUMSKO

KOMPROMISNO RANGIRANJE (VIKOR)

SKRIPSI

VARUNA DEWI 141402089

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2018

(2)

SISTEM PENENTUAN PENERIMA BEASISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DAN VIŠEKRITERIJUMSKO KOMPROMISNO

RANGIRANJE (VIKOR)

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

VARUNA DEWI 141402089

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2018

(3)

iii

(4)

PERNYATAAN

SISTEM PENENTUAN PENERIMA BEASISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DAN VIŠEKRITERIJUMSKO KOMPROMISNO

RANGIRANJE (VIKOR)

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, Juli 2018

Varuna Dewi 141402089

(5)

UCAPAN TERIMAKASIH

Puji dan syukur kehadirat Tuhan yang Maha Esa, karena rahmat dan izin-Nya Penulis dapat menyelesaikan penyusunan skripsi ini, sebagai syarat untuk memperoleh gelar Sarjana Komputer, pada Program Studi S1 Teknologi Informasi Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.

Skripsi ini penulis persembahkan kepada kedua orangtua penulis, Ibu Wanitha Dewi dan Ayah Wamanen yang selalu memberikan doa, dukungan dan kasih sayang kepada penulis. Terima kasih penulis ucapkan kepada kakak penulis Laxhmi Mahesvary Sharojini Naidu, ST dan adik penulis Maharani Fatmawathy Naidu yang selalu memberikan doa dan dukungan semangat dalam pengerjaan skripsi ini.

Penulis menyadari bahwa penelitian ini tidak akan terwujud tanpa bantuan banyak pihak. Dengan kerendahan hati, penulis ingin menyampaikan ucapan terima kasih kepada:

1. Bapak Prof. Dr. Opim Salim Sitompul, M.Sc selaku Dekan Fasilkom-TI Universitas Sumatera Utara.

2. Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc selaku Ketua Program Studi S1 Teknologi Informasi Universitas Sumatera Utara.

3. Bapak Baihaqi Siregar, S.Si, MT. selaku Dosen Pembimbing I yang telah memberikan bimbingan dan saran kepada penulis.

4. Bapak Seniman, S.Kom, M.Kom selaku Dosen Pembimbing II yang telah memberikan bimbingan dan saran kepada penulis.

5. Ibu Sarah Purnamawati, ST., M.Sc selaku Dosen Pembanding I yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.

6. Bapak Indra Aulia, S.TI., M.Kom selaku Dosen Pembanding II yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.

7. Sahabat tersayang Sity Ayu Novarina Suyanto, Victoria Tambunan, Hetly Saint Kartika, Afzalurrahmah, Aggie Wicita Riny Riady, Zurwatus Saniyah, dan Cindy Pakpahan yang selalu memberikan dukungan dan motivasi.

v

(6)

8. Sahabat seperjuangan pengerjaan skripsi Santa C. Hutabarat yang selalu memberikan motivasi dan Kakak Novira Naili Ulya Siregar yang sudah banyak membantu dalam proses pengerjaan skripsi.

9. Teman-teman seperjuangan dari Teknologi Informasi USU angkatan 2014 yang selalu memberikan dukungan dan motivasi.

10. Teman-teman pengurus HIMATIF periode 2016/2017 dan periode 2017/2018.

11. Teman-teman seperjuangan dari Paguyuban Karya Salemba Empat USU periode 2016/2017 dan periode 2017/2018.

12. Yayasan Karya Salemba Empat dan donatur beasiswa penulis, PT. Perusahaan Gas Negara.

13. Semua pihak-pihak yang telah membantu penulis secara langsung dan tidak langsung, yang tidak dapat penulis sebutkan satu persatu yang telah membantu penyelesaian skripsi ini.

Semoga Tuhan yang Maha Esa melimpahkan nikmat dan karunia kepada semua pihak yang telah memberikan bantuan, perhatian serta dukungan kepada penulis dalam menyelesaikan skripsi ini.

Medan, Juli 2018

Penulis

(7)

ABSTRAK

Setiap warga negara berhak mendapat pendidikan, namun banyak warga negara yang tidak dapat melanjutkan pendidikan karena keterbatasan yang mereka miliki. Salah satu cara untuk mengurangi masalah tersebut adalah diberikannya beasiswa. Terdapat beberapa jenis program beasiswa kepada mahasiswa berprestasi dan memerlukan bantuan ekonomi dalam menyelesaikan kuliahnya, oleh sebab itu dibutuhkan suatu sistem yang mampu mengelompokkan keadaan pendaftar beasiswa lalu dirangkingkan untuk prioritas dalam mendapatkan program beasiswa. Untuk pengelompokkan digunakan metode k-means clustering yang mempunyai beberapa kriteria yaitu jumlah penghasilan orangtua, tagihan PLN dan tagihan PDAM. Lalu pada perengkingan digunakan salah satu dari metode multi attribute decision making yaitu VIšekriterijumsko KOmpromisno Rangiranje (VIKOR).

Kriteria yang digunakan dalam perangkingan adalah jumlah penghasilan orangtua. Dari hasil pengujian terhadap 21.614 data pendaftar beasiswa, dihasilkan 3 cluster yaitu 13.423 pendaftar pada cluster 1 yang artinya tidak layak mendapatkan beasiswa, 7.030 pendaftar pada cluster 2 yang artinya direkomendasi mendapatkan beasiswa, dan 1.161 pendaftar pada cluster 3 yang artinya layak mendapatkan beasiswa.

Kata kunci: beasiswa, multi attribute decision making, k-means clustering, VIšekriterijumsko KOmpromisno Rangiranje.

vii

(8)

DETERMINATION SYSTEM FOR SCHOLARSHIP FELLOW BY USING K-MEANS CLUSTERING METHOD AND

VIŠEKRITERIJUMSKO KOMPROMISNO RANGIRANJE (VIKOR).

ABSTRACT

Every citizen has the right to get education, nevertheless many of the citizen cannot continue their education to the higher level because of their financial inability. One of the ways to overcome this problem is by giving scholarship. There are many kind of scholarship given to the prestigious students and in need of financial aid to finish their education, so that a system is needed for clustering the scholarship applicants condition and then ranked for priority to get scholarship. For clustering the k-means clustering method is used which has some criterias they are parent income, electricity bill and water bill. And then in ranking one of the multi attribute decision making method is used that is VIKOR.

The criteria used in ranking is parent income. From the result of 21.614 scholarship applicant data testing, 3 clusters come out they are 13.423 applicants in cluster 1 which means cannot get scholarship, 7.030 applicants in second cluster which means recommended to get scholarship, and 1.161 applicants from cluster 3 which means are fit to get scholarship.

Keyword: scholarship, multi attribute decision making, k-means clustering, VIšekriterijumsko KOmpromisno Rangiranje.

(9)

DAFTAR ISI

PERSETUJUAN iii

PERNYATAAN iv

UCAPAN TERIMA KASIH v

ABSTRAK vii

ABSTRACT viii

DAFTAR ISI ix

DAFTAR TABEL xii

DAFTAR GAMBAR xiii

BAB 1 PENDAHULUAN

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Batasan Masalah 3

1.4 Tujuan Penelitian 3

1.5 Manfaat Penelitian 4

1.6 Metodologi Penelitian 4

1.7 Sistematika Penulisan 5

BAB 2 LANDASAN TEORI

2.1 Beasiswa 7

2.2 Data Mining 8

2.3 Clustering 10

2.4 Algoritma K-Means 10

2.5 Multi Criteria Decision Making (MCDM) 12

ix

(10)

2.7 Penelitian Terdahulu 15

BAB 3 ANALISIS DAN PERANCANGAN

3.1 Data yang Digunakan 18

3.2 Arsitektur Umum 18

3.3 Analisis Clustering K-Means 21

3.3.1 Menentukan Jumlah Cluster 21

3.3.2 Menentukan Pusat Cluster (centroid) 21 3.3.3 Hitung Jarak Data dengan Rumus Euclidean Distance 21 3.3.4 Kelompokkan Data pada Cluster Terdekat 23

3.3.5 Hasil Clustering 23

3.4 Analisis VIKOR 25

3.4.1 Membuat Matriks Keputusan Ternormalisasi 25 3.4.2 Menentukan Solusi Ideal & Ideal Negatif 27

3.4.3 Menghitung Utility Measures 27

3.4.4 Menghitung Indeks VIKOR 29

3.4.5 Perangkingan Alternatif 30

3.4.6 Usulan Solusi Kompromi 31

3.5 Perancangan Sistem 33

3.5.1 Perancangan flowchart 33

3.5.1.1 Flowchart Clustering K-Means 33

3.5.1.2 Flowchart VIKOR 34

3.5.1.3 Diagram Aktivitas 35

3.5.1.4 Diagram Use Case 36

3.5.1.5 Sequence Diagram 37

3.5.2 Rancangan tampilan antarmuka pengguna 38 BAB 4 IMPLEMENTASI DAN PENGUJIAN

4.1 Implementasi Sistem 41

(11)

4.1.1 Spesifikasi Perangkat Keras & Lunak 41 4.1.2 Implementasi Coding Program 42

4.1.2.1 Main.java 42

4.1.2.2 Const.java 42

4.1.2.3 Cluster.java 43

4.1.3 Implementasi Perancangan Antarmuka 43 4.1.3.1 Halaman Specification 43

4.1.3.2 Halaman About 44

4.1.3.3 Halaman Performance 45

4.1.3.4 Halaman Data 45

4.1.3.5 Proses VIKOR 46

4.2 Pengujian Sistem 46

4.2.1 Ilustrasi Data 47 4.2.2 Hasil Clustering 47

4.2.3 Hasil VIKOR 49

4.2.4 Validasi Hasil Akhir 51

BAB 5 KESIMPULAN DAN SARAN

5.1 Kesimpulan 52

5.2 Saran 53

DAFTAR PUSTAKA 54

xi

(12)

DAFTAR TABEL

Halaman

Tabel 2.1. Penelitian Terdahulu 17

Tabel 3.1. Pusat Cluster Iterasi 1 22

Tabel 3.2. Hasil Cluster iterasi 1 23

Table 3.3. Hasil Cluster Pertama 23

Table 3.4. Hasil Cluster Kedua 24

Tabel 3.5. Hasil Cluster Ketiga 24

Tabel 3.6. Data Kriteria Cluster 3 25

Tabel 3.7. Hasil Normalisasi Matriks 27

Tabel 3.8. Hasil Si, dan Ri 29

Tabel 3.9. Hasil Qi 30

Tabel 3.10. Hasil Pengurutan Si, Ri dan Qi 31

Tabel 3.11. Hasil Akhir Perengkingan Cluster Layak 32

Tabel 3.12. Diagram Aktivitas 35

Tabel 4.1 Hasil Perankingan VIKOR 49

Tabel 4.2 Perbandingan Hasil Akhir 51

(13)

DAFTAR GAMBAR

Halaman

Gambar 2.1. Bidang Ilmu Data Mining 8

Gambar 2.2. Tahapan Data Mining 10

Gambar 3.1. Arsitektur Umum 20

Gambar 3.2. Flowchart Clustering K-Means 33

Gambar 3.3. Flowchart VIKOR 34

Gambar 3.4. Use Case Diagram 36

Gambar 3.5. Sequence Diagram 37

Gambar 3.6. Rancangan Halaman Specification 38

Gambar 3.7. Rancangan Halaman Performance 39

Gambar 3.8. Rancangan Halaman About 39

Gambar 3.9. Rancangan Halaman Data 40

Gambar 3.10. Rancangan Halaman VIKOR Analyze 40

Gambar 4.1. Coding Main.java 42

Gambar 4.2. Coding Const.java 42

Gambar 4.3. Coding Cluster.java 43

Gambar 4.4. Tampilan Spesification 44

Gambar 4.5. Tampilan About 44

Gambar 4.6. Tampilan Performance 45

xiii

(14)

Gambar 4.7. Tampilan Data 45

Gambar 4.8. Proses VIKOR 46

Gambar 4.9. Data numerik .arff 47

Gambar 4.10. Cluster 1 48

Gambar 4.11. Cluster 2 48

Gambar 4.12. Cluster 3 49

Gambar 4.13. Hasil Akhir Penerima Beasiswa 50

(15)

BAB 1

PENDAHULUAN

1.1. Latar Belakang

Pendidikan bagi manusia merupakan kebutuhan mutlak yang harus dipenuhi sepanjang hayat. Pendidikan merupakan usaha agar manusia dapat mengembangkan potensi dirinya melalui proses pembelajaran dan/ cara lain yang dikenal dan diakui oleh masyarakat. Undang-Undang Dasar Negara Republik Indonesia Tahun 1945 pasal 31 ayat (1) menyebutkan bahwa setiap warga negara berhak mendapatkan pendidikan.

Namun pada kenyataannya, masih terdapat berbagai persoalan yang ada di dunia pendidikan di Indonesia. Mulai dari kurangnya tenaga pengajar, fasilitas yang kurang memadai, sampai kesulitan pembiayaan dan sudah lama menjadi wacana yang mewarnai dunia pendidikan. Adanya beasiswa merupakan salah satu jalan keluar dari permasalahan tersebut.

Menurut Kamus Besar Bahasa Indonesia, beasiswa adalah tunjangan yang diberikan kepada pelajar atau mahasiswa sebagai bantuan biaya belajar. Ada berbagai jenis beasiswa yang saat ini ditawarkan untuk mahasiswa. Kementrian Riset, Teknologi, Pendidikan Tinggi mencatat sedikitnya ada 23 beasiswa yang rutin ditawarkan tiap tahunnya kepada mahasiswa S1 dalam negeri.

Kriteria yang dibutuhkan untuk mendapatkan beasiswa pun bermacam-macam, seperti alasan kebutuhan beasiswa, keaktifan di organisasi dalam maupun luar kampus, prestasi serta IP dan IPK selama berkuliah.

(16)

Dalam melakukan seleksi beasiswa tentu akan mengalami kesulitan karena banyaknya yang mendaftar beasiswa dan banyaknya kriteria yang digunakan untuk menentukan keputusan penerima beasiswa yang sesuai dengan yang diharapkan. Untuk itu diperlukan suatu aplikasi sistem pendukung keputusan (SPK) yang dapat memperhitungkan segala kriteria yang mendukung pengambilan keputusan guna membantu, mempercepat dan mempermudah proses pengambilan keputusan dalam penentuan penerima beasiswa. Dari pengamatan masalah diatas, peneliti berkeinginan untuk membangun sistem yang mampu mengelompokkan yang mana menjadi prioritas untuk mendapatkan program beasiswa lalu merangkingnya, sehingga program beasiswa ini menyasar mahasiswa yang tepat mendapatkan beasiswa dengan cepat dan sesuai dengan anggaran.

Clustering adalah suatu metode pengelompokan berdasarkan ukuran kedekatan (kemiripan). Clustering berbeda dengan group, group berarti kelompok yang sama.

Cluster tidak harus selalu sama akan tetapi pengelompokannya berdasarkan pada kedekatan dari suatu karakteristik sample yang ada, salah satunya dengan menggunakan rumus jarak euclidean (Satriyanto, 2011).

Pada penelitian kali ini, penulis mengajukan metode K-Means Clustering yang telah digunakan pada beberapa penelitian seperti penentuan penerima beasiswa dengan kriteria berupa Indeks Prestasi Kumulatif (IPK), jumlah tanggungan keluarga, dan penghasilan total orang tua yang menghasilkan 3 cluster yaitu menerima, dipertimbangkan, dan tidak berhak menerima beasiswa (Hastuti, 2013). Selain itu penelitian lain yang dilakukan ialah untuk menilai kedisiplinan siswa di SMPN 21 Medan dengan clustering K-Means dan Analytical Hierarchy Process yang menghasilkan 4 cluster yaitu sangat disiplin, disiplin, cukup disiplin dan tidak disiplin (Bancin,2014).

Metode MADM digunakan untuk menyeleksi agar mendapatkan alternatif dari sejumlah alternatif. Metode MADM yang akan digunakan adalah VIšekriterijumsko KOmpromisno Rangiranje (VIKOR). VIKOR dapat digunakan untuk menyeleksi lebih

(17)

untuk seleksi penerima beasiswa dengan 4 kriteria yaitu indeks prestasi, semester, daya listrik dan jumlah tagihan listrik (Lengkong et al, 2015). Berdasarkan latar belakang di atas, maka penulis mengajukan proposal penelitian dengan judul “SISTEM

PENENTUAN PENERIMA BEASISWA MENGGUNAKAN METODE

CLUSTERING K-MEANS DAN VIŠEKRITERIJUMSKO KOMPROMISNO RANGIRANJE (VIKOR)”.

1.2. Rumusan Masalah

Permasalahan yang dihadapi adalah penentuan penerima beasiswa di Indonesia masih menggunakan cara manual sehingga perlu adanya sebuah aplikasi dengan mengimplementasikan metode K-Means Clustering dan VIKOR untuk menentukan kelulusan penerimaan beasiswa.

1.3. Batasan Masalah

Batasan masalah yang diberikan dalam penelitian ini adalah:

1. Data yang digunakan adalah data pendaftar Beasiswa Karya Salemba Empat tahun 2017.

2. Kriteria yang digunakan adalah:

A. Penghasilan Ayah

B. Penghasilan Ibu (jika ada) C. Tagihan PLN

D. Tagihan PDAM

3. Tidak mencakup syarat pendaftar beasiswa.

1.4. Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk membantu pemerintah atau yayasan beasiswa dalam mengelompokkan serta meranking data mahasiswa yang mendaftar beasiswa dengan menggunakan clustering K-Means dan VIKOR.

3

(18)

1.5. Manfaat Penelitian

Adapun manfaat penelitian ini diantara lain yaitu:

1. Membantu pemerintah dan yayasan beasiswa untuk menyalurkan bantuan beasiswa tepat sasaran serta memprioritaskan yang paling membutuhkan.

2. Memberi masukan untuk penelitian lain dalam bidang K-Means Clustering dan Multi Attribute Decision Making VIKOR

1.6. Metodologi Penelitian

Beberapa tahapan yang akan dilakukan pada penelitian ini adalah sebagai berikut:

1. Studi Literatur

Pada tahap ini dilakukan proses mengumpulkan bahan referensi mengenai program beasiswa, multi attribute decision making, K-Means clustering, dan VIKOR dari berbagai buku, jurnal, artikel, dan beberapa sumber referensi lainnya.

2. Analisis Permasalahan

Pada tahap ini dilakukan analisis terhadap berbagai referensi yang telah dikumpulkan untuk mendapatkan pemahaman mengenai K-Means clustering dan VIKOR untuk menyelesaikan masalah menentukan penerima beasiswa.

3. Perancangan

Pada tahap ini dilakukan perancangan arsitektur yang akan digunakan untuk pengumpulan data dan perancangan antar muka. Proses perancangan dilakukan berdasarkan hasil analisis terhadap studi literatur yang telah didapatkan dan dipahami.

4. Implementasi

Pada tahap ini dilakukan implementasi dari hasil analisis dan perancangan yang telah dilakukan ke dalam pembangunan kode program menggunakan Bahasa pemrograman Java.

(19)

5. Pengujian

Pada tahap ini dilakukan pengujian terhadap hasil yang didapatkan melalui impelementasi K-Means clustering dan VIKOR untuk menentukan penerima beasiswa serta memastikan sistem telah berjalan sesuai dengan yang diharapkan.

6. Penyusunan Laporan

Pada tahap ini dilakukan penyusunan laporan mengenai hasil analisis dan implementasi K-Means clustering dan VIKOR untuk menentukan beasiswa.

1.7. Sistematika Penulisan

Sitematika penulisan dari skripsi ini terdiri dari lima bagian utama sebagai berikut:

Bab 1: Pendahuluan

Bab ini berisi latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metodologi dan sistematika penulisan.

Bab 2: Landasan Teori

Bab ini berisi teori-teori yang digunakan untuk memahami permasalahan yang dibahas pada penelitian ini. Teori-teori yang berhubungan dengan beasiswa, data mining, clustering, k-means, multi attribute decision making, VIKOR.

Bab 3: Analisis dan Perancangan

Bab ini berisi tentang analisis dan penerapan K-Means clustering untuk pengelompokkan dan VIKOR untuk perangkingan penerima beasiswa serta perancangan seperti flowchart dan tampilan.

Bab 4: Implementasi dan Pengujian

Bab ini berisi pembahasan tentang implementasi dari analisis dan perancangan yang telah disusun pada Bab 3. Selain itu, pada bab ini juga dipaparkan hasil dari pengujian sistem yang telah dibangun.

5

(20)

Bab 5: Kesimpulan dan Saran

Bab ini berisi kesimpulan dari seluruh pembahasan pada bab-bab sebelumnya dan saran-saran yang disampaikan untuk pengembangan pada penelitian selanjutnya.

(21)

BAB 2

LANDASAN TEORI 2.1. Beasiswa

Beasiswa adalah pemberian berupa bantuan keuangan yang diberikan kepada perorangan, mahasiswa atau pelajar yang digunakan demi keberlangsungan pendidikan yang ditempuh. Beasiswa diartikan sebagai bentuk penghargaan yang diberikan kepada individu agar dapat melanjutkan pendidikan ke jenjang yang lebih tinggi (Murniasih, 2009).

Penghargaan itu dapat berupa akses tertentu pada suatu institusi atau penghargaan berupa bantuan keuangan. Pada dasarnya, beasiswa adalah penghasilan bagi yang menerimanya. Hal ini sesuai dengan ketentuan pasal 4 ayat (1) Undang-undang PPh/2000. Disebutkan pengertian penghasilan adalah tambahan kemampuan ekonomis dengan nama dan dalam bentuk apapun yang diterima atau diperoleh dari sumber Indonesia atau luar Indonesia yang dapat digunakan untuk konsumsi atau menambah kekayaan wajib pajak. Karena beasiswa bisa diartikan menambah kemampuan ekonomis bagi penerimanya, berarti beasiswa merupakan penghasilan.

Beasiswa dapat diberikan oleh Lembaga pemerintah, perusaahaan ataupun yayasan. Pemberian beasiswa dapat dikategorikan pada pemberian cuma-cuma ataupun pemberian dengan ikatan kerja (biasa disebut ikatan dinas) setelah selesainya pendidikan. Lama ikatan dinas ini berbeda-beda, tergantung pada lembaga yang memberikan beasiswa tersebut.

(22)

2.2. Data Mining

Data Mining adalah analisis meninjau sekumpulan data untuk menemukan suatu hubungan yang tidak diduga dan meringkas data secara berbeda dengan sebelumnya yang bermanfaat dan dipahami oleh pemilik data (Larose, 2005).

Data Mining mewarisi banyak aspek dan teknik dari berbagai bidang ilmu. Dari Gambar 2.1 menunjukkan bahwa data mining memiliki akar yang panjang dari bidang.

Gambar 2.1 Bidang Ilmu Data Mining (Pramudiono, 2006) Data Mining adalah bagian dari Knowledge Discovery in Database (KDD).

Knowledge Discovery in Database (KDD) adalah keseluruhan proses untuk mencari dan mengidentifikasi pola atau informasi data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. Secara garis besar proses KDD terdiri atas beberapa tahap (Fayyad, 1996).

1. Data Selection

Pemilihan (seleksi) data dilakukan dari suatu kumpulan data operasional, sebelum tahap penggalian informasi dalam KDD dimulai proses ini perlu

(23)

dilakukan. Data hasil seleksi disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing

Proses cleaning perlu dilakukan pada data yang menjadi fokus KDD sebelum proses data mining dapat dilakukan. Proses cleaning melingkupi antara lain membuang data yang memiliki duplikasi, data yang tidak konsisten diperiksa, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (typo), juga dilakukan proses enrichment, yaitu proses

“memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.

3. Transformation

Proses transformasi pada data yang telah dipilih adalah coding, sehingga sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining merupakan proses untuk mencari suatu pola atau informasi yang menarik dalam data yang terpilih dengan teknik atau metode tertentu.

Data mining memiliki teknik, metode, atau algoritma dalam sangat bervariasi. Pemilihan metode dan algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation/Evalution

Interpretation merupakan proses untuk menampilkan pola informasi yang dihasilkan dari proses data mining oleh pihak yang berkepentingan. Tahap ini meliputi pemeriksaan terhadap pola atau informasi yang ditemukan agar tidak bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

9

(24)

2.3. Clustering

Clustering adalah metode penganalisaan data untuk menemukan suatu kelompok- kelompok dari sekumpulan objek atau individu yang memiliki karakteristik yang sama. Clustering merupakan salah satu metode dalam data mining. Di dalam clustering terdapat dua pendekatan. Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan pendekatan hirarki (Oliveira et al, 2007). Clustering dengan pendekatan partisi (partition-based clustering) adalah mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster yang ada. Clustering dengan pendekatan hirarki (hierarchical clustering) adalah mengelompokkan data dengan membuat hirarki berupa dendogram yaitu data yang mirip ditempatkan pada hirarki yang berdekatan sedangkan yang tidak diletakkan para hirarki yang berjauhan.

3.4. Algoritma K-Means

K-Means merupakan salah satu metode data clustering non hirarki yang mempartisi

(25)

dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok lain sehingga data yang berada dalam satu cluster/kelompok memiliki tingkat variasi yang kecil (Agusta, 2007).

Menurut Sarwono (2011), algoritma k-means adalah sebagai berikut:

1. Menentukan k sebagai jumlah cluster yang ingin dibentuk.

2. Membangkitkan nilai random untuk pusat cluster awal (centroid) sebanyak k.

3. Menghitung jarak setiap data input terhadap masing-masing centroid menggunakan rumus jarak Eucledian (Eucledian Distance) hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid.

Berikut adalah persamaan Eucledian Distance:

(𝑥𝑖, 𝜇𝑗) = √(xi − μj)2… (2.1) dimana:

𝑥𝑖 : data kriteria

𝜇𝑗 : centroid pada cluster ke-j

4. Mengklasifikasikan setiap data berdasarkan kedekatannya dengan centroid (jarak terkecil).

5. Memperbaharui nilai centroid. Nilai centroid baru diperoleh dari rata- rata cluster yang bersangkutan dengan rumus:

𝜇(t+1)= 1

𝑁𝑠𝑗𝑗=𝑠𝑗𝑋j… (2.2) dimana:

𝜇(t+1) : centroid baru pada iterasi ke (t+1) Nsj : banyak data pada cluster Sj

11

(26)

6. Melakukan perulangan dari langkah 2 hingga 5 hingga anggota tiap cluster tidak ada yang berubah.

7. Jika langkah 6 telah terpenuhi, maka nilai pusat cluster (µj) pada iterasi terakhir akan digunakan sebagai parameter untuk menentukan klasifikasi data.

2.5. Multi Criteria Decision Making (MCDM)

Multi criteria decision making (MCDM) merupakan teknik pengambilan keputusan dari beberapa pilihan alternatif yang ada. Di dalam MCDM ini mengandung unsur atribut, obyektif, dan tujuan (Rahardjo et al, 2000).

 Atribut menerangkan, memberi ciri kepada suatu obyek.

Misalnya tinggi, panjang dan sebagainya.

 Obyektif menyatakan arah perbaikan atau kesukaan terhadap atribut, misalnya memaksimalkan umur, meminimalkan harga, dan sebagainya. Obyektif dapat pula berasal dari attribute yang menjadi suatu obyektif jika pada atribut tersebut diberi arah tertentu.

 Tujuan ditentukan terlebih dahulu. Misalnya suatu proyek mempunyai obyektif memaksimumkan profit, maka proyek tersebut mempunyai tujuan mencapai profit 10 juta/bulan.

Kriteria merupakan ukuran, aturan-aturan ataupun standar-standar yang memandu suatu pengambilan keputusan. Pengambilan keputusan dilakukan melalui pemilihan atau memformulasikan atribut-atribut, obyektif-obyektif, maupun tujuan-tujuan yang berbeda, maka atribut, obyektif maupun tujuan dianggap sebagai kriteria. Kriteria dibangun dari kebutuhan-kebutuhan dasar manusia serta nilai-nilai yang diinginkannya. Ada dua macam kategori dari multi criteria decision making (MCDM), yaitu:

1. Multiple Objective Decision Making (MODM) 2. Multiple Attribute Decision Making (MADM)

(27)

Multiple Objective Decision Making (MODM) menyangkut masalah perancangan (design), di mana teknik-teknik matematik optimasi digunakan, untuk jumlah alternatif yang sangat besar (sampai dengan tak berhingga) dan untuk menjawab pertanyaan apa (what) dan berapa banyak (how much).

Multiple Attribute Decision Making (MADM), menyangkut masalah pemilihan, di mana analisa matematis tidak terlalu banyak dibutuhkan atau dapat digunakan untuk pemilihan hanya terhadap sejumlah kecil alternatif saja. Metode Analytical Hierarchy Process (AHP), Simple Additive Weighting Method (SAW), Technique for Order by Similarity to Ideal Solution Method (TOPSIS), VIšekriterijumsko KOmpromisno Rangiranje (VIKOR) merupakan bagian dari teknik MADM.

2.6. VIšekriterijumsko KOmpromisno Rangiranje (VIKOR)

Metode VIšekriterijumsko KOmpromisno Rangiranje (VIKOR) dikembangkan untuk optimasi multikriteria dari sistem yang kompleks. VIKOR digunakan untuk menentukan daftar peringkat, solusi kompromi, dan bobot interval stabilitas. Untuk kestabilan preferensi solusi kompromi diperoleh dengan initial bobot. Metode VIKOR memiliki kelebihan pada proses pemeringkatan dengan memiliki nilai preferensi untuk pemeringkatan dan dapat mengatasi pemeringkatan banyak alternatif dengan lebih mudah. Serta memperkenalkan indeks berbasis indeks multikriteria pada ukuran khusus "kedekatan" dengan solusi "ideal" (Opricovic, 1998).

Prosedur perhitungan metode VIKOR menurut (Opricovic & Tzeng, 2004) dan (Zhang, et al., 2016) mengikuti tahap-tahap di bawah ini:

1. Menghitung normalisasi matrik keputusan

Perhitungan normalisasi matrik keputusan terhadap setiap data L mengikuti persamaan:

13

(28)

f

ij

=

𝐿𝑖𝑗

√∑𝑚𝑖=1𝐿2𝐼𝐽

(2.3)

Dimana i merupakan alternatif ke 1,2,3 hingga m, j merupakan alternatif ke 1,2,3 hingga n. Xij adalah nilai elemen dari setiap kriteria dan fij merupakan nilai hasil normalisasi. Akan diperoleh matrik F yang mengandung keseluruhan nilai elemen hasil normalisasi, ditunjukkan melalui persamaan

F = 𝐴1 𝐴2

⋮ 𝐴𝑚

[

𝐶𝑥1 𝐶𝑥2 … 𝐶𝑥𝑛 𝑥11 𝑥12 … 𝑥1𝑛 𝑥21 𝑥22 … 𝑥2𝑛

⋮ ⋮ ⋮ ⋮

𝑥𝑚1 𝑥𝑚2 … 𝑥𝑚𝑛]

(2.4)

2. Menentukan solusi ideal dan ideal negative

Menentukan alternative dengan nilai tertinggi yang berarti sebagai solusi positif (f j*). Sedangkan yang mempunyai nilai terendah akan menjadi ideal negative (f j-). Cara menentukan nilai f j* dan f j- melalui persamaan:

f j * = maxifij

f j - = minifij (2.5)

3. Menghitung Utility Measures

Untuk mendapatkan nilai Si dan Ri, diperlukan nilai bobot kriteria. Bobot kriteria (wj) bertujuan untuk merepresentasikan kepentingan relatif. Nilai Si dan Ri dihitung secara berturut-turut melalui persamaan

Si = ∑ 𝑤𝑗 𝑓 𝑗∗ −𝑓 𝑖 𝑗 (𝑓 𝑗∗ −𝑓 𝑗−)

𝑛𝑗=1 (2.6)

Ri = Maxj [𝑤𝑗 (𝑓 𝑗∗ −𝑓 𝑖 𝑗)

(𝑓 𝑗∗ −𝑓 𝑗−)] (2.7)

4. Menghitung indeks VIKOR (Qi)

Perhitungan indeks VIKOR menggunakan persamaan

𝑆𝑖−𝑆 𝑅𝑖−𝑅

(29)

dengan ketentuan:

S* = Mini(Si) R* = Mini(Ri) S- = Maxi(Si) R- = Maxi(Ri),

Untuk menghitung nilai VIKOR diperlukan variabel v yang dikenal dengan istilah bobot strategis dari mayoritas kriteria, dimana nilai v default ditetapkan sebesar 0,5.

5. Melakukan perangkingan alternatif dengan nilai Si, Ri, dan Qi.

6. Mengajukan solusi kompromi

Solusi kompromi berupa alternatif (A′) diajukan ketika kondisi C1 dan C2 terpenuhi di mana alternatif A′ merupakan alternatif yang menempati peringkat pertama dalam pemeringkatan nilai VIKOR (𝑄𝑖). Adapun kondisi C1 dan C2 sebagai berikut:

A. Kondisi C1: Acceptable Advantage

Kondisi C1 diterima apabila Q(A2) – Q(A1) ≥ DQ, dengan DQ = 1/(n-1). A1 adalah alternatif urutan pertama dalam perankingan 𝑄𝑖, A2 adalah alternatif urutan kedua dalam perankingan 𝑄𝑖.

B. Kondisi C2: Acceptable Stability

Untuk memenuhi kondisi C2, alternatif A′ harus pula menduduki peringkat pertama dalam pemeringkatan nilai 𝑆𝑖 dan/atau 𝑅𝑖. Apabila kondisi C2 terpenuhi, maka solusi kompromi lain bisa diusulkan, yaitu alternatif A1, A2, … An dimana An ditentukan dari relasi Q(An) – Q(A1) < DQ untuk n yaitu posisi alternatif yang terdekat.

2.7. Penelitian Terdahulu

Beberapa penelitian yang telah dilakukan sebelumnya, diantaranya yaitu: penelitian yang dilakukan oleh (Anindya Khrisna Wardhani, 2016), yaitu Implementasi Algoritma K-Means untuk Pengelompokkan Penyakit Pasien pada Puskesmas Kajen Pekalongan.

15

(30)

Penelitian ini berhasil dilakukan dengan melakukan inisialisasi jumlah cluster sebanyak 2 buah.

Penelitian selanjutnya yang dilakukan oleh (Noor Fitriana Hastuti, 2013) yaitu Pemanfaatan Metode K-Means Clustering dalam Penentuan Penerima Beasiswa. Pada penelitian ini pengujian dilakukan sebanyak 40 kali percobaan untuk mendapatkan nilai presisi hasil implementasi metode K-Means. Nilai error presisi pada hasil klasifikasi berdasarkan IPK adalah 0,118.

Penelitian selanjutnya yang dilakukan oleh (Fitriani, 2016) yaitu Penerapan Metode Clustering Data dengan C-Means untuk Rekomendasi Penerima Beasiswa pada Universitas Sumatera Utara. Penelitian ini berhasil dilakukan dan menyarankan penggunaan algoritma lain. Hasil penelitian menunjukkan bahwa penggunaan gabungan metode AHP dan VIKOR dapat membantu proses seleksi dengan menyediakan urutan penerima beasiswa berdasarkan kriteria yang telah ditetapkan dan diberi bobot oleh pimpinan.

(31)

Penelitian terdahulu yang telah dipaparkan akan diuraikan secara singkat pada Tabel 2.1.

Tabel 2.1. Penelitian Terdahulu

No Peneliti Judul Metode

1 Anindya Khrisna Wardhani, et al

2016

Implementasi Algoritma K-Means untuk Pengelompokkan Penyakit Pasien pada Puskesmas Kajen Pekalongan

K-Means

2 Hastuti, 2013

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penerima Beasiswa

Clustering dan K- means

3 Lengkong, et al, 2015

Implementasi Metode VIKOR untuk Seleksi Penerima Beasiswa.

Multi Atributte Decision Making (MADM) dan VIKOR

4 F. Nasari, S.

Darma 2015

Penerapan K-Means Clustering pada Data Penerima Mahasiswa Baru

K-Means

5 Fitriani, Desi 2016

Penerapan Metode Clustering Data Dengan C-Means Untuk Rekomendasi Penerima Beasiswa Pada Universitas Sumatera Utara

C-Means

Pada penelitian ini penulis mengimplementasikan metode K-Means Clustering untuk pengelompokkan dan VIKOR digunakan untuk melakukan perangkingan agar dapat menentukan penerima beasiswa.

17

(32)

BAB 3

ANALISIS DAN PERANCANGAN

Pada bab ini akan dibahas mengenai analisis dan perancangan sistem. Pada tahap analisis akan dilakukan analisis terhadap algoritma K-Means Clustering dan VIKOR. Pada tahap perancangan akan dibahas mengenai diagram aktivitas, diagram use case, diagram sequence, flowchart dan tampilan antarmuka pada aplikasi yang akan dibangun.

3.1. Data yang Digunakan

Data yang digunakan dalam penelitian berasal data pendaftar beasiswa Karya Salemba Empat tahun 2017. Dari data tersebut diambil data pendaftar beasiswa dari 33 Universitas di seluruh Indonesia. Setelah pengumpulan data dilakukan analisis data sesuai dengan kebutuhan sistem. Analisis data dilakukan menggunakan K-Means Clustering dan VIKOR.

Total data yang digunakan 21.614 data pendaftar beasiswa.

Dari data tersebut terdapat 3 kriteria yang digunakan dalam penelitian. Dimana 3 kriteria digunakan untuk K-Means clustering dan 1 kriteria untuk VIKOR. Adapun 3 kriteria untuk pengelompokkan adalah jumlah penghasilan orangtua pendaftar, tagihan PLN, dan tagihan PDAM. Sedangkan 1 kriteria untuk VIKOR adalah jumlah penghasilan orangtua. Data yang digunakan adalah dalam format csv yang di export ke format arff menggunkana software Weka Explorer.

3.2. Arsitektur Umum

Metode yang diajukan untuk menentukan penerima beasiswa terdiri dari beberapa tahapan.

Tahapan-tahapan tersebut dimulai dari data preprocessing berupa parsing untuk

(33)

memeriksa data yang inkonsisten dan kesalahan cetak (tipografi) serta mengisi missing value. Tahapan selanjutnya yaitu clustering, di dalam tahap pengelompokkan ini diawali dengan menentukan jumlah cluster setelah itu tentukan titik pusat cluster (centroid) lalu hitung jarak antar data ke titik pusat cluster dengan persamaan euclidean distance.

Kemudian alokasikan data-data tersebut ke cluster terdekat sehingga diketahui di kelompok mana data tersebut berada. Tahap selanjutnya yaitu decision making, dimana data yang telah dikelompokkan akan dirangkingkan. Dari data tersebut dibuat matriks keputusan berdasarkan kriteria dan alternatif yang dimiliki yang setelah itu dinormalisasikan.

Selanjutnya tentukanlah solusi ideal positif dan negatifnya yang diikuti dengan menghitung utility measures. Lalu hitunglah indeks VIKOR berdasarkan nilai utility measures tersebut.

Kemudian rangkingkan semua alternatif sehingga didapatilah hasil perangkingan untuk hasil rekomendasi yang berhak menerima beasiswa. Adapun tahapan-tahapan diatas dapat dilihat dalam bentuk arsitektur umum pada Gambar 3.1.

19

(34)

Gambar 3.1 Arsitektur Umum

(35)

3.3. Analisis K-Means Clustering

Pada tahap ini dilakukan analisis dengan K-Means Clustering. Tahapan analisis yang akan dilakukan yaitu:

3.3.1. Menentukan Jumlah Cluster

Tahap awal dalam proses clustering adalah menentukan berapa jumlah cluster yang diinginkan. Pada sistem penentuan penerima beasiswa akan digunakan 3 cluster yaitu cluster pertama (C1), cluster kedua (C2) dan cluster ketiga (C3).

3.3.2. Menentukan Pusat Cluster (centroid)

Pada tahap ini ditentukan nilai pusat cluster (centroid) awal secara random dari data yang telah diinputkan. Centroid kriteria 1 jumlah penghasilan orangtua, centroid 2 tagihan PLN, centroid 3 tagihan PDAM. Maka diperoleh:

C1= (6.885.571; 50.118; 40.064) C2= (1.315.133; 47.680; 40.768) C3= (1.294.884; 64.976; 34.801)

3.3.3. Hitung Jarak Data dengan Euclidean Distance

Kemudian akan dihitung jarak dari setiap data ke setiap pusat cluster yang ada dengan euclidean distance sehingga ditemukan jarak terdekat dari tiap data ke centroid. Perhitungan dengan euclidean distance dapat digunakan dengan persamaan 3.1:

𝑑(𝑥𝑖, 𝜇𝑗) = √(𝑥𝑖𝑎 − 𝜇𝑗𝑎)2 + (𝑥𝑖𝑏 − 𝜇𝑗𝑏)2 (3.1) Dengan ketentuan sebagai berikut:

xi : data kriteria

µj : centroid pada cluster ke-j

Jarak data pertama ke pusat cluster pertama

d11=√(2.603.310– 6.885.571)2 + (60.791– 50.118)2 + (46.490 – 40.064)2

21

(36)

Jarak data pertama ke pusat cluster kedua

d12=√(2.603.310– 1.315.133)2+ (60.791– 47.680)2+ (46.490– 40.768)2

= 1.28825643

Jarak data pertama ke pusat cluster ketiga

d13= √(2.603.310– 1.294.884)2+ (60.791– 64.976)2+ (46.490– 34.801)2

= 1.3084849

Jarak data kedua ke pusat cluster pertama

d21= √(2.000.000– 6.885.571)2 + (60.973– 50.118)2 + (43.189– 40.064)2

= 1.54495733

Jarak data kedua ke pusat cluster kedua

d22= √(2.000.000– 1.315.133)2 + (60.973– 47.680)2 + (43.189– 40.768)2

= 2.16616106

Jarak data kedua ke pusat cluster ketiga

d23= √(2.000.000 −1.294.884)2+ (60.97364.976)2+ (43.18934.801)2

= 2.22996627

Jarak data ketiga ke pusat cluster pertama

d31=√(2.000.000 − 6.885.571)2+ (68.267 − 50.118)2+ (35.516 − 40.064)2

= 1.54496453

Jarak data ketiga ke pusat cluster kedua

d32= √(2.000.000 −1.315.133)2+ (68.26747.680)2+ (35.51640.768)2

= 2.16678152

Jarak data ketiga ke pusat cluster ketiga

d32= √(2.000.000 −1.294.884)2+ (68.26764.976)2+ (35.51634.801)2

= 1.04193435

Hasil perhitungan jarak awal pada iterasi-1 dapat dilihat pada Tabel 3.10.

Tabel 3.1. Pusat cluster iterasi 1

Nama Cluster 1 Cluster 2 Cluster 3

Pendaftar 1 1.35417556 1.28825643 1.3084849

(37)

Pendaftar 2 1.54495733 2.16616106 2.22996627

Pendaftar 3 1.54496453 2.16678152 1.04193435

⋮ ⋮ ⋮ ⋮

Pendaftar 21.614 1.61278855 1.0499382 2.9001268

3.3.4. Kelompokkan Data pada Cluster Terdekat

Dari hasil hitungan pada Tabel 3.10, setiap data akan dialokasikan ke suatu cluster berdasarkan jarak terdekat dari pusat clusternya. Pada data pertama diperoleh jarak terdekat dengan pusat cluster kedua, maka data tersebut akan menjadi anggota cluster kedua. Hasil cluster pada iterasi 1 dapat dilihat pada Tabel 3.11:

Tabel 3.2. Hasil cluster iterasi 1

Nama Cluster 1 Cluster 2 Cluster 3

Pendaftar 1 *

Pendaftar 2 *

Pendaftar 3 *

⋮ ⋮ ⋮ ⋮

Pendaftar 21.614 *

3.3.5. Hasil Clustering

Proses iterasi berakhir pada iterasi ke 1 dan menghasilkan 13.423 data untuk cluster pertama, 7.030 data pada cluster kedua dan 1.161 data pada cluster ketiga yang dapat dilihat di Tabel 3.14, Tabel 3.15 dan Tabel 3.16.

Tabel 3.3. Hasil Cluster Pertama

No Nama Cluster

1 Pendaftar 2 Cluster 1

2 Pendaftar 6 Cluster 1

3 Pendaftar 10 Cluster 1

23

(38)

4 Pendaftar 11 Cluster 1

5 Pendaftar 12 Cluster 1

⋮ ⋮ ⋮

13.423 Pendaftar 21.240 Cluster 1

Tabel 3.4. Hasil Cluster Kedua

No Nama Cluster

1 Pendaftar 1 Cluster 2

2 Pendaftar 5 Cluster 2

3 Pendaftar 8 Cluster 2

4 Pendafta 13 Cluster 2

5 Pendaftar 17 Cluster 2

⋮ ⋮ ⋮

7.030 Pendaftar 21.614 Cluster 2

Tabel 3.5. Hasil Cluster Ketiga

No Nama Cluster

1 Pendaftar 3 Cluster 3

2 Pendaftar 4 Cluster 3

3 Pendaftar 7 Cluster 3

4 Pendaftar 9 Cluster 3

5 Pendaftar 14 Cluster 3

⋮ ⋮ ⋮

1.161 Pendaftar 17.832 Cluster 3

Dari hasil pusat cluster didapatkan informasi sebagai berikut:

1. Cluster 1 adalah kondisi dimana pendaftar beasiswa memiliki jumlah penghasilan orangtua yang relatif tinggi tetapi tagihan PLN dan tagihan PDAM yang rendah.

(39)

2. Cluster 2 adalah kondisi dimana pendaftar beasiswa memiliki jumlah penghasilan orangtua yang relatif rendah tetapi tagihan PLN dan tagihan PDAM yang tinggi.

3. Cluster 3 adalah kondisi dimana pendaftar beasiswa memiliki jumlah penghasilan orangtua, tagihan PLN dan tagihan PDAM yang tidak rendah maupun tinggi.

Oleh karena itu, hasil cluster untuk pengelompokkan keadaaan rumah yang berhak mendapatkan bantuan dikelompokkan menjadi 3 cluster yaitu:

1. Cluster tidak layak, dimana keadaan pendaftar beasiswa sangat tidak layak dan tidak berhak mendapatkan beasiswa.

2. Cluster rekomendasi, dimana keadaan pendaftar beasiswa sangat membutuhkan beasiswa.

3. Cluster layak, dimana keadaan pendaftar beasiswa layak mendapatkan beasiswa namun diperlukan perangkingan.

3.4. Analisis VIKOR

Setelah melewati proses clustering, maka dilanjutkan ke proses perangkingan dengan VIKOR dengan 6 tahapan. Tahapan analisis VIKOR yang akan dilakukan yaitu:

3.4.1. Membuat matriks keputusan ternormalisasi

Tahap pertama dalam proses perangkingan VIKOR adalah membuat matriks keputusan ternormalisasi. Pada Tabel 3.17 menunjukan data alternatif dan kriteria dari cluster layak. Kriteria-kriterianya adalah jumlah penghasilan orangtua.

Kemudian terdapat alternatif A1 sampai A1161, yaitu 1.161 pendaftar yang layak mendapatkan beasiswa yang terdapat di cluster 3.

Tabel 3.6. Data Kriteria Cluster 3

No Alternatif C3

1 Pendaftar 3 2.000.000

25

(40)

2 Pendaftar 4 750.000

3 Pendaftar 7 1.500.000

4 Pendaftar 9 1.500.000

5 Pendaftar 14 2.000.000

⋮ ⋮ ⋮

1.161 Pendaftar 17.832 750.000

Untuk melakukan matriks keputusan ternormalisasi digunakan persamaan

𝑓

ij

=

𝐿𝑖𝑗

√∑𝑚𝑖=1𝐿2𝑖𝑗

(3.2)

Dimana:

Lij adalah nilai dari Alternative Ai.

Perhitungan normalisasi dapat dilihat dibawah ini:

f13= 2.000.000

√(2.000.0002+750.0002+1.500.0002+1.500.0002+2.000.0002+⋯+750.0002)

= 2.000.000

√2.302.870.798.017.970

= 2.000.000

47.988.236

= 0.041

f23= 750.000

√(2.000.0002+750.0002+1.500.0002+1.500.0002+2.000.0002+⋯+750.0002)

= 750.000

√2.302.870.798.017.970

= 750.000

47.988.236

= 0.015

f33= 1.500.000

√(2.000.0002+750.0002+1.500.0002+1.500.0002+2.000.0002+⋯+750.0002)

= 1.500.000

√2.302.870.798.017.970

= 1.500.000

47.988.236

= 0.031

(41)

Hasil normalisasi matriks dapat dilihat pada Tabel 3.7.

Tabel 3.7. Hasil Normalisasi Matriks

Alternatif C3

A1 0.041

A2 0.015

A3 0.031

A4 0.031

A5 0.041

⋮ ⋮

A1161 0.015

3.4.2. Menentukan solusi ideal dan ideal negatif

Solusi ideal adalah nilai maksimum hasil normalisasi dari tiap kriteria. Sedangkan nilai ideal negatif adalah nilai minimum normalisasi dari masing – masing kriteria.

Solusi ideal dan ideal negatif diperoleh dengan persamaan sebagai berikut:

A* = {max fij |i=1,2, …, m}

= {𝑓1,𝑓2 , …, 𝑓𝑛} (3.3) A- = {min fij |i=1,2, …, m}

= {𝑓1, 𝑓2, …, 𝑓𝑛} (3.4) Solusi idealnya

A* = {𝑓3} = {0,041}

Ideal negatif A- = {𝑓3}

= {0,015}

3.4.3. Menghitung Utility Measures

Utility measures dihitung berdasarkan 𝑆𝑖 (maximum group utility) dan 𝑅𝑖 (minimum individual regret of the opponent). 𝑆𝑖 (maximum group utility) adalah titik terjauh dari solusi ideal sedangkan dan 𝑅𝑖 (minimum individual regret of the

27

(42)

opponent) adalah titik terdekat dari solusi ideal. Adapun cara menghitung utility measures dapat dilihat pada persamaan 3.5 dan 3.6.

Si = ∑ 𝑤𝑗 𝑓𝑗−𝑓𝑖𝑗

(𝑓𝑗−𝑓𝑗)

𝑛𝑗=1 (3.5)

Ri = Maxj[𝑤𝑗 (𝑓𝑗−𝑓𝑖𝑗)

(𝑓𝑗−𝑓𝑗)] (3.6) Dengan ketentuan:

𝑆𝑖 : maximum group utility

𝑅𝑖 : minimum individual regret of the opponent 𝑓𝑗 : nilai tertinggi dari kriteria

𝑓𝑗 : nilai terkecil dari kriteria

𝑤𝑗 : bobot yang diberikan pada setiap kriteria

Kemudian nilai 𝑤 atau bobot yang telah ditentukan untuk setiap kriteria sebagai berikut:

 Jumlah penghasilan orang tua: 0,4 Adapun perhitungan untuk Si yaitu:

S1 = w1

𝑓𝑗−𝑓𝑖𝑗 (𝑓𝑗−𝑓𝑗)

S1 = 0,4 0,041−0,041 (0,041−0,015)

S1 = 0,4 0

0,026

S1 = 0

S2 = w1 𝑓𝑗−𝑓𝑖𝑗 (𝑓𝑗−𝑓𝑗)

S2 = 0,4 0,041−0,015 (0,041−0,015)

S2 = 0,4

Sedangkan untuk nilai Ri adalah R1 = Max[𝑤1 (𝑓𝑗𝑓𝑗−𝑓𝑗−𝑓𝑖𝑗)]

R1 = 0

(43)

R2 = Max[𝑤1 𝑓𝑗−𝑓𝑖𝑗

(𝑓𝑗−𝑓𝑗)] R2 = 0,4

Hasil perhitungan Si dan Ri dapat dilihat pada Tabel 3.8.

Tabel 3.8. Hasil Si dan Ri

Alternatif Si Ri

A1 0 0

A2 0,4 0,4

A3 0,15 0,15

A4 0,15 0,15

A5 0 0

⋮ ⋮ ⋮

A1161 0,4 0,4

3.4.4. Menghitung Indeks VIKOR

Menghitung indeks VIKOR adalah menghitung nilai perangkingan 𝑄𝑖 menggunakan nilai 𝑆𝑖 dan 𝑅𝑖 dari perhitungan Utility Measures. Perhitungan indeks VIKOR menggunakan persamaan 3.8

𝑄𝑖 = v[𝑆𝑖− 𝑆

𝑆−𝑆]+ (1-v) [𝑅𝑖− 𝑅

𝑅−𝑅] (3.7)

Dengan ketentuan:

S* = Mini (Si) R* = Mini(R), S- = Maxi (Si) R- = Maxi(R), v = bobot (biasanya bernilai 0,5)

Nilai indeks VIKOR yang terpilih menjadi solusi terbaik adalah dengan nilai terkecil.

29

(44)

Q1 = 0,5 [0 − 0,08

1 − 0,08]+ (1-0,5) [0 − 0,08

0,4 − 0,08] Q1 = 0,5 [−0,08

0,92] + 0,5 [−0,08

0,32] Q1 = -0,165

Q2 = 0,5 [0,4 − 0,08

1− 0,08 ] + (1-0,5) [0,4 − 0,08 0,4 − 0,08 ] Q2 = 0,5 [0,32

0,92] + 0,5 [0,32

0,32] Q2 = 0,173

Hasil perhitungan Qi dapat dilihat pada Tabel 3.9.

Tabel 3.9. Hasil Qi

Alternatif Qi

A1 -0,165

A2 0,173

A3 0,139

A4 0,139

A5 -0,165

⋮ ⋮

A1161 0,173

3.4.5. Perangkingan Alternatif

Setelah masing-masing nilai 𝑆𝑖, 𝑅𝑖 dan 𝑄𝑖 diperoleh, maka langkah selanjutnya adalah mengurutkan nilai dari 𝑆𝑖, 𝑅𝑖 dan 𝑄𝑖 berdasarkan nilai yang paling minimum. Sehingga diperoleh tiga buah perangkingan. Hasil pengurutan 𝑆𝑖, 𝑅𝑖 dan 𝑄𝑖 dapat dilihat pada Tabel 3.10.

(45)

Tabel 3.10. Hasil Pengurutan Si, Ri, dan Qi Alternatif Si Ranking

Si

Ri Ranking Ri

Qi Ranking Qi

A1 0 1 0 1 -0,165 1

A2 0,4 1056 0,4 1056 0,173 1160

A3 0,15 698 0,15 698 0,139 453

A4 0,15 690 0,15 690 0,139 454

A5 0 2 0 2 -0,165 2

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

A1161 0,4 1057 0,4 1057 0,173 1161

Setelah mendapatkan 3 macam perangkingan seperti yang ditunjukkan oleh Tabel 3.10 perangkingan 𝑆𝑖 merupakan perangkingan berdasarkan pendekatan dengan titik solusi terjauh dengan solusi ideal, perangkingan 𝑅𝑖 adalah perangkingan berdasarkan pendekatan dengan titik solusi terdekat dengan solusi ideal, sedangkan perangkingan 𝑄𝑖 merupakan perangkingan kompromi dengan menghitung indeks VIKOR.

3.4.6. Usulan Solusi Kompromi

Usulan solusi kompromi adalah langkah terakhir dalam menentukan rangking setiap alternatif. Untuk melakukan solusi kompromi dilihat berdasarkan rangking terbaik dengan nilai 𝑄𝑖 minimum dengan 2 kondisi berikut.

A. Acceptable Advantage

Kondisi ini terpenuhi dengan cara menghitung selisih dari nilai alternatif peringkat kedua dengan peringkat pertama harus lebih besar atau sama dengan nilai DQ.

Q(A2) – Q(A1) ≥ DQ (3.8) DQ = 1

(𝑛−1) (3.9)

Dimana n adalah jumlah alternatif.

31

(46)

B. Acceptable Stability

Jika kondisi pertama tidak terpenuhi, maka nilai A1 harus menjadi rangking terbaik pada 𝑆𝑖 dan/atau 𝑅𝑖. Solusi kompromi lain bisa diusulkan yaitu alternatif A1, A2, … An dengan persamaan 3.10.

Q(An) – Q(A1) < DQ (3.10) Dimana n yaitu posisi alternatif yang berada pada kondisi saling berdekatan.

Maka usulan kompromi untuk hitungan cluster tidak layak menggunakan acceptable advantage adalah.

Q(A2) – Q(A1) ≥ DQ 0.0271– 0 ≥ 1

(1161−1)

0.0271 ≥ 0.0008 (diterima)

Solusi kompromi telah terpenuhi dan perangkingan alternatif terbaik adalah berdasarkan nilai Q minimum. Maka hasil perangkingan cluster tidak layak dapat dilihat pada Tabel 3.11.

Tabel 3.11. Hasil Akhir Perangkingan Cluster Layak

Alternatif Nama Rank Qi

A14149 Pendaftar 14.149 1

A9041 Pendaftar 9.041 2

A654 Pendaftar 654 3

A7350 Pendaftar 7.350 4

A341 Pendaftar 341 5

⋮ ⋮ ⋮

A12141 Pendaftar 12.141 1.161

Dari hasil perangkingan cluster layak menggunakan VIKOR didapatkan A14149 pada urutan pertama, A9041 pada urutan kedua, A654 pada urutan ketiga, A7350 berada pada urutan keempat, A341 berada pada urutan kelima hingga A12141 berada pada urutan terakhir atau urutan ke

(47)

3.5. Perancangan Sistem 3.5.1. Perancangan flowchart

Flowchart merupakan gambaran dalam bentuk diagram alir dari algoritma dalam suatu program yang menyatakan arah alur program dalam menyelesaikan suatu masalah.

3.5.1.1. Flowchart K-Means Clustering

33

(48)

Pada flowchart k-means clustering, proses awal dimulai dari menentukan jumlah cluster yang akan dibentuk. Kemudian tentukan nilai centroid pada masing-masing cluster. Setelah itu hitung jarak data ke masing-masing pusat cluster menggunakan persamaan euclidean distance. Kelompokkan data ke dalam cluster berdasarkan hasil perhitungan dengan jarak terdekat. Lalu hitung rata-rata dari tiap pusat cluster untuk mendapatkan pusat cluster yang baru. Setelah didapatkan pusat cluster yang baru, bandingkan titik pusat cluster yang baru dengan lama jika posisi anggota tiap cluster berubah maka ulangi menghitung jarak data ke masing-masing pusat cluster, jika tidak berubah maka nilai pusat cluster terakhir akan digunakan untuk menampilkan hasil clustering.

3.5.1.2. Flowchart VIKOR

(49)

Pada flowchart VIKOR proses awal dimulai dengan membuat matriks keputusan ternormalisasi dari alternatif dan kriteria. Lalu tentukan solusi ideal yaitu nilai maksimum dari hasil normalisasi dan ideal negatif adalah nilai minimum dari hasil normalisasi. Setelah itu hitung utility measures dan regret measures. Lalu hitung indeks VIKOR. Setelah mendapatkan hasil utility measures, regret measures dan indeks VIKOR dilakukan perangkingan, maka didapatkan tiga buah perangkingan. Lalu diajukanlah solusi kompromi untuk mendapatkan hasil perangkingan terbaik. Kemudian ditampilkan hasil akhir perangkingan.

3.5.1.3 Diagram Aktivitas

Diagram aktivitas menggambarkan alur proses berupa urutan- urutan kegiatan yang terjadi di dalam sistem yang dirancang. Kegiatan user di dalam sistem antara lain upload file data yang akan di cluster dan menentukan berapa banyak cluster yang akan dibuat oleh sistem. Urutan- urutan kegiatan tersebut dapat dilihat pada tabel 3.12.

Tabel 3.12 Diagram Aktivitas

USER SISTEM

Menjalankan Aplikasi

Menampilkan Halaman Utama

Memilih dan memasukkan dokumen, menentukan banyak

cluster dan iterasi dan memilih tombol analyze

Menampilkan cluster dalam bentuk grafik 3D dan tabel Memilih tombol VIKOR Analyze

Menampilkan data penerima beasiswa yang sudah di ranking

dalam bentuk tabel

35

(50)

3.5.1.4 Diagram Use Case

Diagram Use Case menjelaskan interaksi yang terjadi antara user dengan sistem yang ada. Interaksi antara user dengan sistem ini dapat dilihat pada Gambar 3.4.

User

Memasukkan file data pendaftar beasiswa

Menentukan jumlah cluster dan

iterasi

Mendapatkan hasil data yang sudah di

rengking

k-means clustering Mendapatkan

hasil clustering data

pendaftar beasiswa

VIKOR

<<include>>

Input file Sistem Penerimaan Beasiswa

Gambar 3.4. Use Case Diagram

(51)

3.5.1.5. Sequence Diagram

Diagram Sequence memperlihatkan interkasi-interaksi antar objek didalam sistem dari setiap event yang ditampilkan secara bertahap, seperti pada Gambar 3.5.

User

Halaman utama

Halaman Performance

Data clustering

Rengking

VIKOR Hasil akhir

Memasukkan file data penerima beasiswa

Menentukan jumlah clustering dan iterasi

Meng-cluster data

Mengklik button Vikor Analyze

Merengking data

Mengklik button hasil akhir

Menampilkan data hasil akhir penerima beasiswa

Gambar 3.5. Sequence Diagram

37

(52)

3.5.2. Rancangan tampilan antarmuka pengguna

Tampilan antarmuka pengguna merupakan sebuah desain tampilan yang akan dibangun pada aplikasi ini. Antarmuka yang dibangun diharapkan dapat memudahkan pengguna untuk memahami dan menjalankan program aplikasi dengan baik. Perancangan antarmuka program aplikasi ini terdiri dari menu Specification, Performance, about, data dan VIKOR Analyze.

Rancangan antar muka menu Specification dapat dilihat pada Gambar 3.6.

Gambar 3.6. Rancangan Halaman Specification

(53)

Rancangan antar muka Performance dapat dilihat pada Gambar 3.7.

Gambar 3.7. Rancangan halaman Performance Rancangan antar muka menu about dapat dilihat pada Gambar 3.8.

Gambar 3.8. Rancangan halaman about

39

(54)

Rancangan antar muka menu data dapat dilihat pada Gambar 3.9.

Gambar 3.9. Rancangan halaman data

Rancangan antar muka menu VIKOR Analyze dapat dilihat pada Gambar 3.10.

Gambar 3.10. Rancangan halaman VIKOR Analyze

(55)

BAB 4

IMPLEMENTASI DAN PENGUJIAN

Pada bab ini akan dijelaskan tentang proses pengimplementasian K-Means Clustering dan VIKOR pada sistem, sesuai perancangan sistem yang telah dibahas pada Bab 3 serta melakukan pengujian sistem yang telah dibangun.

4.1. Implementasi Sistem

Pada tahap implementasi sistem, K-Means dan VIKOR akan diimplementasikan ke dalam sistem dengan menggunakan bahasa pemrograman Java sesuai perancangan yang telah dilakukan.

4.1.1 Spesifikasi Perangkat Keras dan Lunak yang Digunakan

Adapun spesifikasi perangkat keras dan lunak yang digunakan untuk membangun sistem ini adalah sebagai berikut:

1. Processor Intel® Core™ i3-4030U CPU 1.90GHz.

2. Memory (RAM): 4.00 GB.

3. Kapasitas hardisk 1 TB.

4. Sistem Operasi yang digunakan adalah Microsoft Windows 10 Pro.

5. NetBeans IDE 8.2 6. Software Weka Explorer

(56)

4.1.2 Implementasi coding program

Adapun implementasi dari coding program yang telah dibuat pada sistem ini adalah:

4.1.2.1 Main.java

Halaman Main.java merupakan halaman java yang berfungsi untuk menampung halaman- halaman lainnya.

Gambar 4.1. Coding Main.java 4.1.2.2 Const.java

Halaman Const.java merupakan halaman java yang berfungsi untuk meletakkan algoritme menghitung jarak Euclidian.

Gambar 4.2. Coding Const.java

Gambar

Gambar 2.1 Bidang Ilmu Data Mining (Pramudiono, 2006)  Data Mining adalah bagian dari Knowledge Discovery in Database (KDD)
Gambar 3.1 Arsitektur Umum
Tabel 3.3. Hasil Cluster Pertama
Tabel 3.5. Hasil Cluster Ketiga
+7

Referensi

Dokumen terkait

menunjukkan bahwa siswa laki-laki mampu menganalisis situasi matematis soal cerita dengan baik, menunjukkan kemampuan berargumentasi dan mempertahankan argumennya dengan

Mengacu Tabel 19 memperlihatkan terdapat perbedaan yang bermakna dalam hal lama penyakit diare berdasarkan jenis perlakuan, dengan kata lain subjek yang mendapat formula tempe

Dari hasil penelitian didapat bahwa dengan penentuan centroid awal menggunakan metode Particle Swarm Optimization dapat meningkatkan kualitas hasil clustering algoritma

Judul Skripsi : Segmentasi Pelanggan Pada Jasa Perawatan dan Perbaikan Pesawat Terbang Dengan Analisis RFM Menggunakan Metode K-Means Clustering dan K-Medoids Clustering..

Setelah penerapan asuhan keperawatan pada masalah Nutrisi kurang dari kebutuhan tubuh berhubungan dengan intake yang tidak adekuat, dengan tindakan keperawatan yang

Di Indonesia, penelitian pada tahun 2006 yang dilakukan untuk mengetahui perawatan yang paling dicemaskan anak saat perawatan gigi menunjukkan bahwa hal yang paling ditakuti

February 2021 Principal’s Message February Message When I think of February, three things come to mind: Love and Red.. Our motto is Lead with Love and there is no better role model

Sedangkan pada formula C, konsentrasi kitosan yang digunakan tinggi (2%) menghasilkan gel yang sulit ditembus oleh asiklovir sehingga asiklovir kebanyakan tidak