• Tidak ada hasil yang ditemukan

PENGELOMPOKAN EVALUASI AKADEMIK MAHASISWA JURUSAN ILMU KOMPUTER UNIVERSITAS RIAU MENGGUNAKAN METODE K-MEDOIDS CLUSTERING

N/A
N/A
Protected

Academic year: 2023

Membagikan "PENGELOMPOKAN EVALUASI AKADEMIK MAHASISWA JURUSAN ILMU KOMPUTER UNIVERSITAS RIAU MENGGUNAKAN METODE K-MEDOIDS CLUSTERING"

Copied!
12
0
0

Teks penuh

(1)

PENGELOMPOKAN EVALUASI AKADEMIK MAHASISWA JURUSAN ILMU KOMPUTER UNIVERSITAS RIAU MENGGUNAKAN METODE K-MEDOIDS

CLUSTERING

Nur Ihsan Saputra, Alfirman

Mahasiswa Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia [email protected], [email protected]

ABSTRACT

One of the successes of higher education is the success of students in pursuing their studies. The success of students can be seen from the achievement index they have achieved. The high average number of student achievement index has a big influence on the image and accreditation of universities. Therefore, a research was conducted on the grouping of the Academic Evaluation of Students of the Department of Computer Science, University of Riau using the K-Medoids Clustering Method. Clustering is the process of dividing data in a set into several groups whose data similarity in one group is greater than the similarity of the data with data in other groups. K-Medoids Clustering is one method of partitioning because it uses the most centralized objects in the cluster to be the center cluster of the average values of objects in a cluster. The stages in this research are processing data with K-Medoids Clustering, Evaluation Processing and analysis of results. From the research conducted, the results of the analysis of each cluster are obtained, the first cluster is normal students with a total of 40 students, the second cluster of problematic students with a total of 5 students. While the third cluster is a cluster of excellent students with a total of 68 students. From the research conducted, it was found that students dominated the entire cluster.

Keywords : Academic, Grade Point, Cluster, Data Mining, K-Medoids Clustering.

ABSTRAK

Salah satu keberhasilan perguruan tinggi adalah keberhasilan mahasiswa dalam menempuh studinya. Keberhasilan mahasiwa dapat dilihat dari indeks prestasi yang dicapainya. Tinggi rendahnya angka rata-rata indeks prestasi mahasiswa berpengaruh besar bagi citra dan akreditasi perguruan tinggi. Oleh karena itu dilakukan penelitian mengenai pengelompokan Evaluasi Akademik Mahasiswa Jurusan Ilmu Komputer Universitas Riau menggunakan Metode K-Medoids Clustering. Clustering merupakan proses membagi data dalam suatu himpunan ke dalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar daripada kesamaan data tersebut dengan data dalam kelompok lain. K-Medoids Clustering merupakan salah satu metode partisi karena menggunakan objek yang paling terpusat di cluster menjadi pusat cluster dari nilai-nilai rata-rata objek dalam sebuah cluster. Tahapan dalam penelitian ini adalah

(2)

processing data dengan K-Medoids Clustering, Proses Evaluasi dan analisa hasil. Dari penelitian yang dilakukan diperoleh hasil analisis dari masing-masing cluster, cluster pertama yaitu mahasiswa normal dengan jumlah 40 mahasiswa, cluster kedua yaitu mahasiswa bermasalah dengan jumlah 5 mahasiswa. Sedangkan cluster ketiga merupakan cluster mahasiswa berprestasi dengan jumlah 68 mahasiswa. Dari penelitian yang dilakukan diperoleh bahwa mahasiswa berprestasi mendominasi keseluruhan cluster.

Kata Kunci : Akademik, Indeks Prestasi, Cluster, Data Mining, K-Medoids Clustering.

PENDAHULUAN

Pada setiap perguruan tinggi negeri di Indonesia mahasiwa merupakan bagian dari kemajuan suatu perguruan tinggi. Salah satu indikator perguruan tinggi yang mampu bersaing dapat dilihat dari keberhasilan mahasiswa dari perguruan tinggi tersebut dalam menempuh studinya. Keberhasilan seorang mahasiwa dapat dilihat dari indeks prestasi yang dicapainya. Indeks prestasi (IP) adalah tingkat keberhasilan mahasiswa pada akhir keseluruhan program pembelajaran yang merupakan rata-rata terimbang dari seluruh mata kuliah yang ditempuh, dinyatakan dalam bilangan dengan dua angka dibelakang koma (Pristanti & Kristin Wulansari, 2021). Banyak faktor yang yang menjadi penghalang bagi mahasiswa mencapai dan mempertahankan indeks prestasi tinggi yang dapat menjadi ukuran kerja keras mahasiswa selama masa kuliah di perguruan tinggi.

faktor-faktor hambatan ini dapat ditargetkan oleh perencana akademik dalam mengembangkan strategi untuk meningkatkan kegiatan pembelajaran dan prestasi akademik mahasiwa dengan cara memantau perkembangan kinerja akademik.

Tinggi rendahnya angka rata-rata indeks prestasi mahasiswa berpengaruh besar bagi citra dan akreditasi perguruan tinggi. Oleh karena itu Indeks Prestasi menjadi faktor yang paling umum digunakan oleh para perencana akademis untuk mengevaluasi kemajuan akademik setiap mahasiswa. Setiap perguruan tinggi tentu ingin mahasiswa berhasil baik dalam bidang akademis maupun nonakademis. Oleh karena itu peguruan tinggi memanfaatkan perkembangan pengetahuan dan teknologi untuk menghasilkan lulusan yang bermutu dan kompeten. Perguruan tinggi yang menjadi tempat penelitian peneliti adalah Jurusan Ilmu Komputer Universitas Riau. Penelitian ini diharapkan dapat mendukung pengambilan keputusan bagi para perencana akademik di lembaga pendidikan untuk meningkatkan kinerja akademik mahasiswa, memahami perilaku mahasiswa, menurunkan tingkat kegagalan untuk menghasilkan lulusan yang berkualitas.

Berdasarkan permasalahan tersebut dibutuhkan suatu sistem yang membantu dalam pengelompokan evaluasi akademik bagi mahasiwa yang memberikan hasil mahasiswa bermasalah dan mahasiswa berprestasi. Oleh karena itu dilakukan penelitian mengenai Pengelompokan Evaluasi Akademik Mahasiswa Jurusan Ilmu Komputer Universitas Riau Menggunakan Metode K-Medoids Clustering. Menurut Mustakim dalam (Marlina et al., 2018) K-Medoids adalah salah satu metode partisi, karena menggunakan objek yang paling terpusat (medoids) di cluster menjadi pusat cluster dari nilai rata-rata objek dalam sebuah cluster. Metode K-Medoids clustering merupakan salah satu metode yang berusaha mempartisi data yang ada kedalam bentuk clustering/kelompok. Metode ini dapat mengatasi permasalahan pengelompokan evaluasi akademik Mahasiswa Ilmu Komputer Universitas Riau.

(3)

METODE PENELITIAN

a. Teknik Pengambilan Data

Pengambilan data dilakukan dengan beberapa tahapan yaitu studi literatur, observasi, wawancara dan pengambilan data langsung ke lapangan.

b. Peralatan Yang Digunakan

Penelitian ini menggunakan beberapa perangkat pendukung yang berupa perangkat keras pada Tabel 1 dan perangkat lunak pada Tabel 2.

Tabel 1. Perangkat keras yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Laptop Pengolahan data Acer Nitro 5

2 Printer Mencetak laporan Canon Pixma MP 287

Tabel 2. Perangkat lunak yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Microsoft Office Word Membuat Laporan Versi 2016 2 Microsoft Office Excel Mengolah Data Versi 2016

3 Python Bahasa Pemrograman -

4 Google Collab Membuat Script -

c. Akademik

Menurut Catur dalam (Ariyanti et al., 2020) akademik merupakan suatu bidang yang mempelajari kurikulum atau pembelajaran dimana salah satu fungsinya yaitu meningkatkan pengetahuan dalam segi pendidikan pembelajaran untuk dapat dikelola oleh suatu sekolah atau lembaga pendidikan. Sedangkan menurut Setiawan dalam (Khotimah et al., 2016), prestasi akademik adalah sesuatu yang menunjukkan tercapainya tingkat suatu tujuan karena seseorang telah melakukan pembelajaran secara optimal.

Kesuksesan akademik menitikberatkan pada nilai atau poin yang dicapai siswa dalam proses pembelajaran di sekolah atau perguruan tinggi. Nilai ini terutama dilihat dari sisi kognitif, sehingga penguasaan pengetahuan dipandang sebagai ukuran pencapaian hasil belajar.

d. Metode K-Medoids

Menurut Mustakim dalam (Marlina et al., 2018) K-Medoids adalah salah satu metode partisi, karena menggunakan objek yang paling terpusat (medoids) di cluster menjadi pusat cluster dari nilai rata-rata objek dalam sebuah cluster. Metode K-medoids lebih cocok untuk mengelompokkan data dibandingkan metode K-Means. Sedangkan menurut Han dan Kamber dalam (Nahdliyah et al., 2019), algoritma k-means sensitif terhadap pencilan, karena menggunakan nilai rata-rata (mean) sebagai pusat kelompoknya. Untuk mengatasi hal tersebut, digunakan metode k-medoids untuk mengelompokkan objek-objek pada suatu data yang mengandung pencilan.

(4)

K-medoids tidak menentukan nilai rata-rata dari objek dalam cluster sebagai titik acuan, tapi menggunakan medoids (median), yang merupakan objek yang paling terletak dipusat sebuah cluster. Dengan demikian, metode partisi masih dapat dilakukan berdasarkan prinsip meminimalkan jumlah dari ketidak samaan antara setiap objek dan titik acuan yang sesuai (medoids) (Pulungan et al., 2019).

Adapun langkah-langkah algoritma penyelesaian k-medoids clustering (Marlina et al., 2018) sebagai berikut:

1. Inisialisasi pusat cluster sebanyak K (jumlah cluster).

2. Alokasikan setiap data (objek) ke cluster terdekat menggunakan ukuran jarak, dapat menggunakan persamaan rumus euclidean distance yaitu:

𝑑(𝑥, 𝑦) = √∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖)2 ... (1) Keterangan:

𝑑 = Jarak antara x dan y (euclidean distance) 𝑥 = Data pusat cluster

𝑦 = Data pusat atribut 𝑖 = Setiap data

𝑛 = Jumlah data

𝑥𝑖= Data pada pusat cluster ke 𝑖 𝑦𝑖= Data pada setiap cluster ke 𝑖

3. Pilih secara acak objek pada masing-masing cluster sebagai kandidat medoid baru.

4. Hitung jarak setiap objek yang berada pada masing-masing cluster dengan kandidat medoid baru.

5. Hitung total simpangan (S) dengan menghitung total distance baru dikurang dengan total distance lama. Jika nilai S < 0, maka tukarkan objek dengan data cluster non- medoids untuk membentuk kumpulan K objek baru sebagai medoids.

6. Ulangi langkah ketiga sampai kelima sampai tidak ada perubahan atau tetap dalam medoid, hingga didapat pengelompokan cluster beserta anggota cluster.

e. Silhouette Coefficient

Menurut (Rachman et al., 2021) Silhouette coefficient merupakan salah satu metode evaluasi yang digunakan untuk menguji kualitas dan kekuatan dari sebuah cluster.

Adapun langkah-langkah algoritma penyelesaian silhouette coefficient (Kartikawati, 2022) adalah:

1. Menghitung rata-rata jarak objek dengan semua objek lain yang berada dalam satu cluster. Nilai ini disebut a(𝑖). Dengan persamaan:

a(i) = 1

[A]−1∑𝑗 ∈𝐴,𝑗≠𝑖 d(i, j) ... (2) Keterangan:

a(i) = Rata-rata jarak objek i dengan semua objek lain dalam satu cluster A = Jumlah objek dalam satu cluster

d(i, j) = Jarak objek i terhadap j

2. Kemudian menghitung rata-rata jarak objek dengan semua objek cluster lain.

Kemudian ambil nilai terkecil dari semua jarak rata-rata tersebut. Nilai ini disebut 𝑏(𝑖). Dengan persamaan sebagai berikut:

b(i) = 1

[A]∑𝑗 ∈ C d(i, j) ... (3)

(5)

Keterangan:

b(i) = Rata-rata jarak objek i dengan semua objek lain dalam cluster lainnya.

d(i,j) = Jarak objek i terhadap j C = Cluster lain

3. Kemudian menghitung nilai silhouette coefficient dengan menggunakan persamaan:

𝑆(𝑖) = 𝑏(𝑖)−𝑎(𝑖)

max(𝑎(𝑖),𝑏(𝑖)) ... (4) Keterangan:

𝑎(𝑖) = Rata-rata jarak objek i dengan semua objek lain dalam cluster yang s ama 𝑏(𝑖) = Rata-rata jarak objek i dengan semua objek lain dalam cluster yang lainnya 𝑆(𝑖) = Nilai silhouette coefficient

Nilai silhouette coefficient berkisar antara -1 dan 1. Hasil cluster dikatakan baik jika nilai silhouette coefficient adalah 1, berarti dokumen ke-i sudah berada dalam cluster yang tepat. Jika nilai silhouette coefficient adalah 0, maka dokumen ke-i berada di antara dua cluster. Jika nilai silhouette coefficient adalah -1, artinya struktur cluster yang dihasilkan tidak baik, sehingga dokumen ke-i lebih tepat dimasukkan ke dalam cluster yang lain.

Kualitas cluster silhouette coefficient pada Tabel 3.

Tabel 3. Kualitas Cluster

0.7 < SC <= 1 Strong Stucture (Klaster Kuat) 0.5 < SC <= 0.7 Medium Structure (Klaster Cukup) 0.25 < SC <= 0.5 Weak Structure (Klaster Lemah) SC <= 0.25 No structure (Klaster sangat lemah

(cenderung tidak cocok))

HASIL DAN PEMBAHASAN

a. Pengambilan Data

Sesuai dengan tujuan penelitian, yaitu mengetahui hasil proses pengelompokan evaluasi akademik mahasiswa Jurusan Ilmu Komputer Universitas Riau menggunakan metode K-Medoids Clustering, maka penelitian membutuhkan data indeks prestasi semester 1 sampai indeks prestasi semester 4 angkatan 2020 Prodi Sistem Informasi.

Selanjutnya pengambilan data yang diperoleh dengan cara mengambil langsung ke Dekanat Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Riau. Dengan alur membuat surat izin penelitian dari jurusan, selanjutnya memberikan surat izin penelitian ke bagian bidang akademis mahasiswa. Surat izin penelitian diterima oleh bapak Suherman, S.Kom. selaku staf akademis, lalu diberikan data yang dibutuhkan sesuai judul penelitian yang dikirim melalui media sosial What’sApp berbentuk softfile excel. Adapaun data yang diperoleh sebanyak 113 data mahasiswa angkatan 2020 Prodi Sistem Informasi dengan variabel No (Nomor), Nim (Nomor Induk Mahasiswa), Nama Mahasiswa, L/P (Jenis Kelamin), serta Semester 1 tahun 2020, Semester 2 tahun 2020, Semester 3 tahun 2021, Semester 4 tahun 2021. Hasil pengambilan data terdapat pada Tabel 4.

(6)

Tabel 4. Hasil Pengambilan Data

No NIM Nama Mahasiswa

L / P

Tahun 2020 Tahun 2021 SEM

1

SEM 2

SEM 3

SEM 4 IP IP IP IP 1 2003113945 ADIDTIYA PUTRA

CANIAGO L 3,69 3,47 3,72 3,38 2 2003111124 ALFA RAZI L 3,58 3,48 3,3 2,59 3 2003134721 ALICIA MULYA

MAHARANI P 3,85 3,73 3,73 3,79 4 2003113175 AMALIA RAUDHATUL

ILMI P 3,92 3,85 3,84 3,57

5 2003114448 ANISA P 3,81 3,85 3,83 3,64

112 2003134722 ZUHRIE FEBRI ADI

RAHMANA L 3,79 3,78 3,6 3,71

113 2003111130 ZULMAHDI HERLI L 3,72 3,86 3,7 3,54 b. Processing Data

Pada tahap processing data yaitu tahap melakukan menentukan pola pengelompokan (cluster) data menggunakan algoritma K-Medoids clustering. Proses clustering akan dilakukan menggunakan 113 data mahasiswa Jurusan Ilmu Komputer Universitas Riau Angkatan 2020 Prodi Sistem Informasi.

Adapun langkah-langkah proses clustering dengan menggunakan metode K- Medoids clustering adalah sebagai berikut:

1. Menentukan inisialisasi pusat cluster sebanyak K (jumlah cluster).

Jumlah cluster yang diinginkan adalah cluster K=3, yaitu cluster 1, cluster 2, cluster 3, untuk penentuan mahasiswa bermasalah, normal/biasa, atau mahasiswa berprestasi. Selanjutnya pilih secara acak medoid awal sebanyak K dari n data.

Medoid kriteria satu adalah data ke-110 Yosia Situmorang. Medoid kriteria dua adalah data ke-11 Bintang Pratama Ketaren, dan Medoid kriteria tiga adalah data ke-9 Azlina Riyanti Sijabat. Nilai medoid dapat dilihat pada Tabel 5.

Tabel 5 Pusat Medoid

No NAMA IP SEM

1

IP SEM 2

IP SEM 3

IP SEM 4 110 YOSIA SITUMORANG 3,56 3,67 3,47 3,14

11 BINTANG PRATAMA

KETAREN 0 0 0 0

9 AZLINA RIYANTI SIJABAT 3,76 3,78 3,76 3,64

2. Alokasikan setiap data (objek) ke cluster terdekat menggunakan ukuran jarak, persamaan rumus eucliden distance. Berikut adalah perhitungan jarak pada data mahasiswa menggunakan persamaan Euclidean Distance:

𝑑 = √∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖)2

𝑑 = √(𝑥1− 𝑦1)2+ (𝑥2− 𝑦2)2+ (𝑥3− 𝑦3)2+ (𝑥4− 𝑦4)2

(7)

Jarak objek ke medoid 1

𝑑 = √(3,69 − 3,56)2+ (3,47 − 3,67)2+ (3,72 − 3,47)2+ (3,38 − 3,14)2 = 0,420713679

Jarak objek ke medoid 2

𝑑 = √(3,69 − 0)2+ (3,47 − 0)2+ (3,72 − 0)2+ (3,38 − 0)2 = 7,135811096 Jarak objek ke medoid 3

𝑑 = √(3,69 − 3,76)2+ (3,47 − 3,78)2+ (3,72 − 3,76)2+ (3,38 − 3,64)2 = 0,412553027

Berdasarkan hasil perhitungan jarak bisa dilihat pada Tabel 6.

Tabel 6. Perhitungan Jarak Euclidean Distance Iterasi 1

No Nama Mahasiswa Jarak 1 Jarak 2 Jarak 3 Kedekatan Cluster 1 ADIDTIYA PUTRA

CANIAGO 0,420714 7,135811 0,412553 0,412553 3 2 ALFA RAZI 0,606548 6,521112 1,198541 0,606548 1 3 ALICIA MULYA

MAHARANI 0,760132 7,550656 0,184391 0,184391 3 4 AMALIA

RAUDHATUL ILMI 0,695557 7,594696 0,20445 0,20445 3

… …

113 ZULMAHDI HERLI 0,524023 7,413474 0,146969 0,146969 3 Total Jarak Kedekatan (Distance) 44,47889977

Tabel 6 menjelaskan warna hijau muda mendefinisikan kedekatan cluster 1, warna jingga mendefinisikan kedekatan cluster 2, dan warna biru muda mendefinisikan kedekatan cluster 3. Total jarak kedekatan (distance) pada iterasi pertama adalah 44,47889977, dengan jumlah cluster 1 sebanyak 40 mahasiswa, cluster 2 sebanyak 5 mahasiswa, dan cluster 3 sebanyak 68 mahasiswa.

3. Pilih secara acak objek pada masing-masing cluster sebagai kandidat medoid baru.

Pada iterasi pertama telah mendapatkan nilai total jarak (distance)= 44,47889977, maka proses berikutnya melakukan pemilihan secara acak objek pada masing- masing cluster sebagai kandidat medoid baru. Medoid kriteria satu adalah data ke-1 Adidtiya Putra Caniago, Medoid kriteria dua adalah data ke-66 Sella Shasita Amelia Yusuf, dan Medoid kriteria tiga adalah data ke-113 Zulmahdi Herli. Nilai medoid dapat dilihat pada Tabel 7.

Tabel 7. Pusat Medoid

No NAMA IP SEM

1

IP SEM 2

IP SEM 3

IP SEM 4 1 ADIDTIYA PUTRA

CANIAGO 3,69 3,47 3,72 3,38

66 NURUL FINASTY 3,61 3,68 3,55 3,37

113 ZULMAHDI HERLI 3,72 3,86 3,7 3,54 4. Hitung jarak setiap objek yang berada pada masing-masing cluster dengan kandidat

medoid baru. Berdasarkan jarak euclidean distance. Berikut adalah perhitungan jarak pada data mahasiswa menggunakan persamaan Euclidean Distance:

𝑑 = √∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖)2

(8)

𝑑 = √(𝑥1− 𝑦1)2+ (𝑥2− 𝑦2)2+ (𝑥3− 𝑦3)2+ (𝑥4− 𝑦4)2 Jarak objek ke medoid 1

𝑑 = √(3,69 − 3,69)2+ (3,47 − 3,47)2+ (3,72 − 3,72)2+ (3,38 − 3,38)2 = 0 Jarak objek ke medoid 2

𝑑 = √(3,69 − 3,61)2+ (3,47 − 3,68)2+ (3,72 − 3,55)2+ (3,38 − 3,37)2 = 0,28196

Jarak objek ke medoid 3

𝑑 = √(3,69 − 3,72)2+ (3,47 − 3,86)2+ (3,72 − 3,7)2+ (3,38 − 3,54)2 = 0,42308

Hasil perhitungan jarak ke setiap non-medoid baru dapat dilihat pada Tabel 8.

Tabel 8. Perhitungan Jarak Euclidean Distance Iterasi 2

No Nama Mahasiswa Jarak 1 Jarak 2 Jarak 3 Kedekatan Cluster 1 ADIDTIYA PUTRA

CANIAGO 0 0,281957 0,423084 0 1

2 ALFA RAZI 0,901499 0,843682 1,107475 0,843682 2 3 ALICIA MULYA

MAHARANI 0,511273 0,518556 0,311769 0,311769 3 4 AMALIA

RAUDHATUL ILMI 0,497795 0,499099 0,246171 0,246171 3 5 ANISA 0,488365 0,469255 0,18735 0,18735 3 6 ANISA SURYANI

PANGGABEAN 0,444747 0,427902 0,501398 0,427902 2

113 ZULMAHDI HERLI 0,423084 0,309677 0 0 3 110 YOSIA

SITUMORANG 0,420714 0,248797 0,524023 0,248797 2 Total Jarak Kedekatan (Distance) 73,69160696

Tabel 8 mejelaskan warna hijau muda mendefinisikan kedekatan cluster 1, warna jingga mendefinisikan kedekatan cluster 2, dan warna biru muda mendefinisikan kedekatan cluster 3. Total jarak kedekatan (distance) pada iterasi kedua adalah 73,69160696, dengan jumlah cluster 1 sebanyak 7 mahasiswa, cluster 2 sebanyak 48 mahasiswa, dan cluster 3 sebanyak 58 mhasiswa.

5. Pada iterasi kedua telah mendapatkan nilai total jarak (distance). Langkah selanjutnya hitung total simpangan (S) dengan menghitung total distance baru dikurang dengan total distance lama. Jika nilai S < 0, maka tukarkan objek dengan data cluster non-medoids untuk membentuk kumpulan k objek baru sebagai medoids.

𝑆 = Total Distance Baru − Total Distance Lama 𝑆 = 73,69160696− 44,47889977

𝑆 = 29,21270719

Dengan 𝑆 > 0 maka proses cluster dihentikan. Sehingga iterasi cluster yang diambil adalah pada iterasi yang lama, dari hasil clustering menggunakan K- Medoid dapat diperoleh anggota tiap cluster yang dapat dilihat pada Tabel 9.

(9)

Tabel 9 Hasil Clustering No NIM Nama Mahasiswa

L / P

Jarak 1 Jarak 2 Jarak 3 Kedekatan Cluster

1 2003111124 ALFA RAZI L 0,606548 6,521112 1,198541 0,607 1 2 2003114204 ANNISYA

FATIHATURRAHMA P 1,008464 6,065872 1,485665 1,008 1 3 2003111566 DIAN ADELIA PUTRI P 0,454753 6,959382 0,639844 0,455 1 4 2003113946 DONNY SAPUTRA L 0,453652 7,095717 0,462169 0,454 1

112 2003134722 ZUHRIE FEBRI ADI

RAHMANA L 0,637809 7,441546 0,1772 0,177 3 113 2003111130 ZULMAHDI HERLI L 0,524023 7,413474 0,146969 0,147 3

Pada Tabel 9 menjelaskan cluster 1 terdapat 40 mahasiswa, cluster 2 terdapat 5 mahasiswa, dan cluster 3 terdapat 68 mahasiswa yang merupakan hasil perhitungan K-Medoids clustering dari data 1 sampai data ke 113 dengan menggunakan persamaan euclidean distance.

c. Proses Evaluasi

Untuk mengetahui hasil evaluasi dari beberapa clustering menggunakan Silhouette Coefficient, untuk memperoleh nilai kualiatas dari cluster. Kualitas suatu cluster dapat dikatakan baik apabila berada pada range 0-1. Apabila kualitas suatu cluster mendekati 1 maka cluster tersebut akan semakin bagus.

Adapun langkah-langkah proses evaluasi dengan menggunakan algoritma shilouette coefficient cluster K=3 adalah sebagai berikut:

1. Menghitung rata-rata jarak objek dengan semua objek lain yang berada dalam satu cluster. Dengan persamaan a(i):

a(i) = 1

[A]−1∑𝑗 ∈𝐴,𝑗≠𝑖 d(i, j) a(i) cluster 1 untuk data 1:

a(d1,1)=

(√(3,58 − 3,58)2+ (3,48 − 3,48)2+ (3,3 − 3,3)2+ (2,59 − 2,59)2+ ⋯

√… + (3,67 − 3,48)2+ (3,47 − 3,3)2+ (3,14 − 2,59)2 )/39

= 0,831350830398558

a(i) cluster 3 untuk data 68:

(d3,68)=

(√(3,69 − 3,72)2+ (3,47 − 3,86)2+ (3,72 − 3,7)2+ ⋯

√… + (3,86 − 3,47)2+ (3,7 − 3,72)2+ (3,54 − 3,38)2 )/67

= 0,831350830398558

2. Kemudian menghitung rata-rata jarak objek dengan semua objek cluster lain.

Kemudian ambil nilai terkecil dari semua jarak rata-rata tersebut. Nilai ini disebut 𝑏(𝑖). Dengan persamaan b(i):

𝑏(i) = 1

[A]∑𝑗 ∈ C d(i, j)

(10)

b(i) untuk cluster 1 pada data 1 terhadap cluster 3 pada data 1:

b(d1.1, d3.1)=

√(3,58 − 3,58)2+ (3,48 − 3,48)2+ (3,3 − 3,3)2+ (2,59 − 2,59)2+ ⋯

√… + (3,86 − 3,48)2+ (3,7 − 3,3)2+ (3,54 − 2,59)2 )/68

= 1,20333061059925

b(i) untuk cluster 3 pada data 68 terhadap cluster 1 pada data 40:

b(d3.68, d1.40)=

√(3,58 − 3,72)2+ (3,48 − 3,86)2+ (3,3 − 3,7)2+ (2,59 − 3,54)2+ ⋯

√… + (3,67 − 3,86)2+ (3,47 − 3,7)2+ (3,14 − 3,54)2 )/68

= 0,818263533365821

3. Kemudian menghitung nilai silhouette coefficient dengan menggunakan persamaan:

𝑆(𝑖) = 𝑏(𝑖)−𝑎(𝑖)

max(𝑎(𝑖),𝑏(𝑖))

𝑆(𝑑𝑎𝑡𝑎1) =1,20333061059925 − 0,831350830398558

1,20333061059925 = 0,309125170526036

….

𝑆(𝑑𝑎𝑡𝑎113) = 0,818263533365821 − 0,263857070174413

0,818263533365821 = 0,677540230726071 Setelah didapatkan nilai s(i) pada masing-masing data, selanjutnya yaitu mencari nilai s global yang mewakili seluruh cluster. Nilai ini didapatkan dengan menghitung rata-rata hasil s(i) yang dimiliki:

rata-rata silhouette coefficient global

(S) = 𝑆(𝑑𝑎𝑡𝑎1) + 𝑆(𝑑𝑎𝑡𝑎2) + 𝑆(𝑑𝑎𝑡𝑎3) + … 𝑆(𝑑𝑎𝑡𝑎113)/ jumlah data =

((0,309125170526036) + (0,218946922321954) + (-0,166048296293746) +

…+(0,677540230726071)) / 113 = 0.3920767828301593

Maka nilai Silhouette Coefficient untuk cluster dengan K=3 adalah 0.3920767828301593.

Dari hasil proses perhitungan shilouette coefficient terhadap data indeks pretasi semester 1 sampai indeks prestasi semester 4 mahasiswa Jurusan Ilmu Komputer Angkatan 2020 Prodi Sistem Informasi, pada cluster K=3 maka hasil nilai shilouette coefficient = 0.3920767828301593.

d. Analisa Hasil

Berdasarkan hasil analisis proses pengelompokan evaluasi akademik mahasiswa Jurusan Ilmu Komputer Universitas Riau menggunakan metode K-Medoids Clustering, maka untuk mengetahui karakteristik dari setiap cluster, dilakukan perhitungan rata-rata dari IP setiap cluster seperti terdapat pada Tabel 10.

Tabel 10. Rata-Rata IP Setiap Cluster Cluster

Rata-Rata dari IP

Sem 1

Rata-Rata dari IP

Sem 2

Rata-Rata dari IP

Sem 3

Rata-Rata dari IP

Sem 4

Rata- Rata Total

Cluster 1 3,54175 3,584 3,41025 2,962 3,3745

Cluster 2 1,142 0,132 0 0 0,3185

Cluster 3 3,72809 3,80029 3,73485 3,63691 3,72504

(11)

Dari Tabel 10 dapat disimpulkan dari rata-rata total bahwa cluster 1 merupakan mahasiswa normal, cluster 2 merupakan mahasiswa bermasalah, dan cluster 3 merupakan mahasiswa berprestasi.

Adapun hasil dari clustering dengan K=3, dari seluruh mahasiswa 113 data mahasiswa yaitu:

1. Cluster 1 (mahasiswa normal/biasa) terdapat 40 mahasiswa.

2. Cluster 2 (mahasiswa bermasalah) terdapat 5 mahasiswa.

3. Cluster 3 (mahasiswa berprestasi) terdapat 68 mahasiswa.

KESIMPULAN

Berdasarkan penelitian yang telah dilakukan, dapat disimupulkan beberapa hal sebagai berikut:

1. K-Medoids berguna untuk mengatasi kekurangan K-Means yang sensitif dari outliner/pencilan karena suatu objek dengan suatu nilai besar mungkin secara substansial menyimpang dari distribusi data.

2. Proses pengelompokan evaluasi akademik mahasiswa Jurusan Ilmu Komputer Universitas Riau menggunakan metode K-Medoids clustering adalah processing data dengan K-Medoid Clustering, Proses Evaluasi dan analisa hasil.

3. Berdasarkan dari proses penelitian didapatkan hasil analisis pada masing-masing cluster, maka cluster pertama yaitu mahasiswa normal/biasa saja dengan jumlah 40 mahasiswa. Untuk cluster ke-dua yaitu mahasiswa bermasalah dengan jumlah 5 mahasiswa. Sedangkan cluster ke-tiga merupakan cluster mahasiswa berprestasi dengan jumlah 68 mahasiswa. Dari hasil tersebut dapat dilihat mahasiswa berprestasi yang mendominasi suatu cluster.

4. Hasil evaluasi Silhouette Cefficient pada clustering pengelompokan evaluasi akademik mahasiswa Jurusan Ilmu Komputer Universitas Riau angakatan 2020 Prodi Sistem Informasi cluster dengan K=3 adalah 0.3920767828301593 dengan kelompok Weak Structure (Klaster Lemah).

SARAN

Berdasarkan kesimpulan yang telah disebutkan, maka saran dari penelitian ini adalah sebagai berikut:

1. Penelitian ini hanya Mahasiswa Jurusan Ilmu Komputer Universitas Riau angkatan 2020 Prodi Sitem Informasi, untuk penelitian selanjutnya diharapkan bisa dilanjutkan angkatan-angkatan berikutnya dan Prodi lainnya.

2. Penelitian ini juga dapat dikembangkan dengan metode clustering lain.

3. Penelitian ini juga dapat menggunakan metode evaluasi lain.

UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada bapak Alfirman, M.Kom., yang telah membimbing, memotivasi serta membantu penelitian dan penulisan karya ilmiah ini.

(12)

DAFTAR PUSTAKA

Ariyanti, L., Satria, M. N. D., & Alita, D. (2020). Sistem Informasi Akademik Dan Administrasi Dengan Metode Extreme Programming Pada Lembaga Kursus Dan Pelatihan. Jurnal Teknologi Dan Sistem Informasi, 1(1), 90–96.

Kartikawati, L. (2022). Analisis Kualitas Pengelompokkan Algoritma K-Means di Knime dan Excel untuk PTMT Pasca Vaksinasi Covid-19. Ideguru: Jurnal Karya Ilmiah Guru, 7(1), 70–79.

Khotimah, R. H., Radjah, C. L., & Handarini, D. M. (2016). Hubungan antara konsep diri akademik, efikasi diri akademik, harga diri dan prokrastinasi akademik pada siswa SMP negeri di kota malang. Jurnal Kajian Bimbingan Dan Konseling, 1(2), 60–67.

Marlina, D., Putri, N. F., Fernando, A., & Ramadhan, A. (2018). Implementasi Algoritma K-Medoids dan K-Means untuk Pengelompokkan Wilayah Sebaran Cacat pada Anak. J. CoreIT, 4(2), 64.

Nahdliyah, M. A., Widiharih, T., & Prahutama, A. (2019). Metode K-Medoids Clustering dengan Validasi Silhouette Index dan C-Index (Studi Kasus Jumlah Kriminalitas Kabupaten/Kota di Jawa Tengah Tahun 2018). Jurnal Gaussian, 8(2), 161–170.

Pristanti, H., & Kristin Wulansari, S. E. (2021). Pengaruh Pembelajaran Daring Terhadap Prestasi Mahasiswa di Era Pandemic Covid 19. CV Literasi Nusantara Abadi.

Pulungan, N., Suhada, S., & Suhendro, D. (2019). Penerapan Algoritma K-Medoids Untuk Mengelompokkan Penduduk 15 Tahun Keatas Menurut Lapangan Pekerjaan Utama. KOMIK (Konferensi Nasional Teknologi Informasi Dan Komputer), 3(1).

Rachman, D. A. C., Goejantoro, R., & Amijaya, F. D. T. (2021). Implementasi text mining pengelompokkan dokumen skripsi menggunakan metode k-means clustering.

EKSPONENSIAL, 11(2), 167–174.

Referensi

Dokumen terkait

o Merupakan suatu mekanisme interaksi baru (modern), antara pemerintah dengan masyarakat dan kalangan lain yang berkepentingan (stakeholder) dimana melibatkan penggunaan

Penelitian yang terkait dengan Penelitian mengenai Analisis Prestasi Akademik Mahasiswa Yang Mengikuti Organisasi Kemahasiswaan Menggunakan Metode K- Means Clustering

Berdasarkan hasil penelitian menunjukkan bahwa implementasi supervisi akademik pada mata pelajaran matematika di Sekolah Dasar Kecamatan Ciawi berjalan cukup baik

L’existence de l’intrigue est déterminée f o r m e r un thème et l’intrigue fixé qui sont par les trois éléments principaux dans le associés au lieu, au temps, à

Yang dimaksud dengan tim adalah tim yang dibentuk oleh Kepala Desa yang berjumlah paling banyak 11 (sebelas) orang terdiri atas unsur Perangkat Desa, kelembagaan

Kecuali dinyatakan lain, semua data bersumber dari berita media massa, dan tidak diterbitkan oleh PT Bank Commonwealth (PTBC). PTBC harus dijamin untuk dibebaskan dari tanggung

Reaksi Glukosa dengan Reagen Benedict (WHO, 2012).. Memasukkan 5 ml reagen Benedict ke dalam tabung reaksi. Kemudian meneteskan sebanyak 5-8 tetes urin ke dalam tabung tersebut dan

Salah satu pendekatan untuk dapat melakukan prakiraan laba adalah dengan analisis biaya-kapasitas-laba, karena dengan analisis ini dapat diketahui hubungan antara