penerapan algoritma k-means clustering untuk

PENDAHULUAN

Latar Belakang

Penambangan data adalah proses memperoleh informasi dari basis data besar dengan mengekstraksi data menggunakan kumpulan data. Dengan kemajuan teknologi informasi, kini berkembang pesat dan mencakup hampir semua bidang. Kemajuan teknologi tersebut menghasilkan data dalam jumlah yang besar dan banyak mulai dari industri, ekonomi, iptek dan berbagai bidang lainnya.

Penerapan teknologi informasi dalam dunia pendidikan juga dapat menghasilkan data yang melimpah terkait data dari siswa yang menempuh pendidikan. Misalnya dalam proses penerimaan mahasiswa baru, sebuah universitas akan menghasilkan data baru berupa profil mahasiswa baru. Jika dilakukan pengolahan data terhadap sumber data tersebut, maka dapat ditemukan berbagai informasi yang berguna untuk membantu menentukan strategi promosi penerimaan mahasiswa baru tahun depan.

Karakteristik yang dibutuhkan dalam pengolahan adalah asal mahasiswa, sekolah asal mahasiswa dan IPK mahasiswa. Berdasarkan karakteristik tersebut, data kemudian akan dikelompokkan menjadi siswa berdasarkan asal kota, asal sekolah, dan IPK siswa dengan menggunakan algoritma K-Means Clustering.

Rumusan Masalah

Batasan Masalah

Data yang digunakan adalah data mahasiswa Universitas Islam Negeri Sunan Kalijaga Yogyakarta Fakultas Sains dan Teknologi Program Studi Teknik Informatika angkatan 2009 sampai dengan angkatan 2016. Data atribut atau parameter yang digunakan adalah asal kota dan IPK semester 1 Teknik Informatika Program belajar.

Tujuan Penelitian

Manfaat Penelitian

Untuk membantu program sarjana Teknik Informatika menentukan langkah selanjutnya untuk menentukan bidang mana yang diprioritaskan untuk kemajuan. Membantu program studi Teknik Informatika sebagai bahan pertimbangan dalam menentukan langkah selanjutnya dalam penerimaan mahasiswa baru.

Keaslian Penelitian

Sistematika Penulisan

TINJAUAN PUSTAKA DAN LANDASAN TEORI

Tinjauan Pustaka

Pada penelitian sebelumnya (Johan Oscar Ong, 2013) dengan judul Implementasi Algoritma K-Means Clustering untuk Menentukan Strategi Pemasaran President University, penelitian ini bertujuan untuk mengetahui strategi promosi yang dapat diterapkan oleh pemasaran President University. Kajian selanjutnya (Fina Nasari, 2015) dengan judul Penerapan K-Means Clustering Pada Data Penerimaan Mahasiswa Baru (Studi Kasus: Potensi Universitas Utama) berupaya untuk menentukan jurusan apa. Pada penelitian sebelumnya (Andi Wijanarko, 2016) berjudul Penerapan Data Mining Untuk Menentukan Strategi Promosi Universitas PGRI Yogyakarta Menggunakan Algoritma K-means Clustering.

Penelitian ini melakukan strategi promosi Universitas PGRI Yogyakarta dengan menggunakan K-means clustering untuk mengetahui sebaran wilayah berdasarkan indeks prestasi mahasiswa. Penelitian selanjutnya (Nopal Febrian, 2017) berjudul “Penerapan Data Mining Untuk Menentukan Pengelompokan Uang Kuliah Tunggal (UKT) UIN Sunan Kalijaga Menggunakan Algoritma K-Means Clustering.” Penelitian ini bertujuan untuk mengetahui pola penentuan kelompok belajar tunggal (UKT) menggunakan algoritma k-means clustering di Universitas Islam Negeri (UIN) Sunan Kalijaga, memahami tahapan clustering data menggunakan algoritma k-means clustering dan diimplementasikan untuk kuliah tunggal pengelompokan uang.

Pada penelitian sebelumnya (Akhmad Choerudin Wakhid, 2017) berjudul Implementasi Data Mining Menggunakan Algoritma K-Means Clustering Untuk Mengetahui Pola Pemilihan Program. SMP rata-rata jurusannya Sistem Informasi dan kalau asal sekolahnya SMK maka rata-rata jurusannya diikuti.

Landasan Teori

Data Mining
Teknik – Teknik Data Mining
Algoritma K-Means Clustering
Konsep Aplikasi Berbasis Web
Definisi Sistem
World Wide Web
Data Flow Diagram (DFD)
Entity-Relationship Diagram (ERD)
Pengolahan DataMicrosoft Excel

METODE PENELITIAN

Metode Penelitian

Metode clustering K-Means merupakan proses pengelompokan data ke dalam sebuah cluster dengan titik tengah yang berbeda untuk setiap cluster. Aplikasi kedua dari algoritma K-Means Clustering, peneliti menggunakan aplikasi yang dibuat dengan bahasa pemrograman PHP. Sistem yang digunakan dalam implementasi ini menggunakan metode yang sama dengan metode algoritma K-Means Clustering.

Masukan data untuk proses ini adalah centroid baru yang diperoleh dari proses K-Means Clustering yang selanjutnya akan disimpan di tabel database old_centroid. Data dalam tabel ini nantinya akan diolah menggunakan algoritma K-Means Clustering pada sistem aplikasi ini. Data yang digunakan untuk mengimplementasikan sistem ini adalah data yang sama persis dengan data yang sebelumnya digunakan untuk mengimplementasikan algoritma K-Means Clustering menggunakan Microsoft Excel 2010.

Setelah proses K-Means Clustering selesai, sistem akan menampilkan perhitungan titik pusat/nilai pusat cluster baru dan informasi atau petunjuk untuk halaman proses ini di sisi kanan halaman. Pada halaman proses ini, sistem akan terus mengulang proses K-Means Clustering hingga mendapatkan nilai center point cluster baru yang sama dengan nilai center point cluster lama.

Peralatan Penelitian

Perangkat Keras
Perangkat Lunak

Tahap – Tahap Penelitian

Pengumpulan Data
Pre-processingData
K-Means Clustering

HASIL DAN PEMBAHASAN

Objek Penelitian

Penelitian ini mengambil pokok bahasan yaitu data mahasiswa yang menempuh pendidikan teknik ilmu komputer dari tahun 2009 sampai dengan tahun 2016 beserta Indeks Prestasi Kumulatif (IPK) mahasiswa tersebut pada dua semester pertama (semester 1 dan semester 2) di UIN Sunan Kalijaga Yogyakarta. . Peneliti mengambil mahasiswa jurusan Informatika sebagai subjek penelitian karena jurusan Informatika di kampus tersebut baru berdiri pada tahun 2004.

Lokasi Penelitian

Menjadikan universitas sebagai pusat keunggulan dalam kajian dan penelitian yang saling berhubungan secara integratif.

Pengumpulan Data

Pre-processingData

DataReduction
DataCleaning
Data Transformation
Data Integration

Pada proses algoritma K-Means Clustering, data yang dapat diolah hanya diberikan berupa angka, sedangkan data pada atribut kota asal siswa dan sekolah asal siswa diberikan berupa teks, sehingga peneliti harus mengubah data menjadi angka agar dapat dilanjutkan dalam proses K-Means Clustering.Means Clustering. Setelah melalui tahapan proses K-Means Clustering menggunakan aplikasi Microsoft Excel 2010, proses selanjutnya adalah menampilkan hasil dari aplikasi tersebut. Proses pertama dari sistem K-Means Clustering adalah mengimpor file excel ke database dengan nama tabel yaitu data.

Pada proses ini, pengguna atau user cukup menekan tombol 'next process' pada sistem untuk masuk ke proses lain pada sistem K-Means Clustering. Berdasarkan Gambar 4.3, perancangan proses sistem terdiri dari dua proses yaitu proses clustering K-Means dan proses verifikasi. Prosedur centroid check merupakan prosedur untuk menentukan apakah proses clustering K-Means akan berulang atau tidak.

Sistem aplikasi K-Means Clustering memiliki beberapa tabel database yang digunakan untuk mendukung sistem aplikasi K-Means Clustering. Halaman aplikasi K-Means Clustering merupakan halaman awal dari rangkaian proses untuk sistem aplikasi K-Means Clustering ini. Pada halaman ini, pengguna akan diminta untuk mengimpor file Excel yang berisi sejumlah data yang kemudian akan diproses dengan algoritma K-Means Clustering pada sistem ini.

Peneliti menetapkan nilai centroid yang berbeda dengan nilai centroid awal yang digunakan pada penerapan algoritma K-Means Clustering dengan menggunakan aplikasi Microsoft Excel 2010. Setelah user menekan tombol proses maka secara otomatis sistem akan mengolah data menggunakan K-Means Algoritma Pengelompokan . Setelah membutuhkan 18 iterasi proses K-Means Clustering, akhirnya peneliti mendapatkan nilai titik pusat clustering baru dan nilai titik pusat clustering lama yang memiliki nilai yang sama.

Ketika nilai centroid baru yang muncul sama dengan nilai centroid lama, maka secara otomatis sistem akan menghentikan proses perulangan pada algoritma K-Means Clustering. Pada halaman hasil proses K-Means Clustering, sistem akan menampilkan jumlah iterasi dari proses K-Means, menampilkan data kota asal siswa dan sekolah asal siswa yang dicluster pada setiap cluster, beserta frekuensi dan rata-rata IPK jumlah siswa di setiap kelompok.

Tabel 4.1 Tabel Frekuensi Kota Asal Mahasiswa

Penerapan K-Means Clustering

Penerapan Algoritma Menggunakan Microsoft Excel 2010
Hasil Penerapan K-Means menggunakan Microsoft Excel 2010
Penerapan Algoritma Menggunakan Aplikasi PHP
Perancangan Sistem Aplikasi K-Means Clustering
Implementasi Sistem Aplikasi K-Means Clustering
Hasil Implementasi Sistem Aplikasi K-Means Clustering

PENUTUP

Kesimpulan

Penelitian ini menerapkan metode algoritma K-Means Clustering menggunakan dua aplikasi yaitu Microsoft Excel 2010 dan Sistem Aplikasi K-Means Clustering yang dirancang dan dibuat oleh peneliti. Strategi promosi yang tepat sasaran bagi calon mahasiswa baru di UIN Yogyakarta Jurusan Teknik Informatika adalah dengan mempertimbangkan kota asal mahasiswa dan asal sekolah mahasiswa berdasarkan hasil kelompok yang dibentuk sesuai dengan potensi akademik mahasiswa. Tujuan memajukan Teknik Informatika di UIN Sunan Kalijaga kedepannya agar dapat dilakukan berdasarkan kelompok 1 SMA di kota Bantul.

Dan cluster 3 berisi 62 kota dengan jumlah sekolah paling sedikit dan terbanyak masih berasal dari SMA. Dari penelitian yang telah diolah dengan metode k-means clustering menggunakan aplikasi excel dan bahasa pemrograman PHP, didapatkan hasil bahwa mahasiswa angkatan 2009 sampai 2016 terbagi menjadi 3 cluster, dimana pada cluster 1 terdapat mahasiswa dengan jumlah terbanyak. berasal dari kota dan sekolah. Sehingga pada cluster 2 berisi siswa dengan frekuensi kampung halaman yang lebih sedikit dibandingkan cluster 1.

Sedangkan cluster 3 memuat jumlah frekuensi yang berasal dari kota paling sedikit diantara ketiga hasil clustering.

Saran

Aplikasi Data Mining Untuk Menentukan Strategi Promosi Universitas PGRI Yogyakarta Menggunakan Algoritma K-means Clustering Yogyakarta: UIN Sunan Kalijaga. Aplikasi web ini terdiri dari 3 menu utama yaitu Home, K-Means Application dan Help.

Menu Bantuan adalah menu yang disiapkan untuk memberikan informasi tentang cara kerja atau cara kerja sistem aplikasi K-Means dan menjelaskan dengan jelas cara kerja aplikasi ini dan cara menggunakan aplikasi ini.

.