Pencarian Association Rules Pada Data Lulusan Mahasiswa Perguruan Tinggi Menggunakan Algoritma FP-Growth

(1)

1.1. Latar Belakang

Association rules mining merupakan teknik data mining untuk menentukan hubungan diantara data atau bagaimana suatu kelompok data mempengaruhi suatu kelompok

data lain (Ruldeviyani & Fahrian 2008). Dengan kata lain, dapat dicarinya

keterhubungan antar data maupun antar kategori pada data skala besar.

Data dengan skala besar biasanya sering terdapat pada perusahaan maupun

instansi-instansi pendidikan seperti perguruan tinggi. Dari beberapa data yang ada

pada suatu perguruan tinggi salah satunya adalah data lulusan mahasiswa. Pada data

lulusan mahasiswa terdapat berbagai macam atribut yang ada pada data diri

mahasiswa yang dikumpulkan pada masa registrasi awal masuk perguruan tinggi dan

data akademik yang dikumpulkan pada masa perkuliahan hingga akhir perkuliahan.

Data diri mahasiswa yang dikumpulkan pada masa registrasi awal meliputi data

pribadi, data asal sekolah, data keluarga, dan data masuk program studi. Data

akademik yang dikumpulkan adalah data nilai mahasiswa pada setiap semesternya

dengan nama lain sebagai indeks prestasi (IP) yang nantinya akan diakumulasi

menjadi indeks prestasi kumulatif (IPK).

Dari data mahasiswa yang ada, terdapat beberapa atribut yang dapat menjadi

faktor lamanya masa studi seorang mahasiswa seperti jenis sekolah, jalur masuk,

fakultas, dan IPK. Jenis sekolah sebagai tempat mahasiswa itu mendapat pengajaran

sebelumnya, jalur masuk sebagai suatu penyeleksian untuk masuk perguruan tinggi,

fakultas sebagai pilihan konsentrasi mahasiswa yang memungkinkan mengakibatkan

perbedaan dalam segi akademik, dan IPK sebagai suatu penilaian terhadap hasil

(2)

Setiap tahunnya perguruan tinggi meluluskan mahasiswa dari berbagai

fakultas. Mahasiswa yang telah lulus dan mendapat gelar sarjana dari perguruan tinggi

berasal dari jalur masuk dan asal pendidikan yang berbeda-beda pada awalnya, serta

memiliki IPK dan lama masa studi yang berbeda-beda pula. Pencapaian gelar sarjana

membutuhkan waktu normal selama empat tahun, akan tetapi dalam praktiknya

banyak mahasiswa yang tidak selalu dapat menuntaskan studinya selama waktu

normal yang ditentukan.

Beragamnya atribut seperti jenis sekolah, jalur masuk, IPK, dan masa studi

membuat pihak perguruan tinggi sulit mencari dan mengetahui kombinasi atribut

mana yang sering muncul dan memiliki keterhubungan tinggi antar atribut pada data

lulusan mahasiswa. Maka dari itu, dibutuhkan suatu pendekatan untuk mendapatkan

kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut

dengan melakukan association rules mining pada data lulusan mahasiswa. Association rules mining dapat menghasilkan kombinasi atribut yang memiliki keterhubungan tinggi antar atribut dalam bentuk rules dengan melakukan pencarian

kombinasi atribut yang sering muncul terlebih dahulu.

Terdapat beberapa penelitian pada data mahasiswa yang telah dilakukan, yaitu

mengetahui keterhubungan data mahasiswa untuk meningkatkan indeks prestasi

menggunakan algoritma C 4.5 (Hartama, 2011), dan pengelompokan mahasiswa potensial drop out menggunakan metode clustering (Guchi, 2013). Untuk penelitian pada kasus yang sama yang telah dilakukan yaitu : mengetahui hubungan proses

masuk dengan tingkat kelulusan mahasiswa menggunakan algoritma Apriori (Ma’ruf,

2013) yang menghasilkan informasi tentang keberhasilan proses masuk mahasiswa itu

berasal dari mana untuk menjadi acuan dalam memaksimalkan iklan pada daerah

tertentu, pada penelitiannya memiliki kekurangan dari segi algoritma dan data,

algoritma yang digunakan adalah algoritma apriori yang melakukan candidate generate dari setiap item sehingga memerlukan banyak perulangan pencarian ke database, juga data yang digunakan pada penilitian ini belum menggunakan data yang

cukup banyak, sehingga hasil yang diperoleh masih belum signifikan. Penelitian

(3)

dengan algoritma regresi linier berganda (Siregar, 2011) yang menghasilkan sebanyak

61% keterhubungan antara data mahasiswa terhadap masa studi, pada penilitian ini

memiliki kekurangan pada data yang masih sedikit, berdasarkan kedua penelitian

sebelumnya penulis akan menganalisis data lulusan mahasiswa dengan mengambil

algoritma lain pada teknik association rules mining yaitu algoritma FP-Growth sebagai algoritma yang akan digunakan pada penelitian penulis, dan menggunakan

data yang lebih banyak dari penelitian sebelumnya.

Algoritma Frequent Pattern-Growth (FP-Growth) merupakan salah satu algoritma yang dapat digunakan pada teknik association rules mining untuk menentukan himpunan item yang paling sering muncul (frequent itemset) dalam sekumpulan data (Hutasoit, 2010). Algoritma ini hanya melakukan dua kali proses

scanning database untuk menentukan frequent itemset dalam bentuk FP-Tree. Algoritma FP-Growth telah digunakan pada data mining seperti pencarian association rules terhadap barang sebuah butik (Hutasoit, 2010), dan penentuan kelayakan sertifikasi guru berdasarkan keterkaitan NUPTIK (Ramdanie, et al. 2013).

Pada penelitian ini, penulis akan menganalisis data lulusan mahasiswa suatu

perguruan tinggi yang didalamnya terdapat atribut jenis sekolah, jalur masuk, fakultas,

IPK, dan masa studi menggunakan algoritma FP-Growth. Hasil yang didapat nantinya

berupa rules yang sering muncul dan memiliki keterhubungan tinggi antar atribut pada

data lulusan mahasiswa perguruan tinggi.

1.2. Rumusan Masalah

Beragamnya atribut pada data lulusan mahasiswa seperti jenis sekolah, jalur masuk,

fakultas, IPK, dan masa studi membuat pihak perguruan tinggi sulit mencari dan

mengetahui rules yang berisikan kombinasi atribut yang sering muncul dan memiliki

keterhubungan tinggi antar atribut. Oleh karena itu, dibutuhkan suatu pendekatan

(4)

1.3. Batasan Masalah

Pada penelitian ini, penulis memberi batasan sebagai berikut.

1. Hanya meneliti lulusan mahasiswa S1 reguler dari suatu perguruan tinggi.

2. Parameter yang digunakan adalah jenis sekolah, jalur masuk, IPK, dan lama studi.

3. Jalur masuk yang digunakan adalah PMP, UMB, SNMPTN, dan SPMPRM

1.4. Tujuan Penelitian

Tujuan dari penelitian ini adalah mendapatkan association rules atau gabungan dari kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut

pada data lulusan mahasiswa perguruan tinggi menggunakan algoritma FP-Growth.

1.5. Manfaat Penelitian

Manfaat dari penelitian ini adalah sebagai berikut.

1. Mendapatkan informasi tentang bagaimana lulusan mahasiswa yang sering muncul

dan memiliki keterhubungan antar atribut yang tinggi berdasarkan rules yang didapat.

2. Rules yang dihasilkan dapat digunakan sebagai bahan dasar untuk memprediksi masa studi mahasiswa, sehingga dapat membantu pihak perguruan tinggi maupun

fakultas untuk dapat memberikan arahan kepada mahasiswa yang memiliki

kemiripan atribut terhadap salah satu rules untuk meningkatkan pembelajaran sehingga dapat meningkatkan tingkat kelulusan.

(5)

1.6. Metodologi

Terdapat beberapa tahapan dalam penelitian ini untuk menghasilkan suatu sistem

yang sesuai dengan yang diharapkan.

1. Studi Literatur

Kegiatan mempelajari dokumentasi literatur dan teori yang berkaitan dengan

penelitian. Dalam tahap ini merupakan proses pengumpulan referensi, baik buku,

jurnal, tesis, makalah dan sumber-sumber lain termasuk yang diperoleh dari

internet sebagai sumber data dan informasi yang berkaitan dengan data mining,

association rules mining, algoritma FP-Growth, dan data lulusan mahasiswa

perguruan tinggi di Sumatera Utara

2. Analisis Permasalahan

Pada tahap ini dilakukan analisis terhadap data yang telah dikumpulkan

sebelumnya untuk mendapatkan pemahaman mengenai teknik association rules mining dan algoritma FP-Growth yang akan digunakan dalam membangun sistem data mining.

3. Perancangan

Pada tahap ini dilakukan perancangan perangkat lunak yang dibangun, seperti

perancangan proses dan antarmuka.

4. Implementasi

Pada tahap ini dilakukannya pembangunan program dengan pengkodean perangkat

lunak sesuai dengan alur yang ditentukan.

5. Pengujian

Pada tahap ini dilakukannya pengujian terhadap perangkat lunak yang dibangun,

dan bagaimana keakuratan dari sistem yang dibuat.

6. Penyusunan Laporan

Pada tahap ini dilakukannya penulisan dokumentasi dan laporan mengenai

(6)

1.7. Sistematika Penulisan

Sistematika penulisan dari skripsi ini terdiri dari lima bagian utama sebagai berikut.

BAB 1 : PENDAHULUAN

Bab ini berisi latar belakang, rumusan masalah, batasan masalah, tujuan penelitian,

manfaat penelitian, metodologi penelitian, dan sistematika penulisan.

BAB 2 : LANDASAN TEORI

Bab ini berisi teori-teori yang digunakan untuk memahami permasalahan yang dibahas

pada penelitian ini. Pada bab ini dijelaskan data mining secara umum, association rules mining, dan algoritma FP-Growth.

BAB 3 : ANALISIS DAN PERANCANGAN

Bab ini membahas tentang perancangan sistem seperti data flow, dan perancangan sistem untuk melakukan pencarian association rules.

BAB 4 : IMPLEMENTASI DAN PENGUJIAN

Bab ini berisi pembahasan tentang implementasi dari analisis dan perancangan

perangkat lunak yang disusun pada Bab 3 dan pengujian terhadap sistem yang

dibangun.

BAB 5 : KESIMPULAN DAN SARAN

Bab ini berisi kesimpulan dari keseluruhan uraian bab-bab sebelumnya dan