1.1. Latar Belakang
Association rules mining merupakan teknik data mining untuk menentukan hubungan diantara data atau bagaimana suatu kelompok data mempengaruhi suatu kelompok
data lain (Ruldeviyani & Fahrian 2008). Dengan kata lain, dapat dicarinya
keterhubungan antar data maupun antar kategori pada data skala besar.
Data dengan skala besar biasanya sering terdapat pada perusahaan maupun
instansi-instansi pendidikan seperti perguruan tinggi. Dari beberapa data yang ada
pada suatu perguruan tinggi salah satunya adalah data lulusan mahasiswa. Pada data
lulusan mahasiswa terdapat berbagai macam atribut yang ada pada data diri
mahasiswa yang dikumpulkan pada masa registrasi awal masuk perguruan tinggi dan
data akademik yang dikumpulkan pada masa perkuliahan hingga akhir perkuliahan.
Data diri mahasiswa yang dikumpulkan pada masa registrasi awal meliputi data
pribadi, data asal sekolah, data keluarga, dan data masuk program studi. Data
akademik yang dikumpulkan adalah data nilai mahasiswa pada setiap semesternya
dengan nama lain sebagai indeks prestasi (IP) yang nantinya akan diakumulasi
menjadi indeks prestasi kumulatif (IPK).
Dari data mahasiswa yang ada, terdapat beberapa atribut yang dapat menjadi
faktor lamanya masa studi seorang mahasiswa seperti jenis sekolah, jalur masuk,
fakultas, dan IPK. Jenis sekolah sebagai tempat mahasiswa itu mendapat pengajaran
sebelumnya, jalur masuk sebagai suatu penyeleksian untuk masuk perguruan tinggi,
fakultas sebagai pilihan konsentrasi mahasiswa yang memungkinkan mengakibatkan
perbedaan dalam segi akademik, dan IPK sebagai suatu penilaian terhadap hasil
Setiap tahunnya perguruan tinggi meluluskan mahasiswa dari berbagai
fakultas. Mahasiswa yang telah lulus dan mendapat gelar sarjana dari perguruan tinggi
berasal dari jalur masuk dan asal pendidikan yang berbeda-beda pada awalnya, serta
memiliki IPK dan lama masa studi yang berbeda-beda pula. Pencapaian gelar sarjana
membutuhkan waktu normal selama empat tahun, akan tetapi dalam praktiknya
banyak mahasiswa yang tidak selalu dapat menuntaskan studinya selama waktu
normal yang ditentukan.
Beragamnya atribut seperti jenis sekolah, jalur masuk, IPK, dan masa studi
membuat pihak perguruan tinggi sulit mencari dan mengetahui kombinasi atribut
mana yang sering muncul dan memiliki keterhubungan tinggi antar atribut pada data
lulusan mahasiswa. Maka dari itu, dibutuhkan suatu pendekatan untuk mendapatkan
kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut
dengan melakukan association rules mining pada data lulusan mahasiswa. Association rules mining dapat menghasilkan kombinasi atribut yang memiliki keterhubungan tinggi antar atribut dalam bentuk rules dengan melakukan pencarian
kombinasi atribut yang sering muncul terlebih dahulu.
Terdapat beberapa penelitian pada data mahasiswa yang telah dilakukan, yaitu
mengetahui keterhubungan data mahasiswa untuk meningkatkan indeks prestasi
menggunakan algoritma C 4.5 (Hartama, 2011), dan pengelompokan mahasiswa potensial drop out menggunakan metode clustering (Guchi, 2013). Untuk penelitian pada kasus yang sama yang telah dilakukan yaitu : mengetahui hubungan proses
masuk dengan tingkat kelulusan mahasiswa menggunakan algoritma Apriori (Ma’ruf,
2013) yang menghasilkan informasi tentang keberhasilan proses masuk mahasiswa itu
berasal dari mana untuk menjadi acuan dalam memaksimalkan iklan pada daerah
tertentu, pada penelitiannya memiliki kekurangan dari segi algoritma dan data,
algoritma yang digunakan adalah algoritma apriori yang melakukan candidate generate dari setiap item sehingga memerlukan banyak perulangan pencarian ke database, juga data yang digunakan pada penilitian ini belum menggunakan data yang
cukup banyak, sehingga hasil yang diperoleh masih belum signifikan. Penelitian
dengan algoritma regresi linier berganda (Siregar, 2011) yang menghasilkan sebanyak
61% keterhubungan antara data mahasiswa terhadap masa studi, pada penilitian ini
memiliki kekurangan pada data yang masih sedikit, berdasarkan kedua penelitian
sebelumnya penulis akan menganalisis data lulusan mahasiswa dengan mengambil
algoritma lain pada teknik association rules mining yaitu algoritma FP-Growth sebagai algoritma yang akan digunakan pada penelitian penulis, dan menggunakan
data yang lebih banyak dari penelitian sebelumnya.
Algoritma Frequent Pattern-Growth (FP-Growth) merupakan salah satu algoritma yang dapat digunakan pada teknik association rules mining untuk menentukan himpunan item yang paling sering muncul (frequent itemset) dalam sekumpulan data (Hutasoit, 2010). Algoritma ini hanya melakukan dua kali proses
scanning database untuk menentukan frequent itemset dalam bentuk FP-Tree. Algoritma FP-Growth telah digunakan pada data mining seperti pencarian association rules terhadap barang sebuah butik (Hutasoit, 2010), dan penentuan kelayakan sertifikasi guru berdasarkan keterkaitan NUPTIK (Ramdanie, et al. 2013).
Pada penelitian ini, penulis akan menganalisis data lulusan mahasiswa suatu
perguruan tinggi yang didalamnya terdapat atribut jenis sekolah, jalur masuk, fakultas,
IPK, dan masa studi menggunakan algoritma FP-Growth. Hasil yang didapat nantinya
berupa rules yang sering muncul dan memiliki keterhubungan tinggi antar atribut pada
data lulusan mahasiswa perguruan tinggi.
1.2. Rumusan Masalah
Beragamnya atribut pada data lulusan mahasiswa seperti jenis sekolah, jalur masuk,
fakultas, IPK, dan masa studi membuat pihak perguruan tinggi sulit mencari dan
mengetahui rules yang berisikan kombinasi atribut yang sering muncul dan memiliki
keterhubungan tinggi antar atribut. Oleh karena itu, dibutuhkan suatu pendekatan
1.3. Batasan Masalah
Pada penelitian ini, penulis memberi batasan sebagai berikut.
1. Hanya meneliti lulusan mahasiswa S1 reguler dari suatu perguruan tinggi.
2. Parameter yang digunakan adalah jenis sekolah, jalur masuk, IPK, dan lama studi.
3. Jalur masuk yang digunakan adalah PMP, UMB, SNMPTN, dan SPMPRM
1.4. Tujuan Penelitian
Tujuan dari penelitian ini adalah mendapatkan association rules atau gabungan dari kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut
pada data lulusan mahasiswa perguruan tinggi menggunakan algoritma FP-Growth.
1.5. Manfaat Penelitian
Manfaat dari penelitian ini adalah sebagai berikut.
1. Mendapatkan informasi tentang bagaimana lulusan mahasiswa yang sering muncul
dan memiliki keterhubungan antar atribut yang tinggi berdasarkan rules yang didapat.
2. Rules yang dihasilkan dapat digunakan sebagai bahan dasar untuk memprediksi masa studi mahasiswa, sehingga dapat membantu pihak perguruan tinggi maupun
fakultas untuk dapat memberikan arahan kepada mahasiswa yang memiliki
kemiripan atribut terhadap salah satu rules untuk meningkatkan pembelajaran sehingga dapat meningkatkan tingkat kelulusan.
1.6. Metodologi
Terdapat beberapa tahapan dalam penelitian ini untuk menghasilkan suatu sistem
yang sesuai dengan yang diharapkan.
1. Studi Literatur
Kegiatan mempelajari dokumentasi literatur dan teori yang berkaitan dengan
penelitian. Dalam tahap ini merupakan proses pengumpulan referensi, baik buku,
jurnal, tesis, makalah dan sumber-sumber lain termasuk yang diperoleh dari
internet sebagai sumber data dan informasi yang berkaitan dengan data mining,
association rules mining, algoritma FP-Growth, dan data lulusan mahasiswa
perguruan tinggi di Sumatera Utara
2. Analisis Permasalahan
Pada tahap ini dilakukan analisis terhadap data yang telah dikumpulkan
sebelumnya untuk mendapatkan pemahaman mengenai teknik association rules mining dan algoritma FP-Growth yang akan digunakan dalam membangun sistem data mining.
3. Perancangan
Pada tahap ini dilakukan perancangan perangkat lunak yang dibangun, seperti
perancangan proses dan antarmuka.
4. Implementasi
Pada tahap ini dilakukannya pembangunan program dengan pengkodean perangkat
lunak sesuai dengan alur yang ditentukan.
5. Pengujian
Pada tahap ini dilakukannya pengujian terhadap perangkat lunak yang dibangun,
dan bagaimana keakuratan dari sistem yang dibuat.
6. Penyusunan Laporan
Pada tahap ini dilakukannya penulisan dokumentasi dan laporan mengenai
1.7. Sistematika Penulisan
Sistematika penulisan dari skripsi ini terdiri dari lima bagian utama sebagai berikut.
BAB 1 : PENDAHULUAN
Bab ini berisi latar belakang, rumusan masalah, batasan masalah, tujuan penelitian,
manfaat penelitian, metodologi penelitian, dan sistematika penulisan.
BAB 2 : LANDASAN TEORI
Bab ini berisi teori-teori yang digunakan untuk memahami permasalahan yang dibahas
pada penelitian ini. Pada bab ini dijelaskan data mining secara umum, association rules mining, dan algoritma FP-Growth.
BAB 3 : ANALISIS DAN PERANCANGAN
Bab ini membahas tentang perancangan sistem seperti data flow, dan perancangan sistem untuk melakukan pencarian association rules.
BAB 4 : IMPLEMENTASI DAN PENGUJIAN
Bab ini berisi pembahasan tentang implementasi dari analisis dan perancangan
perangkat lunak yang disusun pada Bab 3 dan pengujian terhadap sistem yang
dibangun.
BAB 5 : KESIMPULAN DAN SARAN
Bab ini berisi kesimpulan dari keseluruhan uraian bab-bab sebelumnya dan