MENGGUNAKAN MARKET BASKET ANALYSIS
(Studi Kasus: Mahasiswa USMI Institut Pertanian Bogor)
Oleh
ADITYA PUTRA MAHARDIKA
H24076002
PROGRAM SARJANA MANAJEMEN PENYELENGGARAAN KHUSUS
DEPARTEMEN MANAJEMEN
FAKULTAS EKONOMI DAN MANAJEMEN
INSTITUT PERTANIAN BOGOR
Kompetensi Akademik Siswa SLTA Menggunakan Market Basket Analysis
(Studi Kasus: Mahasiswa USMI Institut Pertanian Bogor). Di bawah bimbingan
Muhammad Syamsun.
Dalam seleksi penentuan mahasiswa baru IPB menerapkan program USMI
yaitu penerimaan jalur masuk mahasiswa dengan sistem seleksi calon mahasiswa IPB
yang tidak menggunakan ujian tertulis, dasar penentuan mahasiswa jalur USMI
dinilai berdasarkan prestasi belajar selama 5 semester di SLTA. Jalur USMI biasanya
diterima dari siswa SLTA jalur IPA melalui tahap penilaian kompetensi akademik
atas peringkat dan nilai yang diperoleh siswa dalam 4 (empat) mata ajaran yaitu
Biologi, Fisika, Kimia dan Matematika dan prestasi dalam bidang kokulikuler dan
ekstrakulikuler.
Banyaknya data dari pelamar USMI dari tahun ke tahun hanya digunakan
pada saat seleksi selanjutnya data-data tersebut sebagai arsip, dan bahan laporan
sehingga terjadi penumpukan. Data-data tersebut seharusnya dapat digunakan sebagai
sumberdaya informasi. Untuk itu diperlukannya suatu cara untuk mempercepat dan
mengekstraksi data-data tersebut agar dapat memberikan informasi. Data mining
adalah salah satu cara untuk mengekstraks data, salah satu metode yang ada dalam
data mining adalah metode Market Basket Analysis. Metode Market Basket Analysis
ini menggunakan algoritma apriori yang merupakan jenis association rule pada data
mining. Tugas dari association rule adalah menganalisis kebiasaan yang berulang dan
mencari kombinasi dan frekuensi.
Tujuan yang ingin dicapai dalam penelitian ini adalah: 1) dapat menerapkan
sistem informasi manajemen melalui metode data mining dengan mengetahui aplikasi
Market basket analysis, 2) Mengidentifikasi pola-pola dari kaidah asosiasi
(association rules) yang berkaitan dengan data faktor-faktor yang mempengaruhi
(asal mahasiswa, nilai USMI, Jenis Kelamin, pilihan mayor dan nilai IPK) untuk
diketahui nilai-nilai support dan confidence, dan 3) Dapat mengamati kebiasaan dan
asosiasi faktor-faktor penentu dari pemilihan mahasiswa USMI yang terhadap nilai
IPK, sehingga didapat pola yang dapat membantu untuk keputusan dan rencana
strategis. Penelitian dilakukan di Institut Pertanian Bogor. Data yang di analisis
meliputi data kompetensi akademik dan data diri mahasiswa baru, serta data prestasi
akademik mahasiswa tersebut yang diperoleh dari Panitia Penerimaan Mahasiswa
Baru dan Direktorat Administrasi Pendidikan.
Dari teknik data mining dilakukan pembersihan data, integrasi data,
transformasi data, mining data serta presentasi hasil. Hasil Market Basket Analysis,
didapatkan 745 rules yang memenuhi aturan yang ditentukan. Implikasi Manajerial
yang didapat adalah dapat dilihatnya pola-pola yang dibentuk dari analisis yang
dilakukan dapat melihat faktor dan kompetensi akademik siswa SLTA yang masuk
dan memilih mayor tertentu, sehingga didapatkan peserta didik yang optimal dan
menghasilkan lulusan yang baik dan bermutu. Dengan menggunakan teknik serupa
dapat mempermudah bagi pimpinan IPB untuk menganalisis data-data lainnya yang
bisa digunakan sebagai informasi sehingga dapat dipergunakan secara efektif dan
efisien sebagai data dalam pengambilan keputusan strategis.
MENGGUNAKAN MARKET BASKET ANALYSIS
(Studi Kasus: Mahasiswa USMI Institut Pertanian Bogor)
SKRIPSI
Sebagai salah satu syarat untuk memperoleh gelar
SARJANA EKONOMI
pada Program Sarjana Manajemen Penyelenggaraan Khusus
Departemen Manajemen
Fakultas Ekonomi dan Manajemen
Institut Pertanian Bogor
Oleh
ADITYA PUTRA MAHARDIKA
H24076002
PROGRAM SARJANA MANAJEMEN PENYELENGGARAAN KHUSUS
DEPARTEMEN MANAJEMEN
FAKULTAS EKONOMI DAN MANAJEMEN
INSTITUT PERTANIAN BOGOR
(Studi Kasus: Mahasiswa USMI Institut Pertanian Bogor)
Nama
: Aditya Putra Mahardika
NIM
: H24076002
Menyetujui
Pembimbing,
(Dr.Ir. Muhammad Syamsun, M.sc)
NIP : 19500727 197412 1 001
Mengetahui
Ketua Departemen,
( Dr. Ir. Jono M. Munandar, M.Sc )
NIP : 196101231986011002
iii
Penulis dilahirkan di kota Sragen 4 Maret 1986. Penulis merupakan putra
pertama
dari
dua
bersaudara
pasangan
Bapak
Drs.
Suyadi
dan
Ibu Sri Winarsih, S.Pd.
Penulis menyelesaikan pendidikan dasar di SDN 3 Sragen pada tahun 1998,
kemudian melanjutkan pendidikannya di SLTPN 5 Sragen dan lulus pada tahun
2001. Pada tahun yang sama, penulis melanjutkan pendidikan di SMU Al-Islam 1
Surakarta dan lulus pada tahun 2004.
Penulis menyelesaikan pendidikan Diploma III tahun 2007 pada Program
Studi Agroteknologi Hasil Perikanan, Departemen Teknologi Hasil Perairan,
Fakultas Perikanan dan Ilmu Kelautan Institut Pertanian Bogor. Pada tahun yang
sama,
penulis
melanjutkan
kuliah
di
Program
Sarjana
Manajemen
Penyelenggaraan Khusus, Departemen Manajemen, Fakultas Ekonomi dan
Manajemen (FEM) IPB. Selain kuliah penulis membantu sebagai staff di
Direktorat Kemahasiswaan IPB.
Prestasi yang pernah diraih pada saat kuliah adalah menjadi penyaji tingkat
nasional pada PIMNAS XVIII dan pernah mendapatkan medali setara perunggu
pada PIMNAS XIX pada tahun 2006, dan beberapa lomba yang lain pernah
diikuti. Penulis aktif dalam beberapa organisasi yaitu Badan Eksekutif Mahasiswa
(BEM) Fakultas Perikanan dan Ilmu Kelautan tahun 2005 -2006, dan menjadi
layouter pada lembaga pers mahasiswa (LPM) BIRU 2006 -2007, pengurus
Extension of Manegement Club FEM IPB 2008-2009 dan menjadi panitia di
iv
Puji serta syukur penulis panjatkan ke Hadirat Allah SWT yang telah
memberikan rahmat dan hidayah-Nya, sehingga dapat menyelesaikan Skripsi
dengan judul Analisis Asosiasi Pilihan Mayor dengan Kompetensi Akademik
Siswa SLTA dengan Menggunakan Market Basket Analysis (Studi Kasus:
Mahasiswa USMI Institut Pertanian Bogor) sebagai salah satu syarat untuk
memperoleh gelar Sarjana pada Fakultas Ekonomi dan Manajemen IPB. Shalawat
dan salam semoga senantiasa tercurah limpahkan kepada Nabi Besar Muhammad
SAW.yang telah menjadi suari toladan dan contoh untuk menjadi manusia yang
sempurna.
Ucapan terima kasih yang sebesar-besarnya penulis sampaikan kepada :
1. Bapak Dr. Ir. Muhammad Syamsun, M.Sc selaku Dosen Pembimbing yang
selalu memberikan arahan, bimbingan dan motivasi dalam penyusunan skripsi
ini.
2. Ibu Heti Mulyati, S.TP., M.T., dan Dra. Siti Rahmawati, M.Pd sebagai Dosen
Penguji.
3. Ibu, Bapak, Adikku yang selalu memberikan dukungan doa dan kasih sayang
yang tidak pernah ada habisnya.
4. Seluruh Staff di kantor sekretariat Panitia Penerimaan Mahasiswa Baru,
Direktorat Administrasi Pendidikan IPB, dan di Direktorat Komunikasi dan
Sistem Informasi IPB yang telah memberikan banyak bantuan dalam
penyusunan skripsi ini.
5. Dosen-dosen di PSMPK Daparteman Manajemen IPB yang telah membagi
Ilmu dan sharing pengalaman yang luar biasa dalam menuntut ilmu.
6. Dr. Rimbawan dan Bapak Bambang Riyanto, S.Pi, M.Si serta seluruh pegawai
di Direktorat Kemahasiswaan terima kasih banyak atas pengalaman dan ilmu
yang luar biasa di bagi kepada penulis.
7. Ahmad, Pandu, Anafi, Yusi Saragi, Dewi, Wulan, Anita, Aris, Darussalam,
Thia, Cendana, Junius, Winda dan Keluarga Besar PSMPK DM IPB atas
persahabatan dan dukungannya.
8. Hari wardhana dan Teh Irin yang telah memberikan semangat tersendiri dalam
menuntuk ilmu di PSMPK IPB.
v
diberikan dalam penyusunan skripsi ini.
Penulis menyadari bahwa dalam penyusunan skripsi ini masih banyak
kekurangan, kritik dan saran yang membangun sangat diharapkan untuk
penyempurnaan skripsi ini. Akhir kata, semoga skripsi ini dapat bermanfaat bagi
semua pihak yang membutuhkan.
Bogor, Maret 2010
vi
Halaman
ABSTRAK
RIWAYAT HIDUP ...
iii
KATA PENGANTAR ...
iv
DAFTAR ISI ...
v
DAFTAR TABEL ...
viii
DAFTAR GAMBAR...
ix
DAFTAR LAMPIRAN ...
x
I.
PENDAHULUAN ...
1
1.1. Latar Belakang ...
1
1.2. Perumusan Masalah ...
3
1.3. Tujuan ...
3
1.4. Ruang Lingkup Penelitian...
4
1.5. Manfaat Penelitian...
4
II. TINJAUAN PUSTAKA ...
5
2.1. Sistem Informasi Manajemen ...
5
2.2. Data Mining ...
6
2.3. Association Rule Mining ...
8
2.4. Market Basket Analysis...
10
2.5 Algoritma Apriori...
11
2.6 Kompetensi Akademik ...
14
2.6. Penelitian Terdahulu...
14
III. METODOLOGI PENELITIAN ...
16
3.1. Kerangka Pemikiran Penelitian...
16
3.2. Metodologi Penelitian...
18
3.2.1. Lokasi dan waktu Penelitian...
18
3.2.2. Jenis dan Metode Pengumpulan Data ...
18
3.3. Metode Pengolahan dan Analisis Data ...
18
IV. HASIL DAN PEMBAHASAN ...
21
4.1. Kondisi umum Institut Pertanian Bogor ...
21
4.1.1 Latar Belakang Institut Pertanian Bogor ...
21
4.1.2 Visi, Misi dan Tujuan IPB...
23
4.1.3 Tujuan Pendidikan ...
24
4.1.4 Kurikulum...
25
4.1.5 Struktur Organisasi Institut Pertanian Bogor ...
27
4.1.6 Penerimaan Mahasiswa Baru...
27
vii
KESIMPULAN DAN SARAN...
44
1. Kesimpulan...
44
2. Saran
...
47
viii
No
Halaman
1. Confidence versus support ... 9
2. Uji normal nilai matematika SLTA mahasiswa USMI 2005-2008 ... 31
3. Uji normal nilai fisika SLTA mahasiswa USMI 2005-2008... 32
4. Uji normal nilai biologi SLTA mahasiswa USMI 2005-2008 ... 33
5. Uji Normal nilai kimia SLTA mahasiswa USMI 2005-2008... 33
6. Daftar sebaran jumlah mahasiswa USMI tahun 2005-2008 berdasarkan
pilihan mayor ... 36
7. Kode asal daerah mahasiswa USMI Tahun 2005-2008 ... 41
8. Atribut biner penilaian kompetensi mahasiswa USMI IPB
tahun 2005-2008 ... 42
ix
No
Halaman
1. Proses Sistem Informasi Manajemen...
5
2. Alur proses KDD (Knowledge Discovery in Database) ...
7
3. Pseudocode dari pembentukan kandidat itemset bersama
pemangkasannya...
13
4. Kerangka penelitian ...
17
5. Struktur organisasi Institut Pertanian Bogor ...
27
6. Presentase mahasiswa Program Sarjana (S1) IPB Melalui Jalur
Masuk USMI ...
29
7. Presentase Mahasiswa USMI Berdasarkan Jenis Kelamin ...
30
8. Asal daerah mahasiswa jalur USMI IPB 2005-2008...
31
9. Kurva normal nilai Matematika SLTA Mahasiswa USMI IPB
tahun 2005-2008 ...
32
10. Kurva normal nilai Fisika SLTA Mahasiswa USMI IPB tahun
2005-2008 ...
32
11. Kurva normal nilai Biologi SLTA Mahasiswa USMI IPB tahun
2005-2008 ...
33
12. Kurva normal nilai Kimia SLTA Mahasiswa USMI IPB tahun
2005-2008 ...
34
13 Kompetensi akademik SLTA Mahasiswa USMI IPB Tahun
2005-2008 ...
35
14. Perolehan IPK pada Tingkat Persiapan Bersama (TPB)
x
No.
Halaman
1. Hasil Nilai Analisis item pada atribut-atribut ... 66
2. Hasil Market Basket Analysis Berdasarkan IPK Tingkat Persiapan
-Bersama (TPB) ... 90
3. Hasil Market Basket Analysis Berdasarkan IPK Akhir Pada Tahun
Akademik 2008/2009 ... 91
4. Hasil Market Basket Analysis dengan menambahkan Variabel jenis
Kelamin Perempuan ... 94
5. Hasil Market Basket Analysis dengan menambahkan Varibel Jenis
1.1. Latar Belakang
Di dalam perkembangan zaman dan kemajuan teknologi, dunia
pendidikan dituntut untuk dapat memberikan pendidikan bermutu tinggi dan
dapat meningkatkan daya saingnya. Adanya trend untuk menuju world class
university, menyebabkan persaingan perguruan tinggi semakin ketat untuk
dapat menjadi universitas yang bertaraf internasional. Mulai dari riset,
penyelenggaraan pendidikan serta sistem administrasi diharuskan dapat
memenuhi standar untuk penyelenggaraan pendidikan yang bermutu. Institut
Pertanian Bogor adalah lembaga pendidikan tinggi yang mempunyai visi
sebagai perguruan tinggi bertaraf internasional dalam pengembangan
sumberdaya manusia dan IPTEKS dengan kompetensi utama di bidang
pertanian tropika (Panduan Sarjana IPB, 2008), untuk itu dalam
perkembangannya IPB menyelenggarakan pendidikan bermutu tinggi dan
pembinaaan kemahasiswaan yang komprehensif dalam rangka untuk
meningkatkan daya saing bangsa.
Dalam penyelenggaran pendidikan tinggi yang bermutu, IPB
menerima mahasiswa baru melalui 5 (lima) jalur yaitu : Undangan Seleksi
Masuk IPB (USMI), Seleksi Penerimaan Mahasiswa Baru (SPMB),
Undangan khusus bagi lulusan SLTA yang mempunyai prestasi nasional
maupun internasional, Seleksi Penerimaan Mahasiswa Beasiswa Utusan
Daerah (BUD),dan Ujian Talenta Mandiri IPB (UTMI) (panduan Sarjana
IPB, 2009). Jalur USMI adalah sistem seleksi calon mahasiswa IPB yang
tidak menggunakan ujian tertulis, Jalur ini biasanya diterima dari siswa
SLTA jalur IPA melalui tahap penilaian kompetensi akademik atas peringkat
dan nilai yang diperoleh siswa dalam 4 (empat) mata ajaran yaitu Biologi,
Fisika, Kimia dan Matematika dan prestasi dalam bidang kokulikuler dan
ekstrakulikuler, dasar penentuan mahasiswa jalur USMI dinilai berdasarkan
prestasi belajar selama 5 semester di SLTA.
Penerimaan mahasiswa Jalur USMI ditetapkan oleh IPB melalui
undangan kepada sejumlah SLTA di seluruh Indonesia dan luar negeri.
Setelah diterima mahasiswa USMI melanjutkan kuliah dengan melalui proses
tingkat persiapan bersama, selanjutnya pada semester 3 (tiga) dilanjutkan
kuliah mayor minor sampai tahap kelulusan. Penilaian hasil belajar di IPB
dinilai dari beberapa segi yaitu penilaian matakuliah, penilaian semester,
penilaian TPB, penilaian interdep, penilaian mayor, penilaian minor,
penilaian akhir tahun akademik dan penilaian akhir program (Panduan
Sarjana IPB, 2008).
Jalur masuk USMI merupakan jalur yang digunakan untuk memilih
mayoritas (60%) mahasiswa IPB, sehingga perlunya suatu informasi dari
berbagai data untuk mengetahui korelasi tingkat kemampuan pendidikan di
SMA dengan jurusan yang diambil. Banyaknya data dari pelamar USMI dari
tahun ke tahun hanya digunakan pada saat penyeleksian saja, selanjutnya data
tersebut disimpan sebagai bahan laporan dan arsip. Data yang disimpan
menumpuk sehingga terjadi penumpukan data atau sering disebut gunung
data. Data-data tersebut seharusnya dapat digunakan sebagai sumberdaya
informasi, untuk itu diperlukannya suatu cara untuk mempercepat dan
mengekstraksi data-data tersebut untuk membantu memberikan informasi
kepada manajerial sehingga dapat digunakan sebagai alat pengambilan
keputusan, sebagai informasi strategis ataupun sebagai informasi pemasaran
dalam mencapai peserta didik. Sistem Informasi Manajemen dapat
mempercepat pengelolaan dan pemrosesan data menjadi salah satu informasi
yang bermanfaat, salah satu cara untuk mengekstraksi data perlunya data
mining. Data mining yaitu proses untuk membangkitkan data-data yang
dikumpulkan untuk dapat ditingkatkan dan dipergunakan sehingga dapat
memberikan kontribusi terhadap sistem (Han dan Kamber, 2006).
Salah satu metode dalam data mining adalah metode Market Basket
Analysis. Dalam metode Market Basket Analysis ini menggunakan algoritma
apriori yang merupakan jenis association rule pada data mining. Tugas dari
association rule adalah menganalisis kebiasaan yang berulang dan mencari
kombinasi dan frekuensi. Dengan menggunakan metode ini dapat diketahui
frekuensi seringnya kombinasi ini berulang dengan suatu pengukuran
(Giudici dan Figini, 2009). Dengan analisis ini didapatkan relevasi
kompetensi akademik siswa SMA terhadap pilihan mayor dan indeks prestasi
mahasiswa tersebut. Dari suatu kombinasi item yang sering muncul, akan
diketahui pola dari kombinasi tersebut. Dengan diketahui pola dari data yang
ada akan lebih mempermudah dan memberikan informasi yang akan berguna
untuk pemilihan strategi bagi IPB khususnya dalam memilih calon
mahasiswa.
Berdasarkan hal di atas maka penulis tertarik untuk menelitinya lebih
lanjut. Selain itu belum pernah dilakukannya penelitian yang berkaitan
dengan aplikasi Market Basket Analysis pada mahasiswa USMI IPB.
1.2. Perumusan Masalah
Adapun masalah yang akan dibahas dalam penelitian ini adalah
sebagai berikut:
1. Bagaimana mengembangkan sebuah Sistem Informasi Manajemen dengan
aplikasi Market Basket Analysis dari data menggunakan teknik asosiatif?
2. Bagaimana output yang akan dihasilkan dari kaidah asosiasi (association
rules) yang berkaitan dengan data nilai USMI dan kaitannya terhadap IPK
pada pilihan mayor yaitu dengan nilai-nilai support dan confidence?
3. Bagaimana pola-pola dari beberapa faktor seperti (asal mahasiswa, nilai
USMI, Jenis Kelamin, pilihan mayor dan nilai IPK) dapat terbentuk ?
1.3. Tujuan
Berdasarkan perumusan masalah diatas, penelitian ini dilaksanakan
dengan tujuan sebagai berikut:
1). Mempelajari penerapan sistem informasi manajemen melalui metode data
mining dengan mengetahui aplikasi Market basket analysis.
2). Mengidentifikasi pola-pola dari kaidah asosiasi (association rules) yang
berkaitan dengan data faktor-faktor yang mempengaruhi (asal mahasiswa,
nilai USMI, Jenis Kelamin, pilihan mayor dan nilai IPK) untuk diketahui
nilai-nilai support dan confidence.
3). Dapat mengamati kebiasaan dan asosiasi faktor-faktor penentu dari
pemilihan mahasiswa USMI yang terhadap nilai IPK, sehingga didapat
pola yang dapat membantu untuk keputusan dan rencana strategis.
1.4. Ruang Lingkup Penelitian
1. Penelitian dikhususkan terhadap mahasiswa USMI IPB dilihat dari nilai
SMA khususnya nilai yang menjadi dasar penilaian untuk USMI dengan
mempertimbangkan nilai Fisika, Kimia, Biologi,dan Matematika, Serta
pilihan Mayor dan Nilai Indeks Prestasi mulai dari tahun 2005 - 2008
2. Metoda yang dikaji adalah dengan Market Basket Analysis.
1.5. Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaat bagi penulis,
instansi maupun siapapun yang membacanya yaitu:
1. Bagi penulis, dapat menerapkan ilmu pengetahuan yang diperoleh di
perkuliahan untuk diterapkan di lapangan.
2. Bagi Institut Pertanian Bogor, diharapkan hasil analisis ini dapat menjadi
bahan pertimbangan dan masukan dalam penggunaan sistem informasi
manajemen.
3. Bahan referensi bagi peneliti lain yang ingin melakukan penelitian lebih
lanjut mengenai perencanaan dan pengendalian berkaitan dengan data
mining.
2.1 Sistem Informasi Manajemen
Mcleod R dan Schell G, (2004) membagi sumber daya menjadi dua
bagian yaitu sumberdaya fisikal dan sumberdaya konseptual. Sumber daya
fisikal terdiri atas personil, mesin, bahan dan materiil, sedangkan
Sumberdaya konseptual terdiri atas modal dan informasi. Suatu informasi
merupakan suatu unsur kunci yang penting di dalam suatu sistem konseptual,
informasi dapat bersifat manual ataupun dapat berupa komputer elektronik
atau mekanik. Informasi dapat dilihat sebagai data penuh arti di mana data
telah diubah jadi suatu konteks yang bermanfaat untuk membantu keputusan
manajemen (Mutch, 1996).
Sistem informasi dibagi menjadi dua bagian yaitu sistem pendukung
operasi dan sistem pendukung manajemen. Sistem pendukung operasi dapat
berupa sistem proses transaksi, sistem proses kontrol, sistem kolaborasi
perusahaan. Bagian dari sistem pendukung manajemen antara lain sistem
informasi manajemen, sistem pendukung keputusan, dan sistem informasi
eksekutif (Mcleod dan Schell, 2004).
Sistem Informasi Manajemen adalah manajemen dari suatu sistem dan
merupakan suatu proses menciptakan, memperoleh, mengorganisir,
menyimpan, mendistribusikan, dan menggunakan informasi. Tujuan dari
Sistem Informasi Manajemen adalah membantu orang dan organisasi untuk
akses informasi secara efektif dan efisien. Sehingga sistem informasi
manajemen dapat membantu organisasi untuk beroperasi secara kompetitif
dan strategis, serta membantu manajemen untuk lebih mudah dalam
menjalani tugas dan mendapatkan data yang lebih baik (Detlor, 2009).
2.2 Data Mining
Data Mining merupakan istilah dari menambang atau mengektraksi
suatu informasi dari sebuah data. Ekstraksi informasi yang berguna dari suatu
penyimpan data besar menjadi pekerjaan yang cukup menantang, seringkali
alat dan teknik analisis data tradisional tidak dapat digunakan dalam
mengekstrak informasi dari data berukuran besar. Data mining adalah
teknologi yang merupakan campuran metode-metode analisis data dengan
algoritma-algoritma untuk memproses data berukuran besar (Giudici dan
Figini, 2009). Data mining merupakan salah satu tahapan Knowledge
discovery in database yang merupakan proses untuk menemukan informasi
yang berguna serta pola-pola yang ada dalam data (Goharian dan Grossman,
2003). Langkah kerja Knowledge discovery in database yaitu :
1.
Pembersihan Data : tahapan untuk menghilangkan data yang tidak
konsisten dan terdapat noise
2.
Mengintegrasikan data : di mana beberapa sumber data yang dapat
dikombinasikan
3.
Menyeleksi data : Mengambil data yang relevan yang dapat digunakan
untuk proses analisis
4.
Transformasi data : Mentrasformasikan atau menggabungkan data ke
dalam bentuk yang tepat untuk ditambang dengan cara melakukan
peringkasan atau operasi agregrasi
5.
Data Mining : Merupakan proses penting, dimana metode-metode
cerdas diaplikasikan untuk mengekstraksi pola-pola yang menarik
dalam data.
6.
Evaluasi Pola : Evaluasi Pola diperlukan untuk mengidentifikasi
pola-pola yang menarik dalam merepresentasikan pengetahuan.
7.
Presentasi Pengetahuan : Penggunaan visualisasi dan teknik
representasi untuk menyajiakan pengetahuan hasil data mining kepada
pengguna
Gambar. 2 Alur Proses KDD (Knowledge discovery in database)
Data mining merupakan proses analisa data yang terdiri dari rangkaian
aktivitas mulai dari mendefinisikan tujuan analisis, analisis data sampai
kepada interpretasi dan evaluasi hasil (Giudici dan Figini, 2009). Disamping
itu diperlukan juga restrukturisasi data yang beragam pada pusat informasi
yang besar yaitu data warehouse (Connoly dan Begg, 2002)
Proses data mining menurut Han dan Kamber (2006) dapat dibedakan
menjadi dua tujuan utama :
a. Descriptive data mining :
Deskripsi konsep atau task relevan data dalam bentuk yang ringkas,
informatif dan diskriminatif.
b. Predictive data mining :
Berdasarkan analisis data dibuat model untuk kemudian dijadikan
sebagai alat prediksi trend dan data yang tidak diketahui nilainya.
Pencarian pola secara otomatis terhadap data dalam jumlah besar
dalam data mining menggunakan beberapa tehnik seperti klasifikasi,
penggugusan (clustering), deskripsi konsep, prediksi dan association rule
(Han dan Kamber, 2006).
Untuk membuat pengguna dapat berkomunikasi dengan sistem data
mining, diperlukan data mining primitive yang dirancang untuk memfasilitasi
penemuan pengetahuan secara efisien. Data mining primitive menurut
Riyanti (2005) meliputi :
Pengkoleksian data; digunakan untuk menspesifikasikan data yang akan
di-mining karena pengguna pada umumnya hanya tertarik pada subset
tertentu pada basis data.
Analisis relevansi dimensi yaitu hirarki konsep yang merupakan informasi
tentang domain yang akan di-mining yang dapat bermanfaat untuk proses
penemuan pengetahuan. Konsep hierarki dapat didefinisikan serangkaian
pemetaan dari konsep ber-level rendah menjadi level yang lebih tinggi
Perhitungan nilai kemenarikan diperlukan karena tidak semua hasil dari
data mining merupakan pengetahuan sehingga diperlukan nilai tertentu
yang dapat ditetapkan oleh pengguna sebagai batas.
Presentasi dan visualisasi pola yang ditemukan. Sistem data mining yang
efektif harus mampu menampilkan pola-pola yang ditemukan dalam
bermacam-macam bentuk seperti aturan, tabel, tabel silang, grafik, pohon
keputusan, cube, atau visualisasi lain sehingga pengguna dari latar
belakang yang berbeda dapat mengidentifikasi pola dan dapat beriteraksi
dengan sistem.
2.3. Association Rule Mining
Association Rule Mining digunakan untuk mencari hubungan menarik
di antara items dalam suatu himpunan data (Han dan Kamber 2006). Di
dalam data mining tehnik Association Rule Mining merupakan format yang
paling sering digunakan pada penelusuran pola pada sistem data yang tidak
dapat terlihat (Kantardzic, 2003).
Dengan Association Rule hubungan dapat diimplementasikan dengan
Format X→ Ij, dimana X adalah suatu itemset yang terpisah dari Ij tetapi
masih dalam suatu database (Agarwal et al, 1993), berdasarkan hubungan
yang terbentuk dari beberapa item data tersebut dapat diambil kesimpulan
item yang dapat digunakan untuk informasi (Kona dan Chakravarthy, 2003).
Ukuran objektif yang dapat digunakan untuk menemukan aturan
asosiasi
adalah
dengan
menggunakan
dua
ukuran
kepercayaan
(interestingness measure) (Srikant dan Agrawal, 1996) yaitu :
a.
Support adalah suatu ukuran yang menunjukkan presentase
banyaknya kejadian kombinasi item A dalam basis data.
Support = jika asosiasi X → Y =
...(1)
b.
Confidence adalah presentase menunjukkan keakuratan dari
hubungan antar 2 item atau lebih dalam aturan asosiasi (Han dan
Kamber 2006).
Confidence= jika asosiasi X → Y=
..(2)
Batasan nilai support dan confidence ditentukan oleh user, sehingga
akan terjadi maximum support, minimum suport, maximum confidence, dan
minimum confidence. Keterangan confidence versus support dapat dilihat
dalam Tabel. 1
Tabel.1 Confidence versus Support (Tanjung,2005)
minimum confidence
maximum confidence
maximum
suport
Aturan asosiasi jarang bernilai
benar, tetapi dapat sering
terjadi
Aturan asosiasi sering
bernilai benar, tetapi dapat
sering terjadi
minimum
support
Aturan asosiasi jarang bernilai
benar, tetapi dapat jarang
terjadi
Aturan asosiasi sering
bernilai benar, tetapi dapat
jarang terjadi
Aturan asosiasi yang memenuhi minimum support dan minimum
confidence terkadang bisa menjadi aturan asosiasi yang menyesatkan bagi
pengguna. Aturan Asosiasi X → Y bisa menyesatkan jika ternyata pembelian
item X tidak diikuti pembelian item Y. Pembelian item X adalah independent
P(X)P(Y) maka item X dan Y bersifat dependent dan saling berhubungan
(Han dan Kamber, 2006). Untuk itu perlu paramater penting selain support
dan confidence yaitu adanya Lift Ratio. Lift Ratio merupakan nilai yang
menunjukkan kevalidan proses transaksi dan memberikan informasi apakah
benar produk X dibeli bersamaan dengan produk Y.
Lift Ratio dapat ditulis sebagai:
Lift Ratio X→Y =
…. (3)
Sebuah transaksi dikatakan valid jika mempunyai nilai Lift Ratio lebih
dari 1 (satu), yang berarti bahwa dalam transaksi tersebut produk X dan Y
benar-benar terdapat hubungan korelasi. Selain Lift Ratio juga terdapat nilai
Laverage yaitu nilai dari jumlah kekurangan ataupun kelebihan support untuk
memenuhi syarat. Nilai leverage dapat mengartikan jika suatu aturan
memiliki nilai leverage positif maka hubungan antara kedua item adalah
positif, sebaliknya jika nilai leverage negatif maka hubungan kedua item
tersebut juga negatif.
Leverage dapat ditulis dengan rumus:
Leverage =
…(4)
2.4 Market Basket Analysis
Market basket analysis merupakan fungsi dari Association Rule
Mining yang biasanya digunakan untuk mempelajari kebiasaan konsumen
dengan mencari frekuensi itemset yang sering dibeli dan item yang dibeli
secara bersamaan (Han dan Kamber 2006). Market basket analysis
merupakan teknik matematis yang biasanya digunakan profesional marketing
untuk mencari hubungan produk individual ataupun group (Redlon,2008).
Istilah analisis ini sendiri datang dari kejadian yang sudah sangat umum
terjadi di dalam supermarket, yaitu pengambilan barang secara bersamaan
oleh pelanggan saat mengunjungi supermarket (Cavique , 2007).
Tujuan dari market basket analysis untuk mengidentifikasi produk,
atau kelompok produk yang cenderung terdapat korelasi bersamaan (Giudici
dan Figini, 2009). Market basket analysis adalah alat yang ampuh untuk
diterapkan didalam strategi cross-selling (Cavique, 2007). Hasil dari analisis
ini dapat digunakan untuk mengorganisir tata ruang, mengorganisir produk
yang sering menjual bersama-sama, serta dapat juga digunakan untuk
meningkatkan efisiensi promosi produk (Factpoint Group, 2008). Terdapat
dua riset utama dalam Market basket analysis, yaitu bersifat penyelidikan dan
bersifat menjelaskan model.
Pendekatan penyelidikan terbatas kepada tugas dalam menemukan
cross-category yaitu hubungan timbal balik dasarkan pada pola dasar yang
diamati dari kategori produk atau konsumen. Pendekatan penyelidikan juga
dikenal sebagai gaya gabung atau analisa hubungan dekat. Analisa ini
mengarahkan suatu ukuran asosiasi symmetric dan memasangkan sehingga
memperoleh pola dari cross-tabulation berbagai faktor (Boztug , 2008).
2.5. Algoritma Apriori
Algoritma Apriori adalah algoritma paling terkenal untuk menemukan
pola frekuensi tinggi yang digunakan untuk menghasilkan aturan asosiasi
dengan pola “if condition –then result”(Hochreiter, 2006). Pola frekuensi
tinggi adalah pola-pola item di dalam suatu database yang memiliki frekuensi
atau support di atas ambang batas tertentu yang disebut dengan istilah
minimum support. Pola frekuensi tinggi ini digunakan untuk menyusun
aturan assosiatif dan juga beberapa teknik data mining lainnya.
Menurut Srikant dan Agrawal (1996) Algoritma Apriori menggunakan
pendekatan iteratif yang dikenal dengan level-wise search yang dibagi
menjadi beberapa tahap, dimana k-kelompok produk digunakan untuk
mengeksplorasi (k+1)-kelompok produk atau (k+1)-itemset. Tiap iterasi
menghasilkan pola frekuensi tinggi dengan panjang yang sama dimulai dari
fase pertama yang menghasilkan pola frekuensi tinggi dengan panjang satu.
Dalam iterasi pertama ini, support dari setiap item dihitung dengan men-scan
database. Setelah support dari setiap item didapat, item yang memiliki
support diatas minimum support dipilih sebagai pola frekuensi tinggi dengan
panjang 1 atau sering disingkat 1-itemset. Singkatan k-itemset berarti satu set
yang terdiri dari k item.
Iterasi kedua menghasilkan 2-itemset yang tiap set-nya memiliki dua
item. Pertama dibuat kandidat 2-itemset dari kombinasi semua 1-itemset. Lalu
untuk tiap kandidat 2-itemset ini dihitung support-nya dengan men-scan
database. Support disini artinya jumlah transaksi dalam database yang
mengandung kedua item dalam kandidat 2-itemset. Setelah support dari
semua kandidat 2-itemset didapatkan, kandidat 2-itemset yang memenuhi
syarat minimum support dapat ditetapkan sebagai 2-itemset yang juga
merupakan pola frekuensi tinggi dengan panjang 2.
Selanjutnya pada iterasi ke-k dapat dibagi lagi menjadi beberapa
bagian :
1. Pembentukan kandidat itemset. Kandidat k-itemset dibentuk dari
kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu ciri
dari algoritma apriori adalah adanya pemangkasan kandidat k-itemset
yang subset-nya yang berisi k-1 item tidak termasuk dalam pola
frekuensi tinggi dengan panjang k-1.
2. Penghitungan support dari tiap kandidat k-itemset. Support dari tiap
kandidat k-itemset didapat dengan men-scan database untuk
menghitung jumlah transaksi yang memuat semua item di dalam
kandidat k-itemset tersebut. Ini adalah ciri dari algoritma apriori dimana
diperlukan penghitungan dengan scan seluruh database sebanyak
k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k
item atau k-itemset ditetapkan dari kandidat k-itemset yang support-nya
lebih besar dari minimum support.
4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses
dihentikan. Bila tidak, maka k ditambah satu dan kembali ke bagian 1.
Ada dua proses utama yang dilakukan algoritma apriori (Srikant dan
Agrawal, 1996) , yaitu:
1. Join (penggabungan): untuk menemukan L
k
, C
kdibangkitkan dengan
melakukan proses join L
k-1
dengan dirinya sendiri, C
k=L
k-1*L
k-1,lalu
anggota C
k
diambil hanya yang terdapat didalam L
k-1.
2. Prune (pemangkasan): menghilangkan anggota C
k
yang memiliki
support count lebih kecil dari minimum support agar tidak dimasukkan
ke dalam L
k