III. METODOLOGI PENELITIAN
3.3. Metode Pengolahan dan Analisis Data
Pengolahan dan analisis data yang akan diteliti menggunakan tehnik
data mining dengan menggunakan metode Market Basket Analysis yaitu
dengan cara menemukan asosiasi dan korelasi dari berbagai macam faktor
yang sering berkaitan dan terdapat hubungan. Pengolahan data menggunakan
tahap-tahap sebagai berikut (Han dan Kamber, 2006):
1. Metode Analisis : yaitu dengan melakukan survei dan observasi untuk
mengumpulkan data yang digunakan
2. Pembersihan data : membuang data, informasi atau field yang tidak
konsisten dan data yang mengandung noise.
3. Integrasi data : merupakan proses memilih dan memisahkan data
berdasarkan kriteria
4. Menyeleksi data : mengambil data yang relevan yang dapat digunakan
untuk proses analisis
5. Transformasi data : data di rubah dalam bentuk yang useable dan dapat
di-mining.
6. Data mining : melakukan penambangan data sehingga mendapatkan
pola-pola dari data
7. Evaluasi Pola : Evaluasi Pola diperlukan untuk mengidentifikasi
pola-pola yang menarik dalam merepresentasikan pengetahuan.
8. Presentasi pengetahuan : setelah menemukan pola data dapat
dipresentasikan dengan tehnik visualisasi agar user dapat mudah
memahaminya. .
Tahapan penelitian diawali dengan melakukan pembersihan data, data
yang akan digunakan adalah data yang dinilai kemenarikannya dan relevan
untuk diekstraksi. Data yang mengandung noise ataupun kosong yang
diakibatkan oleh pengentrian data dapat dibersihkan sehingga tidak
mengganggu ekstraksi data.
Data yang digunakan dalam penelitian ini hanya berupa data
kompetensi akademik dari SLTA dan sebagian dari data diri yaitu jenis
kelamin, asal daerah dan tahun masuk. Selain data yang dibutuhkan atau
terdapat data yang sama maka data tersebut akan dihapus. Pemasukan data
harus didasarkan rule yang ditentukan sehingga jika ada data yang tidak
sama terhadap aturan yang ditentukan data tersebut dibersihkan.
Pembersihan data dilakukan dengan penghapusan data dari database
dan perbaikan data, bagian data yang dihapus adalah data yang
mengandung noise, data kosong ,dan data dari atribut yang tidak dinilai
kemenarikannya. Data juga dapat diperbaiki jika terdapat data yang
terdapat noise tetapi dapat diperbaiki.
Setelah dilakukan pembersihan data, selanjutnya dilakukan integrasi
data, proses ini diperlukan untuk memperoleh data yang dapat di-mining
sesuai kemenarikannya. Data diperoleh dari dua bagian yang berbeda yaitu
PPMB IPB yang mempunyai data tentang kompetensi akademik SLTA
mahasiswa USMI IPB tahun 2005-2008 dan data dari Direktorat
Administrasi Pendidikan yang memiliki data Indeks Prestasi mahasiswa
tersebut selama masa perkuliahan.
Proses pengintegrasian data dimulai dengan konversi nilai akademik
4 mata ajaran Matematika, Fisika, Biologi, dan Kimia yang menjadi dasar
pertimbangan penilaian di jalur USMI untuk dikelompokkan menjadi 2
(dua) kelompok besar yaitu A dan B. Konversi dilakukan juga terhadap
Indeks Prestasi Mahasiswa, sesuai kisaran yang telah ditentukan untuk
penelitian ini adalah IP dengan nilai 3,51–4,00; 2,76 – 3,50; 2,01 – 2,75;
dan < 2,0 dan selanjutnya akan diberi Kode ”CL” untuk nilai 3,51–4,00,
”SM” untuk nilai 2,76 -3,50, ”M” untuk 2,01-2,75 dan ”DS” jika memiliki
nilai <2,0.
Proses integrasi data dilakukan pada tabel dan diidentifikasi
berdasarkan Nomor Induk Mahasiswa (NIM), atribut pada data akan
diberikan kode-kode untuk membedakan. Hasil tabel gabungan akan
memiliki seluruh atribut gabungan dari mahasiswa. Informasi tahun masuk
mahasiswa USMI juga akan disertakan dalam atribut untuk tetap menjaga
informasi. Setelah diintregasikan diperoleh data sebanyak 74.243 tuple.
Atribut yang digunakan dalam penelitian ini berupa Indeks prestasi
TPB diberikan kode ”IPKB”, Indeks prestasi akhir dengan kode ”IPKA”.
Untuk kompetensi akademik SLTA menggunakan variabel dari nilai yang
digunakan sebagai dasar pemilihan mahasiswa USMI yaitu nilai kimia
diberikan kode ”KIMUS”, nilai fisika ”FISUS” nilai matematika
”MATUS” dan nilai biologi ”BIOUS”. Atribut jenis kelamin yang
disingkat ”JK” digunakan juga untuk melihat pengaruh yang diakibatkan
jika terdapat faktor gender, untuk laki-laki diberikan kode ”1” dan
perempuan deberikan kode ”0”. Mayor akan diberikan kode ”DEPT” ,
kode mayor yang dipilih mahasiswa tersebut akan didasarkan kode mayor
yang ada di IPB dan untuk asal daerah akan disingkat dengan ”ASDAE”
diberikan kode seperti pada Tabel 7 dibawah ini :
Tabel 7. Kode Asal Daerah Mahasiswa USMI Tahun 2005-2008
Kode Asal Daerah
1 Sumatera
2 DKI Jakarta
3 Jawa Barat
4 Jawa Tengah
5 Jawa Timur dan
Madura
6 Bali dan Nusa
Tenggara
7 Kalimantan
8 Sulawesi
9 Irian Jaya
10 Luar Negeri
Data yang sudah diintegrasikan akan diubah kedalam bentuk data
yang mudah untuk dilakukan penambangan. Data tersebut harus sesuai
dengan alat atau software yang digunakan. Dalam penelitian ini digunakan
”Magnum Opus” yang dikeluarkan oleh G.I. Webb & Associates pty Ltd.,
yang merupakan software untuk mengolah data dengan menggunakan
tehnik market basket analysis.
Data yang diperoleh dari IPB berformat basis data Foxpro (.dbf)
sehingga perlu di transformasi menjadi format yang disediakan oleh
”Magnum Opus” yaitu Identifier-Item File (.idi), Item List File (.itl), Name
File (.nam). Data yang diperoleh dari Panitia Penerimaan Mahasiswa Baru
(PPMB) IPB dan Direktorat Administrasi Pendidikan adalah basis data
Foxpro (.dbf) dan sudah di konversi dalam tabel microsoft exel (.xls).
Format data yang diberikan mirip dengan format Identifier-Item File (.idi)
yang ada di magnum opus, sehingga data yang diperoleh dikonversi
menjadi (.idi) dengan format (NIM, Atribut).
Setelah semua atribut diintegrasikan didapatkan 68 atribut yang
digunakan. Atribut tersebut akan diibaratkan sebuah transaksi, setiap
transaksi berisi tentang data kompetensi akademik saat SLTA, data diri
mahasiswa, serta data pilihan mayor dan indeks prestasinya. Untuk
memudahkan proses atribut tersebut diberikan kode sebagai berikut :
Tabel. 8 Atribut Biner Penilaian Kompetensi Mahasiswa USMI IPB Tahun
2005-2008
Analisis data dilakukan dengan menggunakan kaidah asosiasi
(Association Rules), yang biasa digunakan dalam metode market basket
analysis untuk menghasilkan aturan asosiasi dengan pola ”if condition –
then result” (Agarwal et al, 1993). Association Rules digunakan dengan
1. IPKB CL 35. DEPT A3
2. IPKB SM 36. DEPT A4
3. IPKB M 37. DEPT B0
4. IPKB DS 38. DEPT C1
5. IPKA CL 39. DEPT C2
6. IPKA SM 40. DEPT C3
7. IPKA M 41. DEPT C4
8. IPKA DS 42. DEPT C5
9. ASDAE 1 43. DEPT D1
10. ASDAE 2 44. DEPT D2
11. ASDAE 3 45. DEPT E1
12. ASDAE 4 46. DEPT E2
13. ASDAE 5 47. DEPT E3
14. ASDAE 6 48. DEPT E4
15. ASDAE 7 49. DEPT F1
16. ASDAE 8 50. DEPT F2
17. ASDAE 9 51. DEPT F3
18. ASDAE 10 52. DEPT F4
19. JK 1 53. DEPT G1
20. JK 0 54. DEPT G2
21. MATUS A 55. DEPT G3
22. MATUS B 56. DEPT G4
23. KIMUS A 57. DEPT G5
24. KIMUS B 58. DEPT G6
25. FISUS A 59. DEPT G7
26. FISUS B 60. DEPT G8
27. BIOUS A 61. DEPT H1
28. BIOUS B 62. DEPT H2
29. TAHUN 05 63. DEPT H3
30. TAHUN 06 64. DEPT H4
31. TAHUN 07 65. DEPT I1
32. TAHUN 08 66. DEPT I2
33. DEPT A1 67. DEPT I3
34. DEPT A2 68. DEPT D0
tujuan menemukan frequent itemsets yang dijalankan pada sekumpulan
data. Ukuran objektif yang dapat digunakan untuk menemukan aturan
asosiasi adalah dengan menggunakan dua ukuran kepercayaan
(interestingness measure) (Srikant dan Agrawal, 1996) yaitu :
a. Support adalah suatu ukuran yang menunjukkan presentase
banyaknya kejadian kombinasi item A dalam basis data.
Support = jika asosiasi X → Y =
b. Confidence adalah presentase menunjukkan keakuratan dari
hubungan antar 2 item atau lebih dalam aturan asosiasi (Han dan
Kamber 2006).
Confidence= jika asosiasi X → Y =
Data yang diperoleh dari database ditentukan pola yang menarik dan
dilihat karakteristiknya. Setelah mengetahui karakteristik data dilakukan
integrasi data sehingga mudah untuk di-mining. Aturan yang akan diterapkan
dalam penelitian ini adalah ” jika mahasiswa berasal dari daerah...., dan
memiliki nilai USMI...., memilih mayor....,→ maka Indeks prestasi
mahasiswa...”. Dalam proses data mining juga dapat menggunakan
fasilitas query dalam basis data sehingga dapat digunakan sebagai alat untuk
mengkombinasikan antar item dalam itemset. Penelitian ini menggunakan
software khusus untuk metode market basket analysis yaitu ”magnum opus”
dari G.I. Webb & Associates pty Ltd.
... (6)
Dalam dokumen
ANALISIS ASOSIASI PILIHAN MAYOR DENGAN KOMPETENSI AKADEMIK SISWA SLTA MENGGUNAKAN MARKET BASKET ANALYSIS
(Halaman 30-36)