• Tidak ada hasil yang ditemukan

Proses Data Mining dalam Sistem Pembelaj

N/A
N/A
Protected

Academic year: 2018

Membagikan "Proses Data Mining dalam Sistem Pembelaj"

Copied!
10
0
0

Teks penuh

(1)

Berbantuan Komputer

Mewat i Ayub

Jur usan Tekni k Inf or mat i ka, Fakul t as Teknol ogi Inf or masi Uni ver si t as Kr i st en Mar anat ha, Bandung Emai l : mewat i . ayub@eng. mar anat ha. edu

Abstract

Web-based educat i onal syst ems and i nt el l i gent t ut or i ng syst ems col l ect l ar ge amount s of st udent s dat a, f r om web l ogs t o st udent model s. Dat a mi ni ng appl i cat i ons on t hose dat a can hel p di scover i ng r el evant knowl edge f or i mpr ovi ng comput er ai ded l ear ni ng syst em. Usi ng t he knowl edge, t eacher can under st and mor e about how st udent s l ear n by st udyi ng a gr oup of st udent s i n or der t o enhance t eachi ng and l ear ni ng. In t hi s paper , dat a mi ni ng pr ocess wi l l be separ at ed i nt o dat a col l ect i on, dat a t r ansf or mat i on, and dat a anal ysi s. Associ at i on r ul es, cl assi f i cat i on, and cl ust er i ng ar e dat a mi ni ng al gor i t hms t hat expl or ed i n dat a anal ysi s f or comput er ai ded l ear ni ng syst ems.

Keywords : dat a mi ni ng, comput er ai ded l ear ni ng syst em, knowl edge

1. Pendahuluan

(2)

Sist em pembel aj aran berbant uan komput er (comput er ai ded l ear ni ng syst em) dapat diimplement asikan sebagai sist em t ut orial berbasis web (web-based t ut or i ng t ool ) [ Merceron, 2005] at au sist em t ut orial cerdas (i nt el l i gent t ut or i ng syst em) [ Nil akant , 2004] . Di dalam sist em t ut orial berbasis web maupun sist em t ut orial cerdas, set iap int eraksi siswa dengan sist em akan dicat at dal am suat u basis dat a dal am bent uk web l og at au model siswa (st udent model ). Set elah sist em t ersebut digunakan dalam proses pembel aj aran sel ama j angka wakt u t ert ent u, maka akan t erkumpul sej uml ah besar dat a. Kumpul an dat a t ersebut dapat diproses l ebih l anj ut dengan dat a mi ni ng unt uk memperoleh pol a baru yang dapat digunakan unt uk meningkat kan ef ekt if it as dal am proses pembel aj aran.

Makal ah ini akan membahas bagaimana dat a mi ni ng dapat dimanf aat kan unt uk meningkat kan ef ekt if it as dal am proses pembel aj aran berbant uan komput er dari sudut pedagogi.

2. Dat a Mining

Dat a mi ni ng mengacu pada proses unt uk menambang (mi ni ng) penget ahuan dari sekumpul an dat a yang sangat besar [ Jiawei, 2001] . Sebenarnya dat a mi ni ng merupakan suat u langkah dalam knowl egde di scover y i n dat abases (KDD). Knowl edge di scover y sebagai suat u proses t erdiri at as pembersihan dat a (dat a cl eani ng), int egrasi dat a (dat a i nt egr at i on), pemil ihan dat a (dat a sel ect i on), t ransf ormasi dat a (dat a t r ansf or mat i on), dat a mi ni ng, evaluasi pola (pat t er n eval uat i on) dan penyaj ian penget ahuan (knowl edge pr esent at i on).

(3)

(Mewat i Ayub)

Gambar 1. Aliran inf ormasi dalam dat a mining

Pada gambar 1 dit unj ukkan diagram yang menggambarkan al iran inf ormasi dal am proses dat a mi ni ng yang diadapt asi dari [ Nilakant , 2004] . Proses dat a mi ni ng pada gambar t ersebut dit unj ukkan sebagai proses yang it erat if . Hasil eval uasi penget ahuan yang dihasil kan dat a mi ni ng dapat menimbul kan kebut uhan penget ahuan yang l ebih l engkap, perbaikan kumpul an dat a (dat aset ) at au perubahan pada sist em.

3. Dat a mining dalam pembelaj aran

Unt uk menent ukan variabel apa saj a yang perl u dicat at dari int eraksi siswa dengan sist em, perl u dikembangkan suat u model int eraksi siswa-sist em. Gambar 2 menunj ukkan anal isis int eraksi t ersebut pada beberapa l apisan (l ayer) yang berbeda [ Nil akant , 2004] .

(4)

Gambar 2. Model int eraksi siswa-sist em (lapisan granularit as)

Inf ormasi yang dihasil kan pada berbagai l apisan t ersebut di at as dapat sal ing mel engkapi, sehingga anal isis dat a dapat menunj ukkan hubungan ant ara dat a dari berbagai l apisan. Sebagai cont oh, unt uk set iap pel anggaran at uran yang dicat at , inf ormasi mengenai siswa yang mel akukan pel anggaran, pel aj aran yang sedang diikut i, soal yang sedang dipel aj ari, sert a usaha yang menyebabkan pel anggaran harus disimpan j uga. Pada t abel 1 dit unj ukkan ringkasan dat a yang dapat disimpan unt uk set iap usaha yang dil akukan siswa dal am menj awab soal .

T abel 1. T aksonomi variabel dari usaha siswa menj awab soal

Kegiat an Variabel Ket erangan

persiapan • umpan balik yang

t ersedia

• banyaknya soal

• banyaknya usaha

• t ingkat kesul it an soal

inf ormasi yang dipakai siswa

sebel um mencoba menj awab suat u soal

Pelajaran

Sesi

Soal

Usaha

(5)

(Mewat i Ayub)

Tahap pengumpul an dat a akan menyediakan dat a dal am vol ume yang cukup besar, namun anal isis dat a t idak dapat l angsung dil akukan t erhadap kumpul an dat a t ersebut , karena harus dil akukan t ransf ormasi t erhadap dat a sehingga anal isis siap dil akukan.

Dat a ment ah yang dihasil kan dari pengumpul an dat a, biasanya t ersimpan dal am bent uk beberapa t abel basis dat a. Karena anal isis dat a umumnya dil akukan t erhadap suat u t abel t unggal , maka perl u dil akukan penggabungan (j oin) beberapa t abel yang rel evan. Hasil nya adal ah suat u st rukt ur yang disebut dengan dat aset , sepert i t ampak pada gambar 3 [ Nil akant , 2004] . Dat aset dapat dikel ompokkan secara vert ikal sebagai kumpul an at ribut dan secara horisont al sebagai kumpul an inst ans. Set iap at ribut mempunyai t ipe dat a, yang dapat berupa numerik, t eks, at au bent uk l ainnya. Jika domain nil ai suat u at ribut berhingga, maka disebut at ribut nominal . Suat u inst ans adal ah dat a yang dihasil kan dari suat u

(6)

Terdapat dua cara unt uk mel akukan diskrit isasi nil ai at ribut . Cara pert ama dengan mel akukan penel usuran (scanni ng) seluruh dat aset unt uk semua nil ai kont inu yang muncul , kemudian menggunakan nil ai t ersebut sebagai domain dari at ribut nominal . Teknik ini membuat domain nil ai menj adi himpunan t ert ut up dari nil ai yang mungkin muncul , sehingga dat aset menj adi ‘spar se’ .

Terdapat t eknik l ainnya, yait u ‘ bi nni ng’ , yang mendef inisikan kumpulan kel as nominal unt uk set iap at ribut , kemudian menet apkan set iap nil ai at ribut ke dal am sal ah sat u kel as. Misal nya, j ika domain at ribut numerik mempunyai nil ai dari 0 sampai dengan 100, domain t ersebut dapat dibagi menj adi empat bin (0. . 24, 25. . 49, 50. . 74, 75. . 100). Set iap nil ai at ribut akan dikonversi menj adi at ribut nominal yang berkorespondensi dengan sal ah sat u bin.

Terdapat t iga cara unt uk mendef inisikan int erval nil ai, yait u equal -wi dt h, equal -f r equency, dan cust omi sed. Equal -wi dt h akan membagi int erval nilai at ribut menj adi n int erval yang l ebarnya sama. Equal -f r equency menghit ung int erval dari set iap kel as sehingga set iap kel as yang dial okasikan akan mempunyai f rekuensi inst ans dat aset yang hampir sama.

4. Penerapan Teknik Data Mining

Proses anal isis dat a dengan menerapkan t eknik dat a mi ni ng dapat dil akukan mel al ui anal isis st at ist ik at au dengan pendekat an machi ne l ear ni ng. Analisis dat a pembelaj aran dengan pendekat an machi ne l ear ni ng akan menggunakan t iga t eknik, yait u associ at i on r ul es, cl ust er i ng, dan cl assi f i cat i on [ Nilakant , 2004] [ Merceron, 2005] .

Al gorit ma associ at i on r ul e (AR) digunakan unt uk menemukan hubungan ant ar nil ai t ert ent u dari at ribut nominal dal am suat u dat aset . At uran yang dihasil kan dapat dit ul is dal am bent uk “ if -t hen” dengan mempert imbangkan besaran suppor t dan conf i dence unt uk menilai reliabilit as at uran. Bent uk umum at uran dal am associ at i on r ul e adalah :

(X = xi) →(Y = yi) [ sup, conf ]

(7)

(Mewat i Ayub)

No At ribut Ket erangan

1 IdSiswa Ident it as siswa

2 NoSoal Nomor soal yang dikerj akan 3 JenisSal ah Jenis kesal ahan

4 NoAt uran Nomor at uran/ konsep yang dipakai dal am soal 5 Jml Coba Banyaknya usaha siswa mencoba menj awab soal 6 Tingkat Tingkat pencapaian dal am pengerj aan soal 7 Nil ai Nil ai yang diperol eh

Gambar 4. Cont oh At ribut Dat aset

Dalam mi ni ng dat a pembelaj aran, algorit ma AR dapat dimanf aat kan unt uk menemukan kesal ahan yang sering t erj adi pada saat siswa mengerj akan l at ihan soal . Sebagai cont oh, dari dat aset pada gambar 4, diperol eh kumpul an inst ans mengenai siswa yang mel akukan kesal ahan dengan f rekuensi t ert ent u. Diasumsikan kumpul an inst ans t ersebut memenuhi kondisi j ika siswa melakukan kesal ahan A dan kesalahan B, maka mereka j uga mel akukan kesal ahan C, misal nya dengan support 30% dan conf idence 60%, akan dit ul is sebagai :

A and B → C [ 30%, 60%]

At uran t ersebut dapat dibaca sebagai berikut : dari 30% siswa yang mel akukan kesal ahan A dan kesal ahan B (dari sel uruh siswa yang mengerj akan l at ihan soal ), 60% diant aranya mel akukan kesal ahan C.

Al gorit ma AR j uga dapat menyat akan hubungan ant ara beberapa at ribut yang berbeda, misal nya kesal ahan A pada konsep X menimbul kan kesal ahan B pada konsep Y, yang dit ul is sebagai

A and X → B and Y

(8)

Perbedaan ut ama ant ara at uran hasil al gorit ma AR dengan at uran hasil cl assi f i cat i on adalah cl assi f i cat i on hanya membuat model unt uk sat u at ribut , yait u at ribut kel as. Pada al gorit ma AR, bagian konsekuen at uran (bagian kanan at uran) dapat mengandung l ebih dari sat u at ribut , sedangkan pada cl assi f i cat i on hanya mengandung nilai at ribut dari at ribut kel as. Hal ini dapat digunakan unt uk anal isis secara t op-down, yait u mul ai dengan al gorit ma AR unt uk memperol eh hubungan ant ara beberapa at ribut , kemudian anal isis dipersempit pada at ribut t ert ent u dengan menggunakan cl assi f i cat i on.

Dengan menggunakan dat aset hasil bel aj ar siswa sepert i pada gambar 4, sebagai dat a t raining pada suat u t ahun, dapat dibuat pohon keput usan unt uk memperkirakan dist ribusi nil ai siswa pada t ahun berikut nya. Gambar 5 menunj ukkan cont oh pohon keput usan yang dihasil kan dari t eknik cl assi f i cat i on. Pada gambar 5 t erlihat kl asif ikasi siswa yang didasarkan pada j uml ah kesal ahan yang dil akukan siswa dan t ingkat pencapaian dal am pengerj aan soal . Pemil ihan at ribut yang digunakan dal am pohon keput usan dit ent ukan secara heurist ik dengan i nf or mat i on gai n [ Jiawei, 2001] .

tingkat

pencapaian?

tingkat

pencapaian?

n

> n

kelas-1

kelas-2

kelas-2

kelas-3

> p

p

> m

m

(9)

(Mewat i Ayub)

digunakan adal ah j uml ah kesal ahan yang dil akukan seorang siswa dal am mengerj akan suat u soal . Dengan demikian, siswa-siswa dengan f rekuensi dan j enis kesal ahan yang hampir sama (mirip), dapat dikel ompokkan dal am sat u cl ust er yang sama. Sebagai cont oh, bil a n < m, cl ust er 1 adal ah kel ompok siswa yang f rekuensi kesal ahannya l ebih kecil dari n, cl ust er 2 adal ah kel ompok siswa dengan f rekuensi kesal ahan di ant ara n sampai dengan m, dan cl ust er 3 adal ah kel ompok siswa dengan f rekuensi kesal ahan l ebih besar dari m. Cont oh visual isasi cl ust ering dapat dit unj ukkan sepert i pada gambar 6. Pada gambar t ersebut t erdapat t iga cl ust er dan beberapa out l i er .

Gambar 6. Cont oh Clust ering

5. Kesimpulan

Penerapan dat a mining dal am sist em pembel aj aran berbant uan komput er diawal i dengan pengumpul an dat a, yang dil anj ut kan dengan t ransf ormasi dat a, dan diakhiri dengan anal isis dat a. Pada pengumpul an dat a, harus didef inisikan suat u model int eraksi siswa-sist em unt uk menet apkan dat a yang harus dicat at dari suat u proses pembel aj aran. Model int eraksi siswa-sist em t ersebut dapat t ersusun at as beberapa l apisan unt uk memungkinkan penangkapan dat a pada t ingkat granul arit as yang berbeda. Proses t ransf ormasi dat a mengubah dat a ment ah menj adi dat aset yang siap dianal isis. Transf ormasi dapat dil akukan pada inst ans dat aset mel al ui proses f il t rasi, maupun pada at ribut dari dat aset mel al ui f il t rasi at aupun konversi. Anal isis dat a hasil pembel aj aran dapat dil akukan dengan menerapkan t eknik al gorit ma associ at i on r ul es, cl assi f i cat i on, dan cl ust er i ng unt uk menghasilkan penget ahuan yang dapat membant u guru

(10)

dal am mengel ol a kel asnya dengan memahami cara bel aj ar siswa, dan memberikan umpan bal ik proakt if kepada siswanya.

Daftar Pust aka

Jiawei, H. , Kamber, M. (2001). Dat a Mining Concept s and Techniques, Morgan Kauf mann Publ ishers.

Jing, L. (2004). Dat a Mining Appl icat ions in Higher Educat ion,

www. spss. com/ event s/ e_id_1471/ Dat a Mining in Higher Educat ion. pdf, diakses t anggal 7 Februari 2007.

Nil akant , K. (2004). Appl icat ion of Dat a Mining in Const raint Based

Int el l igent Tut oring Syst em, www. cosc. cant erbury. ac. nz/ research/ report s/ HonsReps/ 2004/ hons_04

08. pdf, diakses t anggal 28 Februari 2007.

Merceron, A. , Yacef , K. (2005). Educat ional Dat a Mining : a Case St udy, ht t p: / / www. it . usyd. edu. au/ ~kal ina/ publ is/

merceron_yacef _aied05. pdf, diakses t anggal 7 Februari 2007.

Merceron, A. , Yacef , K. (2005). TADA-Ed f or Educat ional Dat a Mining, imej . wf u. edu/ art icl es/ 2005/ 1/ 03/ print ver. asp, diakses t anggal 1

Gambar

Gambar 2. Model interaksi siswa-sistem (lapisan granularitas)
Gambar 3.  Format Dataset
Gambar 5. Contoh Pohon Keputusan
Gambar 6. Contoh Clustering frekuensi kesalahan

Referensi

Dokumen terkait

Masalah dalam penelitian ini adalah bagaimana membuat dan menghasilkan sebuah sistem Augmented Reality dengan Metode Markerless sebagai media pengenalan gedung perkuliahan

Berdasarkan Penetapan Pemenang Pelelangan Nomor : 229/ULP-POKJA.JK-1/VI/2016 Tanggal 06 Juni 2016 dan Berita Acara Hasil Pelelangan Nomor : 228/ULP-POKJA.JK-1/VI/2016 Tanggal 27

After starting the month on a weaker tone, declining for 6 days in a row on relatively weak Q3 earnings and prolonged fuel price adjustments, the index rebounded strongly from its

This presentation may contain statements regarding the business of PT Selamat Sempurna Tbk and its subsidiaries that are of a forward-looking nature and are therefore based

[r]

Kertas kerja ini juga memerihalkan faktor-faktor yang boleh diberi perhatian sebagai faktor pencarian maklumat produk makanan halal dalam kalangan keluarga

[r]

 Peserta didik bertanya jawab tentang hal-hal yang mereka belum pahami tentang fungsi sosial, struktur teks dan unsur kebahasaan dalam teks deskripsi dengan pola I have