Berbantuan Komputer
Mewat i Ayub
Jur usan Tekni k Inf or mat i ka, Fakul t as Teknol ogi Inf or masi Uni ver si t as Kr i st en Mar anat ha, Bandung Emai l : mewat i . ayub@eng. mar anat ha. edu
Abstract
Web-based educat i onal syst ems and i nt el l i gent t ut or i ng syst ems col l ect l ar ge amount s of st udent s dat a, f r om web l ogs t o st udent model s. Dat a mi ni ng appl i cat i ons on t hose dat a can hel p di scover i ng r el evant knowl edge f or i mpr ovi ng comput er ai ded l ear ni ng syst em. Usi ng t he knowl edge, t eacher can under st and mor e about how st udent s l ear n by st udyi ng a gr oup of st udent s i n or der t o enhance t eachi ng and l ear ni ng. In t hi s paper , dat a mi ni ng pr ocess wi l l be separ at ed i nt o dat a col l ect i on, dat a t r ansf or mat i on, and dat a anal ysi s. Associ at i on r ul es, cl assi f i cat i on, and cl ust er i ng ar e dat a mi ni ng al gor i t hms t hat expl or ed i n dat a anal ysi s f or comput er ai ded l ear ni ng syst ems.
Keywords : dat a mi ni ng, comput er ai ded l ear ni ng syst em, knowl edge
1. Pendahuluan
Sist em pembel aj aran berbant uan komput er (comput er ai ded l ear ni ng syst em) dapat diimplement asikan sebagai sist em t ut orial berbasis web (web-based t ut or i ng t ool ) [ Merceron, 2005] at au sist em t ut orial cerdas (i nt el l i gent t ut or i ng syst em) [ Nil akant , 2004] . Di dalam sist em t ut orial berbasis web maupun sist em t ut orial cerdas, set iap int eraksi siswa dengan sist em akan dicat at dal am suat u basis dat a dal am bent uk web l og at au model siswa (st udent model ). Set elah sist em t ersebut digunakan dalam proses pembel aj aran sel ama j angka wakt u t ert ent u, maka akan t erkumpul sej uml ah besar dat a. Kumpul an dat a t ersebut dapat diproses l ebih l anj ut dengan dat a mi ni ng unt uk memperoleh pol a baru yang dapat digunakan unt uk meningkat kan ef ekt if it as dal am proses pembel aj aran.
Makal ah ini akan membahas bagaimana dat a mi ni ng dapat dimanf aat kan unt uk meningkat kan ef ekt if it as dal am proses pembel aj aran berbant uan komput er dari sudut pedagogi.
2. Dat a Mining
Dat a mi ni ng mengacu pada proses unt uk menambang (mi ni ng) penget ahuan dari sekumpul an dat a yang sangat besar [ Jiawei, 2001] . Sebenarnya dat a mi ni ng merupakan suat u langkah dalam knowl egde di scover y i n dat abases (KDD). Knowl edge di scover y sebagai suat u proses t erdiri at as pembersihan dat a (dat a cl eani ng), int egrasi dat a (dat a i nt egr at i on), pemil ihan dat a (dat a sel ect i on), t ransf ormasi dat a (dat a t r ansf or mat i on), dat a mi ni ng, evaluasi pola (pat t er n eval uat i on) dan penyaj ian penget ahuan (knowl edge pr esent at i on).
(Mewat i Ayub)
Gambar 1. Aliran inf ormasi dalam dat a mining
Pada gambar 1 dit unj ukkan diagram yang menggambarkan al iran inf ormasi dal am proses dat a mi ni ng yang diadapt asi dari [ Nilakant , 2004] . Proses dat a mi ni ng pada gambar t ersebut dit unj ukkan sebagai proses yang it erat if . Hasil eval uasi penget ahuan yang dihasil kan dat a mi ni ng dapat menimbul kan kebut uhan penget ahuan yang l ebih l engkap, perbaikan kumpul an dat a (dat aset ) at au perubahan pada sist em.
3. Dat a mining dalam pembelaj aran
Unt uk menent ukan variabel apa saj a yang perl u dicat at dari int eraksi siswa dengan sist em, perl u dikembangkan suat u model int eraksi siswa-sist em. Gambar 2 menunj ukkan anal isis int eraksi t ersebut pada beberapa l apisan (l ayer) yang berbeda [ Nil akant , 2004] .
Gambar 2. Model int eraksi siswa-sist em (lapisan granularit as)
Inf ormasi yang dihasil kan pada berbagai l apisan t ersebut di at as dapat sal ing mel engkapi, sehingga anal isis dat a dapat menunj ukkan hubungan ant ara dat a dari berbagai l apisan. Sebagai cont oh, unt uk set iap pel anggaran at uran yang dicat at , inf ormasi mengenai siswa yang mel akukan pel anggaran, pel aj aran yang sedang diikut i, soal yang sedang dipel aj ari, sert a usaha yang menyebabkan pel anggaran harus disimpan j uga. Pada t abel 1 dit unj ukkan ringkasan dat a yang dapat disimpan unt uk set iap usaha yang dil akukan siswa dal am menj awab soal .
T abel 1. T aksonomi variabel dari usaha siswa menj awab soal
Kegiat an Variabel Ket erangan
persiapan • umpan balik yang
t ersedia
• banyaknya soal
• banyaknya usaha
• t ingkat kesul it an soal
inf ormasi yang dipakai siswa
sebel um mencoba menj awab suat u soal
Pelajaran
Sesi
Soal
Usaha
(Mewat i Ayub)
Tahap pengumpul an dat a akan menyediakan dat a dal am vol ume yang cukup besar, namun anal isis dat a t idak dapat l angsung dil akukan t erhadap kumpul an dat a t ersebut , karena harus dil akukan t ransf ormasi t erhadap dat a sehingga anal isis siap dil akukan.
Dat a ment ah yang dihasil kan dari pengumpul an dat a, biasanya t ersimpan dal am bent uk beberapa t abel basis dat a. Karena anal isis dat a umumnya dil akukan t erhadap suat u t abel t unggal , maka perl u dil akukan penggabungan (j oin) beberapa t abel yang rel evan. Hasil nya adal ah suat u st rukt ur yang disebut dengan dat aset , sepert i t ampak pada gambar 3 [ Nil akant , 2004] . Dat aset dapat dikel ompokkan secara vert ikal sebagai kumpul an at ribut dan secara horisont al sebagai kumpul an inst ans. Set iap at ribut mempunyai t ipe dat a, yang dapat berupa numerik, t eks, at au bent uk l ainnya. Jika domain nil ai suat u at ribut berhingga, maka disebut at ribut nominal . Suat u inst ans adal ah dat a yang dihasil kan dari suat u
Terdapat dua cara unt uk mel akukan diskrit isasi nil ai at ribut . Cara pert ama dengan mel akukan penel usuran (scanni ng) seluruh dat aset unt uk semua nil ai kont inu yang muncul , kemudian menggunakan nil ai t ersebut sebagai domain dari at ribut nominal . Teknik ini membuat domain nil ai menj adi himpunan t ert ut up dari nil ai yang mungkin muncul , sehingga dat aset menj adi ‘spar se’ .
Terdapat t eknik l ainnya, yait u ‘ bi nni ng’ , yang mendef inisikan kumpulan kel as nominal unt uk set iap at ribut , kemudian menet apkan set iap nil ai at ribut ke dal am sal ah sat u kel as. Misal nya, j ika domain at ribut numerik mempunyai nil ai dari 0 sampai dengan 100, domain t ersebut dapat dibagi menj adi empat bin (0. . 24, 25. . 49, 50. . 74, 75. . 100). Set iap nil ai at ribut akan dikonversi menj adi at ribut nominal yang berkorespondensi dengan sal ah sat u bin.
Terdapat t iga cara unt uk mendef inisikan int erval nil ai, yait u equal -wi dt h, equal -f r equency, dan cust omi sed. Equal -wi dt h akan membagi int erval nilai at ribut menj adi n int erval yang l ebarnya sama. Equal -f r equency menghit ung int erval dari set iap kel as sehingga set iap kel as yang dial okasikan akan mempunyai f rekuensi inst ans dat aset yang hampir sama.
4. Penerapan Teknik Data Mining
Proses anal isis dat a dengan menerapkan t eknik dat a mi ni ng dapat dil akukan mel al ui anal isis st at ist ik at au dengan pendekat an machi ne l ear ni ng. Analisis dat a pembelaj aran dengan pendekat an machi ne l ear ni ng akan menggunakan t iga t eknik, yait u associ at i on r ul es, cl ust er i ng, dan cl assi f i cat i on [ Nilakant , 2004] [ Merceron, 2005] .
Al gorit ma associ at i on r ul e (AR) digunakan unt uk menemukan hubungan ant ar nil ai t ert ent u dari at ribut nominal dal am suat u dat aset . At uran yang dihasil kan dapat dit ul is dal am bent uk “ if -t hen” dengan mempert imbangkan besaran suppor t dan conf i dence unt uk menilai reliabilit as at uran. Bent uk umum at uran dal am associ at i on r ul e adalah :
(X = xi) →(Y = yi) [ sup, conf ]
(Mewat i Ayub)
No At ribut Ket erangan
1 IdSiswa Ident it as siswa
2 NoSoal Nomor soal yang dikerj akan 3 JenisSal ah Jenis kesal ahan
4 NoAt uran Nomor at uran/ konsep yang dipakai dal am soal 5 Jml Coba Banyaknya usaha siswa mencoba menj awab soal 6 Tingkat Tingkat pencapaian dal am pengerj aan soal 7 Nil ai Nil ai yang diperol eh
Gambar 4. Cont oh At ribut Dat aset
Dalam mi ni ng dat a pembelaj aran, algorit ma AR dapat dimanf aat kan unt uk menemukan kesal ahan yang sering t erj adi pada saat siswa mengerj akan l at ihan soal . Sebagai cont oh, dari dat aset pada gambar 4, diperol eh kumpul an inst ans mengenai siswa yang mel akukan kesal ahan dengan f rekuensi t ert ent u. Diasumsikan kumpul an inst ans t ersebut memenuhi kondisi j ika siswa melakukan kesal ahan A dan kesalahan B, maka mereka j uga mel akukan kesal ahan C, misal nya dengan support 30% dan conf idence 60%, akan dit ul is sebagai :
A and B → C [ 30%, 60%]
At uran t ersebut dapat dibaca sebagai berikut : dari 30% siswa yang mel akukan kesal ahan A dan kesal ahan B (dari sel uruh siswa yang mengerj akan l at ihan soal ), 60% diant aranya mel akukan kesal ahan C.
Al gorit ma AR j uga dapat menyat akan hubungan ant ara beberapa at ribut yang berbeda, misal nya kesal ahan A pada konsep X menimbul kan kesal ahan B pada konsep Y, yang dit ul is sebagai
A and X → B and Y
Perbedaan ut ama ant ara at uran hasil al gorit ma AR dengan at uran hasil cl assi f i cat i on adalah cl assi f i cat i on hanya membuat model unt uk sat u at ribut , yait u at ribut kel as. Pada al gorit ma AR, bagian konsekuen at uran (bagian kanan at uran) dapat mengandung l ebih dari sat u at ribut , sedangkan pada cl assi f i cat i on hanya mengandung nilai at ribut dari at ribut kel as. Hal ini dapat digunakan unt uk anal isis secara t op-down, yait u mul ai dengan al gorit ma AR unt uk memperol eh hubungan ant ara beberapa at ribut , kemudian anal isis dipersempit pada at ribut t ert ent u dengan menggunakan cl assi f i cat i on.
Dengan menggunakan dat aset hasil bel aj ar siswa sepert i pada gambar 4, sebagai dat a t raining pada suat u t ahun, dapat dibuat pohon keput usan unt uk memperkirakan dist ribusi nil ai siswa pada t ahun berikut nya. Gambar 5 menunj ukkan cont oh pohon keput usan yang dihasil kan dari t eknik cl assi f i cat i on. Pada gambar 5 t erlihat kl asif ikasi siswa yang didasarkan pada j uml ah kesal ahan yang dil akukan siswa dan t ingkat pencapaian dal am pengerj aan soal . Pemil ihan at ribut yang digunakan dal am pohon keput usan dit ent ukan secara heurist ik dengan i nf or mat i on gai n [ Jiawei, 2001] .
tingkat
pencapaian?
tingkat
pencapaian?
≤
n
> n
kelas-1
kelas-2
kelas-2
kelas-3
> p
≤
p
> m
≤
m
(Mewat i Ayub)
digunakan adal ah j uml ah kesal ahan yang dil akukan seorang siswa dal am mengerj akan suat u soal . Dengan demikian, siswa-siswa dengan f rekuensi dan j enis kesal ahan yang hampir sama (mirip), dapat dikel ompokkan dal am sat u cl ust er yang sama. Sebagai cont oh, bil a n < m, cl ust er 1 adal ah kel ompok siswa yang f rekuensi kesal ahannya l ebih kecil dari n, cl ust er 2 adal ah kel ompok siswa dengan f rekuensi kesal ahan di ant ara n sampai dengan m, dan cl ust er 3 adal ah kel ompok siswa dengan f rekuensi kesal ahan l ebih besar dari m. Cont oh visual isasi cl ust ering dapat dit unj ukkan sepert i pada gambar 6. Pada gambar t ersebut t erdapat t iga cl ust er dan beberapa out l i er .
Gambar 6. Cont oh Clust ering
5. Kesimpulan
Penerapan dat a mining dal am sist em pembel aj aran berbant uan komput er diawal i dengan pengumpul an dat a, yang dil anj ut kan dengan t ransf ormasi dat a, dan diakhiri dengan anal isis dat a. Pada pengumpul an dat a, harus didef inisikan suat u model int eraksi siswa-sist em unt uk menet apkan dat a yang harus dicat at dari suat u proses pembel aj aran. Model int eraksi siswa-sist em t ersebut dapat t ersusun at as beberapa l apisan unt uk memungkinkan penangkapan dat a pada t ingkat granul arit as yang berbeda. Proses t ransf ormasi dat a mengubah dat a ment ah menj adi dat aset yang siap dianal isis. Transf ormasi dapat dil akukan pada inst ans dat aset mel al ui proses f il t rasi, maupun pada at ribut dari dat aset mel al ui f il t rasi at aupun konversi. Anal isis dat a hasil pembel aj aran dapat dil akukan dengan menerapkan t eknik al gorit ma associ at i on r ul es, cl assi f i cat i on, dan cl ust er i ng unt uk menghasilkan penget ahuan yang dapat membant u guru
dal am mengel ol a kel asnya dengan memahami cara bel aj ar siswa, dan memberikan umpan bal ik proakt if kepada siswanya.
Daftar Pust aka
Jiawei, H. , Kamber, M. (2001). Dat a Mining Concept s and Techniques, Morgan Kauf mann Publ ishers.
Jing, L. (2004). Dat a Mining Appl icat ions in Higher Educat ion,
www. spss. com/ event s/ e_id_1471/ Dat a Mining in Higher Educat ion. pdf, diakses t anggal 7 Februari 2007.
Nil akant , K. (2004). Appl icat ion of Dat a Mining in Const raint Based
Int el l igent Tut oring Syst em, www. cosc. cant erbury. ac. nz/ research/ report s/ HonsReps/ 2004/ hons_04
08. pdf, diakses t anggal 28 Februari 2007.
Merceron, A. , Yacef , K. (2005). Educat ional Dat a Mining : a Case St udy, ht t p: / / www. it . usyd. edu. au/ ~kal ina/ publ is/
merceron_yacef _aied05. pdf, diakses t anggal 7 Februari 2007.
Merceron, A. , Yacef , K. (2005). TADA-Ed f or Educat ional Dat a Mining, imej . wf u. edu/ art icl es/ 2005/ 1/ 03/ print ver. asp, diakses t anggal 1