IMPLEMENTASI ALGORITMA
K-NEAREST NEIGHBORS
UNTUK MENENTUKAN KEMUNGKINAN
TINGKAT KETERCAPAIAN KOMPETENSI PEMBELAJARAN
KETERAMPILAN KOMPUTER DAN PENGELOLAAN INFORMASI
Aa Zezen Zaenal Abidin
Jurusan Teknik Informatika STMIK Subang, Jawa Barat Jl.Marsinu no 5 Subang, 40112 telp (0260)417853
Email:[email protected]
Abstrak
Nilai keterampilan komputer, nilai matematika dan bahasa Inggris pada saat kelas 3 SMP yang tersimpan dalam basis data digunakan untuk menentukan tingkat ketercapaian kompetensi pembelajaran Keterampilan Komputer dan pengelolaan Informasi (KKPI) di kelas I SMK pada masa lampau. Nilai keterampilan komputer, nilai matematika dan bahasa Inggris pada masa sekarang digunakan untuk menentukan kemungkinan tingkat ketercapaian kompetensi pembelajaran KKPI di kelas I SMK pada masa sekarang sebagai informasi untuk meminimalisir dan mendiagnosa awal faktor-faktor yang bisa diantisipasi lebih dini. Sistem digunakan sebagai salah satu media komunikasi antar guru pembina dan guru muda dalam mengelola pembelajaran. Algoritma K-Nearest Neigbohr digunakan untuk menentukan kemiripan kondisi masa lampau dan kondisi sekarang dengan menggunakan rumus similarity. Kasus sekarang dibandingkan kasus lampau kemudian diukur similarity-nya. Nilai similarity tertinggi menunjukkan kemiripan antara kasus yang dibandingkan, sehingga menjadi dasar pengambilan kesimpulan kemungkinan tingkat pencapaian kompetensi. Hasil penelitian menunjukkan sistem dapat menghitung nilai similarity dan membuat kesimpulan kemungkinan pencapaian tingkat kompetensi KKPI berdasarkan pada nilai keterampilan komputer, nilai matematika dan bahasa Inggris. Sistem dapat digunakan sebagai model komunikasi guru muda dan guru pembina dalam proses pembelajaran.
Kata kunci:KKPI, algoritma K-Nearest Neigbohr, similarity
1. PENDAHULUAN
Kompetensi merupakan salah satu target kegiatan pembalajaran. Dalam kegiatan pembelajaran, pendidik merupakan perencana, pelaksana dan evaluator ketercapaian kompetensi. Pendidik dapat menggunakan alat bantu berupa perangkat lunak dalam menentukan kemungkinan ketercapaian kompetensi berdasarkan pada pengetahuan masa lampau. Pengetahuan masa lampau digunakan untuk menentukan kondisi sekarang.
Kompetensi dalam pembelajaran KKPI merupakan kompetensi dasar yang harus dimiliki oleh semua peserta didik SMK. Lebih jauh lagi dasar-dasar pembelajaran KKPI sebagai mata pelajaran dasar, ditunjang oleh mata pelajaran pada tingkat SMP yaitu mata pelajaran keterampilan komputer, matematika dan bahasa inggris. Relevansi mata pelajaran pada jenjang sebelumnya terhadap mata pelajaran KKPI dapat diamati dari data nilai mata pelajaran keterampilan komputer, matematika dan bahasa inggris.
Mengukur kemiripan antar kasus sekarang yang dikonsultasikan dengan kasus lampau dapat menggunakan algoritma K-NN. K-NN merupakan algoritma yang dapat menentukan tingkat kemiripan kasus baru terhadap kasus lama sebagai pengetahuan yang sudah tersedia dalam sistem. Dengan K-NN diharapkan dapat menentukan kemungkinan pencapaian kompetensi peserta didik pada saat pertama kali masuk pembelajaraan KKPI, untuk mendiagnosa awal kemungkinan penghambat pencapaian kompetensi dan menentukan strategi yang paling tepat untuk meningkatkan pencapaian tingkat kompetensi pemebalajaran KKPI.
Class kompetensi meliputi tercapai dan tidak tercapai, merupakan klasisfikasi ketercapaian siswa kelas I SMK dalam kompetensi materi pembelajaran KKPI. Algoritma K-NN sebagai algoritma klasifikasi digunakan Romeo dkk(2008) dalam mengklasifikasi mahasiswa dalam akses terhadap media pembelajaran moodle di Universitas
Cordoba. Paramter yang digunakan adalahnumerical data,categorical datadanrebalanced data.
Guru pembina dapat menetapkan basis pengetahuan, guru yang muda dapat mengkonsultasikan kemungkinan tingkat ketercapaian kompetensi pada sistem. Konsultasi dilakukan guru muda dengan cara meng-inputkan nilai mata pelajaran keterampilan komputer, matematika dan bahasa inggris. Media komunikasi diperlukan dalam rangka pembinaan guru muda. Media bantu diperlukan untuk mendiagnosa awal kemungkinan-kemungkinan yang dapat menghambat pencapaian tingkat kompetensi yang menjadi target pembelajaran.
2. TINJAUAN PUSTAKA
Wu dan Kumar (2009) menyampaikan sepuluh algoritma data mining yang banyak digunakan adalah C 4.5,
K-mean, SVM, Apriori, EM,PageRank,AdaBoost, K-NN,Naive Bayesdan CART. K-NN merupakan salah satu
teknik klasifikasi yang mudah dimengerti dan diimplementasikan. Pal dan Shiu (2003) dalam case retrievall
terdapat empat macam yaituNeirest-Neighbor Retrieval,Inductive Approach, Knowledge Guided Approachdan
Validated Retrieval. Neirest-Neighbor Retrieval menggunakan K-NN dalam menentukan fitur yang cocok melalui nilai jarak. Menurut Watson(1997) demikian juga menurut Kusrini dan Luthfi (2009) kimiripan dapat ditentukan menggunakan Rumus 1.
...1) Dimana:
T:kasus baru
S:kasus lama yang tersimpan dalam data base N:jumlah atribut dalam setiap kasus
i:atribut individu antara 1 s/d n
f:fungsi similarity atribut i antara kasus T dan kasus S w:bobot yang diberikan pada atribut ke-i
Sarkar dan Leong (2007) menyampaikan enam keunggulan algoritma K-NN, sebagai berikut:
1) simple to implement.
2) works fast for small training sets.
3) KNN does not need any a priori knowledge about the structure of the data in the training set. 4) Its performance asymptotically approaches the performance of the Bayes classifier
5) KNN does not need any retraining if the new training pattern is added to the existing training set.
6) The output of the K-NN algorithm can be interpreted as an a posteiory probability of the input pattern belonging to a particular class. Thus the output provides the relative class confidence levels.
3. METODE PENELITIAN
Penelitian dilakukan dengan cara studi literatur yang berkaitan dengan algoritma K-NN, pengambilan data lapangan, analisis terhadap parameter-parameter kemiripan berupa nilai keterampilan komputer, nilai matematika dan nilai bahasa inggris yang diambil dari nilai raport di kelas 3 SMP dan nilai KKPI diambil dari nilai KKPI pada tahun pertama di SMK Al-Mufti Subang. Hubungan antar parameter diperlihatkan dalam Gambar 1. Dalam kegiatan analisi data, nilai-nilai parameter seperti pada Tabel 1, dikonversi menjadi niai kualitatif tinggi dan rendah seperti diperlihatkan dalam Tabel 2. Nilai tinggi untuk nilai lebih besar atau sama dengan 78 dan nilai rendah untuk nilai di bawah 78.
Data kasus lama sebagai acuan penentuan kemungkianan pencapaian kompetensi diambil dari proses seleksi data
seperti diperlihatkan dalam Tabel 2. Hasil seleksi data diperlihatkan dalam Tabel 3, sedangkan tabel 4
menunjukkan data bahan analisis dalam implementasi K-NN, sebagai kasus lama. Implementasi menggunakan bahasa pemrograman PHP dan DBMS MYSQL.
Gambar 1.Hubungan parameter penentuan tingkat ketercapaian kompetensi
Tabel 1.Parameter nilai secara kuantitatif dan tingkat ketercapaian kompetensi
NO. NISN NAMA
Nilai Keterampilan Komputer Nilai Matematika Nilai B.inggris nilai KKPI Pencampaian Kompetensinya 1 9975250848 ANGGI NURSAFITRI
AZHARI 82 75 78 52.50 tidak tercapai
2 9974873489
ANISAH
RAHMAWATI 78 83 88 87.50 tercapai
3 985173984 BUDI MAULANA 76 75 75 87.50 tercapai
4 9975194580 DETI 77 68 72 75.00 tidak tercapai
6 9975239838 DEVI WULANSARI 70 67 64 82.50 tercapai
7 9970266500 DIAN WINASARI 83 85 80 92.50 tercapai
8 9965395501 DODI PRIATNA 86 85 78 97.50 tercapai
9 9971160317 DWI MARFIRA 92 92 95 65.00 tidak tercapai
10 968233665 EKA KANIA 80 80 75 92.50 tercapai
11 997487494 ERIKA 76 78 78 92.50 tercapai
12 9985095541
FEBBY SITI
WILIYANTI 76 77 77 75.00 tidak tercapai
13 9965338593 FENI FITRIYANTI 80 79 76 67.50 tidak tercapai
14 9965338578 IDA FANDINI 86 80 77 80.00 tercapai
15 9944912905 IIS ISMAWATI 85 75 80 90.00 tercapai
16 9965338579 JERI DESTIAN 80 77 75 50.00 tidak tercapai
17 9976491529 LIA SULIAWATI 76 70 78 95.00 tercapai
18 9965338522 MILA ANJANI 80 80 77 90.00 tercapai
19 9975239333 NURMILATI 80 79 80 45.00 tercapai
20 9975239321 NISA NUR AZIZAH 89 90 94 67.50 tidak tercapai
21 9955374714 POPON OKTAVIANI 65 66 70 15.00 tidak tercapai
22 9975190855 RAMA IRMANSYAH 80 80 75 67.50 tidak tercapai
23 9965393628 RISA RAHMAWATI 77 72 74 82.50 tercapai
24 9965339688 SELI MARLINA 78 72 75 67.50 tidak tercapai
25 9965570317 SEPRIATNA 67 82 80 87.50 tercapai
26 9985298612 SRI NAWANGSIH 85 85 87 67.50 tidak tercapai
27 9963375973 TASINI 83 79 82 82.50 tercapai
28 9976491521 TIA OKTALIA 70 61 73 40.00 tidak tercapai
29 9985095412
TIFA NABILA NUR
INTAN 75 82 76 75.00 tidak tercapai
30 9974598523 TUTIN MUSTOTINAH 81 90 76 87.50 tercapai 31 9975194527 VERRA ANGGRAENI 84 80 80 90.00 tercapai
Tabel 2.Parameter nilai secara kualitatif dan tingkat ketercapaian kompetensi
NO. NISN NAMA
Nilai Keterampilan Komputer Nilai Matematika Nilai B.inggris Pencampaian Kompetensinya 1 9975250848 ANGGI NURSAFITRI
AZHARI tinggi rendah tinggi tidak tercapai
2 9974873489
ANISAH
RAHMAWATI tinggi tinggi tinggi Tercapai
3 9975194580 DETI tinggi rendah rendah tidak tercapai
4 9975253196 DEVI ALFIANI tinggi rendah rendah Tercapai
5 9975239838 DEVI WULANSARI rendah rendah rendah Tercapai
6 9970266500 DIAN WINASARI tinggi tinggi tinggi Tercapai
7 9965395501 DODI PRIATNA tinggi tinggi tinggi Tercapai
8 9985095541
FEBBY SITI
WILIYANTI rendah rendah rendah tidak tercapai
9 9965338593 FENI FITRIYANTI tinggi tinggi rendah tidak tercapai
11 9944912905 IIS ISMAWATI tinggi rendah tinggi Tercapai
12 9965338579 JERI DESTIAN tinggi rendah rendah tidak tercapai
13 9976491529 LIA SULIAWATI rendah rendah tinggi Tercapai
14 9965338522 MILA ANJANI tinggi tinggi rendah Tercapai
15 9975239333 NURMILATI tinggi tinggi tinggi Tercapai
16 9955374714 POPON OKTAVIANI rendah rendah rendah tidak tercapai
17 9975190855 RAMA IRMANSYAH tinggi tinggi rendah tidak tercapai
18 9965393628 RISA RAHMAWATI rendah rendah rendah Tercapai
19 9965339688 SELI MARLINA tinggi rendah rendah tidak tercapai
20 9965570317 SEPRIATNA rendah tinggi tinggi Tercapai
21 9985298612 SRI NAWANGSIH tinggi tinggi tinggi tidak tercapai
22 9963375973 TASINI tinggi tinggi tinggi Tercapai
23 9976491521 TIA OKTALIA rendah rendah rendah tidak tercapai
24 9985095412
TIFA NABILA NUR
INTAN rendah tinggi rendah tidak tercapai
25 9974598523 TUTIN MUSTOTINAH tinggi tinggi rendah Tercapai
26 9975194527 VERRA ANGGRAENI 84 80 80 Tercapai
Tabel 3.Parameter nilai secara kualitatif dan tingkat ketercapaian kompetensi sebagai representasi kasus lama
NO. NISN NAMA
Nilai Keterampilan Komputer Nilai Matematika Nilai B.inggris Pencampaian Kompetensinya 1 9975250848 ANGGI NURSAFITRI
AZHARI tinggi rendah tinggi tidak tercapai
2 9974873489
ANISAH
RAHMAWATI tinggi tinggi tinggi Tercapai
3 9975194580 DETI tinggi rendah rendah tidak tercapai
5 9975239838 DEVI WULANSARI rendah rendah rendah Tercapai
9 9965338593 FENI FITRIYANTI tinggi tinggi rendah tidak tercapai
11 9944912905 IIS ISMAWATI tinggi rendah tinggi Tercapai
13 9976491529 LIA SULIAWATI rendah rendah tinggi Tercapai
20 9965570317 SEPRIATNA rendah tinggi tinggi Tercapai
24 9985095412
TIFA NABILA NUR
INTAN rendah tinggi rendah tidak tercapai
Tabel 4.Representasi kasus lama
No Nilai Keterampilan Komputer Nilai Matematika Nilai Bahasa Inggris Pencapaian Kompetensi
1 Tinggi Rendah Tinggi Tidak tercapai
2 Tinggi Tinggi Tinggi Tercaai
3 Tinggi Rendah Rendah Tidak tercapai
4 Rendah Rendah Rendah Tercapai
5 Tinggi Tinggi Rendah Tidak tercapai
6 Tinggi Rendah Tinggi Tercapai
7 Rendah Rendah Tinggi Tercapai
8 Rendah Tinggi Tinggi Tercapai
Pemberian bobot dilakukan terhadap parameter penelitian, seperti diperlihatkan dalam Tabel 5. Nilai kemiripan atau kesamaan dari nilai-nilai yang dimiliki parameter nilai keterampilan komputer, nilai matematika dan nilai bahasa Inggris diperlihatkan dalam tabel 6, 7 dan Tabel 8. Tabel 9 merupakan tabel salah satu data tes, diambil dari baris data nomor 4 dari Tabel 2.
Tabel 5 Representasi bobot atribut
Atribut bobot
Nilai keterampilan
computer 1
Nilai matematika 0,75
Nilai bahasa Inggris 0,5
Tabel 6Kedekatan nilai atribut nilai keterampilan komputer
nilai 1 nilai 2 kedekatan
Tinggi Tinggi 1
Rendah Rendah 1
Tinggi Rendah 0,5
Rendah Tinggi 0,5
Tabel 7kedekatan nilai atribut nilai matematika
nilai 1 nilai 2 kedekatan
Tinggi Tinggi 1
Rendah Rendah 1
Tinggi Rendah 0,5
Rendah Tinggi 0,5
Tabel 8Kedekatan nilai atribut nilai bahasa Inggris
nilai 1 nilai 2 kedekatan
Tinggi Tinggi 1
Rendah Rendah 1
Tinggi Rendah 0,5
Rendah Tinggi 0,5
Tabel 9Kedekatan nilai atribut nilai bahasa Inggris
No NISN Nama NKK NM NIB kompetensi
4 9975253196 DEVI ALFIANI tinggi rendah rendah tercapai
Perhitungan jarak kasus baru pada tabel 9 dengan kasus lama yang bernomor 1 di Tabel 4, diperoleh nilai parameter sebagi berikut :
a:kedekatan nilai atribut nilai keterampilan komputer ( tinggi dengan tinggi):1 b:bobot atribut nilai keterampilan komputer:1
c:kedekatan nilai atribut nilai matematika (rendah dengan rendah):1 d:bobot atribut nilai matematika:0,75
e:kedekatan nilai atribut nilai bahasa Inggris(rendah dengan tinggi):0,5 f:bobot atribut nilai bahasa Inggris:0,5
perhitungan kemiripan diperlihatkan dalam Rumus 2, sebagai representasi Rumus 1.
=0,89
a:kedekatan nilai atribut nilai keterampilan komputer ( tinggi dengan rendah):0,5 b:bobot atribut nilai keterampilan komputer:1
c:kedekatan nilai atribut nilai matematika (rendah dengan tinggi):0,5 d:bobot atribut nilai matematika:0,75
e:kedekatan nilai atribut nilai bahasa Inggris(rendah dengan rendah):1 f:bobot atribut nilai bahasa Inggris:0,5
=0,61
Seperti diperlihatkan pada Gambar 2, model data sistem, terdiri dari 7 entitas yaitu guru pembina, kasus lama, guru muda, kasus baru, kemiripan, atribut dan entitas nilai atribut. Atribut dari masing-masing entitas
disampaikan dalam katerangan dari Gambar 2. Model fungsional sistem, seperti diperlihatkan dalam diagram
usecase pada Gambar 3, terdapat dua aktor yaitu guru pembina dan guru muda.
Gambar 2. Model data pencapaian kompetensi Keterangan:
Atribut (no_atribut, nama, bobot)
nilai_atribut(no_nilai, no_taribut, nilai_atribut1, nilai_atribut2, kesamaan) guru_pembina (id_pembina, nama)
kasus_lama(no_kasus_lama, id_pembina, nilai_keterampilan_komputer, nilai_matematika, nilai_bahasa_inggris, kompetensi)
guru_muda (id_muda, nama, alamat, jenkel)
kasus_baru(no_kasus_lama, id_pembina, nilai_keterampilan_komputer, nilai_matematika, nilai_bahasa_inggris)
kemiripan(no_kemiripan, no_kasus_lama, no_kasus_baru, kedekatan_nilai_atribut_nkk,
bobot_atribut_nkk, kedekatan_nilai_atribut_nm, bobot_atribut_nm , kedekatan_nilai_atribut_nbi, bobot_atribut_nbi, jarak)
System
guru muda guru pembina
input kasus lama input kasus baru
pilih kasus
ambil nilai kesamaan
hitung jarak <<include>> <<include>> buat kesimpulan tampilkan proses tampilkan kesimpulan <<extend>> simpan jarak <<include>> <<include>>
konversi nilai kasus baru
<<include>>
konversi nilai kasus lama
<<include>>
Gambar 3.Model fungsional sistem
4. IMPLEMENTASI DAN PEMBAHASAN
Implementasi basis data, sesuai dengan model data dalam Gambar 2, diperlihatkan dalam Gambar 4. Basis data diimplementasikan dalam DBMS MYSQL. Terdapat tabel guru_pembina, guru_muda, kasus_lama, kasus_baru, kemiripan, atribut dan table nilai_atribut. Gambar 5 merupakan tampilan atar muka untuk input parameter penetuan kemungkinan tingkat pencapaian kompetensi. Terdapat tiga proses utama yaitu proses pilih kasus dan proses ambil data parameter dari masing-masing kasus yang dihitung kemiripannya, proses mengambil dan menyimpan nilai kesamaan perbandingan atribut dan bobot atribut seperti pada Gambar 6.
Gambar 7 merupakan kode penghitungan kemiripan dan penyimpanannya, Gambar 8 merupakan tampilan hasil perhitungan kemiripan. Gambar 9 merupakan kode untuk menampilkan kesimpulan, Gambar 10 merupakan tampilan kesimpulan, penentuan kemiripan kasus baru, kasus pada Tabel 9 dengan kasus pada Tabel 4.
Gambar 5.Antar muka pengisian parameter penentuan kompetensi proses pilih kasus
Gambar 6.Antar muka pengisian parameter penentuan kompetensi proses input dan simpan data atribut
$jarak=($a*$b+$c*$d+$e*$f)/($b+$d+$f); $jarak_bulat=round($jarak,2);
mysql_query("INSERT INTO kemiripan
(no_kemiripan,no_kasus_baru,no_kasus_lama,kedekatan_nilai_atribut_nkk,bobot_atribut_nkk,kedekata n_nilai_atribut_nm,bobot_atribut_nm,kedekatan_nilai_atribut_nbi,bobot_atribut_nbi,jarak)VALUES('$ g','$h','$i','$a','$b','$c','$d','$e','$f','$jarak_bulat')");
Gambar8. Antar muka hasil perhitungan kemiripan
<tr><td><font size=5 color=red>nilai tertinggi jarak untuk kasus baru bernomor </font>"; //menampilkan nilai jarak tertinggi untuk kasus baru yang dipilih
$a="SELECT MAX(round(jarak,2)) as solusi FROM kemiripan where no_kasus_baru='$no_kasus_baru'";
$ja=mysql_query($a); $b=mysql_fetch_array($ja);
$k="SELECT no_kasus_baru FROM kemiripan where no_kasus_baru='$no_kasus_baru'"; $lk=mysql_query($k);
$l=mysql_fetch_array($lk);
$c="SELECT no_kasus_lama from kemiripan where jarak='$b[solusi]'"; $jc=mysql_query($c);
$d=mysql_fetch_array($jc);
$n="SELECT kompetensi FROM kasus_lama where no_kasus_lama='$b[solusi]'"; $jn=mysql_query($n);
$e=mysql_fetch_array($jn);
echo "<font size=5 color=red> $l[no_kasus_baru] adalah $b[solusi], mirip dengan kasus lama bernomor $d[no_kasus_lama] yaitu $e[kompetensi]</font>
Gambar 9.Kode penentuan kesimpulan
Gambar 10.Antar muka tampilan kesimpulan
Tabel 10.Representasi kasus lama
No Nilai Keterampilan Komputer Nilai Matematika Nilai Bahasa Inggris Pencapaian Kompetensi
1 Tinggi Rendah Tinggi Tidak tercapai
2 Tinggi Tinggi Tinggi Tercaai
3 Tinggi Rendah Rendah Tidak tercapai
4 Rendah Rendah Rendah Tercapai
5 Tinggi Tinggi Rendah Tidak tercapai
6 Tinggi Rendah Tinggi Tercapai
7 Rendah Rendah Tinggi Tercapai
8 Rendah Tinggi Tinggi Tercapai
Kesimpulan pada Gambar 11, menunjukkan kasus pada Tabel 9, memiliki kesamaan atau memiliki kemiripan dengan kasus ke 3 dalam Tabel 4, seperti diperlihatkan dengan blok warna biru pada tabel 10.
5. KESIMPULAN
Sistem dapat menghitung nilai similarity dan membuat kesimpulan kemungkinan pencapaian tingkat kompetensi KKPI berdasarkan pada nilai keterampilan komputer, nilai matematika dan bahasa Inggris. Nilai similarity yang diperoleh sistem sama dengan nilai similarity analisis perhitungan. Kesimpulan yang di hasilkan sistem sesuai dengan kesimpulan hasil analisis. Perangkat lunak dapat digunakan oleh guru muda dalam rangka konsultasi dengan guru pembina dalam proses pembelajran untuk mengoptimalkan pencapaian target pembelajaran.
DAFTAR PUSTAKA
Kusrini, Luthfi, E., T., 2009, Algoritma Data Mining, Andi Offset, Yogyakarta
Pal, S., K., Shiu, S., C., K., 2003,Foundations of Soft Case-Based Reasoning, Wiley
Romeo, C., Ventur, S., Espejo, P., G., Hervas, C., Data Mining Algorithms to Classify Students, Cordoba
University
Sarkar, M., Leong, T., Y., 2007, Application of K-Nearest Neighbors Algorithm on Breast Cancer Diagnosis
Problem, National University of sngapore, dapat diakses pada:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2243774/pdf/procamiasymp00003-0794.pdf
Watson, I., 1997,Applying Case-Based Reasoning, Morgan Kaufmann Publishers,Inc, San Francisco, California
Wu, X., Kumar, V., 2009,The Top Ten Algoritms in Data Mining, Taylor & Francis Group, LLC Chapman &