PENGELOMPOKAN PEMINATAN JURUSAN DI SMK MENGGUNAKAN METODE SELF ORGANIZING MAP
(SOM)
Rusydi Umar
1), Abdul Fadlil
2), Rifqi Rahmatika Az-Zahra
3)Program Studi Magister Teknik Informatika Universitas Ahmad Dahlan
Jln. Prof. Soepomo, Janturan, Yogyakarta, Indonesia.
1
[email protected],
2[email protected],
3
[email protected].
ABSTRAK
Pendidikan merupakan kebutuhan utama dalam mengembangkan potensi diri. Peran pendidikan merupakan syarat kemajuan bangsa. Pendidikan kejuruan adalah bagian dari sistem pendidikan yang mempersiapkan seseorang agar lebih mampu bekerja pada satu kelompok pekerjaan atau satu bidang pekerjaan dari pada bidang-bidang pekerjaan lainnya. Menurut penjelasan Undang-Undang Nomor 20 Tahun 2003 Pasal 15, pendidikan kejuruan merupakan pendidikan menengah yang mempersiapkan peserta didik terutama untuk bekerja dalam bidang tertentu. Sebagian besar Sekolah Menengah Kejuruan (SMK) memiliki beberapa (lebih dari satu) program keahlian sehingga memungkinkan terjadi kebingungan bagi calon siswa yang ingin mendaftar dalam memilih jurusan yang sesuai dengan minatnya. Dalam mendaftar seorang siswa akan memiliki acuan/tolok ukur untuk memilih jurusan yang sesuai dengan bakat, minat dan keinginannya.
Penelitian ini bertujuan untuk mengelompokkan peminatan jurusan dengan teknik clustering untuk mendeteksi adanya pencilan data (outlier) dalam pengambilan keputusan sehingga membantu siswa dalam memilih jurusan secara tepat dan akurat. Teknik yang akan digunakan adalah metode Self Organizing Map(SOM), acuannya adalah angka yang dikelompokkan/ clustered diharapkan mempermudah calon siswa mengambil atau memilih jurusan. Sedangkan Indeks Davies-Bouldin (IDB) digunakan untuk validasi cluster sehingga dihasilkan kelompok yang optimum atau paling homogen dari cluster-cluster yang sudah terbentuk.
Kata kunci : Clustering, Jaringan Syaraf Tiruan (JST), Metode Self-Organizing Maps (SOM).
ABSTRACT
Education is a major need in developing self-potential. The role of education is a condition of progress of the nation. Vocational education is part of the educational system that prepares a person to be better able to work in one group of jobs or one field of work than in other occupational fields. According to the explanation of Law Number 20 Year 2003 Article 15, vocational education is a secondary education that prepares learners primarily to work in a particular field. Most Vocational High Schools (SMK) have several (more than one) skill programs to allow confusion for prospective students who wish to enroll in choosing majors appropriate to their interests. In registering a student will have benchmarks / benchmarks to choose the majors that match his talents, interests and desires. This study aims to classify the interests of majors with clustering techniques to detect the existence of data outliers (outliers) in decision making so as to assist students in choosing majors accurately and accurately. The technique that will be used is Self Organizing Map method (SOM), the reference is clustered number is expected to facilitate the prospective students to take or choose the majors. The Davies-Bouldin (IDB)index is used for cluster validation to produce the optimum or most homogeneous group of clusters that have been formed.
Keywords : Clustering, Artificial Neural Network (ANN), Self-Organizing Maps (SOM) Method.
1. PENDAHULUAN
Pendidikan merupakan kebutuhan utama dalam mengembangkan potensi diri. Peran pendidikan merupakan syarat kemajuan bangsa. Perkembangan teknologi yang semakin maju membuat pendidikan merupakan bekal yang sangat penting untuk mengantarkan kita menuju masa depan yang cerah. Pendidikan kejuruan
adalah bagian dari sistem pendidikan yang mempersiapkan seseorang agar lebih mampu bekerja pada satu kelompok pekerjaan atau satu bidang pekerjaan daripada bidang-bidang pekerjaan lainnya. Menurut penjelasan Undang-Undang Nomor 20 Tahun 2003 Pasal 15, pendidikan kejuruan merupakan pendidikan menengah yang mempersiapkan peserta didik terutama untuk bekerja dalam bidang tertentu. Pendidikan kejuruan terdiri dari Sekolah Menengah Kejuruan, dan Madrasah Aliyah Kejuruan. Ada beberapa jurusan di SMK yang bisa dipilih oleh calon siswa yang akan masuk ke sekolah tersebut. Dalam memilih jurusan di SMK harus disesuiakan dengan skill/ keahlian yang dimiliki dan didukung oleh informasi agar siswa tidak salah dalam memilih jurusan. Adapun jurusan yang ada di SMK antara lain: Multimedia, Teknik Audio dan Video, Bisnis Kontruksi dan Properti, dan Teknik Komputer Jaringan. Dengan mengelompokkan peminatan jurusan menggunakan teknik clustering dapat membantu mendeteksi adanya pencilan data (outlier). Proses selanjutnya dapat dianalisa terhadap data outlier. Berdasarkan informasi yang ada, nantinya calon siswa akan lebih tepat dalam mengambil jurusan di SMK sehingga dapat mempermudah untuk pekerjaan dimasa mendatang.
Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, dkk [1] clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum. Clustering merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda dengan cluster yang lain. Partisi tidak dilakukan secara manual melainkan dengan suatu algoritma clustering. Oleh karena itu, clustering sangat berguna dan bisa menemukan group atau kelompok yang tidak dikenal dalam data.
Ada bermacam-macam metode untuk melakukan clustering, mulai dari metode yang sederhana hingga metode yang kompleks dengan menggunakan kecerdasan buatan seperti jaringan syaraf tiruan (Artificial Neural Network). Metode jaringan syaraf tiruan untuk melakukan clustering adalah metode jaringan syaraf yang menggunakan pola unsupervised learning, yaitu Kohonen’s Self-Organizing Maps (SOM). Jaringan Kohonen/SOM digunakan untuk mengelompokkan (clustering) data berdasarkan karakteristik/ fitur-fitur data.
2. METODE PENELITIAN Kajian Pustaka
Penelitian Terdahulu
Penelitian dengan tema yang sejenis pernah dilakukan oleh peneliti sebelumnya, dan merupakan perbandingan dengan penelitian yang dilakukan oleh penulis. Tidak dibuat tabel.
Penelitian yang dilakunan oleh Abdul Fadlil, adalah Perbandingan Pengklasifikasia Fungsi Jarak dan Jaringan Syaraf Tiruan Pada Sistem pengenalan Wajah Jaringan Syaraf Tiruan dengan Algoritma Backpropagation Penelitian ini adalah Sistem Pengenalan wajah menggunnakan teknik pengklasifikasian fungsi dan JST telah dibuat dan dapat bekerja efektif 4 sempel pada gambar menunjukkan tingkat akurasi yang sama baiknya.[2]
Penelitian yang kedua dialkukan olehAbdul Fadlil,Adhi Susanto,Litasari adalah Pengenalan Ucapan dengan Jaringan Syaraf Tiruan Kuantisasi Vektor Adaptif menggunakan tool Matlab menggunkana metode Adaptive Vector, menggunakan object platform Dekstop, Penelitian yang dilakukam dapat digunakan untuk pengenalan ucapan manusia dengan tingkat pengenalan cukup tinggi dengan menggunkan Jaringa Syaraf tiruan kuantisasi vector adaptif.[3]
Penelitian yang ketiga dilakukan oleh Sapriani Gustina, Abdul Fadlil, Rusydi Umar,.adalah Identifikasi Tanaman Kamboja menggunakan Ekstrasi Ciri Citra Daun dan Jaringan Syaraf Tiruan Matlab, Learning Vector Quantization, berbaisi Dekstop Penelitian yang telah berhasil dilakukan peneliti saat ini menentukan jenis dari daun Kamboja menggunkan metode Back Propogation [4]
Penelitian selanjutnya dilakukan oleh Abdul Fadlil, Sistem Identifikasi Otomatis Gangguan Kulit Manusia Metode SOM dan K-Means, berbasis Mobile Application, Penelitian ini bermanfaat bagi bank untuk memperbaiki layanan dan bermanfaat bagi tim pemasaran perbankan untuk meluncurkan promosi yang sesuai untuk clustering yang tepat[5].
Penelitian kelima dilakukan oleh Meylindra Arini P., Rully A. Hendrawan, Irmasari Hafidz, Penerapan Metode Self Organizing Map (SOM) Untuk Visualisasi Data Geospasial Pada Sistem Informasi Sebaran Data Pemilih Tetap (DPT) Matlab 7.01, ArcGIS 9.0, berbasis Dekstop, Aplikasi yang dibuat dapat menyelesaikan pengambilan keputusan terkait visualisasi data DPT dengan berbagai pertimbangan menyangkut jumlah pemilih, jumlah TPS dan beberapa pertimbangan lainnya dengan menggunkan metode SOM[6].
Penelitian keenam dilakukan oleh Yunus Anis a, R.Rizal Isnantob, Karakteristik Pelanggan Telepon Kabel Dengan SOM & K-MEANS Untuk Klasifikasi Pelanggan Perusahaan Telekomunikasi (Studi Kasus : PT. XYZ), menggunkan tool Matlab, SOM & K-MEANS, berbasis Dekstop, Penelitian yang dilakukan dengan menggunakan metode SOM dan Kmeans, dengan melakukannya terhadap data call detail record[7]
Penelitian selanjutnya dilakukan oleh Abdul Fadlil Ikhsan Hidayat Sunardin, Sistem Pengenalan Wajah Manusia Secara Real Time Menggunkaan Algoritma Jaringan Syaraf Tiruan Algoritma Jaringan Syaraf Tirua JST backpropagation, Sistem yang dibuat adalah pengenalan wajah yang telah dikembangkan kedalam sistem aplikasi. Prosentasi akurasi pengenalan citra wajah secara offline telah mencapai 93,69 % dengan parameter JST berupa laju pembelajaran ( a ) = 0,2 dan jumlah neuron pada lapis. tersembunyi sebanyak 40 neuron. Sedangkan pengenalan wajah secara langsung (realtime) yang diujikan kepada 5 orang dari 10 orang yang dilatihkan pada sistem diperoleh akurasi pengenalan 74,70 %[8]..
Dasar Teori
Flowchart dibutuhkan untuk menggambarkan suatu penelitian yang dilakukan secara detail. Pada flowchart yang dibuat dibawah ini merupakan gambaran sistem berjalan dari tahap awal sampai dengan tahap akhir.
Untuk lebih jelasnya dapat dilihat pada gambar 2.1 dibawah ini :
Gambar 2.1 Flowchart Sistem
Langkah-langkah pengelompokan pemintan jurusan adalah sebagai berikut : 1. Inputkan data peminatan jurusan dengan 3 kriteria.
2. Hasil data yang sudah dinormalisasikan dijadikan untuk proses selanjutnya.
3. Data tersebut dicluster menggunakan SOM, yang diawali dengan inisilisasi bobot, menetapkan learning rate, sehingga menghasilkan data yang sudah tercluster.
4.
Untuk setiap cluster yang terbentuk kemudian dilakukan pencarian nila rata-rata dari data yang tercluster, sehingga diperoleh hasil akhir nilai IDB.5.
Langkah 3 dan 4 dilakukan sebanyak yang diinginkan. Pada penelitian ini dilakukan analisa pengelompokan data keminatan jurusan dengan menggunakan 4 cluster.6.
Nilai IDB yang paling kecil adalah nilai IDB menunjukkan bahwa pengelompokan data tersebut adalah jenis pengelompokan yang mampu menghasilkan cluster paling homogen.Normalisasi
Langkah yang dilakukan pada penelitian ini adalah normalisasi. Normalisasi ini diawali dengan pembacaan data yang kemudian dilakukan perhitungan terhadap nilai statistik dari data. Setelah data statistik didapatkan, maka selanjutnya dilakukan proses pengkonversian terhadapa tiap instance dari data ke bentuk normal Zscore. Hasilnya disimpan kembali kedalam file untuk digunakan pada proses selanjutnya. Z-Score adalah suatu metode normalisasi yang didapatkan dengan mengurangkan intensitas raw data untuk masing- masing gen dengan keseluruhan rata-rata intensitas gen, kemudian dibagi dengan standar deviasi dari keseluruhan intensitas yang diukur [10].
𝑍𝑖 =𝑥1 − 𝑥̅
𝑠 Keterangan:
Zi : Jarak Eucledian Distance S : Sampel data pelatihan X : data pelatihan
𝑥̅ : rata – rata sample data pelatihan Self Organizing Map (SOM)
SOM merupakan metode berdasarkan model dari pendekatan jaringan syaraf tiruan. SOM dikembangkan oleh Prof. Teuvo Kohonen ilmuwan Finlandia pada tahun 1982. Jaringan SOM merupakan suatu jaringan yang banyak digunaan untuk membagi pola masukan ke dalam bebrapa kelompok cluster. SOM menyediakan suatu teknik visualisasi data yang membantu memahami data yang memiliki dimensi yang kompleks dengan mengurangi dimensi data kedalam peta. Dalam nilai bobot terdapat pola nilai input yang dikumpulkan dalam cluster. Selama proses SOM, unit cluster yang mempunyai nilai bobot akan dicocokkan dengan pola input yang terdekat dan dilpilih sebagai pemenang[11]. Adapun arsitektur SOM dapat dilihat pada Gambar 2.1
Gambar 2.1 Arsitektur SOM
Proses learning yang dilakukan SOM mirip dengan Artificial Neural Networks, tetapi proses untuk meng- assign input data ke map, lebih mirip dengan K-Means dan KNN Algorithm. Adapun prosedur yang ditempuh dalam melakukan clustering dengan SOM adalah sebagai berikut:
Algoritma SOM
1. Inisialisasi bobot. Pada tahap ini menentukan secara acak bobot awal secara random sebagai wij 2. Repeat
a. Menentukan data Pada algoritma tahap ini adalah menetukan data selanjutnya
b. Menentukan centroid dari obyek tersebut Untuk setiap data terhadap bobot dihitung menggunakan Euclidean Distance matrix
c. Menentukan bobot terbaru Dalam menentukan bobot terbaru pada waktu t, maka diasumsikan obyek saat ini x(i) dan centroid yang terbentuk wj. Kemudian untuk menentukan centroid yang baru untuk waktu berikutnya t+1 Wij(baru) =Wij(lama) + a[X1 -Wij (lama)] a adalah learning rate, tiap kenaikan epoch (iterasi) maka learning rate = learning rate awal *0.5
3. Until tidak ada perubahan centroid atau threshold sudah terpenuhi.
4. Iterasi pada langkah ke-2 akan berhenti apabila threshold terpenuhi, untuk mencapai nilai threshold terpenuhi dilakukan dengan menghitung nilai MSE.
5. Menetapkan setiap objek terhadap centroid dan menentukan letak Cluster tersebut.
Pada Gambar 2.2 jika neuron/bobot yang di tengah adalah winner neuron untuk suatu input vector/data, maka neighboring neuron untuk winner neuron ini adalah mereka yang terletak di dalam lingkaran area, yang didefinisikan dengan Nc(t1), Nc(t2), …dst. Nc(t1) adalah batas area pada iterasi ke-1, Nc(t2) adalah batas area pada iterasi ke-2, dst. Neuron yang secara topografi terletak jauh dari winner neuron tidak diupdate.
Gambar 2.2
Ilustrasi Self Organizing Map (SOM)
Secara ringkas algoritma Self Organizing Map digambarkan seperti tampak pada diagram alir pada Gambar 2.3
Gambar 2.3
Diagram Alir Self Organizing Map (SOM) Berikut ini adalah penjelasan Gambar 2.3
1. Masukan data calon siswa yang mendaftar. Data yang digunakan adalah data yang berbentuk matrik ixj, dan selanjutnya dilakukan proses clustering menggunakan metode SOM
2. Pada perhitungan menggunakan metode SOM, diawali dengan inisialisasi bobot secara random (acak)
3. Menetapkan learning rate (a), untuk epoch ke-2 dst nilai learning rate menjadi 0.5 * learning rate awal.
4. Untuk setiap data dilakukan perhitungan terhadap bobot menggunakan rumus Euclidean Distance. Kemudian dipilih nilai terkecil.
5. Data yang memiliki nilai terkecil dari langkah 4 digunakan untuk proses update bobot.
6. Melakukan pengecekan syarat berhenti, disini menggunakan nilai MSE.
7.
Apabila nila MSE 0,1 iterasi akan berhenti8. 8.Selanjutnya dilakukan proses pengelompokkan atau clusterisasi, disini menggunakan rumus Euclidean.
9. Hasil akhir dari proses ini yaitu data tercluster Eucledian Distance
Eucledian Distance dianggap sebagai distance matrix yang mengadopsi prinsip Phytagoras. Hal ini dikarenakan pola perhitungannya yang menggunakan aturan pangkat dan akar kuadrat. Eucledian akan memberikan hasil jarak yang relatif kecil.[12] Jarak antara Nilai Random/ Bobot dan data dihitung dengan menggunakan rumus Euclidean Distance.
Keterangan :
deucledian : Jarak Eucledian Distance pi : Titik Awal
qi : Titik Awal N : Jumlah Data Davies Bouldin Index
Indeks Davies-Bouldin (IDB) merupakan salah satu metode validasi cluster untuk evaluasi kuantitatif dari hasil clustering. Pengukuran ini bertujuan memaksimalkan jarak intercluster antara satu cluster dengan cluster yang lain. Dalam penelitian ini IDB akan digunakan untuk mendeteksi outlier pada
Dimana
DB : validasi davies bouldin Var : variance dari data N : Banyaknya data X : data ke-i
X : rata-rata dari tiap Cluster R : jarak antar Cluster
Skema clustering yang optimal adalah skema yang memiliki nilai IDB minimal [4]. Flowchart perhitungan IDB dapat dilihat pada Gambar 2.3.[13]
Gambar 2.3
Flowchart Self Organizing Maps (SOM)
1. Masukan data siswa yang mendaftar. Data yang digunakan adalah data yang berbentuk matrik ixj, dan selanjutnya dilakukan proses clustering menggunakan metode SOM
2. Pada perhitungan menggunakan metode SOM, diawali dengan inisialisasi bobot secara random (acak) 3. Menetapkan learning rate (a), untuk epoch ke-2 dst nilai learning rate menjadi 0.5 * learning rate awal.
4. Untuk setiap data dilakukan perhitungan terhadap bobot menggunakan rumus Euclidean Distance.
Kemudian dipilih nilai terkecil.
5. Data yang memiliki nilai terkecil dari langkah 4 digunakan untuk proses update bobot.
6. Melakukan pengecekan syarat berhenti, disini menggunakan nilai MSE.
7. Apabila nila MSE 0,1 iterasi akan berhenti
8. Selanjutnya dilakukan proses pengelompokkan atau clusterisasi, disini menggunakan rumus Euclidean.
9. Hasil akhir dari proses ini yaitu data tercluster Alat dan Bahan
Alat dan bahan yang dibutuhkan dalam penelitian ini adalah Laptop Acer -471 : Processor intel ® Codde
™ i3 2328M RAM8 GB, Sistem Operasi Windows 10 64 bit, Software yang digunakan Xampp 6.3.2, Bahasa Pemograman PHP, Script Engine Notepad++.
Objek Penelitian
Objek dalam penelitian ini adalah Pengelompokkan Pemintaan Jurusan di SMK berdasarkan kemiripan isi.
Pengelompokan data-data tersebut menggunakan metode Self Organizing Map(SOM).
3. HASIL DAN PEMBAHASAN
Setiap data memiliki banyak persyaratan atau kriteria yang sudah ditentukan. Dari persyaratan yang sudah di tentukan, ada beberapa persyaratan di atas yang menjadi pertimbangan utama untuk proses peminatan jurusan. Data training untuk pengelompokkan Jurusan berdasarkan 3 kriteria utama yaitu,
kemampuan(skill) dasar, bakat, dan minat adalah dengan perhitungan menggunakan metode yang sudah ditentukan.
Tabel 3 1 Input yang digunakan
Variabel/Kriteria Keterangan
X1 Skill
X2 Bakat
X 3 Minat
Tabel 3.2 Cluster
Cluster Keterangan
MM Multimedia
TKJ Teknik Komputer Jaringan
BK Bisnis Kontruksi
AV Audio Video/Elektronika
Gambar 3.1 Proses Clustering
4. PENUTUP
Berdasarkan dari uraian diatas, Algortima SOM dapat dimanfaatkan untuk penelitian ini dengan pemetaan data. Data akan dipetakan dengan cara mengelompokkan data tersebut menjadi 4 cluster .Dengan memperoleh data tersebut, maka kita kelompokkan objek tersebut kedalam 4 cluster dengan atribut sesuai keminatan Penggunaan model pemetaan data berbasis metode artificial neural network dengan algoritma self organizing maps ini dapat dijadikan sebagai alternatif cara yang mudah dan efektif dalam melakukan pemetaan data.Untuk perhitungan selanjutnya dibahas dijurnal berikutnya.
5. DAFTAR PUSTAKA
[1].
Tan, P.N., Steinbach, M., Kumar, V. (2006) Introduction to Data Mining. Boston:Pearson Education.[2]. Abdul Fadlil, 2007. Perbandingan Pengklasifikasian Fungsi Jarak dan Jaringan Syaraf Tiruan Pada Sistem Pengenalan Wajah.. Seminar Nasioanal Aplikasi Teknologi Informasi .2007.ISSN :19975022
[3].
Abdul Fadlil,2007,”Pengenalan Ucapan Dengan Jaringan Syaraf Tiruan Kuantisasi Vektor Adaptif”, Teknosasi 2001, XIV(1)[4].
Sapriani Gustina, Abdul Fadlil, Rusydi Umar, 2016, “Identifikasi Tanaman Kamboja menggunakan Ektraksi Ciri Citra Daun dan Jaringan Syaraf Tiruan”. Prosiding Seminar Penelitian Tahunan, ISBN:979-587-626-0
[5]. Abdul Fadlil, 2010,” Sistem Identifikasi Otomatis Gangguan Kulit Manusia”. ISSN:1693-6930 [6]. Niyagas, W., Srivihok, A., & Kitisin, S. (2006). Clustering e-banking customer using data mining
and marketing segmentation. ECTI Transactions on Computer and Information Technology, 2(1).