177
IMPLEMENTASI DATA MINING PADA DATA ALUMNI SMK
SWASTA SATRIA BINGAI MENGGUNAKAN
CLUSTRING K-MEANS
Ika pertiwi1)
1)STMIK KAPUTAMA
Program studi sistem Informasi
Jln Veteran No 4A-9A Binjai 20714 Sumatera Utara e-mail :1) [email protected]
ABSTRACT
At the Satria Bingai Private Vocational School in terms of implementing services and handling data collection carried out by employees, it is still done manually using Microsoft Excel and word written on the books so that it takes a slower and longer time to complete. To overcome this problem, the author makes programming Data Mining easier by designing it using the K-Maens clostring method, which is expected to overcome the manual system that has long been applied to the Satria Bingai Private Vocational School. students making it easier to find data on old student alumni. By using computer services, recording data collection can be done quickly and does not require a long time or large storage space and can make it easier for officers to collect data on alumni of Satria Bingai Private Vocational School, so that there are no more errors in data collection for employees at Satria Bingai Private Vocational School. With this program, the data will be more accurate and maintained so that it can provide information quickly and precisely.
Keywords: Data Mining, K-Maens Clostring Method, Alumni Data Collection, Satria Bingai Private Vocational School
ABSTRAK
Di SMK Swasta Satria Bingai dalam hal pelaksaan pelayanan dan penanganan pendataan yang di lakukan oleh pegawai masih dilakukan dengan cara manual yang menggunakan microsof excel dan word yang dituliskan pada pembukuan sehingga memerlukan waktu yang lambat dan lebih lama dalam penyelesaianya. Untuk mengatasi permasalahan tersebut penulis membuat pemrograman Data Mining yang lebih mudah dengan dirancangya mengunakan metode clostring K-Maens dihapkan dapat mengatasi sistem manual yang sudah lama yang diterapkan pada Smk Swasta Satria Bingai.Tujuan pengembangan menggunakan Metode Clostring K-Maens adalah untuk mempermudah dan meningkatkan keakuratan Pendataan siswa sehingga memudahkan dalam mencari data alumni siswa yang sudah lama. Dengan menggunakan jasa komputer, pencatatan data pendataan dapat dilakukan dengan cepat dan tidak memerlukan waktu yang lama maupun ruang penyimpanan yang besar dan dapat mempermudah petugas dalam Pendataan alumni Smk Swasta Satria Bingai, sehingga tidak ada lagi kesalahan dalam pendataan bagi pegawai di Smk Swasta Satria Bingai. Dengan adanya Perogram ini data akan lebih akurat dan terpelihara sehingga dapat memberikan informsi dengan cepat dan tepat. Kata Kunci : Data Mining, metode clostring K-Maens,Pendataan Alumni, Smk Swasta Satria Bingai
178 1. PENDAHULUAN
Upaya peningkatan mutu sebuah sekolah tidak bisa dibebankan hanya pada sekolah. Dalam Manajemen Peningkatan Mutu Berbasis Sekolah (MPMBS) diperlukan sinergi dan kerjasama antara beberapa komponen (stakeholders) yang melingkupi sekolah (Departemen Pendidikan Nasional, 2002). Di antara komponen tersebut adalah alumni. Alumni merupakan aset penting yang harus dirangkul dan dikembangkan sedini mungkin. Peran alumni antara lain, sebagai katalis dengan memberikan berbagai masukan membangun kepada almamater dan diharapkan mampu mengembangkan jaringan serta membangun pencitraan institusi di luar. Kerjasama dan sinergi yang harmonis antara sekolah dengan alumni akan memiliki dampak yang besar bagi pengembangan sekolah secara berkesinambungan di masa mendatang. Data mining sendiri memiliki beberapa teknik untuk menemukan pola atau informasi yang tersembunyi salah satunya yang banyak digunakan dalam 2 penelitian kebanyakan adalah teknik klaster. Teknik klaster sendiri merupakan teknik yang tidak menggunakan parameter atau disebut juga non parametic dan diaplikasikan untuk kasus nyata. Untuk dapat mengaplikasikan teknik ini perlu adanya algoritma yang bekerja, data mining juga memiliki beberapa algoritma tetapi yang paling sederhana dan sering digunakan adalah algoritma k-means, algoritma ini sendiri bertujuan untuk mengelompokan obyek ke dalam klaster atau kelompok yang telah ditentukan.
2. METODOLOGI PENELITIAN 2.1 Kecelakaan
Penelitian terdahulu ini menjadi salah satu acuan dalam melakukan penelitiansehingga dapat memperkaya teori yang digunakan dalam mengkaji penelitian yang dilakukan. Beberapa penelian terdahulu ini dijadikan sebagai referensi dalam memperkaya bahan kajian pada penelitian ini. Salah satu
penelitian terdahulu yaitu dengan judul judul K-means Clustering Untuk Data Kecelakaan Lalu Lintas Jalan Raya Di Kecamatan Pelaihari dengan hasil Penerapan K-means clustering telah berhasil dilakukan pada dataset 2, dimana kedua cluster yang dihasilkan menunjukkan bahwa kecelakaan lalu lintas sering terjadi pada kendaraan roda 2, korbannya adalah pengemudi, terjadi pada hari kerja, dan terjadi di waktu pagi hari (Winda Aprianti dan Jaka Pemadi, 2017).
2.2 pengelompokan
Peneliti lain yaitu dengan judul Analisis Dengan hasil meyode Clustering dengan algoritma k-means dapat meminimalkan data yang ada pada cluster /kelompok dan memaksimalkan data pada cluster yang lainnya dengan cara mendekatkan data untuk menentukan ke group mana data seharusnya berada. Pada hasil penentuan group dapat dilihat bahwa group 1 yang berjumlah 27 data dimana 1 kriteria yang rendah 2 kriteria untuk mendukung penilaian dosen yang tinggi. Group 2 yang berjumlah 13 data dimana dari penyampaian materi, disiplin dan sikap bernilai rendah. Group 3 yang berjumlah 44 data dimana untuk materi,disiplin dan sikap bernilai tinggi (Akim Manaor Hara Pardede dan Budi Serasi Ginting, 2012). Peneliti selanjutnya yaitu dengan judul Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada RSUD Pekanbaru. Dengan hasil penelitian hasil clusterisasi pada data obat – obatan dapat ditarik kesimpulan bahwa kelompok obat yang termasuk pemakaian sedikit rata rata permintaan obat setiap tahunnya kurang dari 18000 buah, dan obat yang termasuk pemakaian sedang rata rata permintaan obat setiap tahunnya diantara 18000–70000 buah, sedangkan obat yang masuk kedalam kelompok obat yang pemakaian tinggi rata – rata permintaan obat setiap tahunnya diatas 70000 buah (Gustientiedina dkk, 2019)
179 3. HASIL DAN PEMBAHASAN
1. Data Awal untuk Clustering K-Means ImplementasiClustering K-pop Means dan Model Case Based Reasoning dalammemperoleh informasi alumni siswa sekolah SMK Swasta Satria Sei Bingai membutuhkan suatu data-data tentang data alumni SMK Swasta Satria Sei Bingai. Berdasarkan penelitian yang telah dilakukan pada sekolah SMK Swasta Satria Sei Bingai maka diperoleh suatu data yang nantinya digunakan untuk menganalisis data alumni siswa sekolah SMK Swasta Satria Sei Bingai. Adapun data tersebut yaitu seperti pada tabel dibawah ini.
Tabel 1. Data Alumni Sekolah Siswa SMK Swasta Satria Sei Bingai No Objec t Nila i Jurusa n Asal/Des a 1 A 82 Akunta nsi Telagah 2 B 82 Akunta
nsi Namu Ukur Utara 3 C 82 Akunta
nsi Mekar Jaya 4 D 85 TSM Telagah 5 E 82 TSM Namu Ukur Selatan 6 F 81 TSM Gunung Ambat 7 G 80 Akunta nsi Telagah 8 H 81 Akunta nsi Namu Ukur Selatan 9 I 80 Akunta nsi Namu Ukur Utara 10 J 82 Akunta nsi Mekar jaya 11 K 82 TSM Telagah 12 L 83 TSM Namu Ukur Utara 13 M 80 TSM Rumah Galuh 14 N 81 TSM Namu Ukur Selatan 15 O 82 TSM Namu Ukur Selatan 16 P 81 TSM Namu Ukur Selatan 17 Q 83 Akunta nsi Namu Ukur Utara 18 R 82 Akunta
nsi Namu Ukur Utara 19
S
82 Akunta
nsi Namu Ukur Utara 20
T
82 Akunta
nsi Namu Ukur Utara Adapun data sample untukImplementasi Clustering Machine Learning dan Model Case Based Reasoning dalam Mendiagnosa Gizi Buruk Pada Anak (Studi Kasus Rumah Sakit Cut Meutia) adalah sebagai berikut :
Tabel 2.Nilai Kode Nilai 1 80 – 100 2 70 – 79 3 60 – 69 4 50 – 59 5 < 50
180 Tabel 3. Jurusan
Kode Nama Jurusan 1 Akuntansi (AK)
2 Teknis Sepeda Motor (TSM)
Tabel 4. Asal dan Kelurahan Kode Asal/Kelurahan
1 Telagah
2 Namu Ukur Utara 3 Mekar Jaya
4 Namu Ukur Selatan 5 Gunung Ambat 6 Rumah Galuh 7 Belinteng
Selanjutnya mentransformasi data kriteria di atas untuk dihitung dengan menggunakan metode clustering dengan algoritma k-means. Adapun data transformasi dari data di atas dapat dilihat pada tabel dibawah ini.
Tabel 5. Data Transformasi
No Object X Y Z 1 A 1 1 1 2 B 1 1 2 3 C 1 1 3 4 D 1 2 1 5 E 1 2 4 6 F 1 2 5 7 G 1 1 1 8 H 1 1 4 9 I 1 1 2 10 J 1 1 3 11 K 1 2 1 12 L 1 2 2 13 M 1 2 6 14 N 1 2 4 15 O 1 2 4 16 P 1 2 4 17 Q 1 1 2 18 R 1 1 2 19 S 1 1 2 20 T 1 1 2 Kemudian membentuk cluster
menjadi 3 kelompok (K=3) dan menentukan titik pusat centroid. Adapun proses perhitungan clustering seperti dibawah ini.
K=3 Centroid
C1= (1,1,1) diambil dari data A
C2= (1,1,2) diambil dari data B
C3= (1,1,3) diambil dari data
Tabel 6. Hasil Perhitungan Iterasi 1 N o Obj ect X Y Z C1 C2 C3 Gro up
181 1 A 1 1 1 00 0, 00 1, 00 2, 1 2 B 1 1 2 1, 00 0, 00 1, 00 2 3 C 1 1 3 2, 00 1, 00 0, 00 3 4 D 1 1 1 00 0, 00 1, 00 2, 1 5 E 1 1 4 00 3, 00 0, 00 1, 2 6 F 1 1 5 00 4, 00 3, 00 2, 3 7 G 1 1 1 00 0, 00 1, 00 2, 1 8 H 1 1 4 00 3, 00 2, 00 1, 3 9 I 1 1 2 1, 00 0, 00 1, 00 2 1 0 J 1 1 3 2, 00 1, 00 0, 00 3 1 1 K 1 1 1 0, 00 1, 00 2, 00 1 1 2 L 1 1 2 1, 00 0, 00 1, 00 2 1 3 M 1 1 6 5, 00 4, 00 3, 00 3 1 4 N 1 1 4 3, 00 2, 00 1, 00 3 1 5 O 1 1 4 3, 00 2, 00 1, 00 3 1 6 P 1 1 4 00 3, 00 2, 00 1, 3 1 7 Q 1 1 2 1, 00 0, 00 1, 00 2 1 8 R 1 1 2 1, 00 0, 00 1, 00 2 1 9 S 1 1 2 1, 00 0, 00 1, 00 2 2 0 T 1 1 2 1, 00 0, 00 1, 00 2 Setelah dilakukan perhitungan menggunakan rumus cluster yang ada, maka group berdasarkan jarak minimal Centroid terdekat adalah:
Dari perhitungan di atass maka diperoleh hasil perhitungan iterasi 2 yaitu seperti pada tabel dibawah ini.
Tabel 7 Hasil Perhitungan Iterasi 2 N o Obj ect X Y Z C1 C2 C3 Gro up 1 A 1 1 1 00 0, 25 1, 13 3, 1 2 B 1 1 2 00 1, 25 0, 13 2, 2 3 C 1 1 3 2, 00 0, 75 1, 13 2 4 D 1 1 1 0, 00 1, 25 3, 13 1 5 E 1 1 4 00 3, 00 0, 13 0, 2 6 F 1 1 5 00 4, 75 2, 88 0, 3 7 G 1 1 1 00 0, 25 1, 13 3, 1 8 H 1 1 4 00 3, 75 1, 13 0, 3 9 I 1 1 2 00 1, 25 0, 13 2, 2
182 1 0 J 1 1 3 2, 00 0, 75 1, 13 3 1 1 K 1 1 1 0, 00 1, 25 3, 13 1 1 2 L 1 1 2 1, 00 0, 25 2, 13 2 1 3 M 1 1 6 5, 00 3, 75 1, 88 3 1 4 N 1 1 4 3, 00 1, 75 0, 13 3 1 5 O 1 1 4 3, 00 1, 75 0, 13 3 1 6 P 1 1 4 3, 00 1, 75 0, 13 2 1 7 Q 1 1 2 1, 00 0, 25 2, 13 2 1 8 R 1 1 2 1, 00 0, 25 2, 13 2 1 9 S 1 1 2 1, 00 0, 25 2, 13 2 2 0 T 1 1 2 1, 00 0, 25 2, 13 2 Setelah dilakukan perhitungan menggunakan rumus cluster yang ada pada iterasi 1 dan 2, maka group berdasarkan jarak minimal Centroid terdekat adalah:
Grou p Lam a : ( 1 2 2 1 2 3 1 3 2 3 1 2 3 3 3 2 2 2 2 2 ) Grou p Baru : ( 1 2 2 1 2 3 1 3 2 3 1 2 3 3 3 2 2 2 2 2)
Setelah dilakukan perhitungan menggunakan rumus cluster yang ada, pada iterasi 2 terjadi sama seperti iterasi 2 dan Tidak ada data yang berpindah group lagi sehingga perhitungan dapat dihentikan. Sehingga dapat dibuat grafik cluster data
alumni siswa SMK Swasta Satria Sei Bingai.
Grafik Clustering
Membuat grafik cluster berdasarkan perhitungan yang telah dilakukan. Adapun grafik yang diperoleh adalah sebagai berikut :
Gambar 1. Grafik Cluster Berdasarkan Perhitungan Yang Telah Dilakukan
Cluster 1 : 1; 1; 1;
Cluster 2 : 1; 1; 2,25;
Cluster 3 : 1; 1; 4,13;
Penjelasan Grafik :
Dari 20 data diperoleh 3 group, Cluster 1 terdapat 4 data, Cluster 2 terdapat 8 data, dan Cluster 3 terdapat 8 data. Dan diperoleh Group terbanyak adalah
cluster 1.
Tampilan Halaman Utama
Tampilan halaman utama ini dimana pengguna hanya bisa membuka menu proses cluster, informasi dan menu exit. 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 Z : Asal/Desa Y : Jurusan X : Nilai 9 10 9 10 11 12
183 Gambar 2. Tampilan Halaman Utama
Tampilan Menu Custer
Pada saat pengguna masuk ke menu proses cluster atau pengelompokkan maka terlebih dahulu menginputkan data terlebih dahulu serta menentukan jumlah cluster yang tersedia di tampilan tersebut. Setelah selesai menginput data tersebut maka tahap selanjutnya yaitu mengklik poses cluster, yang nantinya akan muncul tampilan proses cluster dimana hasil Centroid, keterangan centroid serta anggota cluster dan juga diagram tertera dan telah menunjukkan bahwa data yang di input sebelumnya sudah diproses pada tampilan home proses tersebut.
Gambar 3. Tampilan Menu Cluster
7. Tampilan Informasi
Pada tampilan informasi data hasil ini saat menginput semua dari informasi data alumni siswa satria maka proses informasi akan menampilkan beberapa kriteria dari data alumnis siswa satria yaitu jenis nilai rata-rata SKHU, jurusan dan asal/desa.
Gambar 4. Tampilan Informasi 8. Bantuan
Pada bantuan ini berisikan informasi tentang tata cara penggunan sistem ini. Adapun menu dari bantuan ini yaitu sebagai berikut.
Gambar 5. Bantuan 9. Implementasi
Implemetasi mempunyai tujuan untuk menyiapkan semua kegiatan
184
penerapan sistem sesuai dengan rancangan yang telah ditentukan. Pada sistem clustering data alumnis siswa sekolah Satria Sei Bingai menggunakan algoritma k-means diimplemtasikan dengan menggunakan bahasa pemrograman
Matlab, sedangkan untuk media
penyimpanan database menggunakan
Microsoft Excel.
Dalam implementasi ini akan di analisa program yang dapat memproses data alumnis siswa satria dengan menggunakan metode clustering. Data akan diproses dengan cara mengimport jumlah data yang telah diuraikan di atas kemudian diproses untuk mendapatkan suatu informasi dari hasil proses sistem. Berikut merupakan hasil proses sistem yang telah dilakukan seperti pada gambar dibawah ini.
Gambar 6. Proses Cluster
Dari hasil diatas dapat dijumlahkan masing-masing group yaitu sebagai berikut : Grup 1 Sebanyak 37 data
Grup 2 Sebanyak 41 data Grup 3 Sebanyak 41 data Jadi total data = 155 data
Adapun hasil grafik 3 cluster dapat dilihat pada gambar 7 Seperti Berikut :
Gambar 7. Grafik Cluster Pusat : C1 : 1 1,7027 3,7297 (1 2 4) C2 : 1 1,9351 7,2078 (1 2 5) C3 : 1 1,7073 1,4634 (1 2 1) Keterangan : a. C1 : 1 1,7027 3,7297 (1 2 4)
Berdasarkan Perhitungan di atas dapat diketahui bahwa pada cluster 1 berpusat pada centroid dengan grup nilai (X) adalah nilai > 80, dengan jurusan (Y) yaitu Teknik Sepeda Mototr (TSM), dengan Asal/Desa (Z) yaitu Namu Ukur Selatan. b. C2 : 2,9493 3,5326 5,3514 (3 4 5)
Berdasarkan Perhitungan di atas dapat diketahui bahwa pada cluster 1 berpusat pada centroid dengan grup nilai (X) adalah nilai > 80, dengan jurusan (Y) yaitu Teknik Sepeda Mototr (TSM), dengan Asal/Desa (Z) yaitu Gunung Ambat.
c. C3 : 1 1,7073 1,4634 (1 2 1)
Berdasarkan Perhitungan di atas dapat diketahui bahwa pada cluster 1 berpusat pada centroid dengan grup nilai (X) adalah nilai > 80, dengan jurusan (Y) yaitu Teknik Sepeda Mototr (TSM), dengan Asal/Desa (Z) yaitu Telagah.
Untuk informasi pada setiap centroid proses perhitungan di atas dapat dilihat seperti pada gambar dibawah ini dengan cara memilih jenis nilai SKHU,
185
jurusan dan asal/Desa kemudain klik proses maka akan tampil informasi jumlah data yang dipilih.
Gambar 8. Informasi Hasil Centroid 1 Dari gambar di atas hasil centroid 1 dapat dilihat informasi bahwa nilai > 80 sebanyak 155 alumni, jurusan Teknisk Sepeda Motor (TSM) sebanyak 127 alumni dan asal desa dari telagah sebanyak 22 alumni, selanjutnya untuk mendapatkan informasi dilakukan dengan cara yang sama
.
4. KESIMPULAN
Berdasarkan penjelasan-penjelasan yang telah di kemukakan, penulis dapat mengambil kesimpulan sebagai berikut:
1. Dengan menggunakan bahasa pemrograman data mining dengan metode Clostring K-Means akan lebih mempermudahkan admin dalam mencari tempat tinggal,nilai dan nama siapa saja yg terdapat di pengelompokan data, pengimputan data akan lebih cepat dan akurat dalam melakukan kegiatan pengolahan data, semakin efektif dan memerlukan waktu lama. 2. Dengan kecerdasan metode
Clostring K-Maens, sistem control
yang di bangun mampu mempertimbangkan input yang diberikan User menjadi hasil
Outputya .
5. SARAN
Adapun saran yang dapat penulis sampaikan agar dapat memberikan manfaat bagi semuanya :
1. Pembuatan program ini masih dapat dikembangkan seiring zaman sesuai kebutuhan sipengguna perlukan. 2. Untuk mengamankan sistem dengan
memberikan anti virus agar aplikasi dapat digunakan dan bekerja dengan baik dan berjalan dengan lancar tampa ada gangguan.
Pengamanan data dapat dengan membackup data, agar lebih terjamin keamanannya dan mengantifikasi jika terjadi sesuatu yang tidak di inginkan seperti terjadi kerusakan dan kehilangan data-data penting, dengan membackup file dapat digunakan kembali
DAFTAR PUSTAKA
[1]. Akim Manaor Hara Pardede dan Budi Serasi Ginting. 2012. Analisis Pengelompokkan Performance Dosen Dengan Metode Clustering Pada Stmik Kaputama Binjai. Jurnal KAPUTAMA, Vol.5 No.2 ISSN : 1979-6641, STMIK Kaputama. Binjai.
[2]. Eko Prasetyo,2012 Data Mining Konsep Dan Aplikasi mengunakan
Matlab, Penerbit C.V Andi,
Yogyakarta.
[3]. Fajar Astuti Hermawati, 2013 Data Mining, Penerbit C.V Andi, Yogyakarta,
[4]. Gunaidi Abdia Away.2014.The Shortcut of MATLAB Programming. Informatika, Bandung.
[5]. Gustientiedina, M.Hasmil Adiya dan Yenny Desnelita. 2019. Penerapan Algoritma K-Means Untuk
186
Clustering Data Obat-Obatan Pada RSUD Pekanbaru. Jurnal Nasional Teknologi dan Sistem Informasi ISSN : 2460-3465. Sekolah Tinggi Ilmu Komputer Pelita Indonesia, Pekanbaru.
[6]. Kusrini, Emha Taufiq Luthfi, 2009, Algoritma Data Mining, Penerbit C.V Andi, Yogyakarta.
[7]. Riswan Dwi Djatmiko. 2016. Keselamatan dan Kesehatan Kerja. CV. Budi Utama. Yogyakarta.
[8]. Siregar, M. H. (2018). Data Mining Klasterisasi Penjualan Alat-Alat Bangunan Menggunakan Metode K-Means (Studi Kasus Di Toko Adi Bangunan). Jurnal Teknologi Dan
Open Source, 1(2), 83–91.
https://doi.org/10.36378/jtos.v1i2.24
[9]. Syahputra, S., Ramadani, S., & Pardede, A. M. H. (2020). MENENTUKAN STRATEGI PROMOSI MENGGUNAKAN ALGORITMA CLUSTERING K-MEANS. JOISIE (Journal Of Information Systems And Informatics Engineering), 4(1), 7-14.
[10]. Yuni Sugiarti. 2013.Analisis dan Perancangan UML (United Modeling
Language) Generated VB.6.Graha
Ilmu. Yogyakarta.
[11].Winda Aprianti dan Jaka Permadi. 2017. K-Means Clustering Untuk Data kecelakaan LaluLintas Jalan Raya di Kecamatan Pelaihari. Jurnal Teknologi Informasi dan Ilmu Komputer P-ISSN: 2355-7699, Poleteknik Negeri Tanah Laut. Padang.
[12]. Indra Yatini B. 2010. Flowchart,
Algoritma dan Pemrograman
menggunakan Bahasa C++Builder,
Graha Ilmu. Yogyakarta.
[13].http://digilib.uinsby.ac.id/14326/36/B ab%202.pdf diakses pada tanggal 11 September 2020.