PENERAPAN METODE K-MEANS UNTUK
CLUSTERING MAHASISWA BERDASARKAN
PARAMETER NILAI MAGANG DAN JOB
DESCRIPTION PADA JURUSAN TEKNIK
INFORMATIKA POLITEKNIK NEGERI BATAM
TUGAS AKHIR
Oleh :
Cytra Sari Rewati Saragi 3311401002
Disusun untuk memenuhi syarat kelulusan Program Diploma III
PROGRAM STUDI TEKNIK INFORMATIKA POLITEKNIK NEGERI BATAM
BATAM 2017
HALAMAN PENGESAHAN
PENERAPAN METODE K-MEANS UNTUK CLUSTERING MAHASISWA BERDASARKAN PARAMETER NILAI MAGANG DAN
JOB DESCRIPTION PADA JURUSAN TEKNIK INFORMATIKA
POLITEKNIK NEGERI BATAM
Oleh :
Cytra Sari Rewati Saragi (3311401002)
Tugas Akhir ini telah diterima dan disahkan sebagai persyaratan untuk memperoleh gelar
Ahli Madya di
PROGRAM STUDI DIPLOMA 3 TEKNIK INFORMATIKA POLITEKNIK NEGERI BATAM
Batam, Januari 2017 Disetujui oleh;
Pembimbing,
Mir’atul Khusna Mufida, M.Sc. NIK. 109057
HALAMAN PERNYATAAN
Dengan ini, saya:NIM : 3311401002
Nama : Cytra Sari Rewati Saragi
adalah mahasiswa Teknik Informatika Politeknik Batam yang menyatakan bahwa tugas akhir dengan judul:
PENERAPAN METODE K-MEANS UNTUK CLUSTERING MAHASISWA BERDASARKAN PARAMETER NILAI MAGANG DAN
JOB DESCRIPTION PADA JURUSAN TEKNIK INFORMATIKA
POLITEKNIK NEGERI BATAM
disusun dengan:
1. tidak melakukan plagiat terhadap naskah karya orang lain 2. tidak melakukan pemalsuan data
3. tidak menggunakan karya orang lain tanpa menyebut sumber asli atau tanpa ijin pemilik
Jika kemudian terbukti terjadi pelanggaran terhadap pernyataan di atas, maka saya bersedia menerima sanksi apapun termasuk pencabutan gelar akademik.
Lembar pernyataan ini juga memberikan hak kepada Politeknik Batam untuk mempergunakan, mendistribusikan ataupun memproduksi ulang seluruh hasil Tugas Akhir ini.
Batam, Januari 2017
Cytra Sari Rewati Saragi
KATA PENGANTAR
Puji syukur penulis ucapkan kepada Tuhan Yang Maha Esa yang telah memberikan berkat-Nya, sehingga penulis dapat menyelesaikan Tugas Akhir ini dengan judul “Penerapan Metode K-Means untuk Clustering Mahasiswa Berdasarkan Parameter Nilai Magang dan Job Description pada Jurusan Teknik Informatika Politeknik Negeri Batam”. Tugas Akhir ini disusun sebagai salah satu syarat untuk kelulusan. Dalam Penyusunan Tugas Akhir ini penulis banyak mendapat saran, dorongan, bimbingan serta keterangan-keterangan dari berbagai pihak. Oleh karena itu penulis mengucapkan terimakasih kepada :
1. Tuhan Yang Maha Esa, yang senantiasa memberikan limpahan anugerah dan berkat-Nya berupa nikmat kesehatan yang selalu mengiringi Penulis. 2. Ibu Mir’atul Khusna Mufida, M.Sc. selaku dosen pembimbing Tugas Akhir
yang telah meluangkan waktu untuk memberikan bimbingan.
3. Bapak Sudra Irawan M.Sc , selaku dosen wali Teknik Informatika angkatan 2014 yang selalu memberikan motivasi bagi Penulis agar menyelesaikan Tugas Akhir ini dengan baik.
4. Keluarga, yang telah memberikan dukungan, nasihat, dan motivasi serta doa yang tak henti-hentinya agar selalu semangat dalam menyelesaikan Tugas Akhir ini.
5. Semua teman-teman dan pihak yang tidak mungkin penulis sebutkan satu persatu yang telah banyak membantu sehingga Tugas Akhir ini dapat diselesaikan.
Penulis menyadari masih terdapat banyak kekurangan yang dibuat baik sengaja maupun tidak sengaja. Untuk itu penulis mohon maaf atas segala kekurangan tersebut tidak menutup diri terhadap segala saran dan kritik serta masukan yang bersifat membangun bagi diri penulis. Akhir kata penulis ucapkan terimakasih.
Batam, Januari 2017
ABSTRAK
PENERAPAN METODE K-MEANS UNTUK CLUSTERING MAHASISWA BERDASARKAN PARAMETER NILAI MAGANG DAN
JOB DESCRIPTION PADA JURUSAN TEKNIK INFORMATIKA
POLITEKNIK NEGERI BATAM
Dalam pelaksanaan kegiatan magang masih ditemukan beberapa kendala, diantaranya mahasiswa jurusan Teknik Informatika selama ini mengalami kesulitan dalam menentukan posisi magang yang sesuai dengan minat dan kemampuannya dan kurangnya informasi jenis pekerjaan yang dibutuhkan dari pihak perusahaan atau instansi tujuan magang. Penelitian ini bertujuan untuk mengelompokkan mahasiswa dengan menerapkan algoritma K-means, sehingga menghasilkan suatu pola yang dapat mengidentifikasi mahasiswa yang berpotensi bermasalah. Metode penelitian yang digunakan adalah dokumen data laporan magang mahasiswa. Manfaat dari adanya aplikasi ini adalah mempermudah pihak Politeknik Negeri Batam dalam menentukan posisi magang mahasiswa dan mempermudah mahasiswa untuk mengetahui informasi jenis pekerjaan yang dibutuhkan oleh pihak perusahaan atau instansi.
ABSTRACT
IMPLEMENTATION OF K-MEANS METHODS FOR CLUSTERING STUDENT BASED ON VALUES INTERNSHIP AND JOB DESCRIPTION
OF INFORMATICS ENGINEERING DEPARTMENT BATAM STATE POLYTECHNIC
In the implementation of the internship activities still found several problems, including the Department of Information Engineering students have had difficulty in determining an intern position that match their interests and abilities and lack of information on the type of work required of the company or agency internship destination. This study aims to classify students by implementing the K-means algorithm, thereby generating a pattern that can identify potentially problematic student. The method used is the student internship report data document. The benefits of this application is to facilitate the Batam State Polytechnic in determining the position of student internships and easier for students to find information on the type of work required by the company or agency.
DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PENGESAHAN ... ii
HALAMAN PERNYATAAN ... iii
KATA PENGANTAR ... iv
ABSTRAK ... vi
ABSTRACT ... vii
DAFTAR ISI ... viii
DAFTAR GAMBAR ... x
DAFTAR TABEL ... xii
BAB I PENDAHULUAN ... 13 1.1 Latar Belakang ... 13 1.2 Rumusan Masalah ... 14 1.3 Batasan Masalah ... 14 1.4 Tujuan Penelitian ... 15 1.5 Manfaat Penelitian ... 15 1.6 Tinjauan Pustaka ... 15 1.7 Sistematika Penulisan ... 16
BAB II LANDASAN TEORI ... 17
2.1 Magang ... 17
2.2 Visualisasi ... 17
2.3Data Mining ... 18
2.4 Knowledge Discovery in Database (KDD) ... 18
2.5 Clustering ... 19
2.6 Algoritma K-Means ... 20
2.7 ER-Diagram ... 21
2.8 DFD ... 23
2.9 Weka Data Mining Tool ... 24
2.10 MySQL ... 25
2.11 PHP ... 26
2.12 JpGraph ... 27
BAB III ANALISIS DAN PERANCANGAN ... 28
3.1 Analisis Data ... 28
3.1.1 Sumber Data dan Metode ... 28
3.1.2 Prepocessing Data ... 28
3.1.3 Transformasi Data ... 29
3.1.4 Clustering ... 32
3.2 Deskripsi Umum Sistem ... 33
3.5 Perancangan Basis Data ... 34 3.6DFD ... 35 3.6.1 DFD level 0 ... 35 3.6.2 DFD level 1 ... 35 3.6.3 DFD level 2 ... 36 3.7 Perancangan Antarmuka ... 38 3.7.1 Rancangan Login ... 39
3.7.2 Rancangan Form Input Document ... 39
3.7.3 Rancangan Clustering K-Means ... 40
3.7.4 Rancangan Grafik... 41
BAB IV IMPLEMENTASI DAN PENGUJIAN ... 42
4.1Implementasi Daftar File ... 42
4.2Implementasi Basis Data ... 43
4.2.1users ... 43
4.2.2databaru ... 43
4.2.3centroid ... 43
4.3Implementasi Antarmuka ... 44
4.3.1 Implementasi Proses Login ... 44
4.3.2 Implementasi Menu Utama ... 46
4.3.3 Implementasi Menu Cluster ... 50
4.4Hasil Pengujian ... 59
4.4.1 Hasil Pengujian Pengelola... 59
4.4.2 Hasil Pengujian Pengguna... 62
4.4.3 Hasil Persentase ... 63
BAB V KESIMPULAN DAN SARAN ... 64
5.1Kesimpulan ... 64
5.2Saran ... 64
DAFTAR PUSTAKA ... 65
DAFTAR GAMBAR
Gambar 1 Tahapan KDD ... 18
Gambar 2 Contoh Cluster ... 20
Gambar 3 Algoritma clustering K-Means... 21
Gambar 4 Contoh ER-Diagram Sederhana ... 23
Gambar 5 Komponen DFD ... 23
Gambar 6 Tampilan Aplikasi Weka Data Mining Tool ... 25
Gambar 7 Kode PHP dan Tampilan Script PHP pada web browser ... 27
Gambar 8 Contoh Simpel Grafik Scatter ... 27
Gambar 9 Data Rekapan Mahasiswa Magang ... 28
Gambar 10 Hasil Seleksi Atribut ... 29
Gambar 11 Hasil Normalisasi Data ... 31
Gambar 12 Hasil Clustering mahasiswa dengan WEKA ... 32
Gambar 13 Deskripsi Umum Sistem ... 33
Gambar 14 ER-Diagram Sistem Analisis Data Magang ... 34
Gambar 15 Level 0 dari Sistem Analisis Data Magang ... 35
Gambar 16 Level 1 dari Sistem Analisis Data Magang ... 35
Gambar 17 Level 2 Proses Pengolahan Data Magang Mahasiswa ... 36
Gambar 18 Level 2 Proses Prepocessing Data Magang Mahasiswa... 36
Gambar 19 Level 2 Proses Pengelompokan Magang Mahasiswa ... 37
Gambar 20 Algoritma K-Means pada Proses Clustering ... 38
Gambar 21 Rancangan Login... 39
Gambar 22 Rancangan Form Input Document ... 39
Gambar 23 Antarmuka masukan jumlah cluster ... 40
Gambar 24 Rancangan Clustering K-Means ... 40
Gambar 25 Rancangan Grafik ... 41
Gambar 26 Login ... 44
Gambar 27 Source Code Login ... 45
Gambar 30 Tampilan Menu Utama sebagai Member ... 47
Gambar 31 Tampilan Download Format ... 47
Gambar 32 Source Code Download Format ... 48
Gambar 33 Tampilan Upload ... 48
Gambar 34 Source Code Upload File ... 49
Gambar 35 Tampilan Form Input ... 49
Gambar 36 Source Code Form Input ... 50
Gambar 37 Tampilan Masukan Jumlah Cluster ... 50
Gambar 38 Source code Jumlah Cluster ... 51
Gambar 39 Data Hasil Cluster ... 52
Gambar 40 Source code cluster ... 54
Gambar 41 Tabel Centroid Hasil Cluster ... 54
Gambar 42 Source code Centroid Cluster ... 56
Gambar 43 Hasil Grafik Data Laporan Magang ... 57
DAFTAR TABEL
Tabel 1 Perbandingan Hasil Penelitian ... 15
Tabel 2 Implementasi Daftar File ... 42
Tabel 3 Tabel user ... 43
Tabel 4 Tabel databaru ... 43
Tabel 5 Tabel centroid ... 43
Tabel 6 Tabel Skenario Pengujian untuk Pengelola ... 59
Tabel 7 Tabel Skenario Pengujian untuk Pengguna ... 62
BAB I
PENDAHULUAN
1.1 Latar Belakang
Mahasiwa Jurusan Teknik Informatika Politeknik Negeri Batam wajib mengikuti matakuliah magang. Matakuliah magang dilaksanakan pada semester 6 untuk program studi Diploma III Teknik Informatika dan semester 8 untuk program studi Diploma IV Teknik Multimedia dan Jaringan. Sehingga setiap mahasiswa harus menyelesaikan magang sebagai persiapan untuk masuk kedalam dunia pekerjaan. Selama magang mahasiswa menerapkan ilmu yang telah dipelajari sambil menyesuaikan diri di instansi atau perusahaan, sehingga mampu menyerap berbagai pengalaman kerja yang sesungguhnya.
Kegiatan magang ini juga membawa keuntungan baik untuk pihak perusahaan atau instansi maupun civitas Politeknik Negeri Batam. Perusahaan mendapat tenaga bantuan dengan adanya mahasiswa magang. Politeknik Negeri Batam juga bisa menyalurkan alumni maupun calon lulusannya ke pihak perusahaan atau instansi terkait. Namun, dalam pelaksanaannya masih ditemukan beberapa kendala, diantaranya mahasiswa jurusan Teknik Informatika selama ini mengalami kesulitan dalam menentukan posisi magang yang sesuai dengan minat dan kemampuannya dan kurangnya informasi jenis pekerjaan yang dibutuhkan dari pihak perusahaan atau instansi tujuan magang.
Dari permasalahan tersebut, maka diperlukan analisis data berupa pengelompokan terhadap data yang ada. Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya (Pramudiono, 2006). Metode data mining digunakan untuk menemukan pola yang menarik agar mahasiswa bisa menentukan posisi magang yang sesuai dengan kemampuannya. Pencarian tempat magang yang sesuai dilakukan berdasarkan data
job description yang diisi oleh pihak perusahaan atau instansi. Variabel yang dipilih
untuk melakukan pengelompokan mahasiswa adalah: job description, nilai akhir matakuliah magang, etika profesi dan pelaporan kerja.
Data tersebut diproses dengan menggunakan metode pengelompokan clustering K-Means. Metode K-Means digunakan untuk menyesuaikan pengelompokan mahasiswa ke beberapa cluster berdasarkan data tersebut, sehingga data yang memiliki kriteria yang sama dikelompokkan dalam satu cluster dan data yang memiliki kriteria berbeda dikelompokkan dalam cluster yang lain. Dengan adanya pengelompokkan data, diharapkan dapat memberikan informasi kepada mahasiswa yang akan menentukan posisi magang dan mengidentifikasi mahasiswa magang yang berpotensi bermasalah, ditinjau dari ketidaksesuaian pemilihan tempat magang.
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas dapat dirumuskan permasalahan yang akan di selesaikan dalam hal ini adalah :
1. Bagaimana menyajikan data magang berupa job description dan nilai magang mahasiswa agar dapat dieksplorasi untuk menemukan pola atau informasi yang menarik ?
2. Bagaimana mempresentasikan kategorisasi data magang untuk mengetahui perilaku data ?
1.3 Batasan Masalah
Batasan Masalah dari aplikasi ini adalah : 1. Aplikasi ini berbasis web dinamis.
2. Visualisasi digunakan hanya untuk merepresentasikan hasil dari data mining.
3. Pengkategorian Job description dilakukan secara manual.
1.4 Tujuan Penelitian
Tujuan penelitian ini adalah merancang dan membangun sebuah aplikasi untuk mengelompokkan mahasiswa berdasarkan nilai magang dan job description menggunakan metode clustering K-Means. Dilengkapi dengan visualisasi hasil cluster untuk memperjelas pola menarik data.
1.5 Manfaat Penelitian
1. Mempermudah pihak Politeknik Negeri Batam dalam menentukan posisi magang mahasiswa.
2. Membantu koordinator magang menganalisis mahasiswa magang yang berpotensi bermasalah.
1.6 Tinjauan Pustaka
Penelitian ini dikembangkan dari hasil pengumpulan data yang dilakukan terhadap data laporan magang mahasiswa jurusan Teknik Informatika. Diharapkan dapat membuat suatu sistem baru yang belum pernah ada pada referensi sebelumnya. Adapun perbedaan penelitian ini dapat dilihat dari table berikut :
Tabel 1 Perbandingan Hasil Penelitian
Judul Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang
Peerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Parameter Nilai Magang dan Job Description Pada Jurusan Teknik Informatika Politeknik Negeri Batam
Tujuan Untuk mencari 5 mahasiswa
dalam penyeleksian untuk mengikuti lomba
Untuk mengidentifikasi
mahasiswa magang yang
Jurusan Teknik Informatika Politeknik Negeri Batam
Data Nilai Akademik mahasiswa Laporan Magang Mahasiswa dan Job description magang Jurusan Informatika Tahun 2015/2016
Metode Clustering K-Means Clustering K-Means
Hasil Grafik Aplikasi Clustering, Visualisasi
1.7 Sistematika Penulisan
Untuk memudahkan pembaca dalam penulisan Tugas Akhir, penulis membuat sistematika penulisan dalam bab 5 yaitu :
BAB I : Pendahuluan
Berisi tentang latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, tinjauan pustaka, sistematika penulisan.
BAB II : Landasan Teori
Bab ini berisi tentang Magang (Job description, Kategori Nilai), Visualisasi, Data Mining, KDD (Knowledge Discovery in Databases), Clustering, K-means, Microsoft Excel, MySQL, PHP, Basis Data, DFD, ER-Diagram.
BAB III : Analisis dan perancangan
Bab ini berisi metode penelitian yang meliputi : Strudi pustaka, Pengumpulan Data, Prepocessing Data, Pemodelan Data (Clustering), Perancangan Sistem.
BAB IV : Implementasi dan Pengujian
Bab ini berisi penjelasan hasil implementasi dan pengujian aplikasi.
BAB V : Penutup
BAB II
LANDASAN TEORI
2.1 Magang
Magang merupakan kegiatan wajib yang diikuti oleh mahasiswa tingkat akhir dengan tujuan untuk memberikan gambaran tentang kondisi lingkungan kerja. Disamping itu pelaksanaan magang juga berguna untuk menerapkan ilmu yang telah dipelajari sambil menyesuaikan diri di instansi atau perusahaan, sehingga mampu menyerap berbagai pengalaman kerja yang sesungguhnya. Magang diartikan sebagai pelatihan kerja dengan bekerja langsung dibawah bimbingan dan pengawasan pekerja yang lebih berpengalaman di perusahaan untuk dapat menguasai keahlian atau keterampilan tertentu. Tujuan magang adalah sebagai berikut :
a. Melatih sumber daya manusia menjadi tenaga kerja profesional di masa yang akan dating.
b. Memberikan pengalaman nyata dan permasalahan yang dihadapi di dunia kerja untuk menumbuhkan rasa tanggungjawab.
Membantu industri dalam memenuhi sumber daya manusia sebagai kebutuhan tenaga kerja.
2.2 Visualisasi
Visualisasi adalah produk interprestasi gambar diatas kertas atau menggunakan teknologi dengan tujuan untuk menyampaikan informasi dalam bentuk gambar sehingga mempermudah dalam pemahaman (Hershkowitz, 1989). Dengan kata lain visualisasi adalah konversi data kedalam bentuk table atau gambar visual sehingga dapat menangkap konsep dari data yang ditampilkan. Umumnya manusia lebih mudah menangkap informasi melalui gambar daripada teks. Visualisasi dapat diterapkan pada bidang sistem informasi dan aplikasi dengan koneksi database, sehingga data dapat diproses dengan tujuan memperluas pemanfaatan data.
2.3 Data Mining
Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya (Pramudiono, 2006).
Data mining merupakan gabungan dari berbagai bidang ilmu, antara lain basis data,
information retrieval, statistika, machine learning dan sebagainya. Data mining
dapat diterapkan diberbagai bidang, seperti bisnis, kesehatan, asuransi, pemasaran dan perbankan. Data mining merupakan bagian dari proses Knowledge Discovery
in Database (KDD) untuk menemukan informasi dan pola yang berguna dalam
data.
2.4 Knowledge Discovery in Database (KDD)
Knowledge Discovery in Database (KDD) berhubungan dengan teknik integrasi
dan penemuan ilmiah, interprestasi dan visualisasi dari pola-pola sejumlah kumpulan data. KDD adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah baru dapat bermanfaat dan dapat dimengerti.
Gambar 1 Tahapan KDD
Tahapan Proses KDD : 1. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi
yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing/Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi focus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada data. Juga dilakukan proses enrichment, yaitu proses memperkaya data yag sdah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
4. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
5. Interpretation/Evaluation.
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
2.5 Clustering
Proses pengelompokan sekumpulan obyek kedalam kelas-kelas obyek yang sama disebut clustering atau pengelompokan. Pengklasteran merupakan satu dari sekian
banyak fungsi proses data mining untuk menemukan kelompok atau identifikasi kelompok obyek yang hampir sama. Analisis cluster merupakan usaha untuk mengidentifikasi kelompok obyek yang mirip-mirip dan membantu menemukan pola penyebaran dan pola hubungan dalam sekumpulan data yang besar. Hal penting dalam proses pengklasteran adalah menyatakan sekumpulan pola ke kelompok yang sesuai yang berguna untuk menemukan kesamaan dan perbedaan sehingga dapat menghasilkan kesimpulan.
Gambar 2 Contoh Cluster
2.6 Algoritma K-Means
K-Means merupakan salah satu algoritma clustering. Tujuan algoritma ini yaitu untuk membagi data menjadi beberapa kelompok. Algoritma K-means menerima masukan berupa data tanpa label kelas, komputer mengelompokkan sendiri data-data yang menjadi masukannya tanpa mengetahui terlebih dulu target kelasnya. Algoritma K-means termasuk dalam unsupervised learning. Masukan yang diterima adalah data atau objek dan k buah kelompok (cluster) yang diinginkan. Algoritma ini akan mengelompokkan data atau objek ke dalam k buah kelompok tersebut. Pada setiap cluster terdapat titik pusat (centroid) yang merepresentasikan cluster tersebut. Algoritma untuk melakukan K-means clustering adalah sebagai berikut :
Mulai Banyaknya cluster K Tentukan Pusat Hitung Jarak Obyek ke Pusat Mengelompokan data berdasarkan jarak terdekat dengan pusat Obyek berpindah cluster Hasil cluster Selesai Ya Tidak
Gambar 3 Algoritma clustering K-Means
Ada beberapa kelebihan pada algoritma K-means, yaitu : a. Mudah diimplementasikan dan dijalankan.
b. Waktu yang dibutuhkan untuk menjalankan relatif cepat. c. Mudah untuk diadaptasi.
d. Umum digunakan.
Algoritma K-means juga memiliki kekurangan yaitu, sebelum alagoritma dijalankan k buah titik diinisialisasi secara random sehingga pengelompokkan data yang dihasilkan dapat berbeda-beda.
2.7 ER-Diagram
ER – Diagram ( Entity Relationship Diagram ) adalah sutu model untuk menjelaskan hubungan antar data dalam basis data berdasarkan objek – objek dasar
data yang mempunyai hubungan antar relasi. ER – Diagram untuk memodelkan struktur data dan hubungan antar data, untuk menggambarkannya menggunakan beberapa notasi dan symbol ( Bayu, 2013).
Pada dasarnya ada 3 komponen yang digunakan yaitu : 1. Entitas
Entitas merupakan objek yang mewakili sesuatu yang nyata dan dapat dibedakan dari sesuatu yang lain. Simbol dari entitas ini biasanya digambarkan dengan persegi panjang.
2. Atribut
Setiap entitas pasti mempunyai elemen yang disebut atribut yang berfungsi untuk mendes-kripsikan karakteristik dari entitas tersebut. Isi dari atribut mempunyai sesuatu yang dapat mengidentifikasikan isi elemen satu dengan yang lain. Gambar atribut diwakili oleh simbol elips.
3. Hubungan / Relasi
Hubungan antara sejumlah entitas yang berasal dari himpunan entitas yang berbeda.Relasi dapat digambarkan sebagai relasi yang terjadi diantara dua himpunan entitas (misalnya A dan B) dalam satu basis data yaitu:
3.1.Satu ke satu ( one to one )
Hubungan relasi satu ke satu yaitu setiap entitas pada himpunan entitas A berhubungan paling banyak dengan satu entitas pada himpunan entitas B. 3.2.Satu ke banyak / Banyak ke Satu ( one to many / many to one )
Setiap entitas pada himpunan entitas A dapat berhubungan dengan banyak entitas pada himpunan entitas B, tetapi setiap entitas pada entitas B dapat berhubungan dengan satu entitas pada himpunan entitas A.
3.3.Banyak ke banyak ( many to many )
Setiap entitas pada himpunan entitas A dapat berhubungan dengan banyak entitas pada himpunan entitas B.
Gambar 4 Contoh ER-Diagram Sederhana
2.8 DFD
Data Flow Diagram (DFD) merupakan diagram yang menggunakan simbol-simbol untuk menggambarkan sistem kerja antara fungsi-fungsi yang berhubungan satu sama lain dengan aliran penyimpanan data (Adi Nugroho, 2011). DFD sering digunakan untuk menggambarkan suatu sistem yang telah ada atau sistem baru yang akan dikembangkan. Salah satu keuntungan dalam menggunakan DFD ini adalah memudahkan pemakai (user) yang kurang menguasai bidang komputer untuk mengerti sistem yang akan dikerjakan. DFD terdiri dari diagram konteks dan diagram rinci (level diagram). Diagram konteks adalah diagram yang terdiri dari suatu proses dan menggambarkan ruang lingkup suatu sistem. Diagram konteks merupakan level tertinggi dari DFD yang menggambarkan seluruh input ke sistem atau output dari sistem. Dalam diagram konteks biasanya hanya ada satu proses. Tidak boleh ada store dalam diagram konteks. Diagram rinci adalah diagram yang menguraikan proses apa yang ada dalam diagram level di atasnya. Adapun komponen-komponen dalam DFD Menurut Yourdan dan DeMarco adalah sebagai berikut :
1. Terminator/Entitas Eksternal.
Entitas Eksternal (entity) di lingkungan luar sistem yang dapat berupa orang, organisasi atau sistem lainnya yang berada dilingkungan luarnya yang akan memberikan input atau menerima output dari sistem.
2. Aliran Data.
Aliran data mengalir diantara proses (process), simpanan data (data store) dan kesatuan luar (External entity). Aliran data ini menunjukkan arus dari data yang dapat berupa masukan untuk sistem atau hasil dari proses sistem. 3. Proses.
Suatu proses adalah kegiatan atau kerja yang dilakukan oleh orang, mesin atau computer dari hasil suatu aliran data yang masuk kedalam proses untuk dihasilkan aliran data yang akan keluar dari proses.
4. Penyimpanan Data.
Penyimpanan data (Data Store) merupakan penyimpanan data yang dapat berupa :
a. Suatu file atau basis data di sistem computer b. Suatu arsip atau catatan manual
c. Suatu agenda atau buku
2.9 Weka Data Mining Tool
Weka merupakan aplikasi data mining yang berbasis open source (GPL) dan berengine Java. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi atau formulasi dari sekumpulan data sampling. Kekuatan Weka sebenarnya terletak pada algoritma yang makin lengkap dan canggih, kesuksesan data mining tetap terletak pada faktor pengetahuan manusianya itu sendiri. Hal tersebut bisa dilakukan jika adanya pengumpulan data yang berkualitas tinggi pengetahuan pemodelan dan penggunaan algoritma yang tepat, sehingga akan menjamin keakuratan formulasi yang diharapkan. Weka mendukung beberapa format file untuk masukannya, diantaranya :
dengan menggunakan Microsoft Excel atau membuatnya sendiri dengan menggunakan notepad.
b. Format C45 : Merupakan format file yang bisa diakses dengan menggunakan aplikasi Weka.
c. Attribute-Relation File Format (ARFF) : Merupakan tipe file teks yang berisi berbagai instance data yang berhubungan dengan suatu set atribut data yang dideskripsikan juga dalam file tersebut.
Gambar 6 Tampilan Aplikasi Weka Data Mining Tool
2.10 MySQL
MySQL adalah sistem manajemen database SQL yang bersifat Open Source dan paling populer saat ini.Sistem Database MySQL mendukung beberapa fitur seperti multithreaded, multi-user, dan SQL database managemen sistem (DBMS).Database ini dibuat untuk keperluan sistem database yang cepat, handal dan mudah digunakan.Ulf Micheal Widenius adalah penemu awal versi pertama MySQL yang kemudian pengembangan selanjutnya dilakukan oleh perusahaan MySQL AB. MySQL AB yang merupakan sebuah perusahaan komersial yang didirikan oleh para pengembang MySQL. MySQL sudah digunakan lebih dari 11 millar instalasi saat ini( Bayu, 2013 ). Berikut ini kelebihan MySQL sebagai database server antara lain :
2. Sintaksnya lebih mudah dipahami dan tidak rumit. 3. Pengaksesan database dapat dilakukan dengan mudah.
4. MySQL merupakan program yang multithreaded, sehingga dapat dipasang pada server yang memiliki multiCPU.
5. Didukung programprogram umum seperti C, C++, Java, Perl, PHP, Python, dsb. Bekerja pada berbagai platform. (tersedia berbagai versi untuk berbagai sistem operasi).
6. Memiliki jenis kolom yang cukup banyak sehingga memudahkan konfigurasi sistem database.
7. Memiliki sistem sekuriti yang cukup baik dengan verifikasi host. 8. Mendukung ODBC untuk sistem operasi Windows.
Mendukung record yang memiliki kolom dengan panjang tetap atau panjang bervariasi.
2.11 PHP
PHP adalah sigkatan dari “Hypertext Processor” yaitu bahasa pemrograman yang digunakan untuk pengembangan dan pembuatan sebuah web dan bisa digunakan bersamaan dengan HTML. Kelebihan PHP dari bahasa pemrograman lain :
1. Dalam sisi pengembangan lebih mudah
2. Bahasa pemrograman PHP adalah sebuah bahasa script yang tidak melakukan sebuah kompilasi dalam penggunaanya
3. Dalam sisi pemahamanan, PHP adalah bahasa scripting yang paling mudah karena memiliki referensi yang banyak
4. PHP adalah bahasa open source yang dapat digunakan di berbagai mesin 5. PHP digunakan sebagai landasan operasi pada pemrogaman jaringan
berbasis web.
Sebagai contoh, berikut kode PHP yang berada di dalam kode HTML :
<?php
echo "Selamat Datang"; ?>
Gambar 7 Kode PHP dan Tampilan Script PHP pada web browser
Kode PHP diawali dengan <?php dan diakhiri dengan ?>. pasangan kedua kode inilah yang berfungsi sebagai tag kode. Maka apabila kode tersebut dijalankan akan menghasilkan gambar seperti gambar 7 pada web browser.
2.12 JpGraph
JpGraph adalah library dari PHP yang bersifat object oriented. Fungsi utama dari library ini adalah untuk membuat grafik pada browser dengan menggunakan data yang ada. Digunakan untuk menampilkan jumlah titik data yang didefinisikan oleh nilai X dan nilai Y. JpGraph bersifat open source dapat didownload secara gratis melalui http://jpgraph.net/download/. Perlu diperhatikan bahwa untuk dapat menggunakan JpGraph pastikan GD library aktif (enable) pada PHP anda.
BAB III
ANALISIS DAN PERANCANGAN
3.1 Analisis Data
3.1.1 Sumber Data dan Metode
Sumber Data yang digunakan adalah data laporan magang mahasiswa Jurusan Teknik Informatika Politeknik Negeri Batam angkatan 2015-2016. Data tersebut berjumlah 62 baris. Ada 2 parameter yang digunakan, yaitu : job description dan nilai akhir magang. Berikut tampilan sejumlah data yang diambil dari data laporan magang :
Gambar 9 Data Rekapan Mahasiswa Magang
Metode pengambilan data yang digunakan adalah metode clustering. Metode clustering adalah cara mengumpulkan objek yang memiliki tingkat kemiripan yang tinggi dengan objek yang berada di cluster yang sama maupun yang berbeda.
3.1.2 Prepocessing Data
data tetapi menghasilkan hasil analisis yang sama (hampir sama). Reduksi data dapat dilakukan dengan banyak cara, salah satunya adalah seleksi atribut. Dalam proses seleksi atribut yang dilakukan adalah mengurangi atribut yang dianggap tidak perlu, yaitu atribut NIM. Jadi, atribut yang tersisa atau yang akan dipakai untuk tahap normalisasi adalah nama, job description dan nilai.
Gambar 10 Hasil Seleksi Atribut
3.1.3 Transformasi Data
Adalah merubah data yang kompleks dengan tidak menghilangkan isi, sehingga lebih mudah diolah. Transformasi data dapat dilakukan dengan banyak cara, salah satunya adalah normalisasi. Dari data yang ada terdapat dua atribut yang perlu untuk di normalisasikan.
Contoh data yang akan dinormalisasi :
Pengkategorian Job description dilakukan secara manual, Sehingga didapatkan hasil sebagai berikut :
Dicari nilai rata-rata dari rentang nilai yang diberikan dengan mengambil nilai minimum dari setiap rentang nilai.
Jawab : Nilai’ 80+80+80/3 = 80
3.1.4 Clustering
Penghitungan dengan algoritma K-means dilakukan menggunakan aplikasi WEKA untuk membantu mempercepat perhitungan data. Dalam pembagian cluster dibagi menjadi 3 kelompok yaitu cluster 0, cluster 1 dan cluster 2.
3.2 Deskripsi Umum Sistem Pengelola Pengguna Proses Clustering K-Means Mengelola Data Mahasiswa Job description, Nilai akhir magang Menampilkan Visualisasi, Data Pengelompokan Mahasiswa Menampilkan Visualisasi, Data Pengelompokan Mahasiswa Mengirim Data Clustering K-Means Sistem Analisis Data Magang Merespon Data Clustering K-Means Gambar 13 Deskripsi Umum Sistem
Sistem Analisis data magang ini adalah sebuah aplikasi yang dibangun berbasis web dinamis. Pengelola memasukkan data yang digunakan untuk masukan program adalah Microsoft Excel. Data diimpor kedalam program kemudian ditampung menggunakan database MySQL. Sehingga data yang diolah adalah data yang ada pada table MySQL. Data yang telah dimasukkan kemudian diproses menggunakan Algoritma K-Means. Proses klustering selesai bila jumlah anggota dari tiap kluster tidak berubah. Sehingga keluaran yang dihasilkan dari sistem analisis data magang ini adalah berupa data pengelompokkan mahasiswa magang yang di representasikan dengan visualisasi.
3.3 Kebutuhan Fungsional
F01. Aplikasi harus dapat menangani login untuk pengguna dan pengelola. F02. Pengelola harus dapat menambah data laporan magang mahasiswa. F03. Aplikasi harus dapat melakukan convert data excel ke database.
F04. Aplikasi harus dapat melakukan pengelompokan mahasiswa magang berdasarkan parameter nilai akhir magang dan job description menggunakan Algoritma K-Means.
F05. Aplikasi harus dapat melakukan prepocessing data laporan magang mahasiswa.
F06. Aplikasi harus dapat menampilkan hasil pengelompokan mahasiswa magang. F07. Aplikasi harus dapat memvisualisasikan data magang.
3.4 Kebutuhan Non Fungsional
NF01.Aplikasi berbasis web dinamis.
NF02. Aplikasi memiliki hak akses yang berbeda-beda.
3.5 Perancangan Basis Data
Pengelola Mengelola Mahasiswa Magang Memiliki Job description Id_pengelola nama hak_akses nim nama jurusan no_id jenis_pekerjaan nilai_magang nilai_etika nilai_pelaporan ratarata_nilai
3.6 DFD
3.6.1 DFD level 0
0 Sistem Cluster Data
Magang
+
Pengelola
Username, Password, Job description, Nilai
akhir magang Visualisasi, Data Pengelompokan Mahasiswa Pengguna Visualisasi, Data Pengelompokkan Mahasiswa
Gambar 15 Level 0 dari Sistem Analisis Data Magang
Pada diagram konteks terdapat sebuah entitas luar yaitu pengelola dan pengguna yang berinteraksi dengan sebuah proses yaitu sistem pengklusteran nilai akhir magang dan job description. Dalam hal ini pengelola yaitu : Koordinator magang dan Bagian Akademik. Pengguna yanitu : Pudir, KPS dan Kajur.
3.6.2 DFD level 1 Mahasiswa Magang Pengelola 3 Pengelompokan magang mahasiswa +
Data Pengelompokan Mahasiswa
Data Pengelompokan Mahasiswa Data Pengelompokan Mahasiswa
1 Pengolahan data magang mahasiswa + 2 Prepocessing +
Data Pengelompokan Mahasiswa Visualisasi
Job description
Job description
Pengguna
Nilai akhir magang Nilai akhir magang
Job description
Job description Job description
Nilai akhir magang Nilai akhir magang
Visualisasi Visualisasi Visualisasi Job description terkluster Job description terkluster
Nilai akhir magang terkluster Nilai akhir magang
terkluster
Gambar 16 Level 1 dari Sistem Analisis Data Magang
Level 1 merupakan tingkatan dari level sebelumnya yang menjelaskan proses aliran data yang berasal dari masukkan pengelola kemudian diproses kedalam proses klustering dan pengelompokan, prepocessing dan transformasi data. Job
description dan nilai akhir magang nantinya akan disimpan kedalam data
penyimpanan laporan magang mahasiswa. Data yang dikelola pada level 1 ini adalah data mahasiswa magang.
3.6.3 DFD level 2
1.1 Tambah Data magang
mahasiswa
1.2
Convert Data magang
mahasiswa
1.3 Hasil Data magang
mahasiswa
Mahasiswa Magang Pengelola
Nilai akhir magang Nilai akhir magang
Data magang mahasiswa Data magang mahasiswa
Visualisasi Visualisasi
Pengguna
Job description
Job description Job description
Visualisasi Visualisasi
Gambar 17 Level 2 Proses Pengolahan Data Magang Mahasiswa
Level ini merupakan tingkatan level dari level 1 pengolahan data magang mahasiswa. Data yang mengalir ke dalam data store merupakan data yang berhubungan dengan data magang mahasiswa. Proses yang dapat dilakukan oleh pengelola terhadap aplikasi adalah memasukkan data magang mahasiswa.
Mahasiswa Magang 2.1 Reduksi Data Pengelola 2.2 Transformasi Data Job description Job description
Nilai akhir magang
Job description
Nilai akhir magang Nilai akhir magang Nilai akhir magang
Job description Job description Job description
Nilai akhir magang Nilai akhir magang
Nilai akhir magang Nilai akhir magang
Job description
Job description Job description
Gambar 18 Level 2 Proses Prepocessing Data Magang Mahasiswa
Pada level 2 proses prepocessing data magang dilakukan reduksi data untuk mengurangi ukuran data tetapi menghasilkan hasil analisis yang sama (hampir sama) dan transformasi data yang mengalir ke data store adalah data yang berhubungan dengan magang mahasiswa. Pada level ini data dapat dilakukan dengan banyak cara, salah satunya adalah normalisasi.
Mahasiswa Magang 3.1 Proses Klustering K-means Pengelola 3.2 Pengelompokan Job description
Nilai akhir magang
Data Pengelompokan Mahasiswa Data Pengelompokan Mahasiswa Nilai akhir magang
Job description
Pengguna
Job description
Data Pengelompokan Mahasiswa Data Pengelompokan Mahasiswa
Gambar 19 Level 2 Proses Pengelompokan Magang Mahasiswa
Pada level 2 pengelompokan magang mahasiswa data yang mengalir ke data
store adalah data yang berhubungan dengan magang mahasiswa. Proses yang
terdapat pada data ini adalah melakukan pengelompokan mahasiswa magang berdasarkan parameter nilai akhir magang dan job description menggunakan algoritma K-Means. Semua proses yang dilakukan akan disimpan kedalam data magang mahasiswa. Algoritma ini akan mengelompokkan data atau objek ke dalam k buah kelompok tersebut.
Mulai Banyaknya cluster K Tentukan Pusat Hitung Jarak Obyek ke Pusat Mengelompokan data berdasarkan jarak terdekat dengan pusat Obyek berpindah cluster Hasil cluster Selesai Ya Tidak
Gambar 20 Algoritma K-Means pada Proses Clustering
3.7 Perancangan Antarmuka
Rancangan antarmuka adalah sarana untuk menghubungkan sistem dan pengguna. Rancangan antarmuka sistem analisis data magang dengan menggunakan algoritma
Clustering K-Means terdiri dari rancangan login, form input dokumen, Clustering
K-Means yang berfungsi untuk melakukan proses pengelompokkan data magang mahasiswa dan Grafik Clustering K-Means.
3.7.1 Rancangan Login
Gambar 21 Rancangan Login
Rancangan antarmuka login dibuat untuk hak ases pengelola terhadap sistem yang dibuat. Tampilan ini terdiri dari nama pengguna atau pengelola dan password. Setelah mengisi data diatas, maka pilih tombol OK. Jika tidak tekan tombol Batal.
3.7.2 Rancangan Form Input Document
Rancangan form input document adalah rancangan untuk pengelola melakukan input dokumen data magang mahasiswa berupa file excel ke dalam sistem yang kemudian akan di convert untuk selanjutnya dimasukkan ke dalam database. Proses lain yang dilakukan adalah memasukkan data secara manual dengan mengisi data nama mahasiswa dan kode job description.
Gambar 23 Antarmuka masukan jumlah cluster
3.7.3 Rancangan Clustering K-Means
Gambar 24 Rancangan Clustering K-Means
Rancangan ini berfungsi untuk melakukan proses pengelompokkan data magang mahasiswa. Hasil pengelompokkan data mahasiswa magang tersebut dapat dikelompokan dengan perbedaan warna yang telah tersedia. Untuk melihat hasil Clustering secara visual maka user harus menekan tombol “Lihat Grafik Clustering”.
3.7.4 Rancangan Grafik
Gambar 25 Rancangan Grafik
Rancangan Grafik ini merupakan representasi dari hasil pengelompokan data magang berupa job description dan nilai magang mahasiswa.
BAB IV
IMPLEMENTASI DAN PENGUJIAN
4.1 Implementasi Daftar File
Implementasi adalah tahap penerapan sistem yang akan dilakukan jika sistem disetujui termasuk program yang telah dibuat pada tahap perancangan sistem agar siap untuk dioperasikan.
Tabel 2 Implementasi Daftar File
No Fungsional Nama File Data Path
1 Login login.php config.php check-login.php Database http://localhost/login-bootstrap/login.php 2 Input index.php forminputman ual.php Database http://localhost/N/forminputmanual. php 3 Upload index.php upload.php Database http://localhost/N/upload.php
4 Convert upload.php Database http://localhost/N/upload.php
5 Download index.php downloadfile. php Database http://localhost/N/downloadfile.php 6 Clustering masukan.php kluster.php kmeans.php centroid.php following.php sse.php Database http://localhost/N/masukan.php
7 Visualisasi scatterex.php Database http://localhost/scatterex.php
4.2 Implementasi Basis Data 4.2.1 users
Tabel dibawah ini merupakan implementasi data table user
Tabel 3 Tabel user
No Nama Field Type Length Keterangan
1 id_user Int 10 Primary Key
2 nama Varchar 200
3 username Varchar 200
4 password Text
5 level_user Varchar 150
4.2.2 databaru
Tabel dibawah ini merupakan implementasi data table data baru
Tabel 4 Tabel databaru
No Nama Field Type Length Keterangan
1 nama Varchar 25 2 nilai Int 11 3 jobdesc Int 25 4 Ket Varchar 255 5 cluster Int 5 4.2.3 centroid
Tabel dibawah ini merupakan implementasi data table centroid
Tabel 5 Tabel centroid
No Nama Field Type Length Keterangan
1 id3 int 11 Primary Key
2 x float
4.3 Implementasi Antarmuka 4.3.1 Implementasi Proses Login
Gambar 26 Login
Pada gambar tersebut menjelaskan bahwa pengguna aplikasi harus memasukkan username dan password sebagai hak akses agar dapat menggunakan aplikasi tersebut. Lalu tekan login.
Gambar 27 Source Code Login
Kode tersebut menjelaskan bahwa aplikasi memiliki 2 level user yaitu : admin sebagai pengelola dan member sebagai pengguna. Akan ada proses check login ketika pengguna atau pengelola telah memasukkan username dan password sesuai dengan level user. Jika user salah memasukkan username
dan password maka error dan muncul pesan “Username dan Password Invalid.
4.3.2 Implementasi Menu Utama
Gambar 28 Tampilan Menu Utama sebagai Admin
Pada gambar tersebut menunjukkan halaman utama yang ditampilkan ketika user masuk sebagai admin atau pengelola. Terdapat 5 navigasi bar : Home, File, Cluster, dan Log Out.
Pada menu dropdown File terdapat 3 menu lagi dibawahnya yaitu : Download Format, menu ini memberikan fasilitas untuk mengunduh format file sesuai aturan tertentu yang telah disediakan. Upload File, menu ini berfungsi untuk mengunggah file dalam jumlah data yang banyak sesuai dengan format file yang telah diunduh pada menu download format. Form Input, adalah form yang disediakan untuk memasukkan data mahasiswa secara manual.
Gambar 30 Tampilan Menu Utama sebagai Member
yang membedakan tampilan menu utama ini dengan tampilan menu utama sebelumnya adalah tidak terdapat navigasi bar “File”.
Gambar 31 Tampilan Download Format
Gambar 31 Tampilan download format, menu ini memberikan fasilitas untuk mengunduh format file sesuai aturan tertentu yang telah disediakan. Pengelola
dapat mengklik tulisan yang berwarna biru dan secara otomatis format file berhasil diunduh.
Gambar 32 Source Code Download Format
Kode tersebut menjelaskan bahwa format file yang tersedia adalah dalam bentuk file Microsoft Excel dan dapat langsung diunduh dengan mengklik link format file yang telah disediakan.
Gambar 33 Tampilan Upload
Pengelola menekan tombol pilih file untuk memilih file yang ingin di upload. File yang diupload harus disesuaikan dengan format file yang telah disediakan pada menu download format. Kemudian setelah dipilih tekan tombol upload maka secara otomatis file upload akan masuk dan tersimpan kedalam database.
Gambar 34 Source Code Upload File
Kode ini menjelaskan bahwa ketika pengelola menekan tombol upload maka aplikasi membaca file excel yang di upload dengan menggunakan excel reader. Jika data yang diupload berhasil diimport maka aplikasi akan menampilkan pesan “data berhasil di import” jika tidak maka aplikasi akan menampilkan pesan “data gagal di import”.
Pengelola memasukkan data Nama, Nilai, Kode Jobdescription mahasiswa magang dan Keterangan lainnya. Untuk Kode Jobdescription dapat dipilih lebih dari satu sesuai dengan jenis pekerjaan yang dilakukan oleh mahasiswa tersebut. kolom Keterangan Lainnya dapat di isi ketika pengelola memilih kode jobdescription nomor 19. Lalu pilih Simpan.
Gambar 36 Source Code Form Input
Pada kode tersebut menjelaskan bahwa masukan data untuk nama dan nilai tidak boleh kosong jika kosong maka aplikasi akan menampilkan pesan “Masukan data tidak boleh ada yang kosong” jika semua masukan diisi dengan benar maka masukan data berhasil dilakukan.
4.3.3 Implementasi Menu Cluster
Pengelola memasukkan jumlah pengelompokan data yang mau dibentuk. Lalu pilih tombol “Cluster Now” untuk melanjutkan proses cluster.
Gambar 38 Source code Jumlah Cluster
Kode program memvalidasi jumlah cluster yang dimasukkan oleh pengelola. Jumlah minimal cluster yang dapat di masukkan adalah 1 dan jumlah maksimal cluster adalah 5.
Gambar 39 Data Hasil Cluster
Untuk hasil cluster pada gambar diatas data yang ditampilkan berjumlah 3 cluster. Setiap warna mewakili 1 cluster dan seterusnya. Pengelola dapat menekan tombol “Lihat Grafik Clustering” untuk melihat representasi data tulisan dalam bentuk grafik . tombol “Lihat Centroid” berguna untuk menampilkan titik centroid algoritma k-means dari data yang ada.
Gambar 40 Source code cluster
Kode program menjelaskan bahwa data yang akan diolah sebagai nilai x dan nilai y adalah data nilai dan data jobdesc. Ditentukan data titik pusatnya berupa data array kemudian ditampilkan hasil cluster dengan mendapatkan data berdasarkan nama .
Gambar 41 Tabel Centroid Hasil Cluster
Gambar ini menjelaskan bahwa terdapat sebuah titik cluster (x,y) dari masing-masing jumlah cluster yang ditampung dalam sebuah tabel. Dengan data nilai untuk centroid x dan data jobdesc untuk centroid y,
Gambar 42 Source code Centroid Cluster
Kode ini menjelaskan bahwa centroid baru didapatkan dengan menjalankan beberapa fungsi yang terdapat dalam kode program.
Gambar 43 Hasil Grafik Data Laporan Magang
Grafik ini merupakan representasi dari hasil data magang berupa job description dan nilai magang mahasiswa.
Gambar 44 Source Code Grafik Data Laporan Magang
Kode tersebut menjelaskan bahwa grafik akan menampilkan hasil representasi data magang berupa job description dan nilai magang mahasiswa dari database. Setiap kali pengelola memasukkan data kedalam sistem maka data akan otomatis tampil pada grafik.
4.4 Hasil Pengujian
Pengujian dilakukan dengan menguji setiap proses dan kemungkinan kesalhana yang terjadi untuk setiap proses. Pengujian dilakukan dengan hanya memperhatikan masukan kesistem dan keluaran dari sistem.
4.4.1 Hasil Pengujian Pengelola
Nama Penguji : Mir’atul Khusna Mufida, M.Sc.
Tabel 6 Tabel Skenario Pengujian untuk Pengelola
No Skenario Pengujian Test Case Hasil yang Diharapkan Pengujian
Berhasil Gagal 1 Melakukan data login yang benar
sebagai pengelola, lalu klik tombol login
Username = admin Password = admin
Sistem menerima akses login dan kemudian langsung menampilkan halaman utama
√
2 Memasukkan data login salah Username = admin
Password = 133
Sistem menolak akses dan
mengeluarkan peringatan Username dan Password Invalid
√
3 Mengunduh data format file Mengklik link unduh format file yang tersedia
Sistem dapat mengunduh data
4 Melakukan upload data sesuai format -Menekan tombol pilih file denga√√n nama file
-Memilih file yang akan diupload sesuai format file
-Tekan tombol upload
File data berhasil diupload
√
5 Memasukkan data form input manual dengan data yang benar
Nama = Sasa Nilai = 80
Kode Jobdescription = pilih sesuai jenis pekerjaan yang lakukan (boleh pilih lebih dari satu)
Keterangan = di isi sesuai kebutuhan
Sistem dapat menerima hasil masukan dari pengelola untuk memasukkan data laporan magang
mahasiswa.
√
6 Memasukkan data form input manual dengan data yang salah
Nama = Nilai =
Kode Jobdescription = pilih sesuai jenis pekerjaan yang lakukan (boleh pilih lebih dari satu)
Sistem menolak menerima hasil masukan dari pengelola dan mengeluarkan peringatan Data yang dimasukkan tidak boleh kosong
Keterangan = di isi sesuai kebutuhan
7 Melakukan proses clustering data -Memasukkan data laporan magang mahasiswa dengan upload data
-Sistem melakukan proses clustering data
Sistem menerima hasil masukan, melakukan proses clustering data, dan menampilkan hasil clustering berupa tabel
√
8 Visualisasi -Memasukkan data laporan
magang mahasiswa dengan upload data
-Sistem melakukan proses clustering data
Sistem menampilkan hasil
representasi clustering data dengan
4.4.2 Hasil Pengujian Pengguna
Nama Penguji : Mir’atul Khusna Mufida, M.Sc.
Tabel 7 Tabel Skenario Pengujian untuk Pengguna
No Skenario Pengujian Test Case Hasil yang Diharapkan Pengujian
Berhasil Gagal 1 Melakukan data login yang benar, lalu
mengklik tombol login.
Username = member Password = member
Sistem menerima akses login dan kemudian langsung menampilkan halaman utama
√
2 Memasukkan data login tidak sesuai dengan user dan password yang telah dibuat.
Username = mem Password = member
Sistem menolak akses dan
mengeluarkan peringatan Username
dan Password Invalid
√
3 Visualisasi untuk pengguna sistem -Menekan tombol result yang ada pada halaman utama
Sistem menampilkan hasil
representasi clustering data dengan
4 Logout yang benar -Menekan tombol Logout -tekan tombol back
Sistem kembali ke menu login dan
tidak kembali kahalaman
sebelumnya
√
5 Logout yang salah -Menekan tombol Logout
-tekan tombol back
Sistem kembali ke menu login dan kembali kahalaman sebelumnya
√
4.4.3 Hasil Persentase
Tabel 8 Persentase Perbedaan Hasil Antara Aplikasi dan Weka
APLIKASI Persentase WEKA Persentase
Cluster 1 47 (76%) 24 (39%)
Cluster 2 7 (11%) 30 (48%)
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan dari tujuan yang dibuat dan hasil dari pengujian, maka diperoleh kesimpulan sebagai berikut :
1. Aplikasi clustering magang mahasiswa ini mempermudah mahasiswa untuk mengetahui informasi jenis pekerjaan yang dibutuhkan .
2. Visualisasi yang ditampilkan dapat mempermudah pengelompokan mahasiswa.
3. Proses pengembangan aplikasi sudah sesuai dengan perancangan.
4. Aplikasi dapat menerapkan metode clustering untuk mengelompokkan mahasiswa berdasarkan nilai magang dan job description secara manual. 5. Berdasarkan data yang diolah, didapatkan 3 kelompok dengan hasil sebagai
berikut :
a. Cluster 1 merupakan kelompok mahasiswa magang yang berpotensi berprestasi dengan nilai diatas >75 .
b. Cluster 2 merupakan kelompok mahasiswa magang yang berpotensi mengalami kesulitan dengan nilai antara 65>75 .
c. Cluster 3 merupakan kelompok mahasiswa magang yang berpotensi bermasalah dengan nilai diatas <65
5.2 Saran
Saran untuk aplikasi clustering magang mahasiswa adalah :
1. Aplikasi dapat menangani pengkategorian data mahasiswa magang dengan metode klasifikasi.
2. Aplikasi dapat menangani pengkategorian data mahasiswa magang dengan algoritma untuk data kategori jobdescription dan algoritma untuk data numerik.
DAFTAR PUSTAKA
Asroni dan Adrian, Ronald,2015,”Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang”,Jurnal Ilmiah Semesta Teknika Vol.18, No. 1, 76-82, Mei 2015.
Bayu, Muhammad,”Laporan Produktif”,2013
Kusrini dan Luthfi, Emha Taufiq,2009”Algoritma Data Mining”.Yogyakarta.C.V Andi
Lee S, Finn dan Santana, Juan,2010”Data Mining”.I.Jakarta.PT. Gramedia
Luthfi, Emha Taufiq and Kusrini,2009,”Algoritma Data Mining”.I.Yogyakarta. C.V Andi
Ong, Johan Oscar,2013,”Implementasi K-Means Clustering Untuk Menentukan Strategi Marketing President University” Jurnal Ilmiah Teknik Industri, Vol.12, No.1, Juni 2013.
Rachmansyah, dkk,”Penerapan Algoritma K-Means Untuk Clustering Dokumen
E-jurnal STMIK GI MDP”.
Simanjuntak, Elvis,”Sistem Informasi Pemasaran Berbasis Website Pada PT. Trimitra Sebagai Sarana Penjualan Produk Secara Online”,2014