PENERAPAN METODE K-MEANS UNTUK CLUSTERING MAHASISWA BERDASARKAN PARAMETER NILAI MAGANG DAN JOB DESCRIPTION

(1)

PENERAPAN METODE K-MEANS UNTUK

CLUSTERING MAHASISWA BERDASARKAN

PARAMETER NILAI MAGANG DAN JOB

DESCRIPTION PADA JURUSAN TEKNIK

INFORMATIKA POLITEKNIK NEGERI BATAM

TUGAS AKHIR

Oleh :

Cytra Sari Rewati Saragi 3311401002

Disusun untuk memenuhi syarat kelulusan Program Diploma III

PROGRAM STUDI TEKNIK INFORMATIKA POLITEKNIK NEGERI BATAM

BATAM 2017

(2)

HALAMAN PENGESAHAN

PENERAPAN METODE K-MEANS UNTUK CLUSTERING MAHASISWA BERDASARKAN PARAMETER NILAI MAGANG DAN

JOB DESCRIPTION PADA JURUSAN TEKNIK INFORMATIKA

POLITEKNIK NEGERI BATAM

Oleh :

Cytra Sari Rewati Saragi (3311401002)

Tugas Akhir ini telah diterima dan disahkan sebagai persyaratan untuk memperoleh gelar

Ahli Madya di

PROGRAM STUDI DIPLOMA 3 TEKNIK INFORMATIKA POLITEKNIK NEGERI BATAM

Batam, Januari 2017 Disetujui oleh;

Pembimbing,

Mir’atul Khusna Mufida, M.Sc. NIK. 109057

(3)

HALAMAN PERNYATAAN

Dengan ini, saya:

NIM : 3311401002

Nama : Cytra Sari Rewati Saragi

adalah mahasiswa Teknik Informatika Politeknik Batam yang menyatakan bahwa tugas akhir dengan judul:

disusun dengan:

1. tidak melakukan plagiat terhadap naskah karya orang lain 2. tidak melakukan pemalsuan data

3. tidak menggunakan karya orang lain tanpa menyebut sumber asli atau tanpa ijin pemilik

Jika kemudian terbukti terjadi pelanggaran terhadap pernyataan di atas, maka saya bersedia menerima sanksi apapun termasuk pencabutan gelar akademik.

Lembar pernyataan ini juga memberikan hak kepada Politeknik Batam untuk mempergunakan, mendistribusikan ataupun memproduksi ulang seluruh hasil Tugas Akhir ini.

Batam, Januari 2017

Cytra Sari Rewati Saragi

(4)

KATA PENGANTAR

Puji syukur penulis ucapkan kepada Tuhan Yang Maha Esa yang telah memberikan berkat-Nya, sehingga penulis dapat menyelesaikan Tugas Akhir ini dengan judul “Penerapan Metode K-Means untuk Clustering Mahasiswa Berdasarkan Parameter Nilai Magang dan Job Description pada Jurusan Teknik Informatika Politeknik Negeri Batam”. Tugas Akhir ini disusun sebagai salah satu syarat untuk kelulusan. Dalam Penyusunan Tugas Akhir ini penulis banyak mendapat saran, dorongan, bimbingan serta keterangan-keterangan dari berbagai pihak. Oleh karena itu penulis mengucapkan terimakasih kepada :

1. Tuhan Yang Maha Esa, yang senantiasa memberikan limpahan anugerah dan berkat-Nya berupa nikmat kesehatan yang selalu mengiringi Penulis. 2. Ibu Mir’atul Khusna Mufida, M.Sc. selaku dosen pembimbing Tugas Akhir

yang telah meluangkan waktu untuk memberikan bimbingan.

3. Bapak Sudra Irawan M.Sc , selaku dosen wali Teknik Informatika angkatan 2014 yang selalu memberikan motivasi bagi Penulis agar menyelesaikan Tugas Akhir ini dengan baik.

4. Keluarga, yang telah memberikan dukungan, nasihat, dan motivasi serta doa yang tak henti-hentinya agar selalu semangat dalam menyelesaikan Tugas Akhir ini.

5. Semua teman-teman dan pihak yang tidak mungkin penulis sebutkan satu persatu yang telah banyak membantu sehingga Tugas Akhir ini dapat diselesaikan.

(5)

Penulis menyadari masih terdapat banyak kekurangan yang dibuat baik sengaja maupun tidak sengaja. Untuk itu penulis mohon maaf atas segala kekurangan tersebut tidak menutup diri terhadap segala saran dan kritik serta masukan yang bersifat membangun bagi diri penulis. Akhir kata penulis ucapkan terimakasih.

Batam, Januari 2017

(6)

ABSTRAK

Dalam pelaksanaan kegiatan magang masih ditemukan beberapa kendala, diantaranya mahasiswa jurusan Teknik Informatika selama ini mengalami kesulitan dalam menentukan posisi magang yang sesuai dengan minat dan kemampuannya dan kurangnya informasi jenis pekerjaan yang dibutuhkan dari pihak perusahaan atau instansi tujuan magang. Penelitian ini bertujuan untuk mengelompokkan mahasiswa dengan menerapkan algoritma K-means, sehingga menghasilkan suatu pola yang dapat mengidentifikasi mahasiswa yang berpotensi bermasalah. Metode penelitian yang digunakan adalah dokumen data laporan magang mahasiswa. Manfaat dari adanya aplikasi ini adalah mempermudah pihak Politeknik Negeri Batam dalam menentukan posisi magang mahasiswa dan mempermudah mahasiswa untuk mengetahui informasi jenis pekerjaan yang dibutuhkan oleh pihak perusahaan atau instansi.

(7)

ABSTRACT

IMPLEMENTATION OF K-MEANS METHODS FOR CLUSTERING STUDENT BASED ON VALUES INTERNSHIP AND JOB DESCRIPTION

OF INFORMATICS ENGINEERING DEPARTMENT BATAM STATE POLYTECHNIC

In the implementation of the internship activities still found several problems, including the Department of Information Engineering students have had difficulty in determining an intern position that match their interests and abilities and lack of information on the type of work required of the company or agency internship destination. This study aims to classify students by implementing the K-means algorithm, thereby generating a pattern that can identify potentially problematic student. The method used is the student internship report data document. The benefits of this application is to facilitate the Batam State Polytechnic in determining the position of student internships and easier for students to find information on the type of work required by the company or agency.

(8)

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PENGESAHAN ... ii

HALAMAN PERNYATAAN ... iii

KATA PENGANTAR ... iv

ABSTRAK ... vi

ABSTRACT ... vii

DAFTAR ISI ... viii

DAFTAR GAMBAR ... x

DAFTAR TABEL ... xii

BAB I PENDAHULUAN ... 13 1.1 Latar Belakang ... 13 1.2 Rumusan Masalah ... 14 1.3 Batasan Masalah ... 14 1.4 Tujuan Penelitian ... 15 1.5 Manfaat Penelitian ... 15 1.6 Tinjauan Pustaka ... 15 1.7 Sistematika Penulisan ... 16

BAB II LANDASAN TEORI ... 17

2.1 Magang ... 17

2.2 Visualisasi ... 17

2.3Data Mining ... 18

2.4 Knowledge Discovery in Database (KDD) ... 18

2.5 Clustering ... 19

2.6 Algoritma K-Means ... 20

2.7 ER-Diagram ... 21

2.8 DFD ... 23

2.9 Weka Data Mining Tool ... 24

2.10 MySQL ... 25

2.11 PHP ... 26

2.12 JpGraph ... 27

BAB III ANALISIS DAN PERANCANGAN ... 28

3.1 Analisis Data ... 28

3.1.1 Sumber Data dan Metode ... 28

3.1.2 Prepocessing Data ... 28

3.1.3 Transformasi Data ... 29

3.1.4 Clustering ... 32

3.2 Deskripsi Umum Sistem ... 33

(9)

3.5 Perancangan Basis Data ... 34 3.6DFD ... 35 3.6.1 DFD level 0 ... 35 3.6.2 DFD level 1 ... 35 3.6.3 DFD level 2 ... 36 3.7 Perancangan Antarmuka ... 38 3.7.1 Rancangan Login ... 39

3.7.2 Rancangan Form Input Document ... 39

3.7.3 Rancangan Clustering K-Means ... 40

3.7.4 Rancangan Grafik... 41

BAB IV IMPLEMENTASI DAN PENGUJIAN ... 42

4.1Implementasi Daftar File ... 42

4.2Implementasi Basis Data ... 43

4.2.1users ... 43

4.2.2databaru ... 43

4.2.3centroid ... 43

4.3Implementasi Antarmuka ... 44

4.3.1 Implementasi Proses Login ... 44

4.3.2 Implementasi Menu Utama ... 46

4.3.3 Implementasi Menu Cluster ... 50

4.4Hasil Pengujian ... 59

4.4.1 Hasil Pengujian Pengelola... 59

4.4.2 Hasil Pengujian Pengguna... 62

4.4.3 Hasil Persentase ... 63

BAB V KESIMPULAN DAN SARAN ... 64

5.1Kesimpulan ... 64

5.2Saran ... 64

DAFTAR PUSTAKA ... 65

(10)

DAFTAR GAMBAR

Gambar 1 Tahapan KDD ... 18

Gambar 2 Contoh Cluster ... 20

Gambar 3 Algoritma clustering K-Means... 21

Gambar 4 Contoh ER-Diagram Sederhana ... 23

Gambar 5 Komponen DFD ... 23

Gambar 6 Tampilan Aplikasi Weka Data Mining Tool ... 25

Gambar 7 Kode PHP dan Tampilan Script PHP pada web browser ... 27

Gambar 8 Contoh Simpel Grafik Scatter ... 27

Gambar 9 Data Rekapan Mahasiswa Magang ... 28

Gambar 10 Hasil Seleksi Atribut ... 29

Gambar 11 Hasil Normalisasi Data ... 31

Gambar 12 Hasil Clustering mahasiswa dengan WEKA ... 32

Gambar 13 Deskripsi Umum Sistem ... 33

Gambar 14 ER-Diagram Sistem Analisis Data Magang ... 34

Gambar 15 Level 0 dari Sistem Analisis Data Magang ... 35

Gambar 16 Level 1 dari Sistem Analisis Data Magang ... 35

Gambar 17 Level 2 Proses Pengolahan Data Magang Mahasiswa ... 36

Gambar 18 Level 2 Proses Prepocessing Data Magang Mahasiswa... 36

Gambar 19 Level 2 Proses Pengelompokan Magang Mahasiswa ... 37

Gambar 20 Algoritma K-Means pada Proses Clustering ... 38

Gambar 21 Rancangan Login... 39

Gambar 22 Rancangan Form Input Document ... 39

Gambar 23 Antarmuka masukan jumlah cluster ... 40

Gambar 24 Rancangan Clustering K-Means ... 40

Gambar 25 Rancangan Grafik ... 41

Gambar 26 Login ... 44

Gambar 27 Source Code Login ... 45

(11)

Gambar 30 Tampilan Menu Utama sebagai Member ... 47

Gambar 31 Tampilan Download Format ... 47

Gambar 32 Source Code Download Format ... 48

Gambar 33 Tampilan Upload ... 48

Gambar 34 Source Code Upload File ... 49

Gambar 35 Tampilan Form Input ... 49

Gambar 36 Source Code Form Input ... 50

Gambar 37 Tampilan Masukan Jumlah Cluster ... 50

Gambar 38 Source code Jumlah Cluster ... 51

Gambar 39 Data Hasil Cluster ... 52

Gambar 40 Source code cluster ... 54

Gambar 41 Tabel Centroid Hasil Cluster ... 54

Gambar 42 Source code Centroid Cluster ... 56

Gambar 43 Hasil Grafik Data Laporan Magang ... 57

(12)

DAFTAR TABEL

Tabel 1 Perbandingan Hasil Penelitian ... 15

Tabel 2 Implementasi Daftar File ... 42

Tabel 3 Tabel user ... 43

Tabel 4 Tabel databaru ... 43

Tabel 5 Tabel centroid ... 43

Tabel 6 Tabel Skenario Pengujian untuk Pengelola ... 59

Tabel 7 Tabel Skenario Pengujian untuk Pengguna ... 62

(13)

BAB I

PENDAHULUAN

1.1 Latar Belakang

Mahasiwa Jurusan Teknik Informatika Politeknik Negeri Batam wajib mengikuti matakuliah magang. Matakuliah magang dilaksanakan pada semester 6 untuk program studi Diploma III Teknik Informatika dan semester 8 untuk program studi Diploma IV Teknik Multimedia dan Jaringan. Sehingga setiap mahasiswa harus menyelesaikan magang sebagai persiapan untuk masuk kedalam dunia pekerjaan. Selama magang mahasiswa menerapkan ilmu yang telah dipelajari sambil menyesuaikan diri di instansi atau perusahaan, sehingga mampu menyerap berbagai pengalaman kerja yang sesungguhnya.

Kegiatan magang ini juga membawa keuntungan baik untuk pihak perusahaan atau instansi maupun civitas Politeknik Negeri Batam. Perusahaan mendapat tenaga bantuan dengan adanya mahasiswa magang. Politeknik Negeri Batam juga bisa menyalurkan alumni maupun calon lulusannya ke pihak perusahaan atau instansi terkait. Namun, dalam pelaksanaannya masih ditemukan beberapa kendala, diantaranya mahasiswa jurusan Teknik Informatika selama ini mengalami kesulitan dalam menentukan posisi magang yang sesuai dengan minat dan kemampuannya dan kurangnya informasi jenis pekerjaan yang dibutuhkan dari pihak perusahaan atau instansi tujuan magang.

Dari permasalahan tersebut, maka diperlukan analisis data berupa pengelompokan terhadap data yang ada. Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya (Pramudiono, 2006). Metode data mining digunakan untuk menemukan pola yang menarik agar mahasiswa bisa menentukan posisi magang yang sesuai dengan kemampuannya. Pencarian tempat magang yang sesuai dilakukan berdasarkan data

(14)

job description yang diisi oleh pihak perusahaan atau instansi. Variabel yang dipilih

untuk melakukan pengelompokan mahasiswa adalah: job description, nilai akhir matakuliah magang, etika profesi dan pelaporan kerja.

Data tersebut diproses dengan menggunakan metode pengelompokan clustering K-Means. Metode K-Means digunakan untuk menyesuaikan pengelompokan mahasiswa ke beberapa cluster berdasarkan data tersebut, sehingga data yang memiliki kriteria yang sama dikelompokkan dalam satu cluster dan data yang memiliki kriteria berbeda dikelompokkan dalam cluster yang lain. Dengan adanya pengelompokkan data, diharapkan dapat memberikan informasi kepada mahasiswa yang akan menentukan posisi magang dan mengidentifikasi mahasiswa magang yang berpotensi bermasalah, ditinjau dari ketidaksesuaian pemilihan tempat magang.

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas dapat dirumuskan permasalahan yang akan di selesaikan dalam hal ini adalah :

1. Bagaimana menyajikan data magang berupa job description dan nilai magang mahasiswa agar dapat dieksplorasi untuk menemukan pola atau informasi yang menarik ?

2. Bagaimana mempresentasikan kategorisasi data magang untuk mengetahui perilaku data ?

1.3 Batasan Masalah

Batasan Masalah dari aplikasi ini adalah : 1. Aplikasi ini berbasis web dinamis.

2. Visualisasi digunakan hanya untuk merepresentasikan hasil dari data mining.

3. Pengkategorian Job description dilakukan secara manual.

(15)

1.4 Tujuan Penelitian

Tujuan penelitian ini adalah merancang dan membangun sebuah aplikasi untuk mengelompokkan mahasiswa berdasarkan nilai magang dan job description menggunakan metode clustering K-Means. Dilengkapi dengan visualisasi hasil cluster untuk memperjelas pola menarik data.

1.5 Manfaat Penelitian

1. Mempermudah pihak Politeknik Negeri Batam dalam menentukan posisi magang mahasiswa.

2. Membantu koordinator magang menganalisis mahasiswa magang yang berpotensi bermasalah.

1.6 Tinjauan Pustaka

Penelitian ini dikembangkan dari hasil pengumpulan data yang dilakukan terhadap data laporan magang mahasiswa jurusan Teknik Informatika. Diharapkan dapat membuat suatu sistem baru yang belum pernah ada pada referensi sebelumnya. Adapun perbedaan penelitian ini dapat dilihat dari table berikut :

Tabel 1 Perbandingan Hasil Penelitian

Judul Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang

Peerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Parameter Nilai Magang dan Job Description Pada Jurusan Teknik Informatika Politeknik Negeri Batam

Tujuan Untuk mencari 5 mahasiswa

dalam penyeleksian untuk mengikuti lomba

Untuk mengidentifikasi

mahasiswa magang yang

(16)

Jurusan Teknik Informatika Politeknik Negeri Batam

Data Nilai Akademik mahasiswa Laporan Magang Mahasiswa dan Job description magang Jurusan Informatika Tahun 2015/2016

Metode Clustering K-Means Clustering K-Means

Hasil Grafik Aplikasi Clustering, Visualisasi

1.7 Sistematika Penulisan

Untuk memudahkan pembaca dalam penulisan Tugas Akhir, penulis membuat sistematika penulisan dalam bab 5 yaitu :

BAB I : Pendahuluan

Berisi tentang latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, tinjauan pustaka, sistematika penulisan.

BAB II : Landasan Teori

Bab ini berisi tentang Magang (Job description, Kategori Nilai), Visualisasi, Data Mining, KDD (Knowledge Discovery in Databases), Clustering, K-means, Microsoft Excel, MySQL, PHP, Basis Data, DFD, ER-Diagram.

BAB III : Analisis dan perancangan

Bab ini berisi metode penelitian yang meliputi : Strudi pustaka, Pengumpulan Data, Prepocessing Data, Pemodelan Data (Clustering), Perancangan Sistem.

BAB IV : Implementasi dan Pengujian

Bab ini berisi penjelasan hasil implementasi dan pengujian aplikasi.

BAB V : Penutup

(17)

BAB II

LANDASAN TEORI

2.1 Magang

Magang merupakan kegiatan wajib yang diikuti oleh mahasiswa tingkat akhir dengan tujuan untuk memberikan gambaran tentang kondisi lingkungan kerja. Disamping itu pelaksanaan magang juga berguna untuk menerapkan ilmu yang telah dipelajari sambil menyesuaikan diri di instansi atau perusahaan, sehingga mampu menyerap berbagai pengalaman kerja yang sesungguhnya. Magang diartikan sebagai pelatihan kerja dengan bekerja langsung dibawah bimbingan dan pengawasan pekerja yang lebih berpengalaman di perusahaan untuk dapat menguasai keahlian atau keterampilan tertentu. Tujuan magang adalah sebagai berikut :

a. Melatih sumber daya manusia menjadi tenaga kerja profesional di masa yang akan dating.

b. Memberikan pengalaman nyata dan permasalahan yang dihadapi di dunia kerja untuk menumbuhkan rasa tanggungjawab.

Membantu industri dalam memenuhi sumber daya manusia sebagai kebutuhan tenaga kerja.

2.2 Visualisasi

Visualisasi adalah produk interprestasi gambar diatas kertas atau menggunakan teknologi dengan tujuan untuk menyampaikan informasi dalam bentuk gambar sehingga mempermudah dalam pemahaman (Hershkowitz, 1989). Dengan kata lain visualisasi adalah konversi data kedalam bentuk table atau gambar visual sehingga dapat menangkap konsep dari data yang ditampilkan. Umumnya manusia lebih mudah menangkap informasi melalui gambar daripada teks. Visualisasi dapat diterapkan pada bidang sistem informasi dan aplikasi dengan koneksi database, sehingga data dapat diproses dengan tujuan memperluas pemanfaatan data.

(18)

2.3 Data Mining

Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya (Pramudiono, 2006).

Data mining merupakan gabungan dari berbagai bidang ilmu, antara lain basis data,

information retrieval, statistika, machine learning dan sebagainya. Data mining

dapat diterapkan diberbagai bidang, seperti bisnis, kesehatan, asuransi, pemasaran dan perbankan. Data mining merupakan bagian dari proses Knowledge Discovery

in Database (KDD) untuk menemukan informasi dan pola yang berguna dalam

data.

2.4 Knowledge Discovery in Database (KDD)

Knowledge Discovery in Database (KDD) berhubungan dengan teknik integrasi

dan penemuan ilmiah, interprestasi dan visualisasi dari pola-pola sejumlah kumpulan data. KDD adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah baru dapat bermanfaat dan dapat dimengerti.

Gambar 1 Tahapan KDD

Tahapan Proses KDD : 1. Data Selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi

(19)

yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing/Cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi focus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada data. Juga dilakukan proses enrichment, yaitu proses memperkaya data yag sdah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation/Evaluation.

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

2.5 Clustering

Proses pengelompokan sekumpulan obyek kedalam kelas-kelas obyek yang sama disebut clustering atau pengelompokan. Pengklasteran merupakan satu dari sekian

(20)

banyak fungsi proses data mining untuk menemukan kelompok atau identifikasi kelompok obyek yang hampir sama. Analisis cluster merupakan usaha untuk mengidentifikasi kelompok obyek yang mirip-mirip dan membantu menemukan pola penyebaran dan pola hubungan dalam sekumpulan data yang besar. Hal penting dalam proses pengklasteran adalah menyatakan sekumpulan pola ke kelompok yang sesuai yang berguna untuk menemukan kesamaan dan perbedaan sehingga dapat menghasilkan kesimpulan.

Gambar 2 Contoh Cluster

2.6 Algoritma K-Means

K-Means merupakan salah satu algoritma clustering. Tujuan algoritma ini yaitu untuk membagi data menjadi beberapa kelompok. Algoritma K-means menerima masukan berupa data tanpa label kelas, komputer mengelompokkan sendiri data-data yang menjadi masukannya tanpa mengetahui terlebih dulu target kelasnya. Algoritma K-means termasuk dalam unsupervised learning. Masukan yang diterima adalah data atau objek dan k buah kelompok (cluster) yang diinginkan. Algoritma ini akan mengelompokkan data atau objek ke dalam k buah kelompok tersebut. Pada setiap cluster terdapat titik pusat (centroid) yang merepresentasikan cluster tersebut. Algoritma untuk melakukan K-means clustering adalah sebagai berikut :

(21)

Mulai Banyaknya cluster K Tentukan Pusat Hitung Jarak Obyek ke Pusat Mengelompokan data berdasarkan jarak terdekat dengan pusat Obyek berpindah cluster Hasil cluster Selesai Ya Tidak

Gambar 3 Algoritma clustering K-Means

Ada beberapa kelebihan pada algoritma K-means, yaitu : a. Mudah diimplementasikan dan dijalankan.

b. Waktu yang dibutuhkan untuk menjalankan relatif cepat. c. Mudah untuk diadaptasi.

d. Umum digunakan.

Algoritma K-means juga memiliki kekurangan yaitu, sebelum alagoritma dijalankan k buah titik diinisialisasi secara random sehingga pengelompokkan data yang dihasilkan dapat berbeda-beda.

2.7 ER-Diagram

ER – Diagram ( Entity Relationship Diagram ) adalah sutu model untuk menjelaskan hubungan antar data dalam basis data berdasarkan objek – objek dasar

(22)

data yang mempunyai hubungan antar relasi. ER – Diagram untuk memodelkan struktur data dan hubungan antar data, untuk menggambarkannya menggunakan beberapa notasi dan symbol ( Bayu, 2013).

Pada dasarnya ada 3 komponen yang digunakan yaitu : 1. Entitas

Entitas merupakan objek yang mewakili sesuatu yang nyata dan dapat dibedakan dari sesuatu yang lain. Simbol dari entitas ini biasanya digambarkan dengan persegi panjang.

2. Atribut

Setiap entitas pasti mempunyai elemen yang disebut atribut yang berfungsi untuk mendes-kripsikan karakteristik dari entitas tersebut. Isi dari atribut mempunyai sesuatu yang dapat mengidentifikasikan isi elemen satu dengan yang lain. Gambar atribut diwakili oleh simbol elips.

3. Hubungan / Relasi

Hubungan antara sejumlah entitas yang berasal dari himpunan entitas yang berbeda.Relasi dapat digambarkan sebagai relasi yang terjadi diantara dua himpunan entitas (misalnya A dan B) dalam satu basis data yaitu:

3.1.Satu ke satu ( one to one )

Hubungan relasi satu ke satu yaitu setiap entitas pada himpunan entitas A berhubungan paling banyak dengan satu entitas pada himpunan entitas B. 3.2.Satu ke banyak / Banyak ke Satu ( one to many / many to one )

Setiap entitas pada himpunan entitas A dapat berhubungan dengan banyak entitas pada himpunan entitas B, tetapi setiap entitas pada entitas B dapat berhubungan dengan satu entitas pada himpunan entitas A.

3.3.Banyak ke banyak ( many to many )

Setiap entitas pada himpunan entitas A dapat berhubungan dengan banyak entitas pada himpunan entitas B.

(23)

Gambar 4 Contoh ER-Diagram Sederhana

2.8 DFD

Data Flow Diagram (DFD) merupakan diagram yang menggunakan simbol-simbol untuk menggambarkan sistem kerja antara fungsi-fungsi yang berhubungan satu sama lain dengan aliran penyimpanan data (Adi Nugroho, 2011). DFD sering digunakan untuk menggambarkan suatu sistem yang telah ada atau sistem baru yang akan dikembangkan. Salah satu keuntungan dalam menggunakan DFD ini adalah memudahkan pemakai (user) yang kurang menguasai bidang komputer untuk mengerti sistem yang akan dikerjakan. DFD terdiri dari diagram konteks dan diagram rinci (level diagram). Diagram konteks adalah diagram yang terdiri dari suatu proses dan menggambarkan ruang lingkup suatu sistem. Diagram konteks merupakan level tertinggi dari DFD yang menggambarkan seluruh input ke sistem atau output dari sistem. Dalam diagram konteks biasanya hanya ada satu proses. Tidak boleh ada store dalam diagram konteks. Diagram rinci adalah diagram yang menguraikan proses apa yang ada dalam diagram level di atasnya. Adapun komponen-komponen dalam DFD Menurut Yourdan dan DeMarco adalah sebagai berikut :

(24)

1. Terminator/Entitas Eksternal.

Entitas Eksternal (entity) di lingkungan luar sistem yang dapat berupa orang, organisasi atau sistem lainnya yang berada dilingkungan luarnya yang akan memberikan input atau menerima output dari sistem.

2. Aliran Data.

Aliran data mengalir diantara proses (process), simpanan data (data store) dan kesatuan luar (External entity). Aliran data ini menunjukkan arus dari data yang dapat berupa masukan untuk sistem atau hasil dari proses sistem. 3. Proses.

Suatu proses adalah kegiatan atau kerja yang dilakukan oleh orang, mesin atau computer dari hasil suatu aliran data yang masuk kedalam proses untuk dihasilkan aliran data yang akan keluar dari proses.

4. Penyimpanan Data.

Penyimpanan data (Data Store) merupakan penyimpanan data yang dapat berupa :

a. Suatu file atau basis data di sistem computer b. Suatu arsip atau catatan manual

c. Suatu agenda atau buku

2.9 Weka Data Mining Tool

Weka merupakan aplikasi data mining yang berbasis open source (GPL) dan berengine Java. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi atau formulasi dari sekumpulan data sampling. Kekuatan Weka sebenarnya terletak pada algoritma yang makin lengkap dan canggih, kesuksesan data mining tetap terletak pada faktor pengetahuan manusianya itu sendiri. Hal tersebut bisa dilakukan jika adanya pengumpulan data yang berkualitas tinggi pengetahuan pemodelan dan penggunaan algoritma yang tepat, sehingga akan menjamin keakuratan formulasi yang diharapkan. Weka mendukung beberapa format file untuk masukannya, diantaranya :

(25)

dengan menggunakan Microsoft Excel atau membuatnya sendiri dengan menggunakan notepad.

b. Format C45 : Merupakan format file yang bisa diakses dengan menggunakan aplikasi Weka.

c. Attribute-Relation File Format (ARFF) : Merupakan tipe file teks yang berisi berbagai instance data yang berhubungan dengan suatu set atribut data yang dideskripsikan juga dalam file tersebut.

Gambar 6 Tampilan Aplikasi Weka Data Mining Tool

2.10 MySQL

MySQL adalah sistem manajemen database SQL yang bersifat Open Source dan paling populer saat ini.Sistem Database MySQL mendukung beberapa fitur seperti multithreaded, multi-user, dan SQL database managemen sistem (DBMS).Database ini dibuat untuk keperluan sistem database yang cepat, handal dan mudah digunakan.Ulf Micheal Widenius adalah penemu awal versi pertama MySQL yang kemudian pengembangan selanjutnya dilakukan oleh perusahaan MySQL AB. MySQL AB yang merupakan sebuah perusahaan komersial yang didirikan oleh para pengembang MySQL. MySQL sudah digunakan lebih dari 11 millar instalasi saat ini( Bayu, 2013 ). Berikut ini kelebihan MySQL sebagai database server antara lain :

(26)

2. Sintaksnya lebih mudah dipahami dan tidak rumit. 3. Pengaksesan database dapat dilakukan dengan mudah.

4. MySQL merupakan program yang multithreaded, sehingga dapat dipasang pada server yang memiliki multiCPU.

5. Didukung programprogram umum seperti C, C++, Java, Perl, PHP, Python, dsb. Bekerja pada berbagai platform. (tersedia berbagai versi untuk berbagai sistem operasi).

6. Memiliki jenis kolom yang cukup banyak sehingga memudahkan konfigurasi sistem database.

7. Memiliki sistem sekuriti yang cukup baik dengan verifikasi host. 8. Mendukung ODBC untuk sistem operasi Windows.

Mendukung record yang memiliki kolom dengan panjang tetap atau panjang bervariasi.

2.11 PHP

PHP adalah sigkatan dari “Hypertext Processor” yaitu bahasa pemrograman yang digunakan untuk pengembangan dan pembuatan sebuah web dan bisa digunakan bersamaan dengan HTML. Kelebihan PHP dari bahasa pemrograman lain :

1. Dalam sisi pengembangan lebih mudah

2. Bahasa pemrograman PHP adalah sebuah bahasa script yang tidak melakukan sebuah kompilasi dalam penggunaanya

3. Dalam sisi pemahamanan, PHP adalah bahasa scripting yang paling mudah karena memiliki referensi yang banyak

4. PHP adalah bahasa open source yang dapat digunakan di berbagai mesin 5. PHP digunakan sebagai landasan operasi pada pemrogaman jaringan

berbasis web.

(27)

Sebagai contoh, berikut kode PHP yang berada di dalam kode HTML :

<?php

echo "Selamat Datang"; ?>

Gambar 7 Kode PHP dan Tampilan Script PHP pada web browser

Kode PHP diawali dengan <?php dan diakhiri dengan ?>. pasangan kedua kode inilah yang berfungsi sebagai tag kode. Maka apabila kode tersebut dijalankan akan menghasilkan gambar seperti gambar 7 pada web browser.

2.12 JpGraph

JpGraph adalah library dari PHP yang bersifat object oriented. Fungsi utama dari library ini adalah untuk membuat grafik pada browser dengan menggunakan data yang ada. Digunakan untuk menampilkan jumlah titik data yang didefinisikan oleh nilai X dan nilai Y. JpGraph bersifat open source dapat didownload secara gratis melalui http://jpgraph.net/download/. Perlu diperhatikan bahwa untuk dapat menggunakan JpGraph pastikan GD library aktif (enable) pada PHP anda.

(28)

BAB III

ANALISIS DAN PERANCANGAN

3.1 Analisis Data

3.1.1 Sumber Data dan Metode

Sumber Data yang digunakan adalah data laporan magang mahasiswa Jurusan Teknik Informatika Politeknik Negeri Batam angkatan 2015-2016. Data tersebut berjumlah 62 baris. Ada 2 parameter yang digunakan, yaitu : job description dan nilai akhir magang. Berikut tampilan sejumlah data yang diambil dari data laporan magang :

Gambar 9 Data Rekapan Mahasiswa Magang

Metode pengambilan data yang digunakan adalah metode clustering. Metode clustering adalah cara mengumpulkan objek yang memiliki tingkat kemiripan yang tinggi dengan objek yang berada di cluster yang sama maupun yang berbeda.

3.1.2 Prepocessing Data

(29)

data tetapi menghasilkan hasil analisis yang sama (hampir sama). Reduksi data dapat dilakukan dengan banyak cara, salah satunya adalah seleksi atribut. Dalam proses seleksi atribut yang dilakukan adalah mengurangi atribut yang dianggap tidak perlu, yaitu atribut NIM. Jadi, atribut yang tersisa atau yang akan dipakai untuk tahap normalisasi adalah nama, job description dan nilai.

Gambar 10 Hasil Seleksi Atribut

3.1.3 Transformasi Data

Adalah merubah data yang kompleks dengan tidak menghilangkan isi, sehingga lebih mudah diolah. Transformasi data dapat dilakukan dengan banyak cara, salah satunya adalah normalisasi. Dari data yang ada terdapat dua atribut yang perlu untuk di normalisasikan.

Contoh data yang akan dinormalisasi :

(30)

Pengkategorian Job description dilakukan secara manual, Sehingga didapatkan hasil sebagai berikut :

(31)

Dicari nilai rata-rata dari rentang nilai yang diberikan dengan mengambil nilai minimum dari setiap rentang nilai.

Jawab : Nilai’ 80+80+80/3 = 80

(32)

3.1.4 Clustering

Penghitungan dengan algoritma K-means dilakukan menggunakan aplikasi WEKA untuk membantu mempercepat perhitungan data. Dalam pembagian cluster dibagi menjadi 3 kelompok yaitu cluster 0, cluster 1 dan cluster 2.

(33)

3.2 Deskripsi Umum Sistem Pengelola Pengguna Proses Clustering K-Means Mengelola Data Mahasiswa Job description, Nilai akhir magang Menampilkan Visualisasi, Data Pengelompokan Mahasiswa Menampilkan Visualisasi, Data Pengelompokan Mahasiswa Mengirim Data Clustering K-Means Sistem Analisis Data Magang Merespon Data Clustering K-Means Gambar 13 Deskripsi Umum Sistem

Sistem Analisis data magang ini adalah sebuah aplikasi yang dibangun berbasis web dinamis. Pengelola memasukkan data yang digunakan untuk masukan program adalah Microsoft Excel. Data diimpor kedalam program kemudian ditampung menggunakan database MySQL. Sehingga data yang diolah adalah data yang ada pada table MySQL. Data yang telah dimasukkan kemudian diproses menggunakan Algoritma K-Means. Proses klustering selesai bila jumlah anggota dari tiap kluster tidak berubah. Sehingga keluaran yang dihasilkan dari sistem analisis data magang ini adalah berupa data pengelompokkan mahasiswa magang yang di representasikan dengan visualisasi.

3.3 Kebutuhan Fungsional

F01. Aplikasi harus dapat menangani login untuk pengguna dan pengelola. F02. Pengelola harus dapat menambah data laporan magang mahasiswa. F03. Aplikasi harus dapat melakukan convert data excel ke database.

(34)

F04. Aplikasi harus dapat melakukan pengelompokan mahasiswa magang berdasarkan parameter nilai akhir magang dan job description menggunakan Algoritma K-Means.

F05. Aplikasi harus dapat melakukan prepocessing data laporan magang mahasiswa.

F06. Aplikasi harus dapat menampilkan hasil pengelompokan mahasiswa magang. F07. Aplikasi harus dapat memvisualisasikan data magang.

3.4 Kebutuhan Non Fungsional

NF01.Aplikasi berbasis web dinamis.

NF02. Aplikasi memiliki hak akses yang berbeda-beda.

3.5 Perancangan Basis Data

Pengelola Mengelola Mahasiswa Magang Memiliki Job description Id_pengelola nama hak_akses nim nama jurusan no_id jenis_pekerjaan nilai_magang nilai_etika _{nilai_pelaporan} ratarata_nilai

(35)

3.6 DFD

3.6.1 DFD level 0

0 Sistem Cluster Data

Magang

+

Pengelola

Username, Password, Job description, Nilai

akhir magang Visualisasi, Data Pengelompokan Mahasiswa Pengguna Visualisasi, Data Pengelompokkan Mahasiswa

Gambar 15 Level 0 dari Sistem Analisis Data Magang

Pada diagram konteks terdapat sebuah entitas luar yaitu pengelola dan pengguna yang berinteraksi dengan sebuah proses yaitu sistem pengklusteran nilai akhir magang dan job description. Dalam hal ini pengelola yaitu : Koordinator magang dan Bagian Akademik. Pengguna yanitu : Pudir, KPS dan Kajur.

3.6.2 DFD level 1 Mahasiswa Magang Pengelola 3 Pengelompokan magang mahasiswa +

Data Pengelompokan Mahasiswa

Data Pengelompokan Mahasiswa Data Pengelompokan Mahasiswa

1 Pengolahan data magang mahasiswa + 2 Prepocessing +

Data Pengelompokan Mahasiswa Visualisasi

Job description

Job description

Pengguna

Nilai akhir magang Nilai akhir magang

Job description

Job description Job description

Visualisasi Visualisasi Visualisasi Job description terkluster Job description terkluster

Nilai akhir magang terkluster Nilai akhir magang

terkluster

Gambar 16 Level 1 dari Sistem Analisis Data Magang

Level 1 merupakan tingkatan dari level sebelumnya yang menjelaskan proses aliran data yang berasal dari masukkan pengelola kemudian diproses kedalam proses klustering dan pengelompokan, prepocessing dan transformasi data. Job

description dan nilai akhir magang nantinya akan disimpan kedalam data

penyimpanan laporan magang mahasiswa. Data yang dikelola pada level 1 ini adalah data mahasiswa magang.

(36)

3.6.3 DFD level 2

1.1 Tambah Data magang

mahasiswa

1.2

Convert Data magang

mahasiswa

1.3 Hasil Data magang

mahasiswa

Mahasiswa Magang Pengelola

Data magang mahasiswa Data magang mahasiswa

Visualisasi Visualisasi

Pengguna

Job description

Visualisasi Visualisasi

Gambar 17 Level 2 Proses Pengolahan Data Magang Mahasiswa

Level ini merupakan tingkatan level dari level 1 pengolahan data magang mahasiswa. Data yang mengalir ke dalam data store merupakan data yang berhubungan dengan data magang mahasiswa. Proses yang dapat dilakukan oleh pengelola terhadap aplikasi adalah memasukkan data magang mahasiswa.

Mahasiswa Magang 2.1 Reduksi Data Pengelola 2.2 Transformasi Data Job description Job description

Nilai akhir magang

Job description

Nilai akhir magang Nilai akhir magang Nilai akhir magang

Job description Job description Job description

Job description

Gambar 18 Level 2 Proses Prepocessing Data Magang Mahasiswa

Pada level 2 proses prepocessing data magang dilakukan reduksi data untuk mengurangi ukuran data tetapi menghasilkan hasil analisis yang sama (hampir sama) dan transformasi data yang mengalir ke data store adalah data yang berhubungan dengan magang mahasiswa. Pada level ini data dapat dilakukan dengan banyak cara, salah satunya adalah normalisasi.

(37)

Mahasiswa Magang 3.1 Proses Klustering K-means Pengelola 3.2 Pengelompokan Job description

Nilai akhir magang

Data Pengelompokan Mahasiswa Data Pengelompokan Mahasiswa Nilai akhir magang

Job description

Pengguna

Job description

Data Pengelompokan Mahasiswa Data Pengelompokan Mahasiswa

Gambar 19 Level 2 Proses Pengelompokan Magang Mahasiswa

Pada level 2 pengelompokan magang mahasiswa data yang mengalir ke data

store adalah data yang berhubungan dengan magang mahasiswa. Proses yang

terdapat pada data ini adalah melakukan pengelompokan mahasiswa magang berdasarkan parameter nilai akhir magang dan job description menggunakan algoritma K-Means. Semua proses yang dilakukan akan disimpan kedalam data magang mahasiswa. Algoritma ini akan mengelompokkan data atau objek ke dalam k buah kelompok tersebut.

(38)

Mulai Banyaknya cluster K Tentukan Pusat Hitung Jarak Obyek ke Pusat Mengelompokan data berdasarkan jarak terdekat dengan pusat Obyek berpindah cluster Hasil cluster Selesai Ya Tidak

Gambar 20 Algoritma K-Means pada Proses Clustering

3.7 Perancangan Antarmuka

Rancangan antarmuka adalah sarana untuk menghubungkan sistem dan pengguna. Rancangan antarmuka sistem analisis data magang dengan menggunakan algoritma

Clustering K-Means terdiri dari rancangan login, form input dokumen, Clustering

K-Means yang berfungsi untuk melakukan proses pengelompokkan data magang mahasiswa dan Grafik Clustering K-Means.

(39)

3.7.1 Rancangan Login

Gambar 21 Rancangan Login

Rancangan antarmuka login dibuat untuk hak ases pengelola terhadap sistem yang dibuat. Tampilan ini terdiri dari nama pengguna atau pengelola dan password. Setelah mengisi data diatas, maka pilih tombol OK. Jika tidak tekan tombol Batal.

3.7.2 Rancangan Form Input Document

(40)

Rancangan form input document adalah rancangan untuk pengelola melakukan input dokumen data magang mahasiswa berupa file excel ke dalam sistem yang kemudian akan di convert untuk selanjutnya dimasukkan ke dalam database. Proses lain yang dilakukan adalah memasukkan data secara manual dengan mengisi data nama mahasiswa dan kode job description.

Gambar 23 Antarmuka masukan jumlah cluster

3.7.3 Rancangan Clustering K-Means

Gambar 24 Rancangan Clustering K-Means

Rancangan ini berfungsi untuk melakukan proses pengelompokkan data magang mahasiswa. Hasil pengelompokkan data mahasiswa magang tersebut dapat dikelompokan dengan perbedaan warna yang telah tersedia. Untuk melihat hasil Clustering secara visual maka user harus menekan tombol “Lihat Grafik Clustering”.

(41)

3.7.4 Rancangan Grafik

Gambar 25 Rancangan Grafik

Rancangan Grafik ini merupakan representasi dari hasil pengelompokan data magang berupa job description dan nilai magang mahasiswa.

(42)

BAB IV

IMPLEMENTASI DAN PENGUJIAN

4.1 Implementasi Daftar File

Implementasi adalah tahap penerapan sistem yang akan dilakukan jika sistem disetujui termasuk program yang telah dibuat pada tahap perancangan sistem agar siap untuk dioperasikan.

Tabel 2 Implementasi Daftar File

No Fungsional Nama File Data Path

1 Login login.php config.php check-login.php Database http://localhost/login-bootstrap/login.php 2 Input index.php forminputman ual.php Database http://localhost/N/forminputmanual. php 3 Upload index.php upload.php Database http://localhost/N/upload.php

4 Convert upload.php Database http://localhost/N/upload.php

5 Download index.php downloadfile. php Database http://localhost/N/downloadfile.php 6 Clustering masukan.php kluster.php kmeans.php centroid.php following.php sse.php Database http://localhost/N/masukan.php

7 Visualisasi scatterex.php Database http://localhost/scatterex.php

(43)

4.2 Implementasi Basis Data 4.2.1 users

Tabel dibawah ini merupakan implementasi data table user

Tabel 3 Tabel user

No Nama Field Type Length Keterangan

1 id_user Int 10 Primary Key

2 nama Varchar 200

3 username Varchar 200

4 password Text

5 level_user Varchar 150

4.2.2 databaru

Tabel dibawah ini merupakan implementasi data table data baru

Tabel 4 Tabel databaru

1 nama Varchar 25 2 nilai Int 11 3 jobdesc Int 25 4 Ket Varchar 255 5 cluster Int 5 4.2.3 centroid

Tabel dibawah ini merupakan implementasi data table centroid

Tabel 5 Tabel centroid

1 id3 int 11 Primary Key

2 x float

(44)

4.3 Implementasi Antarmuka 4.3.1 Implementasi Proses Login

Gambar 26 Login

Pada gambar tersebut menjelaskan bahwa pengguna aplikasi harus memasukkan username dan password sebagai hak akses agar dapat menggunakan aplikasi tersebut. Lalu tekan login.

(45)

Gambar 27 Source Code Login

Kode tersebut menjelaskan bahwa aplikasi memiliki 2 level user yaitu : admin sebagai pengelola dan member sebagai pengguna. Akan ada proses check login ketika pengguna atau pengelola telah memasukkan username dan password sesuai dengan level user. Jika user salah memasukkan username

(46)

dan password maka error dan muncul pesan “Username dan Password Invalid.

4.3.2 Implementasi Menu Utama

Gambar 28 Tampilan Menu Utama sebagai Admin

Pada gambar tersebut menunjukkan halaman utama yang ditampilkan ketika user masuk sebagai admin atau pengelola. Terdapat 5 navigasi bar : Home, File, Cluster, dan Log Out.

(47)

Pada menu dropdown File terdapat 3 menu lagi dibawahnya yaitu : Download Format, menu ini memberikan fasilitas untuk mengunduh format file sesuai aturan tertentu yang telah disediakan. Upload File, menu ini berfungsi untuk mengunggah file dalam jumlah data yang banyak sesuai dengan format file yang telah diunduh pada menu download format. Form Input, adalah form yang disediakan untuk memasukkan data mahasiswa secara manual.

Gambar 30 Tampilan Menu Utama sebagai Member

yang membedakan tampilan menu utama ini dengan tampilan menu utama sebelumnya adalah tidak terdapat navigasi bar “File”.

Gambar 31 Tampilan Download Format

Gambar 31 Tampilan download format, menu ini memberikan fasilitas untuk mengunduh format file sesuai aturan tertentu yang telah disediakan. Pengelola

(48)

dapat mengklik tulisan yang berwarna biru dan secara otomatis format file berhasil diunduh.

Gambar 32 Source Code Download Format

Kode tersebut menjelaskan bahwa format file yang tersedia adalah dalam bentuk file Microsoft Excel dan dapat langsung diunduh dengan mengklik link format file yang telah disediakan.

Gambar 33 Tampilan Upload

Pengelola menekan tombol pilih file untuk memilih file yang ingin di upload. File yang diupload harus disesuaikan dengan format file yang telah disediakan pada menu download format. Kemudian setelah dipilih tekan tombol upload maka secara otomatis file upload akan masuk dan tersimpan kedalam database.

(49)

Gambar 34 Source Code Upload File

Kode ini menjelaskan bahwa ketika pengelola menekan tombol upload maka aplikasi membaca file excel yang di upload dengan menggunakan excel reader. Jika data yang diupload berhasil diimport maka aplikasi akan menampilkan pesan “data berhasil di import” jika tidak maka aplikasi akan menampilkan pesan “data gagal di import”.

(50)

Pengelola memasukkan data Nama, Nilai, Kode Jobdescription mahasiswa magang dan Keterangan lainnya. Untuk Kode Jobdescription dapat dipilih lebih dari satu sesuai dengan jenis pekerjaan yang dilakukan oleh mahasiswa tersebut. kolom Keterangan Lainnya dapat di isi ketika pengelola memilih kode jobdescription nomor 19. Lalu pilih Simpan.

Gambar 36 Source Code Form Input

Pada kode tersebut menjelaskan bahwa masukan data untuk nama dan nilai tidak boleh kosong jika kosong maka aplikasi akan menampilkan pesan “Masukan data tidak boleh ada yang kosong” jika semua masukan diisi dengan benar maka masukan data berhasil dilakukan.

4.3.3 Implementasi Menu Cluster

(51)

Pengelola memasukkan jumlah pengelompokan data yang mau dibentuk. Lalu pilih tombol “Cluster Now” untuk melanjutkan proses cluster.

Gambar 38 Source code Jumlah Cluster

Kode program memvalidasi jumlah cluster yang dimasukkan oleh pengelola. Jumlah minimal cluster yang dapat di masukkan adalah 1 dan jumlah maksimal cluster adalah 5.

(52)

Gambar 39 Data Hasil Cluster

Untuk hasil cluster pada gambar diatas data yang ditampilkan berjumlah 3 cluster. Setiap warna mewakili 1 cluster dan seterusnya. Pengelola dapat menekan tombol “Lihat Grafik Clustering” untuk melihat representasi data tulisan dalam bentuk grafik . tombol “Lihat Centroid” berguna untuk menampilkan titik centroid algoritma k-means dari data yang ada.

(53)

(54)

Gambar 40 Source code cluster

Kode program menjelaskan bahwa data yang akan diolah sebagai nilai x dan nilai y adalah data nilai dan data jobdesc. Ditentukan data titik pusatnya berupa data array kemudian ditampilkan hasil cluster dengan mendapatkan data berdasarkan nama .

Gambar 41 Tabel Centroid Hasil Cluster

Gambar ini menjelaskan bahwa terdapat sebuah titik cluster (x,y) dari masing-masing jumlah cluster yang ditampung dalam sebuah tabel. Dengan data nilai untuk centroid x dan data jobdesc untuk centroid y,

(55)

(56)

Gambar 42 Source code Centroid Cluster

Kode ini menjelaskan bahwa centroid baru didapatkan dengan menjalankan beberapa fungsi yang terdapat dalam kode program.

(57)

Gambar 43 Hasil Grafik Data Laporan Magang

Grafik ini merupakan representasi dari hasil data magang berupa job description dan nilai magang mahasiswa.

(58)

Gambar 44 Source Code Grafik Data Laporan Magang

Kode tersebut menjelaskan bahwa grafik akan menampilkan hasil representasi data magang berupa job description dan nilai magang mahasiswa dari database. Setiap kali pengelola memasukkan data kedalam sistem maka data akan otomatis tampil pada grafik.

(59)

4.4 Hasil Pengujian

Pengujian dilakukan dengan menguji setiap proses dan kemungkinan kesalhana yang terjadi untuk setiap proses. Pengujian dilakukan dengan hanya memperhatikan masukan kesistem dan keluaran dari sistem.

4.4.1 Hasil Pengujian Pengelola

Nama Penguji : Mir’atul Khusna Mufida, M.Sc.

Tabel 6 Tabel Skenario Pengujian untuk Pengelola

No Skenario Pengujian Test Case Hasil yang Diharapkan Pengujian

Berhasil Gagal 1 Melakukan data login yang benar

sebagai pengelola, lalu klik tombol login

Username = admin Password = admin

Sistem menerima akses login dan kemudian langsung menampilkan halaman utama

√

2 Memasukkan data login salah Username = admin

Password = 133

Sistem menolak akses dan

mengeluarkan peringatan Username dan Password Invalid

√

3 Mengunduh data format file Mengklik link unduh format file yang tersedia

Sistem dapat mengunduh data

(60)

4 Melakukan upload data sesuai format -Menekan tombol pilih file denga√√n nama file

-Memilih file yang akan diupload sesuai format file

-Tekan tombol upload

File data berhasil diupload

√

5 Memasukkan data form input manual dengan data yang benar

Nama = Sasa Nilai = 80

Kode Jobdescription = pilih sesuai jenis pekerjaan yang lakukan (boleh pilih lebih dari satu)

Keterangan = di isi sesuai kebutuhan

Sistem dapat menerima hasil masukan dari pengelola untuk memasukkan data laporan magang

mahasiswa.

√

6 Memasukkan data form input manual dengan data yang salah

Nama = Nilai =

Kode Jobdescription = pilih sesuai jenis pekerjaan yang lakukan (boleh pilih lebih dari satu)

Sistem menolak menerima hasil masukan dari pengelola dan mengeluarkan peringatan Data yang dimasukkan tidak boleh kosong

(61)

Keterangan = di isi sesuai kebutuhan

7 Melakukan proses clustering data -Memasukkan data laporan magang mahasiswa dengan upload data

-Sistem melakukan proses clustering data

Sistem menerima hasil masukan, melakukan proses clustering data, dan menampilkan hasil clustering berupa tabel

√

8 Visualisasi -Memasukkan data laporan

magang mahasiswa dengan upload data

-Sistem melakukan proses clustering data

Sistem menampilkan hasil

representasi clustering data dengan

(62)

4.4.2 Hasil Pengujian Pengguna

Nama Penguji : Mir’atul Khusna Mufida, M.Sc.

Tabel 7 Tabel Skenario Pengujian untuk Pengguna

No Skenario Pengujian Test Case Hasil yang Diharapkan Pengujian

Berhasil Gagal 1 Melakukan data login yang benar, lalu

mengklik tombol login.

Username = member Password = member

Sistem menerima akses login dan kemudian langsung menampilkan halaman utama

√

2 Memasukkan data login tidak sesuai dengan user dan password yang telah dibuat.

Username = mem Password = member

Sistem menolak akses dan

mengeluarkan peringatan Username

dan Password Invalid

√

3 Visualisasi untuk pengguna sistem -Menekan tombol result yang ada pada halaman utama

Sistem menampilkan hasil

representasi clustering data dengan

(63)

4 Logout yang benar -Menekan tombol Logout -tekan tombol back

Sistem kembali ke menu login dan

tidak kembali kahalaman

sebelumnya

√

5 Logout yang salah -Menekan tombol Logout

-tekan tombol back

Sistem kembali ke menu login dan kembali kahalaman sebelumnya

√

4.4.3 Hasil Persentase

Tabel 8 Persentase Perbedaan Hasil Antara Aplikasi dan Weka

APLIKASI Persentase WEKA Persentase

Cluster 1 47 (76%) 24 (39%)

Cluster 2 7 (11%) 30 (48%)

(64)

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan dari tujuan yang dibuat dan hasil dari pengujian, maka diperoleh kesimpulan sebagai berikut :

1. Aplikasi clustering magang mahasiswa ini mempermudah mahasiswa untuk mengetahui informasi jenis pekerjaan yang dibutuhkan .

2. Visualisasi yang ditampilkan dapat mempermudah pengelompokan mahasiswa.

3. Proses pengembangan aplikasi sudah sesuai dengan perancangan.

4. Aplikasi dapat menerapkan metode clustering untuk mengelompokkan mahasiswa berdasarkan nilai magang dan job description secara manual. 5. Berdasarkan data yang diolah, didapatkan 3 kelompok dengan hasil sebagai

berikut :

a. Cluster 1 merupakan kelompok mahasiswa magang yang berpotensi berprestasi dengan nilai diatas >75 .

b. Cluster 2 merupakan kelompok mahasiswa magang yang berpotensi mengalami kesulitan dengan nilai antara 65>75 .

c. Cluster 3 merupakan kelompok mahasiswa magang yang berpotensi bermasalah dengan nilai diatas <65

5.2 Saran

Saran untuk aplikasi clustering magang mahasiswa adalah :

1. Aplikasi dapat menangani pengkategorian data mahasiswa magang dengan metode klasifikasi.

2. Aplikasi dapat menangani pengkategorian data mahasiswa magang dengan algoritma untuk data kategori jobdescription dan algoritma untuk data numerik.

(65)

DAFTAR PUSTAKA

Asroni dan Adrian, Ronald,2015,”Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang”,Jurnal Ilmiah Semesta Teknika Vol.18, No. 1, 76-82, Mei 2015.

Bayu, Muhammad,”Laporan Produktif”,2013

Kusrini dan Luthfi, Emha Taufiq,2009”Algoritma Data Mining”.Yogyakarta.C.V Andi

Lee S, Finn dan Santana, Juan,2010”Data Mining”.I.Jakarta.PT. Gramedia

Luthfi, Emha Taufiq and Kusrini,2009,”Algoritma Data Mining”.I.Yogyakarta. C.V Andi

Ong, Johan Oscar,2013,”Implementasi K-Means Clustering Untuk Menentukan Strategi Marketing President University” Jurnal Ilmiah Teknik Industri, Vol.12, No.1, Juni 2013.

Rachmansyah, dkk,”Penerapan Algoritma K-Means Untuk Clustering Dokumen

E-jurnal STMIK GI MDP”.

Simanjuntak, Elvis,”Sistem Informasi Pemasaran Berbasis Website Pada PT. Trimitra Sebagai Sarana Penjualan Produk Secara Online”,2014

(66)