i Universitas Kristen Maranatha
ABSTRAK
Analisis cluster merupakan salah satu metoda dalam data mining. Metoda ini menganalisis cluster atau kelompok yang terbentuk dari kumpulan instance data dalam sebuah dataset. Cluster terbentuk karena terdapat instance data yang memiliki kemiripan sifat atau berkaitan dengan instance data lainnya.
Graph-based clustering menganalisis cluster yang terbentuk dalam sebuah grafik dan
besaran yang dihasilkan. Studi kasus yang digunakan adalah data jadwal kuliah Fakultas Teknologi Informasi semester ganjil dan genap 2013/2014. Algoritma yang digunakan dalam melakukan graph-based clustering adalah algoritma simple
k-means. Analisis cluster menghasilkan pengelompokan atau cluster dalam data
jadwal kuliah berdasarkan jadwal, ruang, dan nilai. Hasil analisis cluster dapat digunakan untuk masa depan sebagai bahan pertimbangan seperti penyebaran jadwal yang lebih merata, penggunaan ruang yang lebih merata, dan pertimbangan pembuatan jadwal terhadap nilai.
ABSTRACT
Cluster analysis is one of the methods in data mining. This method analyzes the cluster or group that is formed from a collection of instance data in a dataset. Clusters are formed because there is an instance of data that has a similar of character or have associated with the other instance. Graph-based clustering is used to analyze clusters formed in a graph and the amount produced. The case study used in this project is the class scheduling in Faculty of Information Technology odd and even semester 2013/2014. The algorithm used in graph-based clustering is simple k-means. Cluster analysis produce clusters in the data schedule based on the schedule, room, and grade. Results of cluster analysis can be used for future consideration such as schedule deployment more equitable, room used more equitable, and creating a schedule based of the grade.
iii Universitas Kristen Maranatha
1.5. Sistematika Pembahasan ... 3
BAB II LANDASAN TEORI ... 4
BAB III ANALISIS DAN DISAIN ... 14
3.1. Analisis ... 14
3.2. Gambaran Keseluruhan ... 23
3.2.1. Persyaratan Antarmuka Eksternal ... 24
3.2.2. Antarmuka dengan Pengguna ... 24
3.2.3. Antarmuka Perangkat Keras ... 24
3.2.4. Antarmuka Perangkat Lunak ... 25
3.2.5. Fitur-fitur Produk Perangkat Lunak ... 26
3.2.5.1. Fitur Input Data ... 26
3.2.5.1.1. Tujuan ... 26
3.2.5.1.2. Urutan Respon ... 26
3.2.5.2. Fitur Simple K-means... 27
3.2.5.6.1. Tujuan ... 27
3.2.5.6.2. Urutan Respon ... 27
3.2.5.6.3. Persyaratan Fungsional yang Berhubungan ... 28
3.2.5.3. Fitur Parameter Data Mining ... 28
3.2.5.7.1. Tujuan ... 28
3.2.5.7.2. Urutan Respon ... 28
3.2.5.7.3. Persyaratan Fungsional yang Berhubungan ... 29
3.3. Disain Perangkat Lunak ... 29
3.3.1. Pemodelan Perangkat Lunak ... 30
3.3.1.1. Diagram Use Case ... 30
3.3.1.1.1. Use Case Input Data. ... 30
3.3.1.1.2. Use Case Simple K-Means. ... 31
3.3.1.1.3. Use Case Mengubah Parameter. ... 31
3.3.1.2. Diagram Activity ... 32
3.3.1.2.1. Diagram Activity Input Data. ... 32
3.3.1.2.2. Diagram Activity Simple K-means. ... 33
3.3.1.2.3. Diagram Activity Mengubah Parameter. ... 34
3.3.1.3. Diagram Kelas ... 35
BAB IV PENGEMBANGAN PERANGKAT LUNAK ... 37
4.1. Implementasi Graph-Based Clustering ... 37
4.1.1. Jadwal Ganjil 2013/2014 ... 40
4.1.2. Jadwal Genap 2013/2014 ... 50
4.1.3. Ruang Ganjil 2013/2014 ... 60
4.1.4. Ruang Genap 2013/2014 ... 72
4.1.5. Nilai Genap 2013/2014 ... 82
4.1.6. Kesimpulan Implementasi Jadwal Ganjil dan Genap 2013/2014... 91
4.1.7. Kesimpulan Implementasi Ruang Ganjil dan Genap 2013/2014 ... 92
4.1.8. Kesimpulan Implementasi Nilai Genap 2013/2014 ... 92
4.1.9. Kesimpulan Implementasi Perubahan Seed ... 92
4.2. Implementasi Class ... 93
v Universitas Kristen Maranatha
4.2.2. Implementasi Class GraphBasedView... 94
4.2.3. Implementasi Class GraphBasedThread ... 95
4.2.4. Implementasi Class Dataset ... 96
4.2.5. Implementasi Class Clustering ... 97
4.3. Implementasi Antarmuka ... 98
4.3.1. Implementasi Antarmuka Awal ... 99
4.3.2. Implementasi Antarmuka Input Data ... 99
4.3.3. Implementasi Antarmuka Clustering ... 100
4.3.4. Implementasi Antarmuka About ... 101
BAB V TESTING DAN EVALUASI SISTEM ... 102
5.1. Rencana Pengujian ... 102
5.2. Pelaksanaan Pengujian ... 102
5.2.1 . Black-Box Testing ... 102
5.2.2.1 Input File ... 102
5.2.2.2 Besaran Clustering ... 103
5.2.2.3 Grafik Clustering ... 103
5.2.2.4 Parameter Clustering ... 104
BAB VI KESIMPULAN DAN SARAN ... 105
6.1. Kesimpulan ... 105
6.2. Saran ... 106
DAFTAR PUSTAKA ... 107
DAFTAR GAMBAR
Gambar 2.1. Contoh Grafik K-means (Han, Kamber and Pei 2012). ... 8
Gambar 2.2. User Interface Weka. ... 9
Gambar 2.3. User Interface Weka Preprocessing. ... 10
Gambar 2.4. User Interface Weka Clustering. ... 11
Gambar 2.5. User Interface Weka Visualize Cluster Assignments. ... 11
Gambar 2.6. User Interface Weka Clusterer Visualize. ... 12
Gambar 3.1. Contoh Arff ... 22
Gambar 3.2. Diagram Use Case. ... 30
Gambar 3.3. Diagram Activity Input Data. ... 33
Gambar 3.5. Diagram Activity K-means. ... 34
Gambar 3.6. Diagram Activity Mengubah Parameter. ... 35
Gambar 3.7. Diagram Kelas. ... 36
Gambar 4.1. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap Hari Text. ... 40
Gambar 4.2. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Jam. ... 41
Gambar 4.3. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap Hari Text. ... 42
Gambar 4.4. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Jam. ... 43
Gambar 4.5. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 10 Terhadap Hari Text. ... 44
Gambar 4.6. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 10 Terhadap Kode Jam. ... 44
Gambar 4.7. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 10 Terhadap Hari Text. ... 45
vii Universitas Kristen Maranatha
Gambar 4.9. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 15 Terhadap
Hari Text. ... 47
Gambar 4.10. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 15
Terhadap Kode Jam... 47
Gambar 4.11. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 15
Terhadap Hari Text. ... 48
Gambar 4.12. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 15
Terhadap Kode Jam... 49
Gambar 4.13. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Hari Text. ... 50
Gambar 4.14. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Kode Jam. ... 51
Gambar 4.15. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap
Hari Text. ... 52
Gambar 4.16. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap
Kode Jam. ... 52
Gambar 4.17. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 10
Terhadap Hari Text. ... 54
Gambar 4.18. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 10
Terhadap Kode Jam... 54
Gambar 4.19. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 10
Terhadap Hari Text. ... 56
Gambar 4.20. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 10
Terhadap Kode Jam... 56
Gambar 4.21. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 15
Terhadap Hari Text. ... 57
Gambar 4.22. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 15
Terhadap Kode Jam... 58
Gambar 4.23. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 15
Terhadap Hari Text. ... 59
Gambar 4.24. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 15
Gambar 4.25. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Kode Jam. ... 61
Gambar 4.26. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Kode Kapasitas... 62
Gambar 4.27. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap
Kode Jam. ... 63
Gambar 4.28. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap
Kode Kapasitas... 64
Gambar 4.29. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 10
Terhadap Kode Jam... 65
Gambar 4.30. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 10
Terhadap Kode Kapasitas. ... 66
Gambar 4.31. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 10
Terhadap Kode Jam... 67
Gambar 4.32. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 10
Terhadap Kode Kapasitas. ... 68
Gambar 4.33. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 15
Terhadap Kode Jam... 69
Gambar 4.34. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 15
Terhadap Kode Kapasitas. ... 70
Gambar 4.35. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 15
Terhadap Kode Jam... 71
Gambar 4.36. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 15
Terhadap Kode Kapasitas. ... 72
Gambar 4.37. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Kode Jam. ... 73
Gambar 4.38. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Kode Kapasitas... 73
Gambar 4.39. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap
Kode Jam. ... 74
Gambar 4.40. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap
ix Universitas Kristen Maranatha
Gambar 4.41. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 10
Terhadap Kode Jam... 76
Gambar 4.42. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 10
Terhadap Kode Kapasitas. ... 76
Gambar 4.43. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 10
Terhadap Kode Jam... 77
Gambar 4.44. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 10
Terhadap Kode Kapasitas. ... 78
Gambar 4.45. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 15
Terhadap Kode Jam... 79
Gambar 4.46. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 15
Terhadap Kode Kapasitas. ... 80
Gambar 4.47. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 15
Terhadap Kode Jam... 81
Gambar 4.48. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 15
Terhadap Kode Kapasitas. ... 81
Gambar 4.49. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Kode Kualifikasi. ... 82
Gambar 4.50. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap
Cluster. ... 83
Gambar 4.51. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap
Kode Kualifikasi. ... 84
Gambar 4.52. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap
Cluster. ... 84
Gambar 4.53. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 10 Terhadap
Kode Kualifikasi. ... 85
Gambar 4.54. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 10 Terhadap
Cluster. ... 86
Gambar 4.55. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 10 Terhadap
Kode Kualifikasi. ... 87
Gambar 4.56. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 10 Terhadap
Gambar 4.57. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 15 Terhadap
Kode Kualifikasi. ... 89
Gambar 4.58. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 15 Terhadap Cluster. ... 89
Gambar 4.59. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 15 Terhadap Kode Kualifikasi. ... 90
Gambar 4.60. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 15 Terhadap Cluster. ... 91
Gambar 4.61. Implementasi Class GraphBased. ... 93
Gamabr 4.62. Implementasi Class GraphBasedView. ... 94
Gambar 4.63. Implementasi Class GraphBased Thread. ... 95
Gambar 4.64. Implementasi Class Dataset. ... 96
Gambar 4.65. Implementasi Class Clustering. ... 98
Gambar 4.66. Implementasi Antarmuka Awal ... 99
Gamabr 4.67. Impementasi Antarmuka Preprocessing ... 100
Gambar 4.68. Implementasi Antarmuka Clustering. ... 100
xi Universitas Kristen Maranatha
DAFTAR TABEL
Tabel 2.1. Library Weka. ... 12
Tabel 3.1. Tabel Atribut ... 15
Tabel 3.2. Tabel Dataset... 16
Tabel 3.3. Tabel Atribut ... 17
Tabel 3.4. Tabel Atribut yang Dipertahankan ... 18
Tabel 3.5. Pemodelan Jam ... 19
Tabel 3.6. Pemodelan Kapasitas ... 20
Tabel 3.7. Pemodelan Dosen ... 20
Tabel 3.8. Pemodelan Jenis Mata Kuliah ... 20
Tabel 3.9. Pemodelan Kualifikasi Mata Kuliah ... 21
Tabel 3.10. Pengkodean Nilai Huruf ke Angka. ... 21
Tabel 3.11. Pengkodean Nilai Angka ke Nominal. ... 21
Tabel 3.12. Deskripsi Use Case Input Data. ... 31
Tabel 3.14. Deskripsi Use Case Simple K-Means ... 31
Tabel 3.15. Deskripsi Use Case Mengubah Parameter. ... 32
Tabel 4.1. Implementasi Jadwal Ganjil 2013/2014. ... 37
Tabel 4.2. Implementasi Jadwal Genap 2013/2014. ... 38
Tabel 4.3. Implementasi Ruang Ganjil 2013/2014. ... 38
Tabel 4.4. Implementasi Ruang Genap 2013/2014. ... 39
Tabel 4.5. Implementasi Nilai Genap 2013/2014. ... 39
Tabel 4.6. Cluster Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 5... 40
Tabel 4.7. Cluster Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 5... 41
Tabel 4.8. Cluster Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 10... 43
Tabel 4.9. Cluster Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 10... 45
Tabel 4.10. Cluster Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 15. ... 46
Tabel 4.11. Cluster Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 15. ... 48
Tabel 4.12. Cluster Jadwal Genap dengan Jumlah Cluster 3 dan Seed 5. ... 50
Tabel 4.13. Cluster Jadwal Genap dengan Jumlah Cluster 5 dan Seed 5. ... 51
Tabel 4.15. Cluster Jadwal Genap dengan Jumlah Cluster 5 dan Seed 10. ... 55
Tabel 4.16. Cluster Jadwal Genap dengan Jumlah Cluster 3 dan Seed 15. ... 57
Tabel 4.17. Cluster Jadwal Genap dengan Jumlah Cluster 5 dan Seed 15. ... 59
Tabel 4.18. Cluster Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 5. ... 61
Tabel 4.19. Cluster Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 5. ... 62
Tabel 4.20. Cluster Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 10. ... 64
Tabel 4.21. Cluster Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 10. ... 66
Tabel 4.22. Cluster Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 15. ... 68
Tabel 4.23. Cluster Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 15. ... 70
Tabel 4.24. Cluster Ruang Genap dengan Jumlah Cluster 3 dan Seed 5. ... 72
Tabel 4.25. Cluster Ruang Genap dengan Jumlah Cluster 5 dan Seed 5. ... 74
Tabel 4.26. Cluster Ruang Genap dengan Jumlah Cluster 3 dan Seed 10. ... 75
Tabel 4.27. Cluster Ruang Genap dengan Jumlah Cluster 5 dan Seed 10. ... 77
Tabel 4.28. Cluster Ruang Genap dengan Jumlah Cluster 3 dan Seed 15. ... 79
Tabel 4.29. Cluster Ruang Genap dengan Jumlah Cluster 5 dan Seed 15. ... 80
Tabel 4.30. Cluster Nilai Genap dengan Jumlah Cluster 3 dan Seed 5. ... 82
Tabel 4.31. Cluster Nilai Genap dengan Jumlah Cluster 5 dan Seed 5. ... 83
Tabel 4.32. Cluster Nilai Genap dengan Jumlah Cluster 3 dan Seed 10. ... 85
Tabel 4.33. Cluster Nilai Genap dengan Jumlah Cluster 5 dan Seed 10. ... 87
Tabel 4.34. Cluster Nilai Genap dengan Jumlah Cluster 3 dan Seed 15. ... 88
Tabel 4.35. Cluster Nilai Genap dengan Jumlah Cluster 5 dan Seed 15. ... 90
Tabel 5.3. Pengujian Input File. ... 103
Tabel 5.4. Pengujian Besaran Clustering. ... 103
Tabel 5.5. Pengujian Grafik Clustering. ... 104
1 Universitas Kristen Maranatha
BAB I
PENDAHULUAN
1.1. Latar Belakang
Perkembangan yang pesat dalam teknologi pengumpulan dan
penyimpanan data membuat data yang cukup besar dapat terakumulasi dengan
mudah. Mengambil informasi yang berguna dari data tersebut pun menjadi hal
yang sangat menantang. Teknik atau alat tradisional dalam mengolah data juga
tidak dapat digunakan karena besarnya ukuran dari kumpulan data. Banyak data
tersimpan dalam berbagai bidang seperti bisnis, obat-obatan, dan ilmu
pengetahuan.
Data mining diperlukan untuk melakukan pengolahan data dengan jumlah
yang banyak dan besar. Data mining adalah teknologi yang menyatukan teknik
tradisional dalam menganalisis data dengan algortima yang canggih untuk
memproses data (Tan, Steinbach and Kumar 2006). Data mentah yang jumlahnya
banyak dan besar tidak hanya didiamkan, tetapi melalui proses data mining data
tersebut dapat menghasilkan informasi yang berguna. Data mining membuka
kesempatan mengetahui sesuatu yang baru dari data yang lama, dengan cara yang
baru.
Metode graph-based clustering adalah salah satu metode data mining yang
fleksibel. Metode ini dapat digunakan untuk data yang sifatnya tidak teratur atau
bahkan data yang teratur, untuk data yang memiliki kesamaan atau tidak memiliki
kesamaan antara satu dengan yang lainnya (Tan, Steinbach and Kumar 2006).
Dataset yang memiliki hubungan antar instance salah satunya adalah data
jadwal. Data jadwal memiliki hubungan dari segi waktu dan tempat. Data jadwal
dapat difokuskan lagi kedalam berbagai macam data salah satunya adalah data
penjadwalan kuliah. Data penjadwalan kuliah adalah data jadwal setiap mata
kuliah yang ada pada periode tertentu. Data tersebut menyediakan hari dan jam
dimana mata kuliah akan dijalankan, dosen yang mengajar, tempat, dan informasi
lain seperti jumlah sks setiap mata kuliah, semester mata kuliah, dan jenis mata
2
kuliah. Hasil clustering dapat melihat pengelompokan yang terjadi terhadap
jadwal dan juga ruangan. Hasil tersebut dapat digunakan untuk pengambilan
keputusan di masa depan dalam pembuatan jadwal kuliah.
1.2. Rumusan Masalah
Berdasarkan latar belakang yang terjadi maka dapat diambil dua rumusan
masalah dalam penelitian ini. Rumusan masalah tersebut adalah:
1. Bagaimana melakukan analisis data mining menggunakan graph-based
clustering dengan algoritma simple k-means.
2. Bagaimana implementasi perangkat lunak untuk melakukan data mining
dengan graph-based clustering dengan algoritma simple k-means.
1.3. Tujuan
Berdasarkan rumusan masalah yang ada maka dapat diambil dua tujuan
dari penelitian ini. Tujuan tersebut adalah:
1. Melakukan analisis graph-based clustering terhadap kelompok data
menggunakan algoritma simple k-means dengan perubahan parameter seed
dan jumlah cluster.
2. Implementasi perangkat lunak untuk melakukan data mining dengan
graph-based clustering menggunakan algoritma simple k-means.
1.4. Batasan Masalah
Penelitian data mining menggunakan metode graph-based clustering ini
perlu dibatasi agar tidak meluas. Batasan dari penelitian ini diantaranya adalah:
1. Aplikasi memproses file data dengan format .arff dan .csv.
2. Aplikasi melakukan proses data mining dengan graph-based clustering tanpa
memperhitungkan waktu pemrosesan.
3. Aplikasi menggunakan library Weka.
4. Aplikasi melakukan analisis cluster terhadap data jadwal perkuliahan Fakultas
Teknologi Indormasi Semester Genap 2013/2014 dan Semester Ganjil
3
Universitas Kristen Maranatha
1.5. Sistematika Pembahasan
Laporan penelitian mengenai graph-based clustering ini dibagi menjadi ke
dalam enam bab besar. Setiap bab terbagi kedalam beberapa sub bab. Sistematika
pembagian bab tersebut adalah:
Bab I adalah bab pendahuluan. Bab ini membahas latar belakang
pembuatan penelitian data mining menggunakan graph-based clustering,
masalah-masalah yang diangkat, tujuan dari penelitian, batasan dari penelitian,
dan sistematika laporan penelitian.
Bab II adalah bab landasan teori. Bab ini memberikan informasi teori yang
digunakan dalam penelitian. Teori analisis maupun implementasi. Bab ini
memberikan informasi teori analisis mengenai data mining, apa itu data mining,
data, clustering, graph-based clustering, dan Weka.
Bab III adalah bab analisis dan disain. Bab ini menjabarkan analisis
mengenai graph-based clustering dan disain perancangan aplikasi. Bab ini terdiri
dari analisis proses graph-based clustering, gambaran dari antarmuka aplikasi,
antarmuka perangkat keras, antarmuka perangkat lunak, disain penyimpanan data,
dan disain antarmuka aplikasi.
Bab IV adalah bab pengembangan perangkat lunak. Bab ini menjabarkan
implementasi dari perangkat lunak yang dibuat dalam penelitian. Bab ini terdiri
dari implementasi class, implementasi penyimpanan data, dan implementasi
antarmuka aplikasi.
Bab V adalah bab testing dan evaluasi sistem. Bab ini melakukan testing
terhadap aplikasi yang dibuat. Bab ini terdiri dari rencana pengujian yang akan
dilakukan terhadap aplikasi dan pelaksanaan pengujian dengan metode white box
dan black box testing.
Bab VI adalah bab kesimpulan dan saran. Bab terakhir ini akan membahas
kesimpulan yang dihasilkan dari penelitian ini dan saran untuk pengembangan
BAB VI
KESIMPULAN DAN SARAN
Bab VI berisi kesimpulan dan saran dari hasil penelitian. Bab ini
memberikan kesimpulan terhadap hasil penelitian dari keseluruhan bab yang ada.
Bab ini juga memberikan saran terhadap pengembangan penelitian.
6.1. Kesimpulan
Kesimpulan dari hasil penelitian untuk menganalisis data jadwal kuliah
Fakultas Teknologi Informasi Semester Ganjil dan Genap 2013/2014
menggunakan graph-based clustering terdapat dalam lima point. Kesimpulan
tersebut adalah:
1. Pada Semester Ganjil 2013/2014 terdapat banyak mata kuliah dengan
kualifikasi Utama dan Khusus pada hari Senin hingga Jumat seperti
ditunjukkan pada tabel 4.9 sedangkan pada Semester Genap 2013/2014
terdapat banyak mata kuliah dengan kualifikasi Utama dan Pemprograman
pada hari Senin, Selasa, dan Rabu seperti ditunjukkan pada tabel 4.15.
2. Terdapat kekosongan penggunaan ruang pada hari Kamis jam 09.30 – 12.00,
Jumat jam 09.30 – 15.00, dan Sabtu jam 17.30 – 22.30 pada pemakaian Ruang
baik untuk Ganjil dan Genap 2013/2014. Gambar 3.31 dan 4.43 menunjukkan
grafik hasil clustering terhadap pemakaian Ruang pada Semester Ganjil dan
Genap 2013/2014.
3. Terdapat penggunaan ruang dengan kapasitas kecil pada Semester Ganjil
2013/2014 seperti ditunjukkan pada gambar 4.32. Berbeda dengan Semester
Ganjil 2013/2014, Semester Genap 2013/2014 tidak terdapat penggunaan
ruang dengan kapasitas kecil seperti ditunjukkan pada gambar 4.44.
4. Mata kuliah pemprograman yang diadakan pada hari Senin jam 12.30 hingga
15.00 cenderung memiliki nilai yang kurang seperti ditunjukkan pada tabel
4.33 pada cluster 3. Mata kuliah pemprograman yang diadakan pada hari Rabu
106
Universitas Kristen Maranatha
5. Pengembangan perangkat lunak menggunakan PHP dan Java dapat dilakukan
dengan menggunakan PHP dengan versi 5 ke atas yang sudah mendukung
pemprograman berorientasi objek dan dengan server yang mendukung Java
seperti Tomcat.
6.2. Saran
Penelitian untuk menganalisis data jadwal menggunakan graph-based
clustering ini masih dapat dikembangkan dan terus berkembang.
Algoritma-algoritma data mining untuk graph-based clustering pun terus dikembangkan.
Pengembangan dapat dilakukan dengan berbagai cara. Saran-saran untuk
pengembangan penelitian ini adalah:
1. Penelitian dapat dikembangkan menggunakan algoritma-algoritma
graph-based clustering lain. Penelitian menggunakan algoritma-algoritma yang lain
akan menguatkan hasil penelitian untuk menarik kesimpulan yang lebih
matang.
2. Penelitian dapat dikembangkan menggunakan sampel data atau dataset yang
berbeda menggunakan graph-based clustering. Penelitian menggunakan
dataset yang berbeda. Dataset dengan jenis yang berbeda memungkinkan
memperoleh hasil yang hasil yang lebih maksimal dengan graph-based
clustering.
3. Pengembangan perangkat lunak. Perangkat lunak dapat dikembangkan dengan
menambahkan algoritma lain dalam graph-based clustering atau metode lain
DAFTAR PUSTAKA
Han, Jiawei, Micheline Kamber, and Jian Pei. Data Mining Concepts and
Techniques. USA: Elsevier Inc., 2012.
Hermawati, Astuti Fajar. Data Mining. Yogyakarta: CV Andi Offset, 2013.
Prasetyo, Eko. Data Mining - Mengolah Data Menjadi Informasi Menggunakan
Matlab. Yogyakarta: CV. Andi Offset, 2014.
Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar. Introduction To Data
Mining. Boston: Pearson Education, Inc., 2006.
Widodo, Prabowo Pudjo, Rahmadya Trias Handayanto, and Herlawati. Penerapan
Data Mining dengan Matlab. Bandung: Rekayasa Sains, 2013.
Witten, Ian H, Eibe Frank, and Mark A Hall. Data Mining Practical Machine