i SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Program Studi Teknik Informatika
Oleh:
Hertartik Clarasita Devy NIM : 065314080
JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA YOGYAKARTA
ii
CLUSTERING THE RESULTS OF LEARNING EVALUATION USING K-MEANS CLUSTERING METHOD
A CASE STUDY IN THE FACULTY OF SCIENCE AND TECHNOLOGY OF SANATA DHARMA UNIVERSITY
THESIS
Presented as Partial Fulfillment Of The Requirements To Obtain The Sarjana Teknik Degree
In Informatics Engineering Study Program
Hertartik Clarasita Devy Student ID : 065314080
INFORMATICS ENGINEERING DEPARTMENT FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERCITY YOGYAKARTA
v
“Usaha dan kerja keras adalah modal untuk maju”
vi
vii
STUDI KASUS DI FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA
Pusat Pengembangan dan Penjaminan Mutu Pembelajaran Universitas Sanata Dharma (P3MP) setiap akhir semester melaksanakan evaluasi pembelajaran matakuliah-matakuliah. Evaluasi dilakukan dengan kuesioner yang diisi mahasiswa. Kuesioner memuat 18 pertanyaan dengan skala penilaian antara1 sampai 7.
Dalam tugas akhir ini, penulis mengelompokkan data hasil evaluasi pembelajaran matakuliah-matakuliah di prodi-prodi Fakultas Sains dan Teknologi pada semester gasal 2008/2009 dan semester genap 2008/2009 kedalam kelompok-kelompok dengan hasil evaluasi yang mirip. Pengelompokan dilakukan dengan metode K-Means clustering. Metode K-Means clustering
mengelompokkan data-data berdasarkan jarak tiap data dengan centroid.
viii
ABSTRACT
CLUSTERING THE RESULTS OF LEARNING EVALUATION USING K-MEANS CLUSTERING METHOD
A CASE STUDY IN THE FACULTY OF SCIENCE AND TECHNOLOGY OF SANATA DHARMA UNIVERSITY
At the end of each semester, The Center of Development and Learning Quality Assurance of Sanata Dharma University evaluates each course learning. Evaluation was performed using questionnaires filled in by students. The questionnaire consist of 18 questions with a rating scale between 1 up to 7.
In this thesis, the author cluster the results of learning evaluation of all departments in the Faculty of Science and Technology of Sanata Dharma University into groups with similar evaluation results. The data was taken from odd and even semester 2008/2009. The clustering was done by using K-Means clustering method. K-Means clustering method groups data based on the distance of each data with the centroid.
x
KATA PENGANTAR
Puji syukur penulis panjatkan atas Kehadirat Tuhan YME, yang telah melimpahkan rahmat dan berkatNya sehingga penulis dapat menyelesaikan tugas akhir yang berjudul PENGELOMPOKAN HASIL EVALUASI PEMBELAJARAN MENGGUNAKAN METODE KLASTERING K-MEANS STUDI KASUS DI FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelar sarjana program studi Teknik Informatika, Fakultas Sains dan Teknologi Universitas Sanata Dharma.
Dalam kesempatan ini, penulis mengucapkan terimakasih yang sebesar-besarnya kepada :
1. Ibu P.H. Prima Rosa, S.Si., M.Sc., selaku dosen pembimbing, terimakasih atas segala bimbingan, kritik, saran dan kesabarannya dalam mengarahkan dan membimbing penulis dalam menyelesaikan tugas akhir ini.
2. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T., selaku kaprodi Teknik Informatika.
3. Ibu Ridowati Gunawan, S.Kom., M.T. dan Ibu Sri Hartati Wijono, S.Si, M.Kom., selaku dosen penguji.
4. Seluruh staff pengajar Prodi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma.
xi
7. Teman-teman prodi Teknik Informatika angkatan 2006, atas kebersamaanya selama penulis menjalani masa studi.
8. Serta semua pihak yang tidak dapat disebutkan satu-persatu yang telah membantu penulis dalam menyelesaikan tugas akhir ini.
Penulis menyadari bahwa tugas akhir ini jauh dari sempurna, oleh karena itu kritik dan saran yang sifatnya membangun sangat penulis harapkan.
Yogyakarta, 19 Juli 2010
xii Daftar Isi
Halaman
HALAMAN JUDUL ……….………. i
HALAMAN JUDUL (bahasa Inggris)……….………. ii
HALAMAN PERSETUJUAN ……… iii
HALAMAN PENGESAHAN ……… iv
HALAMAN PERSEMBAHAN ……….……… v
PERNYATAAN KEASLIAN KARYA ……….………… vi
ABSTRAK……… vii
ABSTRACT ……… viii
PERNYATAAN PERSETUJUAN PUBLIKASI ………. ix
KATA PENGANTAR ………. x
Daftar Isi ………. xii
Daftar Gambar ……….………… xvi
Daftar Tabel ……… xx
Bab I. Pendahuluan ……….………… 1
1.1. Latar Belakang ………..… 1
1.2. Rumusan Masalah ……….... 2
1.3. Tujuan dan Manfaat ……….…. 2
1.4. Batasan Masalah ………..…. 2
1.5. Metodologi Penelitian ……….…. 3
1.6. Sistematika Penulisan ………..…. 4
Bab II. Landasan Teori ………..…. 5
xiii
2.4.1. Euclidean (L2-norm)……….…….. 10
2.5. Sum Of Squared-error (SSE) ……….. 11
2.6. Contoh kasus K-Means ……….…… 11
2.6.1. Contoh kasus K-Means Tanpa SSE …………..…… 12
2.6.2. Contoh kasus K-Means Menggunakan SSE ….……. 17
Bab III. Analisis dan Perancangan Sistem ……….……… 22
3.1. Identifikasi dan Analisis Sistem……… 22
3.2. Perancangan Sistem ………..……… 23
3.2.1. Input ……….………. 23
3.2.2. Pemrosesan Awal Data……….…….. 27
3.2.3. Proses ………. 28
3.2.4. Output………. 29
3.3. Perancangan ……….……… 31
3.3.1 Diagram Konteks ………... 31
3.3.2 Diagram Use Case ……….…….…………... 32
3.3.3 Diagram Aktivitas ………..………... 46
3.3.4 Diagram Kelas ………..….... 53
3.3.5 Algoritma Method Dalam Setiap Kelas…………... 56
3.3.6 Diagram Sequence ………..………... 66
3.4. Desain Antar Muka Pengguna ……….…. 72
xiv
3.4.2 Desain Pengelompokan Data ………. 73
3.4.3 Desain Hasil Pengelompokan Data …………..……. 74
3.4.4 Desain Antar Muka Pie Chart Persentase Klaster …. 75 3.4.5 Desain Detail Anggota Setiap Klaster……… 76
3.4.6 Desain Antar Muka Pie Chart Persentase Prodi Setiap Klaster ………..………….. 77
3.4.7 Desain Antar Muka Detail Data Hasil Evaluasi Seiap Data ……….………….…. 78
3.4.8 Desain Petunjuk Penggunaan ………..……..… 78
Bab IV. Implementasi ……… 80
4.1. Implementasi Antar Muka Pengguna……… 80
4.1.1 Antar Muka Menu Utama Program ………..…. 80
4.1.2 Antar Muka Pemilihan File Data ………..…. 81
4.1.3 Antar Muka Pengelompokan……….…. 82
4.1.4 Antar Muka Detail Data Setiap Klaster ……… 84
4.1.5 Antar Muka Detail Hasil Evaluasi Setiap Data ……. 86
4.1.6 Antar Muka Bantuan ………..….…. 88
4.2. Program Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran ………..…….…… 88
4.2.1 Membaca Data dari File xls ……….……….… 88
4.2.2 Membuat Klaster ……….…….… 92
4.2.3 Mendeklarasikan Centroid Awal ……….…………. 93
xv
4.2.6.2 Menghitung Centroid beserta SSE …….… 97
4.2.7 Pemberian Label Klaster ………..…. 99
4.2.8 Validasi Hasil Pengelompokan ……….……… 101
4.2.9 Pengurutan Data di Setiap Klaster ………. 102
4.2.10 Menampilkan Grafik ……….……… 103
4.2.11 Menghitung Rata-Rata Kategori Setiap Data ……… 105
4.2.12 Menyimpan Hasil Pengelompokan ……… 106
4.3. Uji Percobaan ……… 108
Bab V. Kesimpulan dan Saran ……… 115 Daftar Pustaka
xvi Daftar Gambar
Gambar 2.1. Tahap-tahap Data Mining ... 5
Gambar 2.2. Pengelompokan Obyek Menggunakan K-Means Clustering ... 9
Gambar 2.3. Koordinat Data Obat ... 12
Gambar 2.4. Koordinat obat iterasi ke-0 ... 13
Gambar 2.5. Koordinat obat iterasi ke-1 ... 15
Gambar 2.6. Koordinat obat iterasi ke-2 ... 16
Gambar 3.1. Diagram Konteks ... 31
Gambar 3.2. Diagram Use Case ... 32
Gambar 3.3. Diagram Aktivitas Memilih File Data ... 46
Gambar 3.4. Diagram Aktivitas Mengelompokkan Data ... 47
Gambar 3.5. Diagram Aktivitas Melihat Detail Anggota Setiap Klaster ... 48
Gambar 3.6. Diagram Aktivitas Melihat Detail Data Hasil Evaluasi Setiap Data ... 48
Gambar 3.7. Diagram Aktivitas Melihat Rata-Rata Data Setiap Kategori ... 49
xvii
Gambar 3.11. Diagram Aktivitas Mengurutkan Klaster
Berdasarkan Centroid ... 51
Gambar 3.12. Diagram Aktivitas Mengurutkan Data Dalam Klaster ... 52
Gambar 3.13. Diagram Kelas Keseluruhan ... 53
Gambar 3.14. Diagram Kelas ... 54
Gambar 3.15. Diagram Kelas Lanjutan ... 55
Gambar 3.16. Diagram Sequence Memilih File Data ... 66
Gambar 3.17. Diagram Sequence Mengelompokkan Data ... 67
Gambar 3.18. Diagram Sequence Melihat Detail Anggota Setiap Klaster ... 68
Gambar 3.19. Diagram Sequence Melihat Detail Data Hasil Evaluasi Setiap Data ... 68
Gambar 3.20. Diagram Sequence Melihat Rata-Rata Data Setiap Kategori .. 69
Gambar 3.21. Diagram Sequence Melihat Grafik Presentase Anggota Setiap Klaster ... 70
Gambar 3.22. Diagram Sequence Melihat Grafik Presentase Prodi ... 70
xviii
Gambar 3.24. Diagram Sequence Mengurutkan Klaster
Berdasarkan Centroid ... 71
Gambar 3.25. Diagram Sequence Mengurutkan Klaster Dalam Klaster ... 72
Gambar 3.26. Desain Antar Muka Menu utama ... 73
Gambar 3.27. Desain Antar Muka Submenu ... 73
Gambar 3.28. Desain Antar Muka Pengelompokan Data ... 74
Gambar 3.29. Desain Antar Muka Hasil Pengelompokan Data ... 75
Gambar 3.30. Desain Antar Muka Pie Chart Persentase Klaster ... 76
Gambar 3.31. Desain Antar Muka Hasil Pengelompokan Data Setiap Klaster ... 77
Gambar 3.32. Desain Antar Muka Pie Chart Persentase Prodi Setiap Klaster ... .. 77
Gambar 3.33. Desain Antar Muka Detail Data Hasil Evaluasi Setiap Data ... 78
Gambar 3.34. Desain Antar Muka Bantuan Petunjuk Penggunaan ... 79
Gambar 4.1. Antar Muka Menu Utama ... 80
Gambar 4.2. Antar Muka Input Data ... 81
xix
Gambar 4.6. Antar Muka Detail Anggota Setiap Klaster ... 84
Gambar 4.7. Antar Muka Pie Chart Persentase Prodi Setiap Klaster ... 84
Gambar 4.8. Antar Muka Lihat Detail Hasil Evaluasi Setiap Data ... 86
Gambar 4.9. Antar Muka Input Dialog Jumlah Kategori ... 86
xx Daftar Tabel
Tabel 2.1. Data Obat ... 12
Tabel 2.2. Hasil Pengelompokkan Obat dengan K-Means ... 17
Tabel 3.1. Pedoman Label Output P3MP ... 22
Tabel 3.2. Atribut Tabel Hasil Evaluasi ... 23
Tabel 3.3. Urutan Kolom Data Hasil Evaluasi ... 26
Tabel 3.4. Detail Algoritma Method Kelas InputData ... 56
Tabel 3.5. Detail Algoritma Method Kelas Pengelompokan ... 56
Tabel 3.6. Detail Algoritma Method Kelas DetailDataSetiapKlaster ... 62
Tabel 3.7. Detail Algoritma Method Kelas DetailHasilEvaluasiSetiapData ... 64
Tabel 3.8. Detail Algoritma Method Kelas PieChart ... 65
Tabel 4.1. Hasil Percobaan ... 108
Tabel 4.2. Analisis Predikat Data NIP 87 ... 111
Tabel 4.3. Analisis Predikat Data NIP 64 ... 113
1 1.1. Latar Belakang
Universitas Sanata Dharma (USD) merupakan suatu perguruan tinggi swasta di Yogyakarta yang memiliki sebuah lembaga bernama Pusat Pengembangan dan Penjaminan Mutu Pembelajaran (P3MP). P3MP memiliki tugas untuk menjaga kestabilan kualitas pembelajaran, mengelola komponen pengembangan dan penjaminan mutu pembelajaran, serta mengelola kegiatan peningkatan mutu pembelajaran di USD. Salah satu program yang dilaksanakan P3MP adalah melaksanakan evaluasi kegiatan belajar mengajar di akhir semester. Evaluasi mencakup tiga kategori, yaitu kinerja dosen, konstribusi mahasiswa dan kepuasan mahasiswa terhadap suatu matakuliah. Evaluasi dilakukan dengan kuesioner yang diisi mahasiswa, berjumlah 18 pertanyaan dengan skor penilaian berupa bilangan bulat antara 1 sampai dengan 7.
2
meningkatkan kualitas pembelajaran di USD secara berkelanjutan.
Dalam tugas akhir ini penulis bermaksud memanfaatkan data-data hasil evaluasi pembelajaran matakuliah-matakuliah yang diselenggarakan oleh prodi-prodi di lingkungan Fakultas Sains dan Teknologi (FST). Pengelompokan menggunakan metodeklastering K-Means.
1.2. Rumusan Masalah
Dari latar belakang masalah di atas dapat dirumuskan masalah :
Bagaimana mengelompokkan hasil evaluasi pembelajaran matakuliah-matakuliah di FST USD kedalam kelompok-kelompok dengan hasil evaluasi yang mirip dengan menggunakan metode klastering K-Means? 1.3. Tujuan dan Manfaat
Tujuan
Mengelompokkan hasil evaluasi pembelajaran matakuliah-matakuliah di FST USD.
Manfaat
Hasil pengelompokan dapat digunakan sebagai bahan pertimbangan bagi prodi maupun P3MP untuk melakukan pendampingan terhadap para dosen dalam aspek proses belajar mengajar dan memfasilitasi terjadinya sharing pengalaman antar kelompok.
1.4. Batasan Masalah
Dalam mengelompokkan matakuliah berdasarkan kinerja dosen, kontribusi mahasiswa dan kepuasan mahasiswa, dilakukan beberapa batasan sebagai berikut
1. Metode yang digunakan adalah metode klastering K-Means.
pada semester gasal 2008/2009 dan genap 2008/2009.
3. Pengelompokan berdasarkan rata-rata jawaban semua responden untuk setiap pertanyaan yang termuat di kuesioner yaitu pertanyaan nomor 1 sampai 18.
4. Pelabelan klaster hasil klastering didasarkan pada ketentuan pelabelan yang berlaku di P3MP yaitu sangat tinggi, tinggi, cukup, rendah dan sangat rendah.
5. Sistem hanya dapat memproses data input yang berasal dari file xls. 6. Sistem tidak menyediakan fasilitas preprocessing data.
1.5. Metodologi Penelitian
Metode penelitian dilakukan dengan teknik data mining, yaitu :
1. Pembersihan data, yaitu menghilangkan noise dan data yang tidak konsisten.
2. Integrasi data, yaitu menggabungkan bermacam-macam data storage.
3. Seleksi data, yaitu mengambil data yang relevan dari database.
4. Tranformasi data, yaitu mentransformasikan data ke dalam bentuk yang tepat untuk diolah.
5. Penambangan data
Proses pokok mengimplemetasikan metode yang sesuai untuk mengetahui pola. Metode yang digunakan adalahklastering K-Means. 6. Evaluasi pola, yaitu mengidentifikasi pola-pola didasarkan pada
pengukuran yang menarik.
4
untuk menyajikan informasi hasil penambangan kepada pengguna. 1.6. Sistematika Penulisan
Adapun sistematika penulisan Tugas akhir adalah sebagai berikut : 1. Halaman Judul
2. Abstrak, berisi tentang rangkuman Tugas Akhir. 3. Daftar Isi
4. Bab I Pendahuluan
Pendahuluan berisi tentang latar belakang, rumusan masalah, tujuan dan manfaat, batasan masalah, metodologi penelitian dan sistematika penulisan.
5. Bab II Landasan Teori
Landasan teori berisi tentang teori yang akan digunakan dalam penulisan Tugas Akhir.
6. Bab III Analisis dan Perancangan Sistem
Analisis dan perancangan sistem berisi tentang identifikasi dan analisis sistem, perancangan sistem.
7. Bab IV Implementasi Program
Implementasi Program berisi implementasi program dan analisis hasil. 8. Bab V Kesimpulan dan Saran
5
2.1 Penambangan Data
Penambangan data (data mining) menarik perhatian dalam bidang industri
dan kalangan masyararakat pada umumnya. Penambangan data berkenaan dengan
pengolahan data dalam skala besar supaya menjadi informasi maupun
pengetahuan yang berguna. Penambangan data yang sering juga disebut
knowledge discovery in database (KDD) merupakan kegiatan pengumpulan data,
pemakaian data historis untuk menemukan keteraturan, pola atau hubungan data
dalam ukuran data yang besar (Santosa, 2007). Penambangan data dapat
digambarkan dalam gambar 2.1 yang terdiri dari langkah-langkah berikut :
Gambar 2.1. Tahap-tahap Data Mining
6
1. Pembersihan data
Dalam pembersihan data dilakukan pengapusan noise dan data yang tidak
konsisten.
2. Integrasi data
Dalam langkah ini dilakukan penggabungan beberapa data storage.
3. Seleksi data
Yaitu mengambil data yang relevan dari basis data.
4. Transformasi data
Mentransformasikan data ke dalam bentuk yang tepat untuk diolah,
dengan meringkas atau operasi agregasi.
5. Penambangan data
Sebuah proses esensial dimana metode yang tepat diaplikasikan untuk
mengekstrak pola data.
6. Evaluasi pola
Mengidentifikasi pola-pola didasarkan pada pengukuran yang menarik.
7. Presentasi pengetahuan
Menggunakan visualisasi dan presentasi untuk menyajikan informasi hasil
mining kepada user.
2.2 Analisis Pengelompokan (Clustering Analysis)
Clustering analysis merupakan metode penambangan data yang
menerapkan metode unsupervised learning, dimana tidak ada fase learning yaitu
tidak ada training data. Data yang ditambang menggunakan metode ini tidak
memiliki label. Label merupakan output yang dapat menandai kemana data
ketidakmiripan (dissimilarity). Data yang berada dalam satu kelompok
(intraclass) memiliki kemiripan (similarity) yang tinggi. Sedangkan data yang
berbeda kelompok (interclass) memiliki kemiripan (similarity) yang rendah.
2.3 Klastering K-Means (K-Means Clustering)
K-Means mengambil input parameter, k, dan mempartisi himpunan n
objek ke dalam k klaster. Setiap klaster terdiri dari obyek-obyek yang memiliki
kemiripan yang tinggi dengan data-data dalam klaster tersebut dan memiliki
kemiripan yang rendah terhadap data di klaster lain. Kemiripan klaster diukur
berdasarkan jarak data dengan centroid yaitu nilai rata-rata dari obyek dalam
sebuah klaster.
Cara kerja k-means pertama memilih k obyek secara acak yang
diinisialisasikan sebagai rata-rata klaster atau pusat klaster. Obyek yang lain
ditetapkan menjadi anggota klaster tertentu yang paling mirip dengan obyek
tersebut berdasarkan jarak antara obyek dengan rata-rata klaster. Kemudian
dihitung rata-rata yang baru untuk setiap klaster. Proses ini berulang hingga fungsi
ukuran bertemu di satu titik, yaitu tidak ada perpindahan obyek disetiap klaster.
Tidak ada perpindahan obyek disetiap klaster dapat diartikan dengan tidak ada
perubahan nilai pusat klaster atau jika menggunakan nilai SSE, nilai SSE yang
dihasilkan lebih kecil dari nilai SSE maksimal yang dikehendaki.
Berikut adalah algoritma K-Means :
Input :
k = jumlah klaster
8
Output :
klaster sebanyak k
Algoritma :
(1) Secara acak memilih k obyek dari D yang di inisialisasikan sebagai
pusat klaster (centroid)
(2) Repeat
(3) Tempatkan setiap objek ke klaster yang memiliki kemiripan
yang tinggi, berdasarkan rata-rata obyek-obyek dalam
klaster
(4) Ubah rata-rata klaster, yaitu hasil perhitungan nilai rata-rata
obyek-obyek di setiap klaster.
(5) Sampai tidak ada perubahan anggota disetiap klaster atau tidak ada
perubahan centroid.
Metode klastering k-means relatif terukur dan efisien dalam mengolah
sekumpulan data yang besar karena kompleksitas komputasi dari algoritma ini
adalah O(nkt), di mana n adalah jumlah total obyek, k adalah jumlah klaster, dan t
adalah jumlah iterasi. Biasanya, k <<n dan t <<n.
Algoritma k-means hanya dapat diterapkan ketika centroid didefinisikan.
Jika pusat klaster belum di definisikan maka tidak ada pusat kemana data akan
dikelompokkan. Kekurangan dari k-means adalah pengguna harus menentukan
jumlah klaster terlebih dahulu. Algoritma K-means peka terhadap noise dan titik
data outlier yang secara substansial dapat mempengaruhi nilai rata-rata.
Berdasarkan teori klastering k-means, secara random dipilih tiga objek sebagai
pusat klaster awal yang ditandai dengan symbol ‘+’. Setiap objek didistribusikan
ke klaster berdasarkan pusat klaster terdekat. Setiap klaster dikelilingi oleh kurva
putus-putus.
Kemudian pusat klaster diperbaharui. Pusat klaster baru merupakan nilai
rata-rata semua obyek di setiap klaster. Setelah pusat klaster diperbaharui, setiap
obyek didistribusikan kembali ke klaster berdasarkan pusat klaster terdekat,
sehingga dihasilkan klaster-klaster baru seperti pada Gambar 2.2 (B).
Proses iterasi tersebut akan terus berulang selama masih ada obyek yang
berpindah klaster. Jika sudah tidak ada obyek yang berpindah klaster, maka proses
berakhir dan menghasilkan klaster-klaster seperti yang terlihat pada Gambar 2.2
(C).
Gambar 2.2 Pengelompokan Obyek Menggunakan K-Means
Clustering
2.4 Kemiripan dan Ketidakmiripan
Dalam klaster, untuk menggabungkan dua obyek atau lebih menjadi satu
klaster, biasanya digunakan ukuran kemiripan (similarity) dan ketidakmiripan
10
kesamaan dua buah obyek. Dalam ukuran kemiripan, semakin besar nilai
kemiripan berarti semakin mirip, semakin kecil nilai kemiripan semakin tidak
mirip. Sedangkan ketidakmiripan antara dua obyek adalah ukuran numerik
tingkat perbedaan dua obyek. Dalam ukuran ketidakmiripan, semakin besar nilai
ketidakmiripan berarti semakin tidak mirip, semakin kecil nilai ketidakmiripan
semakin mirip. Semakin mirip dua obyek semakin tinggi peluang untuk
dikelompokkan ke dalam satu klaster. Sebaliknya, semakin tidak mirip semakin
rendah peluang untuk dikelompokkan menjadi satu klaster.
Untuk mengukur kemiripan dan ketidakmiripan obyek-obyek/data-data
dapat digunakan beberapa ukuran. Kemiripan dapat diukur menggunakan cosinus,
kovarian dan korelasi. Ketidakmiripan dapat diukur menggunakan konsep jarak
Euclidean, Manhattan atau Cityblock, Minkowski, Chebyshev dan Mahalanobis.
2.4.1 Euclidean (L2-norm)
Setiap data hasil evaluasi memiliki jumlah atibut yang sama sehingga
pengukuran jarak dapat menggunakan konsep Euclidean. Jarak Euclidean antara
dua data didefinisikan sebagai :
d(a,b)=
║
a-b
║
2=
21( i i)
n
i a −b
∑= ……….2.1
dimana :
a = obyek pertama
b = obyek kedua
Untuk membuat klaster beranggotakan data-data yang memiliki kemiripan
tinggi, dapat menggunakan fungsi kriteria yang dapat mengukur kualitas
klastering. Salah satu persamaan yang sering dipakai dan cukup sederhana adalah
jumlah dari kesalahan kuadrat (sum of squared-error, SSE). SSE didefinisikan
sebagai berikut :
∑ ∑
= ∈
− = k
i x D i e
i
m x J
1
2
………2.2
dimana :
Je = SSE
k = jumlah klaster
D = dataset
x = obyek
m = pusat klaster (centroid)
SSE juga dapat dijadikan ukuran untuk penghentian iterasi proses
pengelompokan. Jika nilai SSE hasil pengelompokan lebih kecil dari pada SSE
yang dimasukkan pengguna, maka proses pengelompokan selesai.
2.6 Contoh Kasus K-Means
Berikut adalah contoh penyelesaian kasus dengan algoritma k-means yang
di peroleh dari website dengan alamat :
http://people.revoledu.com/kardi/tutorial/kMean/NumericalExample.
Dalam tabel 2.1 terdapat 4 objek sebagai titik data yang akan
dikelompokkan. Setiap obyek memiliki 2 atribut. Setiap atribut mewakili
12
Tabel 2.1 Tabel Data Obat
Object
Attribute 1 (X):weight index
Attribute 2 (Y): pH
Medicine A 1 1
Medicine B 2 1
Medicine C 4 3
Medicine D 5 4
2.6.1 Contoh kasus K-Means Tanpa SSE
Data-data dalam tabel 2.1 akan dikelompokkan ke dalam 2 kelompok obat
yang didasarkan pada dua fitur yaitu pH dan indeks berat. Iterasi dalam proses
pengelompokan akan dikendalikan oleh perubahan anggota di setiap klaster.
Gambar 2.3 Koordinat Data Obat
Obyek atribut 1 (X): indeks berat
Obyek atribut 2 (Y): pH
Iterasi 0 :
1. Menentukan nilai awal centroids
d 2 P E C dengan simb
2. Menguku
Pengukuran j
Euclidean. S
Contoh peng
• Jarak
d(x,y
ol bintang, s
Gambar 2
ur jarak obye
jarak antara
etiap kolom
ghitungan jar
obat C = (4
y) =
1n i ∑=
=
(4−1seperti yang
2.4 Koordin
ek ke centro
obyek ke ce
dalam matr
rak obyek ke
, 3) ke centr
2
) (ai−bi
2 2 ) 1 3 ( )
1 + −
terlihat pada
nat obat iter
id
entroid meng
iks jarak me
e centroid :
roid pertama
=
3,61a gambar 2.1
rasi ke-0
ggunakan m
elambangkan
a c1(1,1) : 1.
etode jarak
S
B
c
k
3. M
O d k E m k m y m y • Jarak
d(x,y
Sehingga ma Baris pertam centroid pert kedua. Mengelompo Obyek dikel dikelompokkkelompok 2 d
Element ma
menunjukan
klaster dan
memiliki nila
yang berarti
memiliki nila
yang berarti o
obat C = (4
y) =
1n i ∑=
=
(4−2atriks jarak p
ma dari matri
ama dan bar
okkan obyek
lompokkan
kan ke kelom
dan obat D k
atriks di ba
posisi obye
0 berarti b
ai 1 di kelo
obyek A
ai 0 di kelo
obyek B me
, 3) ke centr
2
) (ai −bi
2 2 ) 1 3 ( )
2 + −
pada iterasi 0
iks jarak ses
ris kedua ada
k
berdasarkan
mpok 1, ob
ke kelompok
awah ini te
ek terhadap
bukan angg
mpok 1 dan
merupakan
mpok 1 dan
rupakan ang
roid kedua c
=
2.830 adalah :
suai dengan
alah jarak se
n jarak min
bat B ke ke
k 2.
erdiri dari
p suatu klas
gota klaster
n memiliki n
anggota ke
n memiliki n
ggota kelomp
c2=(2,1) :
jarak setiap
etiap obyek k
nimum. Jad
elompok 2,
nilai 1 da
ster. 1 berar
r. Misalnya
nilai 0 di ke
elompok 1.
nilai 1 di ke
pok 2 dan se
14
p obyek ke
ke centroid
di, obat A
obat C ke
an 0 yang
IIterasi 1 : 1. M C k te k 2. M P E Menentukan
Centroid di
kelompok. K
etap di c1=(
klaster kelom
Mengukur ja
Pengukuran j
Euclidean, se
nilai centro
ihitung ber
Kelompok 1
(1,1). Kelom
mpok 2 :
Gambar 2
arak obyek k
jarak data t
ehingga diha id
rdasarkan r
memiliki sa
mpok 2 mem
2.5 Koordin
e pusat klast
terhadap pus
asilkan matri
rata-rata se
atu anggota
miliki tiga an
nat obat iter
ter
sat klaster m
ik jarak :
I
3. M
O
d
Iterasi 2 :
1. M P k 2. M P E Mengelompo Obyek dike dihasilkan m Menentukan Pusat klaste
kelompok. c1
Mengukur ja
Pengukuran j
Euclidean, se
okkan obyek
elompokkan
matrik kelomp
nilai pusat k
r dihitung ⎜ ⎝ ⎛ + + = 2 1 , 2 2 1 1 Gambar 2
arak obyek k
jarak data t
ehingga diha k n berdasark pok : klaster berdasarkan ⎠ ⎞ ⎜ ⎝ ⎛ = ⎟ ⎠ ⎞ + 1 , 2 1 1 2 1 2.6 Koordin
e pusat klast
terhadap pus asilkan matri kan jarak n rata-rata ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + = 2 4 2 c
nat obat iter
ter
sat klaster m
ik jarak :
minimum, semua data = ⎟ ⎠ ⎞ + + 2 4 3 , 2 5 rasi ke-2 mengggunak 16 sehingga
a di setiap
D y m H 2 d k p m D 3. M O d
Dari hasil it
yang berpin
means telah
Hasil akhir p
Tab Obje Medicin Medicin Medicin Medicin 2.6.2 Cont Dala dikelompokk koordinat da pengelompo maksimal ya Data-data da Mengelompo Obyek dike dihasilkan m
terasi 2 terl
ndah kelomp
mencapai st
pengelompo
bel 2.2 Tabe
ect
ne A
ne B
ne C
ne D
toh kasus K am tabel 2
kan. Setiap
ari obyek se
okan akan d
ang diingink
alam tabel 2
okkan obyek
elompokkan
matrik kelomp
lihat bahwa
pok lagi. Den
tabilitas dan
kan obat terl
l Hasil Peng
Feature 1 (X
weight ind
1
2
4
5
K-Means Me
2.1 terdapat
p obyek m
eperti yang t
dikendalikan
kan adalah 3.
2.1 akan dik k
n berdasark
pok :
G1=G2, yan
ngan demiki
tidak memb
lihat pada ta
gelompokka
X):
dex Feat
enggunakan
t 4 objek
memiliki 2
terlihat pada
n oleh nilai
.
kelompokkan
kan jarak
ng berarti ba
ian, perhitun
butuhkan iter
abel 2.2.
an Obat den
ture 2 (Y): p
1 1 3 4 n SSE sebagai ti atribut. Set
a gambar 2.4
SSE, dalam
n ke dalam 2
minimum,
ahwa tidak
ngan dari kl
rasi lagi.
ngan K-Mea
pH Group
itik data y
tiap atribut
4. Iterasi da
m kasus ini
2 kelompok
sehingga
ada obyek
lastering
k-ans p (result) 1 1 2 2 yang akan mewakili lam proses nilai SSE
d
I
didasarkan p
Iterasi 0 :
1. 2. P ja o C
pada dua fitu
Menentukan
Nilai awal p
(1,1) dan c
dilambangk
gambar 2.1.
Mengukur ja
Pengukuran j
arak Euclid
obyek : Contoh peng • Jarak
d(x,y
• Jarakd(x,y
ur yaitu pH d
n nilai awal p
pusat klaster
c2=(2,1) men
an dengan
arak obyek k
jarak antara
dean. Setiap
ghitungan jar
obat C = (4
y) =
1n i ∑=
=
(4−1obat C = (4
y) =
1n i ∑=
=
(4−2dan indeks b
pusat klaster
r pertama d
nyatakan koo
simbol bin
ke pusat klas
obyek ke p
kolom dal
rak obyek ke
, 3) ke pusat
2
) (ai−bi
2 2 ) 1 3 ( )
1 + −
, 3) ke pusat
2
) (ai−bi
2 2 ) 1 3 ( )
2 + −
erat.
r
dimisalkan o
ordinat pusa
ntang, seper
ster
pusat klaster
lam matriks
e pusat klaste
t klaster pert
=
3.61t klaster kedu
=
2.83obat A dan o
at klaster. pu
rti yang ter
menggunak
jarak mela
er:
tama c1(1,1)
ua c2=(2,1)
18
obat B. c1=
B p p 3. M O d k E m k m y m y 4. M N Baris pertam pusat klaster pusat klaster Mengelompo Obyek dikel dikelompokk
kelompok 2 d
Element ma menunjukan klaster dan memiliki nila yang berarti memiliki nila
yang berarti o
Menghitung
Pusat klaste
c1=(1,1)
Nilai SSE ak
ma dari matri
r pertama d
kedua.
okkan obyek
lompokkan
kan ke kelom
dan obat D k
atriks di ba
posisi obye
0 berarti b
ai 1 di kelo
obyek A
ai 0 di kelo
obyek B me
pusat klaster
r yang baru
kan dihitung
iks jarak ses
an baris ked
k
berdasarkan
mpok 1, ob
ke kelompok
awah ini te
ek terhadap
bukan angg
mpok 1 dan
merupakan
mpok 1 dan
rupakan ang
r yang baru
:
g menggunak
suai dengan
dua adalah
n jarak min
bat B ke ke
k 2.
erdiri dari
p suatu klas
gota klaster
n memiliki n
anggota ke
n memiliki n
ggota kelomp
dan nilai SS
kan persama
jarak setiap
jarak setiap
nimum. Jad
elompok 2,
nilai 1 da
ster. 1 berar
r. Misalnya
nilai 0 di ke
elompok 1.
nilai 1 di ke
pok 2 dan se
SE
aan 2.2. Seh
p obyek ke
p obyek ke
di, obat A
obat C ke
an 0 yang
I
S
N
p
it
Iterasi 1 :
1. M P k te k 2. M P E 3. M O d
SSE di iteras
SSE = ||1
||4
= 0
Nilai SSE ya
pada iterasi
terasi akan b
Menentukan
Pusat klaste
kelompok. K
etap di c1=(
klaster kelom Mengukur ja Pengukuran Euclidean, se Mengelompo Obyek dike dihasilkan m
si 0 adalah :
1-1||2 + ||1-1|
4-3.67||2 + ||3
+ 0 + 2.79
ang dikehen
0 adalah 9.3
berlanjut.
nilai pusat k
r dihitung
Kelompok 1
(1,1). Kelom
mpok 2 :
arak obyek k
jarak data
ehingga diha
okkan obyek
elompokkan
matrik kelomp
|2 + ||2-3.67|
3-2.67||2
+||5-+ 2.79 +||5-+ 0.1
ndaki adalah
34, karena 9
klaster
berdasarkan
memiliki sa
mpok 2 mem
e centroid a terhadap asilkan matri k n berdasark pok :
|2 + ||1-2.67||
-3.67||2 +
||4-1+0.11 + 1.
h 3 dan nilai
9.34 tidak le
n rata-rata
atu anggota
miliki tiga an
centroid m
ik jarak :
kan jarak 2
+
-2.67||2
77+1.77 = 9
i SSE yang
ebih kecil da
semua data sehingga pu nggota, sehin mengggunaka minimum, 20 9.34 dihasilkan
ari 3 maka
a di setiap
usat klaster
ngga pusat
an metode
4. M c c S N p s Menghitung ⎜ ⎝ ⎛ +
= ,1
2 2 1 1 c ⎜ ⎝ ⎛ +
= ,3
2 5 4
2
c
SSE di iteras
SSE = ||1
||4
= 0.
Nilai SSE ya
pada iterasi selesai. pusat klaster ⎜ ⎝ ⎛ = ⎟ ⎠ ⎞ + 1 , 2 1 1 2 1 ⎜ ⎝ ⎛ = ⎟ ⎠ ⎞ + 2 1 4 2 4 3
si 1 adalah :
1-1.5||2 +
||1-4-4.5||2 +
||3-.25 + 0 + 0.2
ang dikehen
1 adalah 1.7
r baru dan n
⎟ ⎠ ⎞ 1 ⎟ ⎠ ⎞ 2 1 3 , 2 1
-1||2 + ||2-1.5
-3.5||2 +||5-4.
25 + 0.25+ 0
ndaki adalah
75, karena 1
ilai SSE
||2 + ||1-1.5||2
5||2 + ||4-3.5|
0.25 + 0.25 +
h 3 dan nilai
.75 lebih ke 2
+
||2
+ 0.25 +0.25
i SSE yang
ecil dari 3 m = 1.75
dihasilkan
22
Bab III
ANALISIS DAN PERANCANGAN SISTEM
3.1 Identifikasi dan Analisis Sistem
Pusat Pengembangan dan Penjaminan Mutu Pembelajaran (P3MP)
merupakan sebuah lembaga milik Universitas Sanata Dharma (USD). P3MP
memiliki tugas untuk menjaga kestabilan kualitas pembelajaran, mengelola
komponen pengembangan dan penjaminan mutu pembelajaran, serta mengelola
kegiatan peningkatan mutu pembelajaran di USD. P3MP setiap akhir semester
melakukan evaluasi terhadap pelaksanaan matakuliah. Evaluasi mencakup tiga
kategori, yaitu kinerja dosen, kontribusi mahasiswa dan kepuasan mahasiswa yang
tercakup dalam 18 pertanyaan.
Dalam tugas akhir ini akan dikelompokkan data hasil evaluasi ke dalam
kelompok-kelompok yang memiliki kemiripan yang tinggi. Data yang
dikelompokkan adalah data hasil evaluasi di Fakultas Sains dan Teknologi (FST)
USD pada semester gasal 2008/2009 dan semester genap 2008/2009.
Pengelompokan berdasarkan 18 pertanyaan yang termuat dalam kuesioner. Data
semester gasal 2008/2009 yang diperoleh berjumlah 62 record. Data semester
genap 2008/2009 yang diperoleh berjumlah 74 record. Hasil pengelompokan akan
diberi label menurut ketentuan yang berlaku di P3MP, yaitu :
Tabel 3.1 Tabel Pedoman Label Output P3MP
Skala Nilai Persentase Label
5,6 – 7 80% - 100% sangat tinggi
3,22 – 3,91 46% - 55% Rendah
… – 3,22 … - 46% sangat rendah
3.2 Perancangan Sistem 3.2.1 Input
Sistem yang akan dibuat menerima inputan yang berupa data hasil evaluasi
pembelajaran. Dalam tugas akhir ini data yang digunakan adalah data di Fakultas
Sains dan Tekonologi (FST). FST mencakup prodi Teknik Informatika, Teknik
Elektro, Teknik Mesin, Mekatronika, Matematika dan Fisika. Data hasil evaluasi
diperoleh dari P3MP Universitas Sanata Dharma. Satu record data hasil evaluasi
merupakan data satu matakuliah. Data evaluasi mencakup prodi, NIP dosen,
namaDosen, nama matakuliah, fakultas dan nilai rata-rata jawaban semua
responden untuk setiap pertanyaan yang termuat dalam kesioner. Data evaluasi
mencakup 23 atribut, yaitu :
Tabel 3.2 Atribut Data Hasil Evaluasi
Nama Atribut Penjelasan Nilai
prodi Atribut ini menyimpan nama prodi.
Data berupa nama-nama program studi. Data prodi tidak termasuk dalam atribut yang akan dihitung jaraknya, tetapi hanya sebagai identitas prodi penyelenggara matakuliah.
NIP Atribut ini menyimpan nama dosen.
24
sebagai identitas dosen pengampu matakuliah.
namaDosen Atribut ini menyimpan nama dosen.
Data berupa nama dosen yang mengampu mata kuliah yang dievaluasi. Data dosen yang dipakai dalam tugas akhir bukan nama yang sebenarnya,
melainkan nama samaran mengingat kerahasiaan data.
Nama matakuliah
Atribut ini menyimpan nama matakuliah beserta kelasnya
Nama-nama kelas dan matakuliah di prodi FST, misalnya Kalkulus A, Kalkulus B, Ststistik A dll. Data matakuliah tidak termasuk dalam atribut yang akan dihitung jaraknya, tetapi hanya sebagai identitas matakuliah.
Fakultas Atribut ini menyimpan nama fakultas.
Data berupa nama-nama fakultas. Data fakultas tidak termasuk dalam atribut yang akan dihitung jaraknya, tetapi hanya sebagai identitas prodi matakuliah.
rt1
Atribut ini menyimpan nilai rata-rata jawaban semua responden pertanyaan nomor 1 dalam kuesioner.
Skala nilai 1 sampai 7
rt2
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 2 dalam kuesioner.
Skala nilai 1 sampai 7
rt3
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 3 dalam kuesioner.
Skala nilai 1 sampai 7
rt4
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 4 dalam kuesioner.
Skala nilai 1 sampai 7
rt5
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 5 dalam kuesioner.
Skala nilai 1 sampai 7
rt6 Atribut ini menyimpan
nomor 6 dalam kuesioner.
rt7
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 7 dalam kuesioner.
Skala nilai 1 sampai 7
rt8
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 8 dalam kuesioner.
Skala nilai 1 sampai 7
rt9
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 9 dalam kuesioner.
Skala nilai 1 sampai 7
rt10
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 10 dalam kuesioner.
Skala nilai 1 sampai 7
rt11
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 11 dalam kuesioner.
Skala nilai 1 sampai 7
rt12
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 12 dalam kuesioner.
Skala nilai 1 sampai 7
rt13
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 13 dalam kuesioner.
Skala nilai 1 sampai 7
rt14
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 14 dalam kuesioner.
Skala nilai 1 sampai 7
rt15
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 15 dalam kuesioner.
26
rt16
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 16 dalam kuesioner.
Skala nilai 1 sampai 7
rt17
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 17 dalam kuesioner.
Skala nilai 1 sampai 7
rt18
Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 18 dalam kuesioner.
Skala nilai 1 sampai 7
Data pertanyaan untuk setiap nomor tercantum dalam lampiran.
3.2.2 Pemrosesan Awal Data
Sebelum data diolah menggunakan sistem yang akan dibuat, dilakukan
pemrosesan awal data terlebih dulu. Sistem tidak menyediakan fasilitas
preprocessing data sehingga pemrosesan awal data dilakukan secara manual.
1) Mengatur urutan kolom data
Pada proses ini dilakukan pengurutan atribut (kolom) data. Urutan
kolom data yang akan diolah sistem adalah sebagai berikut :
Tabel 3.3 Urutan Kolom Data Hasil Evaluasi
Urutan kolom
Nama kolom
1
Prodi
2
NIP
3
Nama Dosen
4
Nama Matakuliah
5
7 Rata pertanyaan no 2 8 Rata pertanyaan no 3 9 Rata pertanyaan no 4 10 Rata pertanyaan no 5 11 Rata pertanyaan no 6 12 Rata pertanyaan no 7 13 Rata pertanyaan no 8 14 Rata pertanyaan no 9 15 Rata pertanyaan no 10 16 Rata pertanyaan no 11 17 Rata pertanyaan no 12 18 Rata pertanyaan no 13 19 Rata pertanyaan no 14 20 Rata pertanyaan no 15 21 Rata pertanyaan no 16 22 Rata pertanyaan no 17 23 Rata pertanyaan no 18
2) Membersihkan data kosong
Pada langkah ini dilakukan pembersihan record atau baris yang
datanya tidak lengkap. K-means menggunakan rata-rata klaster
28
yang tidak berisi data hasil evaluasi akan mempengaruhi rata-rata
klaster (centroid).
3) Menyeragamkan nilai varibel prodi
Pada langkah ini dilakukan penyamaan nama prodi. Sistem memiliki
fasilitas melihat persentase prodi di setiap klaster, sehingga nama prodi
harus disamakan. Misalnya dalam data mentah yaitu data yang belum
dilakukan pemrosesan awal data, untuk prodi D3 Mekatronika terdapat
dua nilai yaitu D3 Meka dan D3 Mekatornika. Jika kedua nilai tersebut
tidak diseragamkan, maka akan dianggap menjadi dua nilai yang
berbeda.
3.2.3 Proses
1) Membaca data
Pada proses ini sistem akan membaca data-data hasil evaluasi dalam
bentuk file excel (xls). Data evaluasi mencakup informasi prodi, kode
dosen, nama dosen, nama matakuliah, fakultas dan nilai rata-rata
jawaban semua responden untuk setiap pertanyaan yang termuat dalam
kesioner.
2) Menginisialisasikan jumlah klaster k
Jumlah klaster yang diinisialisasikan tergantung dari masukan
pengguna.
3) Menginisialisasikan centroid
Pada awal proses, pusat klaster dipilih oleh sistem secara acak
rata-jumlah klaster yang dimasukkan pengguna.
4) Menghitung jarak antara data dengan pusat klaster
Pada tahap ini dilakukan penghitungan jarak antara setiap obyek
dengan setiap pusat klaster. Untuk menghitung jarak obyek dengan
pusat klaster digunakan konsep jarak Euclidean dengan persamaan no
2.1.
5) Mengelompokkan data-data ke dalam kelompok-kelompok
Hasil penghitungan jarak pada proses nomor 5 digunakan untuk
mengelompokkan obyek-obyek ke centroid. Jarak setiap obyek dengan
pusat klaster- pusat klaster akan dibandingkan. Pengelompokan
obyek-obyek didasarkan pada jarak terdekat antara obyek-obyek dengan pusat
klaster.
6) Menghitung nilai SSE
Jika pengguna menghendaki penggunaan SSE, SSE dihitung setelah
data dikelompokkan.
7) Menghitung validasi hasil pengelompokan
Validasi hasil pengelompokan data hasil evaluasi dihitung dengan
membandingkan predikat evaluasi setiap data dengan label klaster
dimana data tersebut berkelompok.
8) Menampilkan hasil pengelompokan sebagai output
Hasil pengelompokan akan ditampilkan sebagai output.
3.2.4 Output
30
1) Jumlah data
Sistem akan menampilkan jumlah data yang dikelompokkan.
2) Jumlah klaster
Sistem akan menampilkan jumlah klaster yang di inputkan pengguna.
3) Jumlah iterasi
Sistem akan menampilkan jumlah iterasi yang terjadi dalam proses
pengelompokan data.
4) Centroid terakhir
Sistem akan menampilkan nilai rata-rata centroid terakhir untuk setiap
klaster.
5) Jumlah anggota tiap klaster
Sistem akan menampilkan jumlah anggota setiap klaster.
6) Anggota tiap klaster
Sistem akan menampilkan anggota tiap klaster.
7) Nilai SSE
Sistem akan menampilkan nilai SSE yang dapat dicapai sistem.
8) Validasi hasil pengelompokan
Sistem akan menampilkan tingkat validasi pengelompokan.
9) Nilai rata-rata data setiap pertanyaan
Sistem akan menampilkan detail rata-rata setiap data untuk setiap
pertanyaan.
10)Nilai rata-rata setiap kategori
Sistem akan menampilkan nilai rata-rata untuk setiap kategori
11)Diagram Pie (Pie Chart)
Sistem akan menampilkan diagram pie persentase anggota semua
klaster dan diagram pie persentase prodi untuk setiap klaster.
3.3 Perancangan 3.3.1 Diagram Konteks
32
3.3.2 Diagram Use Case
Mengelompokkan data Memilih file data
Melihat detail anggota tiap klaster
<<depends on>>
Pengguna
<<depends on>>
Melihat detail hasil evaluasi setiap data
<<depends on>>
Melihat rata data setiap kategori
<<depends on>>
Melihat grafik persentase prodi
Melihat grafik persentase klaster
Menyimpan hasil pengelompokan
<<depends on>> <<depends on>>
Mengurutkan klaster berdasarkan centroid
<<uses>>
<<uses>>
Mengurutkan data dalam klaster
<<depends on>>
Gambar 3.2 Diagram Use Case
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi :
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Memilih File Data Jenis Use Case :
Kebutuhan Bisnis
ID usecase 1
Prioritas Tinggi
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan pengguna memilih tabel data yang akan dikelompokkan.
Pra-kondisi Sistem belum memiliki data yang akan dikelompokkan
Pemicu Aktor ingin memasukkan tabel data
Langkah umum Aksi Aktor Respon Sistem
Langkah 1 : Aktor memilih halaman pengelompokan data
Langkah 3 : Aktor memilih data dalam bentuk file excel yang akan dikelompokkan.
Langkah 2 : memberikan halaman pengelompokan data
Langkah 4: menampilkan kotak dialog pemilihan nomor pertanyaan dalam kuesioner yang akan dikelompokkan.
Langkah 6 : Data yang dipilih di perlakukan sebagai obyek yang ditambahkan ke vector data dan ditampilkan ke tabel output.
Langkah 5 : Aktor memilih pertanyaan yang akan dikelompokkan
Langkah 7 : Aktor memasukkan jumlah klaster dan nilai SSE jika dikehendaki.
Langkah alternatif
Kesimpulan Use case ini selesai jika sistem telah menampilkan data yang dipilih aktor ke dalam tabel.
Pasca kondisi Sistem memiliki masukan data yang akan
dikelompokkan
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
34
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi :
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Mengelompokkan Data Jenis Use Case :
Kebutuhan bisnis
ID usecase 2
Prioritas Tinggi
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan pengguna
mengelompokkan data hasil evaluasi.
Pra-kondisi Aktor sudah memilih data yang akan dikelompokkan, memasukkan jumlah klaster dan nilai SSE.
Pemicu Aktor ingin mengelompokkan data
Langkah umum Aksi Aktor Respon Sistem
Langkah 1 : Aktor mengklik tombol proses.
Langkah 2 : Sistem menangkap jumlah klaster dan nilai SSE yang diinputkan pengguna. Sistem memilih centroid secara random. Sistem menghitung jarak tiap data dengan setiap centroid menggunakan persamaan
euclidean. Sistem mengelompokkan data berdasarkan jarak terkecil antara setiap data dengan
setiap centroid. Penghentian iterasi pengelompokan didasarkan
Langkah 3 : Setelah pengelompokkan semua data selesai, sistem akan memberi label klaster berdasarkan ketentuan P3MP. Pemberian label berdasarkan rata-rata tiap klaster.
Langkah 4 : Sistem menghitung validitas hasil pengelompokan.
Penghitungan validitas dilakukan dengan membandingkan label
klaster hasil pengelompokan sistem
dengan label setiap data. Sistem menampilkan data hasil pengelompokkan.
Langkah alternatif
Kesimpulan Use case ini selesai jika sistem sudah menampilkan data hasil pengelompokan.
Pasca kondisi Data-data yang dimasukkan telah dikelompokkan ke dalam klaster-klaster.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
36
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi :
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Melihat Detail Anggota Setiap Klaster
Jenis Use Case :
Kebutuhan Bisnis ID usecase 3
Prioritas Tinggi
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan pengguna melihat data setiap klaster.
Pra-kondisi Data telah dikelompokkan ke dalam klaster-klaster.
Pemicu Aktor ingin mengetahui data-data setiap klaster.
Langkah umum Aksi aktor Respon sistem
Langkah 1 : Aktor mengklik klaster yang datanya akan dilihat secara detail.
Langkah 2 : Sistem menangkap klaster yang dipilih aktor. Sistem menampilkan semua data yang menjadi anggota klaster yang dipilih.
Langkah alternatif
Kesimpulan Use case ini selesai jika sistem telah menampilkan semua angota dari klaster yang dilihat.
Pasca kondisi Hasil pengelompokan data hasil evaluasi ditampilkan berdasarkan klaster-klaster.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi : Masalah terbuka -
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Melihat Detail Hasil Evaluasi Setiap Data
Jenis Use Case :
Kebutuhan Bisnis ID usecase 4
Prioritas Sedang
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan pengguna melihat detai data hasil evaluasi setiap data.
Pra-kondisi Data setiap pertanyaan dalam kuesioner ditampilkan.
Pemicu Aktor ingin mengetahui nilai data evaluasi untuk setiap pertanyaan.
Langkah umum Aksi aktor Respon sistem
Langkah 1 : Aktor mengklik data yang akan dilihat secara detail nilai hasil evaluasi setiap pertanyaan yang termuat dalam kuesioner.
Langkah 2 : Sistem menangkap urutan data yang dipilih aktor. Sistem menampilkan nilai hasil evaluasi setiap pertanyaan yang termuat dalam kuesioner.
Langkah alternatif
38
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi : dalam kuesioner.
Pasca kondisi Nilai hasil evaluasi setiap pertanyaan yang termuat dalam kuesioner telah ditampilkan.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
Masalah terbuka -
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Melihat Rata Data Setiap Kategori
Jenis Use Case :
Kebutuhan Bisnis ID usecase 5
Prioritas Tinggi
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan pengguna melihat rata-rata data hasil evaluasi untuk setiap kategori.
Pra-kondisi Data hasil evaluasi setiap data ditampilkan per pertanyaan.
Pemicu Aktor ingin mengetahui rata-rata data evaluasi untuk setiap kategori.
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi : mengklik tombol liat rata
data tiap kategori.
Langkah 3 : Aktor memasukkan jumlah kategori yang dikehendaki
Langkah 5 : Aktor memasukkan nomor awal pertanyaan dan nomor akhir pertanyaan untuk setiap kategori
menampilkan kotak dialog untuk inputan jumlah kategori yang diinginkan pengguna.
Langkah 4 : Sistem menampilkan form inputan nomor pertanyaan untuk setiap kategori.
Langkah 6 : Sistem menghitung rata-rata data berdasarkan kategori.
Langkah alternatif
Kesimpulan Use case ini selesai jika sistem telah menampilkan nilai rata-rata hasil evaluasi untuk setiap kategori.
Pasca kondisi Nilai rata-rata tiap kategori telah ditampilkan.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
Masalah terbuka -
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Melihat Grafik Presentase Anggota Setiap Klaster
Jenis Use Case :
Kebutuhan Bisnis
ID usecase 6
40
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan pengguna melihat
persentase jumlah anggota setiap klaster.
Pra-kondisi Data hasil evaluasi telah dikelompokkan kedalam klaster-klaster.
Pemicu Aktor ingin melihat persentase jumlah anggota setiap klaster.
Langkah umum Aksi aktor Respon sistem
Langkah 1 : Aktor mengklik tombol grafik.
Langkah 2 : Sistem menampilkan grafik persentase anggota setiap klaster dalam bentuk pieChart.
Langkah alternatif
Kesimpulan Use case ini selesai jika sistem telah menampilkan grafik persentase anggota setiap klaster dalam bentuk pieChart .
Pasca kondisi Persentase jumlah anggota setiap klaster ditampilkan dalam bentuk pieChart.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
Versi :
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Melihat Grafik Presentase Prodi
Jenis Use Case :
Kebutuhan Bisnis ID usecase 7
Prioritas Sedang
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan pengguna melihat
persentase jumlah prodi setiap klaster.
Pra-kondisi Detail anggota setiap klaster telah ditampilkan.
Pemicu Aktor ingin melihat persentase jumlah prodi setiap klaster.
Langkah umum Aksi aktor Respon sistem
Langkah 1 : Aktor mengklik tombol grafik.
Langkah 2 : Sistem menampilkan grafik persentase jumlah prodi setiap klaster dalam bentuk pieChart.
Langkah alternatif
Kesimpulan Use case ini selesai jika sistem telah menampilkan grafik persentase jumlah prodi setiap klaster dalam bentuk pieChart .
Pasca kondisi Persentase jumlah prodi setiap klaster ditampilkan dalam bentuk pieChart.
Aturan bisnis -
Batasan
42
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi : spesifikasi
Asumsi -
Masalah terbuka -
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Menyimpan Hasil Klastering
Jenis Use Case :
Kebutuhan Bisnis ID usecase 8
Prioritas Sedang
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan sistem menyimpan data hasil klastering ke dalam file excel.
Pra-kondisi Data sudah dikelompokan.
Pemicu Aktor ingin menyimpan data hasil pengelompokan.
Langkah umum Aksi aktor Respon sistem
Langkah 1 : Aktor melakukan
pengelompokan data.
Langkah 2 : Sistem membuat nama file dan menuliskan data hasil pengelompokan ke file excel, kemudian file excel disimpan.
Langkah alternatif
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi : bentuk file excel.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
Masalah terbuka -
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Mengurutkan Klaster Berdasarkan Centroid Klaster
Jenis Use Case :
Kebutuhan Bisnis
ID usecase 9
Prioritas Sedang
Sumber -
Pelaku bisnis utama Pengguna
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan sistem mengurutkan klaster-klaster berdasarkan rata-rata centroid setiap klaster, mulai dari centroid terbesar sampai cenroid terkecil.
Pra-kondisi Data sudah dikelompokan.
Pemicu Aktor ingin melihat klaster-klaster hasil
pengelompokan.
44
Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009
Versi : Langkah 1 : Aktor
mengklik tombol proses.
Langkah 2 : Sistem menghitung rata-rata centroid setiap klaster.
Langkah 3 : Sistem mengurutkan klaster-klaster berdasarkan rata-rata centroid, mulai dari centroid terbesar sampai terkecil.
Langkah 3 : Sistem menyimpan klaster-klaster yang sudah diurutkan.
Langkah alternatif
Kesimpulan Use case ini selesai jika sistem telah menyimpan klaster-klaster yang sudah diurutkan.
Pasca kondisi Klaster-klaster sudah terurut mulai dai centroid terbesar sampai terkecil.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
Masalah terbuka -
Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma
Nama Usecase Mengurutkan Data Dalam Klaster
Jenis Use Case :
Kebutuhan Bisnis
ID usecase 10
Prioritas Sedang
Pelaku partisipan -
Partisipan lain -
Deskripsi Use case ini menggambarkan sistem mengurutkan data-data dalam klaster-klaster berdasarkan rata-rata centroid setiap data atau prodi yang dimiliki data, mulai dari centroid terbesar sampai cenroid terkecil atau mulai dari prodi dari abjad a sampai z.
Pra-kondisi Aktor melihat detail data dalam klaster.
Pemicu Aktor ingin melihat data-data dalam klaster secara terurut.
Langkah umum Aksi aktor Respon sistem
Langkah 1 : Aktor memilih urut data berdasarkan centroid data atau prodi data.
Langkah 2 : Jika aktor memilih urut data berdasarkan centroid maka sistem menghitung rata-rata centroid setiap data.
Kemudian sistem mengurutkan data-data dalam klaster-klaster berdasarkan rata-rata centroid data, mulai dari centroid terbesar sampai terkecil.
Langkah 2 : Jika aktor memilih urut data berdasarkan prodi maka sistem membandingkan prodi setiap data dan mengurutkan data-data dalam klaster-klaster berdasarkan prodi data.
Langkah 3 : Sistem menyimpan klaster-klaster yang sudah diurutkan.
Langkah alternatif
46
3.3.3 Diagram Aktivitas
a) Diagram Aktivitas Memilih File Data
Gambar 3.3 Diagram Aktivitas Memilih Tabel Data
Pasca kondisi Klaster-klaster sudah terurut mulai dai centroid terbesar sampai terkecil.
Aturan bisnis -
Batasan
implementasi dan spesifikasi
-
Asumsi -
48
c) Diagram Aktivitas Melihat Detail Anggota Setiap Klaster
Gambar 3.5 Diagram Aktivitas Melihat Detail Data Setiap Klaster
d) Diagram Aktivitas Melihat Detail Nilai Hasil Evaluasi Setiap Data
Gambar 3.6 Diagram Aktivitas Melihat Detail Data Hasil Evaluasi Setiap Data
Gambar 3.7 Diagram Aktivitas Melihat Rata-rata Data Setiap Kategori
f) Diagram Aktivitas Melihat Grafik Presentase Anggota Setiap Klaster
50
g) Diagram Aktivitas Melihat Grafik Presentase Prodi
Gambar 3.9 Diagram Aktivitas Melihat Grafik Presentase Prodi
h) Diagram Aktivitas Menyimpan Hasil Pengelompokan
52
j) Diagram Aktivitas Mengurutkan Data Dalam Klaster
<<Controller>> Pengelompokan <<Controller>> DetailDataSetiapKlaster <<Controller>> DetailHasilEvaluasiSetiapData <<boundary>> DetailDataSetiapKlaster Menggunakan Menggunakan Menggunakan Menggunakan Me ngirim M emiliki Me mili ki 1 1 1 1 1…* 1…* 1…* 1 1…* M engg unaka n Memiliki Memiliki <<boundary>> Input Data <<boundary>> Pengelompokan Data DetailHasilEvaluasiSetiapData <<Controller>> InputData HasilEvaluasi Cluster 1 1…* 1 1 1 1 1…* Centroid Mem iliki Memiliki 1 1…* <<Controller>> Pie Chart 1 1 1 1 Me ngg unaka n Men ggun akan Me mili ki Menggunakan <<boundary>> PilihAtribut <<Controller>> PilihAtribut 1 1 M eng guna kan
54
56
3.3.5 Algoritma Method Dalam Setiap Kelas a) Detail Algoritma Method Kelas InputData
Tabel 3.4 Detail Algoritma Method Kelas InputData
Nama
Method Tugas Method Algoritma Method
bacaFile
Method bacaFile bertugas membaca data input dan menjadikan data tersebut sebagai obyek dari kelas HasilEvaluasi
1.Menangkap/ membaca file yang dipilih pengguna.
2.Membaca banyak kolom dan banyak baris data.
3.Membaca semua data yang ada dalam file yang telah dipilih.
4.Data yang telah dibaca dijadikan obyek yang bertipe HasilEvaluasi.
b) Detail Algoritma Method Kelas Pengelompokan
Tabel 3.5 Detail Algoritma Method Kelas Pengelompokan
Nama
Method Tugas Method Algoritma Method
pengelompok anData Method pengelompokanDa ta bertugas membuat klaster dan mendeklarasikan pusat awal klaster
1. Membuat klaster sebanyak klaster yang dimasukkan pengguna.
2. Mendeklarasikan centroid awal setiap klaster dengan cara memanggil method
declareCentroid. iterasi Method iterasi bertugas melakukan serta menghentikan iterasi pengelompokan
1.Memanggil method Euclidean.
2.Memanggil method pindahData.
3.Memanggil method untuk menghitung centroid. declareCentr oid Method declareCentroid bertugas mendeklarasikan
1. Untuk sebanyak jumlah klaster lakukan langkah 2.
menjadi centroid di klaster lain atau belum, jika sudah lakukan kembali ke langkah nomor 2. Jika belum menjadi centroid di klaster lain, lakukan langkah 4.
4. Mendeklarasikan data yang telah dipilih menjadi centroid klaster.
euclidean
Method euclidean bertugas
menghitung jarak setiap data dengan centroid setiap klaster
1. Untuk i=0 sampai i < jumlah data lakukan langkah nomor 2.
2. Untuk j=0 sampai j < jumlah klaster lakukan langkah nomor 3.
3. Untuk k=0 sampai k < jumlah pertanyaan kuesioner, lakukan langkah nomor 4.
4. Hitung selisih nilai hasil evaluasi antara data i dengan centroid klaster j dengan persamaan euclidean. Jika k < jumlah pertanyaan ulangi langkah 4. pindahData Method pindahData bertugas menempatkan setiap data ke klaster yang memiliki jarak terdekat
1. Untuk setiap data dan setiap klaster, cari yang memiliki jarak terdekat. Jika pencarian jarak terdekat sudah selesai, lakukan langkah nomor 2.
2. Tempatkan data ke klaster yang memiliki jarak terdekat berdasarkan pencarian pada langkah nomor 1. hitungCentro id Method hitungCentroid bertugas mengitung centroid klaster tanpa menghitung nilai SSE
1. Untuk i=0 sampai i < jumlah klaster, lakukan langkah 2.
2. Untuk j=0 sampai j < jumlah atribut pertanyaan, lakukan langkah 3.
3. Untuk k=0 sampai k< jumlah anggota klaster i, lakukan langkah 4.
4. Menghitung jumlah data hasil evaluasi atribut ke-j semua anggota yang menjadi anggota klaster i. jika k ≥ jumlah anggota klaster i lakukan langkah 5.
58
6. Menghitung klaster yang centroidnya tidak berubah dan klaster i diset dengan nilai centroid yang baru. Set i=i+1. Jika i<jumlah klaster, ulangi langkah 2. Jika i ≥jumlah klaster lakukan langkah nomor 7.
7. Cek