• Tidak ada hasil yang ditemukan

Hertartik Clarasita Devy Student ID : 065314080 INFORMATICS ENGINEERING DEPARTMENT FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERCITY YOGYAKARTA 2010

N/A
N/A
Protected

Academic year: 2019

Membagikan "Hertartik Clarasita Devy Student ID : 065314080 INFORMATICS ENGINEERING DEPARTMENT FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERCITY YOGYAKARTA 2010"

Copied!
149
0
0

Teks penuh

(1)

i SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Program Studi Teknik Informatika

Oleh:

Hertartik Clarasita Devy NIM : 065314080

JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA

(2)

ii

CLUSTERING THE RESULTS OF LEARNING EVALUATION USING K-MEANS CLUSTERING METHOD

A CASE STUDY IN THE FACULTY OF SCIENCE AND TECHNOLOGY OF SANATA DHARMA UNIVERSITY

THESIS

Presented as Partial Fulfillment Of The Requirements To Obtain The Sarjana Teknik Degree

In Informatics Engineering Study Program

Hertartik Clarasita Devy Student ID : 065314080

INFORMATICS ENGINEERING DEPARTMENT FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERCITY YOGYAKARTA

(3)
(4)
(5)

v  

“Usaha dan kerja keras adalah modal untuk maju”

(6)

vi  

(7)

vii

STUDI KASUS DI FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA

Pusat Pengembangan dan Penjaminan Mutu Pembelajaran Universitas Sanata Dharma (P3MP) setiap akhir semester melaksanakan evaluasi pembelajaran matakuliah-matakuliah. Evaluasi dilakukan dengan kuesioner yang diisi mahasiswa. Kuesioner memuat 18 pertanyaan dengan skala penilaian antara1 sampai 7.

Dalam tugas akhir ini, penulis mengelompokkan data hasil evaluasi pembelajaran matakuliah-matakuliah di prodi-prodi Fakultas Sains dan Teknologi pada semester gasal 2008/2009 dan semester genap 2008/2009 kedalam kelompok-kelompok dengan hasil evaluasi yang mirip. Pengelompokan dilakukan dengan metode K-Means clustering. Metode K-Means clustering

mengelompokkan data-data berdasarkan jarak tiap data dengan centroid.

(8)

viii

ABSTRACT

CLUSTERING THE RESULTS OF LEARNING EVALUATION USING K-MEANS CLUSTERING METHOD

A CASE STUDY IN THE FACULTY OF SCIENCE AND TECHNOLOGY OF SANATA DHARMA UNIVERSITY

At the end of each semester, The Center of Development and Learning Quality Assurance of Sanata Dharma University evaluates each course learning. Evaluation was performed using questionnaires filled in by students. The questionnaire consist of 18 questions with a rating scale between 1 up to 7.

In this thesis, the author cluster the results of learning evaluation of all departments in the Faculty of Science and Technology of Sanata Dharma University into groups with similar evaluation results. The data was taken from odd and even semester 2008/2009. The clustering was done by using K-Means clustering method. K-Means clustering method groups data based on the distance of each data with the centroid.

(9)
(10)

x  

KATA PENGANTAR

Puji syukur penulis panjatkan atas Kehadirat Tuhan YME, yang telah melimpahkan rahmat dan berkatNya sehingga penulis dapat menyelesaikan tugas akhir yang berjudul PENGELOMPOKAN HASIL EVALUASI PEMBELAJARAN MENGGUNAKAN METODE KLASTERING K-MEANS STUDI KASUS DI FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelar sarjana program studi Teknik Informatika, Fakultas Sains dan Teknologi Universitas Sanata Dharma.

Dalam kesempatan ini, penulis mengucapkan terimakasih yang sebesar-besarnya kepada :

1. Ibu P.H. Prima Rosa, S.Si., M.Sc., selaku dosen pembimbing, terimakasih atas segala bimbingan, kritik, saran dan kesabarannya dalam mengarahkan dan membimbing penulis dalam menyelesaikan tugas akhir ini.

2. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T., selaku kaprodi Teknik Informatika.

3. Ibu Ridowati Gunawan, S.Kom., M.T. dan Ibu Sri Hartati Wijono, S.Si, M.Kom., selaku dosen penguji.

4. Seluruh staff pengajar Prodi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma.

(11)

xi  

7. Teman-teman prodi Teknik Informatika angkatan 2006, atas kebersamaanya selama penulis menjalani masa studi.

8. Serta semua pihak yang tidak dapat disebutkan satu-persatu yang telah membantu penulis dalam menyelesaikan tugas akhir ini.

Penulis menyadari bahwa tugas akhir ini jauh dari sempurna, oleh karena itu kritik dan saran yang sifatnya membangun sangat penulis harapkan.

Yogyakarta, 19 Juli 2010

(12)

xii Daftar Isi

Halaman

HALAMAN JUDUL ……….………. i

HALAMAN JUDUL (bahasa Inggris)……….………. ii

HALAMAN PERSETUJUAN ……… iii

HALAMAN PENGESAHAN ……… iv

HALAMAN PERSEMBAHAN ……….……… v

PERNYATAAN KEASLIAN KARYA ……….………… vi

ABSTRAK……… vii

ABSTRACT ……… viii

PERNYATAAN PERSETUJUAN PUBLIKASI ………. ix

KATA PENGANTAR ………. x

Daftar Isi ………. xii

Daftar Gambar ……….………… xvi

Daftar Tabel ……… xx

Bab I. Pendahuluan ……….………… 1

1.1. Latar Belakang ………..… 1

1.2. Rumusan Masalah ……….... 2

1.3. Tujuan dan Manfaat ……….…. 2

1.4. Batasan Masalah ………..…. 2

1.5. Metodologi Penelitian ……….…. 3

1.6. Sistematika Penulisan ………..…. 4

Bab II. Landasan Teori ………..…. 5

(13)

xiii

2.4.1. Euclidean (L2-norm)……….…….. 10

2.5. Sum Of Squared-error (SSE) ……….. 11

2.6. Contoh kasus K-Means ……….…… 11

2.6.1. Contoh kasus K-Means Tanpa SSE …………..…… 12

2.6.2. Contoh kasus K-Means Menggunakan SSE ….……. 17

Bab III. Analisis dan Perancangan Sistem ……….……… 22

3.1. Identifikasi dan Analisis Sistem……… 22

3.2. Perancangan Sistem ………..……… 23

3.2.1. Input ……….………. 23

3.2.2. Pemrosesan Awal Data……….…….. 27

3.2.3. Proses ………. 28

3.2.4. Output………. 29

3.3. Perancangan ……….……… 31

3.3.1 Diagram Konteks ………... 31

3.3.2 Diagram Use Case ……….…….…………... 32

3.3.3 Diagram Aktivitas ………..………... 46

3.3.4 Diagram Kelas ………..….... 53

3.3.5 Algoritma Method Dalam Setiap Kelas…………... 56

3.3.6 Diagram Sequence ………..………... 66

3.4. Desain Antar Muka Pengguna ……….…. 72

(14)

xiv

3.4.2 Desain Pengelompokan Data ………. 73

3.4.3 Desain Hasil Pengelompokan Data …………..……. 74

3.4.4 Desain Antar Muka Pie Chart Persentase Klaster …. 75 3.4.5 Desain Detail Anggota Setiap Klaster……… 76

3.4.6 Desain Antar Muka Pie Chart Persentase Prodi Setiap Klaster ………..………….. 77

3.4.7 Desain Antar Muka Detail Data Hasil Evaluasi Seiap Data ……….………….…. 78

3.4.8 Desain Petunjuk Penggunaan ………..……..… 78

Bab IV. Implementasi ……… 80

4.1. Implementasi Antar Muka Pengguna……… 80

4.1.1 Antar Muka Menu Utama Program ………..…. 80

4.1.2 Antar Muka Pemilihan File Data ………..…. 81

4.1.3 Antar Muka Pengelompokan……….…. 82

4.1.4 Antar Muka Detail Data Setiap Klaster ……… 84

4.1.5 Antar Muka Detail Hasil Evaluasi Setiap Data ……. 86

4.1.6 Antar Muka Bantuan ………..….…. 88

4.2. Program Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran ………..…….…… 88

4.2.1 Membaca Data dari File xls ……….……….… 88

4.2.2 Membuat Klaster ……….…….… 92

4.2.3 Mendeklarasikan Centroid Awal ……….…………. 93

(15)

xv

4.2.6.2 Menghitung Centroid beserta SSE …….… 97

4.2.7 Pemberian Label Klaster ………..…. 99

4.2.8 Validasi Hasil Pengelompokan ……….……… 101

4.2.9 Pengurutan Data di Setiap Klaster ………. 102

4.2.10 Menampilkan Grafik ……….……… 103

4.2.11 Menghitung Rata-Rata Kategori Setiap Data ……… 105

4.2.12 Menyimpan Hasil Pengelompokan ……… 106

4.3. Uji Percobaan ……… 108

Bab V. Kesimpulan dan Saran ……… 115 Daftar Pustaka

(16)

xvi Daftar Gambar

Gambar 2.1. Tahap-tahap Data Mining ... 5

Gambar 2.2. Pengelompokan Obyek Menggunakan K-Means Clustering ... 9

Gambar 2.3. Koordinat Data Obat ... 12

Gambar 2.4. Koordinat obat iterasi ke-0 ... 13

Gambar 2.5. Koordinat obat iterasi ke-1 ... 15

Gambar 2.6. Koordinat obat iterasi ke-2 ... 16

Gambar 3.1. Diagram Konteks ... 31

Gambar 3.2. Diagram Use Case ... 32

Gambar 3.3. Diagram Aktivitas Memilih File Data ... 46

Gambar 3.4. Diagram Aktivitas Mengelompokkan Data ... 47

Gambar 3.5. Diagram Aktivitas Melihat Detail Anggota Setiap Klaster ... 48

Gambar 3.6. Diagram Aktivitas Melihat Detail Data Hasil Evaluasi Setiap Data ... 48

Gambar 3.7. Diagram Aktivitas Melihat Rata-Rata Data Setiap Kategori ... 49

(17)

xvii

Gambar 3.11. Diagram Aktivitas Mengurutkan Klaster

Berdasarkan Centroid ... 51

Gambar 3.12. Diagram Aktivitas Mengurutkan Data Dalam Klaster ... 52

Gambar 3.13. Diagram Kelas Keseluruhan ... 53

Gambar 3.14. Diagram Kelas ... 54

Gambar 3.15. Diagram Kelas Lanjutan ... 55

Gambar 3.16. Diagram Sequence Memilih File Data ... 66

Gambar 3.17. Diagram Sequence Mengelompokkan Data ... 67

Gambar 3.18. Diagram Sequence Melihat Detail Anggota Setiap Klaster ... 68

Gambar 3.19. Diagram Sequence Melihat Detail Data Hasil Evaluasi Setiap Data ... 68

Gambar 3.20. Diagram Sequence Melihat Rata-Rata Data Setiap Kategori .. 69

Gambar 3.21. Diagram Sequence Melihat Grafik Presentase Anggota Setiap Klaster ... 70

Gambar 3.22. Diagram Sequence Melihat Grafik Presentase Prodi ... 70

(18)

xviii

Gambar 3.24. Diagram Sequence Mengurutkan Klaster

Berdasarkan Centroid ... 71

Gambar 3.25. Diagram Sequence Mengurutkan Klaster Dalam Klaster ... 72

Gambar 3.26. Desain Antar Muka Menu utama ... 73

Gambar 3.27. Desain Antar Muka Submenu ... 73

Gambar 3.28. Desain Antar Muka Pengelompokan Data ... 74

Gambar 3.29. Desain Antar Muka Hasil Pengelompokan Data ... 75

Gambar 3.30. Desain Antar Muka Pie Chart Persentase Klaster ... 76

Gambar 3.31. Desain Antar Muka Hasil Pengelompokan Data Setiap Klaster ... 77

Gambar 3.32. Desain Antar Muka Pie Chart Persentase Prodi Setiap Klaster ... .. 77

Gambar 3.33. Desain Antar Muka Detail Data Hasil Evaluasi Setiap Data ... 78

Gambar 3.34. Desain Antar Muka Bantuan Petunjuk Penggunaan ... 79

Gambar 4.1. Antar Muka Menu Utama ... 80

Gambar 4.2. Antar Muka Input Data ... 81

(19)

xix

Gambar 4.6. Antar Muka Detail Anggota Setiap Klaster ... 84

Gambar 4.7. Antar Muka Pie Chart Persentase Prodi Setiap Klaster ... 84

Gambar 4.8. Antar Muka Lihat Detail Hasil Evaluasi Setiap Data ... 86

Gambar 4.9. Antar Muka Input Dialog Jumlah Kategori ... 86

(20)

xx Daftar Tabel

Tabel 2.1. Data Obat ... 12

Tabel 2.2. Hasil Pengelompokkan Obat dengan K-Means ... 17

Tabel 3.1. Pedoman Label Output P3MP ... 22

Tabel 3.2. Atribut Tabel Hasil Evaluasi ... 23

Tabel 3.3. Urutan Kolom Data Hasil Evaluasi ... 26

Tabel 3.4. Detail Algoritma Method Kelas InputData ... 56

Tabel 3.5. Detail Algoritma Method Kelas Pengelompokan ... 56

Tabel 3.6. Detail Algoritma Method Kelas DetailDataSetiapKlaster ... 62

Tabel 3.7. Detail Algoritma Method Kelas DetailHasilEvaluasiSetiapData ... 64

Tabel 3.8. Detail Algoritma Method Kelas PieChart ... 65

Tabel 4.1. Hasil Percobaan ... 108

Tabel 4.2. Analisis Predikat Data NIP 87 ... 111

Tabel 4.3. Analisis Predikat Data NIP 64 ... 113

(21)

1 1.1. Latar Belakang

Universitas Sanata Dharma (USD) merupakan suatu perguruan tinggi swasta di Yogyakarta yang memiliki sebuah lembaga bernama Pusat Pengembangan dan Penjaminan Mutu Pembelajaran (P3MP). P3MP memiliki tugas untuk menjaga kestabilan kualitas pembelajaran, mengelola komponen pengembangan dan penjaminan mutu pembelajaran, serta mengelola kegiatan peningkatan mutu pembelajaran di USD. Salah satu program yang dilaksanakan P3MP adalah melaksanakan evaluasi kegiatan belajar mengajar di akhir semester. Evaluasi mencakup tiga kategori, yaitu kinerja dosen, konstribusi mahasiswa dan kepuasan mahasiswa terhadap suatu matakuliah. Evaluasi dilakukan dengan kuesioner yang diisi mahasiswa, berjumlah 18 pertanyaan dengan skor penilaian berupa bilangan bulat antara 1 sampai dengan 7.

(22)

2

meningkatkan kualitas pembelajaran di USD secara berkelanjutan.

Dalam tugas akhir ini penulis bermaksud memanfaatkan data-data hasil evaluasi pembelajaran matakuliah-matakuliah yang diselenggarakan oleh prodi-prodi di lingkungan Fakultas Sains dan Teknologi (FST). Pengelompokan menggunakan metodeklastering K-Means.

1.2. Rumusan Masalah

Dari latar belakang masalah di atas dapat dirumuskan masalah :

Bagaimana mengelompokkan hasil evaluasi pembelajaran matakuliah-matakuliah di FST USD kedalam kelompok-kelompok dengan hasil evaluasi yang mirip dengan menggunakan metode klastering K-Means? 1.3. Tujuan dan Manfaat

Tujuan

Mengelompokkan hasil evaluasi pembelajaran matakuliah-matakuliah di FST USD.

Manfaat

Hasil pengelompokan dapat digunakan sebagai bahan pertimbangan bagi prodi maupun P3MP untuk melakukan pendampingan terhadap para dosen dalam aspek proses belajar mengajar dan memfasilitasi terjadinya sharing pengalaman antar kelompok.

1.4. Batasan Masalah

Dalam mengelompokkan matakuliah berdasarkan kinerja dosen, kontribusi mahasiswa dan kepuasan mahasiswa, dilakukan beberapa batasan sebagai berikut

1. Metode yang digunakan adalah metode klastering K-Means.

(23)

pada semester gasal 2008/2009 dan genap 2008/2009.

3. Pengelompokan berdasarkan rata-rata jawaban semua responden untuk setiap pertanyaan yang termuat di kuesioner yaitu pertanyaan nomor 1 sampai 18.

4. Pelabelan klaster hasil klastering didasarkan pada ketentuan pelabelan yang berlaku di P3MP yaitu sangat tinggi, tinggi, cukup, rendah dan sangat rendah.

5. Sistem hanya dapat memproses data input yang berasal dari file xls. 6. Sistem tidak menyediakan fasilitas preprocessing data.

1.5. Metodologi Penelitian

Metode penelitian dilakukan dengan teknik data mining, yaitu :

1. Pembersihan data, yaitu menghilangkan noise dan data yang tidak konsisten.

2. Integrasi data, yaitu menggabungkan bermacam-macam data storage.

3. Seleksi data, yaitu mengambil data yang relevan dari database.

4. Tranformasi data, yaitu mentransformasikan data ke dalam bentuk yang tepat untuk diolah.

5. Penambangan data

Proses pokok mengimplemetasikan metode yang sesuai untuk mengetahui pola. Metode yang digunakan adalahklastering K-Means. 6. Evaluasi pola, yaitu mengidentifikasi pola-pola didasarkan pada

pengukuran yang menarik.

(24)

4

untuk menyajikan informasi hasil penambangan kepada pengguna. 1.6. Sistematika Penulisan

Adapun sistematika penulisan Tugas akhir adalah sebagai berikut : 1. Halaman Judul

2. Abstrak, berisi tentang rangkuman Tugas Akhir. 3. Daftar Isi

4. Bab I Pendahuluan

Pendahuluan berisi tentang latar belakang, rumusan masalah, tujuan dan manfaat, batasan masalah, metodologi penelitian dan sistematika penulisan.

5. Bab II Landasan Teori

Landasan teori berisi tentang teori yang akan digunakan dalam penulisan Tugas Akhir.

6. Bab III Analisis dan Perancangan Sistem

Analisis dan perancangan sistem berisi tentang identifikasi dan analisis sistem, perancangan sistem.

7. Bab IV Implementasi Program

Implementasi Program berisi implementasi program dan analisis hasil. 8. Bab V Kesimpulan dan Saran

(25)

5

2.1 Penambangan Data

Penambangan data (data mining) menarik perhatian dalam bidang industri

dan kalangan masyararakat pada umumnya. Penambangan data berkenaan dengan

pengolahan data dalam skala besar supaya menjadi informasi maupun

pengetahuan yang berguna. Penambangan data yang sering juga disebut

knowledge discovery in database (KDD) merupakan kegiatan pengumpulan data,

pemakaian data historis untuk menemukan keteraturan, pola atau hubungan data

dalam ukuran data yang besar (Santosa, 2007). Penambangan data dapat

digambarkan dalam gambar 2.1 yang terdiri dari langkah-langkah berikut :

Gambar 2.1. Tahap-tahap Data Mining

(26)

6

1. Pembersihan data

Dalam pembersihan data dilakukan pengapusan noise dan data yang tidak

konsisten.

2. Integrasi data

Dalam langkah ini dilakukan penggabungan beberapa data storage.

3. Seleksi data

Yaitu mengambil data yang relevan dari basis data.

4. Transformasi data

Mentransformasikan data ke dalam bentuk yang tepat untuk diolah,

dengan meringkas atau operasi agregasi.

5. Penambangan data

Sebuah proses esensial dimana metode yang tepat diaplikasikan untuk

mengekstrak pola data.

6. Evaluasi pola

Mengidentifikasi pola-pola didasarkan pada pengukuran yang menarik.

7. Presentasi pengetahuan

Menggunakan visualisasi dan presentasi untuk menyajikan informasi hasil

mining kepada user.

2.2 Analisis Pengelompokan (Clustering Analysis)

Clustering analysis merupakan metode penambangan data yang

menerapkan metode unsupervised learning, dimana tidak ada fase learning yaitu

tidak ada training data. Data yang ditambang menggunakan metode ini tidak

memiliki label. Label merupakan output yang dapat menandai kemana data

(27)

ketidakmiripan (dissimilarity). Data yang berada dalam satu kelompok

(intraclass) memiliki kemiripan (similarity) yang tinggi. Sedangkan data yang

berbeda kelompok (interclass) memiliki kemiripan (similarity) yang rendah.

2.3 Klastering K-Means (K-Means Clustering)

K-Means mengambil input parameter, k, dan mempartisi himpunan n

objek ke dalam k klaster. Setiap klaster terdiri dari obyek-obyek yang memiliki

kemiripan yang tinggi dengan data-data dalam klaster tersebut dan memiliki

kemiripan yang rendah terhadap data di klaster lain. Kemiripan klaster diukur

berdasarkan jarak data dengan centroid yaitu nilai rata-rata dari obyek dalam

sebuah klaster.

Cara kerja k-means pertama memilih k obyek secara acak yang

diinisialisasikan sebagai rata-rata klaster atau pusat klaster. Obyek yang lain

ditetapkan menjadi anggota klaster tertentu yang paling mirip dengan obyek

tersebut berdasarkan jarak antara obyek dengan rata-rata klaster. Kemudian

dihitung rata-rata yang baru untuk setiap klaster. Proses ini berulang hingga fungsi

ukuran bertemu di satu titik, yaitu tidak ada perpindahan obyek disetiap klaster.

Tidak ada perpindahan obyek disetiap klaster dapat diartikan dengan tidak ada

perubahan nilai pusat klaster atau jika menggunakan nilai SSE, nilai SSE yang

dihasilkan lebih kecil dari nilai SSE maksimal yang dikehendaki.

Berikut adalah algoritma K-Means :

Input :

k = jumlah klaster

(28)

8

Output :

klaster sebanyak k

Algoritma :

(1) Secara acak memilih k obyek dari D yang di inisialisasikan sebagai

pusat klaster (centroid)

(2) Repeat

(3) Tempatkan setiap objek ke klaster yang memiliki kemiripan

yang tinggi, berdasarkan rata-rata obyek-obyek dalam

klaster

(4) Ubah rata-rata klaster, yaitu hasil perhitungan nilai rata-rata

obyek-obyek di setiap klaster.

(5) Sampai tidak ada perubahan anggota disetiap klaster atau tidak ada

perubahan centroid.

Metode klastering k-means relatif terukur dan efisien dalam mengolah

sekumpulan data yang besar karena kompleksitas komputasi dari algoritma ini

adalah O(nkt), di mana n adalah jumlah total obyek, k adalah jumlah klaster, dan t

adalah jumlah iterasi. Biasanya, k <<n dan t <<n.

Algoritma k-means hanya dapat diterapkan ketika centroid didefinisikan.

Jika pusat klaster belum di definisikan maka tidak ada pusat kemana data akan

dikelompokkan. Kekurangan dari k-means adalah pengguna harus menentukan

jumlah klaster terlebih dahulu. Algoritma K-means peka terhadap noise dan titik

data outlier yang secara substansial dapat mempengaruhi nilai rata-rata.

(29)

Berdasarkan teori klastering k-means, secara random dipilih tiga objek sebagai

pusat klaster awal yang ditandai dengan symbol ‘+’. Setiap objek didistribusikan

ke klaster berdasarkan pusat klaster terdekat. Setiap klaster dikelilingi oleh kurva

putus-putus.

Kemudian pusat klaster diperbaharui. Pusat klaster baru merupakan nilai

rata-rata semua obyek di setiap klaster. Setelah pusat klaster diperbaharui, setiap

obyek didistribusikan kembali ke klaster berdasarkan pusat klaster terdekat,

sehingga dihasilkan klaster-klaster baru seperti pada Gambar 2.2 (B).

Proses iterasi tersebut akan terus berulang selama masih ada obyek yang

berpindah klaster. Jika sudah tidak ada obyek yang berpindah klaster, maka proses

berakhir dan menghasilkan klaster-klaster seperti yang terlihat pada Gambar 2.2

(C).

Gambar 2.2 Pengelompokan Obyek Menggunakan K-Means

Clustering

2.4 Kemiripan dan Ketidakmiripan

Dalam klaster, untuk menggabungkan dua obyek atau lebih menjadi satu

klaster, biasanya digunakan ukuran kemiripan (similarity) dan ketidakmiripan

(30)

10

kesamaan dua buah obyek. Dalam ukuran kemiripan, semakin besar nilai

kemiripan berarti semakin mirip, semakin kecil nilai kemiripan semakin tidak

mirip. Sedangkan ketidakmiripan antara dua obyek adalah ukuran numerik

tingkat perbedaan dua obyek. Dalam ukuran ketidakmiripan, semakin besar nilai

ketidakmiripan berarti semakin tidak mirip, semakin kecil nilai ketidakmiripan

semakin mirip. Semakin mirip dua obyek semakin tinggi peluang untuk

dikelompokkan ke dalam satu klaster. Sebaliknya, semakin tidak mirip semakin

rendah peluang untuk dikelompokkan menjadi satu klaster.

Untuk mengukur kemiripan dan ketidakmiripan obyek-obyek/data-data

dapat digunakan beberapa ukuran. Kemiripan dapat diukur menggunakan cosinus,

kovarian dan korelasi. Ketidakmiripan dapat diukur menggunakan konsep jarak

Euclidean, Manhattan atau Cityblock, Minkowski, Chebyshev dan Mahalanobis.

2.4.1 Euclidean (L2-norm)

Setiap data hasil evaluasi memiliki jumlah atibut yang sama sehingga

pengukuran jarak dapat menggunakan konsep Euclidean. Jarak Euclidean antara

dua data didefinisikan sebagai :

d(a,b)=

a-b

2

=

2

1( i i)

n

i ab

∑= ……….2.1

dimana :

a = obyek pertama

b = obyek kedua

(31)

Untuk membuat klaster beranggotakan data-data yang memiliki kemiripan

tinggi, dapat menggunakan fungsi kriteria yang dapat mengukur kualitas

klastering. Salah satu persamaan yang sering dipakai dan cukup sederhana adalah

jumlah dari kesalahan kuadrat (sum of squared-error, SSE). SSE didefinisikan

sebagai berikut :

∑ ∑

= ∈

− = k

i x D i e

i

m x J

1

2

………2.2

dimana :

Je = SSE

k = jumlah klaster

D = dataset

x = obyek

m = pusat klaster (centroid)

SSE juga dapat dijadikan ukuran untuk penghentian iterasi proses

pengelompokan. Jika nilai SSE hasil pengelompokan lebih kecil dari pada SSE

yang dimasukkan pengguna, maka proses pengelompokan selesai.

2.6 Contoh Kasus K-Means

Berikut adalah contoh penyelesaian kasus dengan algoritma k-means yang

di peroleh dari website dengan alamat :

http://people.revoledu.com/kardi/tutorial/kMean/NumericalExample.

Dalam tabel 2.1 terdapat 4 objek sebagai titik data yang akan

dikelompokkan. Setiap obyek memiliki 2 atribut. Setiap atribut mewakili

(32)

12

Tabel 2.1 Tabel Data Obat

Object

Attribute 1 (X):weight index

Attribute 2 (Y): pH

Medicine A 1 1

Medicine B 2 1

Medicine C 4 3

Medicine D 5 4

2.6.1 Contoh kasus K-Means Tanpa SSE

Data-data dalam tabel 2.1 akan dikelompokkan ke dalam 2 kelompok obat

yang didasarkan pada dua fitur yaitu pH dan indeks berat. Iterasi dalam proses

pengelompokan akan dikendalikan oleh perubahan anggota di setiap klaster.

Gambar 2.3 Koordinat Data Obat

Obyek atribut 1 (X): indeks berat

Obyek atribut 2 (Y): pH

Iterasi 0 :

1. Menentukan nilai awal centroids

(33)

d 2 P E C dengan simb

2. Menguku

Pengukuran j

Euclidean. S

Contoh peng

• Jarak

d(x,y

ol bintang, s

Gambar 2

ur jarak obye

jarak antara

etiap kolom

ghitungan jar

obat C = (4

y) =

1

n i=

=

(4−1

seperti yang

2.4 Koordin

ek ke centro

obyek ke ce

dalam matr

rak obyek ke

, 3) ke centr

2

) (aibi

2 2 ) 1 3 ( )

1 + −

terlihat pada

nat obat iter

id

entroid meng

iks jarak me

e centroid :

roid pertama

=

3,61

a gambar 2.1

rasi ke-0

ggunakan m

elambangkan

a c1(1,1) : 1.

etode jarak

(34)

S

B

c

k

3. M

O d k E m k m y m y • Jarak

d(x,y

Sehingga ma Baris pertam centroid pert kedua. Mengelompo Obyek dikel dikelompokk

kelompok 2 d

Element ma

menunjukan

klaster dan

memiliki nila

yang berarti

memiliki nila

yang berarti o

obat C = (4

y) =

1

n i ∑=

=

(4−2

atriks jarak p

ma dari matri

ama dan bar

okkan obyek

lompokkan

kan ke kelom

dan obat D k

atriks di ba

posisi obye

0 berarti b

ai 1 di kelo

obyek A

ai 0 di kelo

obyek B me

, 3) ke centr

2

) (aibi

2 2 ) 1 3 ( )

2 + −

pada iterasi 0

iks jarak ses

ris kedua ada

k

berdasarkan

mpok 1, ob

ke kelompok

awah ini te

ek terhadap

bukan angg

mpok 1 dan

merupakan

mpok 1 dan

rupakan ang

roid kedua c

=

2.83

0 adalah :

suai dengan

alah jarak se

n jarak min

bat B ke ke

k 2.

erdiri dari

p suatu klas

gota klaster

n memiliki n

anggota ke

n memiliki n

ggota kelomp

c2=(2,1) :

jarak setiap

etiap obyek k

nimum. Jad

elompok 2,

nilai 1 da

ster. 1 berar

r. Misalnya

nilai 0 di ke

elompok 1.

nilai 1 di ke

pok 2 dan se

14

p obyek ke

ke centroid

di, obat A

obat C ke

an 0 yang

(35)

IIterasi 1 : 1. M C k te k 2. M P E Menentukan

Centroid di

kelompok. K

etap di c1=(

klaster kelom

Mengukur ja

Pengukuran j

Euclidean, se

nilai centro

ihitung ber

Kelompok 1

(1,1). Kelom

mpok 2 :

Gambar 2

arak obyek k

jarak data t

ehingga diha id

rdasarkan r

memiliki sa

mpok 2 mem

2.5 Koordin

e pusat klast

terhadap pus

asilkan matri

rata-rata se

atu anggota

miliki tiga an

nat obat iter

ter

sat klaster m

ik jarak :

(36)

I

3. M

O

d

Iterasi 2 :

1. M P k 2. M P E Mengelompo Obyek dike dihasilkan m Menentukan Pusat klaste

kelompok. c1

Mengukur ja

Pengukuran j

Euclidean, se

okkan obyek

elompokkan

matrik kelomp

nilai pusat k

r dihitung ⎜ ⎝ ⎛ + + = 2 1 , 2 2 1 1 Gambar 2

arak obyek k

jarak data t

ehingga diha k n berdasark pok : klaster berdasarkan ⎠ ⎞ ⎜ ⎝ ⎛ = ⎟ ⎠ ⎞ + 1 , 2 1 1 2 1 2.6 Koordin

e pusat klast

terhadap pus asilkan matri kan jarak n rata-rata ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + = 2 4 2 c

nat obat iter

ter

sat klaster m

ik jarak :

minimum, semua data = ⎟ ⎠ ⎞ + + 2 4 3 , 2 5 rasi ke-2 mengggunak 16 sehingga

a di setiap

(37)

D y m H 2 d k p m D 3. M O d

Dari hasil it

yang berpin

means telah

Hasil akhir p

Tab Obje Medicin Medicin Medicin Medicin 2.6.2 Cont Dala dikelompokk koordinat da pengelompo maksimal ya Data-data da Mengelompo Obyek dike dihasilkan m

terasi 2 terl

ndah kelomp

mencapai st

pengelompo

bel 2.2 Tabe

ect

ne A

ne B

ne C

ne D

toh kasus K am tabel 2

kan. Setiap

ari obyek se

okan akan d

ang diingink

alam tabel 2

okkan obyek

elompokkan

matrik kelomp

lihat bahwa

pok lagi. Den

tabilitas dan

kan obat terl

l Hasil Peng

Feature 1 (X

weight ind

1

2

4

5

K-Means Me

2.1 terdapat

p obyek m

eperti yang t

dikendalikan

kan adalah 3.

2.1 akan dik k

n berdasark

pok :

G1=G2, yan

ngan demiki

tidak memb

lihat pada ta

gelompokka

X):

dex Feat

enggunakan

t 4 objek

memiliki 2

terlihat pada

n oleh nilai

.

kelompokkan

kan jarak

ng berarti ba

ian, perhitun

butuhkan iter

abel 2.2.

an Obat den

ture 2 (Y): p

1 1 3 4 n SSE sebagai ti atribut. Set

a gambar 2.4

SSE, dalam

n ke dalam 2

minimum,

ahwa tidak

ngan dari kl

rasi lagi.

ngan K-Mea

pH Group

itik data y

tiap atribut

4. Iterasi da

m kasus ini

2 kelompok

sehingga

ada obyek

lastering

k-ans p (result) 1 1 2 2 yang akan mewakili lam proses nilai SSE

(38)

d

I

didasarkan p

Iterasi 0 :

1. 2. P ja o C

pada dua fitu

Menentukan

Nilai awal p

(1,1) dan c

dilambangk

gambar 2.1.

Mengukur ja

Pengukuran j

arak Euclid

obyek : Contoh peng • Jarak

d(x,y

• Jarak

d(x,y

ur yaitu pH d

n nilai awal p

pusat klaster

c2=(2,1) men

an dengan

arak obyek k

jarak antara

dean. Setiap

ghitungan jar

obat C = (4

y) =

1

n i ∑=

=

(4−1

obat C = (4

y) =

1

n i=

=

(4−2

dan indeks b

pusat klaster

r pertama d

nyatakan koo

simbol bin

ke pusat klas

obyek ke p

kolom dal

rak obyek ke

, 3) ke pusat

2

) (aibi

2 2 ) 1 3 ( )

1 + −

, 3) ke pusat

2

) (aibi

2 2 ) 1 3 ( )

2 + −

erat.

r

dimisalkan o

ordinat pusa

ntang, seper

ster

pusat klaster

lam matriks

e pusat klaste

t klaster pert

=

3.61

t klaster kedu

=

2.83

obat A dan o

at klaster. pu

rti yang ter

menggunak

jarak mela

er:

tama c1(1,1)

ua c2=(2,1)

18

obat B. c1=

(39)

B p p 3. M O d k E m k m y m y 4. M N Baris pertam pusat klaster pusat klaster Mengelompo Obyek dikel dikelompokk

kelompok 2 d

Element ma menunjukan klaster dan memiliki nila yang berarti memiliki nila

yang berarti o

Menghitung

Pusat klaste

c1=(1,1)

Nilai SSE ak

ma dari matri

r pertama d

kedua.

okkan obyek

lompokkan

kan ke kelom

dan obat D k

atriks di ba

posisi obye

0 berarti b

ai 1 di kelo

obyek A

ai 0 di kelo

obyek B me

pusat klaster

r yang baru

kan dihitung

iks jarak ses

an baris ked

k

berdasarkan

mpok 1, ob

ke kelompok

awah ini te

ek terhadap

bukan angg

mpok 1 dan

merupakan

mpok 1 dan

rupakan ang

r yang baru

:

g menggunak

suai dengan

dua adalah

n jarak min

bat B ke ke

k 2.

erdiri dari

p suatu klas

gota klaster

n memiliki n

anggota ke

n memiliki n

ggota kelomp

dan nilai SS

kan persama

jarak setiap

jarak setiap

nimum. Jad

elompok 2,

nilai 1 da

ster. 1 berar

r. Misalnya

nilai 0 di ke

elompok 1.

nilai 1 di ke

pok 2 dan se

SE

aan 2.2. Seh

p obyek ke

p obyek ke

di, obat A

obat C ke

an 0 yang

(40)

I

S

N

p

it

Iterasi 1 :

1. M P k te k 2. M P E 3. M O d

SSE di iteras

SSE = ||1

||4

= 0

Nilai SSE ya

pada iterasi

terasi akan b

Menentukan

Pusat klaste

kelompok. K

etap di c1=(

klaster kelom Mengukur ja Pengukuran Euclidean, se Mengelompo Obyek dike dihasilkan m

si 0 adalah :

1-1||2 + ||1-1|

4-3.67||2 + ||3

+ 0 + 2.79

ang dikehen

0 adalah 9.3

berlanjut.

nilai pusat k

r dihitung

Kelompok 1

(1,1). Kelom

mpok 2 :

arak obyek k

jarak data

ehingga diha

okkan obyek

elompokkan

matrik kelomp

|2 + ||2-3.67|

3-2.67||2

+||5-+ 2.79 +||5-+ 0.1

ndaki adalah

34, karena 9

klaster

berdasarkan

memiliki sa

mpok 2 mem

e centroid a terhadap asilkan matri k n berdasark pok :

|2 + ||1-2.67||

-3.67||2 +

||4-1+0.11 + 1.

h 3 dan nilai

9.34 tidak le

n rata-rata

atu anggota

miliki tiga an

centroid m

ik jarak :

kan jarak 2

+

-2.67||2

77+1.77 = 9

i SSE yang

ebih kecil da

semua data sehingga pu nggota, sehin mengggunaka minimum, 20 9.34 dihasilkan

ari 3 maka

a di setiap

usat klaster

ngga pusat

an metode

(41)

4. M c c S N p s Menghitung ⎜ ⎝ ⎛ +

= ,1

2 2 1 1 c ⎜ ⎝ ⎛ +

= ,3

2 5 4

2

c

SSE di iteras

SSE = ||1

||4

= 0.

Nilai SSE ya

pada iterasi selesai. pusat klaster ⎜ ⎝ ⎛ = ⎟ ⎠ ⎞ + 1 , 2 1 1 2 1 ⎜ ⎝ ⎛ = ⎟ ⎠ ⎞ + 2 1 4 2 4 3

si 1 adalah :

1-1.5||2 +

||1-4-4.5||2 +

||3-.25 + 0 + 0.2

ang dikehen

1 adalah 1.7

r baru dan n

⎟ ⎠ ⎞ 1 ⎟ ⎠ ⎞ 2 1 3 , 2 1

-1||2 + ||2-1.5

-3.5||2 +||5-4.

25 + 0.25+ 0

ndaki adalah

75, karena 1

ilai SSE

||2 + ||1-1.5||2

5||2 + ||4-3.5|

0.25 + 0.25 +

h 3 dan nilai

.75 lebih ke 2

+

||2

+ 0.25 +0.25

i SSE yang

ecil dari 3 m = 1.75

dihasilkan

(42)

22

 

Bab III

ANALISIS DAN PERANCANGAN SISTEM

3.1 Identifikasi dan Analisis Sistem

Pusat Pengembangan dan Penjaminan Mutu Pembelajaran (P3MP)

merupakan sebuah lembaga milik Universitas Sanata Dharma (USD). P3MP

memiliki tugas untuk menjaga kestabilan kualitas pembelajaran, mengelola

komponen pengembangan dan penjaminan mutu pembelajaran, serta mengelola

kegiatan peningkatan mutu pembelajaran di USD. P3MP setiap akhir semester

melakukan evaluasi terhadap pelaksanaan matakuliah. Evaluasi mencakup tiga

kategori, yaitu kinerja dosen, kontribusi mahasiswa dan kepuasan mahasiswa yang

tercakup dalam 18 pertanyaan.

Dalam tugas akhir ini akan dikelompokkan data hasil evaluasi ke dalam

kelompok-kelompok yang memiliki kemiripan yang tinggi. Data yang

dikelompokkan adalah data hasil evaluasi di Fakultas Sains dan Teknologi (FST)

USD pada semester gasal 2008/2009 dan semester genap 2008/2009.

Pengelompokan berdasarkan 18 pertanyaan yang termuat dalam kuesioner. Data

semester gasal 2008/2009 yang diperoleh berjumlah 62 record. Data semester

genap 2008/2009 yang diperoleh berjumlah 74 record. Hasil pengelompokan akan

diberi label menurut ketentuan yang berlaku di P3MP, yaitu :

Tabel 3.1 Tabel Pedoman Label Output P3MP

Skala Nilai Persentase Label

5,6 – 7 80% - 100% sangat tinggi

(43)

3,22 – 3,91 46% - 55% Rendah

… – 3,22 … - 46% sangat rendah

3.2 Perancangan Sistem 3.2.1 Input

Sistem yang akan dibuat menerima inputan yang berupa data hasil evaluasi

pembelajaran. Dalam tugas akhir ini data yang digunakan adalah data di Fakultas

Sains dan Tekonologi (FST). FST mencakup prodi Teknik Informatika, Teknik

Elektro, Teknik Mesin, Mekatronika, Matematika dan Fisika. Data hasil evaluasi

diperoleh dari P3MP Universitas Sanata Dharma. Satu record data hasil evaluasi

merupakan data satu matakuliah. Data evaluasi mencakup prodi, NIP dosen,

namaDosen, nama matakuliah, fakultas dan nilai rata-rata jawaban semua

responden untuk setiap pertanyaan yang termuat dalam kesioner. Data evaluasi

mencakup 23 atribut, yaitu :

Tabel 3.2 Atribut Data Hasil Evaluasi

Nama Atribut Penjelasan Nilai

prodi Atribut ini menyimpan nama prodi.

Data berupa nama-nama program studi. Data prodi tidak termasuk dalam atribut yang akan dihitung jaraknya, tetapi hanya sebagai identitas prodi penyelenggara matakuliah.

NIP Atribut ini menyimpan nama dosen.

(44)

24

 

sebagai identitas dosen pengampu matakuliah.

namaDosen Atribut ini menyimpan nama dosen.

Data berupa nama dosen yang mengampu mata kuliah yang dievaluasi. Data dosen yang dipakai dalam tugas akhir bukan nama yang sebenarnya,

melainkan nama samaran mengingat kerahasiaan data.

Nama matakuliah

Atribut ini menyimpan nama matakuliah beserta kelasnya

Nama-nama kelas dan matakuliah di prodi FST, misalnya Kalkulus A, Kalkulus B, Ststistik A dll. Data matakuliah tidak termasuk dalam atribut yang akan dihitung jaraknya, tetapi hanya sebagai identitas matakuliah.

Fakultas Atribut ini menyimpan nama fakultas.

Data berupa nama-nama fakultas. Data fakultas tidak termasuk dalam atribut yang akan dihitung jaraknya, tetapi hanya sebagai identitas prodi matakuliah.

rt1

Atribut ini menyimpan nilai rata-rata jawaban semua responden pertanyaan nomor 1 dalam kuesioner.

Skala nilai 1 sampai 7

rt2

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 2 dalam kuesioner.

Skala nilai 1 sampai 7

rt3

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 3 dalam kuesioner.

Skala nilai 1 sampai 7

rt4

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 4 dalam kuesioner.

Skala nilai 1 sampai 7

rt5

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 5 dalam kuesioner.

Skala nilai 1 sampai 7

rt6 Atribut ini menyimpan

(45)

nomor 6 dalam kuesioner.

rt7

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 7 dalam kuesioner.

Skala nilai 1 sampai 7

rt8

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 8 dalam kuesioner.

Skala nilai 1 sampai 7

rt9

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 9 dalam kuesioner.

Skala nilai 1 sampai 7

rt10

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 10 dalam kuesioner.

Skala nilai 1 sampai 7

rt11

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 11 dalam kuesioner.

Skala nilai 1 sampai 7

rt12

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 12 dalam kuesioner.

Skala nilai 1 sampai 7

rt13

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 13 dalam kuesioner.

Skala nilai 1 sampai 7

rt14

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 14 dalam kuesioner.

Skala nilai 1 sampai 7

rt15

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 15 dalam kuesioner.

(46)

26

 

rt16

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 16 dalam kuesioner.

Skala nilai 1 sampai 7

rt17

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 17 dalam kuesioner.

Skala nilai 1 sampai 7

rt18

Atribut ini menyimpan nilai rata-rata jawaban responden pertanyaan nomor 18 dalam kuesioner.

Skala nilai 1 sampai 7

Data pertanyaan untuk setiap nomor tercantum dalam lampiran.

3.2.2 Pemrosesan Awal Data

Sebelum data diolah menggunakan sistem yang akan dibuat, dilakukan

pemrosesan awal data terlebih dulu. Sistem tidak menyediakan fasilitas

preprocessing data sehingga pemrosesan awal data dilakukan secara manual.

1) Mengatur urutan kolom data

Pada proses ini dilakukan pengurutan atribut (kolom) data. Urutan

kolom data yang akan diolah sistem adalah sebagai berikut :

Tabel 3.3 Urutan Kolom Data Hasil Evaluasi

Urutan kolom

Nama kolom

1

Prodi

2

NIP

3

Nama Dosen

4

Nama Matakuliah

5

(47)

7 Rata pertanyaan no 2  8 Rata pertanyaan no 3  9 Rata pertanyaan no 4  10 Rata pertanyaan no 5  11 Rata pertanyaan no 6  12 Rata pertanyaan no 7  13 Rata pertanyaan no 8  14 Rata pertanyaan no 9  15 Rata pertanyaan no 10  16 Rata pertanyaan no 11  17 Rata pertanyaan no 12  18 Rata pertanyaan no 13  19 Rata pertanyaan no 14  20 Rata pertanyaan no 15  21 Rata pertanyaan no 16  22 Rata pertanyaan no 17  23 Rata pertanyaan no 18 

2) Membersihkan data kosong

Pada langkah ini dilakukan pembersihan record atau baris yang

datanya tidak lengkap. K-means menggunakan rata-rata klaster

(48)

28

 

yang tidak berisi data hasil evaluasi akan mempengaruhi rata-rata

klaster (centroid).

3) Menyeragamkan nilai varibel prodi

Pada langkah ini dilakukan penyamaan nama prodi. Sistem memiliki

fasilitas melihat persentase prodi di setiap klaster, sehingga nama prodi

harus disamakan. Misalnya dalam data mentah yaitu data yang belum

dilakukan pemrosesan awal data, untuk prodi D3 Mekatronika terdapat

dua nilai yaitu D3 Meka dan D3 Mekatornika. Jika kedua nilai tersebut

tidak diseragamkan, maka akan dianggap menjadi dua nilai yang

berbeda.

3.2.3 Proses

1) Membaca data

Pada proses ini sistem akan membaca data-data hasil evaluasi dalam

bentuk file excel (xls). Data evaluasi mencakup informasi prodi, kode

dosen, nama dosen, nama matakuliah, fakultas dan nilai rata-rata

jawaban semua responden untuk setiap pertanyaan yang termuat dalam

kesioner.

2) Menginisialisasikan jumlah klaster k

Jumlah klaster yang diinisialisasikan tergantung dari masukan

pengguna.

3) Menginisialisasikan centroid

Pada awal proses, pusat klaster dipilih oleh sistem secara acak

(49)

rata-jumlah klaster yang dimasukkan pengguna.

4) Menghitung jarak antara data dengan pusat klaster

Pada tahap ini dilakukan penghitungan jarak antara setiap obyek

dengan setiap pusat klaster. Untuk menghitung jarak obyek dengan

pusat klaster digunakan konsep jarak Euclidean dengan persamaan no

2.1.

5) Mengelompokkan data-data ke dalam kelompok-kelompok

Hasil penghitungan jarak pada proses nomor 5 digunakan untuk

mengelompokkan obyek-obyek ke centroid. Jarak setiap obyek dengan

pusat klaster- pusat klaster akan dibandingkan. Pengelompokan

obyek-obyek didasarkan pada jarak terdekat antara obyek-obyek dengan pusat

klaster.

6) Menghitung nilai SSE

Jika pengguna menghendaki penggunaan SSE, SSE dihitung setelah

data dikelompokkan.

7) Menghitung validasi hasil pengelompokan

Validasi hasil pengelompokan data hasil evaluasi dihitung dengan

membandingkan predikat evaluasi setiap data dengan label klaster

dimana data tersebut berkelompok.

8) Menampilkan hasil pengelompokan sebagai output

Hasil pengelompokan akan ditampilkan sebagai output.

3.2.4 Output

(50)

30

 

1) Jumlah data

Sistem akan menampilkan jumlah data yang dikelompokkan.

2) Jumlah klaster

Sistem akan menampilkan jumlah klaster yang di inputkan pengguna.

3) Jumlah iterasi

Sistem akan menampilkan jumlah iterasi yang terjadi dalam proses

pengelompokan data.

4) Centroid terakhir

Sistem akan menampilkan nilai rata-rata centroid terakhir untuk setiap

klaster.

5) Jumlah anggota tiap klaster

Sistem akan menampilkan jumlah anggota setiap klaster.

6) Anggota tiap klaster

Sistem akan menampilkan anggota tiap klaster.

7) Nilai SSE

Sistem akan menampilkan nilai SSE yang dapat dicapai sistem.

8) Validasi hasil pengelompokan

Sistem akan menampilkan tingkat validasi pengelompokan.

9) Nilai rata-rata data setiap pertanyaan

Sistem akan menampilkan detail rata-rata setiap data untuk setiap

pertanyaan.

10)Nilai rata-rata setiap kategori

Sistem akan menampilkan nilai rata-rata untuk setiap kategori

(51)

11)Diagram Pie (Pie Chart)

Sistem akan menampilkan diagram pie persentase anggota semua

klaster dan diagram pie persentase prodi untuk setiap klaster.

3.3 Perancangan 3.3.1 Diagram Konteks

 

(52)

32

 

3.3.2 Diagram Use Case

Mengelompokkan data Memilih file data

Melihat detail anggota tiap klaster

<<depends on>>

Pengguna

<<depends on>>

Melihat detail hasil evaluasi setiap data

<<depends on>>

Melihat rata data setiap kategori

<<depends on>>

Melihat grafik persentase prodi

Melihat grafik persentase klaster

Menyimpan hasil pengelompokan

<<depends on>> <<depends on>>

Mengurutkan klaster berdasarkan centroid

<<uses>>

<<uses>>

Mengurutkan data dalam klaster

<<depends on>>

Gambar 3.2 Diagram Use Case

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi :

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Memilih File Data Jenis Use Case :

Kebutuhan Bisnis

ID usecase 1

Prioritas Tinggi

(53)

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan pengguna memilih tabel data yang akan dikelompokkan.

Pra-kondisi Sistem belum memiliki data yang akan dikelompokkan

Pemicu Aktor ingin memasukkan tabel data

Langkah umum Aksi Aktor Respon Sistem

Langkah 1 : Aktor memilih halaman pengelompokan data

Langkah 3 : Aktor memilih data dalam bentuk file excel yang akan dikelompokkan.

Langkah 2 : memberikan halaman pengelompokan data

Langkah 4: menampilkan kotak dialog pemilihan nomor pertanyaan dalam kuesioner yang akan dikelompokkan.

Langkah 6 : Data yang dipilih di perlakukan sebagai obyek yang ditambahkan ke vector data dan ditampilkan ke tabel output.

Langkah 5 : Aktor memilih pertanyaan yang akan dikelompokkan

Langkah 7 : Aktor memasukkan jumlah klaster dan nilai SSE jika dikehendaki.

Langkah alternatif

Kesimpulan Use case ini selesai jika sistem telah menampilkan data yang dipilih aktor ke dalam tabel.

Pasca kondisi Sistem memiliki masukan data yang akan

dikelompokkan

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

(54)

34

 

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi :

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Mengelompokkan Data Jenis Use Case :

Kebutuhan bisnis

ID usecase 2

Prioritas Tinggi

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan pengguna

mengelompokkan data hasil evaluasi.

Pra-kondisi Aktor sudah memilih data yang akan dikelompokkan, memasukkan jumlah klaster dan nilai SSE.

Pemicu Aktor ingin mengelompokkan data

Langkah umum Aksi Aktor Respon Sistem

Langkah 1 : Aktor mengklik tombol proses.

Langkah 2 : Sistem menangkap jumlah klaster dan nilai SSE yang diinputkan pengguna. Sistem memilih centroid secara random. Sistem menghitung jarak tiap data dengan setiap centroid menggunakan persamaan

euclidean. Sistem mengelompokkan data berdasarkan jarak terkecil antara setiap data dengan

setiap centroid. Penghentian iterasi pengelompokan didasarkan

(55)

Langkah 3 : Setelah pengelompokkan semua data selesai, sistem akan memberi label klaster berdasarkan ketentuan P3MP. Pemberian label berdasarkan rata-rata tiap klaster.

Langkah 4 : Sistem menghitung validitas hasil pengelompokan.

Penghitungan validitas dilakukan dengan membandingkan label

klaster hasil pengelompokan sistem

dengan label setiap data. Sistem menampilkan data hasil pengelompokkan.

Langkah alternatif

Kesimpulan Use case ini selesai jika sistem sudah menampilkan data hasil pengelompokan.

Pasca kondisi Data-data yang dimasukkan telah dikelompokkan ke dalam klaster-klaster.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

(56)

36

 

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi :

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Melihat Detail Anggota Setiap Klaster

Jenis Use Case :

Kebutuhan Bisnis ID usecase 3

Prioritas Tinggi

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan pengguna melihat data setiap klaster.

Pra-kondisi Data telah dikelompokkan ke dalam klaster-klaster.

Pemicu Aktor ingin mengetahui data-data setiap klaster.

Langkah umum Aksi aktor Respon sistem

Langkah 1 : Aktor mengklik klaster yang datanya akan dilihat secara detail.

Langkah 2 : Sistem menangkap klaster yang dipilih aktor. Sistem menampilkan semua data yang menjadi anggota klaster yang dipilih.

Langkah alternatif

Kesimpulan Use case ini selesai jika sistem telah menampilkan semua angota dari klaster yang dilihat.

Pasca kondisi Hasil pengelompokan data hasil evaluasi ditampilkan berdasarkan klaster-klaster.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

(57)

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi : Masalah terbuka -

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Melihat Detail Hasil Evaluasi Setiap Data

Jenis Use Case :

Kebutuhan Bisnis ID usecase 4

Prioritas Sedang

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan pengguna melihat detai data hasil evaluasi setiap data.

Pra-kondisi Data setiap pertanyaan dalam kuesioner ditampilkan.

Pemicu Aktor ingin mengetahui nilai data evaluasi untuk setiap pertanyaan.

Langkah umum Aksi aktor Respon sistem

Langkah 1 : Aktor mengklik data yang akan dilihat secara detail nilai hasil evaluasi setiap pertanyaan yang termuat dalam kuesioner.

Langkah 2 : Sistem menangkap urutan data yang dipilih aktor. Sistem menampilkan nilai hasil evaluasi setiap pertanyaan yang termuat dalam kuesioner.

Langkah alternatif

(58)

38

 

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi : dalam kuesioner.

Pasca kondisi Nilai hasil evaluasi setiap pertanyaan yang termuat dalam kuesioner telah ditampilkan.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

Masalah terbuka -

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Melihat Rata Data Setiap Kategori

Jenis Use Case :

Kebutuhan Bisnis ID usecase 5

Prioritas Tinggi

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan pengguna melihat rata-rata data hasil evaluasi untuk setiap kategori.

Pra-kondisi Data hasil evaluasi setiap data ditampilkan per pertanyaan.

Pemicu Aktor ingin mengetahui rata-rata data evaluasi untuk setiap kategori.

(59)

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi : mengklik tombol liat rata

data tiap kategori.

Langkah 3 : Aktor memasukkan jumlah kategori yang dikehendaki

Langkah 5 : Aktor memasukkan nomor awal pertanyaan dan nomor akhir pertanyaan untuk setiap kategori

menampilkan kotak dialog untuk inputan jumlah kategori yang diinginkan pengguna.

Langkah 4 : Sistem menampilkan form inputan nomor pertanyaan untuk setiap kategori.

Langkah 6 : Sistem menghitung rata-rata data berdasarkan kategori.

Langkah alternatif

Kesimpulan Use case ini selesai jika sistem telah menampilkan nilai rata-rata hasil evaluasi untuk setiap kategori.

Pasca kondisi Nilai rata-rata tiap kategori telah ditampilkan.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

Masalah terbuka -

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Melihat Grafik Presentase Anggota Setiap Klaster

Jenis Use Case :

Kebutuhan Bisnis

ID usecase 6

(60)

40

 

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan pengguna melihat

persentase jumlah anggota setiap klaster.

Pra-kondisi Data hasil evaluasi telah dikelompokkan kedalam klaster-klaster.

Pemicu Aktor ingin melihat persentase jumlah anggota setiap klaster.

Langkah umum Aksi aktor Respon sistem

Langkah 1 : Aktor mengklik tombol grafik.

Langkah 2 : Sistem menampilkan grafik persentase anggota setiap klaster dalam bentuk pieChart.

Langkah alternatif

Kesimpulan Use case ini selesai jika sistem telah menampilkan grafik persentase anggota setiap klaster dalam bentuk pieChart .

Pasca kondisi Persentase jumlah anggota setiap klaster ditampilkan dalam bentuk pieChart.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

(61)

Versi :

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Melihat Grafik Presentase Prodi

Jenis Use Case :

Kebutuhan Bisnis ID usecase 7

Prioritas Sedang

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan pengguna melihat

persentase jumlah prodi setiap klaster.

Pra-kondisi Detail anggota setiap klaster telah ditampilkan.

Pemicu Aktor ingin melihat persentase jumlah prodi setiap klaster.

Langkah umum Aksi aktor Respon sistem

Langkah 1 : Aktor mengklik tombol grafik.

Langkah 2 : Sistem menampilkan grafik persentase jumlah prodi setiap klaster dalam bentuk pieChart.

Langkah alternatif

Kesimpulan Use case ini selesai jika sistem telah menampilkan grafik persentase jumlah prodi setiap klaster dalam bentuk pieChart .

Pasca kondisi Persentase jumlah prodi setiap klaster ditampilkan dalam bentuk pieChart.

Aturan bisnis -

Batasan

(62)

42

 

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi : spesifikasi

Asumsi -

Masalah terbuka -

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Menyimpan Hasil Klastering

Jenis Use Case :

Kebutuhan Bisnis ID usecase 8

Prioritas Sedang

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan sistem menyimpan data hasil klastering ke dalam file excel.

Pra-kondisi Data sudah dikelompokan.

Pemicu Aktor ingin menyimpan data hasil pengelompokan.

Langkah umum Aksi aktor Respon sistem

Langkah 1 : Aktor melakukan

pengelompokan data.

Langkah 2 : Sistem membuat nama file dan menuliskan data hasil pengelompokan ke file excel, kemudian file excel disimpan.

Langkah alternatif

(63)

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi : bentuk file excel.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

Masalah terbuka -

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Mengurutkan Klaster Berdasarkan Centroid Klaster

Jenis Use Case :

Kebutuhan Bisnis

ID usecase 9

Prioritas Sedang

Sumber -

Pelaku bisnis utama Pengguna

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan sistem mengurutkan klaster-klaster berdasarkan rata-rata centroid setiap klaster, mulai dari centroid terbesar sampai cenroid terkecil.

Pra-kondisi Data sudah dikelompokan.

Pemicu Aktor ingin melihat klaster-klaster hasil

pengelompokan.

(64)

44

 

Pengarang : Hertartik Clarasita Devy Tanggal : 18 November 2009

Versi : Langkah 1 : Aktor

mengklik tombol proses.

Langkah 2 : Sistem menghitung rata-rata centroid setiap klaster.

Langkah 3 : Sistem mengurutkan klaster-klaster berdasarkan rata-rata centroid, mulai dari centroid terbesar sampai terkecil.

Langkah 3 : Sistem menyimpan klaster-klaster yang sudah diurutkan.

Langkah alternatif

Kesimpulan Use case ini selesai jika sistem telah menyimpan klaster-klaster yang sudah diurutkan.

Pasca kondisi Klaster-klaster sudah terurut mulai dai centroid terbesar sampai terkecil.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

Masalah terbuka -

Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran Universitas Sanata Dharma

Nama Usecase Mengurutkan Data Dalam Klaster

Jenis Use Case :

Kebutuhan Bisnis

ID usecase 10

Prioritas Sedang

(65)

Pelaku partisipan -

Partisipan lain -

Deskripsi Use case ini menggambarkan sistem mengurutkan data-data dalam klaster-klaster berdasarkan rata-rata centroid setiap data atau prodi yang dimiliki data, mulai dari centroid terbesar sampai cenroid terkecil atau mulai dari prodi dari abjad a sampai z.

Pra-kondisi Aktor melihat detail data dalam klaster.

Pemicu Aktor ingin melihat data-data dalam klaster secara terurut.

Langkah umum Aksi aktor Respon sistem

Langkah 1 : Aktor memilih urut data berdasarkan centroid data atau prodi data.

Langkah 2 : Jika aktor memilih urut data berdasarkan centroid maka sistem menghitung rata-rata centroid setiap data.

Kemudian sistem mengurutkan data-data dalam klaster-klaster berdasarkan rata-rata centroid data, mulai dari centroid terbesar sampai terkecil.

Langkah 2 : Jika aktor memilih urut data berdasarkan prodi maka sistem membandingkan prodi setiap data dan mengurutkan data-data dalam klaster-klaster berdasarkan prodi data.

Langkah 3 : Sistem menyimpan klaster-klaster yang sudah diurutkan.

Langkah alternatif

(66)

46

 

3.3.3 Diagram Aktivitas

a) Diagram Aktivitas Memilih File Data

Gambar 3.3 Diagram Aktivitas Memilih Tabel Data

Pasca kondisi Klaster-klaster sudah terurut mulai dai centroid terbesar sampai terkecil.

Aturan bisnis -

Batasan

implementasi dan spesifikasi

-

Asumsi -

(67)
(68)

48

 

c) Diagram Aktivitas Melihat Detail Anggota Setiap Klaster

  Gambar 3.5 Diagram Aktivitas Melihat Detail Data Setiap Klaster

d) Diagram Aktivitas Melihat Detail Nilai Hasil Evaluasi Setiap Data

Gambar 3.6 Diagram Aktivitas Melihat Detail Data Hasil Evaluasi Setiap Data

(69)

  Gambar 3.7 Diagram Aktivitas Melihat Rata-rata Data Setiap Kategori

f) Diagram Aktivitas Melihat Grafik Presentase Anggota Setiap Klaster

    

(70)

50

 

g) Diagram Aktivitas Melihat Grafik Presentase Prodi

Gambar 3.9 Diagram Aktivitas Melihat Grafik Presentase Prodi

h) Diagram Aktivitas Menyimpan Hasil Pengelompokan

(71)
(72)

52

 

j) Diagram Aktivitas Mengurutkan Data Dalam Klaster

(73)

<<Controller>> Pengelompokan <<Controller>> DetailDataSetiapKlaster <<Controller>> DetailHasilEvaluasiSetiapData <<boundary>> DetailDataSetiapKlaster Menggunakan Menggunakan Menggunakan Menggunakan Me ngirim M emiliki Me mili ki 1 1 1 1 1…* 1…* 1…* 1 1…* M engg unaka n Memiliki Memiliki <<boundary>> Input Data <<boundary>> Pengelompokan Data DetailHasilEvaluasiSetiapData <<Controller>> InputData HasilEvaluasi Cluster 1 1…* 1 1 1 1 1…* Centroid Mem iliki Memiliki 1 1…* <<Controller>> Pie Chart 1 1 1 1 Me ngg unaka n Men ggun akan Me mili ki Menggunakan <<boundary>> PilihAtribut <<Controller>> PilihAtribut 1 1 M eng guna kan

(74)

54

 

 

(75)

 

(76)

56

 

 

3.3.5 Algoritma Method Dalam Setiap Kelas a) Detail Algoritma Method Kelas InputData

Tabel 3.4 Detail Algoritma Method Kelas InputData

Nama

Method Tugas Method Algoritma Method

bacaFile

Method bacaFile bertugas membaca data input dan menjadikan data tersebut sebagai obyek dari kelas HasilEvaluasi

1.Menangkap/ membaca file yang dipilih pengguna.

2.Membaca banyak kolom dan banyak baris data.

3.Membaca semua data yang ada dalam file yang telah dipilih.

4.Data yang telah dibaca dijadikan obyek yang bertipe HasilEvaluasi.

b) Detail Algoritma Method Kelas Pengelompokan

Tabel 3.5 Detail Algoritma Method Kelas Pengelompokan

Nama

Method Tugas Method Algoritma Method

pengelompok anData Method pengelompokanDa ta bertugas membuat klaster dan mendeklarasikan pusat awal klaster

1. Membuat klaster sebanyak klaster yang dimasukkan pengguna.

2. Mendeklarasikan centroid awal setiap klaster dengan cara memanggil method

declareCentroid. iterasi Method iterasi bertugas melakukan serta menghentikan iterasi pengelompokan

1.Memanggil method Euclidean.

2.Memanggil method pindahData.

3.Memanggil method untuk menghitung centroid. declareCentr oid Method declareCentroid bertugas mendeklarasikan

1. Untuk sebanyak jumlah klaster lakukan langkah 2.

(77)

menjadi centroid di klaster lain atau belum, jika sudah lakukan kembali ke langkah nomor 2. Jika belum menjadi centroid di klaster lain, lakukan langkah 4.

4. Mendeklarasikan data yang telah dipilih menjadi centroid klaster.

euclidean

Method euclidean bertugas

menghitung jarak setiap data dengan centroid setiap klaster

1. Untuk i=0 sampai i < jumlah data lakukan langkah nomor 2.

2. Untuk j=0 sampai j < jumlah klaster lakukan langkah nomor 3.

3. Untuk k=0 sampai k < jumlah pertanyaan kuesioner, lakukan langkah nomor 4.

4. Hitung selisih nilai hasil evaluasi antara data i dengan centroid klaster j dengan persamaan euclidean. Jika k < jumlah pertanyaan ulangi langkah 4. pindahData Method pindahData bertugas menempatkan setiap data ke klaster yang memiliki jarak terdekat

1. Untuk setiap data dan setiap klaster, cari yang memiliki jarak terdekat. Jika pencarian jarak terdekat sudah selesai, lakukan langkah nomor 2.

2. Tempatkan data ke klaster yang memiliki jarak terdekat berdasarkan pencarian pada langkah nomor 1. hitungCentro id Method hitungCentroid bertugas mengitung centroid klaster tanpa menghitung nilai SSE

1. Untuk i=0 sampai i < jumlah klaster, lakukan langkah 2.

2. Untuk j=0 sampai j < jumlah atribut pertanyaan, lakukan langkah 3.

3. Untuk k=0 sampai k< jumlah anggota klaster i, lakukan langkah 4.

4. Menghitung jumlah data hasil evaluasi atribut ke-j semua anggota yang menjadi anggota klaster i. jika k ≥ jumlah anggota klaster i lakukan langkah 5.

(78)

58

 

6. Menghitung klaster yang centroidnya tidak berubah dan klaster i diset dengan nilai centroid yang baru. Set i=i+1. Jika i<jumlah klaster, ulangi langkah 2. Jika i ≥jumlah klaster lakukan langkah nomor 7.

7. Cek

Gambar

Gambar 2.1. Tahap-tahap Data Mining
Tabel 2.1 Tabel Data Obat
Gambar 3.7 Diagram Aktivitas Melihat Rata-rata Data Setiap Kategori
Tabel 3.6 Detail Algoritma Method Kelas DetailDataSetiapKlaster
+7

Referensi

Dokumen terkait