• Tidak ada hasil yang ditemukan

TINJAUAN PUSTAKA

2.1 Dasar Teori

2.1.1 Sistem Pendukung Keputusan (SPK)

Sistem Pendukung Keputusan (SPK) pertama kali didefinisikan oleh Scott-Morton pada tahun 1970 sebagai sistem berbasis komputer yang interaktif, yang membantu pengambil keputusan memanfaatkan data dan model untuk menyelesaikan masalah tidak terstruktur. Sistem pendukung keputusan diharapkan dapat mendukung para pengambil keputusan manajerial dalam situasi semi terstruktur dan tidak terstruktur. Sistem pendukung keputusan dimaksudkan untuk menjadi alat bantu bagi para pengambil keputusan untuk memperluas kapabilitas mereka, namun tidak untuk menggantikan penilaian mereka (Turban et al, 2011).

Menurut Turban et al (2011), sistem pendukung keputusan terdiri dari empat subsistem, yaitu:

1. Subsistem Manajemen Data

Subsistem manajemen data mencakup suatu database yang berisi data yang relevan untuk situasi dan dikelola oleh perangkat lunak yang disebut Database Management System (DBMS). Manajemen data dapat diinterkoneksikan dengan data warehouse perusahaan, suatu repositori untuk data perusahaan yang relevan untuk pengambilan keputusan. Biasanya data dimasukkan dan diakses melalui

database Web Server.

2. Subsistem Manajemen Model

Subsistem manajemen model merupakan suatu paket perangkat lunak yang mencakup model keuangan, statistik, ilmu manajemen, atau model kuantitatif lainnya yang memberikan kemampuan analitik dan manajemen perangkat lunak yang sesuai. Perangkat lunak ini sering disebut Model Base Management System

(MBMS).

3. Subsistem Antarmuka Pengguna

Pengguna berkomunikasi dan memerintahkan SPK melalui subsistem antarmuka pengguna. Pengguna dianggap sebagai bagian dari sistem. Peneliti

commit to user

menegaskan bahwa beberapa kontribusi yang unik dari SPK berasal dari interaksi yang intensif antara komputer dan pengambil keputusan. Web Browser

menyediakan struktur antarmuka Graphical User Interface (GUI) yang familier dan konsisten. Istilah antarmuka pengguna mencakup semua aspek komunikasi antara pengguna dengan sistem.

4. Subsistem Manajemen Berbasis Pengetahuan

Subsistem manajemen berbasis pengetahuan dapat mendukung subsistem lain atau berlaku sebagai komponen yang berdiri sendiri. Subsistem manajemen berbasis pengetahuan dapat saling berhubungan dengan repositori pengetahuan organisasi yang disebut organization knowledge base.

Proses pengambilan keputusan dilakukan dengan menggunakan beberapa tahapan. Menurut Turban et al (2011), tahapan dalam pengambilan keputusan antara lain:

1. Intelligence

Tahap ini merupakan proses penelusuran dan pendeteksian dari lingkup problematika serta proses pengenalan masalah. Data masukkan diperoleh, diproses, dan diuji dalam rangka mengindentifikasikan masalah.

2. Design

Tahap ini merupakan proses menemukan, mengembangkan, dan menganalisis alternatif tindakan yang bisa dilakukan. Tahap ini meliputi proses untuk mengerti masalah, menurunkan solusi, menguji kelayakan solusi.

3. Choice

Tahap ini merupakan proses pemilihan di antara berbagai alternatif tindakan yang mungkin dijalankan. Tahap ini dimulai dengan mencari solusi dengan menggunakan model, melakukan analisis sensitivitas, menyeleksi alternatif yang terbaik, melakukan aksi atau rencana untuk mengimplementasikan, dan merancang sistem pengendalian.

4. Implementation

Fase implementasi meliputi pembuatan suatu solusi yang direkomendasikan. Pembuat keputusan harus mempertimbangkan beberapa tujuan dan

sensitivitas-commit to user

7

analisis masalah. Fase ini mengadaptasikan materi yang dipilih untuk diterapkan pada situasi pemilihan (penyelesaian masalah).

2.1.2 Clustering

Clustering adalah mengelompokkan item data ke dalam sejumlah kecil grup sedemikian sehingga masing-masing grup mempunyai sesuatu persamaan yang esensial (Andayani, 2007).

Ada beberapa pendekatan yang digunakan dalam mengembangkan metode

clustering. Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada.

Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical clustering mengelompokkan data dengan membuat suatu hirarki berupa kurva yang menggambarkan pengelompokan cluster dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan.

Menurut Andayani (2007), Algoritma clustering dibagi ke dalam beberapa kelompok besar, antara lain:

1. Partitioning algorithms: algoritma dalam kelompok ini membentuk bermacam partisi dan kemudian mengevaluasinya dengan berdasarkan beberapa kriteria.

2. Hierarchy algorithms: pembentukan dekomposisi hirarki dari sekumpulan data menggunakan beberapa kriteria.

3. Density based: pembentukan cluster berdasarkan pada koneksi dan fungsi densitas.

4. Grid based: pembentukan cluster berdasarkan pada struktur multiple level granularity.

5. Model based: sebuah model dianggap sebagai hipotesa untuk masing masing cluster dan model yang baik dipilih diantara model hipotesa tersebut.

commit to user

2.1.3 K-Means Clustering

Metode K-Means pertama kali diperkenalkan oleh MacQueen JB pada tahun 1976. Metode ini adalah salah satu metode non hierarchi yang umum digunakan. Metode ini termasuk dalam teknik penyekatan (partition) yang membagi atau memisahkan objek ke k daerah bagian yang terpisah. Pada K-Means, setiap objek harus masuk dalam kelompok tertentu, tetapi dalam satu tahapan proses tertentu, objek yang sudah masuk dalam satu kelompok, pada satu tahapan berikutnya objek akan berpindah ke kelompok lain.

Hasil cluster dengan dengan metode K-Means sangat bergantung pada nilai pusat kelompok awal yang diberikan. Pemberian nilai awal yang berbeda bisa menghasilkan kelompok yang berbeda. Ada beberapa cara memberi nilai awal misalnya dengan mengambil sampel awal dari objek, lalu mencari nilai pusatnya, memberi nilai awal secara random, menentukan nilai awalnya atau menggunakan hasil dari kelompok hierarki dengan jumlah kelompok yang sesuai (Santosa 2007).

K-Means adalah suatu metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi. Metode K-Means berusaha mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, metode ini berusaha untuk meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya (Agusta, 2011).

Menurut Nuningsih (2010), algoritma K-Means memerlukan 3 komponen, yaitu:

1. Jumlah Cluster K

K-Means merupakan bagian dari metode non-hirarki sehingga dalam metode ini jumlah k harus ditentukan terlebih dahulu. Jumlah cluster k dapat ditentukan melalui pendekatan metode hirarki. Namun perlu diperhatikan bahwa

commit to user

9

tidak terdapat aturan khusus dalam menentukan jumlah cluster k, terkadang jumlah cluster yang diiinginkan tergantung pada subyektif seseorang.

2. Cluster Awal

Cluster awal yang dipilih berkaitan dengan penentuan pusat cluster awal (centroid awal). Dalam hal ini, terdapat beberapa pendapat dalam memilih cluster

awal untuk metode K-Means sebagai berikut:

a. Berdasarkan Hartigan (1975), pemilihan cluster awal dapat ditentukan berdasarkan interval dari jumlah setiap observasi

b. Berdasarkan Rencher (2002), pemilihan cluster awal dapat ditentukan melalui pendekatan salah satu metode hirarki.

c. Berdasarkan Teknomo (2007), pemilihan cluster awal dapat secara acak dari semua observasi.

Oleh karena adanya pemilihan cluster awal yang berbeda ini maka kemungkinan besar solusi cluster yang dihasilkan akan berbeda pula.

3. Ukuran Jarak

Metode k-means dimulai dengan pembentukan prototipe cluster di awal kemudian secara iteratif prototipe cluster ini diperbaiki hingga konvergen (tidak terjadi perubahan yang signifikan pada prototipe cluster). Perubahan ini diukur dengan ukuran jarak Euclidean. Ukuran jarak ini digunakan untuk menempatkan observasi ke dalam cluster berdasarkan centroid terdekat.

Menurut Sarwono (2011), Algoritma K-Means adalah sebagai berikut: 1. Menentukan k sebagai jumlah cluster yang ingin dibentuk.

2. Membangkitkan nilai random untuk pusat cluster awal (centroid) sebanyak k

3. Menghitung jarak setiap data input terhadap masing-masing centroid

menggunakan rumus jarak Eucledian (Eucledian Distance) hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Berikut adalah persamaan Eucledian Distance:

commit to user

dimana:

xi : data kriteria

µj : centroid pada cluster ke-j

4. Mengklasifikasikan setiap data berdasarkan kedekatannya dengan centroid

(jarak terkecil).

5. Memperbaharui nilai centroid. Nilai centroid baru diperoleh dari rata-rata

cluster yang bersangkutan dengan menggunakan rumus: ... (2) dimana:

µj (t+1) : centroid baru pada iterasi ke (t+1), Nsj : banyak data pada cluster Sj

6. Melakukan perulangan dari langkah 2 hingga 5 hingga anggota tiap cluster

tidak ada yang berubah.

7. Jika langkah 6 telah terpenuhi, maka nilai pusat cluster (µj) pada iterasi terakhir akan digunakan sebagai parameter untuk menentukan klasifikasi data. Ilustrasi dari perubahan cluster/kelompok data ditunjukkan pada Gambar 2.2.

commit to user

11

Gambar 2.1 Diagram alir algoritma k-means (Andayani, 2007)

commit to user

Berikut ini adalah ilustrasi penggunaan metode K means untuk menentukan cluster dari 4 buah objek dengan 2 atribut, seperti ditunjukkan dalam Tabel 2.1. Clustering akan dilakukan untuk membentuk 2 cluster jenis obat berdasarkan atributnya (Andayani, 2007). Langkah langkah metode K means

adalah sebagai berikut :

a) Pengesetan nilai awal titik tengah. Misalkan obat A dan Obat B masing-masing menjadi titik tengah (centroid) dari cluster yang akan dibentuk. Tentukan koordinat kedua centroid tersebut, yaitu c1=(1,1) dan c2=(2,1).

Tabel 2.1 Daftar objek yang akan diolah dalam clustering

Objek Atribut1(x): indeks berat Atribut2(y): pH

Obat A 1 1

Obat B 2 1

Obat C 4 3

Obat D 5 4

b) Menghitung jarak objek ke centroid dengan menggunakan rumus jarak

Euclidean.

Misalnya jarak objek obat C=(4,3) ke centroid pertama c1=(1,1) adalah = 3,61 dan jarak dengan centroid kedua c1=(2,1) adalah = 2,83

Hasil perhitungan jarak ini disimpan dalam bentuk matriks k x n, dengan k banyak cluster dan n banyak objek. Setiap kolom dalam matriks tersebut menunjukkan objek sedangkan baris pertama menunjukkan jarak ke centroid

pertama, baris kedua menunjukkan jarak ke centroid kedua. Iterasi-0

1) Matriks jarak setelah iterasi ke-0 adalah sebagai berikut: D =

A B C D

2) Clustering objek: Memasukkan setiap objek ke dalam cluster (grup) berdasarkan jarak minimumnya. Jadi obat A dimasukkan ke grup 1, dan obat B, C, dan D dimasukkan ke grup 2. Keanggotaan objek ke dalam grup dinyatakan dengan matrik, elemen dari matriks bernilai 1 jika sebuah objek menjadi anggota grup.

commit to user

13

G =

A B C D

Iterasi-1

1) Menentukan centroid: Berdasarkan anggota masing-masing grup, selanjutnya ditentukan centroid baru. Grup 1 hanya berisi 1 objek, sehingga centroidnya tetap c1=(1,1). Grup 2 mempunyai 3 anggota, sehingga centroidnya ditentukan berdasarkan rata-rata koordinat ketiga anggota tersebut: c2= =

2) Menghitung jarak objek ke centroid: selanjutnya, jarak antara centroid

baru dengan seluruh objek dalam grup dihitung kembali sehingga diperoleh matriks jarak sebagai berikut:

D =

A B C D

3) Clustering objek: menentukan keanggotaan grup berdasarkan jaraknya. Berdasarkan matriks jarak baru, maka obat B harus dipindah ke grup 1.

G1 =

A B C D Iterasi-2

1) Menetukan centroid: menentukan centroid baru berdasarkan keanggotaan grup yang baru. Grup 1 dan 2 masing-masing mempunyai 2 anggota, sehingga centroidnya menjadi

c1= = dan c2= =

2) Menghitung jarak objek ke centroid: diperoleh matriks jarak sebagai berikut:

D =

commit to user

3) Clustering objek: mengelompokkan tiap-tiap objek berdasarkan jarak minimumnya, diperoleh:

G2 =

A B C D

Hasil pengelompokkan pada iterasi terakhir dibandingkan dengan hasil sebelumnya, diperoleh G2=G1. Hasil ini menunjukkan bahwa tidak ada lagi objek yang berpindah grup, dan metode telah stabil. Hasil akhir clustering

ditunjukkan dalam Tabel 2.2.

Tabel 2.2 Hasil clustering

Objek Atribut1(x): indeks berat Atribut2(y): pH Grup Hasil

Obat A 1 1 1

Obat B 2 1 1

Obat C 4 3 2

Obat D 5 4 2

2.1.3. 1 Jumlah Cluster Optimal

Jumlah cluster optimal ditentukan dengan validitas indeks cluster melalui perbandingan nilai indeks pada berbagai validity measure. Perhitungan nilai indeks dengan berbagai validity measure dilakukan dengan parameter yang telah

-3

Gambar 2.3 Partition coeficient (PC)

commit to user

15

Gambar 2.5 Partition index (SC)

Gambar 2.6 Separation index (S)

Gambar 2.7 Xie and beni index (XB)

Gambar 2.8 Dunn index (DI)

Hasil perhitungan validitas indeks menggunakan PC menunjukkan bahwa indeks semakin menurun seiring pertambahan jumlah cluster. Indeks mengalami penurunan signifikan pada c (jumlah cluster opimal) = 3 (Gambar 2.3). Hasil perhitungan validitas indeks menggunakan CE menunjukkan bahwa indeks semakin meningkat seiring pertambahan jumlah cluster dan mengalami perubahan signifikan pada c = 3 (Gambar 2.4). Hasil perhitungan validitas indeks menggunakan SC dan S menunjukkan bahwa indeks relatif semakin menurun seiring pertambahan jumlah cluster (Gambar 2.5 dan Gambar 2.6). Sedangkan hasil perhitungan validitas indeks menggunakan XB menunjukkan bahwa indeks

commit to user

mencapai nilai minimum pada c = 3 (Gambar 2.7). Sedangkan nilai

mengalami perubahan signifikan dan mencapai nilai minimum pada lembah pertama pada c = 3 (Gambar 2.8). Berdasarkan hasil perbandingan index dengan berbagai validity measure yang telah dilakukan, jumlah cluster optimal berada pada c = 3.

2.1.4 Beasiswa

Beasiswa adalah pemberian berupa bantuan keuangan yang diberikan kepada perorangan yang bertujuan untuk digunakan demi keberlangsungan pendidikan yang ditempuh (Putranto, 2011).

Pemberian beasiswa merupakan program kerja yang ada di setiap universitas atau perguruan tinggi. Program beasiswa diadakan untuk meringankan beban mahasiswa dalam menempuh masa studi kuliah khususnya dalam masalah biaya. Pemberian beasiswa kepada mahasiswa dilakukan secara selektif sesuai dengan jenis beasiswa yang diadakan.

Adapun jenis beasiswa yang diselenggarakan antara lain Beasiswa Peningkatan Prestasi Akademik (PPA), Beasiswa Bantuan Belajar Mahasiswa (BBM), Beasiswa yang diberikan pihak swasta, seperti beasiswa djarum, astra, dan sebagainya.

Tujuan diselenggarakan beasiswa antara lain (Dikti, 2011):

1. Meningkatkan akses dan pemerataan kesempatan belajar di perguruan tinggi bagi rakyat Indonesia.

2. Mengurangi jumlah mahasiswa yang putus kuliah, karena tidak mampu membiayai pendidikan.

3. Meningkatkan prestasi dan motivasi mahasiswa, baik pada bidang akademik/kurikuler, ko-kurikuler, maupun ekstrakurikuler.

Sasaran mahasiswa penerima beasiswa antara lain (Dikti, 2011):

1. Mahasiswa berprestasi (baik pada bidang akademik/kurikuler, ko-kurikuler maupun ekstra kurikuler).

2. Mahasiswa dengan prestasi minimal yang orang tua/wali-nya tidak mampu membiayai pendidikannya.

commit to user

17

Adapun urutan prioritas kriteria yang digunakan untuk penetapan mahasiswa penerima beasiswa adalah tidak sama untuk setiap jenis beasiswa. Sebagai contoh urutan prioritas kriteria penerima beasiswa PPA dan BBM adalah berbeda .

Penentukan mahasiswa penerima beasiswa PPA sesuai dengan urutan prioritas sebagai berikut (Dikti, 2011):

1. Mahasiswa yang mempunyai IPK paling tinggi.

2. Mahasiswa yang mempunyai SKS paling banyak (jumlah semester paling sedikit)

3. Mahasiswa yang memiliki prestasi di kegiatan ko/ekstra kurikuler (olahraga, teknologi, seni/budaya tingkat internasional/dunia, regional/Asia/Asean dan nasional).

4. Mahasiswa yang (orang tuanya) paling tidak mampu.

Sedangkan penentukan mahasiswa penerima beasiswa BBM sesuai dengan urutan prioritas sebagai berikut (Dikti, 2011):

1. Mahasiswa yang (orang tuanya) paling tidak mampu.

2. Mahasiswa yang memiliki prestasi di kegiatan ko/ekstra kurikuler (olahraga, teknologi, seni/budaya tingkat internasional/dunia, regional/Asia/Asean dan nasional).

3. Mahasiswa yang mempunyai IPK paling tinggi.

4. Mahasiswa yang mempunyai SKS paling banyak (jumlah semester paling sedikit).

2.2 Penelitian Terkait

1. Aplikasi K-Means untuk Pengelompokkan Mahasiswa Berdasarkan

Nilai Body Mass Index (BMI) dan Ukuran Kerangka (Kusumadewi,

2008)

Penelitian tersebut membahas tentang penerapan metode K-Means

Clustering untuk mengelompokkan mahasiswa berdasarkan kriteria Body Mass Index (BMI) dan ukuran kerangka. Kriteria tersebut didasarkan pada data kondisi fisik dari mahasiswa yang bersangkutan yang telah diambil

commit to user

terlebih dahulu. Data kondisi fisik yang digunakan adalah tinggi badan, berat badan dan lingkar lengan bawah. Diasumsikan data yang diambil adalah data mahasiswa putra. Setelah data tersebut diperoleh kemudian dilakukan perhitungan untuk mencari status gizi dan ukuran rangka dari masing-masing data yang ada.

Setelah mendapatkan status gizi dan nilai rangka dari masing-masing data maka langkah selanjutnya adalah melakukan proses klasifikasi data menggunakan metode klasifikasi K-Means.

Kesimpulan dari hasil penelitian adalah bahwa algoritma klasifikasi K-Means dapat digunakan untuk mengelompokkan mahasiswa berdasarkan status gizi dan ukuran kerangka. Diperoleh 3 kelompok berdasarkan BMI dan ukuran kerangka, yaitu BMI normal dan kerangka besar, BMI obesitas sedang dan kerangka sedang, BMI obesitas berat dan kerangka kecil.

2. Clustering Data Non-numerik dengan Pendekatan Algoritma

K-Means dan Hamming Distance Studi Kasus Biro Jodoh (Nanjaya,

2005)

Penelitian tersebut membahas tentang penerapan algoritma k-means pada suatu clustering data non-numerik (categorical), dengan dibantu

Hamming Distance sebagai alat untuk mengukur jarak dari masing-masing atribut kategorikalnya. Metodologi yang digunakan dalam penelitian ini meliputi beberapa tahapan. Modifikasi yang dilakukan adalah proses modifikasi data dari non-numerik menjadi numerik. Dari penelitian tersebut didapatkan bahwa clustering dapat dilakukan pada atribut-atribut kategorikal yang ditransformasikan terlebih dahulu ke dalam bentuk numerik. Selain itu, kesamaan (similarity) dan karakterisktik dari masing-masing keanggotaan bisa diketahui.

3. Performance Evaluation of K-Means and Fuzzy C-Means Clustering Algorithms for Statistical Distributions of Input Data Points(Santhanam, 2010)

Penelitian tersebut membahas tentang perbandingan performa antara algoritma K-Means Clustering dengan algoritma Fuzzy C-Means

commit to user

19

Clustering. Kedua algoritma tersebut diimplementasikan dan dianalisis kinerjanya berdasarkan pada kualitas hasil clustering. Perilaku kedua algoritma tergantung pada jumlah titik data serta pada jumlah cluster. Input

data poin dihasilkan oleh dua cara, yaitu dengan menggunakan distribusi normal dan lain dengan menerapkan distribusi seragam dengan Box-Muller formula. Kinerja algoritma dianalisis selama eksekusi yang berbeda dari program pada titik input data. Waktu eksekusi untuk masing-masing algoritma juga dianalisis dan hasilnya dibandingkan. Hasil penelitian menunjukkan bahwa kinerja dari algoritma K-Means lebih baik dibandingkan dengan Fuzzy C-Means untuk distribusi normal dan seragam. FCM menghasilkan hasil yang dekat dengan K-Means clustering, namun membutuhkan waktu komputasi lebih lama dari K-means. Jadi untuk data poin yang dihasilkan dengan menggunakan distribusi statistik, algoritma K-Means tampaknya lebih unggul daripada Fuzzy C-K-Means.

2.3 Rencana Penelitian

Proses seleksi penerimaan beasiswa secara manual yaitu dengan menginputkan satu persatu data mahasiswa ke dalam file excel kemudian melakukan sorting data mahasiswa menimbulkan beberapa permasalahan, antara lain membutuhkan waktu yang lama dan ketelitian yang tinggi.

Salah satu cara untuk membantu dalam proses seleksi penerimaan beasiswa adalah dengan cara mengelompokkan mahasiswa berdasarkan kriteria-kriteria yang telah ditentukan, antara lain IPK, jumlah tanggungan keluarga, dan penghasilan total orang tua. Pengelompokan dilakukan dengan menerapkan algoritma K-Means Clustering. Pengelompokan ini akan menunjukkan siapa saja yang akan masuk ke dalam masing-masing kelompok.

Jumlah cluster yang digunakan pada kasus ini adalah tiga (3) berdasarkan perhitungan validasi cluster optimal, yaitu mahasiswa yang direkomendasikan menerima beasiswa, dipertimbangkan menerima beasiswa, dan tidak menerima beasiswa.

commit to user

Dokumen terkait