Implementasi Fuzzy C-Means untuk Clustering Data
dalam Sistem Informasi Promosi
(Studi Kasus : UKSW)
Artikel Ilmiah
Diajukan kepada Fakultas Teknologi Informasi
untuk memperoleh Gelar Sarjana Komputer
Peneliti :
Monica Dias Pangestika (672007068) Drs. Prihanto Ngesti Basuki, M. Kom.
Charitas Fibriani, S. Kom., M. Eng.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
Juli 2013
Pernyataan
Yang bertandatangan di bawah ini,
Nama : Monica Dias Pangestika
NIM : 672007068
Program Studi : Teknik Informatika
Fakultas : Teknologi Informasi, Universitas Kristen Satya Wacana
Menyatakan dengan sesungguhnya bahwa tugas akhir dengan judul :
Implementasi Fuzzy C-Means untuk Clustering Data dalam Sistem Informasi Promosi (Studi Kasus : UKSW)
Yang dibimbing oleh :
1. Drs. Prihanto Ngesti Basuki, M.Kom. 2. Charitas Fibriani, S.Kom., M.Eng.
Adalah benar hasil karya saya.
Di dalam tugas akhir ini tidak terdapat keseluruhan atau sebagian tulisan atau gagasan orang lain yang saya ambil dengan menyalin atau meniru dalam bentuk rangkaian kalimat atau gambar serta simbol yang saya akui seolah-olah sebagai karya saya tanpa memberikan pengakuan penulisan atau sumber aslinya.
Salatiga, 25 Juli 2013 Yang memberi pernyataan,
Implementasi Fuzzy C-Means untuk Clustering Data
dalam Sistem Informasi Promosi
(Studi Kasus : UKSW)
1)Monica Dias Pangestika, 2) Prihanto Ngesti Basuki, 3)Charitas Fibriani
Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Satya Wacana
Jl. Diponegoro 52-60 Salatiga
Email: 4)monica_andika@yahoo.com, 5)ngesti@hotmail.com,
6
)charitasfibriani@yahoo.com
Abstract
Promotion is a important factor in a university to attract prospective students interest for continuing their education in that university. Equality of the same promotion in Satya Wacana Christian University (UKSW) to all high scholl and to all study major, make promotion less effective. Data clustering method are used to classification scholl and study major based on the clusters. Fuzzy C–Means algorithm is the one of algorithm which can be used to clustering data, this algorithm be used in this research to clustering data prospective students and study major. The final result is a information that shows scholls and study majors which the promotion is less, need to increase, or enough. Based the result of this research, value of the cluster about scholls and study major which include to low cluster, it is recommended to do promotion in that scholl and that study major.
Keywords: Fuzzy C-Means, clustering data, information
Abstrak
Promosi merupakan faktor penting dalam suatu universitas untuk menarik minat calon mahasiswa agar melanjutkan pendidikannya ke universitas itu. Pemerataan promosi pada Universitas Kristen Satya Wacana (UKSW) yang sama ke semua sekolah menengah atas dan pada semua program studi, membuat kurang efektifnya promosi. Metode Pengelompokan data yang dilakukan untuk mengklasifikasikan sekolah dan program studi berdasarkan clusternya. Algoritma Fuzzy C-Means merupakan salah satu algoritma yang digunakan dalam teknik pengelompokan data, untuk itulah algoritma Fuzzy C-Means digunakan pada penelitian ini untuk mengelompokkan data calon mahasiswa dan program studi. Hasil akhir berupa informasi yang menunjukan sekolah dan program studi yang promosinya kurang, lebih ditingkatkan, atau cukup. Berdasarkan hasil penelitian, nilai cluster sekolah dan program studi yang masuk ke cluster rendah, direkomendasikan untuk dilakukan promosi di sekolah dan program studi tersebut.
Kata Kunci : Fuzzy C-Means, pengelompokan data,informasi
1 Mahasiswa Teknologi Informasi Universitas Satya Wacana
2 Pembimbing Pertama Teknologi Informasi Universitas Satya Wacana
3 Pembimbing Kedua Teknologi Informasi Universitas Satya Wacana
4
Alamat email mahasiswa
5 Alamat email Pembimbing Pertama
1. Pendahuluan
Promosi adalah salah satu faktor penting bagi suatu universitas untuk menarik minat calon mahasiswa agar tertarik untuk melanjutkan pendidikannya ke universitas itu. Banyaknya lulusan sekolah menengah atas yang ingin melanjutkan jenjang pendidikan ke jenjang yang lebih tinggi, maka promosi pada suatu universitas perlu lebih diefektifkan.
Selama ini suatu universitas menerima mahasiswa dari berbagai sekolah menengah atas dan berbagai jurusan yang diminati dengan jumlah berbeda setiap tahunnya. Tergantung dari bagaimana bagian promosi suatu universitas melakukan promosi, menunjukkan kualitas yang dimiliki suatu universitas, baik dalam hal akademik, fasilitas, maupun program studi yang dimiliki.
Penerimaan mahasiswa dari suatu sekolah menengah atas yang berbeda - beda setiap tahunnya, program studi yang diminati yang tidak sama setiap tahunnya, serta pemerataan promosi pada Universitas Kristen Satya Wacana yang sama ke semua sekolah menengah atas dan pada semua program studi, membuat kurang efektifnya promosi, mendorong penulis untuk melakukan pengelompokan data berdasarkan data 3 tahun terakhir pada Universitas Kristen Satya Wacana. Data jumlah calon mahasiswa dari setiap sekolah menengah atas, dan data program studi yang diminati setiap tahunnya akan dikelompokkan menjadi 3
cluster.
Pembentukan cluster atau kelompok data merupakan salah satu teknik yang digunakan dalam mengekstrak pola kecenderungan suatu data. Analisis
cluster atau clustering merupakan proses membagi data dalam suatu himpunan ke
dalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar daripada kesamaan data tersebut dengan data dalam kelompok lain [1].
Metode Fuzzy C-Means yang digunakan dipilih karena metode ini adalah suatu teknik pengelompokan data dimana keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Fuzzy C-Means adalah algoritma pengelompokan yang terawasi, karena pada algoritma Fuzzy C-Means jumlah cluster yang akan dibentuk perlu diketahui terlebih dahulu. Konsep dasar algoritma Fuzzy C-Means adalah menentukan pusat kelompok yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan pada tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang-ulang, maka didapat lokasi pusat cluster optimal. Perulangan ini didasarkan pada minimasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut [2].
Diharapkan dengan perancangan sistem informasi tersebut, nantinya sistem ini dapat memberi informasi berdasarkan pengelompokan data penerimaan mahasiswa dari setiap sekolah menengah atas dan program studi yang diminati untuk dapat menentukan strategi promosi berikutnya dalam biro promosi yang lebih berorientasi kepada target.
2. Strategi Promosi di UKSW
Strategi Promosi merupakan teknik dan cara – cara yang dipakai suatu perusahaan atau organisasi untuk melakukan promosi dengan tujuan untuk mendapatkan efisiensi promosi yang baik, termasuk didalamnya kegiatan pemasaran untuk menginformasikan, membujuk, serta menarik konsumen mengenai produk atau jasa yang ditawarkan perusahaan [3].
Biro Promosi dan Hubungan Luar (BPHL) adalah unit yang bertugas untuk mengelola dan mengembangkan sistem dan program promosi di UKSW. Dalam kegiatannya, BPHL menjalin hubungan kemitraan yang baik dengan sekolah, gereja, pemerintah, industri, dan alumni. Banyak kegiatan yang dilakukan biro promosi dalam kegiatan promosinya, ada kegiatan visitasi ke sekolah – sekolah yang lebih prospek, kegiatan presentasi yang merupakan penyampaian materi mengenai UKSW, kegiatan EXPO, kegiatan Road Show, kegiatan consultation desk. Serta penggunaan baliho yang dipasang seperti pada persimpangan jalan, trafik yang ramai contohnya seperti pada Kota Salatiga, brosur, leaflet, Satya link yaitu website yang berisi informasi serta kegiatan yang ada pada UKSW, dan iklan ke advedtorial.
Proses Bisnis pada BPHL dituangkan pada Standart Operational Prosedure (SOP) Pelaksanaan Promosi. Pada SOP tersebut dijelaskan tahap – tahap untuk pelaksanaan promosi sampai kepada laporan pertanggungjawaban. Dengan tujuan memperkenalkan program dan keunggulan yang ada pada masing – masing program studi di Universitas Kristen Satya Wacana Salatiga kepada siswa SMA/SMK/MA/sederajat untuk menarik minat siswa melanjutkan pendidikannya ke UKSW. Ruang lingkup meliputi presentasi ke sekolah meliputi permohonan izin presentasi, materi promosi, anggaran, penjelasan program dan keunggulan, pembuatan laporan.
3. Kajian Pustaka
Penelitian terdahulu
Irma Irandha P. W, mahasiswa D4 dari Politeknik Elektronika Negeri Surabaya, meneliti tentang Analisa Keluarga Miskin Dengan Menggunakan Metode Fuzzy C-Means Clustering. Penelitian ini meneliti Kota Surabaya tepatnya di Kecamatan Wonocolo yang terdapat Keluarga miskin. Penentuan status Keluarga Miskin menggunakan metode tentang data keluarga miskin yang meliputi jumlah ART (Anggota Rumah Tangga), jenis pekerjaan, indikator Kesehatan, Pendidikan, Perumahan dan Lingkungan, Ekonomi serta Sosial Budaya. Metode ini dilakukan untuk menghasilkan informasi tentang keluarga miskin dengan katagori sangat miskin, miskin, dan mendekati miskin [4].
Bahar mahasiswa program Pasca Sarjana, Magister Teknik Informatika dari Universitas Dian Nuswantoro tentang Penentuan Jurusan Sekolah Menengah Atas dengan Algoritma Fuzzy C-Means. Parameter data yang digunakan dalam eksperimen berupa rata-rata nilai mata pelajaran kelompok peminatan, yaitu: jurusan IPA (mata pelajaran Biologi, Matematika, Fisika dan Kimia), jurusan IPS (mata pelajaran Sosiologi, Geografi, Sejarah dan Ekonomi), jurusan Bahasa (Bahasa Inggris dan Bahasa Indonesia). Penelitian ini menghasilkan 3 cluster yang
merupakan peminatan IPS, Bahasa, dan IPA, dan tingkat akurasi yang lebih tinggi (yaitu rata – rata 78,39 %) dibandingkan dengan metode penentuan jurusan secara manual [5].
Pada penelitian ini metode Fuzzy C-Means akan digunakan dalam pengolahan data promosi di UKSW. Data yang diperlukan dalam penelitian ini akan diambil dari data jumlah masing – masing sekolah menengah atas calon mahasiswa dan jumlah program studi yang diminati per tahunnya selama 3 tahun, di mana data ini dimasukkan langsung oleh bagian promosi dan semua proses perhitungan Fuzzy C-Means dilakukan oleh sistem. Sistem ini menyediakan fungsi untuk load data berupa file excel. Hasil dari penelitian ini akan dikelompokkan menjadi 3 cluster, yaitu rendah, sedang, dan tinggi dan keterangan informasi bagi biro promosi. Sehingga nantinya dapat membantu pihak promosi dalam menentukan tindakan promosi selanjutnya yang lebih berorientasi target.
Algoritma Clustering
Kategori pengelompokan algoritma clustering adalah sebagai berikut [6]:
Hierarchical clustering menentukan sendiri jumlah cluster yang dihasilkan. Hasil dari metode ini adalah suatu struktur data berbentuk pohon yang disebut dendogram dimana data dikelompokkan secara bertingkat dari yang paling bawah dimana tiap instance data merupakan satu cluster sendiri, hingga tingkat paling atas dimana keseluruhan data membentuk satu cluster besar berisi cluster-cluster. Hierarchical clustering dibagi lagi menjadi 2 yaitu : - Agglomerative clustering merupakan suatu teknik hierarki clustering
yang menghasilkan suatu rangkaian penurunan jumlah cluster pada setiap tahapan. Clustering yang terdapat pada setiap tahapan diperoleh dari tahapan sebelumnya dengan cara menggabungkan 2 cluster yang mempunyai kemiripan.
- Divisive hierarchical clustering mengelompokkan data dari kelompok yang terbesar hingga ke kelompok yang terkecil, yaitu masing-masing
instance dari kelompok data tersebut. Sebaliknya, agglomerative hierarchical clustering mulai mengelompokkan data dari kelompok yang
terkecil hingga kelompok yang terbesar. Beberapa algoritma yang menggunakan metode ini adalah: RObust Clustering Using LinKs (ROCK), Chameleon, Cobweb, Shared Nearest Neighbor (SNN).
Partitional clustering yang mengelompokkan data ke dalam k cluster dimana k adalah banyaknya cluster dari input user. Kategori ini biasanya memerlukan pengetahuan yang cukup mendalam tentang data dan proses bisnis yang memanfaatkannya untuk mendapatkan kisaran nilai input yang sesuai. Beberapa algoritma yang masuk dalam kategori ini antara lain: K-Means,
Fuzzy C-Means, Clustering Large Aplications (CLARA), Expectation Maximation (EM), Bond Energy Algorithm (BEA), algoritma Genetika,
Jaringan Saraf Tiruan.
Clustering Large Data, dibutuhkan untuk melakukan clustering pada data yang volumenya sangat besar sehingga tidak cukup ditampung dalam memori komputer pasca suatu waktu. Biasanya untuk mengatasi masalah besarnya
volume data, dicari teknik-teknik untuk meminimalkan berapa kali algoritma harus membaca seluruh data. Beberapa algoritma yang masuk dalam kategori ini antara lain: Balanced Iteratif Reducing and clustering using hierarchies (BIRCH), Density Based Spatial Clustering of Application With Noise (DCSCAN), Clustering Categorical Data Using Summaries (CACTUS).
Fuzzy Clustering C-Means (FCM)
Pada proses pengklasteran (clustering) secara klasik (misalnya pada algoritma Clustering K-Means), pembentukan partisi dilakukan sedemikian rupa sehingga setiap obyek berada tepat pada satu partisi. Namun, adakalanya tidak dapat menempatkan suatu obyek tepat pada suatu partisi, karena sebenarnya obyek tersebut terletak di antara 2 atau lebih partisi yang lain. Pada logika fuzzy, metode yang dapat digunakan untuk melakukan pengelompokan sejumlah data dikenal dengan nama fuzzy clustering. Fuzzy Clustering lebih alami jika dibandingkan dengan pengklasteran secara klasik. Suatu algoritma clustering dikatakan sebagai fuzzy clustering jika algoritma tersebut menggunakan parameter strategi adaptasi secara soft competitive. Sebagian besar algoritma fuzzy clustering didasarkan atas optimasi fungsi obyektif atau modifikasi dari fungsi obyektif tersebut.
Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). FCM adalah suatu teknik pengklasteran data yang keberadaan tiap-tiap data dalam suatu
cluster ditentukan oleh nilai/derajat keanggotaan tertentu. Teknik ini pertama kali
diperkenalkan oleh Jim Bezdek pada tahun 1981. Berbeda dengan teknik pengklasteran secara klasik (dimana suatu obyek hanya akan menjadi anggota suatu klaster tertentu), dalam FCM setiap data bisa menjadi anggota dari beberapa
cluster. Batas-batas cluster dalam FCM adalah lunak (soft). Konsep dasar FCM,
pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata untuk tiap- tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang, maka akan terlihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi obyektif [7].
Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut [8]:
Menentukan data yang akan di cluster X, berupa matriks berukuran n x m (n=jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i (i=1,2,...,n), atribut ke-j (j=1,2,...,m).
Menentukan:
- Jumlah cluster = c ( ) - Pangkat = w (> 1)
- Maksimum interasi = MaxIter - Error terkecil yang diharapkan = - Fungsi objektif awal = Po = 0 - Interasi awal = t =1 dan
Membangkitkan bilangan random μik, i=1,2,3 ..., n; k=1,2,3 ...,c; sebagai elemen-elemen matriks partisi awal U.
Menghitung jumlah setiap kolom:
...(2.1) dengan j = 1,2,...,n
Menghitung pusat cluster ke-k: Vkj, dengan k=1,2,...c; dan j=1,2,...m
...(2.2) Menghitung fungsi objektif pada interasi ke-t :
...(2.3) Menghitung perubahan matriks partisi :
...(2.4) dengan: i=1,2,...n; dan k=1,2,...c.
Memeriksa kondisi berhenti :
Jika: (|Pt – Pt-1|<
ξ)
atau (t > MaxIter) maka berhenti Jika tidak: t=t+1, mengulang langkah ke-4.Perancangan Sistem
Gambar berikut ini merupakan diagram alir (flowchart) yang merupakan diagram alir perangkat lunak untuk menentukan informasi promosi dengan menggunakan metode Fuzzy C-Means.
tidak
Ya
Gambar 1 Flowchart Metode Fuzzy C-Means pada sistem
Input MaxIterasi dan Error
Proses dengan Algoritma FCM
Fgs Objectf skrg – fgs Obj sblumbya < error Iterasi > maks iterasi
Hasil clustering Optimal
Selesai Load Data Excel jumlah sekolah atau program studi selama
3 tahun Mulai
tidak
Ya
Gambar 2 Flowchart Algoritma Fuzzy C-Means
Use Case Diagram
Dalam diagram use case, hak akses hanya user. Di sini user adalah pegawai biro Promosi UKSW. Seorang user dapat langsung mengakses sistem dan menjalankan proses mulai algoritma. Di sini user menjalankan 2 aktifitas, yaitu dimana user dapat melakukan proses algoritma mencakup perubahan pada max iterasi dan error, juga meload data, kemudian melihat hasil, dimana user dapat melihat fungsi obyektif yang dihasilkan, melihat matriks partisi, melihat pusat cluster, melihat hasil pengelompokan cluster, dan melihat grafik hasil
Mulai
Baca Matriks X ukuran m x n, error terkecil, pangkat pembobot
(w),maksimum iterasi
Bangkitkan matriks partisi awal secara random[0....1] dan normalisasi matriks partisi awal
P(t) –P(t-1) < error / Iterasi >= maks iterasi
Hasil clustering Optimal Selesai Inisialisasi P(0)=0, Iterasi awal=1 Menghitung Pusat cluster Vkj Perbaharui Matriks Partisi Fungsi Objective P(t) t= t+1
pengolahan metode Fuzzy C-Means, serta melihat Informasi bagi Biro Promosi. Lebih jelasnya dapat dilihat Gambar 3.
User
Melakukan Proses Algoritma
Load data
Melakukan Perubahan MaxIterasi dan Error
Melihat Hasil
Melihat Fungsi Objectif
Melihat Matriks Partisi
Melihat Pusat Cluster
Melihat Hasil Pengelompokan Cluster
Melihat GrafiK hasil FCM <<include>> <<include>> <<include>> <<include>> <<include>> <<include>> <<include>>
Melihat Informasi bagi Biro Promosi <<include>>
Gambar 3 Use Case Diagram User
Class Diagram MainFrame +FuzzyFix fix +DialogInput input +keluar() +inputSettingDanData() +tampilkanHasil() DialogInput +initComponents() +loadDataActionPerformed() +prosesactionPerformed() Data +file +table +jumlahIterasi +jumlahtahun +error +nilaiIterasiBerhenti +nilaiErrorIterasiBerhenti FuzzyFix +model +model1 +modelPartisi +modelPusatCluster +modelFungsiObj +informasiIterasi +JUMLAH_DATA +table +L1 +L2 +L3 +LT +totalCluster1Pow +totalCluster2Pow +totalCluster3Pow +pusatCluster +jumlahFungsiObjective +jumlahFungsiObjectiveSebelumnya +proses() +bacaExcel() +bangkitkanMatriks() +tentukanPusatCluster() +fungsiObjective() +perubahanMatriksPartisi() +tampilkanHasil() +tampilkanGrafik1() +tampilkanGrafik2() +tampilkanGrafik3() +tampilkanPromosi() Baris data +name +data +derajatKeanggotaanCluster1 +derajatKeanggotaancluster2 +derajatKeanggotaanCluster3 +cluster1 +cluster2 +cluster3 +cluster1pow +cluster2pow +cluster3pow
Gambar 4 Class Diagram Sistem
Class diagram sistem pada Gambar 4 dapat dijelaskan sebagai berikut. Class MainFrame dan DialogInput merupakan User Interface berupa tampilan
Menu Utama dan Input setting dan Data. Class MainFrame melakukan panggilan terhadap Class FuzzyFix yang merupakan algoritma dan menggunakan
DialogInput karena dipanggil dari MainFrame. Class FuzzyFix memiliki 2 Class
yang diperlukan untuk proses yaitu Class Baris Data yang digunakan untuk menyimpan data yang dihasilkan setelah proses algoritma dan Class Data yang berisi variabel dari Class DialogInput.
Gambar 5 Hirarki Keputusan untuk mengelompokkan data sekolah
menengah atas dan program studi
Penentuan cluster Rendah adalah promosi kurang, cluster Sedang adalah promosi lebih ditingkatkan, dan cluster Tinggi adalah promosi cukup. Pada sekolah menengah atas / jurusan yang promosinya cukup, kegiatan visitasi dapat digantikan dengan mengirim brosur, leaflet, dan juga sosialisasi ke satya link, sehingga biaya dapat lebih diefektifkankan ke sekolah / program studi yang promosinya kurang, sehingga pendekatan, pengenalan kelebihan program studi dapat terlaksana dengan waktu kunjungan yang cukup untuk tahap menarik minat siswa. Untuk sekolah menengah atas / jurusan yang promosinya lebih ditingkatkan, kegiatan visitasi tetap dilakukan, tetapi dengan waktu kunjungan yang tidak begitu lama tetapi tetap efektif untuk penyampaian materi promosi.
Tujuan
Atribut
Jumlah Cluster
mengelompokkan data
Jumlah sekolah menengah atas
Jumlah program studi
4. Hasil dan Pembahasan
Gambar 6 Tampilan Awal
Gambar 6 merupakan tampilan antarmuka awal bagi user. Halaman Utama berisi 3 button menu yaitu button Setting dan Data , button Tampilkan Hasil , dan button Keluar untuk keluar dari aplikasi.
Gambar 7 Tampilan Antarmuka Setting & Data
Pada proses clustering seperti pada Gambar 7, aktifitas yang dapat dilakukan oleh user menentukan maksimal iterasi dan ketelitian kesalahan. Dua faktor tersebut dipenuhi untuk menentukan kriteria berhenti.
Gambar 8 Tampilan antarmuka Tampilkan Hasil
Pada Gambar 8 yang merupakan tampilan antarmuka tampilkan hasil, user dapat melihat fungsi objective yang dihasilkan, matriks partisi, pusat cluster, hasil perhitungan Fuzzy C-Means, grafik, dan informasi promosi.
Gambar 10 Informasi Biro Promosi
Tabel 1 Hasil Pengclusteran Data Sekolah Menangah Atas Kota Salatiga
Label
Data Nama Sekolah Rendah Sedang Tinggi Keterangan
1 SMA Kristen 1 Salatiga * Promosi cukup
2 SMA Kristen 2 Salatiga * Promosi lebih ditingkatkan 3 SMA Kristen Satya Wacana Salatiga * Promosi cukup
4 SMA Muhammadiyah Salatiga * Promosi lebih ditingkatkan 5 SMA PGRI 3 Salatiga * Promosi lebih ditingkatkan 6 SMA Theresiana * Promosi lebih ditingkatkan 7 SMA Negeri 1 Salatiga * Promosi cukup
8 SMA Negeri 2 Salatiga * Promosi cukup 9 SMA Negeri 3 Salatiga * Promosi cukup
10 SMK PGRI 1 Salatiga * Promosi lebih ditingkatkan 11 SMK PGRI 2 Salatiga * Promosi lebih ditingkatkan 12 SMK Kristen 1 Salatiga * Promosi cukup
13 SMK Kristen 2 Salatiga * Promosi lebih ditingkatkan 14 SMK Islam Sudirman Tingkir * Promosi lebih ditingkatkan 15 SMK Diponegoro * Promosi lebih ditingkatkan 16 SMK Negeri 1 * Promosi lebih ditingkatkan
17 SMK Pelita * Promosi lebih ditingkatkan
18 SMK Negeri 2 * Promosi lebih ditingkatkan 19 SMK T&I Kristen * Promosi lebih ditingkatkan 20 SMK Saraswati * Promosi lebih ditingkatkan 21 SMK Negeri 3 Salatiga * Promosi lebih ditingkatkan 22 SMA Lain - Lain * Promosi lebih ditingkatkan
Tabel 1 adalah salah satu contoh hasil pengclusteran dengan data sampel sekolah menengah atas Kota Salatiga selama 3 tahun terakhir. Ada 22 data mewakili nama – nama sekolah menengah atas serta jumlah calon mahasiswa tiap tahunnya. Disini ke – 22 data tersebut masuk ke dalam 2 cluster yaitu cluster sedang dan cluster tinggi. Dapat dilihat data yang masuk ke cluster tinggi ada SMA Kristen 1 Salatiga, SMA Kristen Satya Wacana, SMA Negeri 1 Salatiga, SMA Negeri 2 Salatiga, SMA Negeri 3 Salatiga, SMK Kristen 1 Salatiga, yang promosinya cukup. Sisanya masuk ke kelompok sedang dimana promosi lebih ditingkatkan.
Tabel 4.2 Hasil Pengclusteran Data Jurusan
Label
Data PROGRAM STUDI Rendah Sedang Tinggi Keterangan
1 AGRIBISNIS * Promosi kurang
2 AGROEKOTEKNOLOGI * Promosi kurang
3 AKUTANSI * Promosi lebih ditingkatkan
4 ANALIS KIMIA INDUSTRI * Promosi kurang
5 BIMBINGAN KONSELING * Promosi kurang
6 BIOLOGI * Promosi kurang
7 SECRETARY PROGRAM * Promosi kurang
8 TOURISM PROGRAM * Promosi kurang
9 D2 PENDIDIKAN GURU SD * Promosi kurang
10 DESAIN KOMUNIKASI VISUAL * Promosi kurang 11 DOKTOR ILMU MANAJEMEN * Promosi kurang 12 DOKTOR SOSIOLOGI AGAMA * Promosi kurang 13 DOKTOR STUDI PEMBANGUNAN * Promosi kurang
14 FISIKA * Promosi kurang
15 ILMU HUKUM * Promosi kurang
16 KEPERAWATAN * Promosi kurang
17 KIMIA * Promosi kurang
18 KOMPUTER AKUNTANSI * Promosi kurang
19 KOMUNIKASI * Promosi kurang
20 MAGISTER BIOLOGI * Promosi kurang
21 MAGISTER ILMU HUKUM * Promosi kurang
22 MAGISTER MANAJEMEN * Promosi kurang
23
MAGISTER MANAJEMEN
PENDIDIKAN * Promosi kurang
24 MAGISTER SAINS PSIKOLOGI * Promosi kurang 25 MAGISTER SISTEM INFORMASI * Promosi kurang 26 MAGISTER SOSIOLOGI AGAMA * Promosi kurang 27 MAGISTER STUDI PEMBANGUNAN * Promosi kurang
28 MANAJEMEN * Promosi lebih ditingkatkan
30 PENDIDIKAN BAHASA INGGRIS * Promosi lebih ditingkatkan 31 PENDIDIKAN GURU SD * Promosi lebih ditingkatkan 32 PENDIDIKAN MATEMATIKA * Promosi lebih ditingkatkan
33 PENDIDIKAN EKONOMI * Promosi kurang
34 PENDIDIKAN FISIKA * Promosi kurang
35 PENDIDIKAN SEJARAH * Promosi kurang
36 PERSONNEL MANAGEMENT * Promosi kurang
37 PPKN * Promosi kurang
38 PSIKOLOGI * Promosi lebih ditingkatkan
39 PUBLIC RELATION * Promosi kurang
40 S1 PENDIDIKAN GURU * Promosi cukup
41 SENI MUSIK * Promosi kurang
42 SISTEM INFORMASI * Promosi kurang
43 SISTEM KOMPUTER * Promosi kurang
44 SOSIOLOGI * Promosi kurang
45 STUDI PEMBANGUNAN * Promosi kurang
46 TEKNIK ELEKTRO * Promosi kurang
47 TEKNIK INFORMATIKA * Promosi lebih ditingkatkan
48 TEOLOGI * Promosi kurang
Tabel 2 adalah salah satu contoh hasil pengclusteran dengan data sampel program studi selama 3 tahun terakhir. Ada 48 data mewakili nama – nama program studi serta jumlah peminat tiap tahunnya. Disini dilihat ke – 48 data tersebut ada 7 data pada cluster sedang yaitu Akutansi, Manajemen, Pendidikan Bahasa Inggris, Pendidikan Guru SD, Pendidikan Matematika, Psikologi, dan Teknik Informatika, yang promosinya lebih ditingkatkan . S1 Pendidikan Guru promosinya sudah cukup. Sisanya masuk ke cluster rendah dimana promosi kurang.
5. Simpulan
Berdasarkan uji coba terhadap data kota Salatiga dan data program studi, nilai cluster sekolah dan program studi yang promosinya kurang, lebih direkomendasikan untuk dilakukan promosi di sekolah dan pada program studi tersebut. Biro promosi dapat lebih melakukan pendekatan terhadap sekolah menengah atas dan peningkatan pengenalan keunggulan program studi terhadap sekolah dan program studi yang promosinya kurang atau lebih ditingkatkan. Dengan begitu biaya dari sekolah dan program studi yang promosinya cukup dapat diefektifkan kepada promosi yang kurang. Informasi dalam clustering data ini dihitung dengan menggunakan algoritma Fuzzy C Means (FCM). Adapun perhitungan dalam Fuzzy C Means (FCM) menggunakan jumlah calon
mahasiswa tiap sekolah dan jumlah peminat masing – masing program studi selama 3 tahun sebagai atribut.
Diharapkan di kemudian hari, pengembangan yang dapat dilakukan pada aplikasi clustering data ini adalah dengan menambah atribut sebagai dasar perhitungan Fuzzy C Means (FCM), membuat cluster dan pembobot sebagai inputan yang dinamis. Serta pengembangan aplikasi lebih diperbaiki dari sisi User
interface secara umum, sehingga pihak promosi lebih mudah membaca hasil
perhitungan.
6. Daftar Pustaka
[1] Kusrini, 2006, Algoritma Data Mining, Penerbit ANDI, Yogyakarta. [2] Kusumadewi, Sri dan Hari Purnomo, 2004, Aplikasi Logika Fuzzy Untuk
Pendukung Keputusan, Yogyakarta: Graha Ilmu.
[3] Suharyadi, 2012, Analisis Strategi Universitas dengan Data Mining, Salatiga : Fakultas Teknologi Informasi Universitas Kristen Satya Wacana. [4] P. W Irandha, Irma, Analisa Keluarga Miskin Dengan Menggunakan
Metode Fuzzy C-Means Clustering, Politeknik Elektronika Negeri
Surabaya.
[5] Bahar, 2011, Penentuan Jurusan Sekolah Menengah Atas dengan
Algoritma Fuzzy C-Means, Program Pasca Sarjana, Magister Teknik
Informatika, Universitas Dian Nuswantoro, Semarang.
[6] Kantardzic, Mehmed (2003), Data Mining Concepts Models, Methods, and Algorithms, New Jersey, IEEE.
[7] Kusumadewi, S., Hartati, S., 2006, Fuzzy Multi Atribute Decision Making, Graha Ilmu, Yogyakarta.
[8] Kusumadewi, S., Purnomo, H., 2010, Aplikasi Fuzzy Untuk Pendukung