• Tidak ada hasil yang ditemukan

ANALISA DAN IMPLEMENTASI FUZZY INFERENCE SYSTEM PADA HASIL KLASTERISASI ALGORITMA FUZZY SUBTRACTIVE CLUSTERING

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISA DAN IMPLEMENTASI FUZZY INFERENCE SYSTEM PADA HASIL KLASTERISASI ALGORITMA FUZZY SUBTRACTIVE CLUSTERING"

Copied!
7
0
0

Teks penuh

(1)

ANALISA DAN IMPLEMENTASI FUZZY INFERENCE SYSTEM PADA HASIL KLASTERISASI ALGORITMA FUZZY SUBTRACTIVE CLUSTERING

Hendrik Puasa Riyanto¹, Ririn Dwi Agustin², Tjokorda Agung Budi Wirayuda³

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Abstrak

Analisis klaster merupakan salah satu cara yang bagus untuk mempercepat dalam

meninjau/menganalisis data. Suatu klaster ditentukan berdasarkan persamaan karakteristik setiap data. Terkadang tidak dapat menempatkan data dengan tepat pada satu klaster karena terletak diantara dua atau lebih klaster. Dalam meninjau data diperlukan beberapa analisa sebelum menentukan jumlah klaster. Sehingga dibutuhkan suatu mekanisme tertentu untuk membentuk klaster yang tepat agar didapatkan hasil klaster yang optimal tanpa harus menentukan jumlah klaster terlebih dahulu.

Fuzzy Subtractive Clustering (FSC) salah satu algoritma klasterisasi untuk mencari klaster berkemampuan baik dalam menemukan klaster karena mempertimbangkan seluruh dimensi data. Algoritma FSC tidak terawasi sehingga pengguna tidak perlu menentukan jumlah klaster terlebih dahulu. Implementasi Fuzzy Inference System (FIS) pada hasil klasterisasi FSC guna

mendapatkan performansi maksimal dari hasil klaster. FIS berperan dalam memilih hasil klaster yang optimal karena memperhitungkan nilai akurasi.

Pada algoritma FSC, parameter inputan jari-jari, squash factor, dan reject ratio berbanding terbalik terhadap jumlah klaster. Sedangkan parameter accept ratio tidak memberikan pengaruh apapun terhadap jumlah klaster. Selain itu, parameter batas atas dan bawah data harus

ditentukan secara cermat oleh pengguna sesuai dengan kondisi data untuk mendapatkan hasil klaster yang baik. Sedangkan FIS memberikan performansi yang baik dalam memilih jumlah klaster yang optimal berdasar tingkat akurasinya.

Kata Kunci : fuzzy clustering, subtractive clustering, fuzzy subtractive clustering, fuzzy inference system

Abstract

Cluster analysis is one good way for quick review of data. Cluster is determined based on characteristics equation of each data. Sometimes we can‟t put data exactly on single cluster because it is located between two or more clusters. In reviewing data, requires several analysis before clusters number can be determined. It is required specific mechanism to get right cluster to obtain optimal cluster without having to specify clusters number beforehand.

Fuzzy Subtractive Clustering (FSC) is clustering algorithm to find clusters and well capable of finding cluster because considering all dimensions of data. FSC is unsupervised algorithm and users don‟t need to specify the number of clusters beforehand. Implementation of Fuzzy Inference System (FIS) on the clustering results of the FSC in order to obtain maximum

performance from the cluster. FIS plays a role in choosing the optimal cluster for calculating the accuracy value.

On FSC algorithm, input parameters including influance range, squash factor, and reject ratio is inversely proportional to clusters number. While accept ratio parameter doesn‟t have any influence on clusters number. In addition, upper and lower limits parameters must be accurately determined by users in accordance with data conditions to obtain good clustering results. While FIS had better performance in selecting optimal number of clusters based on the level of accuracy.

Keywords : fuzzy clustering, subtractive clustering, fuzzy subtractive clustering, fuzzy inference system

(2)

1

1. Pendahuluan

1.1

Latar belakang

Kebutuhan akan analisis data semakin berkembang. Salah satu cara dalam menganalisis data tersebut dengan cara membentuk suatu klaster. Suatu klaster ditentukan berdasarkan persamaan karakteristik dari setiap data. Dari klaster yang dihasilkan, dapat diketahui informasi mengenai kemiripan data dalam klaster tersebut. Salah satu keuntungan dalam membentuk klaster untuk proses analisis adalah dapat dengan mudah membaca karakteristik dari tiap klaster data sehingga memudahkan dalam menganalisa data. Analisis klaster merupakan cara yang bagus untuk mempercepat dalam meninjau data khususnya jika data diklaster ke dalam beberapa kelompok[5]. Oleh karena itu dibutuhkan suatu mekanisme tertentu untuk membentuk klaster yang tepat. Pada proses pengklasteran, pembentukan klaster dilakukan sedemikian rupa sehingga setiap data berada tepat dalam satu klaster. Namum, terkadang kita tidak dapat menempatkan suatu data dengan tepat pada satu klaster, karena terletak diantara dua atau lebih klaster. Kadangkala perbedaan data dapat memberikan hasil klaster yang kurang akurat, sehingga diperlukan suatu cara atau metode untuk menghasilkan klaster yang lebih akurat. Banyak cara atau metode yang dapat digunakan untuk menghasilkan klaster yang lebih akurat. Akan tetapi metode tersebut terkadang juga dapat memberikan hasil yang kurang optimal, sehingga diperlukan lagi cara untuk mengoptimalkan hasil klaster tersebut.

Salah satu metode pengklasteran yang dirasa dapat memberikan hasil klaster yang lebih akurat adalah Fuzzy Subtractive Clustering (FSC). FSC merupakan salah satu algoritma klasterisasi dalam mencari klaster yang tepat. FSC memiliki kemampuan yang baik dalam menemukan klaster karena mempertimbangkan seluruh dimensi atau variabel yang dimiliki suatu data. FSC merupakan algoritma yang tidak terawasi sehingga pengguna tidak perlu menentukan jumlah klaster terlebih dahulu. Pengguna akan mendapatkan informasi jumlah klaster yang tepat hasil algoritma FSC. Hasil dari algoritma FSC ini berupa pusat klaster, standar deviasi, dan derajat keanggotaan tiap data terhadap klaster yang dihasilkan. Derajat keanggotaan tersebut mencerminkan kedekatan tiap data terhadap pusat klaster sehingga dapat dilihat anggota dari masing-masing klaster.

Untuk mengetahui lebih lanjut tingkat keakuratan dari klaster yang dihasilkan oleh FSC, maka dapat dibangun suatu Fuzzy Inference System(FIS). FIS merupakan sistem yang dapat melakukan penalaran dengan prinsip serupa seperti manusia melakukan penalaran dengan nalurinya dengan input berupa bilangan tertentu dan output yang dihasilkan juga harus berupa bilangan tertentu. Pada FIS dibagi atas tiga proses yaitu fuzzifikasi, rule evaluation, dan defuzzifikasi. Pada proses fuzzifikasi dihasilkan suatu fungsi keanggotaan. Fungsi keanggotaan hasil fuzzifikasi menggunakan standar deviasi hasil FSC yang kemudian digunakan dalam defuzzifikasi. Perbedaan hasil defuzzifikasi FIS dengan data target (variabel output) akan digunakan untuk mengukur tingkat akurasi.

Pada tugas akhir ini dilakukan pengujian terhadap data Iris yang dikenalkan oleh Sir Ronald Aylmer Fisher (1936) sebagai contoh untuk analisis perbedaan[6].

(3)

Iris merupakan genus (marga) dari suatu spesies tanaman bunga. Kumpulan data Iris tersebut terdiri dari lima puluh contoh dari masing-masing subgenus Iris (Iris

setosa, Iris virginica, dan Iris versicolor). Empat fitur yang diukur dari

masing-masing contoh yaitu panjang dan lebar dari sepal (kelopak) dan petal (mahkota) Iris dalam ukuran sentimeter. Berdasarkan kombinasi dari keempat fitur tersebut, Fisher mengembangkan suatu model untuk membedakan spesies dari masing-masing data. Data Fisher tersebut biasa digunakan sebagai uji tipikal untuk teknik-teknik klasifikasi. Selain data Iris, tugas akhir ini juga melakukan percobaan untuk data yang lain yaitu data nilai mahasiswa yang diambil dari referensi 2. Data ini terdiri dari lima variabel yaitu nilai UTS (Ujian Tengah Semester), nilai tugas I, nilai UAS (Ujian Akhir Semester), nilai tugas II, dan nilai akhir. Selain kedua data yang telah disebutkan sebelumnya, tugas akhir ini juga menggunakan data dummy. Penelitian menggunakan data ini dimaksudkan untuk mengetahui kemungkinan suatu data terletak tidak tepat pada satu klaster, karena terletak diantara dua atau lebih klaster.

Pada permasalahan di atas, pemilihan model fuzzy dikarenakan berkemampuan untuk menjelaskan secara linguistik suatu sistem. Aturan-aturan dalam model fuzzy pada umumnya dibangun berdasarkan keahlian manusia dan pengetahuan heuristik dari sistem yang dimodelkan. Model fuzzy sangat sederhana dan mudah untuk dimengerti serta mengaplikasikan pengalaman tanpa proses pelatihan. Selain itu model fuzzy lebih fleksibel dan memiliki toleransi terhadap data-data yang tidak tepat dan didasarkan pada bahasa alami. Teknik ini selanjutnya dikembangkan menjadi teknik yang dapat mengidentifikasi aturan-aturan dari suatu basis data yang telah dikelompokkan berdasarkan persamaan strukturnya. Dalam hal ini metode pengelompokan fuzzy berfungsi untuk mencari klaster-klaster data. Informasi yang dihasilkan dari metode pengelompokan ini, yaitu informasi tentang pusat kelompok, digunakan untuk membentuk aturan-aturan dalam sistem penalaran fuzzy..

1.2

Perumusan masalah

Permasalahan yang akan dibahas pada tugas akhir ini adalah

1. bagaimana performansi sistem ditinjau dari tingkat akurasi hasil klasterisasi FSC

2. faktor-faktor apa saja pada FSC yang mempengaruhi ketepatan hasil klaster yang dijadikan sebagai dasar dalam penentuan jumlah aturan FIS Agar tujuan akhir tercapai maka diperlukan adanya ruang lingkup yang menjadi batasan masalah. Pada tugas akhir ini yang menjadi batasan masalah diantaranya

1. metode fuzzy inference system yang digunakan adalah metode Sugeno orde satu.

2. fungsi keanggotaan yang digunakan pada proses fuzzifikasi adalah fungsi Gaussian karena punya tingkat ketelitian yang baik

3. tipe data berupa data numerik (angka) baik bilangan bulat maupun desimal dan tidak null dan salah satu variabelnya dapat dijadikan sebagai variabel output yang akan digunakan pada metode Sugeno orde satu.

4. faktor-faktor pengaruh ketepatan penentuan jumlah aturan pada fuzzy

(4)

3

fuzzy subtractive clustering yang terdiri dari jari-jari, accept ratio, reject

ratio, dan squash factor

1.3

Tujuan

Melihat permasalahan di atas, tujuan yang dapat ditetapkan diantaranya

1. mengetahui performansi dari sistem yang ditinjau dari tingkat akurasi hasil klasterisasi algoritma FSC

2. membangun klaster yang optimal dengan tujuan demi performansi yang maksimal

3. menguji faktor-faktor yang berpengaruh dalam ketepatan hasil klaster.

1.4

Metodologi penyelesaian masalah

Metodologi yang akan digunakan untuk menyelesaikan tugas akhir ini adalah : 1. Studi literatur

Untuk menyelesaikan masalah tugas akhir ini, pertama kali dilakukan pembelajaran terhadap logika fuzzy dengan fungsi keanggotaan berbentuk Kurva Gauss. Kemudian pada tahap selanjutnya mempelajari proses pengklasteran data yang menggunakan algoritma Fuzzy Subtractive

Clustering. Sedangkan tahap terakhir mempelajari literatur mengenai Fuzzy Inference System menggunakan metode Sugeno orde-1 serta mempelajari

proses penentuan tingkat akurasi untuk mengetahui performansi sistem. 2. Perancangan sistem, yaitu:

Pada proses perancangan sistem, data akan dibagi menjadi data latih dan data uji. Selanjutnya data latih diolah dan dilakukan pengklasteran data menggunakan algoritma Fuzzy Subtractive Clustering hingga menghasilkan

sigma (standart deviasi) dan pusat klaster. Tahap berikutnya variabel-variabel

data latih akan dibedakan menjadi variabel input dan variabel output, selanjutnya menghitung derajat keanggotaan tiap data dengan hanya melibatkan variabel-variabel input saja terhadap pusat klaster yang telah dihasilkan. Berikutnya membangun Fuzzy Inference System menggunakan metode Sugeno orde-1 berdasar derajat keanggotaan, nilai sigma, dan pusat klaster hasil klasterisasi algoritma Fuzzy Subtractive Clustering. Hasil defuzzifikasi pada proses Fuzzy Inference System selanjutnya akan dilakukan perhitungan performansi sistem yang dilihat dari tingkat akurasi antara variabel output data dengan hasil defuzzifikasi. Tahap terahir dilakukan pengujian dari data uji terhadap data latih.

3. Implementasi

Setelah mendapatkan rancangan yang jelas, barulah sistem diterapkan dalam bentuk suatu program simulasi dengan mengimplementasikan fuzzy

inference system pada hasil klasterisasi algoritma fuzzy subtractive clustering

untuk selanjutnya akan dilakukan analisa. 4. Evaluasi dan analisis hasil

Pada tahap ini hasil sistem akan dievaluasi sehingga dapat diketahui apakah hasil sistem yang diimplementasikan sesuai dengan tujuan yang dilakukan untuk melihat performansi sistem berdasar tingkat akurasi, membentuk klaster yang optimal, serta untuk mengetahui faktor-faktor yang

(5)

mempengaruhi ketepatan hasil klaster. Kemudian dilakukan analisis terhadap sistem berdasar data-data yang diperoleh pada tahap implementasi

5. Pembuatan Dokumentasi

Tahap akhir dari penelitian ini adalah pembuatan dokumentasi disertai manarik kesimpulan dari seluruh langkah-langkah yang dilakukan dalam penelitian serta saran–saran yang perlu diperhatikan untuk memperbesar manfaat penelitian ini terutama dalam hal perbaikan hasil penelitian.

1.5 Sistematika Penulisan

BAB I Pendahuluan

Bab ini menguraikan tugas akhir secara umum, meliputi latar belakang, perumusan masalah, tujuan, dan metodologi penyelesaian masalah yang digunakan.

BAB 2 Dasar Teori

Bab ini membahas uraian teori yang berhubungan dengan sistem fuzzy, algoritma fuzzy subtractive clusering, fuzzy inference system menggunakan metode Sugeno orde-1, serta prosentase menentukan tingkat akurasi. BAB 3 Analisis Kebutuhan dan Pemodelan Sistem

Bab ini berisi gambaran umum sistem, analisa kebutuhan sistem, pengolahan data, serta pemodelan sistem

BAB 4 Percobaan dan Analisis Hasil Percobaan

Bab ini membahas mengenai hasil percobaan yang telah dilakukan yaitu pengklasteran data latih dan selanjutnya akan dianalisa faktor-faktor yang berpengaruh terhadap hasil klaster tersebut serta performansi sistem yang dilihat dari aspek akurasi

BAB 5 Kesimpulan dan Saran

Berisi kesimpulan dari pembuatan tugas akhir ini dan saran-saran yang diperlukan untuk pengembangan lebih lanjut.

(6)

34

5. Kesimpulan dan Saran

5.1

Kesimpulan

Kesimpulan yang dapat diambil pada tugas akhir ini antara lain :

1. Implementasi FIS terhadap FSC memberikan kinerja yang maksimal dalam menghasilkan jumlah klaster dengan tingkat akurasi lebih dari 97% 2. Penerapan FIS pada algoritma FSC memberikan manfaat dalam

menghitung kualitas hasil klasterisasi FSC karena FIS secara otomatis memperhitungkan nilai akurasi dari klaster yang dihasilkan sehingga didapatkan hasil klaster yang optimal.

3. Faktor-faktor yang berpengaruh terhadap hasil klasterisasi algoritma FSC antara lain jari-jari, reject ratio, squash factor, batas bawah, dan batas atas. 4. Faktor-faktor tersebut di atas berbanding terbalik dengan jumlah klaster

yang dihasilkan. Semakin besar nilai jari-jari, reject ratio, dan squash

factor, jumlah klaster yang dihasilkan semakin sedikit.

5. Untuk range dari domain antara batas atas dan batas bawah, juga berbanding terbalik dengan jumlah klaster yang dihasilkan. Jumlah klaster yang dihasilkan dengan range domain yang besar lebih sedikit dibandingkan dengan range domain yang kecil.

6. Sedangkan faktor accept ratio tidak memberikan pengaruh terhadap jumlah klaster yang dihasilkan. Meskipun nilai accept ratio berbeda, jumlah klaster yang dihasilkan tetap.

7. Jumlah klaster yang sedikit belum tentu memberikan performansi yang maksimal. Suatu saat performansi maksimal dapat dicapai pada jumlah klaster yang cukup besar. Hal ini tergantung dengan kondisi dari data yang diproses dan nilai parameter-parameter algoritma FSC serta prosentase tingkat akurasi.

8. Suatu data dapat tergabung ke dalam dua atau lebih klaster karena data tersebut memiliki derajat maksimal keanggotaan yang sama pada klaster-klaster tertentu.

9. Data yang digunakan dalam algoritma ini harus dalam bentuk data numerik

10. Salah satu variabel dalam data yang digunakan dapat dijadikan sebagai variabel output dalam proses FIS

5.2

Saran

Saran-saran untuk pengembangan tahap selanjutnya antara lain :

1. Pengguna harus lebih cermat ketika menentukan parameter batas atas dan bawah data yang disesuaikan dengan kondisi data yang ada

2. Pengguna lebih bijak dalam menentukan variabel output

Powered by TCPDF (www.tcpdf.org)

(7)

Referensi

[1] __________

http://elearning.uin-suka.ac.id/attachment/fuzzy_inference_system_yb.ppt

diakses pada : 1 Juni 2008

[2] __________. http://www.ittelkom.ac.id/staf/suy diakses pada : Juni 2010 [3] __________. http://www.math.tau.ac.il/~mansour/ml-course/iris.data

diakses pada : Juni 2010

[4] ___________.2001. Fuzzy Logic Toolbox User’s Guide. The MathWorks, Inc. Available on

:www.mathworks.com/access/helpdesk/help/pdf_doc/fuzzy/fuzzy.pdf, diakses pada : 31 Januari 2008

[5] __________. Cluster Analysis. http://wikipedia.org/wiki/Cluster_analysis. diakses pada : Maret 2010

[6] __________. Iris Flower Data Set.

http://wikipedia.org/wiki/Iris_flower_data_set. diakses pada : Maret 2010 [7] __________. Learning. ITP Informatics Eng. Dept : ITTelkom

[8] __________. Mean Absolute Percentage Error.

http://wikipedia.org/wiki/MAPE. diakses pada : Maret 2010 [9] __________. Percent Difference.

http://wikipedia.org/wiki/Percent_difference. diakses pada : Maret 2010 [10] Berkhin, Pavel. Survey of Clustering Data Mining Techniques. Available

on : www.cc.gatech.edu/~isbell/reading/papers/berkhin02survey.pdf, diakses pada : 31 Januari 2008

[11] Han, Jiawei & Kamber, Micheline. 2001. Data Mining: Concepts and

Techniques.

[12] Kusumadewi, Sri & Purnomo, Hari. 2004. Aplikasi Logika Fuzzy untuk

Pendukung Keputusan. Yogyakarta: Graha Ilmu

[13] Kuswadi, Son.2007. Kendali Cerdas, Teori dan Aplikasi Praktisnya. Yogyakarta: Andi

[14] Nakkrasae, Sathit. March 2004. Fuzzy Subtractive Clustering Based

Indexing Approach For Software Components Classification. International

Journal of Computer & Information Science, Vol. 5, No. 1,

[15] Tafazoli, Siamak., Leduc, Mathieu., dan Sun, Xuehong. 2006. Hysteresis

Modeling using Fuzzy Subtractive Clustering. International Journal Of

Computational Cognition. Available on :

www.yangsky.com/ijcc/pdf/ijcc433.pdf, diakses pada : 31 Januari 2008 [16] Seema Chopra, R. Mitra, and Vijay Kumar. Analysis of Fuzzy PI and PD

Type Controllers Using Subtractive Clustering. International Journal of

Computational Cognition. Juni 2006. Available on: http://www.ijcc.us , diakses pada : 31 Januari 2008

[17] Witten, Ian H. & Frank, Eibe. 2005. Data Mining : Practical Machine

Referensi

Dokumen terkait

Untuk menghapus data, pertama, pilih jenis barang yang akan dihapus, kemudian click tombol Delete, dan selanjutnya akan ditampilkan jendela seperti berikut:. Jendela Hapus Data

 perdarahan pas$a pas$a persalinan persalinan 6an4 6an4 disebabkan disebabkan oleh oleh atonia atonia uteri. 7indak 7indakan an ini ini men44unakan men44unakan

Cemaran biologis pada makanan dapat terjadi karena adanya mikroba seperti bakteri, kapang, kamir, parasit, dan virus, di mana pertumbuhan mikroba ini dapat

Prestasi yang didapat oleh kafilah UNAIR pada ajang MTQ Nasional ke XIV di Universitas Indonesia Agustus lalu, menjadi pelecut masifnya keikutsertaan peserta dan yang

Bila yang disoroti sisi bentuk dari ujaran bermakna (shigat ma’niyah), berarti kita membahasnya sebagai satuan leksikal, sedangkan jika yang disoroti lebih pada sisi

material. Fenomena volkanisme dapat terjadi berkaitan dengan mekanisme penunjaman.. Ketika kerak samudera masuk kembali ke dalam mantel dan meleleh kembali,

Selain dari beberapa karya di atas, Fazlur Rahman pernah menulis artikel yang berjudul “Iqbal in Modern Muslim Thoght” Rahman mencoba melakukan survei terhadap

Berdasarkan latar belakang tersebut maka oleh peneliti, penelitian dilanjutkan dengan menganalisis ketepatan penggunaan simbol dan singkatan dalam satu dokumen rekam