METODOLOGI PENELITIAN
3.2. Contoh Perhitungan Manual 1. Input dataset
Input data yang akan di cluster : , dengan = 1,2, … , ' dan ( = 1,2, … , . Dataset yang digunakan pada contoh perhitungan ini adalah Iris dataset yang didapat pada https://archive.ics.uci.edu/ml/datasets/iris.
3.2.2. Inisialisasi parameter
Langkah selanjutnya adalah menentukan parameter awal sebagai berikut : ) ∶ 0.45
ℎ . / ∶ 1.25
( ℎ ∶ 5
∶ 4.3; 2; 1; 0.1 ∶ 7.9; 44; 6.9; 2.5 3.2.3. Normalisasi dataset
Normalisasi nilai atribut dataset dilakukan dengan cara mengubah interval nilai atribut dataset yang sebenarnya ke dalam interval tertentu, dalam kasus ini diubah ke dalam interval [0,1]. Sebagai contoh, perhitungan terhadap Iris dataset sebagaimana persamaan 3.1: telah normalisasi seperti pada table 3.1.
Tabel 3.1. Kutipan Iris dataset ternormalisasi
4 5 6 8
Tabel 3.1. Kutipan Iris dataset ternormalisasi (Lanjutan)
3.2.4. Penghitungan potensi setiap titik data
Potensi dari titik data dihitung menggunakan persamaan 2.2. Sebagai contoh, Potensi awal 4 pada data pertama 4, misalkan = 0.45. Sebagai contoh
Proses perhitungan jarak dilakukan untuk setiap data, yaitu = 1 sampai = 150, sehingga hasil akhir potensi awal untuk data pertama seperti pada table 3.2.
Tabel 3.2. Kutipan Potensi awal 4 untuk data pertama 4 sehingga hasil akhir potensi awal untuk seluruh data seperti pada table 3.3.
Tabel 3.3. Potensi awal 4 Iris dataset
4 4 4
Tabel 3.3. Potensi awal 4 Iris dataset (Lanjutan)
3.2.5. Potensi tertinggi ∗ dan menetapkan pusat cluster
Dari table 3.3, nilai tertinggi terletak pada titik data ke-79. Selanjutnya inisialisasi variabel nilai tertinggi ∗ dan letak titik data tertinggi dengan ℎ .
4∗= 30.4675 ℎ = 79
4 = = 0.4722; 0.3750; 0.5932; 0.5833
Kemudian kurangi potensi dari titik-titik didekat pusat cluster menggunakan persamaan (2.3). Sebagai contoh perhitungan, untuk pengurangan pada data pertama:
;44=0.4722 − 0.2222
Kemudian dihitung menggunakan persamaan dibawah ini:
;C = <D − D5
Demikian seterusnya perhitungan tersebut dilakukan untuk = 2 sampai = 150. Kemudian dihitung nilai sebagai nilai pengurang potensial setiap titik data.
Sebagai contoh, untuk data pertama :
= 4∗B ?8 AFG = 30.4675 B ?8 5.4H8H = 0.0047
Potensi baru merupakan pengurangan antara potensi lama dengan pengurang potensi . sebagai contoh untuk potensi baru dari data pertama adalah :
5 = 5 − 4 = 29.3694 − 0.0047 = 29.3648
Sehingga hasil akhir untuk potensi baru 5 semua titik data, seperti pada table 3.4. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol.
Dari table 3.4, nilai tertinggi terletak pada titik data ke-8. Selanjutnya
Selanjutnya tentukan potensi titik tertinggi K dan letak titik data tersebut ℎ berdasarkan potensi baru dari titik data. Sehingga didapatkan hasil K = 30.3865, ℎ = 8, dan = 1 > 1 = 2.
Hal ini menandakan bahwa data ke-8 berpotensi menjadi pusat cluster baru dan jumlah pusat cluster 2 atau ≠ . Proses mencari potensi tertinggi ∗ dan menetapkan pusat cluster dilakukan secara berulang sampai tercapai kondisi
tertentu, yaitu kondisi dimana = . Karena ≠ , maka kembali ke langkah 4, sampai = . Hasil akhir untuk potensi 6 semua titik data, seperti pada table 3.5. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol. Dari table 3.5, nilai tertinggi terletak pada titik data ke-113. Selanjutnya inisialisasi variabel nilai tertinggi 6∗ dan letak titik data tertinggi dengan ℎ . Dimana :
6∗ = 16.8907
Hasil akhir untuk potensi 8 semua titik data, seperti pada table 3.6. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol.
Dari table 3.6, nilai tertinggi terletak pada titik data ke-82. Selanjutnya inisialisasi variabel nilai tertinggi 8∗ dan letak titik data tertinggi dengan ℎ . Dimana :
Hasil akhir untuk potensi M semua titik data, seperti pada table 3.7. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol.
Dari table 3.7, nilai tertinggi terletak pada titik data ke-34. Selanjutnya inisialisasi variabel nilai tertinggi M∗ dan letak titik data tertinggi dengan ℎ . Dimana :
Sehingga didapatkan hasil sebagai berikut :
= > 1 = 4 > 1 = 5
Karena nilai = , maka proses dihentikan.
Dari proses perhitungan menggunakan subtractive clustering, Proses perhitungan ini menghasilkan 5 buah pusat cluster (center), selengkapnya pada table 3.8.
Tabel 3.8. Hasil pusat cluster
N Sepal length Sepal width Petal length Petal width
1 0.4722 0.3750 0.5932 0.5833
2 0.1944 0.5833 0.0847 0.0417
3 0.6944 0.4167 0.7627 0.8333
4 0.3333 0.1667 0.4746 0.4167
5 0.3333 0.9167 0.0678 0.0417
Selanjutnya mengembalikan pusat cluster dari bentuk ternormalisasi ke bentuk semula, menggunakan persamaan 3.10.
N ' = N ' ∗ − ' > ' 3.10
Berikut contoh perhitungan untuk mengembalikan pusat cluster pada cluster pertama:
' 44 = ' 44B 4− '4 > '4
= 0.4722 B 7.9 − 4.3 > 4.3 = 6
' 45 = ' 45B 5− '5 > '5
= 0.3750 B 4.4 − 2 > 2 = 2.9
' 46 = ' 46B 6− '6 > '6
= 0.5932 B 6.9 − 1 > 1 = 4.5
' 48 = ' 48B 8− '8 > '8
= 0.5833 B 2.5 − 0.1 > 0.1 = 1.5
Hasil pengembalian seluruh pusat cluster ke bentuk semula, selengkapnya pada table 3.9.
Tabel 3.9. Hasil center denormalisasi
Langkah selanjutnya adalah menghitung nilai sigma menggunakan persamaan (3.11). Contoh perhitungan untuk menghitung nilai sigma cluster adalah sebagai berikut:
Hasil sigma cluster selengkapnya ditampilkan pada tabel 3.10.
Tabel 3.10. Nilai sigma cluster
Sepal length Sepal width Petal length Petal width
0.5728 0.3818 0.9387 0.3818
Langkah terakhir adalah menentukan masing-masing titik-titik data masuk ke dalam cluster mana berdasarkan derajat keanggotaannya, pada penelitian ini menggunakan fungsi gaussian pada persamaan (3.12). Berikut contoh perhitungan derajat keanggotaan pada data pertama terhadap pusat cluster pertama:
QR = ? ∑
Q44= ?de M.4?f akhir untuk derajat keanggotaan pada cluster kedua Q^5 , cluster ketiga Q^6 , cluster keempat Q^8 , dan cluster kelima Q^M . Penentuan suatu titik data masuk ke cluster mana dapat dilihat dari besarnya nilai derajat keanggotaan. Sehingga suatu titik data dikatakan masuk ke dalam cluster yang derajat keanggotaan titik data pada cluster tersebut lebih besar dari nilai derajat keanggotaan titik data pada cluster lainnya. Hasil clustering selengkapnya pada tabel 3.11:
Tabel 3.11. Hasil proses algoritma subtractive clustering
4 5 6 8 N4 N5 N6 N8 NM
Tabel 3.11. Hasil proses algoritma subtractive clustering (Lanjutan)
Tabel 3.11. Hasil proses algoritma subtractive clustering (Lanjutan)
Tabel 3.11. Hasil proses algoritma subtractive clustering (Lanjutan)
3.2.6. Hitung fuzzy silhouette index
Berdasarkan data yang diperoleh dari tabel 3.11 maka perlu dilakukan pengujian terhadap kualitas hasil clustering tersebut, pada penelitian ini pengujian kualitas hasil clustering dilakukan dengan menggunakan metode fuzzy silhouette index dan pengukuran jaraknya menggunakan metode Euclidean Distance, dengan menggunakan persamaan (2.6), (2.7), (2.8), (2.9), dan (2.10)
1. Menghitung nilai , menggunakan persamaan 2.6:
Berikut contoh perhitungan nilai N4 pada data ke-51:
= 1
2. Menghitung nilai , menggunakan persamaan 2.7:
a. Hitung rata-rata jarak data di N4 terhadap N5
= 0.05 ∗ 76.71 = 3.8355
d. Hitung rata-rata jarak data di N4 terhadap NM
Berikut contoh perhitungan nilai N4 pada data ke-51 terhadap NM:
=1
7 ) M45 , f5 > ) M45 , 4M5 > ⋯ ) M45 , 685
=1
7 13.05 > 15.77 > ⋯ > 15.58
= 0.1429 ∗ 102.62 = 14.66
Untuk menentukan nilai , cari nilai terendah (minimum) dari rata-rata jarak di N4 terhadap N5, N6, N8 serta NM.
Tabel 3.12. Hasil dan (Lanjutan)
Tabel 3.12. Hasil dan (Lanjutan)
Pada fuzzy silhouette index, nilai rata-rata silhouette cluster dihitung menggunakan rata-rata tertimbang. Setiap nilai titik data diberi nilai bobot berdasarkan pengurangan nilai keanggotaan cluster terbesar, menggunakan persamaan 2.9. Berikut contoh perhitungan pada data ke-1.
pq ∶ 0.946287
rq ∶ 0.145985
pq− rq = s q
0.946287 − 0.145985 = 0.8003
Hasil nilai bobot berdasarkan pengurangan nilai keanggotaan cluster terbesar, selengkapnya 3.13.
Tabel 3.13. Bobot keanggotaan s (Lanjutan)
Tabel 3.13. Bobot keanggotaan s (Lanjutan)
Tabel 3.13. Bobot keanggotaan s (Lanjutan)
Tabel 3.13. Bobot keanggotaan s (Lanjutan) persamaan 2.10. Hasil selengkapnya nilai . disajikan pada table 3.14.
Tabel 3.14. Hasil fuzzy silhouette index
;t = −
Tabel 3.14. Hasil fuzzy silhouette index (Lanjutan)
Tabel 3.14. Hasil fuzzy silhouette index (Lanjutan)
Tabel 3.14. Hasil fuzzy silhouette index (Lanjutan)
Tabel 3.14. Hasil fuzzy silhouette index (Lanjutan) diambil nilai rata-ratanya yang akan digunakan sebagai nilai average fuzzy silhouette index dari hasil clustering. Berdasarkan nilai . yang terdapat pada table 3.14.
maka diperoleh nilai average fuzzy silhouette index sebesar 0.5785.
x . =39.3698
68.0547 = 0.5785