Contoh Perhitungan Manual 1. Input dataset

METODOLOGI PENELITIAN

3.2. Contoh Perhitungan Manual 1. Input dataset

Input data yang akan di cluster : , dengan = 1,2, … , ' dan ( = 1,2, … , . Dataset yang digunakan pada contoh perhitungan ini adalah Iris dataset yang didapat pada https://archive.ics.uci.edu/ml/datasets/iris.

3.2.2. Inisialisasi parameter

Langkah selanjutnya adalah menentukan parameter awal sebagai berikut : ) ∶ 0.45

ℎ . / ∶ 1.25

( ℎ ∶ 5

∶ 4.3; 2; 1; 0.1 ∶ 7.9; 44; 6.9; 2.5 3.2.3. Normalisasi dataset

Normalisasi nilai atribut dataset dilakukan dengan cara mengubah interval nilai atribut dataset yang sebenarnya ke dalam interval tertentu, dalam kasus ini diubah ke dalam interval [0,1]. Sebagai contoh, perhitungan terhadap Iris dataset sebagaimana persamaan 3.1: telah normalisasi seperti pada table 3.1.

Tabel 3.1. Kutipan Iris dataset ternormalisasi

₄ ₅ ₆ ₈

Tabel 3.1. Kutipan Iris dataset ternormalisasi (Lanjutan)

3.2.4. Penghitungan potensi setiap titik data

Potensi dari titik data dihitung menggunakan persamaan 2.2. Sebagai contoh, Potensi awal ₄ pada data pertama ₄, misalkan = 0.45. Sebagai contoh

Proses perhitungan jarak dilakukan untuk setiap data, yaitu = 1 sampai = 150, sehingga hasil akhir potensi awal untuk data pertama seperti pada table 3.2.

Tabel 3.2. Kutipan Potensi awal ₄ untuk data pertama ₄ sehingga hasil akhir potensi awal untuk seluruh data seperti pada table 3.3.

Tabel 3.3. Potensi awal ₄ Iris dataset

4 4 4

Tabel 3.3. Potensi awal ₄ Iris dataset (Lanjutan)

3.2.5. Potensi tertinggi ^∗ dan menetapkan pusat cluster

Dari table 3.3, nilai tertinggi terletak pada titik data ke-79. Selanjutnya inisialisasi variabel nilai tertinggi ^∗ dan letak titik data tertinggi dengan ℎ .

4∗= 30.4675 ℎ = 79

4 = = 0.4722; 0.3750; 0.5932; 0.5833

Kemudian kurangi potensi dari titik-titik didekat pusat cluster menggunakan persamaan (2.3). Sebagai contoh perhitungan, untuk pengurangan pada data pertama:

;₄₄=0.4722 − 0.2222

Kemudian dihitung menggunakan persamaan dibawah ini:

;C = <D − D⁵

Demikian seterusnya perhitungan tersebut dilakukan untuk = 2 sampai = 150. Kemudian dihitung nilai sebagai nilai pengurang potensial setiap titik data.

Sebagai contoh, untuk data pertama :

= ₄^∗B ^{?8 AF}^G = 30.4675 B ^{?8 5.4H8H} = 0.0047

Potensi baru merupakan pengurangan antara potensi lama dengan pengurang potensi . sebagai contoh untuk potensi baru dari data pertama adalah :

5 = ₅ − ₄ = 29.3694 − 0.0047 = 29.3648

Sehingga hasil akhir untuk potensi baru ₅ semua titik data, seperti pada table 3.4. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol.

Dari table 3.4, nilai tertinggi terletak pada titik data ke-8. Selanjutnya

Selanjutnya tentukan potensi titik tertinggi K dan letak titik data tersebut ℎ berdasarkan potensi baru dari titik data. Sehingga didapatkan hasil K = 30.3865, ℎ = 8, dan = 1 > 1 = 2.

Hal ini menandakan bahwa data ke-8 berpotensi menjadi pusat cluster baru dan jumlah pusat cluster 2 atau ≠ . Proses mencari potensi tertinggi ^∗ dan menetapkan pusat cluster dilakukan secara berulang sampai tercapai kondisi

tertentu, yaitu kondisi dimana = . Karena ≠ , maka kembali ke langkah 4, sampai = . Hasil akhir untuk potensi ₆ semua titik data, seperti pada table 3.5. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol. Dari table 3.5, nilai tertinggi terletak pada titik data ke-113. Selanjutnya inisialisasi variabel nilai tertinggi ₆^∗ dan letak titik data tertinggi dengan ℎ . Dimana :

6∗ = 16.8907

Hasil akhir untuk potensi ₈ semua titik data, seperti pada table 3.6. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol.

Dari table 3.6, nilai tertinggi terletak pada titik data ke-82. Selanjutnya inisialisasi variabel nilai tertinggi ₈^∗ dan letak titik data tertinggi dengan ℎ . Dimana :

Hasil akhir untuk potensi _M semua titik data, seperti pada table 3.7. Ketika potensi titik data ada yang bernilai kurang dari nol, maka nilai potensi titik data tersebut diset menjadi nol.

Dari table 3.7, nilai tertinggi terletak pada titik data ke-34. Selanjutnya inisialisasi variabel nilai tertinggi _M^∗ dan letak titik data tertinggi dengan ℎ . Dimana :

Sehingga didapatkan hasil sebagai berikut :

= > 1 = 4 > 1 = 5

Karena nilai = , maka proses dihentikan.

Dari proses perhitungan menggunakan subtractive clustering, Proses perhitungan ini menghasilkan 5 buah pusat cluster (center), selengkapnya pada table 3.8.

Tabel 3.8. Hasil pusat cluster

N Sepal length Sepal width Petal length Petal width

1 0.4722 0.3750 0.5932 0.5833

2 0.1944 0.5833 0.0847 0.0417

3 0.6944 0.4167 0.7627 0.8333

4 0.3333 0.1667 0.4746 0.4167

5 0.3333 0.9167 0.0678 0.0417

Selanjutnya mengembalikan pusat cluster dari bentuk ternormalisasi ke bentuk semula, menggunakan persamaan 3.10.

N ' = N ' ∗ − ' > ' 3.10

Berikut contoh perhitungan untuk mengembalikan pusat cluster pada cluster pertama:

' ₄₄= ' ₄₄B ₄− '₄ > '₄

= 0.4722 B 7.9 − 4.3 > 4.3 = 6

' ₄₅ = ' ₄₅B ₅− '₅ > '₅

= 0.3750 B 4.4 − 2 > 2 = 2.9

' ₄₆= ' ₄₆B ₆− '₆ > '₆

= 0.5932 B 6.9 − 1 > 1 = 4.5

' ₄₈ = ' ₄₈B ₈− '₈ > '₈

= 0.5833 B 2.5 − 0.1 > 0.1 = 1.5

Hasil pengembalian seluruh pusat cluster ke bentuk semula, selengkapnya pada table 3.9.

Tabel 3.9. Hasil center denormalisasi

Langkah selanjutnya adalah menghitung nilai sigma menggunakan persamaan (3.11). Contoh perhitungan untuk menghitung nilai sigma cluster adalah sebagai berikut:

Hasil sigma cluster selengkapnya ditampilkan pada tabel 3.10.

Tabel 3.10. Nilai sigma cluster

Sepal length Sepal width Petal length Petal width

0.5728 0.3818 0.9387 0.3818

Langkah terakhir adalah menentukan masing-masing titik-titik data masuk ke dalam cluster mana berdasarkan derajat keanggotaannya, pada penelitian ini menggunakan fungsi gaussian pada persamaan (3.12). Berikut contoh perhitungan derajat keanggotaan pada data pertama terhadap pusat cluster pertama:

Q_R = ^{? ∑}

Q₄₄= ^{?de M.4?f} akhir untuk derajat keanggotaan pada cluster kedua Q_^5 , cluster ketiga Q_^6 , cluster keempat Q_^8 , dan cluster kelima Q_^M . Penentuan suatu titik data masuk ke cluster mana dapat dilihat dari besarnya nilai derajat keanggotaan. Sehingga suatu titik data dikatakan masuk ke dalam cluster yang derajat keanggotaan titik data pada cluster tersebut lebih besar dari nilai derajat keanggotaan titik data pada cluster lainnya. Hasil clustering selengkapnya pada tabel 3.11:

Tabel 3.11. Hasil proses algoritma subtractive clustering

4 5 6 8 N4 N5 N6 N8 NM

Tabel 3.11. Hasil proses algoritma subtractive clustering (Lanjutan)

3.2.6. Hitung fuzzy silhouette index

Berdasarkan data yang diperoleh dari tabel 3.11 maka perlu dilakukan pengujian terhadap kualitas hasil clustering tersebut, pada penelitian ini pengujian kualitas hasil clustering dilakukan dengan menggunakan metode fuzzy silhouette index dan pengukuran jaraknya menggunakan metode Euclidean Distance, dengan menggunakan persamaan (2.6), (2.7), (2.8), (2.9), dan (2.10)

1. Menghitung nilai , menggunakan persamaan 2.6:

Berikut contoh perhitungan nilai N₄ pada data ke-51:

= 1

2. Menghitung nilai , menggunakan persamaan 2.7:

a. Hitung rata-rata jarak data di N₄ terhadap N₅

= 0.05 ∗ 76.71 = 3.8355

d. Hitung rata-rata jarak data di N₄ terhadap N_M

Berikut contoh perhitungan nilai N₄ pada data ke-51 terhadap N_M:

7 ) ^M4⁵ , _f⁵ > ) _M4⁵ , _4M⁵ > ⋯ ) _M4⁵ , ₆₈⁵

7 13.05 > 15.77 > ⋯ > 15.58

= 0.1429 ∗ 102.62 = 14.66

Untuk menentukan nilai , cari nilai terendah (minimum) dari rata-rata jarak di N₄ terhadap N₅, N₆, N₈serta N_M.

Tabel 3.12. Hasil dan (Lanjutan)

Pada fuzzy silhouette index, nilai rata-rata silhouette cluster dihitung menggunakan rata-rata tertimbang. Setiap nilai titik data diberi nilai bobot berdasarkan pengurangan nilai keanggotaan cluster terbesar, menggunakan persamaan 2.9. Berikut contoh perhitungan pada data ke-1.

pq ∶ 0.946287

rq ∶ 0.145985

pq− _rq = s _q

0.946287 − 0.145985 = 0.8003

Hasil nilai bobot berdasarkan pengurangan nilai keanggotaan cluster terbesar, selengkapnya 3.13.

Tabel 3.13. Bobot keanggotaan _s (Lanjutan)

Tabel 3.13. Bobot keanggotaan _s (Lanjutan) persamaan 2.10. Hasil selengkapnya nilai . disajikan pada table 3.14.

Tabel 3.14. Hasil fuzzy silhouette index

;t = −

Tabel 3.14. Hasil fuzzy silhouette index (Lanjutan)

Tabel 3.14. Hasil fuzzy silhouette index (Lanjutan) diambil nilai rata-ratanya yang akan digunakan sebagai nilai average fuzzy silhouette index dari hasil clustering. Berdasarkan nilai . yang terdapat pada table 3.14.

maka diperoleh nilai average fuzzy silhouette index sebesar 0.5785.

x . =39.3698

68.0547 = 0.5785

Dalam dokumen ANALISIS KINERJA ALGORITMA SUBTRACTIVE CLUSTERING DALAM MENENTUKAN JUMLAH DAN POSISI PUSAT CLUSTER TESIS IRWANDI (Halaman 32-59)