• Tidak ada hasil yang ditemukan

ANALISIS PENGARUH NILAI CENTROID TERHADA

N/A
N/A
Protected

Academic year: 2018

Membagikan "ANALISIS PENGARUH NILAI CENTROID TERHADA"

Copied!
4
0
0

Teks penuh

(1)

ANALISIS PENGARUH NILAI CENTROID TERHADAP JUMLAH

ITERASI DENGAN MENGGUNAKAN METODE CLUSTERING

(STUDI KASUS PT. PHP MOTOR)

Evri Ekadiansyah

1

, Purwa Hasan Putra

2

1Dosen Teknik Informatika, STMIK Potensi Utama 2 Mahasiswa Sistem Informasi, STMIK Potensi Utama 1,2Jl. K L. Yos Sudarso Km 6,5 No. 3A Tanjung Mulia-Medan

1

evrie1409@gmail.com 2

purwahasanputra21@gmail.com

Abstrak

Currently, the concept of data mining is increasingly recognized as an important tool in the management of information due to the amount of information that increasingly large numbers. One of the known techniques in data mining, namely clustering. Understanding clustering in data mining scientific data or grouping a number of objects in the cluster will contain data that is as similar as possible and different from the other objects in the cluster. In this study, the authors tried to analyze the amount of the value of the centroid of the number of iterations by using clustering methods. Testing the number of centroid value 2 has a smaller number of iterations is the 3rd iteration with previous data similarity level, compared to the number of centroid values 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 , 15, 16, 17, 18, 19, 20. Testing the number of centroid value 4 has a greater number of iterations, reaching 14 iterations to reach the level of similarity to previous data. The number of different centroid values will result in the number of iterations of the different anyway. The number of large centroid value does not always lead to the number of iterations increases.

Kata kunci: data mining, clustering.

1.Pendahuluan

Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen infomasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri sering disebut sebagai knowledge discovery in database

(KDD) adalah kegiatan yang meliputi

pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola hubungan dalam set data berukuran besar . Output dari data mining ini dapat digunakan untuk pengambilan keputusan di masa depan.

Salah satu teknik yang dikenal dalam data mining yaitu clustering. Pengertian clustering keilmuan dalam data mining pengelompokan sejumlah data atau objek ke dalam cluster tersebut akan berisi data yang semirip mungkin dan berbeda dengan objek dalam cluster yang lainnya. Sampai saat ini, para ilmuan masih terus melakukan berbagai usaha untuk melakukan perbaikan model cluster dan menghitung jumlah

cluster yang optimal sehingga dapat dihasilkan cluster yang paling baik [1].

Tutik Khotimah (2014) melakukan pengelompokan surat-surat dalam Al Qur’an dengan menggunakan algoritma K-means. Pengelompokan menghasilkan 4 cluster dengan anggota cluster_0 sebanyak 18 surat, cluster_1 sebanyak 26 surat, cluster_2 sebanyak 7 surat, cluster_3 sebanyak 63 surat. Pengelompokan ini

telah mencapai nilaioptimal pada iterasi ke-14 [3].

Kumar Ch.N.Santosh, V.Shita Ramulu, et al. (2012) Tujuan utama dari data mining adalah untuk menemukan pengetahuan yang kompleks dari data yang tersembunyi. Berdasarkan amalisis

clustering ditemukan informasi yang

menggambarkan objek atau hubungan data terdapat semua anggota dari cluster yang sama memiliki fitur serupa sedangkan cluster yang berbeda memiliki fitur yang berbeda [4].

Dari penelitian sebelumnya belum pernah digunakan pengaruh nilai centroid terhadap jumlah iterasi dengan menggunakan metode

Clustering.

Tujuan penelitian ini dilakukan adalah untuk menganalisis pengaruh jumlah nilai centroid terhadap jumlah iterasi dengan menggunakan metode clustering.

2.Data Mining

(2)

3. Metode Penelitian

Metode penelitian ini meliputi tahapan analisis dilakukan pada saat tahap perencanaan telah selesai. Pada tahapan ini melakukan penelitian lanjutan untuk memperoleh data yang lebih terperinci, yang betujuan untuk keperluan pengembangan sistem secara teknis.

Selanjutnya penelitian ini untuk menganalisa pengaruh centroid terhadap jumlah iterasi dengan metode clustering. Penulis ingin mengetahui apakah ada perbedaan antara penambahan centroid dengan jumlah iterasi.

Untuk mencapai tujuan tersebut, penulis akan melakukan perbandingan dengan menggunakan data kredit sepeda motor pada PT.PHP MOTOR.

Pengaruh nilai centroid terhadap jumlah iterasi dengan metode clustering digunakan langkah-langkah sebagai berikut.

a. Sumber data yang digunakan dalam penelitian ini merupakan data kredit sepeda motor dari konsumen PT.PHP MOTOR. b. Melakukan studi pustaka tentang

pengelompokan data dengan metode clustering.

c. Menentukan variable-variabel dari data konsumen kredit sepeda motor pada PT.PHP MOTOR diantaranya: nama pelanggan, jumlah angsuran, lama angsuran dan tunggakan kredit.

d. Menentukan parameter dalam pengujian diantaranya: jumlah centroid yang di variasikan dari centroid 2 sampai centroid 20, jumlah data konsumen sebanyak 100 data, dan jumlah iterasi maksimum 15. e. Pengujian dilakukan bertujuan untuk

mengetahui pengaruh nilai centroid dengan jumlah iterasi maksimum dengan metode

clustering.

4.Hasil Dan Pembahasan

Dalam penelitian ini akan dilakukan analisis pengaruh nilai centroid terhadap jumlah iterasi dengan menggunakan metode clustering. Untuk mengetahui pengaruh nilai centroid maka jumlah centroid di variasikan dari nilai centroid 2 sampai nilai centroid 20 dengan jumlah data 100 dan jumlah iterasi maksimum 15.

Berikut berupa tahapan-tahapan dari proses clustering dengan nilai centroid 2, jumlah data 100, dan jumlah iterasi maksimum 15 dapat dilihat pada Tabel 1.

Tabel 1(a). Pusat cluster awal dengan iterasi ke 1 Pusat Cluster Awal

c11=559 c12=33 c13=8

c21=1314 c12=33 c23=5

c31=598 c12=33 c33=5

Pada tabel 1(a) jumlah centroid 1=11, jumlah centroid 2=51, dan jumlah centroid 3=38 dengan iterasi ke 1.

Tabel 1(b). Pusat cluster baru dengan iterasi ke 2 Menghitung Pusat Cluster Baru

c11=539.55 c12=33 c13=5.82

c21=1389.71 c22=14.76 c23=5.33

c31=759.21 c22=14.76 c33=5.39

Pada tabel 1(b) jumlah centroid 1=22, jumlah centroid 2=36, dan jumlah centroid 3=42 dengan iterasi ke 2 dimana tingkat kesamaan dengan data sebelumnya 64 data.

Tabel 1(c). Pusat cluster baru dengan iterasi ke 3 Menghitung Pusat Cluster Baru

c11=596.77 c12=29.77 c13=5.5

c21=1629.03 c22=12.27 c23=5.37

c31=938.02 c32=21.23 c33=5.39

Pada tabel 1(c) jumlah centroid 1=26, jumlah centroid 2=30, dan jumlah centroid 3=44 dengan iterasi ke 3 dimana tingkat kesamaan dengan data sebelumnya 90 data.

Tabel 1(d). Pusat cluster baru dengan iterasi ke 4 Menghitung Pusat Cluster Baru

c11=616.8 c12=28.8 c13=5.63

c21=1686.62 c22=11.92 c23=5.54

c31=984.18 c32=20.5 c33=5.18

Pada tabel 1(d) jumlah centroid 1=30, jumlah centroid 2=26, dan jumlah centroid 3=44 dengan iterasi ke 4 dimana tingkat kesamaan dengan data sebelumnya 92 data.

Tabel 1(e). Pusat cluster baru dengan iterasi ke 5 Menghitung Pusat Cluster Baru

c11=655.79 c12=27.77 c13=5.62

c21=1756.18 c22=12.09 c23=5.41

c31=1062.77 c32=18.64 c33=5.21

Pada tabel 1(e) jumlah centroid 1=39, jumlah centroid 2=22, dan jumlah centroid 3=39 dengan iterasi ke 5 dimana tingkat kesamaan dengan data sebelumnya 87 data.

Tabel 1(f). Pusat cluster baru dengan iterasi ke 6 Menghitung Pusat Cluster Baru

c11=655.79 c12=27.77 c13=5.62

c21=1899 c22=12.5 c23=5.19

(3)

Pada tabel 1(f) jumlah c jumlah centroid 2=16, dan ju 3=45 dengan iterasi ke 6 d kesamaan dengan data sebelumny

Tabel 1(g). Pusat cluster baru deng Menghitung Pusat Cluster Baru

c11=666.56 c12=27.73 kesamaan dengan data sebelumny

Tabel 1(h). Pusat cluster baru deng Menghitung Pusat Cluster Baru

c11=666.56 c12=27.73 kesamaan dengan data sebelumny

Tabel 1(i). Pusat cluster baru deng

Menghitung Pusat Cluster Baru

c11=666.56 c12=27.73 kesamaan dengan data sebelum Setelah iterasi ke 9 masih belum kesamaan dengan data sebel selanjutnya menghitung pusat dengan iterasi ke 10 sehingga tin dengan data sebelumnya mencapa

Selanjutnya penulis melaku pengujian pengaruh nilai centroi iterasi dengan metode clustering nilai centroid 2 sampai nilai centr jumlah data 100 dan jumlah iter 15. Hasil pengujian dapat dilihat

Tabel 2. Pengaruh nilai centroid terhadap jumlah iteras

Jumlah Nilai Centroid Juml

2 3 4

centroid 1=39, jumlah centroid dimana tingkat nya 94 data.

engan iterasi ke 7

c13=5.56

c23=5.19

c33=5.35

centroid 1=41, jumlah centroid dimana tingkat nya 98 data.

engan iterasi ke 8

c13=5.56

c23=5

c33=5.4

centroid 1=41, jumlah centroid dimana tingkat nya 98 data. jumlah centroid dimana tingkat lumnya 99 data. lum di dapatkan belumnya maka at cluster baru tingkat kesamaan apai 100.

akukan beberapa roid pada jumlah dimana jumlah ntroid 20 dengan terasi maksimum at pada tabel 2.

Pada tabel 2, dapat dilih dengan jumlah nilai centroid iterasi yang lebih kecil yaitu 3 dengan tingkat kesamaan d pada pengujian mengguna centroid 3, 4, 5, 6, 7, 8, 9, 10 16, 17, 18, 19, 20. Pada tab bahwa pengujian dengan jum memiliki jumlah iterasi yan mencapai iterasi ke 14 untu kesamaan data sebelumnya.

Pada tabel 2, dapat di nilai centroid yang berbeda jumlah iterasi yang berbeda centroid yang besar tidak s jumlah iterasi meningkat.

pengaruh jumlah nilai centroid dapat dilihat pada Gambar 1.

Gambar 1: Grafik perbandingan centroid dengan jum

Dari gambar 1 dapat d nilai centroid yang berbeda jumlah iterasi yang berbe dengan jumlah nilai centroi selalu menyebabkan jumlah i

5.Kesimpulan

Dari hasil penelitian dap kesimpulan antara lain:

5

ilihat bahwa pengujian oid 2 memiliki jumlah itu mencapai iterasi ke n data sebelumnya, dari unakan jumlah nilai , 10, 11, 12, 13, 14, 15, tabel 2(c), dapat dilihat jumlah nilai centroid 4 yang lebih besar yaitu ntuk mencapai tingkat

dilihat bahwa jumlah da akan menghasilkan eda pula. Jumlah nilai k selalu menyebabkan t. Grafik perbandingan id dengan jumlah iterasi

an pengaruh jumlah nilai jumlah iterasi

t dilihat bahwa jumlah da akan menghasilkan beda pula. Pengujian troid yang besar tidak

h iterasi meningkat.

(4)

1. Jumlah nilai centroid yang berbeda akan menghasilkan jumlah iterasi yang berbeda pula.

2. Jumlah nilai centroid yang besar tidak selalu menyebabkan jumlah iterasi meningkat. 3. Pengujian dengan jumlah nilai centroid 2

memiliki jumlah iterasi yang lebih kecil yaitu iterasi ke 3 dengan tingkat kesamaan data sebelumnya, dibandingkan dengan jumlah nilai centroid 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20.

4. Pengujian dengan jumlah nilai centroid 4 memiliki jumlah iterasi yang lebih besar yaitu mencapai iterasi ke 14 untuk mencapai tingkat kesamaan data sebelumnya.

Daftar Pustaka

[1] Alfina, et al, 2012. “Analisa perbandingan metode hierarchical clustering, k-means dan gabungan keduanya dalam cluster data (studi kasus: problem kerja praktek jurusan teknik industri its),” jurnal teknik its vol.1, (sept, 2012) issn: 2301-9271.

[2] David, 2013. “Ant colony optimization untuk clustering dokumen hasil pencarian,” seminar nasional informatika 2013.

[3] Khotimah Tutik, 2014. “Pengelompokan surat dalam alquran menggunakan algoritma k-means, jurnal simetris,” vol 5 no1 april 2014, issn: 2252-4983.

[4] Kumar.Ch.N.Santhosh et al, 2012. “Spatial data mining using cluster analysis,” International journal of computer science & information technology (IJCSIT) Vol 4, No 4, August 2012.

[5] Rozi Dwi Joko Fachrur, Yahya Kresnayana, 2013. “Analisa risiko kredit sepeda motor pada pt.x finance (studi kasus kantor cabang

wilayah gresik dan lamongan),” jurnal sains dan seni pomits vol.2, no.2, (2013) 2337-3520 (2301-928x print).

[6] Sholeh Khoirul, et al, (2013). “Implementasi metode k-means clustering untuk pembangkitan aturan fuzzy pada klasifikasi ketahanan hidup penderita kanker payudara”.

LAMPIRAN:

Gambar

Tabel 1(f). Pusat cluster baru  dengan iterasi ke 6
Gambar 1: Grafik perbandingancentroid dengan jum  an pengaruh jumlah nilai jumlah iterasi
Tabel 3. Hasil Pengelompokan  Data Ke-1 Dengan Menggunakan Metode Clustering

Referensi

Dokumen terkait

Selanjutnya, BI, LPS dan OJK juga memiliki kewenangan baru dalam rangka mengoptimalkan gabungan kebijakan moneter dan menjaga stabilitas ekonomi nasional (Aria,

Siswa Wirausaha merupakan portal khusus yang menyajikan informasi tentang produk/jasa yang di kelola siswa, komunitas belajar wirausaha para siswa dengan pakarnya

Diketahui Berdasarkan hasil pengujian dan analisis pada sistem pengenal kata aksara sunda pada pengujian kali ini didapatkan hasil setelah dilakukan pengujian data yang

A mintában szereplő vállalatok megoszlása a tulajdonosi szerkezet szerint.. gyar nagyvállalat saját fejlesztésű szoftverrel dolgozik. A legnagyobb árbevétellel rendelkező

Konsep BBM akan digunakan dalam menilai kewajaran kinerja keuangan dan pemenuhan kewajiban perpajakan Wajib Pajak pada perusahaan jasa pertambangan timah yang

Untuk melihat sejauhmana program tersebut berpengaruh terhadap perilaku ibu-ibu tersebut dalam menabung, penelitian ini dilakukan untuk menjawab rumusan masalah sebagai berikut:

Tutup celah penyelundupan narkoba, baik di pelabuhan maupun bandara, pelabuhan kecil yang ada di negara kita," kata Presiden Jokowi saat membuka Rapat Terbatas dengan

Secara parsial variabel penempatan pada bank indonesia (X1), penempatan pada bank lain (X2), pembiayaan (X4) tidak berpengaruh signifikan terhadap muqabalah, sedangkan