ANALISIS DATA MINING PADA DATA PEMBAYARAN DAN PENUNGGAKAN SEWA RUMAH SUSUN SEDERHANA SEWA
2.2 Metode Analisis
Metode yang digunakan dalam analisis data mining ini menggunakan metode association rule (aturan asosiasi) dengan pendukung penyebab penunggakan dengan k-mean clustering.Metodologi dasar analisis asosiasi terbagi menjadi dua tahap(Ulmer, 2016):
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minum dari nilai support dalam database. Nilai support item diperoleh dengan rumus berikut:
ππ’πππππ‘ (π΄) =Jumlah Transaksi mengandung A Total Transaksi x100%
Sedangkan nilai support dari 2 item diperoleh dari rumus berikut:
ππ’πππππ‘ (π΄βπ΅) =Jumlah Transaksi mengandung A dan B Total Transaksi x100%
2. Pembentukan Aturan Assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif AβB.
Nilai confidence dari aturan AβB diperoleh dari rumus berikut:
πΆπππππππππ = π(π΅|π΄) =Jumlah Transaksi mengandung A dan B Total Transaksi mengandung A x100%
2.2 Metode Pengumpulan Data
Metode pengumpulan data yang digunakan untuk mendapatkan data dan informasi sebagai berikut(Suyanto & Ependi, 2014):
1. Metode Observasi
Dalam metode ini hal yang akan dilakukan adalah melihat dan mempelajari permasalahan yang ada dilapangan yang erat kaitannya dengan objek yang diteliti.
2. Metode Studi Pustaka
Dalam hal ini yang dilakukan adalah sebuah cara mencari bahan yang mendukung dalam pendefenisian masalah melalui jurnal, buku-buku dan internet.
3. HASIL
Association ruledengan algoritmaaprioripada tools weka menjalankan tekniknya dengan menghasilkan sekumpulan aturan, Pertama-tama WEKA akan membaca semua atribut item yang ada seperti gambar 1di bawah ini:
=== Run information ===
Scheme: weka.associations.Apriori -N 25 -T 0 -C 0.2 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -c -1 Relation: OLLAH ALL CSV
Instances: 284 Attributes: 13 BLOK JANUARI FEBRUARI MARET
[122]
APRIL MEI JUNI JULI AGUSUTUS SEPTEMBER OKTOBER NOVEMBER DESEMBER
=== Associator model (full training set) ===
Apriori
=======
Minimum support: 0.4 (114 instances) Minimum metric <confidence>: 0.2 Number of cycles performed: 12 Generated sets of large itemsets:
Size of set of large itemsets L(1): 24 Size of set of large itemsets L(2): 42 Size of set of large itemsets L(3): 12
Gambar 1.Model Data untuk dilakukan mining
Setelah itu teknik association rulesdengan Apriori akan membentuk 2 itemsets yang direpresentasikan dalam bentuk rule. Itemsets yang ditampilkan 25 best rule atau 25 teratas. Hasilnya dapat dilihat pada gambar berikut ini:
Gambar 2. Hasil evaluasi
Dilihat dari gambar diatas output dari tools weka dapat dijabarkan sebagai berikut:
1) Pada hasil proses nomor 1 diatas Jika februari yes atau bayar dan April juga yes tedapat 128 kedaan yang sama maka maret juga yes terdapat 120 keadaan yang sama yang akan dicari pada tahap selanjutnya adalah nilai kesuluruhan ketiganya yaitu 120, dan
[123]
berdasarkan data diatas mempunyai keadaan yang sama untuk penjelasannya akan tetapi mempunyai jumlah keadaan yang berbeda.
2) Dino 16 pada gambar mempunyai pola penunggakan yaitu jika Oktober no atau menunggak terdapat 138 keadaan maka november juga no dengan keadaan yang sama sebanyak 124 hal ini sama dengan keadaan nomor 22 dengan nilai berbeda
3) Pada no 17 terdapat 2 kedaan yang sama yaitu jika november 137 maka Oktober 123 keadaan keduanya yaitu 123 yang sama, terdapat beberapa keadaan yang sama dengan jumlah berbeda juga.
4) Dapat disimpulkan bahwa tiap bulannya memiliki kombinasi kecenderungan yang sama dalam membayar tiap bulannya maupun beberapa penunggakannya.
5) Secara teori sederhana seandainya ada penghuni yang membayar pada bulan januari dan maret tepat waktu maka penghuni tersebut juga akan membayar pada bulan mei dan pola tersebut tejadi berulang kali yag dilakukan oleh penghuni yag berbedaΒΈbegitu juga apabila seorang penghuni menunggak pada bulan januari dan maret yang tidak bayar tepat waktu maka penghuni tersebut juga akan menunggak pada bulan mei, hal bisa digambarkan dalam tabel berikut:
Tabel 1.Pembentukan aturan
NO Bentuk Awal Aturan / Kondisi Jumlah
1
FEBRUARI=Y
APRIL=Y 128 ==>
MARET=Y 120
Jika februari dan april bayar
maka maret juga membayar 120 2 MEI=Y JULI=Y 127
==> JUNI=Y 118
Jika mei dan juli bayar maka
juni juga membayar 118 3
OKTOBER=N 138 ==>
NOVEMBER=N 124
Jika oktober menunggak atau tidak bayar tepat waktu maka november juga menunggak
124 4 OKTOBER=N 138 ==>
SEPTEMBER=N 123
Jika oktober menunggak atau tidak bayar tepat waktu maka september juga menunggak
123 5
JULI=Y 142 ==>
MEI=Y 127 Jika juli bayar maka mei bayar 127
Tabel 2.Contohpembentukan aturan Frekuensi 2-3 Itemset
NO Bentuk Awal Aturan Nilai support %
5 MEI=Y JULI=Y 127
==> JUNI=Y 118
Jika mei dan juli bayar maka juni juga membayar
Jumlah 118 / jumlah
keseluruhan transaksi 284 = 0.415
41.5%
Tabel 3.ContohAturanseleksi Minimum Confidence
NO Bentuk Awal Aturan Confidence %
12 FEBRUARI=Y MEI=Y 132 ==>
MARET=Y 121
Jika februari dan mei bayar maka maret juga bayar
Jumlah 118 / jumlah februari 164 = 0.737
73.7%
Setelah diperoleh hasil dari seleksi minimum confidence, kemudian cari aturan asosiasi akhir dengan cara nilai dari confidence yang diperoleh dikalikan dengan nilai support tiap kombinasi item.
Kemudian untuk menentukan aturan asosiasi pilih hasil perkalian yang paling besar.
[124]
Tabel 4.Contoh Aturan Asosiasi akhir
NO Bulan Support% Confidence % Support X
Confidence 1 FEBRUARI=Ya APRIL=Y 128
==> MARET=Y 120 42.2% 73.1% 30.8%
2 JUNI=Y JULI=Y 126 ==> MEI=Y
118 41.5% 76.6% 31.7%
3 MARET=Y JUNI=Y 124 ==>
MEI=Y 116 40.8% 69.4% 28.3%
4 AGUSUTUS=Y SEPTEMBER=Y
122 ==> OKTOBER=Y 114 40.1% 75% 30.0%
5 MEI=Y JULI=Y 127 ==> JUNI=Y
118 41.5% 74.2% 30.7%
Pada asosiasi akhir terbentuklah aturan yang menunjukan nilai support x confidence. Setelah didapat hasil dari aturan asosiasi akhir terdapat pola kombinasi yang paling sering dilakukan memiliki nilai seperti dibawah ini:
Tabel 5.Polafrekuensi tertinggi pembayaran
Bulan Aturan Support% Confidence % Support X
Confidence SEPTEMBER=Y
144 ==>
OKTOBER=Y 129
Jika september bayar maka
oktober bayar 45.4% 89.5% 40.6%
Pada tabel diatas dapat disimpulkan bahwa pembayaran yang sering terjadi dan tidak banyak menunggak pada bulan September dan Oktober dengan aturan Jika September bayar maka Oktober bayar dengan support = 45.4% dan confidence = 89.5% dengan jumlah terebesar dari asosiasi akhir pembayaran support x confidence yaitu 40.6% .
Sedangkan pola penunggakan yang sering terjadi terdapat pada nomor 16 pada asosiasi akhir seperti dibawah ini:
Tabel 6.Polafrekuensi tertinggi penunggakan
Bulan Aturan Support% Confidence % Support X
Confidence OKTOBER=N 138
==> NOVEMBER=N 124
Jika oktober menunggak
maka november menunggak 43.6% 84.9% 37.0%
Pada tabel diatas dapat disimpulkan bahwa penunggakan yang sering terjadi pada bulan oktober dan november dengan aturan Jika Oktober menunggak maka november menunggak dengan support = 43.6% dan confidence = 84.9% dengan jumlah terebesar dari asosiasi akhir penunggakan support x confidence yaitu 37.0%. Pada bulan oktober didapat pola pembayaran terbesar dan juga pola penunggakan terbesar.
Jadi dari keseluruhan hasil data mining di dapatlah pola pembayaran dan penunggkan yang berguna dan bermanfaat untuk mengetahui bulan yang sering melakukan pembayaran dan penunggakan yang sering terjadi pada tiap bulannya sebagai berikut:
1. Jika september bayar maka oktober bayar dengan nilai support x confidence 40.6%
2. Jika oktober menunggak maka november menunggak nilai support x confidence 37.0%