HASIL PENELITIAN DAN PEMBAHASAN
5.2 Analisis Cluster
5.2 Analisis Cluster
Dari hasil uji coba yang dilakukan menggunakan data transaksi tahun 2008, ada beberapa hal yang dapat dianalisis. Untuk menentukan jumlah cluster yang memiliki nilai fitness terbaik digunakan indeks pengukuran validitas
Modified Partition Coeficient (MPC) dan Classification Entropy (CE). Tabel 5.21
menunjukkan nilai indeks MPC dan CE untuk setiap jumlah cluster yang diujikan pada algoritma Fuzzy C-Means (FCM) dan Fuzzy Subtractive (FS) Clustering. Bentuk grafis nilai indeks MPC dan CE untuk algoritma Fuzzy C-Means dan
Fuzzy Subtractive Clustering ditunjukkan pada Gambar 5.21 dan 5.22.
Tabel 5.21
Indeks MPC dan CE pada Algoritma FCM dan FS Clustering
Jumlah Cluster 2 3 4 5 6 FCM 0,9353 0,8981 0,8644 0,8640 0,8309 Indeks MPC FS 0,3194 0,1662 0,2017 0,1829 0,1541 FCM 0,0597 0,1280 0,1901 0,2119 0,2777 Indeks CE FS 0,1817 0,2115 0,3432 0,3142 0,2832
Nilai indeks MPC untuk masing-masing jumlah cluster pada algoritma Fuzzy
C-Means lebih besar dibandingkan Fuzzy Subtractive Clustering. Sedangkan nilai
indeks CE untuk masing-masing jumlah cluster pada algoritma Fuzzy C-Means lebih kecil dibandingkan Fuzzy Subtractive Clustering. Dari hasil perbandingan tersebut algoritma Fuzzy C-Means memiliki kinerja yang lebih baik dibandingkan algoritma Fuzzy Subtractive Clustering.
Gambar 5.21. Grafik Indeks MPC dan CE untuk Algoritma FCM
Gambar 5.22. Grafik Indeks MPC dan CE untuk Algoritma FS
Dari tabel 5.21, indeks MPC yang terbesar pada algoritma Fuzzy C-Means
Clustering maupun algoritma Fuzzy Subtractive Clustering berada pada proses
cluster terbaik adalah 2 untuk kedua algoritma. Indeks CE yang terkecil pada
algoritma Fuzzy C-Means dan Fuzzy Subtractive Clustering berada pada proses
clustering dengan jumlah cluster = 2. Sehingga berdasarkan indeks CE, jumlah
cluster terbaik menurut kedua algoritma tersebut adalah 2.
Data yang digunakan untuk proses mining adalah data transaksi penjualan dari tahun 2006 sampai 2010. Proses segmentasi konsumen dengan model Fuzzy RFM menghasilkan kelas konsumen yang berbeda pada setiap tahunnya. Perbandingan kelas konsumen per tahun ditunjukkan pada Tabel 5.22
Tabel 5.22
Perbandingan Kelas Konsumen Per Tahun Tahun
Customer No.
Algoritma
2006 2007 2008 2009 2010
FCM Golden D Superstar A Superstar D Superstar D Superstar E
C0020
FS Dormant E Dormant E Dormant E Dormant E Dormant E
FCM Dormant F Dormant F Dormant F Superstar D Superstar E
C0051
FS Dormant E Dormant E Dormant E Dormant E Dormant E
FCM Golden D Superstar A Superstar D Superstar D Dormant F
C0061
FS Dormant E Dormant E Dormant E Dormant E Dormant E
FCM Golden E Superstar A Superstar D Superstar D Superstar E
C0138
FS Dormant E Dormant E Dormant E Dormant E Dormant E
FCM Dormant F Superstar A Superstar C Superstar C Dormant F
C0205
FS Dormant E Dormant E Dormant E Dormant E Dormant E
Gambar 5.23 sampai 5.31 menunjukkan perbandingan hasil segmentasi konsumen untuk masing-masing konsumen per tahun dalam bentuk grafis. Jumlah cluster yang digunakan untuk proses clustering menggunakan algoritma Fuzzy C-Means
dan Fuzzy Subtractive adalah 2. Jika dibandingkan, hasil segmentasi konsumen
(a)
(b)
Gambar 5.23. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FCM Clustering (Customer No. = C0020)
(a)
(b)
Gambar 5.24. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FS Clustering (Customer No. = C0020)
dengan Bentuk Grafik (a) General (b) Detail
(a)
(b)
Gambar 5.25. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FCM Clustering (Customer No. = C0051)
(a)
(b)
Gambar 5.26. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FS Clustering (Customer No. = C0051)
(a)
(b)
Gambar 5.27. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FCM Clustering (Customer No. = C0061)
(a)
(b)
Gambar 5.28. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FS Clustering (Customer No. = C0061)
dengan Bentuk Grafik (a) General (b) Detail
(a)
(b)
Gambar 5.29. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FCM Clustering (Customer No. = C0138)
dengan Bentuk Grafik (a) General (b) Detail
(a)
(b)
Gambar 5.30. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FS Clustering (Customer No. = C0138)
dengan Bentuk Grafik (a) General (b) Detail
(a)
(b)
Gambar 5.31. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FCM Clustering (Customer No. = C0205)
(a)
(b)
Gambar 5.32. Perbandingan Kelas Konsumen Hasil Clustering Menggunakan Algoritma FS Clustering (Customer No. = C0205)
Grafik perbandingan kelas konsumen ini dapat digunakan oleh pihak perusahaan retail untuk mengetahui pola-pola pembelian konsumen yang terkait dengan perilaku konsumen. Grafik perbandingan kelas konsumen yang dapat digunakan adalah hasil segmentasi yang diperoleh dari hasil clustering dengan algoritma FCM. Hal ini disebabkan algoritma FCM memiliki kinerja yang lebih baik dibandingkan FS. Sebagai contoh konsumen dengan nomor C0020 dan C0138 termasuk konsumen potensial (tergolong Golden dan Superstar Customer) yang memiliki pola pembelian yang stabil. Konsumen dengan nomor C0051 termasuk konsumen yang memiliki peningkatan grafik kelas konsumen yang cukup signifikan yaitu dari kelas Dormant pada tahun 2006-2008 menjadi kelas
Superstar pada tahun 2009-2010. Sedangkan konsumen dengan nomor C0061 dan
C0205 mengalami penurunan dari kelas Superstar menjadi kelas Dormant. Khusus untuk konsumen-konsumen potensial dengan pola pembelian yang stabil dan cenderung meningkat, pihak manajemen perusahaan retail dapat memberikan potongan harga (discount) yang lebih tinggi dibandingkan konsumen, untuk meningkatkan loyalitas konsumen ini pada perusahaan. Kebijakan lain yang dapat diterapkan adalah meningkatkan layanan kepada konsumen, contohnya pengiriman barang gratis. Sedangkan untuk konsumen yang mengalami penurunan kelas konsumen, pihak perusahaan retail dapat melakukan usaha-usaha untuk meningkatkan nilai pembelian. Proses ini merupakan implementasi dari penerapan CRM (Customer Relationship Management), yaitu mencakup proses analisa, klasifikasi, dan segmentasi konsumen untuk mengatur dan
memaksimalkan nilai tambah konsumen, seperti halnya aset-aset lain dalam perusahaan (Zumstein, 2007).
Anomali ditemukan pada proses segmentasi cluster hasil dari algoritma
Fuzzy Subtractive. Konsumen yang seharusnya tergolong sebagai konsumen
potensial (termasuk kelas Superstar atau Golden), dikelompokkan ke dalam
Dormant Customer, yaitu konsumen dengan tingkat paling rendah. Tabel 5.23
menunjukkan beberapa konsumen yang mengalami anomali dengan nilai recency,
frequency, dan monetary (RFM). Nilai RFM tersebut diambil dari transaksi
periode tahun 2008.
Tabel 5.23
Contoh Konsumen yang Mengalami Anomali pada Proses Penentuan Kelas Konsumen
Customer No. Recency Frequency Monetary Konsumen Kelas
C0061 0 289 1,621,323,550.00 Dormant E
C0138 0 78 1,538,869,000.00 Dormant E
C0205 0 68 1,078,489,100.00 Dormant E
Jika dilihat dari nilai RFM ketiga konsumen tersebut dan berdasarkan domain nilai himpunan fuzzy pada tabel 3.8, ketiga konsumen tersebut termasuk konsumen yang potensial (Superstar Customer).
123
6.1 Kesimpulan
Dari penelitian yang telah dilakukan, maka dapat ditarik kesimpulan sebagai berikut :
1. Algoritma Fuzzy Subtractive tidak dapat membentuk cluster yang tergolong Superstar dan Golden Customer. Sehingga dapat dikatakan algoritma Fuzzy
Subtractive Clustering kurang mendukung proses data mining pada
perusahaan retail untuk mendapatkan konsumen potensial.
2. Dari pengukuran validitas cluster menggunakan indeks Modified Partition Coefficient (MPC) dan Classification Entropy (CE), algoritma Fuzzy C-Means Clustering memiliki tingkat validitas lebih tinggi dibandingkan algoritma Fuzzy Subtractive Clustering. Sehingga dapat dikatakan algoritma Fuzzy C-Means Clustering memiliki kinerja yang lebih baik dibandingkan algoritma Fuzzy Subtractive Clustering dalam data mining di perusahaan retail. Jumlah cluster yang terbaik untuk algoritma Fuzzy C-Means Clustering dan Fuzzy Subtractive Clustering menurut indeks MPC dan CE adalah 2.
6.2 Saran
Pengembangan simulasi aplikasi data mining dengan metode fuzzy ini dapat dikembangkan dengan metode lain, misalnya dengan metode Jaringan Saraf Buatan sehingga dapat dibandingkan kinerja dari masing-masing metode untuk menghasilkan segmentasi konsumen yang terbaik. Dalam aplikasi ini digunakan
indeks pengukuran validitas cluster Classification Entropy yang menghasilkan indeks pengukuran yang cenderung monoton untuk setiap perubahan jumlah cluster. Sehingga, pada pengembangan aplikasi berikutnya dapat ditambahkan dengan metode pengukuran lain Dunn’s Index, Davies Bouldin’s Index, Separation Index, dan Fuzzy Hypervolume.
126
Balasko, B., Abonyi, J., Feil, B.______. Fuzzy Clustering and Data Analysis
Toolbox : For Use with Maltab. Department of Process Engineering
University of Veszprem, Veszprem, Hungary.
Berry, M.J.A., Linoff, G.S. 2004. Data Mining Techniques : For Marketing,
Sales, and Customer Relationship Management. Second Edition. Wiley
Publishing, Inc., Indianapolis, Indiana.
Brown, S.A. 2000. Customer Relationship Management : A Strategic
Imperative in the World of e-Business, Jhon Wiley and Sons Ltd, Canada.
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., Wirth, R. 2000. CRISP-DM 1.0 : Step-by-Step Data Mining Guide. Tersedia di http://www.community.udayton.edu/provost/it/training/documents/SPSS_CRI SPWPlr.pdf. [diunduh : 10 Desember 2010].
Cox, E. 2005. Fuzzy Modelling and Genetic Algorithms for Data Mining and
Explorations. Elsevier Inc., United States of America.
Crespo, F., Weber, R. A Methodology for Dynamic Data Mining Based on
Fuzzy Clustering. Fuzzy Sets and Systems 150 (2005) 267–284.
CRISP-DM, Tersedia di http://www.crisp-dm.org, [diunduh : 24 Juli 2010].
Fayyad, U, Piatetsky-Shapiro, G. & Smyth, P., 1996, From Data Mining to
Knowledge Discovery in Databases. AI Magazine 17(3), 37–54.
Gelley, N., Jang, R. 2000. Fuzzy Logic Toolbox. Mathwork, Inc., USA.
Hafez, A.M. Knowledge Discovery in Databases. Tersedia di http://faculty.ksu.edu.sa/ahafez/Selected%20Publications/Knowledge%20Disc overy%20in%Databases.doc. [diunduh : 1 Juni 2010].
Halkidi, M. Quality Assessment and Uncertainty Handling in Data Mining
Process. Tersedia di
http://www.edbt2000.unikonstanz.de/phd-workshop/papers/Halkidi.pdf. [diunduh : 25 Mei 2010].
Hammouda, K., Prof. Karaay, F. 2000. A Comparative Study of Data Clustering Techniques. University of Waterloo, Ontario, Canada.
Jain, A. K., Murthy, M. N. & Flynn, P. J. 1999. Data Clustering : A Review. ACM Computing Surveys, Vol. 31, No. 3.
Jansen, S.M.H. 2007. “Customer Segmentation and Customer Profiling for a Mobile Telecommunications Company Based on Usage Behavior : A Vodafone Case Study” (thesis). Maastricht : University of Maastricht.
Kimball, R. 2004. The Data Warehouse ETL Toolkit. Wiley Publishing Inc. Klawonn, F. 2004. Fuzzy Clustering : Insights and a New Approach. Mathware & Soft Computing 11 (2004) 125-142.
Klir, G. J., Yuan, B. 1995. Fuzzy Sets and Fuzzy Logic : Theory and
Applications. Prentice-Hall International, Inc. New Jersey, USA.
Kruse, R., Nauck, D., Borgelt, C.________, Data Mining with Fuzzy Methods
: Status and Perspectives. Department of Knowledge Processing and
Language Engineering, Otto-von-Guericke-University of Magdeburg, Germany
Myatt, G.J. 2007. A Practical Guide to Exploratory Data Analysis and Data
Mining. John Wiley & Sons Inc., United States of America.
Nakkrasae, S., Sophatsathit, P. & Edwards, W. R. Jr. 2004. Fuzzy Substractive Clustering Based Indexing Approach for Software Components Classification. International Journal of Computer & Information Science, Vol. 5, No. 1. Ngai, E.W.T., Xiu, L., Chau, D.C.K., 2008. Application of Data Mining Techniques in Customer Relationship Management : A Literature Review and
Classification. Expert Systems with Applications 36 (2009) 2592–2602.
Prabhu, S., Venatesan, N. 2007. Data Mining and Warehousing. New Age International (P) Limited, Publishers.
Rao, V.S., Vidyavathi, S. 2009. Comparative Investigations And Performance
Analysis of FCM and MFPCM Algorithms on Iris Data. Indian Journal of
Computer Science and Engineering Vol 1 No 2, 145-151.
Rokach, L., 2010. Using Fuzzy Logic in Data Mining. In : Maimon, O., Rokach, L., editors. Data Mining and Knowledge Discovery Handbook. Second Edition. London : Springer.
Salman, M.A, Ali, S.H. 2007. Knowledge Discovery in Data Mining Using
Fuzzy c-Means Model and Genetic Programming. 4th International
Conference: Sciences of Electronic,Technologies of Information and Telecommunications, Tunisia.
Sassi, M., Grissa, A., & Ounell, H. 2007 . Interpreting Fuzzy Clustering
Results based on Fuzzy Formal Concept Analysis. IEEE Fuzzy System
Conference.
Simha, J.B., Iyengar, S.S._____. Customer Value Analysis with Fuzzy Data
Mining. Proceedings of the International Conference on Cognition and
Recognition.
Sumathi, S., Sivanandam, S.N. 2006. Introduction to Data Mining and its
Applications. Spinger, Verlag Berlin Heidelberg.
Swift, R.S. 2000. Accelerating Customer Relationships – Using CRM and
Relationship Technologies, Prentice Hall Inc.
Tama, B.A. 2009. Implementasi Teknik Data Mining di dalam Konsep
Customer Relationship Management (CRM). Konferensi Nasional Sistem dan
Informatika 2009, Bali, November 14, 2009. KNS&I09-011.
Tan, P.N., Steinbach, M. & Kumar, V. 2006. Introduction to Data Mining. Pearson Education, Inc.
Thearling, K. 2000. An Introduction to Data Mining, Tersedia di : http://www.thearling.com/text/dmwhite/dmwhite.htm. [diunduh : 18 Nopember 2010].
Thomas, B., Raju, G., 2009. Fuzzy Clustering Method for Outlier Detection
in Data Mining, International Journal of Recent Trends in Engineering, Vol.1,
No.2.
Todman, C. 2001. Designing a Data Warehouse – Supporting Customer
Relationship Management, Hewlett Packard.
Tsiptsis, K, Chorianopoulos, A. 2009. Data Mining Techniques in CRM. A John Wiley and Sons, Ltd., Publication. United Kingdom.
Wu, K., Yang, M. 2005. A Cluster Validity Index for Fuzzy Clustering. Pattern Recognition Letter 26, pp. 1275-1291.
Xu, M., Walton, J. 2005. Gaining Customer Knowledge Through Analytical CRM, Industrial Management & Data System, Vol.105 No.7. pp 955-977.
Yan, J., Power, J., 1994. Using Fuzzy Logic (Toward Intelligent System). Prentice Hall, New York.
Zumstein, D. 2007. “Customer Performance Measurement : Analysis of the Benefit of a Fuzzy Classification Approach in Customer Relationship Management” (thesis). Switzerland : University of Fribourg.