LAPORAN DATA MINING
DISUSUN OLEH :
Salsabella Rahma (14.01.53.0084)
Uswatun Khasanah (14.01.53.0093)
Yusnizar Abbas (14.01.53.0094)
TEKHNOLOGI INFORMASI
BAB I
PENDAHULUAN
1.1 Deskripsi PermasalahanLaboratorium Data Mining merupakan salah satu lab. Yang dibuat oleh UII yang ditunjukan kepada mahasiswa jurusan tekhnik industri. Namun mahasiswa biasanya datang ke laboratorium hanya untuk melaksanakan praktikum saja. Padahal laboratorium tersebut dibuat tidak hanya untuk keperluan praktikum. Maka dengan penelitian yang dilakukan akan diketahui profilasi mahasiswa yang berkenjung ke laboratorium data mining,profilasi tersebut berisi jenis kelamin, usia, angkatan, intensitas,dan durasi atau berapa lama biasanya responden tersebut berada di laboratorium.
1.2 Rumusan Masalah
1. Berapa cluster yang terbentuk dari penelitian yang dilakukan ? 2. Bagaimana hasil profilisasi customer berdasarkan penelitian ?
1.3 Batasan Masalah
1. Penelitian dikhususkan pada mahasiswa Tekhnik Industri. 2. Obyek lokasi penelitian adalah Laboratorium Data Mining.
1.4 Tujuan Penelitian
1. Untuk mengetahui berapa banyak cluster yang akan terbentuk dari penelitian yang dilakukan.
2. Untuk mengetahui hasil profilasi customer berdasarkan penelitian.
1.5 Manfaat Penelitian
BAB II
TINJAUAN PUSTAKA
Analisis cluster merupakan salah satub teknik multivariat yang digunakan dalam data mining yang bertujuan untuk mengidentifikasi sekelompok obyek yang mempunyai kemiripan karakteristik tertentu yang dapat dipisahkan dengan kelompok obyek lainnya, sehingga obyek yang berada dalam kelompok yang sama relatif lebih homogen (sama) dari pada obyek yang berada pada kelompok yang berbeda.
Jumlah kelompok yang dapat diidentifikasikan tergantung pada banyak dan variasi data obyek. Tujuan dari pembentukan cluster ini adalah untuk analisis dan interpretasi lebih lanjut sesuai dengan tujuan penelitian yang dilakukan. Solusi cluster secara keseluruhan bergantung pada variabel-variabel yang digunakan sebagai dasar untuk menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang relavan dapat mempengaruhi substensi hasil analisis cluster.
Analisis cluster dapat diterapkan pada bidang apa saja. Namun pemakaian teknik ini lebih familiar pada bidang pemasaran karena memang salah satu kegiatan yang dilakukan dalam pemasaran adalah pengelompokan, yang disebut segmentasi pasar. Penerapan analisis cluster di dalam pemasaran adalah sebagi berikut :
1. Membuat segmen pasar (segmenting the market)
Pelanggan atau pembeli sering diklasterkan berdasarkan manfaat atau keuntungan yang diperoleh dari pembelian barang. Setiap cluster akan terdiri dari pelanggan/pembeli yang relatif homogen, dinyatakan dalam manfaat yang dicari.
2. Memahami perilaku pembeli
Analisis cluster digunakan untuk mengenali/mengidentifikasi kelompok pembeli yang homogen/relatif homogen. Kemudian perilaku dalam untuk setiap kelompok perlu dikaji secara terpisah. Responden (pembeli) dikelompokkan didasarkan pada self-reported importance yang terkit pada setiap faktor pilihan yang digunakan untuk memilih toko atau mall di mana para pembeli memberi barang yang dibutuhkan.
3. Mengenali peluang produk baru
BAB III
METODE PENELITIAN
3.1 Objek PenelitianMahasiswa teknik industri
3.2 Metode Pengumpulan Data
1. Data Primer
Data primer merupakan data yang didaptkan oleh penliti langsung dari objeknya. Yang menjadi data primer dalam penelitian ini adalah data yang berasal dari kuisioner yang diisi langsung oleh para responden.
2. Data Sekunder
3.3 Alur Penelitian
3.4 Langkah Software
Kuisioner Tingkat Kepuasan
1. Input data yang diperoleh ke software
2. pilih analyze klik Clasify lalu pilih Hirarchical Cluster 3. Variabel :Letakkan semua Variabel X yang valid 4. Label case by : Letakkan nama responden 5. Cluster : Case
6. Display : statistic, plot
7. Statistik : agglomeration schedule 8. Plots: klik Dendogram
9. Iccicle : none
Mulai
Rumusan Masalah
Input Data
Clustring – Metode Hirarki
Profilisasi Customer
10. Method : Cluster Method pilih nearest nighbor measure Interval pilih Squared Euqliden Distance
11. Klik save
Cluster membership :none
Kuisioner Profilisasi Customer
1. Input data yang diperoleh ke software
2. Pilih analyze klik Descriptive Statistic lalu pilih Crosstabs 3. Row : Letakkan semua variabel Y yang valid
4. Column: Letakkan Cluster Member 5. Exact : Asymptotic only
6. Statistics: Corelations
7. Cells : Counts klik observed. Noninteger Weights klik Round Cells Counts 8. Format : Row Order klik Ascending
BAB IV
HASIL DAN PEMBAHSAN
4.1 Pengumpulan Data
4.1.1 Hasil Rekapitulasi Kuesioner Profilisasi Customer
No Nama Jenis Kelamin
Usia Angkatan Intensitas Durasi
1 Sekar 2 3 2 3 4
Tabel 4.1 Reka pitulasi Kuesioner Profilisasi Customer
4.1.2 Hasil Rekapitulasi Kuesioner Tingkat Kepuasan
No Nama Fasilitas Pelayanan Tata Letak Kenyamanan
1 Sekar 3 3 4 3
Tabel 4.1 Reka pitulasi Kuesioner Tingkat Kepuasan
a. Stage
Stage Cluster Combined Coefficients Stsge Cluster First Appears
Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 23 50 .000 0 0 17
1. Cluster yang terbentuk sebanyak 3 cluster dan 1 outlier. Cluster 1 terdiri dari 42 responden, cluster 2 terdiri daei 3 responden, dan cluster 3 terdiri dari 4 responden. Cluster 4 tidak memiliki kelompok yang relative homogen, sehingga cluster 4 tidak dikatakan outlier. Cluster 4 terdiri dari 1 responden.
angkatan 2008 dengan intensitas kunjungan yang jarang dan durasi atau lama berkunjung responden kurang lebih 60 menit.
DAFTAR PUSTAKA
Modul II Analisis Cluster Praktikum Data Mining
Han,Jiawei.”Data Mining Concept and Technique”. Presentation
http://www.cse.msu.edu/~cse980
Bertalya,”Konsep Data Mining”.Universitas Gunadarma,2009.
LAMPIRAN
Cluster
Cases
Valid Missing Total
N Percent N Percent N Percent
50 100.0 0 .0 50 100.0
a. Squared Eudidean Distance used
b. Single Linkage
Single Linkage
Stage Cluster Combined Coefficients Stsge Cluster First Appears
Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 23 50 .000 0 0 17
2 25 49 .000 0 0 15
3 5 46 .000 0 0 42
4 43 45 .000 0 0 26
5 36 44 .000 0 0 25
6 39 40 .000 0 0 7
7 37 39 .000 0 6 8
8 34 37 .000 0 7 9
9 32 34 .000 0 8 11
10 24 33 .000 0 0 16
11 31 32 .000 0 9 12