Penerapan Data Mining Dengan Algoritma Apriori Untuk
Informasi Saran Kueri Barang
(Studi Kasus :
Situs “
Inkuiri.com
”
)
SKRIPSIDiajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Oleh :
Dimas Dewa Wicaksono 115314085
PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA YOGYAKARTA
Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang
(Studi Kasus : Situs “Inkuiri.com”) ABSTRAK
Dalam data history sebuah situs pencarian “Inkuiri.com” atau data rekaman pengunjung ternyata memiliki data clickstream yang cukup banyak jenisnya, sebagai contoh : data id pengunjung, ip address pengunjung, profile pengunjung, data kueri barang, data jumlah berkunjung pada sebuah ip address dan lain sebagainya. Berdasarkan pada jenis artikel di atas ternyata dapat digali informasi dari data kunjungan yang dapat dimanfaatkan. Salah satunya dapat diolah dengan proses menggunakan algoritma apriori dengan teknik accociation rule mining untuk menganalisa data history situs “Inkuiri.com”. Accociation rule mining adalah teknik mengolah data untuk menemukan aturan suatu kombinasi item.
Application of Data Mining With Apriori Algorithm For
Item Information Query Suggestions
Case Study : Sites " Inkuiri.com "
ABSTRACT
In the history data of a search site " Inkuiri.com " or recording the data of
visitors turned out to have quite a lot of clickstream data type, for example : the
data id visitors , ip address of visitors , visitor profile , query data items , data on
the number visiting on an ip address and others. Based on the type of the above
article it can be extracted information from the traffic data that can be utilized .
One of them can be processed by using a priori algorithm with accociation rule
mining techniques to analyze the data history site " Inkuiri.com " . Accociation
rule mining is a technique to process the data to find the rules of a combination of
items .
The first stage in the calculation of Apriori algorithm to discover
association rules that write the traffic data query, wherein the processed data is the
data query traffic for 55 minutes. Followed by changing the data format .json into
csv format, in order to modify and refine the data as needed ie query data traffic,
IP address, and the number of visiting. Next create table 1 itemset to perform
calculations on the number of visits each item. Then make a combination of two
itemsets in every query and frequency of each combination is calculated in
accordance with the data in the table. After analyzing the tables on the
combination of two itemsets. The next step to create a combination of 3 itemset
accordance with the composition of the new combination. Specified minimum
support value of 0.6 on training data with confidence minimum value of 0.7 and
then the number of patterns based on the value confidencenya. Obtained a
different pattern of association of the training data with the support and
confidence values are different. From the pattern of association obtained a
i
Penerapan Data Mining Dengan Algoritma Apriori Untuk
Informasi Saran Kueri Barang
(Studi Kasus :
Situs “
Inkuiri.com
”
)
SKRIPSIDiajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Oleh :
Dimas Dewa Wicaksono 115314085
PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA YOGYAKARTA
ii
Application of Data Mining With Apriori Algorithm For Item
Information Query Suggestions
(Case Study : Sites " Inkuiri.com")
A Final Project
Presented as Partial Fulfillment of The Requirements
To Obtain Sarjana Komputer Degree
In Informatics Engineering Study Program
By :
Dimas Dewa Wicaksono 115314085
INFORMATICS ENGINEERING STUDY PROGRAM DEPARTMENT OF INFORMATICS ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY
iii
HALAMAN PERSETUJUAN
SKRIPSI
Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang
(Studi Kasus : Situs “Inkuiri.com”)
Disusun Oleh : Dimas Dewa Wicaksono
115314085
Telah Disetujui Oleh :
Dosen Pembimbing
iv
HALAMAN PENGESAHAN
SKRIPSI
Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang
(Studi Kasus : Situs “Inkuiri.com”) Dipersiapkan dan Disusun Oleh :
Dimas Dewa Wicaksono 115314085
Telah dipertahankan didepan Panitia Penguji Pada Tanggal 19 April 2016
Dan dinyatakan memenuhi syarat Susunan Panitia Penguji :
Nama Lengkap Tanda Tangan
Ketua Paulina Heruningsih Prima Rosa M.Sc. ... Sekretaris Alb. Agung Hadhiatma , S.T., M.T. ...
Anggota Sri Hartati Wijono, S.Si., M.Kom. ...
Yogyakarta, Mei 2016 Fakultas Sains dan Teknologi
Universitas Sanata Dharma
v
Sudi Mungkasi, S.Si.,M.Math.Sc.,Ph.D.
HALAMAN PERSEMBAHAN
Tugas akhir ini saya persembahkan untuk:
Allah SWT
Orang tua tercinta atas doa, semangat, dan dukungan yang selalu
diberikan
Pristian Putik tercinta yang selalu setia menemani dan mendukung
dalam penyelesaian TA
Romo Poldo yang telah membantu dalam penyelesaian TA
Audris Evan Utomo yang telah membantu dalam penyelesaian TA
Teman – teman yang selalu setia menemani dengan menghadirkan
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini
tidak memuat karya atau bagian karya dari orang lain, kecuali yang telah
disesbutkan dalam kutipan dan daftar pustaka sebagaimana layaknya karya ilmiah.
Yogyakarta, 17 Mei 2016
Penulis
vii
LEMBAR PERNYATAAN PERSETUJUAN
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma:
Nama : Dimas Dewa Wicaksono
Nomor Mahasiswa : 115314085
Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakaan
Universitas Sanata Dharma karya ilmiah saya yang berjudul:
Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang
(Studi Kasus : Situs “Inkuiri.com”)
Beserta perangkat yang diperlukan. Dengan demikian saya memberikan kepada
Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan
dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data,
mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media
lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun
memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai
penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di Yogyakarta
Pada tanggal : 17 Mei 2016
Yang menyatakan
viii
Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang
(Studi Kasus : Situs “Inkuiri.com”) ABSTRAK
Dalam data history sebuah situs pencarian “Inkuiri.com” atau data rekaman pengunjung ternyata memiliki data clickstream yang cukup banyak jenisnya, sebagai contoh : data id pengunjung, ip address pengunjung, profile pengunjung, data kueri barang, data jumlah berkunjung pada sebuah ip address dan lain sebagainya. Berdasarkan pada jenis artikel di atas ternyata dapat digali informasi dari data kunjungan yang dapat dimanfaatkan. Salah satunya dapat diolah dengan proses menggunakan algoritma apriori dengan teknik accociation rule mining untuk menganalisa data history situs “Inkuiri.com”. Accociation rule mining adalah teknik mengolah data untuk menemukan aturan suatu kombinasi item.
ix
Application of Data Mining With Apriori Algorithm For
Item Information Query Suggestions
Case Study : Sites " Inkuiri.com "
ABSTRACT
In the history data of a search site " Inkuiri.com " or recording the data of
visitors turned out to have quite a lot of clickstream data type, for example : the
data id visitors , ip address of visitors , visitor profile , query data items , data on
the number visiting on an ip address and others. Based on the type of the above
article it can be extracted information from the traffic data that can be utilized .
One of them can be processed by using a priori algorithm with accociation rule
mining techniques to analyze the data history site " Inkuiri.com " . Accociation
rule mining is a technique to process the data to find the rules of a combination of
items .
The first stage in the calculation of Apriori algorithm to discover
association rules that write the traffic data query, wherein the processed data is the
data query traffic for 55 minutes. Followed by changing the data format .json into
csv format, in order to modify and refine the data as needed ie query data traffic,
IP address, and the number of visiting. Next create table 1 itemset to perform
calculations on the number of visits each item. Then make a combination of two
itemsets in every query and frequency of each combination is calculated in
accordance with the data in the table. After analyzing the tables on the
combination of two itemsets. The next step to create a combination of 3 itemset
accordance with the composition of the new combination. Specified minimum
support value of 0.6 on training data with confidence minimum value of 0.7 and
then the number of patterns based on the value confidencenya. Obtained a
different pattern of association of the training data with the support and
confidence values are different. From the pattern of association obtained a
x
KATA PENGANTAR
Puji dan syukur penulis panjatkan atas kehadirat Tuhan Yang Maha Esa atas berkat, rahmat serta kasih-Nya sehingga penulis dapat menyelesaikan skripsi yang berjudul
“Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang (Studi Kasus : Situs “Inkuiri.com”)”.
Penulisan skripsi ini bertujuan untuk memenuhi syarat untuk memperoleh
gelar sarjana komputer program studi S1 jurusan Teknik Informatika Universitas
Sanata Dharma. Penulis menyadari bahwa skripsi ini masih jauh dari kata
sempurna, oleh sebab itu penulis mengharapkan kritik dan saran yang bersifat
membangun dari semua pihak demi kesempurnaan skripsi ini.
Skripsi ini tidak lepas dari peran penting berbagai pihak, sehingga pada
kesempatan ini penulis dengan segala kerendahan hati serta rasa hormat
mengucapkan terimakasih yang sebesar-besarnya kepada semua pihak yang telah
memberikan dukungan baik secara langsung maupun tidak langsung kepada
penulis dalam penyusunan skripsi ini hingga selesai. Pada proses penulisan tugas
akhir ini saya ucapkan terima kasih kepada:
1. Allah SWT selaku pembimbing iman dalam hidup yang selalu
memberi solusi diatas segala solusi.
2. Ibu Sri Hartati Wijono, S.Si., M.Kom. selaku pembimbing yang
memberikan pengarahan serta solusi dalam pengerjaan skripsi ini
hingga selesai.
3. Kedua Orang tua, Bapak An Haryanto dan Ibu Endarti yang selalu
memberikan dukungan, rela berkorban, mendoakan, menyayangi dan
xi
4. Pristian Putik Alwena yang selalu setia menemani, mendukung,
membantu dan memarahi ketika penulis mengalami kemalasan dalam
mengerjakan tugas akhir
5. Romo Poldo Andreas Situmorang dan Audris Evan Utomo yang
senantiasa tulus meluangkan waktunya untuk konsultasi mengenai
penelitian ini.
6. Seluruh civitas akademika Teknik Informatika angkatan 2011,
terutama anggota C++ yang telah berjuang bersama dan saling
memberi semangat dan inspirasi.
7. Semua pihak, baik langsung maupun tidak langsung yang telah
membantu dalam proses penyelesaian skripsi.
Penulis menyadari masih banyak kekurangan dalam penyusunan skripsi
ini, namun penulis tetap berharap skripsi ini bermanfaat bagi pengembangan ilmu
pengetahuan.
Yogyakarta, 17 Mei 2016
Penulis
xii
DAFTAR ISI
HALAMAN JUDUL...i
HALAMAN JUDUL...ii
HALAMAN PERSETUJUAN ... iii
HALAMAN PENGESAHAN ... iv
HALAMAN PERSEMBAHAN ... v
PERNYATAAN KEASLIAN KARYA ... vi
LEMBAR PERNYATAAN PERSETUJUAN ... vii
KATA PENGANTAR ... x
DAFTAR ISI ... xii
BAB 1 PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 3
1.3 Tujuan Penelitian ... 3
1.4 Manfaat Penelitian ... 3
1.5 Batasan Masalah ... 4
1.6 Metodologi Penelitian ... 4
1.7 Sistematika Penulisan ... 5
BAB 2 LANDASAN TEORI ... 7
2.1 Data Mining ... 7
2.2 Jenis-jenis Data Mining Menurut Fungsinya ... 9
2.3 Algoritma Apriori ... 9
2.4 Lift Ratio ... 12
BAB 3 PERANCANGAN PERHITUNGAN ... 13
3.1 Analisis Masalah ... 13
3.2 Gambaran Umum Perhitungan ... 13
3.3 Blok Diagram ... 15
3.4 Penerapan Algoritma Apriori ... 16
3.4.1 Preproses ... 16
3.4.2 Membuat Penyaring kata ... 19
xiii
3.4.4 Menghitung Kandidat 1 itemset ... 22
3.4.5 Menghitung Kandidat 2 Itemset... 22
3.4.6 Menghitung Kandidat 3 Itemset... 24
3.5 Analisis Pengujian ... 25
BAB 4 IMPLEMENTASI PERHITUNGAN ... 26
4.1 Implementasi Percobaan Data Kueri Barang ... 26
4.1.1 Implementasi Percobaan Data Training dengan Minimum Support 0,6 ... 26
4.1.1.1 Membuat Representasi Biner ... 27
4.1.1.2 Menghitung Kandidat 1 Itemset... 29
4.1.1.3 Menghitung Kandidat 2 Itemset... 29
4.1.1.4 Menghitung Kandidat 3 Itemset... 31
4.1.1.5 Hasil Pola Asosiasi ... 33
4.1.2 Hasil Perhitungan Lift Ratio ... 34
4.1.3 Proses Pencocokan Pola ... 34
4.1.3.1 Pola Asosiasi ... 34
4.1.3.2 Data testing ... 34
4.1.3.3 Pengecekan Pola Asosiasi ... 35
4.1.3.4 Perhitungan Jumlah Kecocokan Pola ... 36
BAB 5 ANALISIS HASIL DAN PEMBAHASAN ... 38
5.1 Hasil Percobaan ... 38
5.2 Hasil Pengujian ... 39
5.3 Hasil Validitas Lift Ratio ... 41
BAB 6 KESIMPULAN DAN SARAN ... 43
6.1 Kesimpulan ... 43
6.2 Saran ... 44
Daftar Pustaka ... 45
LAMPIRAN 1 ... 46
LAMPIRAN 2 ... 63
xiv
DAFTAR GAMBAR
xv
DAFTAR TABEL
Tabel 3.1 Data Kueri Barang ... 18
Tabel 3.2 Penyaring Kata ... 19
Tabel 3.3 Pencocokan Data Kueri Barang ... 19
Tabel 3.4 Hasil Data dengan Kamus Kata ... 20
Tabel 3.5 Membuat Representasi Biner ... 21
Tabel 3.6 Kandidat 1 itemset ... 22
Tabel 3.7 Kandidat 2 itemset ... 23
Tabel 3.8 Kandidat 3 itemset ... 24
Tabel 3.9 Hasil Pola Asosiasi ... 24
Tabel 3.10 Rule ... 25
Tabel 4.1 Data Asli Kueri Barang... 27
Tabel 4.3 Menghitung Kandidat 1 itemset ... 29
Tabel 4.4.1 Menyeleksi Kandidat 2 itemset ... 30
Tabel 4.4.2 Menghitung Kandidat 2 itemset ... 30
Tabel 4.5 Menghitung Kandidat 3 itemset ... 32
Tabel 4.6 Hasil Pola Asosiasi ... 33
1
BAB 1
PENDAHULUAN
1.1Latar Belakang
Seiring dengan perkembangan zaman dan meningkatnya kemajuan
dibidang teknologi, internet mungkin sudah tidak asing lagi bagi sebagian besar
orang di dunia. Sekarang internet sudah dapat diakses dimanapun tempat dan
dengan siapa saja penggunanya. Dengan adanya akses internet yang mudah,
sekarang istilah jual-beli online melalui situs pencarian sudah menjadi cara baru
menjual atau membeli barang seperti olx, berniaga, bukalapak, dan forum kaskus.
Hal ini membantu bagi user yang ingin menjual atau membeli barang tanpa harus
membuang buang waktu untuk melakukan pencarian dan menawarkan barang
yang ingin dibeli atau dijual.
Dari banyaknya situs jual beli online di internet, situs “Inkuiri.com”
memiliki sistem yang berbeda yaitu mencari barang dengan menggunakan kueri
atau kata kunci barang, kemudian akan dicari di semua situs jual beli online yang
ada di situs “Inkuiri.com” seperti olx, berniaga, bukalapak dan lain sebagainya. Tujuan situs “Inkuiri.com” ini dibuat untuk memudahkan user mencari barang
pada satu situs pencarian namun mendapat informasi dari berbagai situs jual beli
online. Setelah kata kunci dimasukkan maka akan muncul barang dari berbagai
situs jual beli online berdasarkan kata kunci yang dimasukkan, kemudian dari
barang yang dipilih maka akan diteruskan oleh situs “Inkuiri.com” kepada situs
jual beli online yang mencantumkan iklan tersebut.
Situs “Inkuiri.com” masih banyak memerlukan perbaikan atau
2
mampu menghasilkan informasi untuk sistem saran dari kueri yang dimasukkan
oleh user. Di dalam situs tersebut terdapat data clickstream yang sangat beragam.
Data clickstream yang dimaksud yaitu id pengguna, ip address, jumlah
mengunjungi, kota, kueri, waktu berkunjung, jumlah berkunjung, tipe perangkat
yang digunakan, negara, lokasi, operating system yang digunakan, dan lain
sebagainya.
Salah satu cara untuk membantu situs “Inkuiri.com” yaitu dengan
pemanfaatan data jumlah berkunjung, id pengguna, dan kueri pada situs “Inkuiri.com”(data mining). Pada dasarnya data mining berhubungan dengan
analisa data dan penggunaan teknik-teknik perangkat lunak untuk mencari pola
dan keteraturan dalam himpunan data yang sifatnya tersembunyi. Data mining
adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan,
dan machine learning untuk mengekstrasi dan mengidentifikasi informasi yang
bermanfaat dan pengetahuan yang terkait dari berbagai database besar[1]. Data
mining dapat membantu situs “Inkuiri.com” untuk menganalisa pola dari data
jumlah berkunjung, id pengguna, dan kueri yang tersimpan dalam basis data situs “Inkuiri.com” dan mengolah isi dari data tersebut menjadi sebuah pengetahuan
yang baru (knowledge) mengenai pola asosiasi kueri barang sebagai sistem saran
dari kueri yang dimasukkan oleh user. Hal ini merupakan pengetahuan yang
bermanfaat bagi situs ”Inkuiri.com” dalam membantu memberikan saran dari
kueri barang yang dimasukkan oleh user di situs “Inkuiri.com”.
Pada tugas akhir ini akan dilakukan penelitian menggunakan teknik
association rules. Association rules memiliki bentuk LHS RHS dengan
3
item dalam RHS (right Hand Side) juga dibeli. Salah satu penggunaan association
rule adalah mendukung pengambilan keputusan dalam bidang pemasaran,
misalnya untuk mengetahui pola pembelian pelanggan, penentuan tata letak
barang dan lain-lain.
Algoritma yang digunakan yaitu algoritma apriori adalah salah satu
algoritma yang melakukan pencarian frequent itemset dengan menggunakan
teknik association rule. Algoritma apriori menggunakan pengetahuan frekuensi
atribut yang telah diketahui sebelumnya untuk memproses informasi selanjutnya.
Pada algoritma Apriori untuk menentukan kandidat yang mungkin muncul
dengan cara memperhatikan minimum support dan minimum confidence.
1.2Rumusan Masalah
Berdasar latar belakang tersebut maka dapat dirumuskan masalah sebagai berikut:
Bagaimana menggunakan algoritma apriori untuk mengolah data
clickstream yang ada di situs”Inkuiri.com”?
1.3Tujuan Penelitian
Untuk mengolah data clickstream dari situs “Inkuiri.com” menggunakan
algoritma apriori.
4
Sebagai penawaran barang yang berkaitan dengan kueri yang dimasukkan
user pertama kali
Sebagai perhitungan yang membantu situs “Inkuiri.com” menawarkan
barang yang dijual dari beberapa market place
1.5Batasan Masalah
Adapun batasan masalahnya yaitu:
a. Data yang diolah hanya sampai data user memasukkan kueri pencarian
barang, tidak sampai ke data pembelian.
b. Hanya memakai data clickstream yang dimasukkan atau jumlah user
berkunjung lebih dari satu saja.
c. Data dibatasi dengan maksimal 1000 data.
d. Belum mampu mengolah data yang sangat besar.
1.6Metodologi Penelitian
Metode Penelitian yang akan dipakai dalam penelitian ini yaitu :
1. Studi Pustaka : yaitu dengan mencari-cari referensi yang
mendukung dengan judul penelitian untuk memahami penerapan
data mining untuk keperluan bisnis.
2. Studi lapangan : yaitu dengan datang langsung ke Perusahaan “Guna Bangsa” untuk mendapatkan data transaksi kueri, sebagai
5
adalah data Perusahaan Guna Bangsa yaitu data clickstream yang
yang direkam selama 55 menit dan disimpan.
3. Proses Data Mining menggunakan algoritma apriori.
1.7Sistematika Penulisan
Untuk memberikan gambaran dan kerangka yang jelas pada gambaran tiap
bab dalam penelitian ini. Maka diperlukan sistematika penulisan. Berikut ini
gambaran sistematika penulisan dalam masing-masing bab :
BAB I Pendahuluan
Bab ini berisi tentang latar belakang, rumusan masalah, tujuan penelitian,
manfaat penelitian, batasan masalah, dan sistematika penulisan.
BAB II Landasan Teori
Bab ini menjelaskan tentang landasan teori yang berhubungan dengan
topik yang akan dibahas.
BAB III Perancangan Perhitungan
Bab ini berisi tentang analisis perhitungan, gambaran umum perhitungan,
diagram use case, konteks diagram, blok diagram, data pengujian, dan
kerangka yang dipikirkan.
BAB IV Implementasi Perhitungan
Bab ini berisi tentang implementasi perhitungan dari apa yang telah
disusun atau dirancang pada bab sebelumnya.
6
Bab ini menjelaskan tentang analisa dan hasil dari implementasi
perhitungan manual yaitu hasil dari perhitungan manual.
BAB VI Kesimpulan dan Saran
Bab ini berisi tentang kesimpulan dari hasil akhir pola asosiasi dan saran
7
BAB 2
LANDASAN TEORI
2.1Data Mining
Data mining adalah proses menganalisa data dari perspektif yang berbeda
dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai
untuk meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan
keduanya. Secara teknis, data mining dapat disebut sebagai proses untuk
menemukan korelasi atau pola dari ratusan atau ribuan field dari sebuah relasional
database yang besar. [2] Kemampuan Data mining untuk mencari informasi
bisnis yang berharga dari basis data yang sangat besar, dapat dianalogikan dengan
penambangan logam mulia dari lahan sumbernya, teknologi ini dipakai untuk [2] :
1. Prediksi trend dan sifat-sifat bisnis, dimana data mining mengotomatisasi
proses pencarian informasi di dalam basis data yang besar.
2. Penemuan pola-pola yang tidak diketahui sebelumnya, dimana data mining “menyapu” basis data, kemudian mengidentifikasi pola-pola yang sebelumnya
tersembunyi dalam satu sapuan.
8
Gambar 2.1 Tahap penemuan Knowledge Data Discovery (KDD)
Gambar 2.1 menggambarkan proses KDD dalam menghasilkan knowledge dan terdiri dari beberapa tahap [3]:
a) Data Cleaning
Untuk menghapus data yang tidak dipakai dan data yang tidak konsisten.
b) Data Integration
Berbagai sumber data dapat digabungkan. c) Data Selection
Data yang bersangkutan pada tugas analisis diseleksi dan diambil kembali. dari database.
d) Data Transformation
9 e) Data Mining
Sebuah proses penting di mana metode intelijen diterapkan dengan tujuan untuk mengolah pola-pola data.
f) Pattern Evaluation
Untuk mengidentifikasi pola-pola menarik yang
menjelaskan mengenai ukuran dasar pengetahuan yang ada. g) Knowledge Presentation
Visualisasi dan teknik representasi knowledge digunakan untuk menyajikan knowledge yang telah diolah untuk pengguna.
2.2Jenis-jenis Data Mining Menurut Fungsinya
Data mining dibagi menjadi beberapa jenis menurut dari fungsinya, yaitu: [4]
a.Konsep atau kelas description
b.Association Analysis
c.Klasifikasi dan Prediksi
d. Cluster Analysis
e.Outlier Analysis
f.Evaluation Analysis.
2.3Algoritma Apriori
Algoritma Apriori adalah salah satu algoritma yang melakukan pencarian
frequent itemset dengan menggunakan teknik association rule [5]. Algoritma
Apriori menggunakan pengetahuan frekuensi atribut yang telah diketahui
sebelumnya untuk memproses informasi selanjutnya. Pada algoritma Apriori
menentukan kandidat yang mungkin muncul dengan cara memperhatikan
10
a. Minimum support: parameter yang digunakan sebagai batasan frekuensi
kejadian atau support count yang harus dipenuhi suatu kelompok data
untuk dapat dijadikan aturan. Dimana nilai minimum support count
diperoleh dari [6]:
jumlah item barang dari seluruh transaksi x 100%
jumlah total transaksi
b. Minimum confidence: parameter yang mendefinisikan minimum level dari
confidence yang harus dipenuhi oleh aturan yang berkualitas.
Support adalah nilai pengunjung atau persentase kombinasi sebuah item
dalam database. Rumus support adalah sebagai berikut :
Support (A) =
Support (A,B) = P(A∩B)
Support (A,B) = x 100 %
Sedangkan confidence adalah nilai kepercayaan yaitu kuatnya hubungan antar
item dalam sebuah Apriori. Confidence dapat dicari setelah pola frekuensi
munculnya sebuah item ditemukan. Berikut rumus confidence :
Confidence = P(B|A) = x 100 % ∑ Transaksi Mengandung A dan B
jumlah Transaksi Mengandung A
Total Transaksi
∑ Transaksi Mengandung A dan B
∑ Total Transaksi
11
secara garis besar cara kerja algoritma apriori adalah:
1. Pembentukan kandidat itemset, kandidat k-itemset dibentuk dari
kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu ciri dari
algoritma apriori adalah adanya pemangkasan kandidat k-itemset yang subset-nya
yang berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang
k-1.
2. Penghitungan support dari tiap kandidat k-itemset. Support dari tiap
kandidat k-itemset didapat dengan men-scan database untuk menghitung jumlah
transaksi yang memuat semua item di dalam kandidat k-itemset tsb. Ini adalah
juga ciri dari algoritma Apriori dimana diperlukan penghitungan dengan scan
seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k
item atau k-itemset ditetapkan dari kandidat k-itemset yang support-nya lebih
besar dari minimum support.
4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses
dihentikan. Bila tidak, maka k ditambah satu dan kembali ke bagian 1.
a. Kelebihan dari algoritma apriori ini adalah lebih sederhana dan
dapat menangani data yang besar. Sedangkan algoritma lainnya memiliki
kelemahan dalam penggunaan memori saat jumlah data besar, tentunya
berpengaruh terhadap banyaknya item yang diproses serta mudah di
12
b. Apriori memiliki kelemahan karena harus melakukan scan
database setiap kali iterasi, sehingga waktu yang diperlukan bertambah
dengan makin banyak iterasi.
2.4Lift Ratio
Lift Ratio adalah parameter penting selain support dan confidence dalam
association rule. Lift Ratio mengukur seberapa penting rule yang telah terbentuk
berdasarkan nilai support dan confidence, Lift Ratio merupakan nilai yang
menunjukkan kevalidan proses transaksi dan memberikan informasi apakah benar
produk A dibeli bersamaan dengan produk B.
Lift Ratio dapat dihitung dengan rumus [3]:
Lift Ratio =
Sebuah transaksi dikatakan valid jika mempunyai nilai lift lebih dari 1, yang berarti bahwa dalam transaksi tersebut, produk A dan B benar – benar dibeli
secara bersamaan.
13
BAB 3
PERANCANGAN PERHITUNGAN
3.1Analisis Masalah
Situs “Inkuiri.com” merupakan situs pencarian barang yang dijual dari
beberapa market place. Dalam fungsi utamanya yaitu mencari barang yang dijual dari beberapa market place situs “Inkuiri.com” masih memiliki banyak
kekurangan dalam memberikan pelayanan. Salah satunya adalah memberikan
saran barang yang dijual terhadap user setelah melakukan kueri barang. Dilihat
dari sisi pengguna yang sudah modern saat ini, yang menginginkan kemudahan
dalam melakukan proses pencarian terhadap penawaran yang ada, hal ini
membuka kesempatan untuk membuat perhitungan baru untuk memberi
penawaran berupa saran barang yang dicari. Dan saran tersebut haruslah ada
keterkaitan dengan kueri yang dimasukkan pertama kali ketika user melakukan
kueri barang.
3.2Gambaran Umum Perhitungan
Gambaran umum perhitungan yang akan dibuat yaitu perhitungan dapat
memberikan saran informasi barang yang sedang dijual dengan memasukkan
kueri barang yang dicari, perhitungan dapat menghitung data mining dari data
kueri yang sudah dimasukkan user dengan tujuan utama perhitungan yaitu
menentukan pola asosiasi data barang dijual yang dicari, melihat hasil perhitungan
14
pola barang yang dicari user sehingga dimaksudkan dapat memberi saran barang
lain yang berhubungan dengan kueri yang dimasukkan pertama kali. Adapun yang
terlibat dalam perhitungan ini yaitu penguji perhitungan. Penguji dapat
menggunakan data kueri pencarian, melakukan perhitungan pola asosiasi kueri
barang yang dicari dengan metode data mining, dan melihat hasil pola asosiasi
15 3.3Blok Diagram
Blok diagram merupakan langkah perhitungan manual dengan algoritma
apriori dapat dilihat pada gambar 3.1. dimana untuk selanjutnya akan diterapkan
[image:33.595.86.557.197.680.2]pada penerapan perhitungan algoritma apriori pada bab 3.6
Gambar 3.1 Blok Diagram Menghitung kandidat 3 itemset,
menentukan nilai minimum confidence, dan rule (Tabel 3.8,3.9, & 3.10)
Analisis Pengujian
(sub bab 3.8) Selesai Preproses
Data Clickstream
(Tabel 3.2)
Menentukan nilai minimum dan menghitung kandidat 2
itemset (Tabel 3.7) Menghitung
kandidat 1 itemset (Tabel 3.6) Mulai
Membuat Representasi Biner
(Tabel 3.5)
Penyaringan Kata
(Tabel 3.3, 3.4) Proses Penemuan
Knowledge
16 3.4Penerapan Algoritma Apriori
Berikut merupakan penerapan algoritma apriori untuk pencarian Association
Rules dengan 20 data clickstream situs “Inkuiri.com” dengan ketentuan nilai
untuk nilai minimum support 16% dan nilai minimum confidence adalah 70%. [7]
3.4.1 Preproses
Pada tahap ini merupakan tahap awal dengan menyiapkan data
clickstream, dimana data clickstream yang dimaksud yaitu visitor dan query yang
diinputkan.
Data awal yang akan diproses yaitu file data bertipe (*.json) yang
kemudian di convert menggunakan aplikasi online http://konklone.io/json/ untuk
diubah menjadi file data bertipe (*.csv). Data yang telah diubah menjadi format
[image:34.595.88.518.202.695.2]csv dapat dilihat pada gambar 3.2.
17
Kemudian dari data yang sudah diconvert menjadi .csv tersebut hanya
[image:35.595.82.522.127.666.2]diambil source ip dan source query seperti pada gambar 3.3
Gambar 3.3 Seleksi Data
Setelah itu dilakukan perhitungan data dengan rumus seperti pada gambar
3.4
Gambar 3.4 Perhitungan Data
Dari data setelah dihitung tersebut dihasilkan data kunjungan keri yang
18
Gambar 3.5 Contoh Data Yang Akan Digunakan
Dibawah ini terdapat data clickstream dalam waktu 30 menit dalam satu
hari dan diambil 20 data, dimana pada setiap data clickstream terdapat berbagai
jenis kueri. Lihat tabel 3.1.
19 3.4.2 Membuat Penyaring kata
Pada tahap ini yaitu dilanjutkan dengan membuat kamus kata, kamus kata
disini yaitu berfungsi untuk menyaring kata. Berikut merupakan contoh
penggunaan penyaring kata.
Kamus penyaring kata menggunakan database kata yang sudah dibuat dan
[image:37.595.86.509.222.761.2]disimpan ke dalam tabel seperti pada tabel 3.2.
Tabel 3.2 Penyaring Kata
No Kueri yang disimpan untuk penyaring
1 sepatu
2 batu
3 persia
4 reptile
5 keramik
6 gitar
7 keris
8 tombak
9 lensa
10 rak
Dari data kamus penyaring kata yang sudah dibuat, kemudian dicocokan
satu persatu dengan data kueri barang yang diinputkan. Dapat dilihat pada tabel
3.3
Tabel 3.3 Pencocokan Data Kueri Barang
No Data Kueri barang
1 sepatu,batu,persia
2 tombak,keris
3 keris,batu,persia,keramik,kembang
4 batu,reptile,keris
5 motor,dinamo,keramik,sepatu
6 dinamo,lampu
7 persia,kembang,sisha,sepatu
8 reptile,keris,keramik
9 kembang,gitar,persia
10 sisha,motor,keramik
11 keramik,batu,sepatu,persia,kembang
20
13 gitar,lensa,tombak
14 rak,gitar,sepatu,kembang
15 lensa,sepatu,keris
16 sepatu,persia,motor
17 tombak,keris,kembang
18 dinamo,motor,lampu
19 gitar,keramik
20 tombak,dinamo,batu
Jika data kueri sama dengan data kamus penyaring kata maka akan
ditampilkan kembali ke dalam tabel data kueri dan jika data kueri tidak ada di
kamus penyaring kata maka data kueri tersebut akan dihapus dan tidak
[image:38.595.92.511.96.700.2]ditampilkan kembali ke dalam tabel data kueri, hasil dapat dilihat pada tabel 3.4.
Tabel 3.4 Hasil Data dengan Kamus Kata
No Data Kueri
1 2
3 kembang
4
5 motor,dinamo
6 dinamo,lampu
7 kembang,sisha
8
9 kembang
10 sisha,motor
11 kembang
12 lampu,motor,kembang
13
14 kembang
15
16 motor
17 kembang
18 dinamo,motor,lampu
19
21 3.4.3 Membuat Representasi Biner
Tahap ini yaitu membuat tabel untuk melakukan perhitungan jumlah
pengunjung pada masing-masing kueri dengan memisahkan masing-masing kueri
barang dimana setiap kueri dipisahkan dengan kolom dan menghitung jumlah
kueri pada setiap kunjungan, apabila pada setiap kunjungan terdapat 1 kueri yang
di masukkan maka dihitung 1 dan jika pada setiap kunjungan tidak ada kueri yang
[image:39.595.68.547.245.630.2]dimasukkan maka dihitung 0. Perhitungan seperti pada tabel 3.5.
22 3.4.4 Menghitung Kandidat 1 itemset
Kemudian dari perhitungan yang diperoleh pada tabel 3.5 selanjutnya dilakukan
[image:40.595.85.571.192.662.2]tahap untuk menghitung kandidat 1 itemset
Tabel 3.6 Kandidat 1 itemset
Menentukan nilai minimum support (�). Ditetapkan bahwa nilai minimum
support (�) = 16%, maka semua itemset yang frekuensi kemunculannya sama
dengan atau lebih dari 16% disebut frequent. Dilihat dari tabel 3.6, dari jumlah
perhitungan kandidat 1 itemset yang didapat tidak semua dapat memenuhi karena
jumlah semua itemset frekuensi kemunculannya atau jumlah kunjungan kuerinya
tidak semua lebih dari 16%. Maka untuk kombinasi 1 itemset yang memenuhi
support minimal adalah pada bagian kanan dengan semua warna kuning.
3.4.5 Menghitung Kandidat 2 Itemset
Kemudian dilanjutkan dengan perhitungan kandidat 2 itemset. Pada tahap
ini pada setiap kueri dan frekuensi masing-masing kombinasi dihitung sesuai
dengan data pada tabel. Perhitungan masih sama dengan kandidat 1 itemset yaitu
23
pada Tabel 3.2. apabila dalam satu kunjungan terdapat 2 kombinasi itemset kueri
yang dimasukkan maka dihitung 1 dan apabila dalam satu kunjungan tidak
terdapat 2 kombinasi itemset kueri yang dmasukkan maka dihitung 0. Perhitungan
[image:41.595.82.558.201.699.2]seperti pada tabel 3.7.
24
Dari hasil kombinasi 2 itemset tersebut terdapat bagian berwarna kuning
merupakan kombinasi yang memenuhi dari nilai minimum support yang telah
ditentukan yaitu 16%, jadi yang frekuensi kemunculannya atau jumlah transaksi
dari kombinasi 2 itemset tersebut yang jumlahnya lebih dari atau sama dengan
16% adalah yang dipakai untuk digabungkan menjadi calon 3 itemset.
3.4.6 Menghitung Kandidat 3 Itemset
Perhitungan masih sama dengan kandidat 1 itemset dan 2 itemset yaitu
dari kombinasi 3 itemset barang dihitung jumlahnya sesuai dengan data kueri
barang tabel 3.2. apabila dalam satu transaksi terdapat 3 kombinasi itemset yang
dicari maka dihitung 1 dan apabila dalam satu transaksi tidak terdapat 3
kombinasi itemset yang dicari maka dihitung 0. Perhitungan seperti pada tabel
[image:42.595.75.547.206.736.2]3.8.
Tabel 3.8 Kandidat 3 itemset
Dibawah ini merupakan hasil asosiasi yang didapat dengan nilai minimal
confidence yang ditentukan adalah 70%. Lihat tabel 3.9.
25
Dari perhitungan tabel 3.9 hasil asosiasi diatas dengan dengan nilai
minimal confidence yang ditentukan adalah 70% maka rule yang didapat pada 20
data kueri barang tersebut adalah bagian yang berwarna kuning karena
[image:43.595.81.554.208.644.2]menunjukan nilai confidencenya lebih dari 70% seperti tabel 3.10 dibawah ini.
Tabel 3.10 Rule
3.5 Analisis Pengujian
Data training yang direcord selama 55 menit kemudian diuji coba dengan
data testing yang direcord selama 185 menit, untuk membuktikan bahwa hasil
rule dari pola asosiasi kueri barang yang telah diproses dengan minimum support
0,6 dan minimum confidence 0,7 mendapatkan hasil pola kueri yang sama dengan
26
BAB 4
IMPLEMENTASI PERHITUNGAN
Setelah melakukan tahap analisis dan perancangan perhitungan, maka
tahap selanjutnya adalah mengimplementasikan hasil perancangan tersebut ke
dalam sebuah perhitungan manual untuk menentukan pola kueri asosiasi antar
kueri barang. Perhitungan manual dapat menghitung data transaksi barang dari
file spreadsheet yang selanjutnya diolah ke dalam perhitungan yang dapat
melakukan proses data mining dari data kueri barang dengan menentukan nilai
min support, min confidence, jumlah pola dan pilihan sorting yang akan
ditampilkan dimana terdapat dua pilihan yaitu berdasarkan nilai support dan
confidence namun sebelumnya data yang berbentuk teks diubah terlebih dahulu ke
dalam data biner setelah itu data baru akan diproses. Kemudian akan terbentuk
hasil pola kunjungan kueri antar kueri barang yang tersimpan juga dalam bentuk
file data pencarian berupa teks.
4.1Implementasi Percobaan Data Kueri Barang
Pada implementasi data kueri barang situs “Inkuiri.com” dengan
menggunakan data kueri barang selama 55 menit yang telah diproses secara
manual untuk memperoleh data kueri yang dapat dilihat pada lampiran 1.
4.1.1 Implementasi Percobaan Data Training dengan Minimum Support 0,6
Implementasi percobaan data training ditentukan nilai minimum support
0,6, untuk nilai minimum confidence yang ditentukan 0,7 karena berdasarkan
27
dan dari percobaan tersebut dapat dilihat bahwa hasil yang signifikan terdapat
pada minimum support antara 0,1 sampai dengan 2. Berikut merupakan
langkah mencari hasil pola asosiasi dengan min support 0,6. Data clickstream
[image:45.595.82.509.206.605.2]yang sudah di proses menjadi data training dapat dilihat pada tabel 4.1.
Tabel 4.1 Data Asli Kueri Barang
4.1.1.1 Membuat Representasi Biner
Kemudian membuat tabel untuk melakukan perhitungan jumlah
pengunjung pada masing-masing kueri dengan memisahkan masing-masing kueri
barang dimana setiap kueri dipisahkan dengan kolom dan menghitung jumlah
kueri pada setiap kunjungan, apabila pada setiap kunjungan terdapat 1 kueri yang
di masukkan maka dihitung 1 dan jika pada setiap kunjungan tidak ada kueri yang
28
29 4.1.1.2 Menghitung Kandidat 1 Itemset
Kemudian dari perhitungan yang diperoleh pada tabel 4.2 selanjutnya dilakukan
[image:47.595.86.513.188.640.2]tahap seleksi untuk menghitung kandidat 1 itemset. Dapat dilihat pada tabel 4.3.
Tabel 4.3 Menghitung Kandidat 1 itemset
4.1.1.3 Menghitung Kandidat 2 Itemset
Menentukan nilai minimum support (�). Ditetapkan bahwa nilai minimum
support (�) = 0,6. Dari jumlah perhitungan kandidat 1 itemset yang didapat tidak
semua dapat memenuhi karena jumlah semua itemset frekuensi kemunculannya
atau jumlah kunjungan kuerinya tidak semua lebih dari 0,6. Dapat dilihat pada
tabel 4.4.1
Kemudian dilanjutkan dengan perhitungan kandidat 2 itemset. Pada tahap
ini pada setiap kueri dan frekuensi masing-masing kombinasi dihitung sesuai
30
Tabel 4.4.1 Menyeleksi Kandidat 2 itemset
31 4.1.1.4 Menghitung Kandidat 3 Itemset
Dari hasil kombinasi 2 itemset tersebut terdapat beberapa kombinasi yang
memenuhi dari nilai minimum support yang telah ditentukan yaitu 0,6 jadi yang
frekuensi kemunculannya atau jumlah transaksi dari kombinasi 2 itemset tersebut
yang jumlahnya lebih dari atau sama dengan 0,6 adalah yang dipakai untuk
32
Kemudian dilanjutkan dengan perhitungan kandidat 3 itemset. Pada tahap
ini pada setiap kueri dan frekuensi masing-masing kombinasi dihitung sesuai
[image:50.595.88.518.193.759.2]dengan data pada tabel. Perhitungan seperti pada tabel 4.5.
33 4.1.1.5Hasil Pola Asosiasi
Dibawah ini merupakan hasil asosiasi yang didapat dengan nilai minimal
[image:51.595.83.507.189.728.2]confidence yang ditentukan adalah 70%. Lihat tabel 4.6.
Tabel 4.6 Hasil Pola Asosiasi
Pola Asosiasi Support Confidence
Jika mencari kucing bengal,maka dinamo auldey akan dicari
5 0.735294
Jika mencari kucing bengal,maka kaos yonex akan dicari
5 0.735294
Jika mencari shock depan rx king,maka batu bongkahan akan dicari
6 0.882353
Jika mencari kain goretex,maka pintu bekas kusen kayu akan dicari
6 0.882353
Jika mencari kain goretex,maka baby jogger akan dicari
6 0.882353
Jika mencari kain goretex,maka tempat keramas salon akan dicari
5 0.735294
Jika mencari kain goretex,maka batu bongkahan akan dicari
8 1.176471
Jika mencari kain goretex,maka pintu bekas akan dicari
6 0.882353
Jika mencari kain goretex,maka kaos yonex akan dicari
9 1.323529
Jika mencari pintu bekas kusen kayu,maka batu bongkahan akan dicari
7 1.029412
Jika mencari baby jogger,maka tempat keramas salon akan dicari
7 1.029412
Jika mencari baby jogger,maka batu bongkahan akan dicari
10 1.470588
Jika mencari baby jogger,maka kaos yonex akan dicari
7 1.029412
Jika mencari tempat keramas salon,maka batu bongkahan akan dicari
7 1.029412
Jika mencari batu bongkahan,maka pintu bekas akan dicari
5 0.735294
Jika mencari kucing,maka pintu bekas akan dicari
6 0.882353
Jika mencari kucing,maka kaos yonex akan dicari
34 4.1.2 Hasil Perhitungan Lift Ratio
Dari hasil pola asosiasi yang didapat , kemudian dihitung menggunakan Lift Ratio
untuk membuktikan kevalidan rule yang terbentuk. Dapat dikatakan valid jika
mempunyai nilai lift lebih dari 1, yang berarti bahwa dalam data kunjungan tersebut, kueri A dan B benar – benar dicari secara bersamaan. Berikut merupakan
[image:52.595.86.551.226.615.2]perhitungan dengan rumus lift ratio. Dapat dilihat pada tabel 4.7.
Tabel 4.7 Hasil Lift Ratio
4.1.3 Proses Pencocokan Pola
4.1.3.1 Pola Asosiasi
Pola Asosiasi kueri barang yang diperoleh dari proses yang dilakukan
pada perhitungan manual dengan data training dan min support yang
ditentukan 0,6. dapat dilihat pada tabel 5.1 Hasil Pola Asosiasi.
4.1.3.2 Data testing
35 4.1.3.3 Pengecekan Pola Asosiasi
Dari adanya pola asosiasi yang sudah terbentuk dari percobaan data
training 1 kemudian dicocokan kesamaan dengan data testing yang telah
dilampirkan pada lampiran 3 dengan dicari satu persatu pada data testing:
a) Pengecekan kesamaan pola dilakukan dengan menyalin pola asosiasi
satu per satu, kemudian dicari menggunakan fungsi ctrl+f pada data
[image:53.595.86.535.234.630.2]testing. Dapat dilihat pada gambar 4.1.
Gambar 4.1 Pengecekan Pola Asosiasi
b) Pengecekan kunjungan mengandung rule dilakukan dengan menyalin
kueri satu per satu yang terdapat pada pola asosiasi, kemudian dicari
menggunakan fungsi ctrl+f pada data testing. Dapat dilihat pada
36
Gambar 4.2 Pengecekan kunjungan mengandung rule
4.1.3.4 Perhitungan Jumlah Kecocokan Pola Setelah dicek kemudian dihitung jumlahnya :
a) Jumlah pola yang sama dengan data testing dapat dilihat pada gambar 4.3
Gambar 4.3 Jumlah Pola Yang Ditemukan
b) Data kunjungan yang mengandung pola asosiasi kueri barang dapat dilihat
pada gambar 4.4. Digunakan rumus dibawah ini untuk menghitung
37
Jumlah kesamaan pola asosiasi x 100% Jumlah data kunjungan mengandung rule
[image:55.595.82.510.114.654.2]
38
BAB 5
ANALISIS HASIL DAN PEMBAHASAN
5.1 Hasil Percobaan
Pada bab ini akan dibahas mengenai hasil dari implementasi perhitungan
pola pencarian asosiasi kueri barang, dimana dari hasil jumlah data kueri barang
diujikan langsung kepada data kueri barang yang baru untuk membuktikan bahwa
hasil rule dari pola asosiasi kueri barang yang telah diproses menggunakan
perhitungan secara manual mendapatkan hasil yang sama dengan kueri barang
baru yang dicari oleh user. Pada percobaan ini penulis melakukan ujicoba
perhitungan dengan menggunakan data kueri barang selama 55 menit yang telah
diproses secara manual untuk memperoleh data kueri. Data dapat dilihat pada
lampiran 1.
Untuk hasil pola asosiasi dari data training dapat dilihat pada tabel 5.1
dimana dari minimum support yang diuji coba didapat pola asosiasi, nilai support,
[image:56.595.86.512.235.749.2]dan nilai confidence.
Tabel 5.1 Hasil Pola Asosiasi Support, Confidence
Pola Asosiasi Support Confidence
Jika mencari kucing bengal,maka dinamo auldey akan dicari
5 0.735294
Jika mencari kucing bengal,maka kaos yonex akan dicari
5 0.735294
Jika mencari shock depan rx king,maka batu bongkahan akan dicari
6 0.882353
Jika mencari kain goretex,maka pintu bekas kusen kayu akan dicari
6 0.882353
39 jogger akan dicari
Jika mencari kain goretex,maka tempat keramas salon akan dicari
5 0.735294
Jika mencari kain goretex,maka batu bongkahan akan dicari
8 1.176471
Jika mencari kain goretex,maka pintu bekas akan dicari
6 0.882353
Jika mencari kain goretex,maka kaos yonex akan dicari
9 1.323529
Jika mencari pintu bekas kusen kayu,maka batu bongkahan akan dicari
7 1.029412
Jika mencari baby jogger,maka tempat keramas salon akan dicari
7 1.029412
Jika mencari baby jogger,maka batu bongkahan akan dicari
10 1.470588
Jika mencari baby jogger,maka kaos yonex akan dicari
7 1.029412
Jika mencari tempat keramas salon,maka batu bongkahan akan dicari
7 1.029412
Jika mencari batu bongkahan,maka pintu bekas akan dicari
5 0.735294
Jika mencari kucing,maka pintu bekas akan dicari
6 0.882353
Jika mencari kucing,maka kaos yonex akan dicari
6 0.882353
5.2Hasil Pengujian
Kemudian dari pola yang diperoleh dari uji coba data training, penulis
mencoba mengujikan hasil dari perhitungan pola asosiasi kueri barang dengan
data baru yang direcord selama kurang lebih 185 menit. Tabel data testing
terdapat pada lampiran 3. Untuk membuktikan bahwa hasil rule dari pola asosiasi
kueri barang yang telah diproses menggunakan perhitungan manual untuk
mendapatkan hasil pola kueri yang sama dengan data yang baru sebagai saran
40
Tabel 5.2 Hasil Pengujian dengan Data Testing Min.
Support
Pola Asosiasi Kueri Barang Jumlah
Kecocokan Pola
Confidence
0,6 Jika mencari kucing bengal,maka dinamo
auldey akan dicari
5 0.735294
Jika mencari kucing bengal,maka kaos yonex akan dicari
5 0.735294
Jika mencari shock depan rx king,maka batu bongkahan akan dicari
6 0.882353
Jika mencari kain goretex,maka pintu bekas kusen kayu akan dicari
6 0.882353
Jika mencari kain goretex,maka baby jogger akan dicari
6 0.882353
Jika mencari kain goretex,maka tempat keramas salon akan dicari
5 0.735294
Jika mencari kain goretex,maka batu bongkahan akan dicari
8 1.176471
Jika mencari kain goretex,maka pintu bekas akan dicari
6 0.882353
Jika mencari kain goretex,maka kaos yonex akan dicari
9 1.323529
Jika mencari pintu bekas kusen kayu,maka batu bongkahan akan dicari
7 1.029412
Jika mencari baby jogger,maka tempat keramas salon akan dicari
7 1.029412
Jika mencari baby jogger,maka batu bongkahan akan dicari
10 1.470588
Jika mencari baby jogger,maka kaos yonex akan dicari
7 1.029412
Jika mencari tempat keramas salon,maka batu bongkahan akan dicari
7 1.029412
Jika mencari batu bongkahan,maka pintu bekas akan dicari
5 0.735294
Jika mencari kucing,maka pintu bekas akan dicari
6 0.882353
Jika mencari kucing,maka kaos yonex akan dicari
6 0.882353
Jumlah kecocokan pola 55 Presentase Hasil Kecocokan Pola 55/468*10
0
41
Dapat dilihat hasil pengujian dari data testing pada lampiran 3 dengan data
training diperoleh hasil sebagai berikut :
1. Dengan nilai min.support 0,6 dengan jumlah kesamaan pola asosiasinya
55 diperoleh presentase hasil kecocokan pola sebesar 11,75214%.
11,75214% disini artinya yaitu bahwa kesamaan pencarian kueri barang oleh user dengan hasil pola asosiasi kueri barang yang didapatkan dari
perhitungan manual sebesar 11,75214%.
5.3 Hasil Validitas Lift Ratio
Hasil pada percobaan data training diperoleh pola yang memenuhi syarat
lift ratio dengan hasil perhitungan lebih dari 1 adalah bagian yang berwarna
[image:59.595.88.518.172.760.2]kuning yaitu pola nomor 2,3,4,5,7,8,9,11,12,13,14,16,17.
Tabel 5.3 Hasil Perhitungan Lift Ratio
No Pola Asosiasi Hasil
Perhitungan Lift Ratio
1 Jika mencari kucing bengal,maka dinamo auldey akan
dicari 0.391113892
2 Jika mencari kucing bengal,maka kaos yonex akan dicari 1.720901126
3 Jika mencari shock depan rx king,maka batu bongkahan
akan dicari 1.14379085
4 Jika mencari kain goretex,maka pintu bekas kusen kayu
akan dicari 1.470588235
5 Jika mencari kain goretex,maka baby jogger akan dicari 1.176470588
6 Jika mencari kain goretex,maka tempat keramas salon
akan dicari 0.971314452
7 Jika mencari kain goretex,maka batu bongkahan akan
dicari 1.525054466
8 Jika mencari kain goretex,maka pintu bekas akan dicari 1.492374728
9 Jika mencari kain goretex,maka kaos yonex akan dicari 1.797385621
42 bongkahan akan dicari
11 Jika mencari baby jogger,maka tempat keramas salon
akan dicari 1.019880174
12 Jika mencari baby jogger,maka batu bongkahan akan
dicari 1.429738562
13 Jika mencari baby jogger,maka kaos yonex akan dicari 1.048474946
14 Jika mencari tempat keramas salon,maka batu bongkahan
akan dicari 1.010170423
15 Jika mencari batu bongkahan,maka pintu bekas akan
dicari 0.959383754
16 Jika mencari kucing,maka pintu bekas akan dicari 2.238562092
43
BAB 6
KESIMPULAN DAN SARAN
Bab akhir tulisan ini berisikan tentang kesimpulan dan saran. Kesimpulan
berisi tentang hasil akhir pola asosiasi situs Inkuiri.com dari data kueri barang
selama 55 menit dan data yang telah diuji. Saran akan memuat hal yang berkaitan
tentang pengembangan proses perhitungan dalam tulisan ini.
6.1 Kesimpulan
Berdasarkan hasil analisis dari implementasi menggunakan data clickstream yang
di record selama 55 menit, bahwa :
1. Hasil dari pengujian data kueri barang yang baru selama 185 menit dengan
hasil pola asosiasi kueri barang selama 55 menit yaitu data training
disimpulkan bahwa didapat kesamaan pola pencarian kueri barang
membuktikan data training memiliki kesamaan pola pada data testing
dengan jumlah kesamaan pola sebesar 55 pola dan pola terbesar adalah pola “Jika mencari baby jogger,maka batu bongkahan akan dicari” dengan
hasil kesamaan sebesar 10 pola dengan presentase 1.470588%.
2. Hasil dari proses perhitungan kueri barang selama 55 menit menghasilkan
pola asosiasi berjumlah 17 pola dan setelah dihitung menggunakan rumus
lift ratio menghasilkan 13 pola yang dikatakan valid (nilai lebih dari 1)
atau sebesar 76,47% dari 17 pola yang dapat memenuhi syarat lift ratio
yang diperoleh dari 13 pola valid dibagi 17 polda asosiasi dikalikan 100
44 6.2 Saran
Dari perhitungan yang telah dibuat masih dibutuhkan beberapa saran
sebagai pengembangan perhitungan ke arah yang lebih baik, yaitu:
Membuat sistem untuk mengolah data yang sudah diujicoba dengan
cara manual, agar proses dapat dilakukan oleh sistem untuk
45
Daftar Pustaka
[1] Luthfi ,E. T dan Kusrini.(2009). Algoritma Data Mining. Yogyakarta:
Andi Offset
[2] Berry, M.J.A., (2004). Data Mining Techniques, John Wiley & Sons.
[3] Han, Jiawei dkk.(2011). Data Mining Concept And Techniques. University
of lllinois at Urbana-Champaign.
[4] Abdullah, Atje Setiawan.(2009). Spasial Data Mining Menggunakan
Model SARKriging (Sptial Autoregressive-Kriging) untuk Pemetaan Mutu
Pendidikan di Indonesia.Disertasi. Program Pasca Sarjana FMIPA
UGM.UGM: Yogyakarta.
[5] Bettiza, Martaleli dkk.(2009). Penerapan Algoritma Apriori Dalam
Menemukan Hubungan Data Awal Masuk Mahasiswa Dengan Prestasi
Akademik (Studi Kasus : Stai Miftahul Ulum Tanjungpinang). Jurusan
Teknik Informatika, Fakultas Teknik, Universitas Maritim Raja Ali Haji
(UMRAH). Jl. Politeknik Senggarang, Tanjungpinang 29115.
[6] Tampubolon, Kennedi dkk.(2013). Implementasi Data Mining Algoritma
Apriori Pada Sistem Persediaan Alat-alat Kesehatan. Jurnal Informasi dan
Teknologi Ilmiah (INTI), Vol. I , No.1 Bulan Oktober 2013.
[7] Agrawal, Rakesh dkk.(1993). Mining Association Rules between Sets of
Items in Large Databases. IBM Almaden Research Center 650 Harry
46
LAMPIRAN 1
Data Training
1 sepatu gunung salomon gtx,sepatu gunung salomon boots gtx
2 taft gt,gardan daihatsu taft depanpintu bekas kusen kayu 3 kucing bengal,kain goretex,kaos yonex
4 shock depan rx king,kaos yonex 5 kain goretex,pintu bekas kusen kayu
6 burung murai medan betina,kucing bengal 7 etalase bekas bandung,kain goretex
8 trainer roller sepeda,pintu bekas kusen kayu 9 dinamo auldey,kaos yonex
10 pintu bekas kusen kayu,seragam tarung derajat 11 barter vespa cb 100,shock depan rx king 12 barter vespa cb 100,pintu bekas kusen kayu 13 etalase bekas,kain goretex
14 keris sepuh,keris sepuh pamor
15 reel pancing,kucing bengal,seragam tarung derajat
16 baby jogger,baby jogger stroller,baby jogger city,baby jogger city double 17 burung merpati hias,kucing bengal
18 burung merpati hias,pintu bekas kusen kayu
19 tombak luk,tombak luk temuan,keris tombak besar,tombak 20 rockwool yogyakarta,kain goretex
21 tempat keramas salon,kain goretex
22 batu bongkahan,batu bongkahan pancawarna
23 motor drag tangki,motor drag jok tangki,shock depan rx king
24 dinamo mini4wd kilikan tamiya,dinamo mini4wd kilikan lagi,dinamo auldey 25 bdu lokal,bdu lokal multicam,dinamo auldey
26 persia obral,persia obral kitten,kucing bengal
27 ikan arwana (surabaya),kucing bengal,dinamo auldey 28 ikan arwana (surabaya),kain goretex
29 ayam bangkok betina,kucing bengal
30 bangkok yogyakarta ayam bantul,kucing bengal 31 tangki vixion,shock depan rx king,dinamo auldey 32 tanah pangalengan,kain goretex
33 kotak peluru box tempat,pintu bekas kusen kayu
34 batu merah siam retak seribu rubi,batu merah siam retak seribu 35 mesin cuci bandung,kain goretex
36 anis kembang ngerol ring,anis kembang ngerol ring ngeplong,kain goretex 37 batu bongkahan,kucing bengal,dinamo auldey
38 velg jari jari satria fu,shock depan rx king
47 40 lamborghini 1 hotwheels,kucing bengal
41 barn owl surabaya,barn owl brancher jawa tengah
42 dancing in the water speaker,pintu bekas kusen kayu
43 tarantula,brachypelma,brachypelma mexican,brachypelma red,brachypelma adult
44 fahreza04 OR honda OR c50 OR c70 OR th OR 71 70,pintu bekas kusen kayu 45 fahreza04 OR honda OR c50 OR c70 OR th OR 71 70
46 kaisar ruby,carry 87 tahun 47 vaporizer,vamo,dinamo auldey
48 braket vixion megapro lampu tiger,braket vixion megapro lampu tiger scorpio,dinamo auldey
49 lampu depan vixion,kain goretex,dinamo auldey 50 dipan bekas,kucing bengal,kain goretex
51 sepatu gunung salomon gtx,kain goretex 52 sepatu gunung salomon boots gtx 53 taft gt,kucing bengal
54 taft gt,kain goretex,kaos yonex
55 taft gt,shock depan rx king 56 taft gt,pintu bekas kusen kayu
57 gardan daihatsu taft depan,kaos yonex 58 kucing bengal,dinamo auldey
59 kucing bengal,pintu bekas kusen kayu 60 kucing bengal,kain goretex,dinamo auldey 61 kucing bengal,shock depan rx king
62 kucing bengal,dinamo auldey
63 kucing bengal,seragam tarung derajat 64 kucing bengal,shock depan rx king 65 kucing bengal,kaos yonex
66 shock depan rx king
67 shock depan rx king
68 kain goretex,seragam tarung derajat 69 kain goretex,pintu bekas kusen kayu 70 kain goretex,kaos yonex
71 burung murai medan betina,kucing bengal 72 burung murai medan betina,dinamo auldey 73 etalase bekas bandung,pintu bekas kusen kayu 74 etalase bekas bandung,kain goretex,kaos yonex
75 etalase bekas bandung,seragam tarung derajat 76 etalase bekas bandung,dinamo auldey
77 etalase bekas bandung,seragam tarung derajat 78 etalase bekas bandung,pintu bekas kusen kayu
79 etalase bekas bandung,kaos yonex
48
81 etalase bekas bandung,dinamo auldey,dinamo auldey 82 trainer roller sepeda,shock depan rx king
83 trainer roller sepeda,seragam tarung derajat 84 dinamo auldey,pintu bekas kusen kayu 85 dinamo auldey,kaos yonex
86 pintu bekas kusen kayu,kain goretex
87 pintu bekas kusen kayu,seragam tarung derajat 88 pintu bekas kusen kayu,kaos yonex
89 barter vespa cb 100,shock depan rx king
90 barter vespa cb 100,dinamo auldey 91 etalase bekas,baby jogger
92 etalase bekas,pintu bekas kusen kayu 93 keris sepuh,dinamo auldey
94 keris sepuh pamor,seragam tarung derajat
95 reel pancing,pintu bekas kusen kayu
96 reel pancing,kain goretex,tempat keramas salon 97 reel pancing,dinamo auldey
98 reel pancing,kucing bengal 99 reel pancing,baby jogger
100 reel pancing,dinamo auldey,baby jogger 101 reel pancing,shock depan rx king
102 reel pancing,tempat keramas salon 103 reel pancing,kain goretex
104 baby jogger,tempat keramas salon 105 baby jogger,kain goretex
106 baby jogger,pintu bekas kusen kayu 107 baby jogger,shock depan rx king 108 baby jogger,dinamo auldey
109 baby jogger stroller,seragam tarung derajat
110 baby jogger city,kaos yonex 111 baby jogger city double
112 baby jogger city,tempat keramas salon 113 burung merpati hias,kucing bengal
114 burung merpati hias,pintu bekas kusen kayu 115 tombak luk,dinamo auldey
116 tombak luk,pintu bekas kusen kayu,baby jogger 117 tombak luk temuan,baby jogger
118 tombak luk,kain goretex,kaos yonex 119 keris tombak besar,dinamo auldey 120 tombak,pintu bekas kusen kayu
121 tombak luk,baby jogger,tempat keramas salon
49 124 rockwool yogyakarta,baby jogger 125 tempat keramas salon,kaos yonex
126 tempat keramas salon,shock depan rx king 127 tempat keramas salon,pintu bekas kusen kayu 128 tempat keramas salon,kain goretex
129 tempat keramas salon,baby jogger
130 tempat keramas salon,kaos yonex 131 batu bongkahan,kain goretex 132 batu bongkahan,baby jogger
133 batu bongkahan,baby jogger,tempat keramas salon 134 batu bongkahan,shock depan rx king
135 batu bongkahan,pintu bekas kusen kayu 136 batu bongkahan pancawarna,kaos yonex
137 batu bongkahan pancawarna,shock depan rx king
138 batu bongkahan pancawarna,kain goretex 139 motor drag tangki,baby jogger
140 motor drag jok tangki,tempat keramas salon
141 motor drag jok tangki,baby jogger 142 dinamo mini4wd kilikan tamiya
143 dinamo mini4wd kilikan tamiya,shock depan rx king 144 dinamo mini4wd kilikan tamiya,baby jogger
145 dinamo mini4wd kilikan lagi,kaos yonex 146 bdu lokal,pintu bekas kusen kayu
147 bdu lokal multicam,tempat keramas salon 148 persia obral,kucing bengal,baby jogger
149 persia obral kitten,kain goretex,kaos yonex 150 ikan arwana (surabaya),tempat keramas salon 151 ikan arwana (surabaya),shock depan rx king 152 ikan arwana (surabaya),kain goretex
153 ayam bangkok betina,pintu bekas kusen kayu 154 ayam bangkok betina,kucing bengal,baby jogger 155 ayam bangkok betina,baby jogger
156 bangkok yogyakarta ayam bantul,kaos yonex
157 bangkok yogyakarta ayam bantul,shock depan rx king 158 bangkok yogyakarta ayam bantul
159 bangkok yogyakarta ayam bantul,kain goretex 160 tangki vixion,shock depan rx king
161 tangki vixion,kucing bengal,kaos yonex 162 tanah pangalengan,pintu bekas kusen kayu 163 tanah pangalengan,kain goretex
164 kotak peluru box tempat,pintu bekas kusen kayu
50 167 batu merah siam retak seribu,kaos yonex 168 mesin cuci bandung,baby jogger
169 mesin cuci bandung,shock depan rx king 170 mesin cuci bandung,tempat keramas salon 171 mesin cuci bandung,pintu bekas kusen kayu 172 anis kembang ngerol gacor,kain goretex
173 anis kembang ngerol,shock depan rx king
174 anis kembang ngerol gacor,tempat keramas salon 175 anis kembang ngerol gacor istimewa,baby jogger
176 anis kembang ngerol ring,pintu bekas kusen kayu 177 anis kembang ngerol ring,shock depan rx king 178 anis kembang ngerol ring,tempat keramas salon 179 anis kembang ngerol ring ngeplong,baby jogger 180 anis kembang ngerol ring jantan
181 anis kembang ngerol ring jantan ngeplong 182 batu bongkahan,shock depan rx king 183 batu bongkahan,baby jogger
184 batu bongkahan,pintu bekas kusen kayu 185 velg jari jari satria fu,kain goretex
186 velg jari jari satria fu,tempat keramas salon 187 velg jari jari satria fu,shock depan rx king
188 velg jari jari satria fu,baby jogger
189 velg jari jari satria fu,pintu bekas kusen kayu 190 velg jari jari satria fu,kaos yonex
191 undertail ninja 250 model,baby jogger
192 headlamp variasi custom,kucing bengal 193 lamborghini 1 hotwheels,kain goretex 194 lamborghini 1 hotwheels,shock depan rx king 195 barn owl surabaya,tempat keramas salon
196 barn owl brancher jawa tengah,kucing bengal 197 dancin