• Tidak ada hasil yang ditemukan

Penerapan data mining dengan algoritma apriori untuk informasi saran kueri barang : studi kasus : situs ``Inkuiri.com``.

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penerapan data mining dengan algoritma apriori untuk informasi saran kueri barang : studi kasus : situs ``Inkuiri.com``."

Copied!
111
0
0

Teks penuh

(1)

Penerapan Data Mining Dengan Algoritma Apriori Untuk

Informasi Saran Kueri Barang

(Studi Kasus :

Situs “

Inkuiri.com

)

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Oleh :

Dimas Dewa Wicaksono 115314085

PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA

(2)

Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang

(Studi Kasus : Situs “Inkuiri.com”) ABSTRAK

Dalam data history sebuah situs pencarian “Inkuiri.com” atau data rekaman pengunjung ternyata memiliki data clickstream yang cukup banyak jenisnya, sebagai contoh : data id pengunjung, ip address pengunjung, profile pengunjung, data kueri barang, data jumlah berkunjung pada sebuah ip address dan lain sebagainya. Berdasarkan pada jenis artikel di atas ternyata dapat digali informasi dari data kunjungan yang dapat dimanfaatkan. Salah satunya dapat diolah dengan proses menggunakan algoritma apriori dengan teknik accociation rule mining untuk menganalisa data history situs “Inkuiri.com”. Accociation rule mining adalah teknik mengolah data untuk menemukan aturan suatu kombinasi item.

(3)

Application of Data Mining With Apriori Algorithm For

Item Information Query Suggestions

Case Study : Sites " Inkuiri.com "

ABSTRACT

In the history data of a search site " Inkuiri.com " or recording the data of

visitors turned out to have quite a lot of clickstream data type, for example : the

data id visitors , ip address of visitors , visitor profile , query data items , data on

the number visiting on an ip address and others. Based on the type of the above

article it can be extracted information from the traffic data that can be utilized .

One of them can be processed by using a priori algorithm with accociation rule

mining techniques to analyze the data history site " Inkuiri.com " . Accociation

rule mining is a technique to process the data to find the rules of a combination of

items .

The first stage in the calculation of Apriori algorithm to discover

association rules that write the traffic data query, wherein the processed data is the

data query traffic for 55 minutes. Followed by changing the data format .json into

csv format, in order to modify and refine the data as needed ie query data traffic,

IP address, and the number of visiting. Next create table 1 itemset to perform

calculations on the number of visits each item. Then make a combination of two

itemsets in every query and frequency of each combination is calculated in

accordance with the data in the table. After analyzing the tables on the

combination of two itemsets. The next step to create a combination of 3 itemset

accordance with the composition of the new combination. Specified minimum

support value of 0.6 on training data with confidence minimum value of 0.7 and

then the number of patterns based on the value confidencenya. Obtained a

different pattern of association of the training data with the support and

confidence values are different. From the pattern of association obtained a

(4)

i

Penerapan Data Mining Dengan Algoritma Apriori Untuk

Informasi Saran Kueri Barang

(Studi Kasus :

Situs “

Inkuiri.com

)

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Oleh :

Dimas Dewa Wicaksono 115314085

PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA

(5)

ii

Application of Data Mining With Apriori Algorithm For Item

Information Query Suggestions

(Case Study : Sites " Inkuiri.com")

A Final Project

Presented as Partial Fulfillment of The Requirements

To Obtain Sarjana Komputer Degree

In Informatics Engineering Study Program

By :

Dimas Dewa Wicaksono 115314085

INFORMATICS ENGINEERING STUDY PROGRAM DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY

(6)

iii

HALAMAN PERSETUJUAN

SKRIPSI

Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang

(Studi Kasus : Situs “Inkuiri.com”)

Disusun Oleh : Dimas Dewa Wicaksono

115314085

Telah Disetujui Oleh :

Dosen Pembimbing

(7)

iv

HALAMAN PENGESAHAN

SKRIPSI

Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang

(Studi Kasus : Situs “Inkuiri.com”) Dipersiapkan dan Disusun Oleh :

Dimas Dewa Wicaksono 115314085

Telah dipertahankan didepan Panitia Penguji Pada Tanggal 19 April 2016

Dan dinyatakan memenuhi syarat Susunan Panitia Penguji :

Nama Lengkap Tanda Tangan

Ketua Paulina Heruningsih Prima Rosa M.Sc. ... Sekretaris Alb. Agung Hadhiatma , S.T., M.T. ...

Anggota Sri Hartati Wijono, S.Si., M.Kom. ...

Yogyakarta, Mei 2016 Fakultas Sains dan Teknologi

Universitas Sanata Dharma

(8)

v

Sudi Mungkasi, S.Si.,M.Math.Sc.,Ph.D.

HALAMAN PERSEMBAHAN

Tugas akhir ini saya persembahkan untuk:

Allah SWT

Orang tua tercinta atas doa, semangat, dan dukungan yang selalu

diberikan

Pristian Putik tercinta yang selalu setia menemani dan mendukung

dalam penyelesaian TA

Romo Poldo yang telah membantu dalam penyelesaian TA

Audris Evan Utomo yang telah membantu dalam penyelesaian TA

Teman – teman yang selalu setia menemani dengan menghadirkan

(9)

vi

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini

tidak memuat karya atau bagian karya dari orang lain, kecuali yang telah

disesbutkan dalam kutipan dan daftar pustaka sebagaimana layaknya karya ilmiah.

Yogyakarta, 17 Mei 2016

Penulis

(10)

vii

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN

AKADEMIS

Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma:

Nama : Dimas Dewa Wicaksono

Nomor Mahasiswa : 115314085

Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakaan

Universitas Sanata Dharma karya ilmiah saya yang berjudul:

Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang

(Studi Kasus : Situs “Inkuiri.com”)

Beserta perangkat yang diperlukan. Dengan demikian saya memberikan kepada

Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan

dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data,

mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media

lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun

memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai

penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di Yogyakarta

Pada tanggal : 17 Mei 2016

Yang menyatakan

(11)

viii

Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang

(Studi Kasus : Situs “Inkuiri.com”) ABSTRAK

Dalam data history sebuah situs pencarian “Inkuiri.com” atau data rekaman pengunjung ternyata memiliki data clickstream yang cukup banyak jenisnya, sebagai contoh : data id pengunjung, ip address pengunjung, profile pengunjung, data kueri barang, data jumlah berkunjung pada sebuah ip address dan lain sebagainya. Berdasarkan pada jenis artikel di atas ternyata dapat digali informasi dari data kunjungan yang dapat dimanfaatkan. Salah satunya dapat diolah dengan proses menggunakan algoritma apriori dengan teknik accociation rule mining untuk menganalisa data history situs “Inkuiri.com”. Accociation rule mining adalah teknik mengolah data untuk menemukan aturan suatu kombinasi item.

(12)

ix

Application of Data Mining With Apriori Algorithm For

Item Information Query Suggestions

Case Study : Sites " Inkuiri.com "

ABSTRACT

In the history data of a search site " Inkuiri.com " or recording the data of

visitors turned out to have quite a lot of clickstream data type, for example : the

data id visitors , ip address of visitors , visitor profile , query data items , data on

the number visiting on an ip address and others. Based on the type of the above

article it can be extracted information from the traffic data that can be utilized .

One of them can be processed by using a priori algorithm with accociation rule

mining techniques to analyze the data history site " Inkuiri.com " . Accociation

rule mining is a technique to process the data to find the rules of a combination of

items .

The first stage in the calculation of Apriori algorithm to discover

association rules that write the traffic data query, wherein the processed data is the

data query traffic for 55 minutes. Followed by changing the data format .json into

csv format, in order to modify and refine the data as needed ie query data traffic,

IP address, and the number of visiting. Next create table 1 itemset to perform

calculations on the number of visits each item. Then make a combination of two

itemsets in every query and frequency of each combination is calculated in

accordance with the data in the table. After analyzing the tables on the

combination of two itemsets. The next step to create a combination of 3 itemset

accordance with the composition of the new combination. Specified minimum

support value of 0.6 on training data with confidence minimum value of 0.7 and

then the number of patterns based on the value confidencenya. Obtained a

different pattern of association of the training data with the support and

confidence values are different. From the pattern of association obtained a

(13)

x

KATA PENGANTAR

Puji dan syukur penulis panjatkan atas kehadirat Tuhan Yang Maha Esa atas berkat, rahmat serta kasih-Nya sehingga penulis dapat menyelesaikan skripsi yang berjudul

“Penerapan Data Mining Dengan Algoritma Apriori Untuk Informasi Saran Kueri Barang (Studi Kasus : Situs “Inkuiri.com”)”.

Penulisan skripsi ini bertujuan untuk memenuhi syarat untuk memperoleh

gelar sarjana komputer program studi S1 jurusan Teknik Informatika Universitas

Sanata Dharma. Penulis menyadari bahwa skripsi ini masih jauh dari kata

sempurna, oleh sebab itu penulis mengharapkan kritik dan saran yang bersifat

membangun dari semua pihak demi kesempurnaan skripsi ini.

Skripsi ini tidak lepas dari peran penting berbagai pihak, sehingga pada

kesempatan ini penulis dengan segala kerendahan hati serta rasa hormat

mengucapkan terimakasih yang sebesar-besarnya kepada semua pihak yang telah

memberikan dukungan baik secara langsung maupun tidak langsung kepada

penulis dalam penyusunan skripsi ini hingga selesai. Pada proses penulisan tugas

akhir ini saya ucapkan terima kasih kepada:

1. Allah SWT selaku pembimbing iman dalam hidup yang selalu

memberi solusi diatas segala solusi.

2. Ibu Sri Hartati Wijono, S.Si., M.Kom. selaku pembimbing yang

memberikan pengarahan serta solusi dalam pengerjaan skripsi ini

hingga selesai.

3. Kedua Orang tua, Bapak An Haryanto dan Ibu Endarti yang selalu

memberikan dukungan, rela berkorban, mendoakan, menyayangi dan

(14)

xi

4. Pristian Putik Alwena yang selalu setia menemani, mendukung,

membantu dan memarahi ketika penulis mengalami kemalasan dalam

mengerjakan tugas akhir

5. Romo Poldo Andreas Situmorang dan Audris Evan Utomo yang

senantiasa tulus meluangkan waktunya untuk konsultasi mengenai

penelitian ini.

6. Seluruh civitas akademika Teknik Informatika angkatan 2011,

terutama anggota C++ yang telah berjuang bersama dan saling

memberi semangat dan inspirasi.

7. Semua pihak, baik langsung maupun tidak langsung yang telah

membantu dalam proses penyelesaian skripsi.

Penulis menyadari masih banyak kekurangan dalam penyusunan skripsi

ini, namun penulis tetap berharap skripsi ini bermanfaat bagi pengembangan ilmu

pengetahuan.

Yogyakarta, 17 Mei 2016

Penulis

(15)

xii

DAFTAR ISI

HALAMAN JUDUL...i

HALAMAN JUDUL...ii

HALAMAN PERSETUJUAN ... iii

HALAMAN PENGESAHAN ... iv

HALAMAN PERSEMBAHAN ... v

PERNYATAAN KEASLIAN KARYA ... vi

LEMBAR PERNYATAAN PERSETUJUAN ... vii

KATA PENGANTAR ... x

DAFTAR ISI ... xii

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 3

1.3 Tujuan Penelitian ... 3

1.4 Manfaat Penelitian ... 3

1.5 Batasan Masalah ... 4

1.6 Metodologi Penelitian ... 4

1.7 Sistematika Penulisan ... 5

BAB 2 LANDASAN TEORI ... 7

2.1 Data Mining ... 7

2.2 Jenis-jenis Data Mining Menurut Fungsinya ... 9

2.3 Algoritma Apriori ... 9

2.4 Lift Ratio ... 12

BAB 3 PERANCANGAN PERHITUNGAN ... 13

3.1 Analisis Masalah ... 13

3.2 Gambaran Umum Perhitungan ... 13

3.3 Blok Diagram ... 15

3.4 Penerapan Algoritma Apriori ... 16

3.4.1 Preproses ... 16

3.4.2 Membuat Penyaring kata ... 19

(16)

xiii

3.4.4 Menghitung Kandidat 1 itemset ... 22

3.4.5 Menghitung Kandidat 2 Itemset... 22

3.4.6 Menghitung Kandidat 3 Itemset... 24

3.5 Analisis Pengujian ... 25

BAB 4 IMPLEMENTASI PERHITUNGAN ... 26

4.1 Implementasi Percobaan Data Kueri Barang ... 26

4.1.1 Implementasi Percobaan Data Training dengan Minimum Support 0,6 ... 26

4.1.1.1 Membuat Representasi Biner ... 27

4.1.1.2 Menghitung Kandidat 1 Itemset... 29

4.1.1.3 Menghitung Kandidat 2 Itemset... 29

4.1.1.4 Menghitung Kandidat 3 Itemset... 31

4.1.1.5 Hasil Pola Asosiasi ... 33

4.1.2 Hasil Perhitungan Lift Ratio ... 34

4.1.3 Proses Pencocokan Pola ... 34

4.1.3.1 Pola Asosiasi ... 34

4.1.3.2 Data testing ... 34

4.1.3.3 Pengecekan Pola Asosiasi ... 35

4.1.3.4 Perhitungan Jumlah Kecocokan Pola ... 36

BAB 5 ANALISIS HASIL DAN PEMBAHASAN ... 38

5.1 Hasil Percobaan ... 38

5.2 Hasil Pengujian ... 39

5.3 Hasil Validitas Lift Ratio ... 41

BAB 6 KESIMPULAN DAN SARAN ... 43

6.1 Kesimpulan ... 43

6.2 Saran ... 44

Daftar Pustaka ... 45

LAMPIRAN 1 ... 46

LAMPIRAN 2 ... 63

(17)

xiv

DAFTAR GAMBAR

(18)

xv

DAFTAR TABEL

Tabel 3.1 Data Kueri Barang ... 18

Tabel 3.2 Penyaring Kata ... 19

Tabel 3.3 Pencocokan Data Kueri Barang ... 19

Tabel 3.4 Hasil Data dengan Kamus Kata ... 20

Tabel 3.5 Membuat Representasi Biner ... 21

Tabel 3.6 Kandidat 1 itemset ... 22

Tabel 3.7 Kandidat 2 itemset ... 23

Tabel 3.8 Kandidat 3 itemset ... 24

Tabel 3.9 Hasil Pola Asosiasi ... 24

Tabel 3.10 Rule ... 25

Tabel 4.1 Data Asli Kueri Barang... 27

Tabel 4.3 Menghitung Kandidat 1 itemset ... 29

Tabel 4.4.1 Menyeleksi Kandidat 2 itemset ... 30

Tabel 4.4.2 Menghitung Kandidat 2 itemset ... 30

Tabel 4.5 Menghitung Kandidat 3 itemset ... 32

Tabel 4.6 Hasil Pola Asosiasi ... 33

(19)

1

BAB 1

PENDAHULUAN

1.1Latar Belakang

Seiring dengan perkembangan zaman dan meningkatnya kemajuan

dibidang teknologi, internet mungkin sudah tidak asing lagi bagi sebagian besar

orang di dunia. Sekarang internet sudah dapat diakses dimanapun tempat dan

dengan siapa saja penggunanya. Dengan adanya akses internet yang mudah,

sekarang istilah jual-beli online melalui situs pencarian sudah menjadi cara baru

menjual atau membeli barang seperti olx, berniaga, bukalapak, dan forum kaskus.

Hal ini membantu bagi user yang ingin menjual atau membeli barang tanpa harus

membuang buang waktu untuk melakukan pencarian dan menawarkan barang

yang ingin dibeli atau dijual.

Dari banyaknya situs jual beli online di internet, situs “Inkuiri.com”

memiliki sistem yang berbeda yaitu mencari barang dengan menggunakan kueri

atau kata kunci barang, kemudian akan dicari di semua situs jual beli online yang

ada di situs “Inkuiri.com” seperti olx, berniaga, bukalapak dan lain sebagainya. Tujuan situs “Inkuiri.com” ini dibuat untuk memudahkan user mencari barang

pada satu situs pencarian namun mendapat informasi dari berbagai situs jual beli

online. Setelah kata kunci dimasukkan maka akan muncul barang dari berbagai

situs jual beli online berdasarkan kata kunci yang dimasukkan, kemudian dari

barang yang dipilih maka akan diteruskan oleh situs “Inkuiri.com” kepada situs

jual beli online yang mencantumkan iklan tersebut.

Situs “Inkuiri.com” masih banyak memerlukan perbaikan atau

(20)

2

mampu menghasilkan informasi untuk sistem saran dari kueri yang dimasukkan

oleh user. Di dalam situs tersebut terdapat data clickstream yang sangat beragam.

Data clickstream yang dimaksud yaitu id pengguna, ip address, jumlah

mengunjungi, kota, kueri, waktu berkunjung, jumlah berkunjung, tipe perangkat

yang digunakan, negara, lokasi, operating system yang digunakan, dan lain

sebagainya.

Salah satu cara untuk membantu situs “Inkuiri.com” yaitu dengan

pemanfaatan data jumlah berkunjung, id pengguna, dan kueri pada situs “Inkuiri.com”(data mining). Pada dasarnya data mining berhubungan dengan

analisa data dan penggunaan teknik-teknik perangkat lunak untuk mencari pola

dan keteraturan dalam himpunan data yang sifatnya tersembunyi. Data mining

adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan,

dan machine learning untuk mengekstrasi dan mengidentifikasi informasi yang

bermanfaat dan pengetahuan yang terkait dari berbagai database besar[1]. Data

mining dapat membantu situs “Inkuiri.com” untuk menganalisa pola dari data

jumlah berkunjung, id pengguna, dan kueri yang tersimpan dalam basis data situs “Inkuiri.com” dan mengolah isi dari data tersebut menjadi sebuah pengetahuan

yang baru (knowledge) mengenai pola asosiasi kueri barang sebagai sistem saran

dari kueri yang dimasukkan oleh user. Hal ini merupakan pengetahuan yang

bermanfaat bagi situs ”Inkuiri.com” dalam membantu memberikan saran dari

kueri barang yang dimasukkan oleh user di situs “Inkuiri.com”.

Pada tugas akhir ini akan dilakukan penelitian menggunakan teknik

association rules. Association rules memiliki bentuk LHS RHS dengan

(21)

3

item dalam RHS (right Hand Side) juga dibeli. Salah satu penggunaan association

rule adalah mendukung pengambilan keputusan dalam bidang pemasaran,

misalnya untuk mengetahui pola pembelian pelanggan, penentuan tata letak

barang dan lain-lain.

Algoritma yang digunakan yaitu algoritma apriori adalah salah satu

algoritma yang melakukan pencarian frequent itemset dengan menggunakan

teknik association rule. Algoritma apriori menggunakan pengetahuan frekuensi

atribut yang telah diketahui sebelumnya untuk memproses informasi selanjutnya.

Pada algoritma Apriori untuk menentukan kandidat yang mungkin muncul

dengan cara memperhatikan minimum support dan minimum confidence.

1.2Rumusan Masalah

Berdasar latar belakang tersebut maka dapat dirumuskan masalah sebagai berikut:

 Bagaimana menggunakan algoritma apriori untuk mengolah data

clickstream yang ada di situs”Inkuiri.com”?

1.3Tujuan Penelitian

Untuk mengolah data clickstream dari situs “Inkuiri.com” menggunakan

algoritma apriori.

(22)

4

 Sebagai penawaran barang yang berkaitan dengan kueri yang dimasukkan

user pertama kali

 Sebagai perhitungan yang membantu situs “Inkuiri.com” menawarkan

barang yang dijual dari beberapa market place

1.5Batasan Masalah

Adapun batasan masalahnya yaitu:

a. Data yang diolah hanya sampai data user memasukkan kueri pencarian

barang, tidak sampai ke data pembelian.

b. Hanya memakai data clickstream yang dimasukkan atau jumlah user

berkunjung lebih dari satu saja.

c. Data dibatasi dengan maksimal 1000 data.

d. Belum mampu mengolah data yang sangat besar.

1.6Metodologi Penelitian

Metode Penelitian yang akan dipakai dalam penelitian ini yaitu :

1. Studi Pustaka : yaitu dengan mencari-cari referensi yang

mendukung dengan judul penelitian untuk memahami penerapan

data mining untuk keperluan bisnis.

2. Studi lapangan : yaitu dengan datang langsung ke Perusahaan “Guna Bangsa” untuk mendapatkan data transaksi kueri, sebagai

(23)

5

adalah data Perusahaan Guna Bangsa yaitu data clickstream yang

yang direkam selama 55 menit dan disimpan.

3. Proses Data Mining menggunakan algoritma apriori.

1.7Sistematika Penulisan

Untuk memberikan gambaran dan kerangka yang jelas pada gambaran tiap

bab dalam penelitian ini. Maka diperlukan sistematika penulisan. Berikut ini

gambaran sistematika penulisan dalam masing-masing bab :

BAB I Pendahuluan

Bab ini berisi tentang latar belakang, rumusan masalah, tujuan penelitian,

manfaat penelitian, batasan masalah, dan sistematika penulisan.

BAB II Landasan Teori

Bab ini menjelaskan tentang landasan teori yang berhubungan dengan

topik yang akan dibahas.

BAB III Perancangan Perhitungan

Bab ini berisi tentang analisis perhitungan, gambaran umum perhitungan,

diagram use case, konteks diagram, blok diagram, data pengujian, dan

kerangka yang dipikirkan.

BAB IV Implementasi Perhitungan

Bab ini berisi tentang implementasi perhitungan dari apa yang telah

disusun atau dirancang pada bab sebelumnya.

(24)

6

Bab ini menjelaskan tentang analisa dan hasil dari implementasi

perhitungan manual yaitu hasil dari perhitungan manual.

BAB VI Kesimpulan dan Saran

Bab ini berisi tentang kesimpulan dari hasil akhir pola asosiasi dan saran

(25)

7

BAB 2

LANDASAN TEORI

2.1Data Mining

Data mining adalah proses menganalisa data dari perspektif yang berbeda

dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai

untuk meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan

keduanya. Secara teknis, data mining dapat disebut sebagai proses untuk

menemukan korelasi atau pola dari ratusan atau ribuan field dari sebuah relasional

database yang besar. [2] Kemampuan Data mining untuk mencari informasi

bisnis yang berharga dari basis data yang sangat besar, dapat dianalogikan dengan

penambangan logam mulia dari lahan sumbernya, teknologi ini dipakai untuk [2] :

1. Prediksi trend dan sifat-sifat bisnis, dimana data mining mengotomatisasi

proses pencarian informasi di dalam basis data yang besar.

2. Penemuan pola-pola yang tidak diketahui sebelumnya, dimana data mining “menyapu” basis data, kemudian mengidentifikasi pola-pola yang sebelumnya

tersembunyi dalam satu sapuan.

(26)

8

Gambar 2.1 Tahap penemuan Knowledge Data Discovery (KDD)

Gambar 2.1 menggambarkan proses KDD dalam menghasilkan knowledge dan terdiri dari beberapa tahap [3]:

a) Data Cleaning

Untuk menghapus data yang tidak dipakai dan data yang tidak konsisten.

b) Data Integration

Berbagai sumber data dapat digabungkan. c) Data Selection

Data yang bersangkutan pada tugas analisis diseleksi dan diambil kembali. dari database.

d) Data Transformation

(27)

9 e) Data Mining

Sebuah proses penting di mana metode intelijen diterapkan dengan tujuan untuk mengolah pola-pola data.

f) Pattern Evaluation

Untuk mengidentifikasi pola-pola menarik yang

menjelaskan mengenai ukuran dasar pengetahuan yang ada. g) Knowledge Presentation

Visualisasi dan teknik representasi knowledge digunakan untuk menyajikan knowledge yang telah diolah untuk pengguna.

2.2Jenis-jenis Data Mining Menurut Fungsinya

Data mining dibagi menjadi beberapa jenis menurut dari fungsinya, yaitu: [4]

a.Konsep atau kelas description

b.Association Analysis

c.Klasifikasi dan Prediksi

d. Cluster Analysis

e.Outlier Analysis

f.Evaluation Analysis.

2.3Algoritma Apriori

Algoritma Apriori adalah salah satu algoritma yang melakukan pencarian

frequent itemset dengan menggunakan teknik association rule [5]. Algoritma

Apriori menggunakan pengetahuan frekuensi atribut yang telah diketahui

sebelumnya untuk memproses informasi selanjutnya. Pada algoritma Apriori

menentukan kandidat yang mungkin muncul dengan cara memperhatikan

(28)

10

a. Minimum support: parameter yang digunakan sebagai batasan frekuensi

kejadian atau support count yang harus dipenuhi suatu kelompok data

untuk dapat dijadikan aturan. Dimana nilai minimum support count

diperoleh dari [6]:

jumlah item barang dari seluruh transaksi x 100%

jumlah total transaksi

b. Minimum confidence: parameter yang mendefinisikan minimum level dari

confidence yang harus dipenuhi oleh aturan yang berkualitas.

Support adalah nilai pengunjung atau persentase kombinasi sebuah item

dalam database. Rumus support adalah sebagai berikut :

Support (A) =

Support (A,B) = P(A∩B)

Support (A,B) = x 100 %

Sedangkan confidence adalah nilai kepercayaan yaitu kuatnya hubungan antar

item dalam sebuah Apriori. Confidence dapat dicari setelah pola frekuensi

munculnya sebuah item ditemukan. Berikut rumus confidence :

Confidence = P(B|A) = x 100 % ∑ Transaksi Mengandung A dan B

jumlah Transaksi Mengandung A

Total Transaksi

∑ Transaksi Mengandung A dan B

∑ Total Transaksi

(29)

11

secara garis besar cara kerja algoritma apriori adalah:

1. Pembentukan kandidat itemset, kandidat k-itemset dibentuk dari

kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu ciri dari

algoritma apriori adalah adanya pemangkasan kandidat k-itemset yang subset-nya

yang berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang

k-1.

2. Penghitungan support dari tiap kandidat k-itemset. Support dari tiap

kandidat k-itemset didapat dengan men-scan database untuk menghitung jumlah

transaksi yang memuat semua item di dalam kandidat k-itemset tsb. Ini adalah

juga ciri dari algoritma Apriori dimana diperlukan penghitungan dengan scan

seluruh database sebanyak k-itemset terpanjang.

3. Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k

item atau k-itemset ditetapkan dari kandidat k-itemset yang support-nya lebih

besar dari minimum support.

4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses

dihentikan. Bila tidak, maka k ditambah satu dan kembali ke bagian 1.

a. Kelebihan dari algoritma apriori ini adalah lebih sederhana dan

dapat menangani data yang besar. Sedangkan algoritma lainnya memiliki

kelemahan dalam penggunaan memori saat jumlah data besar, tentunya

berpengaruh terhadap banyaknya item yang diproses serta mudah di

(30)

12

b. Apriori memiliki kelemahan karena harus melakukan scan

database setiap kali iterasi, sehingga waktu yang diperlukan bertambah

dengan makin banyak iterasi.

2.4Lift Ratio

Lift Ratio adalah parameter penting selain support dan confidence dalam

association rule. Lift Ratio mengukur seberapa penting rule yang telah terbentuk

berdasarkan nilai support dan confidence, Lift Ratio merupakan nilai yang

menunjukkan kevalidan proses transaksi dan memberikan informasi apakah benar

produk A dibeli bersamaan dengan produk B.

Lift Ratio dapat dihitung dengan rumus [3]:

Lift Ratio =

Sebuah transaksi dikatakan valid jika mempunyai nilai lift lebih dari 1, yang berarti bahwa dalam transaksi tersebut, produk A dan B benar – benar dibeli

secara bersamaan.

(31)

13

BAB 3

PERANCANGAN PERHITUNGAN

3.1Analisis Masalah

Situs “Inkuiri.com” merupakan situs pencarian barang yang dijual dari

beberapa market place. Dalam fungsi utamanya yaitu mencari barang yang dijual dari beberapa market place situs “Inkuiri.com” masih memiliki banyak

kekurangan dalam memberikan pelayanan. Salah satunya adalah memberikan

saran barang yang dijual terhadap user setelah melakukan kueri barang. Dilihat

dari sisi pengguna yang sudah modern saat ini, yang menginginkan kemudahan

dalam melakukan proses pencarian terhadap penawaran yang ada, hal ini

membuka kesempatan untuk membuat perhitungan baru untuk memberi

penawaran berupa saran barang yang dicari. Dan saran tersebut haruslah ada

keterkaitan dengan kueri yang dimasukkan pertama kali ketika user melakukan

kueri barang.

3.2Gambaran Umum Perhitungan

Gambaran umum perhitungan yang akan dibuat yaitu perhitungan dapat

memberikan saran informasi barang yang sedang dijual dengan memasukkan

kueri barang yang dicari, perhitungan dapat menghitung data mining dari data

kueri yang sudah dimasukkan user dengan tujuan utama perhitungan yaitu

menentukan pola asosiasi data barang dijual yang dicari, melihat hasil perhitungan

(32)

14

pola barang yang dicari user sehingga dimaksudkan dapat memberi saran barang

lain yang berhubungan dengan kueri yang dimasukkan pertama kali. Adapun yang

terlibat dalam perhitungan ini yaitu penguji perhitungan. Penguji dapat

menggunakan data kueri pencarian, melakukan perhitungan pola asosiasi kueri

barang yang dicari dengan metode data mining, dan melihat hasil pola asosiasi

(33)

15 3.3Blok Diagram

Blok diagram merupakan langkah perhitungan manual dengan algoritma

apriori dapat dilihat pada gambar 3.1. dimana untuk selanjutnya akan diterapkan

[image:33.595.86.557.197.680.2]

pada penerapan perhitungan algoritma apriori pada bab 3.6

Gambar 3.1 Blok Diagram Menghitung kandidat 3 itemset,

menentukan nilai minimum confidence, dan rule (Tabel 3.8,3.9, & 3.10)

Analisis Pengujian

(sub bab 3.8) Selesai Preproses

Data Clickstream

(Tabel 3.2)

Menentukan nilai minimum dan menghitung kandidat 2

itemset (Tabel 3.7) Menghitung

kandidat 1 itemset (Tabel 3.6) Mulai

Membuat Representasi Biner

(Tabel 3.5)

Penyaringan Kata

(Tabel 3.3, 3.4) Proses Penemuan

Knowledge

(34)

16 3.4Penerapan Algoritma Apriori

Berikut merupakan penerapan algoritma apriori untuk pencarian Association

Rules dengan 20 data clickstream situs “Inkuiri.com” dengan ketentuan nilai

untuk nilai minimum support 16% dan nilai minimum confidence adalah 70%. [7]

3.4.1 Preproses

Pada tahap ini merupakan tahap awal dengan menyiapkan data

clickstream, dimana data clickstream yang dimaksud yaitu visitor dan query yang

diinputkan.

Data awal yang akan diproses yaitu file data bertipe (*.json) yang

kemudian di convert menggunakan aplikasi online http://konklone.io/json/ untuk

diubah menjadi file data bertipe (*.csv). Data yang telah diubah menjadi format

[image:34.595.88.518.202.695.2]

csv dapat dilihat pada gambar 3.2.

(35)

17

Kemudian dari data yang sudah diconvert menjadi .csv tersebut hanya

[image:35.595.82.522.127.666.2]

diambil source ip dan source query seperti pada gambar 3.3

Gambar 3.3 Seleksi Data

Setelah itu dilakukan perhitungan data dengan rumus seperti pada gambar

3.4

Gambar 3.4 Perhitungan Data

Dari data setelah dihitung tersebut dihasilkan data kunjungan keri yang

(36)
[image:36.595.88.520.83.750.2]

18

Gambar 3.5 Contoh Data Yang Akan Digunakan

Dibawah ini terdapat data clickstream dalam waktu 30 menit dalam satu

hari dan diambil 20 data, dimana pada setiap data clickstream terdapat berbagai

jenis kueri. Lihat tabel 3.1.

(37)

19 3.4.2 Membuat Penyaring kata

Pada tahap ini yaitu dilanjutkan dengan membuat kamus kata, kamus kata

disini yaitu berfungsi untuk menyaring kata. Berikut merupakan contoh

penggunaan penyaring kata.

Kamus penyaring kata menggunakan database kata yang sudah dibuat dan

[image:37.595.86.509.222.761.2]

disimpan ke dalam tabel seperti pada tabel 3.2.

Tabel 3.2 Penyaring Kata

No Kueri yang disimpan untuk penyaring

1 sepatu

2 batu

3 persia

4 reptile

5 keramik

6 gitar

7 keris

8 tombak

9 lensa

10 rak

Dari data kamus penyaring kata yang sudah dibuat, kemudian dicocokan

satu persatu dengan data kueri barang yang diinputkan. Dapat dilihat pada tabel

3.3

Tabel 3.3 Pencocokan Data Kueri Barang

No Data Kueri barang

1 sepatu,batu,persia

2 tombak,keris

3 keris,batu,persia,keramik,kembang

4 batu,reptile,keris

5 motor,dinamo,keramik,sepatu

6 dinamo,lampu

7 persia,kembang,sisha,sepatu

8 reptile,keris,keramik

9 kembang,gitar,persia

10 sisha,motor,keramik

11 keramik,batu,sepatu,persia,kembang

(38)

20

13 gitar,lensa,tombak

14 rak,gitar,sepatu,kembang

15 lensa,sepatu,keris

16 sepatu,persia,motor

17 tombak,keris,kembang

18 dinamo,motor,lampu

19 gitar,keramik

20 tombak,dinamo,batu

Jika data kueri sama dengan data kamus penyaring kata maka akan

ditampilkan kembali ke dalam tabel data kueri dan jika data kueri tidak ada di

kamus penyaring kata maka data kueri tersebut akan dihapus dan tidak

[image:38.595.92.511.96.700.2]

ditampilkan kembali ke dalam tabel data kueri, hasil dapat dilihat pada tabel 3.4.

Tabel 3.4 Hasil Data dengan Kamus Kata

No Data Kueri

1 2

3 kembang

4

5 motor,dinamo

6 dinamo,lampu

7 kembang,sisha

8

9 kembang

10 sisha,motor

11 kembang

12 lampu,motor,kembang

13

14 kembang

15

16 motor

17 kembang

18 dinamo,motor,lampu

19

(39)

21 3.4.3 Membuat Representasi Biner

Tahap ini yaitu membuat tabel untuk melakukan perhitungan jumlah

pengunjung pada masing-masing kueri dengan memisahkan masing-masing kueri

barang dimana setiap kueri dipisahkan dengan kolom dan menghitung jumlah

kueri pada setiap kunjungan, apabila pada setiap kunjungan terdapat 1 kueri yang

di masukkan maka dihitung 1 dan jika pada setiap kunjungan tidak ada kueri yang

[image:39.595.68.547.245.630.2]

dimasukkan maka dihitung 0. Perhitungan seperti pada tabel 3.5.

(40)

22 3.4.4 Menghitung Kandidat 1 itemset

Kemudian dari perhitungan yang diperoleh pada tabel 3.5 selanjutnya dilakukan

[image:40.595.85.571.192.662.2]

tahap untuk menghitung kandidat 1 itemset

Tabel 3.6 Kandidat 1 itemset

Menentukan nilai minimum support (). Ditetapkan bahwa nilai minimum

support (�) = 16%, maka semua itemset yang frekuensi kemunculannya sama

dengan atau lebih dari 16% disebut frequent. Dilihat dari tabel 3.6, dari jumlah

perhitungan kandidat 1 itemset yang didapat tidak semua dapat memenuhi karena

jumlah semua itemset frekuensi kemunculannya atau jumlah kunjungan kuerinya

tidak semua lebih dari 16%. Maka untuk kombinasi 1 itemset yang memenuhi

support minimal adalah pada bagian kanan dengan semua warna kuning.

3.4.5 Menghitung Kandidat 2 Itemset

Kemudian dilanjutkan dengan perhitungan kandidat 2 itemset. Pada tahap

ini pada setiap kueri dan frekuensi masing-masing kombinasi dihitung sesuai

dengan data pada tabel. Perhitungan masih sama dengan kandidat 1 itemset yaitu

(41)

23

pada Tabel 3.2. apabila dalam satu kunjungan terdapat 2 kombinasi itemset kueri

yang dimasukkan maka dihitung 1 dan apabila dalam satu kunjungan tidak

terdapat 2 kombinasi itemset kueri yang dmasukkan maka dihitung 0. Perhitungan

[image:41.595.82.558.201.699.2]

seperti pada tabel 3.7.

(42)

24

Dari hasil kombinasi 2 itemset tersebut terdapat bagian berwarna kuning

merupakan kombinasi yang memenuhi dari nilai minimum support yang telah

ditentukan yaitu 16%, jadi yang frekuensi kemunculannya atau jumlah transaksi

dari kombinasi 2 itemset tersebut yang jumlahnya lebih dari atau sama dengan

16% adalah yang dipakai untuk digabungkan menjadi calon 3 itemset.

3.4.6 Menghitung Kandidat 3 Itemset

Perhitungan masih sama dengan kandidat 1 itemset dan 2 itemset yaitu

dari kombinasi 3 itemset barang dihitung jumlahnya sesuai dengan data kueri

barang tabel 3.2. apabila dalam satu transaksi terdapat 3 kombinasi itemset yang

dicari maka dihitung 1 dan apabila dalam satu transaksi tidak terdapat 3

kombinasi itemset yang dicari maka dihitung 0. Perhitungan seperti pada tabel

[image:42.595.75.547.206.736.2]

3.8.

Tabel 3.8 Kandidat 3 itemset

Dibawah ini merupakan hasil asosiasi yang didapat dengan nilai minimal

confidence yang ditentukan adalah 70%. Lihat tabel 3.9.

(43)

25

Dari perhitungan tabel 3.9 hasil asosiasi diatas dengan dengan nilai

minimal confidence yang ditentukan adalah 70% maka rule yang didapat pada 20

data kueri barang tersebut adalah bagian yang berwarna kuning karena

[image:43.595.81.554.208.644.2]

menunjukan nilai confidencenya lebih dari 70% seperti tabel 3.10 dibawah ini.

Tabel 3.10 Rule

3.5 Analisis Pengujian

Data training yang direcord selama 55 menit kemudian diuji coba dengan

data testing yang direcord selama 185 menit, untuk membuktikan bahwa hasil

rule dari pola asosiasi kueri barang yang telah diproses dengan minimum support

0,6 dan minimum confidence 0,7 mendapatkan hasil pola kueri yang sama dengan

(44)

26

BAB 4

IMPLEMENTASI PERHITUNGAN

Setelah melakukan tahap analisis dan perancangan perhitungan, maka

tahap selanjutnya adalah mengimplementasikan hasil perancangan tersebut ke

dalam sebuah perhitungan manual untuk menentukan pola kueri asosiasi antar

kueri barang. Perhitungan manual dapat menghitung data transaksi barang dari

file spreadsheet yang selanjutnya diolah ke dalam perhitungan yang dapat

melakukan proses data mining dari data kueri barang dengan menentukan nilai

min support, min confidence, jumlah pola dan pilihan sorting yang akan

ditampilkan dimana terdapat dua pilihan yaitu berdasarkan nilai support dan

confidence namun sebelumnya data yang berbentuk teks diubah terlebih dahulu ke

dalam data biner setelah itu data baru akan diproses. Kemudian akan terbentuk

hasil pola kunjungan kueri antar kueri barang yang tersimpan juga dalam bentuk

file data pencarian berupa teks.

4.1Implementasi Percobaan Data Kueri Barang

Pada implementasi data kueri barang situs “Inkuiri.com” dengan

menggunakan data kueri barang selama 55 menit yang telah diproses secara

manual untuk memperoleh data kueri yang dapat dilihat pada lampiran 1.

4.1.1 Implementasi Percobaan Data Training dengan Minimum Support 0,6

Implementasi percobaan data training ditentukan nilai minimum support

0,6, untuk nilai minimum confidence yang ditentukan 0,7 karena berdasarkan

(45)

27

dan dari percobaan tersebut dapat dilihat bahwa hasil yang signifikan terdapat

pada minimum support antara 0,1 sampai dengan 2. Berikut merupakan

langkah mencari hasil pola asosiasi dengan min support 0,6. Data clickstream

[image:45.595.82.509.206.605.2]

yang sudah di proses menjadi data training dapat dilihat pada tabel 4.1.

Tabel 4.1 Data Asli Kueri Barang

4.1.1.1 Membuat Representasi Biner

Kemudian membuat tabel untuk melakukan perhitungan jumlah

pengunjung pada masing-masing kueri dengan memisahkan masing-masing kueri

barang dimana setiap kueri dipisahkan dengan kolom dan menghitung jumlah

kueri pada setiap kunjungan, apabila pada setiap kunjungan terdapat 1 kueri yang

di masukkan maka dihitung 1 dan jika pada setiap kunjungan tidak ada kueri yang

(46)
[image:46.595.91.506.81.637.2]

28

(47)

29 4.1.1.2 Menghitung Kandidat 1 Itemset

Kemudian dari perhitungan yang diperoleh pada tabel 4.2 selanjutnya dilakukan

[image:47.595.86.513.188.640.2]

tahap seleksi untuk menghitung kandidat 1 itemset. Dapat dilihat pada tabel 4.3.

Tabel 4.3 Menghitung Kandidat 1 itemset

4.1.1.3 Menghitung Kandidat 2 Itemset

Menentukan nilai minimum support (). Ditetapkan bahwa nilai minimum

support (�) = 0,6. Dari jumlah perhitungan kandidat 1 itemset yang didapat tidak

semua dapat memenuhi karena jumlah semua itemset frekuensi kemunculannya

atau jumlah kunjungan kuerinya tidak semua lebih dari 0,6. Dapat dilihat pada

tabel 4.4.1

Kemudian dilanjutkan dengan perhitungan kandidat 2 itemset. Pada tahap

ini pada setiap kueri dan frekuensi masing-masing kombinasi dihitung sesuai

(48)
[image:48.595.81.528.71.786.2]

30

Tabel 4.4.1 Menyeleksi Kandidat 2 itemset

(49)

31 4.1.1.4 Menghitung Kandidat 3 Itemset

Dari hasil kombinasi 2 itemset tersebut terdapat beberapa kombinasi yang

memenuhi dari nilai minimum support yang telah ditentukan yaitu 0,6 jadi yang

frekuensi kemunculannya atau jumlah transaksi dari kombinasi 2 itemset tersebut

yang jumlahnya lebih dari atau sama dengan 0,6 adalah yang dipakai untuk

(50)

32

Kemudian dilanjutkan dengan perhitungan kandidat 3 itemset. Pada tahap

ini pada setiap kueri dan frekuensi masing-masing kombinasi dihitung sesuai

[image:50.595.88.518.193.759.2]

dengan data pada tabel. Perhitungan seperti pada tabel 4.5.

(51)

33 4.1.1.5Hasil Pola Asosiasi

Dibawah ini merupakan hasil asosiasi yang didapat dengan nilai minimal

[image:51.595.83.507.189.728.2]

confidence yang ditentukan adalah 70%. Lihat tabel 4.6.

Tabel 4.6 Hasil Pola Asosiasi

Pola Asosiasi Support Confidence

Jika mencari kucing bengal,maka dinamo auldey akan dicari

5 0.735294

Jika mencari kucing bengal,maka kaos yonex akan dicari

5 0.735294

Jika mencari shock depan rx king,maka batu bongkahan akan dicari

6 0.882353

Jika mencari kain goretex,maka pintu bekas kusen kayu akan dicari

6 0.882353

Jika mencari kain goretex,maka baby jogger akan dicari

6 0.882353

Jika mencari kain goretex,maka tempat keramas salon akan dicari

5 0.735294

Jika mencari kain goretex,maka batu bongkahan akan dicari

8 1.176471

Jika mencari kain goretex,maka pintu bekas akan dicari

6 0.882353

Jika mencari kain goretex,maka kaos yonex akan dicari

9 1.323529

Jika mencari pintu bekas kusen kayu,maka batu bongkahan akan dicari

7 1.029412

Jika mencari baby jogger,maka tempat keramas salon akan dicari

7 1.029412

Jika mencari baby jogger,maka batu bongkahan akan dicari

10 1.470588

Jika mencari baby jogger,maka kaos yonex akan dicari

7 1.029412

Jika mencari tempat keramas salon,maka batu bongkahan akan dicari

7 1.029412

Jika mencari batu bongkahan,maka pintu bekas akan dicari

5 0.735294

Jika mencari kucing,maka pintu bekas akan dicari

6 0.882353

Jika mencari kucing,maka kaos yonex akan dicari

(52)

34 4.1.2 Hasil Perhitungan Lift Ratio

Dari hasil pola asosiasi yang didapat , kemudian dihitung menggunakan Lift Ratio

untuk membuktikan kevalidan rule yang terbentuk. Dapat dikatakan valid jika

mempunyai nilai lift lebih dari 1, yang berarti bahwa dalam data kunjungan tersebut, kueri A dan B benar – benar dicari secara bersamaan. Berikut merupakan

[image:52.595.86.551.226.615.2]

perhitungan dengan rumus lift ratio. Dapat dilihat pada tabel 4.7.

Tabel 4.7 Hasil Lift Ratio

4.1.3 Proses Pencocokan Pola

4.1.3.1 Pola Asosiasi

Pola Asosiasi kueri barang yang diperoleh dari proses yang dilakukan

pada perhitungan manual dengan data training dan min support yang

ditentukan 0,6. dapat dilihat pada tabel 5.1 Hasil Pola Asosiasi.

4.1.3.2 Data testing

(53)

35 4.1.3.3 Pengecekan Pola Asosiasi

Dari adanya pola asosiasi yang sudah terbentuk dari percobaan data

training 1 kemudian dicocokan kesamaan dengan data testing yang telah

dilampirkan pada lampiran 3 dengan dicari satu persatu pada data testing:

a) Pengecekan kesamaan pola dilakukan dengan menyalin pola asosiasi

satu per satu, kemudian dicari menggunakan fungsi ctrl+f pada data

[image:53.595.86.535.234.630.2]

testing. Dapat dilihat pada gambar 4.1.

Gambar 4.1 Pengecekan Pola Asosiasi

b) Pengecekan kunjungan mengandung rule dilakukan dengan menyalin

kueri satu per satu yang terdapat pada pola asosiasi, kemudian dicari

menggunakan fungsi ctrl+f pada data testing. Dapat dilihat pada

(54)
[image:54.595.85.508.81.644.2]

36

Gambar 4.2 Pengecekan kunjungan mengandung rule

4.1.3.4 Perhitungan Jumlah Kecocokan Pola Setelah dicek kemudian dihitung jumlahnya :

a) Jumlah pola yang sama dengan data testing dapat dilihat pada gambar 4.3

Gambar 4.3 Jumlah Pola Yang Ditemukan

b) Data kunjungan yang mengandung pola asosiasi kueri barang dapat dilihat

pada gambar 4.4. Digunakan rumus dibawah ini untuk menghitung

(55)

37

Jumlah kesamaan pola asosiasi x 100% Jumlah data kunjungan mengandung rule

[image:55.595.82.510.114.654.2]

(56)

38

BAB 5

ANALISIS HASIL DAN PEMBAHASAN

5.1 Hasil Percobaan

Pada bab ini akan dibahas mengenai hasil dari implementasi perhitungan

pola pencarian asosiasi kueri barang, dimana dari hasil jumlah data kueri barang

diujikan langsung kepada data kueri barang yang baru untuk membuktikan bahwa

hasil rule dari pola asosiasi kueri barang yang telah diproses menggunakan

perhitungan secara manual mendapatkan hasil yang sama dengan kueri barang

baru yang dicari oleh user. Pada percobaan ini penulis melakukan ujicoba

perhitungan dengan menggunakan data kueri barang selama 55 menit yang telah

diproses secara manual untuk memperoleh data kueri. Data dapat dilihat pada

lampiran 1.

Untuk hasil pola asosiasi dari data training dapat dilihat pada tabel 5.1

dimana dari minimum support yang diuji coba didapat pola asosiasi, nilai support,

[image:56.595.86.512.235.749.2]

dan nilai confidence.

Tabel 5.1 Hasil Pola Asosiasi Support, Confidence

Pola Asosiasi Support Confidence

Jika mencari kucing bengal,maka dinamo auldey akan dicari

5 0.735294

Jika mencari kucing bengal,maka kaos yonex akan dicari

5 0.735294

Jika mencari shock depan rx king,maka batu bongkahan akan dicari

6 0.882353

Jika mencari kain goretex,maka pintu bekas kusen kayu akan dicari

6 0.882353

(57)

39 jogger akan dicari

Jika mencari kain goretex,maka tempat keramas salon akan dicari

5 0.735294

Jika mencari kain goretex,maka batu bongkahan akan dicari

8 1.176471

Jika mencari kain goretex,maka pintu bekas akan dicari

6 0.882353

Jika mencari kain goretex,maka kaos yonex akan dicari

9 1.323529

Jika mencari pintu bekas kusen kayu,maka batu bongkahan akan dicari

7 1.029412

Jika mencari baby jogger,maka tempat keramas salon akan dicari

7 1.029412

Jika mencari baby jogger,maka batu bongkahan akan dicari

10 1.470588

Jika mencari baby jogger,maka kaos yonex akan dicari

7 1.029412

Jika mencari tempat keramas salon,maka batu bongkahan akan dicari

7 1.029412

Jika mencari batu bongkahan,maka pintu bekas akan dicari

5 0.735294

Jika mencari kucing,maka pintu bekas akan dicari

6 0.882353

Jika mencari kucing,maka kaos yonex akan dicari

6 0.882353

5.2Hasil Pengujian

Kemudian dari pola yang diperoleh dari uji coba data training, penulis

mencoba mengujikan hasil dari perhitungan pola asosiasi kueri barang dengan

data baru yang direcord selama kurang lebih 185 menit. Tabel data testing

terdapat pada lampiran 3. Untuk membuktikan bahwa hasil rule dari pola asosiasi

kueri barang yang telah diproses menggunakan perhitungan manual untuk

mendapatkan hasil pola kueri yang sama dengan data yang baru sebagai saran

(58)
[image:58.595.83.508.99.716.2]

40

Tabel 5.2 Hasil Pengujian dengan Data Testing Min.

Support

Pola Asosiasi Kueri Barang Jumlah

Kecocokan Pola

Confidence

0,6 Jika mencari kucing bengal,maka dinamo

auldey akan dicari

5 0.735294

Jika mencari kucing bengal,maka kaos yonex akan dicari

5 0.735294

Jika mencari shock depan rx king,maka batu bongkahan akan dicari

6 0.882353

Jika mencari kain goretex,maka pintu bekas kusen kayu akan dicari

6 0.882353

Jika mencari kain goretex,maka baby jogger akan dicari

6 0.882353

Jika mencari kain goretex,maka tempat keramas salon akan dicari

5 0.735294

Jika mencari kain goretex,maka batu bongkahan akan dicari

8 1.176471

Jika mencari kain goretex,maka pintu bekas akan dicari

6 0.882353

Jika mencari kain goretex,maka kaos yonex akan dicari

9 1.323529

Jika mencari pintu bekas kusen kayu,maka batu bongkahan akan dicari

7 1.029412

Jika mencari baby jogger,maka tempat keramas salon akan dicari

7 1.029412

Jika mencari baby jogger,maka batu bongkahan akan dicari

10 1.470588

Jika mencari baby jogger,maka kaos yonex akan dicari

7 1.029412

Jika mencari tempat keramas salon,maka batu bongkahan akan dicari

7 1.029412

Jika mencari batu bongkahan,maka pintu bekas akan dicari

5 0.735294

Jika mencari kucing,maka pintu bekas akan dicari

6 0.882353

Jika mencari kucing,maka kaos yonex akan dicari

6 0.882353

Jumlah kecocokan pola 55 Presentase Hasil Kecocokan Pola 55/468*10

0

(59)

41

Dapat dilihat hasil pengujian dari data testing pada lampiran 3 dengan data

training diperoleh hasil sebagai berikut :

1. Dengan nilai min.support 0,6 dengan jumlah kesamaan pola asosiasinya

55 diperoleh presentase hasil kecocokan pola sebesar 11,75214%.

11,75214% disini artinya yaitu bahwa kesamaan pencarian kueri barang oleh user dengan hasil pola asosiasi kueri barang yang didapatkan dari

perhitungan manual sebesar 11,75214%.

5.3 Hasil Validitas Lift Ratio

Hasil pada percobaan data training diperoleh pola yang memenuhi syarat

lift ratio dengan hasil perhitungan lebih dari 1 adalah bagian yang berwarna

[image:59.595.88.518.172.760.2]

kuning yaitu pola nomor 2,3,4,5,7,8,9,11,12,13,14,16,17.

Tabel 5.3 Hasil Perhitungan Lift Ratio

No Pola Asosiasi Hasil

Perhitungan Lift Ratio

1 Jika mencari kucing bengal,maka dinamo auldey akan

dicari 0.391113892

2 Jika mencari kucing bengal,maka kaos yonex akan dicari 1.720901126

3 Jika mencari shock depan rx king,maka batu bongkahan

akan dicari 1.14379085

4 Jika mencari kain goretex,maka pintu bekas kusen kayu

akan dicari 1.470588235

5 Jika mencari kain goretex,maka baby jogger akan dicari 1.176470588

6 Jika mencari kain goretex,maka tempat keramas salon

akan dicari 0.971314452

7 Jika mencari kain goretex,maka batu bongkahan akan

dicari 1.525054466

8 Jika mencari kain goretex,maka pintu bekas akan dicari 1.492374728

9 Jika mencari kain goretex,maka kaos yonex akan dicari 1.797385621

(60)

42 bongkahan akan dicari

11 Jika mencari baby jogger,maka tempat keramas salon

akan dicari 1.019880174

12 Jika mencari baby jogger,maka batu bongkahan akan

dicari 1.429738562

13 Jika mencari baby jogger,maka kaos yonex akan dicari 1.048474946

14 Jika mencari tempat keramas salon,maka batu bongkahan

akan dicari 1.010170423

15 Jika mencari batu bongkahan,maka pintu bekas akan

dicari 0.959383754

16 Jika mencari kucing,maka pintu bekas akan dicari 2.238562092

(61)

43

BAB 6

KESIMPULAN DAN SARAN

Bab akhir tulisan ini berisikan tentang kesimpulan dan saran. Kesimpulan

berisi tentang hasil akhir pola asosiasi situs Inkuiri.com dari data kueri barang

selama 55 menit dan data yang telah diuji. Saran akan memuat hal yang berkaitan

tentang pengembangan proses perhitungan dalam tulisan ini.

6.1 Kesimpulan

Berdasarkan hasil analisis dari implementasi menggunakan data clickstream yang

di record selama 55 menit, bahwa :

1. Hasil dari pengujian data kueri barang yang baru selama 185 menit dengan

hasil pola asosiasi kueri barang selama 55 menit yaitu data training

disimpulkan bahwa didapat kesamaan pola pencarian kueri barang

membuktikan data training memiliki kesamaan pola pada data testing

dengan jumlah kesamaan pola sebesar 55 pola dan pola terbesar adalah pola “Jika mencari baby jogger,maka batu bongkahan akan dicari” dengan

hasil kesamaan sebesar 10 pola dengan presentase 1.470588%.

2. Hasil dari proses perhitungan kueri barang selama 55 menit menghasilkan

pola asosiasi berjumlah 17 pola dan setelah dihitung menggunakan rumus

lift ratio menghasilkan 13 pola yang dikatakan valid (nilai lebih dari 1)

atau sebesar 76,47% dari 17 pola yang dapat memenuhi syarat lift ratio

yang diperoleh dari 13 pola valid dibagi 17 polda asosiasi dikalikan 100

(62)

44 6.2 Saran

Dari perhitungan yang telah dibuat masih dibutuhkan beberapa saran

sebagai pengembangan perhitungan ke arah yang lebih baik, yaitu:

Membuat sistem untuk mengolah data yang sudah diujicoba dengan

cara manual, agar proses dapat dilakukan oleh sistem untuk

(63)

45

Daftar Pustaka

[1] Luthfi ,E. T dan Kusrini.(2009). Algoritma Data Mining. Yogyakarta:

Andi Offset

[2] Berry, M.J.A., (2004). Data Mining Techniques, John Wiley & Sons.

[3] Han, Jiawei dkk.(2011). Data Mining Concept And Techniques. University

of lllinois at Urbana-Champaign.

[4] Abdullah, Atje Setiawan.(2009). Spasial Data Mining Menggunakan

Model SARKriging (Sptial Autoregressive-Kriging) untuk Pemetaan Mutu

Pendidikan di Indonesia.Disertasi. Program Pasca Sarjana FMIPA

UGM.UGM: Yogyakarta.

[5] Bettiza, Martaleli dkk.(2009). Penerapan Algoritma Apriori Dalam

Menemukan Hubungan Data Awal Masuk Mahasiswa Dengan Prestasi

Akademik (Studi Kasus : Stai Miftahul Ulum Tanjungpinang). Jurusan

Teknik Informatika, Fakultas Teknik, Universitas Maritim Raja Ali Haji

(UMRAH). Jl. Politeknik Senggarang, Tanjungpinang 29115.

[6] Tampubolon, Kennedi dkk.(2013). Implementasi Data Mining Algoritma

Apriori Pada Sistem Persediaan Alat-alat Kesehatan. Jurnal Informasi dan

Teknologi Ilmiah (INTI), Vol. I , No.1 Bulan Oktober 2013.

[7] Agrawal, Rakesh dkk.(1993). Mining Association Rules between Sets of

Items in Large Databases. IBM Almaden Research Center 650 Harry

(64)

46

LAMPIRAN 1

Data Training

1 sepatu gunung salomon gtx,sepatu gunung salomon boots gtx

2 taft gt,gardan daihatsu taft depanpintu bekas kusen kayu 3 kucing bengal,kain goretex,kaos yonex

4 shock depan rx king,kaos yonex 5 kain goretex,pintu bekas kusen kayu

6 burung murai medan betina,kucing bengal 7 etalase bekas bandung,kain goretex

8 trainer roller sepeda,pintu bekas kusen kayu 9 dinamo auldey,kaos yonex

10 pintu bekas kusen kayu,seragam tarung derajat 11 barter vespa cb 100,shock depan rx king 12 barter vespa cb 100,pintu bekas kusen kayu 13 etalase bekas,kain goretex

14 keris sepuh,keris sepuh pamor

15 reel pancing,kucing bengal,seragam tarung derajat

16 baby jogger,baby jogger stroller,baby jogger city,baby jogger city double 17 burung merpati hias,kucing bengal

18 burung merpati hias,pintu bekas kusen kayu

19 tombak luk,tombak luk temuan,keris tombak besar,tombak 20 rockwool yogyakarta,kain goretex

21 tempat keramas salon,kain goretex

22 batu bongkahan,batu bongkahan pancawarna

23 motor drag tangki,motor drag jok tangki,shock depan rx king

24 dinamo mini4wd kilikan tamiya,dinamo mini4wd kilikan lagi,dinamo auldey 25 bdu lokal,bdu lokal multicam,dinamo auldey

26 persia obral,persia obral kitten,kucing bengal

27 ikan arwana (surabaya),kucing bengal,dinamo auldey 28 ikan arwana (surabaya),kain goretex

29 ayam bangkok betina,kucing bengal

30 bangkok yogyakarta ayam bantul,kucing bengal 31 tangki vixion,shock depan rx king,dinamo auldey 32 tanah pangalengan,kain goretex

33 kotak peluru box tempat,pintu bekas kusen kayu

34 batu merah siam retak seribu rubi,batu merah siam retak seribu 35 mesin cuci bandung,kain goretex

36 anis kembang ngerol ring,anis kembang ngerol ring ngeplong,kain goretex 37 batu bongkahan,kucing bengal,dinamo auldey

38 velg jari jari satria fu,shock depan rx king

(65)

47 40 lamborghini 1 hotwheels,kucing bengal

41 barn owl surabaya,barn owl brancher jawa tengah

42 dancing in the water speaker,pintu bekas kusen kayu

43 tarantula,brachypelma,brachypelma mexican,brachypelma red,brachypelma adult

44 fahreza04 OR honda OR c50 OR c70 OR th OR 71 70,pintu bekas kusen kayu 45 fahreza04 OR honda OR c50 OR c70 OR th OR 71 70

46 kaisar ruby,carry 87 tahun 47 vaporizer,vamo,dinamo auldey

48 braket vixion megapro lampu tiger,braket vixion megapro lampu tiger scorpio,dinamo auldey

49 lampu depan vixion,kain goretex,dinamo auldey 50 dipan bekas,kucing bengal,kain goretex

51 sepatu gunung salomon gtx,kain goretex 52 sepatu gunung salomon boots gtx 53 taft gt,kucing bengal

54 taft gt,kain goretex,kaos yonex

55 taft gt,shock depan rx king 56 taft gt,pintu bekas kusen kayu

57 gardan daihatsu taft depan,kaos yonex 58 kucing bengal,dinamo auldey

59 kucing bengal,pintu bekas kusen kayu 60 kucing bengal,kain goretex,dinamo auldey 61 kucing bengal,shock depan rx king

62 kucing bengal,dinamo auldey

63 kucing bengal,seragam tarung derajat 64 kucing bengal,shock depan rx king 65 kucing bengal,kaos yonex

66 shock depan rx king

67 shock depan rx king

68 kain goretex,seragam tarung derajat 69 kain goretex,pintu bekas kusen kayu 70 kain goretex,kaos yonex

71 burung murai medan betina,kucing bengal 72 burung murai medan betina,dinamo auldey 73 etalase bekas bandung,pintu bekas kusen kayu 74 etalase bekas bandung,kain goretex,kaos yonex

75 etalase bekas bandung,seragam tarung derajat 76 etalase bekas bandung,dinamo auldey

77 etalase bekas bandung,seragam tarung derajat 78 etalase bekas bandung,pintu bekas kusen kayu

79 etalase bekas bandung,kaos yonex

(66)

48

81 etalase bekas bandung,dinamo auldey,dinamo auldey 82 trainer roller sepeda,shock depan rx king

83 trainer roller sepeda,seragam tarung derajat 84 dinamo auldey,pintu bekas kusen kayu 85 dinamo auldey,kaos yonex

86 pintu bekas kusen kayu,kain goretex

87 pintu bekas kusen kayu,seragam tarung derajat 88 pintu bekas kusen kayu,kaos yonex

89 barter vespa cb 100,shock depan rx king

90 barter vespa cb 100,dinamo auldey 91 etalase bekas,baby jogger

92 etalase bekas,pintu bekas kusen kayu 93 keris sepuh,dinamo auldey

94 keris sepuh pamor,seragam tarung derajat

95 reel pancing,pintu bekas kusen kayu

96 reel pancing,kain goretex,tempat keramas salon 97 reel pancing,dinamo auldey

98 reel pancing,kucing bengal 99 reel pancing,baby jogger

100 reel pancing,dinamo auldey,baby jogger 101 reel pancing,shock depan rx king

102 reel pancing,tempat keramas salon 103 reel pancing,kain goretex

104 baby jogger,tempat keramas salon 105 baby jogger,kain goretex

106 baby jogger,pintu bekas kusen kayu 107 baby jogger,shock depan rx king 108 baby jogger,dinamo auldey

109 baby jogger stroller,seragam tarung derajat

110 baby jogger city,kaos yonex 111 baby jogger city double

112 baby jogger city,tempat keramas salon 113 burung merpati hias,kucing bengal

114 burung merpati hias,pintu bekas kusen kayu 115 tombak luk,dinamo auldey

116 tombak luk,pintu bekas kusen kayu,baby jogger 117 tombak luk temuan,baby jogger

118 tombak luk,kain goretex,kaos yonex 119 keris tombak besar,dinamo auldey 120 tombak,pintu bekas kusen kayu

121 tombak luk,baby jogger,tempat keramas salon

(67)

49 124 rockwool yogyakarta,baby jogger 125 tempat keramas salon,kaos yonex

126 tempat keramas salon,shock depan rx king 127 tempat keramas salon,pintu bekas kusen kayu 128 tempat keramas salon,kain goretex

129 tempat keramas salon,baby jogger

130 tempat keramas salon,kaos yonex 131 batu bongkahan,kain goretex 132 batu bongkahan,baby jogger

133 batu bongkahan,baby jogger,tempat keramas salon 134 batu bongkahan,shock depan rx king

135 batu bongkahan,pintu bekas kusen kayu 136 batu bongkahan pancawarna,kaos yonex

137 batu bongkahan pancawarna,shock depan rx king

138 batu bongkahan pancawarna,kain goretex 139 motor drag tangki,baby jogger

140 motor drag jok tangki,tempat keramas salon

141 motor drag jok tangki,baby jogger 142 dinamo mini4wd kilikan tamiya

143 dinamo mini4wd kilikan tamiya,shock depan rx king 144 dinamo mini4wd kilikan tamiya,baby jogger

145 dinamo mini4wd kilikan lagi,kaos yonex 146 bdu lokal,pintu bekas kusen kayu

147 bdu lokal multicam,tempat keramas salon 148 persia obral,kucing bengal,baby jogger

149 persia obral kitten,kain goretex,kaos yonex 150 ikan arwana (surabaya),tempat keramas salon 151 ikan arwana (surabaya),shock depan rx king 152 ikan arwana (surabaya),kain goretex

153 ayam bangkok betina,pintu bekas kusen kayu 154 ayam bangkok betina,kucing bengal,baby jogger 155 ayam bangkok betina,baby jogger

156 bangkok yogyakarta ayam bantul,kaos yonex

157 bangkok yogyakarta ayam bantul,shock depan rx king 158 bangkok yogyakarta ayam bantul

159 bangkok yogyakarta ayam bantul,kain goretex 160 tangki vixion,shock depan rx king

161 tangki vixion,kucing bengal,kaos yonex 162 tanah pangalengan,pintu bekas kusen kayu 163 tanah pangalengan,kain goretex

164 kotak peluru box tempat,pintu bekas kusen kayu

(68)

50 167 batu merah siam retak seribu,kaos yonex 168 mesin cuci bandung,baby jogger

169 mesin cuci bandung,shock depan rx king 170 mesin cuci bandung,tempat keramas salon 171 mesin cuci bandung,pintu bekas kusen kayu 172 anis kembang ngerol gacor,kain goretex

173 anis kembang ngerol,shock depan rx king

174 anis kembang ngerol gacor,tempat keramas salon 175 anis kembang ngerol gacor istimewa,baby jogger

176 anis kembang ngerol ring,pintu bekas kusen kayu 177 anis kembang ngerol ring,shock depan rx king 178 anis kembang ngerol ring,tempat keramas salon 179 anis kembang ngerol ring ngeplong,baby jogger 180 anis kembang ngerol ring jantan

181 anis kembang ngerol ring jantan ngeplong 182 batu bongkahan,shock depan rx king 183 batu bongkahan,baby jogger

184 batu bongkahan,pintu bekas kusen kayu 185 velg jari jari satria fu,kain goretex

186 velg jari jari satria fu,tempat keramas salon 187 velg jari jari satria fu,shock depan rx king

188 velg jari jari satria fu,baby jogger

189 velg jari jari satria fu,pintu bekas kusen kayu 190 velg jari jari satria fu,kaos yonex

191 undertail ninja 250 model,baby jogger

192 headlamp variasi custom,kucing bengal 193 lamborghini 1 hotwheels,kain goretex 194 lamborghini 1 hotwheels,shock depan rx king 195 barn owl surabaya,tempat keramas salon

196 barn owl brancher jawa tengah,kucing bengal 197 dancin

Gambar

Gambar 3.3 Seleksi Data .................................................................................................
gambar 2.1 [3].
Gambar 2.1 Tahap penemuan Knowledge Data Discovery (KDD)
Gambar 3.1 Blok Diagram
+7

Referensi

Dokumen terkait

para pihak yang bersengketa; kedua, untuk memperkuat keterlibatan masyarakat dalam proses penyelesaian sengketa; dan ketiga, memperluas akses mencapai atau mewujudkan

selaku Sekretaris Jurusan Administrasi Bisnis Politeknik Negeri Sriwijaya dan Dosen Pembimbing II yang telah membantu, mengarahkan dan membimbing penulis

In this research, the fire risk of region was forecasted and the risk map of that was provided using MODIS images by applying geographically weighted regression model with

Metode yang digunakan dalam analisis terhadap peranan Kredit Usaha Rakyat (KUR) terhadap pengembangan Usaha Mikro dan Kecil (UMK) di Kecamatan Gebang Kabupaten Langkat adalah metode

To specify a directory where you want Apache program files to be installed, you use the --prefix parameter with the configure command, specifying the name and location of

Ahli Pertama/Pertama pangkat Penata Muda golongan III/a sampai dengan Ahli Muda/Muda pangkat Penata Tingkat I golongan ruang Ill/d;.. ditetapkan dan ditandatangani oleh

Primer adalah bagian pendek, untai tunggal dari DNA yang melekat dengan urutan komplementer pada templat DNA target.. Sepasang primer akan mengikat kedua sisi

Iverson (1996) juga berpendapat bahwa komitmen organisasional adalah prediktor terbaik dalam perubahan organisasi dibandingkan dengan kepuasan kerja dimana karyawan