• Tidak ada hasil yang ditemukan

Pengembangan alat bantu penambangan aturan asosiasi langka menggunakan algoritma arima (a rare itemset miner algorithm) - USD Repository

N/A
N/A
Protected

Academic year: 2019

Membagikan "Pengembangan alat bantu penambangan aturan asosiasi langka menggunakan algoritma arima (a rare itemset miner algorithm) - USD Repository"

Copied!
217
0
0

Teks penuh

(1)

ATURAN ASOSIASI

ALGORITMA

Ditujukan Untuk Memenuhi Salah Satu

Memperoleh Gelar Sarjana

PROGRAM

JURUSAN TEKN

FAKULTAS SA

UNIVERSITAS SAN

i

ATURAN ASOSIASI LANGKA MENGGUNAK

ALGORITMA

ARIMA (A RARE ITEMSET MINER

ALGORITHM)

SKRIPSI

tujukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Jurusan Teknik Informatika

Oleh :

Yuliani Ika Susanti

085314045

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

2013

MENGGUNAKAN

(A RARE ITEMSET MINER

Syarat

ATIKA

(2)

MINING RARE

(A RARE

Presented as Partial Fulfillment of the Requirements

To Obtain

In

INFORMATICS EN

DEPARTMEN

FACULTY

SANATA D

ii

RARE ASSOCIATION RULE USING

RARE ITEMSET MINER ALGORITHM

A Thesis

Presented as Partial Fulfillment of the Requirements

To Obtain the

Sarjana Komputer

Degree

Informatics Engineering Study Program

By :

Yuliani Ika Susanti

085314045

INFORMATICS ENGINEERING STUDY PROGRA

DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

2013

USING ARIMA

ALGORITHM)

Presented as Partial Fulfillment of the Requirements

Y PROGRAM

GINEERING

(3)
(4)
(5)
(6)

vi

“ Great hopes and great works make great result”

“Hiduplah seolah kau akan mati besuk,

Belajarlah seolah kau akan hidup selamanya”

“Akar prestasi sejati adalah niat untuk mencapai yang terbaik”

“Jangan biarkan hidupmu mematahkan semangatmu,

setiap orang mengalami kegagalan dan harus memulai dari awal”

“Tidak akan ada kemajuan tanpa perjuangan”

“Kamu dapat menghadapi segala rintangan ketika kamu percaya

pada Tuhan”

(7)

vii

Karya ini saya persembahkan kepada:

….

Tuhan Yesus Kristus pemilik jiwaku, Bunda Perawan Maria,

St. Fransiska Pelindungku,

….

Kedua orang tuaku yang telah membesarkan, membimbing dan mendidikku

dengan cinta, pengertian, dan kesabaran,

Semua keluargaku, yang selalu menyayangi dan menerimaku apa adanya,

Semua Dosen dan teman-teman Teknik Informatika

Universitas Sanata Dharma

(8)

viii

Teknik asosiasi adalah salah satu teknik data mining yang sering

digunakan untuk menemukan aturan

(rule)

yang tersembunyi di dalam suatu

kumpulan data. Saat ini banyak algoritma yang menggunakan teknik asosiasi.

Salah satunya adalah algoritma

ARIMA (A Rare Itemset Miner Algorithm).

Algoritma ini digunakan untuk mencari aturan asosiasi yang jarang terjadi atau

langka pada suatu data. Setelah ditemukan aturan asosiasi langka ini dapat

digunakan untuk pertimbangan atau melalukan tindakan yang relevan dengan

aturan asosiasi langka tersebut.

Saat ini masih belum ditemukan alat bantu berupa aplikasi yang dapat

digunakan untuk menemukan aturan asosiasi langka. Untuk itu dibutuhkan alat

bantu yang dapat digunakan untuk menemukan aturan asosiasi langka. Pada tugas

akhir ini dibangun sebuah aplikasi bernama

Application for Mining Rare

Association Rule

. Aplikasi ini bertujuan untuk menemukan aturan asosiasi langka

secara otomatis atau tanpa perlu menghitung secara manual.

Aplikasi ini mengiimplementasikan algoritma

Arima (A Rare Itemset

Miner Algorithm).

Aplikasi dibangun dengan menggunakan bahasa pemrograman

java

dan basis data MySQL serta

Oracle.

Aplikasi dapat membaca data masukan

bertipe .xls serta .csv. Aplikasi juga dapat membaca data masukan dari basisdata

MySQL serta

Oracle

dengan baik.

Berdasar hasil dari uji coba menggunakan dataset yang berbeda, sistem

(9)

ix

Association technique is one of data mining techniques that is used to find

hidden rules in a data set. At present, there are many algorithms that use

association techniques. One of them is the ARIMA algorithm (A Rare Itemset

Miner Algorithm). This algorithm is used to find association rules which are rare

or endangered in the data. Having discovered these rare association rules, they can

be used for considerations or performing actions which are relevant to the rare

association rules.

At this time, there is not any applications tools that can be used to find

rare association rules. Therefore, a tool that can be used to find a rare association

rules is needed. In this final project, an application called Application for Mining

Rare Association Rule to find rule was built. This application aims to discover

rare association rules automatically.

The application implements Arima (A Rare Itemset Miner Algorithm)

algorithm. The application was built using the Java programming language and

the MySQL as well as Oracle databases. The application can read input in the

form of .xls and .csv type. In addition, the application is able to read data from

MySQL and Oracle database as well.

(10)
(11)

xi

Terimakasih dan puji syukur kepada Tuhan Yesus Kristus yang telah

memberikan kekuatan, rahmat, berkat, perlindungan dan hikmatNya. Berkat

karuniaNya-lah penulis dapat menyelesaikan tugas akhir.

Dalam proses penulisan tugas akhir ini saya menyadari bahwa ada begitu

banyak pihak yang telah memberikan perhatian dan bantuan dengan caranya

masing-masing sehingga tugas akhir ini dapat selesai. Oleh karena itu saya ingin

mengucapkan terima kasih antara lain kepada :

1.

Ibu Paulina Heruningsih Prima Rosa, S.Si.,M.Sc, selaku Dekan Fakultas

Sains dan Teknologi, Universitas Sanata Dharma dan selaku Dosen

Pembimbing Tugas Akhir yang telah banyak memberikan bimbingan,

dukungan, motivasi dan fasilitas yang mendukung terselesaikannya tugas

akhir ini.

2.

Ibu Ridowati Gunawan S.Kom., M.T dan Sri Hartati Wijono S.Si., M. Kom

selaku panitia penguji yang telah memberikan kritik dan saran untuk tugas

akhir saya.

(12)

xii

selalu mendukungku dan menyayangiku.

4.

Seluruh staff dosen Teknik Informatika Universitas Sanata Dharma yang

telah banyak memberikan bekal ilmu, arahan dan pengalaman selama saya

menempuh studi.

5.

Seluruh Staff Sekretariat Teknik, yang banyak membantu saya dalam urusan

administrasi akademik terutama menjelang ujian tugas akhir.

6.

Seluruh Staff laboran Teknik Informatika, terima kasih atas semua

bantuannya terutama saat ujian tugas akhir.

7.

Sahabat dan teman-teman Teknik Informatika angkatan 2008, Ancelmatini,

Elisabeth Gadis, Valentina Dian, Siska, Ilana dan semua teman-teman

seperjuangan atas canda tawa dan semangat selama penulis menyelesaikan

tugas akhir ini.

8.

Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhir

ini yang tidak bisa saya sebutkan satu per satu.

Penulis menyadari bahwa tugas akhir ini masih jauh dari sempurna, oleh

karena itu berbagai kritik dan saran untuk perbaikan tugas akhir ini sangat saya

harapkan. Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak.

Terima kasih.

(13)

xiii

Halaman Judul ...

Halaman Judul (Bahasa Inggris)...

Halaman Persetujuan ...

Halaman Pengesahan...

Pernyataan Keaslian Karya ...

Halaman Motto...

Halaman Persempahan...

Abstrak...

Abstract...

Persetujuan Publikasi Karya Ilmiah...

Kata Pengantar...

1.1.

Latar Belakang ...

1.2.

Rumusan Masalah ...

1.3.

Tujuan Penelitian...

1.4.

Manfaat Penelitian...

1.5.

Batasan Masalah...

1.6.

Metodologi Penelitian...

1.7.

Sistematika Penulisan ...

BAB II.

LANDASAN TEORI

2.1. Metode Pengembangan Sistem...

2.2. Metode Analisis Asosiasi...

2.3. Algoritma

Arima (A Rare Itemset Miner Algorithm)...

(14)

xiv

BAB III

.

ANALISIS DAN PERENCANAAN SISTEM

3.1. Fase Analisis Kebutuhan Sistem...

3.1.1. Identifikasi Masalah...

3.1.2. Pernyataan Masalah...

3.1.3. Kebutuhan Perangkat Keras...

3.1.4. Kebutuhan Perangkat Lunak...

3.1.5. Gambaran Sistem Baru ...

3.1.5.1

Input Sistem...

3.1.5.2

Proses Sistem...

3.1.5.3

Output Sistem...

3.1.6. Diagram Use Case...

3.1.7. Ringkasan Use Case...

3.1.8. Narasi Use Case...

3.2. Perancangan Sistem...

3.2.1. Diagram Aktivitas...

3.2.1.1

Diagram Aktivitas Koneksi Database

...

3.2.1.2

Diagram Aktivitas Input Data...

3.2.1.3

Diagram Aktivitas Buat Aturan...

3.2.1.4

Diagram Aktivitas Simpan Aturan...

3.2.2. Model Analisis...

3.2.2.1 Model Analisis Usecase

Open Database....

3.2.2.2 Model Analisis Usecase Input Data...

3.2.2.3 Model Analisis Usecase Buat Aturan...

3.2.2.4 Model Analisis Usecase Simpan Aturan....

3.2.3. Perancangan Antar Muka...

3.2.3.1 Halaman Home...

3.2.3.2 Halaman Proses Asosiasi pada

Tab Open

File...

3.2.3.3 Halaman Proses Asosisasi pada

Tab Open

(15)

xv

3.2.4. Diagram Kelas...

3.2.4.1 Detail Algoritma pada

method

di kelas

Home...

3.2.4.2 Detail Algoritma pada

method

di kelas

ProsesAsosiasi...

3.2.4.3 Detail Algoritma pada

method

di kelas

SelectDatabase...

3.2.4.4 Detail Algoritma pada

method

di kelas

LoginDatabase...

3.2.4.5 Detail Algoritma pada

method

di kelas

OracleConnection...

3.2.4.6 Detail Algoritma pada

method

di kelas

DatabaseConnection...

3.2.4.7 Detail Algoritma pada

method

di kelas

Database...

3.2.4.8 Detail Algoritma pada

method

di kelas

DataFile...

3.2.4.9 Detail Algoritma pada

method

di kelas

Itemset...

3.2.4.10 Detail Algoritma pada

method

di kelas

Candidate...

3.2.4.11 Detail Algoritma pada

method

di kelas

LargeItemset...

BAB IV. IMPLEMENTASI SISTEM

4.1. Fase Implementasi Sistem...

4.1.1. Implementasi Perangkat Keras...

4.1.2. Implementasi Perangkat Lunak...

4.1.3. Implementasi File...

4.1.4. Implemetasi Antar Muka...

(16)

xvi

4.1.4.2 Halaman Proses Asosiasi pada

Tab Open

File

...

4.1.4.3 Halaman Proses Asosiasi pada

Tab Open

Database...

BAB V. PENGUJIAN DAN ANALISIS HASIL PENGUJIAN

5.1.

Fase Implementasi Pengujian...

5.1.1. Rencana Pengujian...

5.1.2. Kasus dan Hasil Pengujian...

5.1.2.1 Pengujian

OracleConnection

...

5.1.2.2 Pengujian

DatabaseConnection

...

5.1.2.3 Pengujian

ProsesAsosiasi...

...

5.1.3. Kesimpulan Hasil Pengujian...

5.1.4. Analisis Hasil Implementasi...

5.1.4.1 Aturan Asosiasi dari Hasil Perhitungan

Manual...

5.1.4.2 Aturan Asosiasi dari Hasil Perhitungan

Sistem...

5.2. Kelebihan dan Kekurangan Sistem...

5.2.1. Kelebihan Sistem...

5.2.2. Kekurangan Sistem...

BAB VI. PENUTUP

6.1. Kesimpulan...

6.2. Saran ...

DAFTAR PUSTAKA

99

102

108

108

109

109

111

116

118

118

119

120

130

130

130

131

131

(17)

xvii

Lampiran 1 Narasi Use Case

Open Database

Lampiran 2 Narasi Use Case Input Data

Lampiran 3 Narasi Use Case Buat Aturan

Lampiran 4 Narasi Use Case Simpan Aturan

Lampiran 5 Listing Program Form Home

Lampiran 6 Listing Program Form

ProsesAsosiasi

Lampiran 7 Listing Program Form

SelectDatabase

Lampiran 8 Listing Program Form

LoginDatabase

Lampiran 9 Listing Program Form

OracleDatabase

Lampiran 10 Aturan Asosiasi Langka Yang Kuat pada Data

Zoo

Lampiran 11 Aturan Asosiasi Langka Yang Kuat pada Data

Mushroom

Lampiran 12 Hasil untuk dataset Zoo dengan

mimimal support 5%

dan

mimimal confidence 60%

Lampiran 13 Hasil untuk dataset Zoo dengan

mimimal support 5%

dan

mimimal confidence 70%

Lampiran 14 Hasil untuk dataset Zoo dengan

mimimal support 5%

dan

mimimal confidence 80%

Lampiran 15 Hasil untuk dataset Zoo dengan

mimimal support 10%

dan

mimimal confidence 60%

Lampiran 16 Hasil untuk dataset Zoo dengan

mimimal support 10%

dan

mimimal confidence 70%

Lampiran 17 Hasil untuk dataset Zoo dengan

mimimal support 10%

dan

mimimal confidence 80%

Lampiran 18 Hasil untuk dataset Zoo dengan

mimimal support 15%

dan

mimimal confidence 60%

Lampiran 19 Hasil untuk dataset Zoo dengan

mimimal support 15%

dan

mimimal confidence 70%

Lampiran 20 Hasil untuk dataset Zoo dengan

mimimal support 15%

dan

mimimal confidence 80%

(18)

xviii

Lampiran 22 Hasil untuk dataset Mushroom dengan

mimimal support

5%

dan

mimimal confidence 70%

Lampiran 23 Hasil untuk dataset Mushroom dengan

mimimal support

5%

dan

mimimal confidence 80%

Lampiran 24 Hasil untuk dataset Mushroom dengan

mimimal support

10%

dan

mimimal confidence 60%

Lampiran 25 Hasil untuk dataset Mushroom dengan

mimimal support

10%

dan

mimimal confidence 70%

(19)

xix

Gambar 2.1 Pengembangan sistem menggunakan model Waterfall ...

Gambar 2.2 Kiri : Contoh Dataset (D). Kanan : Rangkaian pola Dataset D

Gambar 2.3 Algoritma

Arima (A Rare Itemset Miner Algorithm)...

Gambar 2.4 Pencarian

candidate itemset

dan

rare itemset

dengan

min_supp=3...

Gambar 3.1 Diagram Konteks...

Gambar 3.2 Diagram

Use Case

...

Gambar 3.3 Diagram Aktivitas

Open Database

...

Gambar 3.4 Diagram Aktivitas Input Data...

Gambar 3.5 Diagram Aktivitas Buat Aturan...

Gambar 3.6 Diagram Aktivitas Simpan Aturan...

Gambar 3.7 Gambar model analisis Koneksi Database...

Gambar 3.8 Diagram

Sequence

Koneksi Database...

Gambar 3.9 Gambar model analisis Input Data...

Gambar 3.10 Diagram

Sequence

Input Data...

Gambar 3.11 Gambar model analisis Buat Aturan...

Gambar 3.12 Diagram

Sequence

Buat Aturan...

Gambar 3.13 Gambar model analisis Simpan Aturan...

Gambar 3.14 Diagram

Sequence

Simpan Aturan...

Gambar 3.15 Desain Antar Muka Halaman

Home.

...

Gambar 3.16 Desain Antar Muka Halaman Proses Asosiasi pada

Tab

Open File...

Gambar 3.17 Desain Antar Muka Halaman Proses Asosiasi pada

Tab

Open Database

...

Gambar 3.18 Desain Antar Muka Halaman

Select Database

...

Gambar 3.19 Desain Antar Muka Halaman

Open Database

...

Gambar 3.20 Desain Antar Muka Halaman

Oracle Connection...

(20)

xx

Gambar 4.2 Tampilan Halaman Proses Asosiasi pada

Tab Open File

...

Gambar 4.3 Tampilan Tipe File yang dapat digunakan...

Gambar 4.4 Tampilan Mencari File pada Direktori tertentu...

Gambar 4.5 Tampilan Halaman Peringatan...

Gambar 4.6 Tampilan Menyimpan Aturan Asosiasi...

Gambar 4.7 Tampilan Halaman Peringatan...

Gambar 4.8 Tampilan Halaman Proses Asosiasi pada

Tab Open Database

Gambar 4.9 Tampilan Halaman

Select Database

...

Gambar 4.10 Tampilan Database yang dapat digunakan...

Gambar 4.11 Tampilan Halaman

Login Database

...

Gambar 4.12 Tampilan Halaman Peringatan...

Gambar 4.13 Tampilan Halaman Peringatan...

Gambar 4.14 Gambar Halaman Pesan Koneksi Berhasil...

Gambar 4.15 Tampilan Halaman

OracleConnection

...

Gambar 4.16 Tampilan Halaman Peringatan...

Gambar 4.17 Tampilan Menyimpan Aturan Asosiasi...

Gambar 4.18 Tampilan Halaman Peringatan...

Gambar 5.1.a Grafik pada Dataset Zoo dengan minsup=5%...

Gambar 5.1.b Grafik pada Dataset Zoo dengan minsup=10%...

Gambar 5.1.c Grafik pada Dataset Zoo dengan minsup=15%...

Gambar 5.2.a Grafik pada Dataset Zoo dengan minconf=60%...

Gambar 5.2.b Grafik pada Dataset Zoo dengan minconf =70%...

Gambar 5.2.c Grafik pada Dataset Zoo dengan minconf =80%...

Gambar 5.3.a Grafik pada Dataset Mushroom dengan minsup=5%...

Gambar 5.3.b Grafik pada Dataset Mushroom dengan minsup=10%...

Gambar 5.4.a Grafik pada Dataset Mushroom dengan minconf=60%...

Gambar 5.4.b Grafik pada Dataset Mushroom dengan minconf =70%...

Gambar 5.4.c Grafik pada Dataset Mushroom dengan minconf =80%...

(21)

xxi

Tabel 2.1 Contoh Tabel Transaksi A (Tan, et.al, 2006)...

Tabel 2.2 Contoh Tabel Transaksi B (Szathmary, L., et.al, 2007)...

Tabel 2.3

Rare itemset

dengan

minimum support=3

...

Tabel 3.1 Tabel analisis sebab akibat...

Tabel 3.2 Deskripsi

Use Case

...

Tabel 3.3 Kelas Analisis Koneksi Database...

Tabel 3.4 Kelas Analisis Input Data...

Tabel 3.5 Kelas Analisis Buat Aturan...

Tabel 3.6 Kelas Analisis Simpan Aturan...

Tabel 3.7 Tabel Kelas yang digunakan dalam sistem...

Tabel 4.1 Tabel Implementasi File...

Tabel 5.1 Rencana Pengujian...

Tabel 5.2 Pengujian Data

OracleConnection

...

Tabel 5.3 Pengujian Data

DatabaseConnection

...

Tabel 5.4 Pengujian Data ProsesAsosiasi...

Tabel 5.5

Rare itemset

dengan

minimum support

= 5%...

Tabel 5.6

Rare itemset

dengan

minimum support

= 5%...

Tabel 5.7 Hasil Perhitungan Sistem pada data

Zoo

...

Tabel 5.8 Hasil Perhitungan Sistem pada data

Mushroom...

...

(22)

1

BAB I

PENDAHULUAN

1.1.

Latar Belakang

Dewasa ini kebutuhan akan informasi yang akurat sangat dibutuhkan

dalam kehidupan sehari-hari. Namun kebutuhan informasi yang tinggi kadang

tidak diimbangi dengan penyajian informasi yang memadai. Sering kali

informasi tersebut masih harus digali ulang dari data yang jumlahnya sangat

besar.

Pemanfaatan data di dalam sistem informasi untuk menunjang

kegiatan pengambilan keputusan, tidak cukup hanya mengandalkan data

operasional saja. Diperlukan pula analisis data untuk menggali informasi yang

ada. Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan

berbagai tipe data jauh meninggalkan kemampuan untuk menganalisis,

meringkas dan mengekstrak pengetahuan dari data. Dengan adanya masalah

semacam itu memunculkan teknologi baru yaitu penambangan data

(data

mining).

Penambangan data adalah serangkaian proses untuk mengekstrak

pola yang penting atau menarik dari sejumlah data yang sangat besar berupa

pengetahuan yang selama ini tidak diketahui secara manual (Han, 2001).

(23)

item. Metode analisis asosiasi dikenal juga sebagai salah satu teknik

data

mining

yang menjadi dasar dari berbagai teknik data mining lainnya (Kusrini

& Emha

,

2009).

Penting tidaknya suatu aturan asosiasi dapat diketahui dengan 2

parameter yaitu

support

dan

confidence

.

Support

adalah persentase kombinasi

item dalam basisdata sedangkan

confidence

adalah kuatnya hubungan antar

item dalam aturan asosiasi (Kusrini & Emha, 2009). Pencarian aturan asosiasi

dengan menggunakan analisis asosiasi bertujuan untuk menemukan semua

aturan asosiasi yang memenuhi syarat minimum untuk

support

(

minimum

support

) dan syarat minimum untuk

confidence

(

minimum confidence

).

Minsup

(

minimum support

) menandakan ambang batas (

threshold

)

yang menentukan apakah sebuah

itemset

akan digunakan pada perhitungan

selanjutnya untuk pencarian aturan asosiasi. Sedangkan

Minconf

(

minimum

confidence

) menandakan ambang batas (

threshold

) dari sebuah aturan asosiasi

untuk menentukan aturan asosiasi yang kuat (

strong association rule

).

Rare association rule mining

adalah teknik

mining

untuk menemukan

aturan atau pola asosiasi dari suatu kombinasi antar item. Dalam hal ini, pola

asosiasi yang digunakan adalah pola yang langka/jarang ditemui.

(24)

langka pada supermarket yaitu pel dan sapu akan menjadi asosiasi langka

dalam penjualan supermarket, bukan karena barang tersebut tidak dibeli

bersama, tapi karena barang jarang dibeli di supermarket. Dalam kasus ini,

asosiasi biasa tidak akan dapat menemukan barang yang jarang dibeli,

sehingga dibutuhkan metode

Rare Association Rule Mining

(RARM) untuk

dapat menemukan asosiasi langka. Dalam kasus supermarket, metode ini

dapat digunakan untuk menemukan pel dan sapu, sehingga pel dan sapu ini

dapat ditempatkan di tempat yang sejajar. Contoh kasus lain, misalnya untuk

menemukan mahasiswa yang mungkin dapat di DO. Sehingga jika pihak yang

berwenang mengetahui mahasiswa yang mungkin di DO, maka mahasiswa

tersebut dapat diberikan perhatian atau pengarahan agar mahasiswa tersebut

tidak jadi di DO.

(25)

Pada tugas akhir ini akan dibangun sebuah aplikasi yang dapat

membantu pengguna dalam menyelesaikan masalah aturan asosiasi langka.

Aplikasi ini bertujuan untuk menemukan aturan asosiasi langka secara

otomatis atau tanpa perlu menghitung secara manual. Sebuah data dapat dicari

aturan asosiasi langka dengan menginputkan data yang berbentuk file .xls,

.csv maupun data yang berasal dari database. Data tersebut akan diolah

menggunakan algoritma

Arima

untuk menemukan aturan asosiasi langka.

1.2.

Rumusan Masalah

Masalah yang akan diselesaikan dalam tugas akhir ini adalah

bagaimana

membangun

alat

bantu

penambangan

data

yang

mengimplementasikan algoritma

Arima

dengan menggunakan metode

Rare

Association Rule Mining

.

1.3.

Tujuan Penelitian

(26)

1.4.

Manfaat Penelitian

Manfaat penelitian dari tugas akhir ini yaitu membantu pengguna

untuk menemukan aturan asosiasi langka, khususnya yang menggunakan

algoritma

Arima

.

1.5.

Batasan Masalah

Tugas Akhir ini memiliki beberapa batasan sistem yaitu :

1. Alat bantu

Data Mining

ini hanya menerapkan metode aturan asosiasi

(association rule)

yaitu metode

Rare Association Rule Mining

menggunakan algoritma

Arima

.

2. Sistem hanya dapat memproses data yang berasal dari file .xls, .csv

dan data yang berasal dari sebuah

database

.

3. Sistem hanya dapat terhubung dengan database

MySql

dan

Oracle

.

1.6.

Metodologi Penelitian

Metodologi yang digunakan untuk menyelesaikan aplikasi ini adalah

dengan langkah-langkah sebagai berikut :

1. Studi pustaka dengan mempelajari

literature

dari buku maupun

internet

yang berkaitan dengan topik tugas akhir ini.

(27)

a. Analisis dan definisi kebutuhan

Proses ini mendefinisikan secara rinci mengenai fungsi-fungsi,

batasan dan tujuan dari perangkat lunak sebagai spesifikasi

sistem yang akan dibuat.

b. Perancangan sistem dan perangkat lunak

Proses perancangan sistem ini difokuskan pada empat atribut,

yaitu struktur data, arsitektur perangkat lunak, representasi

antarmuka, dan detail (algoritma) prosedural.

c. Implementasi dan pengujian unit

Pada tahap ini, perancangan perangkat lunak direalisasikan

sebagai serangkaian program atau unit program.

d. Integrasi dan pengujian sistem

Pada tahap ini akan digunakan dataset untuk pengujian sistem

yaitu data

zoo

1

dan

mushroom

2

. Dataset

zoo

berisi tentang

beberapa hewan beserta ciri-cirinya

sedangkan dataset

mushroom

berisi tentang beberapa jamur beserta ciri-cirinya.

e. Operasi dan pemeliharaan

Sistem diterapkan (di-

install

) dan dipakai.

1

http://archive.ics.uci.edu/ml/datasets/zoo

2

(28)

1.7.

Sistematika Penulisan

Sistematika penulisan tugas akhir ini adalah sebagai berikut:

BAB I. PENDAHULUAN

Bab ini membahas mengenai latar belakang, rumusan masalah, batasan

masalah, tujuan penelitian, manfaat penelitian, metodologi, dan

sistematika penulisan.

BAB II. LANDASAN TEORI

Bab ini membahas mengenai pengetahuan yang mendukung

implementasi algoritma

Arima

menggunakan metode

Rare Association

Rule Mining

seperti metode pengembangan sistem, Metode Analisis

Asosiasi, algoritma

Arima (A Rare Itemset Miner Algorithm),

dan

contoh penerapan algoritma

Arima

.

BAB III. ANALISIS DAN PERANCANGAN SISTEM

Dalam bab ini akan diidentifikasikan masalah yang akan diselesaikan

serta tahap tahap penyelesaian masalah tersebut dengan menggunakan

algoritma

Arima

. Dalam bab ini juga akan dijelaskan perancangan

program implementasi penambangan data dengan algoritma

Arima

.

BAB IV. IMPLEMENTASI SISTEM

(29)

BAB V. PENGUJIAN DAN ANALISA HASIL PENGUJIAN

Bab ini berisi integrasi dan pengujian sistem yang telah dibuat

menggunakan metode

black box

. Dalam bab ini juga berisi analisa

hasil program dan pembahasan masalah berdasarkan hasil yang telah

didapat secara keseluruhan.

BAB VI. PENUTUP

(30)

9

BAB II

LANDASAN TEORI

2.1. Metode Pengembangan Sistem

Waterfall model

pertama kali diperkenalkan oleh Winston Royce tahun 1970.

Waterfall Model merupakan model klasik yang sederhana dengan aliran sistem

yang linier. Output dari setiap tahap merupakan input bagi tahap berikutnya.

Model ini telah diperoleh dari proses rekayasa lainnya dan menawarkan cara

pembuatan rekayasa perangkat lunak secara lebih nyata.

Waterfall model

merupakan salah satu model proses perangkat lunak yang

mengambil kegiatan proses dasar seperti spesifikasi, pengembangan, validasi, dan

evolusi, dan merepresentasikannya sebagai fase-fase proses yang berbeda seperti

analisis dan definisi persyaratan, perancangan perangkat lunak, implementasi,

pengujian unit, integrasi sistem, pengujian sistem, operasi dan pemeliharaan

(Sommerville, 2003).

Tahap – tahap pengembangan waterfall model

adalah (Sommerville, 2003):

1. Analisis dan definisi kebutuhan

Proses mengumpulkan informasi kebutuhan sistem/perangkat lunak

(31)

mengenai fungsi-fungsi, batasan dan tujuan dari perangkat lunak sebagai

spesifikasi sistem yang akan dibuat.

Beberapa macam requirement

:

User Requirement

(Kebutuhan Pengguna)

Proses ini berisi pernyataan tentang layanan yang disediakan sistem

dan tentang batasan-batasan operasionalnya serta gambar/diagram

yang dapat dimengerti dengan mudah.

System Requirement

(Kebutuhan Sistem)

Proses ini berisi sekumpulan layanan/kemampuan sistem dan

batasan-batasannya yang ditulis secara detail.

Software Requirement Specification

(Spesifikasi Kebutuhan Perangkat

Lunak)

Proses ini berisi gambaran abstrak dari rancangan perangkat lunak

yang menjadi dasar bagi perancangan dan implementasi yang lebih

detail.

2. Perancangan sistem dan perangkat lunak

Proses perancangan sistem ini difokuskan pada empat atribut, yaitu

struktur data, arsitektur perangkat lunak, representasi antarmuka, dan detail

(algoritma) prosedural. Proses ini menerjemahkan syarat / kebutuhan ke

(32)

Beberapa macam metode perancangan :

Perancangan Data

Tahap ini mentransformasikan model data yang dihasilkan oleh proses

analisis menjadi struktur

data yang dibutuhkan pada saat

implementasi.

Perancangan Arsitektur

Tahap ini mendefinisikan keterkaitan antar elemen-elemen utama yang

akan membentuk program.

Perancangan Antarmuka

Tahap ini menjabarkan komunikasi : internal perangkat lunak, antara

perangkat lunak, dengan sistem diluarnya, dan antara perangkat lunak

dengan usernya.

Perancangan Prosedur

Tahap ini metransformasikan elemen struktural dari arsitektur program

menjadi deskripsi prosedur.

3. Implementasi dan pengujian unit

Pada tahap ini, perancangan perangkat lunak direalisasikan sebagai

serangkaian program atau unit program. Kemudian pengujian unit melibatkan

verifikasi bahwa setiap unit program telah memenuhi spesifikasinya

(33)

4. Integrasi dan pengujian sistem

Unit program/program individual diintegrasikan menjadi sebuah

kesatuan sistem dan kemudian dilakukan pengujian. Dengan kata lain,

pengujian ini ditujukan untuk menguji keterhubungan dari tiap-tiap fungsi

perangkat lunak untuk menjamin bahwa persyaratan sistem telah terpenuhi.

Setelah pengujian sistem selesai dilakukan, perangkat lunak dikirim ke

pelanggan/user

(Sommerville, 2003).

Beberapa metode pengujian :

1.

Black box testing

Black box testing

memperlakukan pengujian perangkat lunak sebagai

“kotak hitam” – tanpa pengetahuan tentang pelaksanaan internal.

2.

White box testing

White box testing

adalah ketika penguji memiliki akses ke struktur data

internal dan algoritma termasuk source code.

5. Operasi dan pemeliharaan

Tahap ini biasanya memerlukan waktu yang paling lama. Sistem diterapkan

(di-install) dan dipakai. Pemeliharaan mencakup koreksi dari beberapa

kesalahan yang tidak diketemukan pada tahapan sebelumnya, perbaikan atas

implementasi unit sistem dan pengembangan pelayanan sistem, sementara

(34)

Gambar 2.1 Pengembangan sistem menggunakan model

Waterfall

(Sommerville, 2003)

2.2. Metode Analisis Asosiasi

Metode analisis asosiasi (association analysis) merupakan teknik

data

mining

untuk menemukan aturan asosiatif antara suatu kombinasi item.

Metode analisis asosiasi dikenal juga sebagian salah satu teknik data mining

yang menjadi dasar dari berbagai teknik data mining lainnya.

Penting tidaknya suatu aturan asosiasi dapat diketahui dengan 2

parameter yaitu support

dan confidence.

Support

adalah persentase kombinasi

item dalam basisdata sedangkan

confidence

adalah kuatnya hubungan antar

item dalam aturan asosiasi (Kusrini & Emha, 2009). Pencarian aturan asosiasi

dengan menggunakan analisis asosiasi bertujuan untuk menemukan semua

aturan asosiasi yang memenuhi syarat minimum untuk

support

(minimum

(35)

Support

dari aturan

adalah rasio dari record

yang mengandung

dengan total record

dalam basisdata. Untuk mendapatkan nilai support

dapat menggunakan rumus :

,

(

)

=

( ∪ )

...(2.1)

Keterangan :

(

)

: jumlah X dan Y yang ada di dalam transaksi secara

bersamaan.

N : jumlah semua transaksi yang ada.

Sedangkan

Minsup

(minimum support) menandakan ambang batas

(threshold) yang menentukan apakah sebuah

itemset

akan digunakan pada

perhitungan selanjutnya untuk pencarian aturan asosiasi.

Confidence

dari aturan asosiasi

adalah rasio dari

record

yang

mengandung

dengan total

record

yang mengandung

. Untuk

mendapatkan nilai confidence

dapat menggunakan rumus :

,

(

)

=

( ∪ )

( )

...(2.2)

Keterangan :

(

)

:

jumlah X dan Y yang ada di dalam transaksi secara

bersamaan.

(36)

Atau dapat ditulis sebagai berikut:

,

(

)

=

( , )

( )

...(2.3)

Keterangan :

( , )

: jumlah nilai support untuk X dan Y

( )

:

jumlah nilai support untuk X

Sedangkan

Minconf

(minimum confidence) menandakan ambang batas

(threshold) dari sebuah aturan asosiasi untuk menentukan aturan asosiasi yang

kuat (strong association rule).

Misalnya terdapat himpunan data transaksi A sebagai berikut :

Tabel 2.1 Contoh Tabel Transaksi A (Tan,et.al, 2006)

TID

Itemset

1

Bread, Milk, Diaper

2

Bread,Diaper,Beer,Eggs

3

Milk,Beer,Coke

4

Bread,Milk,Diaper,Beer

5

Bread,Milk,Diaper,Coke

Misalkan akan dihasilkan rule

: {Milk,Diaper}

→Beer

Maka support

menjadi

s

=

σ( , , )

| |

=

= 0.2

Confidence

menjadi

c

=

σ( , , )

(37)

Pada proses pencarian aturan asosiasi ini dapat dibagi menjadi 2

tahapan, yang terdiri dari :

1. Pencarian frequent itemset

Yaitu proses pencarian semua

itemset

yang memiliki nilai

support

minsup.

Itemset

ini disebut

frequent itemset

atau

large itemset

(l-itemset).

2. Pembentukan strong association rule

Yaitu proses mendapatkan aturan asosiasi yang kuat (strong

association rule) dari kombinasi

frequent itemset

yang membentuk

aturan asosiasi yang memiliki nilai confidence

minconf.

2.3. Algoritma

Arima (A Rare Itemset Miner Algorithm)

Algoritma

Arima

merupakan algoritma untuk mencari

rare itemset.

Rare itemset

adalah itemset yang muncul bersama-sama dalam sedikit

transaksi atau persentase sangat kecil pada transaksi dalam database.

Pembentukan rare itemset

dilakukan dengan mencari semua kombinasi item –

item

yang memiliki support

lebih kecil atau sama dengan

minsup

yang telah

ditentukan.

Suatu aturan asosiasi disebut

rare,

jika

support

kurang dari nilai

minimum support. Aturan asosiasi rare

r adalah benar jika r adalah confident,

(38)

Minimal rare itemset (mRI)

adalah suatu itemset yang sangat jarang

terjadi tetapi semua

subset

sering terjadi.

Minimal zero generator (mZG)

adalah suatu itemset yang bernilai nol

dari semua subset yang bukan nol itemset

(non-zero itemsets).

Gambar 2.2 Kiri : Contoh Dataset (D). Kanan : Rangkaian pola

Dataset D (Szathmary, L., et.al, 2007).

Pada gambar 2.3 digambarkan proses pencarian rare itemset dengan

nilai minsup=3. Pada C

1

atau candidate-1

ada 5 itemset yang terdiri dari ({A},

{B}, {C}, {D}, dan {E}). {D} merupakan minimal rare itemset(mRI)

karena

itemset ini memiliki nilai support lebih kecil dari

minimum support

yang

(39)

Kemudian pada C

2

atau

candidate-2

ada 10 itemset yang terdiri dari ({AB},

{AC}, {AD}, {AE}, {BC}, {BD}, {BE}, {CD}, {CE}, dan {DE}). {CD}

merupakan

minimal zero generator (mZG)

karena nilai support itemset

bernilai nol, ({AD}, {BD}, {DE}) merupakan rare itemset

karena itemset ini

memiliki nilai support lebih kecil dari

minimum support

yang ditentukan,

({AB}, {AC}, {AE}, {BC}, {BE}, {CE}) merupakan

frequent itemset. Pada

C

3

atau

candidate-3

ada 10 itemset yang terbentuk yaitu ({ABC}, {ABD},

{ACD}, {ACE}, {ABE}, {ADE}, {BCD}, {BCE}, {BDE}, dan {CDE}).

({ABC}, {ACE}) merupakan

minimal rare itemset(mRI)

karena itemset ini

memiliki nilai support lebih kecil dari

minimum support

yang ditentukan,

({ABD},{ADE}, {BDE}) merupakan rare itemset

karena itemset ini memiliki

nilai support lebih kecil dari

minimum support

yang ditentukan,

({ACD},

{BCD}, {CDE}) merupakan rare itemset

dengan nilai support 0 dan ({ABE},

{BCE}) merupakan frequent itemset.

Kemudian pada C

4 atau candidate-4

ada 5

itemset yang terbentuk yaitu ({ABCD}, {ACDE}, {ABCE}, {ABDE}, dan

{BCDE}). ({ABCD}, {ACDE}, {BCDE}) merupakan

rare item

dengan nilai

support 0 dan ({ABCE}, {ABDE}) merupakan

rare itemset. Proses ini

berhenti pada C

5 atau candidate-5

karena pada tahap ini tidak ada rare itemset

yang terbentuk.

Apabila diketahui :

(40)

mRI = minimal rare itemset

S = menyimpan semua atribut di dataset

i = jumlah itemset

= candidate itemset

untuk ukuran i

= rare itemset

untuk ukuran i

= candidate itemset

Maka pseudocode

untuk pencarian

rare itemset

menggunakan

algoritma Arima

adalah sebagai berikut (Szathmary, L., et.al, 2007) :

Inisialisasi mZG

= null

Inisialisasi S = semua atribut di dataset

Inisialisasi i = jumlah terkecil itemset di mRI

Tambahkan semua itemset terkecil di mRI

ke dalam

Tambahkan anggota

atau nilai support = 0 ke dalam mZG

Tambahkan anggota

atau nilai support > 0 ke dalam

While (

ø)

Loop over the elements of

(r)

//in Cand no duplicates are allowed:

fall possible supersets of r using S;

loop over the elements of

(c)

if c has a proper subset in mZG, then

delete c from

;

//i.e., if c is a superset of a min. zero gen.

//no duplicates are allowed in

:

;

= ø; //re-initializing

SupportCount(

); //requires one database pass

{(i + 1)-long itemsets in mRI};

mZG

mZG

{z €

| support(z) = 0};

{r €

| support(r) > 0};

i

i + 1;

; //(all non-zero) rare itemsets

Gambar 2.3 Algoritma

Arima (A Rare Itemset Miner Algorithm)

(41)

Algoritma diatas dapat dijelaskan sebagai berikut :

a. Pada iterasi pertama dihitung jumlah kemunculan setiap item dalam

transaksi untuk menentukan

large 1-itemset. Pada iterasi selanjutnya

akan dihasilkan

candidate k-itemset

menggunakan

rare-itemset

yang

ditemukan pada iterasi sebelumnya.

b. Setelah itu, dilakukan penelusuran data untuk menghitung support bagi

setiap

candidate itemset

dalam

. Dalam tahap ini pastikan tidak

ada duplikat untuk

. Untuk itu jika suatu data telah terdaftar di

mZG

maka data tersebut akan dihapus di dalam

.

c. Kemudian akan dilakukan eliminasi

minimal zero generator

yang

memiliki nilai

support

sama dengan 0 dan eliminasi

rare itemset yang

memiliki nilai

support

lebih besar dari 0. Sedangkan semua

candidate

k-itemset

yang memenuhi

minsup

disimpan dalam

yang akan

digunakan untuk membentuk

large (k+1)-itemset. Algoritma berakhir

ketika tidak ada

large itemset

baru yang dihasilkan.

Algoritma

Arima

menggunakan arah pencarian

bottom-up, dimana

arah pencarian dimulai dari

rare itemset

menuju

itemset

terpanjang.

Strategi yang digunakan adalah

breadth-first search

dimana proses

(42)

support-nya untuk menemukan rare itemset

pada level

tersebut. Sedangkan

strategi perhitungan nilai

support

dilakukan dengan

horizontal counting,

dengan cara membaca transaksi satu persatu, jika ditemukan

itemset

yang

dicari pada transaksi tersebut maka

counter

bertambah satu, begitu

selanjutnya.

2.4.Contoh Penerapan Algoritma

Arima (A Rare Itemset Miner Algorithm)

Berikut akan ditunjukkan cara kerja algoritma

Arima

untuk

menemukan

rare itemset

dan menemukan aturan asosiasi yang tepat dengan

minsup=3.

Tabel 2.2 adalah contoh dataset yang akan digunakan untuk

menemukan aturan asosiasi langka yang terdapat pada data tersebut.

Tabel 2.2 Tabel Transaksi B (Szathmary, L., et.al, 2007)

ID

Itemset

1

A, B, D, E

2

A, C

3

A, B, C, E

4

B, C, E

5

A, B, C, E

Dari tabel diatas maka proses pencarian rare itemset

dengan algoritma

Arima

adalah sebagai berikut :

mZG = ø

S = {A, B, C, D, E)

i = 1

C

1

R

1

(43)

{A}

4

{D}

1

{B}

4

{C}

4

{D}

1

{E}

4

mZG

before

= ø

mZG

after

= ø

C

2

R

2

Candidate 2-itemset

Support

Rare 2-itemset

Support

{A, D}

1

{A, D}

1

{B, D}

1

{B, D}

1

{C, D}

0

{E, D}

1

{E, D}

1

mZG

before

= ø

mZG

after

= {CD}

C

3

R

3

Candidate 3-itemset

Support

Rare 3-itemset

Support

{A, B, D}

1

{A, B, D}

1

{A, D, E}

1

{A, D, E}

1

{B, D, E}

1

{B, D, E}

1

{A, B, C}

2

{A, B, C}

2

{A, C, E}

2

{A, C, E}

2

mZG

before

= {CD}

mZG

after

= {CD}

C

4

R

4

Candidate 4-itemset

Support

Rare 4-itemset

Support

{A, B, D, E}

1

{A, B, D, E}

1

{A, B, C, E}

2

{A, B, C, E}

2

mZG

before

= {CD}

mZG

after

= {CD}

C

5

R

5

Candidate 5-itemset

Support

Rare5-itemset

Support

(44)

mZG

before

= {CD}

mZG

after

= {CD}

Gambar 2.4 Pencarian

candidate itemset

dan

rare itemset

dengan

min_supp=3

Penerapan algoritma

Arima

pada dataset B (Tabel 2.2) dengan

min_supp = 3

diilustrasikan pada Gambar 2.3. Algoritma pertama

mengambil mRI terkecil, {D}, yang bukan

non-zero

akan disalin ke

R

1

.

2-long

supersets

dihasilkan dan disimpan di

C

2

({AD}, {BD}, {CD}

dan

{DE}).

Karena

{CD}

adalah

zero itemset, maka data ini disalin ke daftar

mZG.

Kemudian yang

Non-zero itemsets

akan disalin ke

R

2

. Untuk setiap

rare

itemset

di R

2

, memungkinkan supersets yang dihasilkan. Misalnya, dari {AD}

dapat menghasilkan kandidat berikut:

{ABD}, {ACD},

dan

{ADE}.

Jika

kandidat memiliki

subset mZG,

maka kandidat pasti

zero itemset

dan dapat

dipangkas ({ACD}). Kandidat

non-zero

berpotensi disimpan di

C

3

. Duplikat

tidak diperbolehkan dalam tabel

C

i

. Dari

mRI 3-long itemsets

ditambahkan ke

C

3

({ABC} dan {ACE}).

Algoritma berhenti jika tabel

R

i

kosong. Gabungan tabel

R

i

memberikan

semua

non-zero rare itemsets.

Pada akhirnya, semua

mZGs

dijadikan satu,

jadi jika diperlukan,

zero itemsets

dapat dengan mudah diambil dari daftar ini.

Berdasarkan pencarian

rare itemset

diatas maka dapat dibuat tabel

(45)

Tabel 2.3

minimal Rare itemset (mRI)

dengan

minimum support

= 3

minimul Rare itemset (mRI)

Support

{D}

1

{ABC}, {ACE}

2

Dari contoh diatas dapat dilihat bahwa bila nilai

minsup

dinaikan

maka akan banyak

candidate itemset

yang terbentuk, sehingga

menyebabkan banyak pengulangan.

Sehingga dengan rare itemset

yang ditemukan diatas dapat diproses

sebagai berikut :

Subset

dari rare itemset

: {D} ,{ABC}, {ACE}.

Dari subset

yang ada dapat dibentuk aturan asosiasi sebagai berikut :

a. A

B & C

c

(

A

B & C

)= s

(A,B,C)/s

A

=2/4

=50%

b. B & C

A

c

(

B & C

A

)= s

(A,B,C) /

s

(B,C)

=2/2

=100%

c. B

A & C

(46)

=50%

d. A & C

B

c

(

A & C

B

)= s

(A,B,C) /

s

(A,C)

=2/3

=75%

e. C

A & B

c

(

C

A & B)= s

(A,B,C)/s

C

=2/4

=50%

f.

A & B

C

c

(A & B

C

)= s

(A,B,C) /

s

(A,B)

=2/3

=75%

g. A

C & E

c

(

A

C & E)= s

(A,B,E)/s

A

=2/4

=50%

h. C & E

A

c

(C & E

A

)= s

(A,C,E) /

s

(C, E)

=2/3

(47)

i.

C

A & E

c

(

C

⇒A &

E

)= s

(A,C,E)/s

C

=2/4

=50%

j.

A & E

C

c

(

A & E

C

)= s

(A,C,E) /

s

(A,E)

=2/3

=75%

k. E

A & C

c

(

E

A & C)= s

(A,C,E)/s

E

=2/4

=50%

l.

A & C

E

c

(A & C

E

)= s

(A,C,E) /

s

(A,C)

=2/3

=75%

Semua aturan asosiasi yang ada ternyata mempunyai nilai

(48)

27

BAB III

ANALISIS DAN PERANCANGAN SISTEM

Perancangan program aplikasi dalam skripsi ini menggunakan aturan

linear

sequential (waterfall)

. Pada bab ini akan dibahas tahap pertama dan kedua yaitu

analisis dan definisi kebutuhan, perancangan sistem dan perangkat lunak.

Tahap-tahap yang digunakan adalah sebagai berikut

3.1. Fase Analisis Kebutuhan Sistem

3.1.1. Identifikasi Masalah

Teknik asosiasi adalah salah satu teknik data mining yang sering

digunakan untuk menemukan aturan

(rule)

yang tersembunyi di dalam suatu

kumpulan data. Saat ini banyak algoritma yang menggunakan teknik asosiasi.

Salah satunya adalah algoritma

ARIMA (A Rare Itemset Miner Algorithm).

Algoritma ini adalah salah satu algoritma yang digunakan untuk mencari aturan

(rule)

yang jarang terjadi atau langka pada suatu kumpulan data.

Dalam menyelesaikan masalah ini, kadang ditemukan kendala seperti

belum ada aplikasi yang menerapkan teknik asosiasi langka, sehingga penerapan

algoritma dilakukan secara manual.

Aplikasi yang akan dibangun ini diharapkan mampu membantu dalam

(49)

Association Rule Mining

(RARM) dengan algoritma

Arima (A Rare Itemset

Miner Algorithm)

pada penambangan data.

3.1.2. Pernyataan Masalah

Tabel 3.1 di bawah ini merupakan pernyataan masalah dan solusi yang

akan diterapkan pada sistem.

Tabel 3.1 Tabel Pernyataan Masalah

Pernyataan Masalah

Solusi

Belum ditemukan sistem yang

dapat membantu menemukan

aturan asosiasi langka.

Membuat sistem yang dapat digunakan

untuk menemukan aturan asosiasi

langka dengan menerapkan teknik

Rare

Association Rule Mining

(RARM)

dengan algoritma

Arima

(A Rare

Itemset

Miner

Algorithm)

pada

penambangan data.

3.1.3. Kebutuhan Perangkat Keras

Perangkat keras yang dibutuhkan untuk membangun sistem adalah

sebagai berikut :

1. Processor Intel core

i3

2.40GHz

2. Memori RAM 2 GB

3.1.4.

Kebutuhan Perangkat Lunak

Perangkat lunak yang dibutuhkan untuk membangun sistem adalah

(50)

1. Sistem Operasi Windows 7 Home Premium

2. NetBeans IDE 6.7

3. Java Development Kit (JDK) versi 1.6.12

4.

Server

basis data MySQL

Server

versi 5.2 dan Oracle Database

10g Express Edition.

5. SQL Yog Community-Edition versi 5.22a dan SQL developer

3.1.5. Gambaran Sistem Baru

Gambar 3.1 di bawah ini merupakan diagram konteks yang digunakan.

Gambar 3.1 Diagram Konteks

Application for Mining Rare Association Rule

berfungsi sebagai

alat bantu untuk mendapatkan aturan asosiasi yang tepat dan akurat.

Aplikasi ini akan dibuat dengan menggunakan bahasa pemrograman

Java

dan merupakan aplikasi desktop. Teknik yang digunakan sebagai

engine

dalam sistem ini adalah teknik

Rare Association Rule Mining

(RARM) dengan algoritma

Arima (A Rare Itemset Miner Algorithm)

(51)

3.1.5.1

Input Sistem

Langkah awal yang dilakukan dalam sistem adalah

menginputkan data yang akan dilakukan pemrosesan

penambangan data. Pada tahap ini jenis tipe file yang dapat

digunakan adalah

.csv, .xls

dan data yang berasal dari

database

(

MySql

dan

Oracle)

. Untuk tipe file

.csv

dan

.xls

pengguna

tidak dapat memilih kolom, sedangkan untuk data yang

berasal dari

database

pengguna dapat memilih kolom yang

diinginkan. Selain data yang diinputkan,

minimum support

dan

minimum confidence

juga harus diinputkan sehingga data yang

ada dapat digunakan untuk proses selanjutnya yaitu penerapan

algoritma ARIMA

(A Rare Itemset Miner Algorithm).

3.1.5.2

Proses Sistem

Proses yang akan terjadi di dalam sistem adalah :

a. Mengambil data dari direktori tertentu yang disimpan

dalam bentuk file

excel, .csv,

dan juga data pada

database

(MySql

dan

Oracle)

dan ditampilkan pada tabel

view

. Data

ini merupakan data yang telah dikenai pemrosesan awal.

b. Membaca nilai

minimum support

dan

minimum confidence

(52)

c. Membaca data yang ditampilkan pada tabel

view

. Mencari

semua

candidate 1-itemset

beserta

count

dan

support

untuk

masing – masing

candidate

. Hasil perhitungan

support

nya

akan digunakan untuk penentuan

rare 1-itemset

yakni

dengan membandingkan nilai

support candidate

dengan

minimum support

yang telah dimasukkan pengguna.

Candidate 1-itemset

yang memiliki nilai support lebih

kecil atau sama dengan

minimum support

akan menjadi

rare 1-itemset

.

d. Mencari

rare k-itemset

dengan membuat semua kombinasi

candidate 1-itemset

yang ada hingga membentuk

candidate

2-itemset

untuk mendapatkan

rare 2-itemset

dan seterusnya

hingga tidak ada lagi

rare itemset

yang dapat dibentuk.

e. Membuat semua kemungkinan aturan asosiasi langka.

Diawali dengan pembentukan

subset

dari

rare itemset

yang

telah ada.

Subset – subset

tersebut akan dikombinasikan

untuk membentuk aturan, dimana ada

subset

yang menjadi

anteseden dan ada

subset

yang menjadi konsekuen. Lalu

akan dihitung nilai

confidence

untuk masing – masing

aturan dengan cara mengambil nilai

support

masing –

masing

subset

dan dihitung. Nilai

confidence

tiap aturan

(53)

dimasukkan oleh pengguna. Jika nilai

confidence

nya lebih

besar atau sama dengan

minimum confidence

maka aturan

tersebut adalah aturan asosiasi yang kuat.

f.

Menampilkan semua hasil

Arima

berupa semua

rare

itemset

dan aturan asosiasi yang kuat sebagai output.

g. Hasil

arima

yang diperoleh dapat disimpan dalam

file

.txt

atau .doc

3.1.5.3

Output Sistem

Sistem yang dibuat akan menghasilkan keluaran

(

output

) sebagai berikut :

a. Data dan jumlah data

Sistem akan menampilkan semua data kategori penilaian

yang dibaca dari file

excel, .csv,

dan juga data pada

database (MySql

dan

Oracle)

yang sudah dilakukan

pemrosesan awal beserta jumlah dari masing–masing data

tersebut.

b.

Minimum support

dan

minimum confidence

Sistem akan menampilkan nilai

minimum support

dan

minimum confidence

yang dimasukkan pengguna.

(54)

Sistem akan menampilkan semua

rare itemset

dimulai dari

rare 1-itemset

hingga

rare k-itemset

beserta nilai

support

nya masing masing.

d. Semua aturan asosiasi yang kuat

Sistem akan menampilkan semua aturan asosiasi yang

kuat.

3.1.6. Diagram

Use Case

Gambar 3.2 di bawah ini merupakan diagram

use case

pada

Application For Mining Rare Association Rule.

(55)

3.1.7. Ringkasan Use Case

Tabel 3.2 di bawah ini merupakan penggambaran umum mengenai

Use Case

pada

Application For Mining Rare Association Rule.

Tabel 3.2 Deskripsi

Use Case

Nomor

Use Case

Nama

Use Case

Deskripsi

MRAR-001

Koneksi

Database

Use case ini menggambarkan proses

sistem terkoneksi ke database yang

akan digunakan untuk melakukan

pencarian aturan asosiasi.

MRAR -002

Input Data

Use case ini menggambarkan proses

input data yang berbentuk file sehingga

data dapat digunakan untuk mencari

aturan asosiasi yang kuat.

MRAR -003

Buat Aturan

Use case ini menggambarkan proses

pembuatan aturan asosiasi yang kuat.

MRAR -004

Simpan Aturan

Use case ini menggambarkan proses

menyimpan

aturan

asosiasi

yang

terbentuk dari proses penambangan

data.

3.1.8. Narasi Use Case

Setiap

usecase

pada bagian sebelumnya akan dijelaskan lebih rinci

dalam sebuah narasi yang merupakan deskripsi tekstual dari kejadian bisnis

dan bagaimana pengguna berinteraksi dengan sistem untuk menyelesaikan

tugas tersebut.

Gambar

Gambar 2.1 Pengembangan sistem menggunakan model Waterfall
Tabel 2.1 Contoh Tabel Transaksi A (Tan,et.al, 2006)
Gambar 2.2 Kiri : Contoh Dataset (D). Kanan : Rangkaian pola
Gambar 2.3 Algoritma Arima (A Rare Itemset Miner Algorithm)(Szathmary, L., et.al, 2007)
+7

Referensi

Dokumen terkait

terjemah ke penerjemah tersumpah à legalisir Kemenkumham (terjemahan) à legalisir Kemenlu (terjemahan) à Legalisir Kedubes Austria (asli dan terjemahan).

Untuk itu diperlukan pengelolaan dengan co-management melalui pengaturan koordinasi yaitu pembentukan forum stakeholder dari MOU antara BTNK dan Pemerintah Kabupaten Jepara,

Biji tanaman jagung yang memiliki ukuran seragam terlebih dulu dibersihkan permukaannya pada air mengalir hingga hilang sisa pestisida atau fungisidanya lalu dilakukan

Dalam prosedur penempatan siswa untuk praktik kerja industri, SMK Negeri 1 Sayung menjalin kerjasama dengan dunia usaha/ dunia industri (DU/DI) dalam memilih dan

(If Dalam  kondisi  normal,  baku  mutu  air  limbah  sebagaimana  climaksud  dalam  Pasal  4  setiap  saat  tidak  boleh  dilampaui  oleh  perianggung  jawab 

Orang asing yang telah berjasa kepada negara Republik Indonesia atau dengan alasan kepentingan negara dapat diberi Kewarganegaraan Republik Indonesia oleh Presiden setelah memperoleh

[r]

Berdasarkan struktur biaya usahatani padi sawah baik pada MH maupun MK pada petani SL-PTT maupun non SL- PTT ada beberapa temuan yang sejalan dengan hasil penelitian Nurasa