• Tidak ada hasil yang ditemukan

Abrianto Ascein Gultom¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

N/A
N/A
Protected

Academic year: 2021

Membagikan "Abrianto Ascein Gultom¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom"

Copied!
8
0
0

Teks penuh

(1)

PENCARIAN KOMBINASI ASOSIASI PALING SEDERHANA YANG TAK TERDUGA DENGAN MENGGUNAKAN ALGORITMA MINZOOMUR DISCOVERING THE MINIMAL SET OF UNEXPECTED PATTERNS USING MINZOOMUR ALGORITHM

Abrianto Ascein Gultom¹, -²

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom Abstrak

Data mining adalah proses mengekstrak dan menganalisa data dalam jumlah besar untuk

mendapatkan pengetahuan dari data yang ada. Analisis asosiasi sebagai salah satu fungsionalitas data mining adalah proses pencarian pola-pola, asosiasi, atau korelasi yang sering muncul (frekuentatif)dari sekumpulan objek.

Tugas akhir ini akan menerapkan Algoritma MinZoomUR sebagai salah satu algoritma asosiasi untuk mencari pola tak terduga yang sering muncul. Algoritma ini dalam proses pencarian polanya bekerja dengan bantuan metoda zoomout dan zoomin. Di fase pertama ZoomUr, dengan metoda zoomin melakukan pencarian pola-pola tak terduga yang merupakan penyempurnaan dari semua perkiraan sebelumnya. Fase kedua ZoomUR, dari semua asosiasi yang dihasilkan dari fase pertama dilakukan generalisasi untuk menghasilkan pola yang juga tidak diduga. Pendekatan seperti ini akan menghasilkan asosiasi yang lebih sedikit dan lebih menarik dibanding

pendekatan lainnya yang sudah ada.

Meskipun menghasilkan hanya asosiasi yang tidak diduga, tetap saja masih ada kemungkinan metoda zoomout menghasilkan banyak asosiasi yang diantaranya redundant dan dapat ditebak dari asosiasi lainnya yang lebih umum. Karena itu, kita perlu menentukan aturan mana yang diterapkan pada data set berdasarkan asumsi monotonicity. Dari hasil analisis, performansi MinZoomUR cukup baik dalam menghasilkan asosiasi relevan. Tulisan ini akan membahas bagaimana Algoritma MinZoomUR menemukan kombinasi terkecil asosiasi relevan yang tidak diduga dari sejumlah objek.

Kata Kunci : data mining, Algoritma MinZoomUR, zoomin, zoomout, frequent pattern, dan redundant

Abstract

Data mining refers to extracting and analyzing large amounts of data to get meaningful knowledge. Association analysis as a functionality of data mining is a process of observating frequent patterns from a set of objects.

This final project will apply MinZoomUR as an association algorithm to find unexpected

(frequent) pattern. Tthe process of searching those patterns, MinZoomUR works by two mwthods, zoomin and zoomout. In the first phas eof ZoomUR, zoomin discovers all unexpected patterns that are refinements to any belief. In the second phase of ZoomUR, starting from all the unexpected refinements, zoomout discovers more general rules that also unexpected. This approach generated far fewer and more interesting patterns than traditional approach.

Though ZoomUR discovers only unexpected rules, it still discovers large numbers of rules many of which are redundant in the sense that they can be inferred from other discovered rules. Thus, to address this issue, we formally characterize minimality of a set of unexpected patterns based on the monotonicity assumption. MInnZoomUR has good performance in term discovering relevant association rules. This paper describe how MinZoomUR discover minimal set of unexpected patterns.

(2)

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

Perkembangan data mining yang sangat pesat membuat para pengembang perangkat lunak untuk terus melakukan perbaikan dan penyempurnaan aplikasi berbasis data mining. Walaupun dari proses mining, asosiasi khususnya, masih banyak terjadi kekurangan baik dari segi biaya (cost) yang ditimbulkan maupun hasil yang didapat.

Permasalahan yang sering terjadi yaitu metode apapun yang diterapkan pada data mining tidak pernah memperhitungkan pengetahuan pengguna mengenai data. Pada banyak segmen bisnis, pada umunya manager dan analis memunyai insting yang tajam berdasarkan pengalaman bertahun-tahun. Disamping itu, walaupun pada dunia nyata subjektifitas masih memegang peranan yang besar dalam menentukan asosiasi atau aturan yang dibentuk berdasar transaksi yang sudah ada, tetap masih diperlukan suatu mekanisme mining pada level aplikasi yang memberikan data statistik yang dapat dijadikan pegangan atau pedoman untuk melakukan pengembangan selanjutnya.

Sebagai contoh, pengguna mempunyai keyakinan adanya pola yang mengaitkan status profesional dan waktu belanja malam hari. Sehingga diperoleh belief [profesional → malam], namun dari data transaksi yang ada bisa dihasilkan rule asosiasi yang tidak terduga seperti “para profesional diakhir pekan cenderung berbelanja di siang hari”, digambarkan [profesional, hari libur → siang]. Informasi yang tidak terduga namun menarik inilah yang akan diteliti.

Dan dikarenakan asosiasi merupakan suatu bagian dari data mining yang cukup banyak diterapkan di berbagai industri, maka haruslah dipilih algoritma asosiasi yang dapat menghasilkan aturan yang minimal dalam kombinasi, namun akurat dan relevan. Pada tugas akhir ini digunakan Algoritma MinZoomUR untuk memenuhi kriteria tersebut.

1

(3)

I - 2

1.2 Rumusan Masalah

Permasalahan yang dijadikan objek penelitian dan pengembangan tugas akhir ini adalah bagaimana mengimplementasikan dan menghasilkan rules yang akurat dan relevan, dan membuang rules yang tidak akurat dan tidak relevan, sehingga rules yang dihasilkan cenderung minimal dalam kombinasi namun maksimal dalam tingkat relefansinya.

1.3 Tujuan Tugas Akhir

Tugas akhir ini bertujuan untuk :

1. Menganalisis, merancang, dan mengimplementasikan Algoritma MinZoomUR.

2. Menganalisis sifat rules yang dihasilkan.

1.4 Batasan Masalah

Untuk menghindari meluasnya materi pembahasan tugas akhir ini, maka penulis membatasi permasalahan dalam tugas akhir ini hanya mencakup hal-hal berikut :

1. Tidak membahas secara mendalam perbandingannya algoritma asosiasi lain dengan Algoritma MinZoomUR.

2. Tidak membahas mengenai optimasi performansi proses mining dari segi cost.

(4)

1.5 Metodologi Penelitian

Metodologi penelitian penyusunan tugas akhir ini adalah sebagai berikut : 1. Studi literatur

Mempelajari buku, makalah, dan referensi lain yang mendukung penyusunan tugas akhir

2. Pengumpulan Data

Mencari dan mengumpulkan data yang sesuai dengan dataset untuk pengujian implementasi asosiasi dengan multiple minsup

3. Desain dan Perancangan Implementasi

Melakukan desain dan perancangan implementasi perangkat lunak mining association rules

4. Pengujian & Analisis

Mengimplementasikan perangkat lunak yang akan dibangun, melakukan pengujian implementasi dengan data transaksi, dan menganalisa hasil implementasi.

5. Pengambilan Kesimpulan

Kesimpulan diambil berdasarkan analisis hasil pengujian.

1.6 Sistematika Penulisan Tugas Akhir

Tugas akhir ini disusun dengan sistematika sebagai berikut :

BAB I : Pendahuluan

Pada bab ini disampaikan latar belakang penelitian, tujuan pembahasan, perumusan masalah, batasan masalah, metode penelitian, dan sistematika penulisan tugas akhir

BAB II : Dasar Teori

Pada bab ini memuat dasar teori yang mendukung dan mendasari penulisan tugas akhir ini.

(5)

I - 4

BAB III : Analisis dan Perancangan Sistem

Pada bab ini dibahas analisa dan perancangan implementasi penggunaan multiple minimum supports dengan MinZoomUR

BAB IV : Implementasi dan Pengujian

Bab ini membahas kebutuhan perangkat lunak dan perangkat keras yang digunakan untuk merealisasikan sistem. Selain itu pada bab ini akan dibahas pengujian dan hasil uji coba sistem.

BAB V : Kesimpulan dan Saran

Pada bab ini diberikan kesimpulan dari serangkaian penelitian yang dilakukan dan saran pengembangan selanjutnya.

(6)

Powered by TCPDF (www.tcpdf.org)

(7)

BAB V

KESIMPULAN & SARAN

5.1 Kesimpulan

1. MinZoomUR efektif dalammenghasilkan hanya unexpected rule saja sehubungan dengan dugaan yang diberikan.

2. Semakin banyak belief yang diinputkan, semakin banyak juga rule yang dihasilkan. Sedangkan semakin besar batas minconf jumlah rule asosiasi semakin sedikit.

3. Jumlah rule yang dibangkitkan berbanding terbalik dengan nilai minsup dan minconf. Semakin kecil nilai minsup dan minconf, semakin banyak rule yang dihasilkan, dan begiu juga sebaliknya.

4. MinZoomUR bersifat efisien dari segi waktu pemrosesan bila mana memenuhi kondisi jumlah belief yang menjadi inputan relatif sedikit, dan minsup yang diberikan relatif besar. Dan pada kondisi sebaliknya didapat tidak efisien.

5.2 Saran

1. Karena MinZoomUR hanya menghasilkan unexpected rule saja, perlu dilakukan penggabungan antara MinZoomUR dengan algoritma lain yang menghasilkan semua rule yang kuat, Apriori misalnya.

2. Menggunakan representasi data yang efisien untuk merepresentasikan negasi(not).

(8)

[1] Jiawai Han, Micleine Kamber. Data Mining : Concepts and Techniques. Simon Fraser University. Morgan Kaufmann Publisher. 2001

[2] Padmanabhan, B. and Tuzhilin, A., A Belief-Driven Method for Discovering Unexpected Patterns. In Proc. 4th Int’l Conf. on Know. Discovery and Data Mining, 1998.

[3] Padmanabhan, B. and Tuzhilin, A., Unexpectedness as a Measure of Interestingness in Knowledge Discovery. 1999.

[4] Padmanabhan, B. and Tuzhilin, A., on Characterization and Discovery of Minimal Unexpected Pattern in data Mining Applications.2000

[5] Kusumo, Dana S. Data Mining dengan Algoritma Apriori pada RDBMS. 2001. [6] Yudho Giri Sucahyo. Data Mining Menggali Informasi yang Terpendam. Ilmu

Komputer.com. 2001.

[7] Silberschatz, A. and Tuzhilin, A., 1996. What Makes Patterns Interesting in Knowledge Discovery Systems. IEEE Transactions on Knowledge and Data Engineering. Special Issue on Data Mining, vol. 5, no. 6, pp. 970-974.

[8] Alam, M. Agus J. “Belajar Sendiri : Borland Delphi 6.0” Elex Media Komputindo : Jakarta. 2001

Powered by TCPDF (www.tcpdf.org)

Referensi

Dokumen terkait

Algoritma Naive Bayes Classifier dapat diimplementasikan untuk klasifikasi ketepatan waktu lulus mahasiswa dan menghasilkan prosentase klasifikasi yang cukup bagus,

Pengujian dan analisis hasil, yaitu langkah yang diambil untuk menilai performansi algoritma PUBLIC dalam perangkat lunak dengan parameter yang disebutkan dalam batasan

Dari hasil percobaan yang didapatkan, metode NormalShrink cukup baik dalam menghilangkan noise, serta didapatkan kesimpulan performansi yang lebih baik antara denosing yang

Adapun permasalahan yang akan diteliti dalam tugas akhir ini adalah bagaimana mengimplementasikan berbagai tingkatan QoS dengan menggunakan arsitektur Diffserv pada jaringan

Agar skema watermarking dengan Wavelet-ICA menghasilkan performansi yang baik, hal yang dilakukan pada penelitian sebelumnya adalah mencari dan menentukan nilai koefisien pencampur

2014.”Opinion Mining Terhadap Elektibilitas Calon Presiden Indonesia pada Media Sosial Twitter dengan Metode Berbasis Lexicon dan Algoritma Naïve Bayes

Pada tugas akhir ini akan menganalisis kinerja dua algoritma kompresi yaitu Huffman dan LZW Binary Search Tree dalam proses kompresi maupun dekompresi sebuah file plaintext

Perbedaan hasil learning style yang diperoleh berdasarkan clickstream dengan kuesioner VARK sebesar 77,8% dan menghasilkan temuan yang mengindikasikan bahwa learning style