• Tidak ada hasil yang ditemukan

Analisis Kinerja Metode Rough Set dan Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid

N/A
N/A
Protected

Academic year: 2017

Membagikan "Analisis Kinerja Metode Rough Set dan Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid"

Copied!
14
0
0

Teks penuh

(1)

ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID

TESIS

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika

BENY IRAWAN 137038012

PROGRAM STUDI (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

(2)

PERSETUJUAN

Judul : ANALISIS KINERJA METODE ROUGH SET DAN

ALGORITMA APRIORI DALAM IDENTIFIKASI

POLA PENYAKIT DEMAM TIFOID

Kategori : TESIS

Nama : BENY IRAWAN

Nomor induk mahasiswa : 137038012

Program studi : MAGISTER (S2) TEKNIK INFORMATIKA

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA Komisi pembimbing :

Pembimbing II, Pembimbing I,

Dr. Erna Budhiarti Nababan, M.IT Prof. Dr. Opim Salim Sitompul,M.Sc

Diketahui/disetujui Oleh

Program Studi S2 Teknik Informatika Ketua,

(3)

PERNYATAAN

ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI

DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa

kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 23 Agustus 2016

(4)

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN

AKADEMIS

Sebagai civitas akademik Universitas Sumatera Utara, saya yang bertanda tangan dibawah ini :

Nama : Beny Irawan

Nim : 137038012

Program Studi : Magister (S2) Teknik Informatika

Demi pengembangan ilmu pengetahuan, menyetujui memberikan kepada Universitas Sumatera Utara Hak Bebas Royaliti Non-Ekslusif (Non-Exclusive Royality Free Right) atas tesis saya yang berjudul :

ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI

DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID

Beserta perangkat yang ada (jika diperlukan). Dengan hak bebas Royaliti Non-Exclusive ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.

Demikian pernyataan ini dibuat dengan sebenarnya.

Medan, 23 Agustus 2016

(5)

Telah di uji pada

Tanggal: 23 Agustus 2016

PANITIA PENGUJI TESIS

Ketua : Prof. Dr. Opim Salim Sitompul, M.Sc

Anggota : 1. Dr. Erna Budhiarti Nababan, M.IT

2. Prof. Dr. Tulus, Vor.Dipl.Math, M.Si

(6)

DAFTAR RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap : Beny Irawan

Tempat dan Tanggal Lahir : Peureulak, 29 Agustus 1987

Alamat Rumah : Dsn Tanjung Tani Desa Paya Palas Kec.Ranto Peureulak Aceh Timur

Telp/Fax/HP : 08126454174

E-mail : benyirawan77@gmail.com

Instansi Tempat Bekerja : Medistra Lubuk Pakam

Alamat Kantor : Jl. Sudirman No.38 Lubuk Pakam Kab. Deli Serdang 20512 Sumatera Utara – Indonesia

DATA PENDIDIKAN

SD : SD Negeri 1 Tanjung Tani TAMAT : 1999 SLTP : MTSs Nurul Ulum Aceh Timur TAMAT : 2002

SLTA : SMA Negeri 15 Medan TAMAT : 2005

(7)

KATA PENGANTAR

Pertama-tama penulis panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas

segala rahmat, berkat dan karunia-Nya berupa pengetahuan, kesehatan dan

kesempatan yang diberikan kepada penulis sehingga dapat menyelesaikan tesis ini

dengan baik. Tesis penulis yang berjudul : “Analisis Kinerja Metode Rough Set Dan

Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid” merupakan salah

satu syarat akademik penulis sebagai mahasiswa S2, Program Studi Teknik

Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI),

Universitas Sumatera Utara (USU), Medan dalam menyelesaikan jenjang pendidikan

S2.

Dalam kesempatan ini, penulis hendak memberikan penghargaan dan ucapan

terima kasih yang sebesar-besarnya kepada :

1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, SH,

M.Hum atas kesempatan yang diberikan kepada penulis untuk mengikuti dan

menyelesaikan pendidikan Program Pascasarjana.

2. Dekan Fakultas Ilmu Komputer Universitas Sumatera Utara Bapak Prof. Dr.

Opim Salim Sitompul, M.Sc, Ketua Program Studi Magister (S2) Teknik

Informatika, Bapak Prof. Dr. Muhammad Zarlis, M.Sc dan Sekretaris Program

Studi Magister (S2) Teknik Informatika, Bapak M. Andri Budiman, S.T,

M.Comp.Sc., M.E.M beserta seluruh dosen yang telah banyak memberikan

ilmu pengetahuan selama masa perkuliahan serta seluruh staf pegawai pada

Program Studi S2 Teknik Informatika Universitas Sumatera Utara.

3. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya

ucapkan kepada Bapak Prof. Dr. Opim Salim Sitompul, M.Sc, selaku

pembimbing utama dan Ibu Dr. Erna Budhiarti Nababan, M.IT, selaku

pembimbing kedua yang telah banyak memberikan bimbingan, tuntunan,

(8)

4. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya

ucapkan kepada Bapak Prof. Dr. Tulus, Vor.Dipl.Math, M.Si dan Bapak Prof.

Dr. Muhammad Zarlis, M.Sc selaku pembanding/penguji tesis yang senantiasa

memberikan saran, masukan dan arahan kepada penulis dalam penyelesaian

penulisan tesis ini.

Secara khusus penulis mengucapkan rasa terima kasih sedalam-dalamnya

kepada orang tua penulis tercinta dan tersayang, Ayahanda Munzir, Ibunda Fatimah,

kakak penulis Sri Mutia, AMK, S.ARS dan adik-adik penulis Aida Muliana, S.Pd,

Muzirullah, Aulia Syahputra yang telah memberikan perhatian, kasih sayang, motivasi

serta dukungan berupa material dan spiritual kepada penulis.

Penulis juga meyampaikan rasa terima kasih kepada Yuzra Yahya, S.Kep yang

telah membantu dalam pengumpulan data penelitian beserta seluruh keluarga dan

berbagai pihak yang telah banyak membantu, memberikan motivasi, perhatian serta

dukungan kepada penulis. Tak lupa untuk rekan-rekan penulis selama menempuh

pendidikan Magister yang sudah penulis anggap sebagai keluarga yaitu kelas Kom-B

2013, terima kasih untuk kekompakan, keakraban, dan kerjasama selama ini. Penulis

pasti sangat merindukan kalian.

Penulis menyadari bahwa masih terdapat kekurangan dalam penyusunan tesis

(9)

ABSTRAK

Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah

sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat tidaklah

mudah, penelitian ini dapat membantu para pengambil keputusan serta menjadikan

sebagai perbandingan. peneliti melakukan teknik data mining untuk analisa kinerja

metode rough set dan algoritma apriori, kegunaan dari metode rough set yaitu mendapat perkiraan aturan yang singkat dengan fungsi reduksi, sedangkan algoritma

apriori dapat mencari kombinasi item set yang sering muncul dalam basis data dengan

memperhatikan minimum support (minsup), proses utama yang dilakukan algoritma apriori adalah join (penggabungan) dan prune (pemangkasan). Tujuan penelitian ini meningkatkan akurasi metode rough set dan algoritma apriori untuk mendapatkan akurasi identifikasi penyakit demam tifoid. Variabel input awal yang digunakan

sebanyak tujuh varibel. Dari hasil penelitian yang dilakukan pada dataset penyakit

demam tifoid, metode rough set menghasilkan empat panjang rule dan algoritma apriori menghasilkan tiga panjang rule, sedangkan nilai rata-rata akurasi yang

dihasilkan sebesar 87,4% dari kedua metode yang digunakan.

(10)

PERFORMANCE ANALYSIS ROUGH SET METHOD AND APRIORI ALGORITHM IN IDENTIFICATION PATTERN OF

TYPHOID FEVER DIASEASE

ABSTRACT

An element that is very important and everyday needs at this time is an information, to

get a right and accurate information is not easy, this research can help the decision

maker and to make a comparison. The Researcher did the data mining techniques for

make analysis rough sets methods and apriori algorithms, the usefulness of rough set

method that got a brief estimate of the rules with the reduction function, whereas the

Apriori algorithm can find the combination of set items that often appear in the

database by taking into account the minimum support (minsup), the main process has

been done apriori algorithm was join and prune. The purpose of this research to

increases the accuracy of the rough set methods and apriori algorithms to obtain

accurate identification of typhoid fever. Initial input variables used seven variables.

From the results of this research was conducted on a dataset of typhoid fever, rough

set method produces four long rule and apriori algorithm produced three long rule,

while the average value of the resulting accuracy of 87.4% from the second method is

used.

(11)

DAFTAR ISI

Hal

HALAMAN JUDUL TESIS i

LEMBAR PERSETUJUAN ii

LEMBAR PERNYATAAN ORISINALITAS iii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI iv

LEMBAR PENITIA PENGUJI TESIS v

RIWAYAT HIDUP vi

1.4. Tujuan Penelitian 4

1.5. Manfaat Penelitian 4

BAB II TINJAUAN PUSTAKA 5

2.1. Data Mining 5

2.1.1. Data Cleaning 5

2.2.2. Data Transformation 7

2.2. Teori Rough Set 8

2.2.1. Information System dan Decision System 10

2.2.2. Indicernibility Relation 11

2.2.3. Equvalence Class 12

2.2.4. Discernibility Matrix 12

2.2.5. Discernibility Matrix Modulo D 12

2.2.6. Reduct 13

2.2.7. Generating Rules 13

2.3. Algoritma Apriori 14

(12)

2.5. Perbedaan dengan Penelitian Sebelumnya 29

BAB III METODOLOGI PENELITIAN 20

3.1. Diagram Blok Penelitian 21

3.2. Data Collection 21

3.3. Tabulasi Data Penelitian 22

3.4. Pre Prosessing 22

3.4.1. Data Cleaning 23

3.4.2. Data Transformation 23

3.5. Analisis Metode Rough Set 24

3.5.1. Representasi Data 24

3.5.2. Indicernibility Relation 26

3.5.3. Equivalence Class 27

3.5.4. Discernibility Matrix 27

3.5.5. Discernibility Matrix Mod D 28

3.5.6. Reduct 29

3.5.7. Generating Rules 29

3.6. Analisis Penerapan Algoritma Apriori 30

3.6.1. Pola Gejala Penyakit Demam Tifoid 31

3.6.2. Pembentukan Aturan Asosiasi 36

3.6.3. Pembentukan Aturan Asosiasi Final 37

BAB IV HASIL DAN PEMBAHASAN 38

4.1. Pendahuluan 38

4.2. Pra Pengolahan Data 38

4.3. Hasil Implementasi Menggunakan Metode Rough Set 39

4.3.1. Reduct 40

4.3.2. Generating Rules 40

4.4. Analisa Penerapan Algoritma Apriori 42

BAB V KESIMPULAN DAN SARAN 45

5.1. Kesimpulan 45

5.2. Saran 45

DAFTAR PUSTAKA 46

(13)

DAFTAR TABEL

Hal

TABEL 2.1. Data Tidak Lengkap 6

TABEL 2.2. Data Lengkap 6

TABEL 2.3. Data Transformasi 7

TABEL 2.4. Hasil Data Transformasi 7

TABEL 2.5. Information System 10

TABEL 2.6. Information System dengan Atribut Keputusan 11

TABEL 2.7. Equivalence Class 12

TABEL 2.8. Discernibility Matrix 12

TABEL 2.9. Discernibility Matrix Mod D 13

TABEL 2.10. Reduct 13

TABEL 2.11. Penelitian Terdahulu 18

TABEL 3.1. Data Primer 21

TABEL 3.2. Hasil Tabulasi Data Penelitian 21

TABEL 3.3. Tabel Data Transformation 23

TABEL 3.4. Information System 25

TABEL 3.5. Decision System 25

TABEL 3.6. Equivalence Class 27

TABEL 3.7. Discernibility Matrix 28

TABEL 3.8. Discernibility Matrix Mod D 28

TABEL 3.9. Reduct 29

TABEL 3.10. Pola Gejala Penyakit Demam Tifoid 31

TABEL 3.11. Support Dari Tiap Item 32

TABEL 3.12. Pola Kombinasi 2 Itemset 32

TABEL 3.13. Tabel Kombinasi 2 Itemset Memenuhi Minimal Support 33

TABEL 3.14. Pola Kombinasi 3 Itemset 34

TABEL 3.15. Tabel Kombinasi 3 Itemset memenuhi Minimal Support 35

TABEL 3.16. Pola Kombinasi 4 Itemset 35

TABEL 3.17. Aturan Asosiasi 37

TABEL 3.18. Aturan Asosiasi Final 37

TABEL 4.1. Akurasi Rule Rough Set 41

(14)

DAFTAR GAMBAR

Hal

GAMBAR 3.1. Diagram Blok Penelitian 20

GAMBAR 3.2. Data Awal 22

GAMBAR 3.3. Hasil Data Cleaning 23

GAMBAR 3.4. Hasil Transformasi Data 24

GAMBAR 4.1. Data Dalam Bentuk Excel 39

GAMBAR 4.2. Tampilan Hasil Import Data Rosetta 39

GAMBAR 4.3. Hasil Reduct 40

GAMBAR 4.4. Hasil Generating Rule 41

GAMBAR 4.5. Data dalam Bentuk Excel 42

Referensi

Dokumen terkait

yang berpotensi bagi perkembangan perusahaan tersebut untuk mampu bertahan dalam persaingan antar perusahaan yang mempunyai bisnis di bidang yang sama. Khalayak dan

kecil Adanya bidang yang memisahkan ruang Adanya ruang lain sebagai perantara Kesimpulan Dapat digunakan pada ruang-ruang yang mempunyai hubungan erat Dapat digunakan pada

LAPORAN KEUANGAN PEMERINTAH PUSAT TAHUN 2012 ( AUDITED) DAFTAR 28.H.. Nilai

Algoritma K-Means Clustering cocok digunakan untuk mengolah Berat Badan Ideal seseorang serta Ukuran Kerangkanya berdasarkan nilai Tinggi Badan, Berat Badan, danUkuran

Jika kita memperhatikan definisi ibadah yang telah disebutkan pada subbab sebelumnya, maka ibadah itu sangat luas tidak terbatas hanya shalat, zakat,  puasa, haji

Komunikasi dalam ertutur hanya dapat dilakukan dengan baik dan efektif jika sama-sama saling memiliki pengalaman maupun pemahaman yang sama mengenai komunikasi dalam konteks

Kebutuhan Jumlah Rak Penyimpanan Menurut Sis Wuryanto (2003) untuk menghitung kebutuhan rak berkas rekam medis terlebih dahulu menentukan kebutuhan untuk menyimpan

of catch fisheries management based on the carrying capacity of aquatic ecosystems; (2) eradication of IUU fishing activities; (3) improve the institutional capacity of fish