ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika
BENY IRAWAN 137038012
PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
PERSETUJUAN
Judul : ANALISIS KINERJA METODE ROUGH SET DAN
ALGORITMA APRIORI DALAM IDENTIFIKASI
POLA PENYAKIT DEMAM TIFOID
Kategori : TESIS
Nama : BENY IRAWAN
Nomor induk mahasiswa : 137038012
Program studi : MAGISTER (S2) TEKNIK INFORMATIKA
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA Komisi pembimbing :
Pembimbing II, Pembimbing I,
Dr. Erna Budhiarti Nababan, M.IT Prof. Dr. Opim Salim Sitompul,M.Sc
Diketahui/disetujui Oleh
Program Studi S2 Teknik Informatika Ketua,
PERNYATAAN
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 23 Agustus 2016
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai civitas akademik Universitas Sumatera Utara, saya yang bertanda tangan dibawah ini :
Nama : Beny Irawan
Nim : 137038012
Program Studi : Magister (S2) Teknik Informatika
Demi pengembangan ilmu pengetahuan, menyetujui memberikan kepada Universitas Sumatera Utara Hak Bebas Royaliti Non-Ekslusif (Non-Exclusive Royality Free Right) atas tesis saya yang berjudul :
ANALISIS KINERJA METODE ROUGH SET DAN ALGORITMA APRIORI
DALAM IDENTIFIKASI POLA PENYAKIT DEMAM TIFOID
Beserta perangkat yang ada (jika diperlukan). Dengan hak bebas Royaliti Non-Exclusive ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 23 Agustus 2016
Telah di uji pada
Tanggal: 23 Agustus 2016
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Opim Salim Sitompul, M.Sc
Anggota : 1. Dr. Erna Budhiarti Nababan, M.IT
2. Prof. Dr. Tulus, Vor.Dipl.Math, M.Si
DAFTAR RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap : Beny Irawan
Tempat dan Tanggal Lahir : Peureulak, 29 Agustus 1987
Alamat Rumah : Dsn Tanjung Tani Desa Paya Palas Kec.Ranto Peureulak Aceh Timur
Telp/Fax/HP : 08126454174
E-mail : benyirawan77@gmail.com
Instansi Tempat Bekerja : Medistra Lubuk Pakam
Alamat Kantor : Jl. Sudirman No.38 Lubuk Pakam Kab. Deli Serdang 20512 Sumatera Utara – Indonesia
DATA PENDIDIKAN
SD : SD Negeri 1 Tanjung Tani TAMAT : 1999 SLTP : MTSs Nurul Ulum Aceh Timur TAMAT : 2002
SLTA : SMA Negeri 15 Medan TAMAT : 2005
KATA PENGANTAR
Pertama-tama penulis panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas
segala rahmat, berkat dan karunia-Nya berupa pengetahuan, kesehatan dan
kesempatan yang diberikan kepada penulis sehingga dapat menyelesaikan tesis ini
dengan baik. Tesis penulis yang berjudul : “Analisis Kinerja Metode Rough Set Dan
Algoritma Apriori Dalam Identifikasi Pola Penyakit Demam Tifoid” merupakan salah
satu syarat akademik penulis sebagai mahasiswa S2, Program Studi Teknik
Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI),
Universitas Sumatera Utara (USU), Medan dalam menyelesaikan jenjang pendidikan
S2.
Dalam kesempatan ini, penulis hendak memberikan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada :
1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, SH,
M.Hum atas kesempatan yang diberikan kepada penulis untuk mengikuti dan
menyelesaikan pendidikan Program Pascasarjana.
2. Dekan Fakultas Ilmu Komputer Universitas Sumatera Utara Bapak Prof. Dr.
Opim Salim Sitompul, M.Sc, Ketua Program Studi Magister (S2) Teknik
Informatika, Bapak Prof. Dr. Muhammad Zarlis, M.Sc dan Sekretaris Program
Studi Magister (S2) Teknik Informatika, Bapak M. Andri Budiman, S.T,
M.Comp.Sc., M.E.M beserta seluruh dosen yang telah banyak memberikan
ilmu pengetahuan selama masa perkuliahan serta seluruh staf pegawai pada
Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
3. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Opim Salim Sitompul, M.Sc, selaku
pembimbing utama dan Ibu Dr. Erna Budhiarti Nababan, M.IT, selaku
pembimbing kedua yang telah banyak memberikan bimbingan, tuntunan,
4. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya
ucapkan kepada Bapak Prof. Dr. Tulus, Vor.Dipl.Math, M.Si dan Bapak Prof.
Dr. Muhammad Zarlis, M.Sc selaku pembanding/penguji tesis yang senantiasa
memberikan saran, masukan dan arahan kepada penulis dalam penyelesaian
penulisan tesis ini.
Secara khusus penulis mengucapkan rasa terima kasih sedalam-dalamnya
kepada orang tua penulis tercinta dan tersayang, Ayahanda Munzir, Ibunda Fatimah,
kakak penulis Sri Mutia, AMK, S.ARS dan adik-adik penulis Aida Muliana, S.Pd,
Muzirullah, Aulia Syahputra yang telah memberikan perhatian, kasih sayang, motivasi
serta dukungan berupa material dan spiritual kepada penulis.
Penulis juga meyampaikan rasa terima kasih kepada Yuzra Yahya, S.Kep yang
telah membantu dalam pengumpulan data penelitian beserta seluruh keluarga dan
berbagai pihak yang telah banyak membantu, memberikan motivasi, perhatian serta
dukungan kepada penulis. Tak lupa untuk rekan-rekan penulis selama menempuh
pendidikan Magister yang sudah penulis anggap sebagai keluarga yaitu kelas Kom-B
2013, terima kasih untuk kekompakan, keakraban, dan kerjasama selama ini. Penulis
pasti sangat merindukan kalian.
Penulis menyadari bahwa masih terdapat kekurangan dalam penyusunan tesis
ABSTRAK
Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah
sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat tidaklah
mudah, penelitian ini dapat membantu para pengambil keputusan serta menjadikan
sebagai perbandingan. peneliti melakukan teknik data mining untuk analisa kinerja
metode rough set dan algoritma apriori, kegunaan dari metode rough set yaitu mendapat perkiraan aturan yang singkat dengan fungsi reduksi, sedangkan algoritma
apriori dapat mencari kombinasi item set yang sering muncul dalam basis data dengan
memperhatikan minimum support (minsup), proses utama yang dilakukan algoritma apriori adalah join (penggabungan) dan prune (pemangkasan). Tujuan penelitian ini meningkatkan akurasi metode rough set dan algoritma apriori untuk mendapatkan akurasi identifikasi penyakit demam tifoid. Variabel input awal yang digunakan
sebanyak tujuh varibel. Dari hasil penelitian yang dilakukan pada dataset penyakit
demam tifoid, metode rough set menghasilkan empat panjang rule dan algoritma apriori menghasilkan tiga panjang rule, sedangkan nilai rata-rata akurasi yang
dihasilkan sebesar 87,4% dari kedua metode yang digunakan.
PERFORMANCE ANALYSIS ROUGH SET METHOD AND APRIORI ALGORITHM IN IDENTIFICATION PATTERN OF
TYPHOID FEVER DIASEASE
ABSTRACT
An element that is very important and everyday needs at this time is an information, to
get a right and accurate information is not easy, this research can help the decision
maker and to make a comparison. The Researcher did the data mining techniques for
make analysis rough sets methods and apriori algorithms, the usefulness of rough set
method that got a brief estimate of the rules with the reduction function, whereas the
Apriori algorithm can find the combination of set items that often appear in the
database by taking into account the minimum support (minsup), the main process has
been done apriori algorithm was join and prune. The purpose of this research to
increases the accuracy of the rough set methods and apriori algorithms to obtain
accurate identification of typhoid fever. Initial input variables used seven variables.
From the results of this research was conducted on a dataset of typhoid fever, rough
set method produces four long rule and apriori algorithm produced three long rule,
while the average value of the resulting accuracy of 87.4% from the second method is
used.
DAFTAR ISI
Hal
HALAMAN JUDUL TESIS i
LEMBAR PERSETUJUAN ii
LEMBAR PERNYATAAN ORISINALITAS iii
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI iv
LEMBAR PENITIA PENGUJI TESIS v
RIWAYAT HIDUP vi
1.4. Tujuan Penelitian 4
1.5. Manfaat Penelitian 4
BAB II TINJAUAN PUSTAKA 5
2.1. Data Mining 5
2.1.1. Data Cleaning 5
2.2.2. Data Transformation 7
2.2. Teori Rough Set 8
2.2.1. Information System dan Decision System 10
2.2.2. Indicernibility Relation 11
2.2.3. Equvalence Class 12
2.2.4. Discernibility Matrix 12
2.2.5. Discernibility Matrix Modulo D 12
2.2.6. Reduct 13
2.2.7. Generating Rules 13
2.3. Algoritma Apriori 14
2.5. Perbedaan dengan Penelitian Sebelumnya 29
BAB III METODOLOGI PENELITIAN 20
3.1. Diagram Blok Penelitian 21
3.2. Data Collection 21
3.3. Tabulasi Data Penelitian 22
3.4. Pre Prosessing 22
3.4.1. Data Cleaning 23
3.4.2. Data Transformation 23
3.5. Analisis Metode Rough Set 24
3.5.1. Representasi Data 24
3.5.2. Indicernibility Relation 26
3.5.3. Equivalence Class 27
3.5.4. Discernibility Matrix 27
3.5.5. Discernibility Matrix Mod D 28
3.5.6. Reduct 29
3.5.7. Generating Rules 29
3.6. Analisis Penerapan Algoritma Apriori 30
3.6.1. Pola Gejala Penyakit Demam Tifoid 31
3.6.2. Pembentukan Aturan Asosiasi 36
3.6.3. Pembentukan Aturan Asosiasi Final 37
BAB IV HASIL DAN PEMBAHASAN 38
4.1. Pendahuluan 38
4.2. Pra Pengolahan Data 38
4.3. Hasil Implementasi Menggunakan Metode Rough Set 39
4.3.1. Reduct 40
4.3.2. Generating Rules 40
4.4. Analisa Penerapan Algoritma Apriori 42
BAB V KESIMPULAN DAN SARAN 45
5.1. Kesimpulan 45
5.2. Saran 45
DAFTAR PUSTAKA 46
DAFTAR TABEL
Hal
TABEL 2.1. Data Tidak Lengkap 6
TABEL 2.2. Data Lengkap 6
TABEL 2.3. Data Transformasi 7
TABEL 2.4. Hasil Data Transformasi 7
TABEL 2.5. Information System 10
TABEL 2.6. Information System dengan Atribut Keputusan 11
TABEL 2.7. Equivalence Class 12
TABEL 2.8. Discernibility Matrix 12
TABEL 2.9. Discernibility Matrix Mod D 13
TABEL 2.10. Reduct 13
TABEL 2.11. Penelitian Terdahulu 18
TABEL 3.1. Data Primer 21
TABEL 3.2. Hasil Tabulasi Data Penelitian 21
TABEL 3.3. Tabel Data Transformation 23
TABEL 3.4. Information System 25
TABEL 3.5. Decision System 25
TABEL 3.6. Equivalence Class 27
TABEL 3.7. Discernibility Matrix 28
TABEL 3.8. Discernibility Matrix Mod D 28
TABEL 3.9. Reduct 29
TABEL 3.10. Pola Gejala Penyakit Demam Tifoid 31
TABEL 3.11. Support Dari Tiap Item 32
TABEL 3.12. Pola Kombinasi 2 Itemset 32
TABEL 3.13. Tabel Kombinasi 2 Itemset Memenuhi Minimal Support 33
TABEL 3.14. Pola Kombinasi 3 Itemset 34
TABEL 3.15. Tabel Kombinasi 3 Itemset memenuhi Minimal Support 35
TABEL 3.16. Pola Kombinasi 4 Itemset 35
TABEL 3.17. Aturan Asosiasi 37
TABEL 3.18. Aturan Asosiasi Final 37
TABEL 4.1. Akurasi Rule Rough Set 41
DAFTAR GAMBAR
Hal
GAMBAR 3.1. Diagram Blok Penelitian 20
GAMBAR 3.2. Data Awal 22
GAMBAR 3.3. Hasil Data Cleaning 23
GAMBAR 3.4. Hasil Transformasi Data 24
GAMBAR 4.1. Data Dalam Bentuk Excel 39
GAMBAR 4.2. Tampilan Hasil Import Data Rosetta 39
GAMBAR 4.3. Hasil Reduct 40
GAMBAR 4.4. Hasil Generating Rule 41
GAMBAR 4.5. Data dalam Bentuk Excel 42