METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN
ALGORITMA QUEST DAN ALGORITMA CART
(Aplikasi pada Data Pasien Penyakit Jantung)
SKRIPSI
NUR SAUNAH RANGKUTI
130803016
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2017
METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN
ALGORITMA QUEST DAN ALGORITMA CART
(Aplikasi pada Data Pasien Penyakit Jantung)
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat
mencapai gelar Sarjana Sains
NUR SAUNAH RANGKUTI
130803016
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2017
PERSETUJUAN
Judul: Metode Klasifikasi Bersturuktur Pohon dengan Algoritma QUEST dan Algoritma CART (Aplikasi pada Data Pasien Penyakit Jantung).
Kategori : Skripsi
Nama : Nur Saunah Rangkuti
Nomor Induk Mahasiswa : 130803016
Program Studi : Sarjana (S1) Matematika
Departemen : Matematika
Fakultas : Matematika Dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara
Disetujui di Medan, 2017 Komisi Pembimbing Pembimbing 2, Pembimbing 1, Dr. Sutarman, M.Sc NIP. 19631026 199103 1 001
Dr. Elly Rosmaini, M.Si NIP. 19600520 198503 2 002
Disetujui Oleh
Departemen Matematika FMIPA USU Ketua
Dr. Suyanto, M.Kom
PERNYATAAN
METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST DAN ALGORITMA CART
(Aplikasi pada Data Pasien Penyakit Jantung)
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya sendiri. Kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 2017
Nur Saunah Rangkuti 130803016
PENGHARGAAN
Puji Syukur penulis ucapkan kehadirat Allah Subhanahu wa Ta’ala, yang telah melimpahkan rahmat dan karunia-Nya serta memberikan banyak kemudahan sehingga penulis dapat menyelesaikan skripsi yang berjudul Metode Klasifikasi Berstruktur Pohon dengan Algoritma QUEST dan Algoritma CART (Aplikasi pada Data Pasien Penyakit Jantung). Shalawat dan salam penulis ucapkan kepada Rasulullah Shallallahu ‘Alaihi wa Sallam, keluarga, para sahabat, dan orang-orang yang mengikutinya.
Terima kasih penulis sampaikan kepada bapak Dr. Suyanto, M.Kom selaku ketua Departemen Matematika dan terima kasih kepada ibu Dr. Elly Rosmaini, M.Si selaku pembimbing 1 yang banyak berjasa kepada penulis dimana beliau telah meluangkan waktu dan pikirannya, memberikan pengarahan, saran, dan kritik terkait penulisan skripsi ini. Terima kasih kepada bapak Dr. Sutarman, M.Sc selaku pembimbing 2, yang juga telah meluangkan waktu, pikiran, dan saran untuk perbaikan skripsi ini.
Terima kasih sebesar-besarnya penulis sampaikan kepada kedua orang tua atas do’a dan dukungannya kepada penulis baik secara moril ataupun materi, kepada abang, kakak dan adik saya yang sudah meluangkan waktu dan pikirannya untuk mendengarkan curahan hati penulis, memberikan nasihat, dan selalu memotivasi penulis. Terima kasih kepada Bapak Direktur Rumah Umum Pusat Haji Adam Malik Medan yang telah membantu penulis memberikan data yang diperlukan dalam penulisan skripsi ini.
Terima kasih penulis sampaikan kepada bapak Dr. Pasukat Sembiring, M.Si selaku penguji 1 dan bapak Drs. Henri Rani Sitepu, M.Si selaku penguji 2 yang telah meluangkan waktu, pikiran dan memberikan kritik maupun saran untuk perbaikan skripsi ini dan sebagai pembelajaran bagi penulis.
Terima kasih penulis sampaikan kepada seluruh dosen Matematika USU yang telah membagikan ilmu kepada penulis selama masa perkuliahan, Dekan dan Wakil Dekan FMIPA USU, serta seluruh staf administrasi FMIPA USU.
Terima kasih juga penulis ucapkan kepada teman-teman yang telah memberikan do’a dan motivasi kepada penulis dalam mengerjakan skripsi. Semoga Tuhan memberikan balasan kebaikan atas segala bantuan yang telah semua berikan kepada penulis.
METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST DAN ALGORITMA CART
(Aplikasi pada Data Pasien Penyakit Jantung) ABSTRAK
Metode klasifikasi yang sering digunakan adalah metode klasifikasi berstruktur pohon, diantaranya yaitu QUEST (Quick, Unbiased, Efficient Statistical Trees)
dan CART (Classification and Regression Tree). QUEST menggunakan uji
ANOVA F dan Chi-square untuk pemisah terbaik pada setiap langkahnya.
Sedangkan CART memilih pemilah terbaik berdasarkan tingkat kehomogenan yang maksimum. Penelitian ini bertujuan untuk mengetahui faktor-faktor yang mempengaruhi seseorang menderita penyakit jantung. Data yang digunakan dalam penelitian ini adalah data pasien penyakit jantung di RSUP H. Adan Malik Medan. Variabel dependennya adalah penyakit jantung, sedangkan variabel independennya adalah umur, jenis kelamin, tekanan darah, kolesterol, gula darah, hasil eletrokardiografi dan kondisi jantung. Metode QUEST menghasikan 3 kelas dimana ada 2 variabel independen yang signifikan terhadap penyakit jantung yaitu hasil eletrokardiografi dan kondisi jantung. Sedangkan CART menghasilkan 6 kelas dimana ada 3 variabel independen yang signifikan terhadap penyakit jantung yaitu kolesterol, jenis kelamin dan umur. Perbedaan dalam klasifikasi antara algoritma QUEST dan algoritma CART adalah pembentukan pohon klasifikasinya, dimana pembentukan pohon pada algoritma QUEST adalah biner. Sedangkan pembentukan pohon pada algoritma CART adalah non biner.
Kata kunci: Klasifikasi, QUEST (Quick, Unbiased, Efficient Statistical Trees),
CLASSIFICATION METHOD OF TREE STRUCTURE WITH QUEST ALGORITHM AND CART ALGORITHM
(Application on Patient Data of Heart Desease) ABSTRACT
A frequently used classification method is a tree classed classification method,
such as QUEST (Quick, Unbiased, Efficient Statistical Trees) and CART
(Classification and Regression Tree). QUEST using ANOVA F test dan Chi-square test for the best separator at each step. While CART choose the best divider based on the maximum homogeneity level. This study aims to determine the factors that effect a persen suffering from heart desease. The data used in this study is the data of patients with heart desease in RSUP H. Adan Malik Medan.The dependent variable is heart desease, while the independent variables are age, sex, blood pressure, cholesterol, blood sugar, eletrokardiografi test and heart condition. QUEST method yielding 3 classes there are 2 independent variables that are significant to heart desease that are eletrokardiografi test and heart condition. While CART method yielding 6 classes there are 3 independent variables that are significant to heart desease that are cholesterol, sex and age. Differences in the intermediate classification between QUEST algorithm and CART algorithm are the formation of the tree classification, in which the formation in QUEST algorithm is binary. While the formation in CART algorithm adalah non-binary.
Keywords: Classification, QUEST (Quick, Unbiased, Efficient Statistical Trees),
DAFTAR ISI Halaman PERSETUJUAN i PERNYATAAN ii PENGHARGAAN iii ABSTRAK iv ABSTRACT v DAFTAR ISI vi
DAFTAR TABEL viii
DAFTAR GAMBAR x DAFTAR LAMPIRAN xi BAB 1 PENDAHULUAN 1.1 Latar Belakang 1 1.2 Rumusan Masalah 3 1.3 Batasan Masalah 4 1.4 Tujuan Penelitian 4 1.5 Manfaat Penelitian 4 1.6 Metodologi Penelitian 5 1.7 Kerangka Penelitian 6
BAB 2 TINJAUAN PUSTAKA
2.1 Skala Pengukuran 7
2.2 Metode Klasifikasi Berstruktur Pohon 8
2.3 Konsep-Konsep Dasar pada Algoritma QUEST dan
Algoritma CART 10
2.3.1 Uji Khi-kuadrat (𝑋2) 10
2.3.2 Uji ANOVA F 12
2.3.3 Uji Levene F 13
2.3.4 Analisis Diskriminan Kuadratik 13
2.4 Metode QUEST 15
2.4.1 Algoritma QUEST 15
2.5 Metode CART 19
2.5.1 Algoritma CART 20
BAB 3 METODE PENELITIAN
3.1 Penelitian 21
3.1.2 Lokasi dan Waktu Penelitian 21
3.1.2.1 Lokasi Penelitain 21
3.1.2.2 Waktu Penelitian 21
3.1.3 Populasi dan Sampel 21
3.1.4 Jenis dan Pengambilan Sampel 22
3.1.5 Variabel Penelitian 22
3.1.6 Skala Ukuran Penelitian 23
3.1.7 Analisis Data 23
3.1.8 Langkah-Langkah Analisis Data 23
BAB 4 HASIL DAN PEMBAHASAN
4.1 Data 25
4.2 Penyelesaian dengan Algoritma QUEST 26
4.2.1 Simpul awal (𝑡0) 26
4.2.2 Simpul Dalam (𝑡1) 35
4.2.3 Simpul Dalam (𝑡2) 43
4.3 Penyelesaian dengan Algoritma QUEST 47
4.3.1 Cabang Pertama 48
4.3.2 Cabang Pertama pada Kondisi Jantung Cacat
Sementara/Cacat Tetap 51
4.3.3 Cabang Ketiga pada Kolestrol ≤ 176 54
4.3.4 Cabang Keempat pada Tekanan Darah ≤ 124 56
4.3.5 Cabang Keempat pada Tekanan Darah > 124 59
4.3.6 Cabang Ketiga pada Kolesterol ≤ 176 61
4.3.7 Cabang Keempat pada Kondisi Jantung yang
Normal 63
4.4 Perbandingan Algoritma QUEST dengan Algoritma CART 68
BAB 5 KESIMPULAN DAN SARAN
5.1 Kesimpulan 70
5.2 Saran 74
DAFTAR TABEL
Nomor Tabel
Judul Halaman
2.1 Kontigensi Dua Arah 11
2.2 ANOVA F 12
2.3 Struktur Data Analisis Diskriminan Kuadratik 14
4.1 Frekuensi Teramati 𝑂𝑖𝑗 28
4.2 Hasil Uji Statistika Pemilihan Peubah Penyekat Simpul 𝑡0 29
4.3 Tabulasi 𝑥6 30
4.4 Tabulasi 𝑥6 Hasil Transformasi 34
4.5 Hasil Uji Statistika Pemilihan Peubah Penyekat Simpul 𝑡1 37
4.6 Tabulasi 𝑥7 38
4.7 Tabulasi 𝑥7 Hasil Transformasi 41
4.8 Hasil Uji Statistika Pemilihan Peubah Penyekat Simpul 𝑡2 45
4.9 Tabulasi 𝑥7 untuk Simpul 𝑡2 45
4.10 Daftar Calon Mutakhir 48
4.11 Perhitungan 𝑃𝐿 dan 𝑃𝑅 49
4.12 Perhitungan 𝑃(𝑗|𝑡𝐿) dan 𝑃(𝑗|𝑡𝑅) 49
4.13 Kesesuaian untuk Calon Cabang 50
4.14 Daftar Calon Mutakhir 52
4.15 Perhitungan 𝑃𝐿 dan 𝑃𝑅 52
4.16 Kesesuaian untuk Calon Cabang 53
4.17 Daftar Calon Mutakhir 54
4.18 Perhitungan 𝑃𝐿 dan 𝑃𝑅 55
4.19 Kesesuaian untuk Calon Cabang 55
4.20 Daftar Calon Mutakhir 57
4.21 Perhitungan 𝑃𝐿 dan 𝑃𝑅 57
4.22 Kesesuaian untuk Calon Cabang 58
4.23 Daftar Calon Mutakhir 58
4.24 Perhitungan 𝑃𝐿 dan 𝑃𝑅 59
4.25 Kesesuaian untuk Calon Cabang 59
4.26 Daftar Calon Mutakhir 60
4.27 Perhitungan 𝑃𝐿 dan 𝑃𝑅 61
4.28 Kesesuaian untuk Calon Cabang 61
4.29 Daftar Calon Mutakhir 62
4.30 Perhitungan 𝑃𝐿 dan 𝑃𝑅 62
4.31 Kesesuaian untuk Calon Cabang 64
Algoritma CART
5.1 Perbandingan Hasil Klasifikasi Algoritma QUEST dan
Algoritma CART
DAFTAR GAMBAR
Nomor Gambar
Judul Halaman
2.1 Pohon Klasifikasi 9
4.1 Pohon Keputusan Cabang Pertama 45
4.2 Pohon Keputusan Cabang Kedua pada Kondisi Jantung 47
4.3 Pohon Keputusan Cabang Ketiga 56
4.4 Pohon Keputusan Cabang Keempat 58
4.5 Pohon Keputusan Cabang Keempat pada Tekanan Darah
>124 60
4.6 Pohon Keputusan Cabang Ketiga pada Kolesterol >176 63
4.7 Pohon Keputusan Cabang Kedua pada Kondisi Jantung yang
DAFTAR LAMPIRAN
Nomor Lamp.
Judul Halaman
1 Data-Data Pasien Penyakit Jantung di Rumah Sakit Umum
Pusat Haji Adam Malik
76
2 Surat Keterangan Izin Riset di Rumah Sakit Umum Pusat
Haji Adam Malik.
81
3 Surat Keterangan Selesai Riset di Rumah Sakit Umum
Pusat Haji Adam Malik.
82