• Tidak ada hasil yang ditemukan

PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION BASED ASSOCIATION HERWANTO

N/A
N/A
Protected

Academic year: 2022

Membagikan "PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION BASED ASSOCIATION HERWANTO"

Copied!
12
0
0

Teks penuh

(1)

PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION

BASED ASSOCIATION

HERWANTO

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR

2006

(2)

PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI

Dengan ini saya menyatakan bahwa tesis Pembangunan Sistem Data Mining untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association adalah karya saya sendiri dan belum diajukan dalam bentuk apa pun kepada pergu ruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, September 2006

Herwanto NIM G651034084

(3)

PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION

BASED ASSOCIATION

HERWANTO

Tesis

Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada

Departemen Ilmu Komputer

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR

2006

(4)

ABSTRAK

HERWANTO. Pembangunan Sistem Data Mining Untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association. Dibimbing oleh IMAS S. SITANGGANG dan RINDANG KARYADIN.

Basis data rumah sakit umumnya berisi data dalam jumlah besar dengan banyak variasi, tetapi belum dimanfaatkan secara optimal. Diperlukan suatu sistem data mining yang bisa memanfaatkan gunungan data menjadi informasi yang bernilai strategis. Dalam penelitian ini dipelajari bagaimana data bisa digunakan untuk membantu mendiagnosa penyakit, khususnya penyakit diabetes

Data-data pasien yang beresiko menderiita penyakit diabetes dikumpulkan ke dalam data warehouse diabetes. Dua tahapan utama yang dilakukan dalam penelitian ini, yaitu proses pembentukan model klasifikasi dan pembuatan program aplikasi untuk mendeteksi penyakit diabetes.

Dalam proses pembentukan model klasifikasi ada tiga tahapan yang dilakukan. Tahap pertama adalah menangani data-data yang beragam, tidak lengkap, dan tidak konsisten. Kemudian melakukan proses perubahan data kontinyu menjadi data kategori, dimana setiap variabel dikelompokkan ke dalam sejumlah kategori. Tahap berikutnya adalah membuat rule mining dan klasifikasi.

700 pasien dipilih sebagai data training, 400 pasien dengan diagnosa negatif diabetes dan 300 pasien positif diabetes. Pada pembentukan model klasifikasi dipilih 12 variabel yang digunakan untuk menghasilkan aturan yaitu usia, sex dan hasil-hasil pemeriksaan laboratorium. Didapatkan hasil pemeriksaan glukosa darah 2 jam pasca puasa, glukosa urin 2 jam pasca puasa, serta glukosa darah puasa menjadi penentu utama untuk menentukan apakah pasien positif diabetes atau negatif diabetes. Aturan-aturan yang dihasilkan selanjutnya digunakan dalam program aplikasi untuk mendiagnosa pasien apakah positif diabetes atau negatif diabetes.

.

(5)

PRAKATA

Syukur Alhamdulillah penulis panjatkan kepada Allah SWT atas limpahan rahmat dan karuniaNya sehingga penulis akhirnya dapat menyelesaikan karya ilmiah ini. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Juni 2005 ini adalah sistem data mining, dengan judul Pembangunan Sistem Data Mining untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association.

Dalam kesempatan ini penulis ingin menyampaikan ucapan terima kasih dan penghargaan kepada Ibu Imas S Sitanggang, S.Si., M.Kom., dan Bapak Rindang Karyadin S.T., M.Kom. selaku pembimbing yang sejak awal penulisan proposal sampai pada penulisan karya ilmiah ini, telah membimbing dengan penuh keikhlasan, dan kesabaran. Di samping itu penghargaan penulis sampaikan kepada para dosen Program Studi Ilmu Komputer, Sekolah Pascasarjana, Institut Pertanian Bogor, yang telah memberikan wawasan dan pengetahuan baru bagi penulis. Atas do’a, pengorbanan, kesabaran, ketulusan, serta dukungan semangatnya, penulis juga menyampaikan ucapan terima kasih dan rasa hormat yang setulus-tulusnya kepada kedua orang tua, serta seluruh keluarga.

Semoga karya ilmiah ini bermanfaat.

Bogor, September 2006

Herwanto

(6)

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta pada tanggal 24 May 1962 dari ayah Paridjan dan ibu Parinah. Penulis merupakan putra kelima dari delapan bersaudara.

Pada tahun 1982 penulis lulus dari SMA Negeri 43 Jakarta. Pendidikan sarjana ditempuh pada tahun 1991 di Sekolah Tinggi Manajemen Informatika dan Komputer Gunadarma, jurusan Manajemen Informatika, lulus pada tahun 1996.

Kesempatan untuk melanjutkan ke program magister pada Program Studi Ilmu Komputer, Sekolah Pascasarjana IPB diperoleh pada tahun 2004.

Penulis bekerja di Rumah Sakit Pusat Pertamina Jakarta pada bagian Sistem Informasi & Telekomunikasi Elektronika sejak tahun 1997. Bidang yang menjadi tanggung jawab penulis ialah pembangunan dan pengembangan sistem informasi rumah sakit. Pada tahun 2005 penulis dipercaya sebagai kepala bagian Sistem Informasi & Telekomunikasi Elektronika.

(7)

Judul Tesis : Pembangunan Sistem Data Mining

Untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association Nama : Herwanto

NIM : G651034084

Disetujui

Komisi Pembimbing

Imas S Sitanggang, S.Si., M.Kom. Rindang Karyadin, S.T., M.Kom.

Ketua Anggota

Diketahui

Ketua Program Studi Ilmu Komputer Dekan Sekolah Pascasarjana

Dr. Sugi Guritman . Dr. Ir. Khairil A. Notodiputro, MS

Tanggal Ujian: 5 September 2006

(8)

DAFTAR ISI

Halaman

DAFTAR GAMBAR xi

DAFTAR TABEL xii

DAFTAR LAMPIRAN xiii

I. PENDAHULUAN 1.1 Latar belakang 1

1.2. Tujuan Penelitian 2

1.3. Ruang lingkup 2

1.4. Manfaat Penelitian 3

II. TINJAUAN PUSTAKA 2.1. Diabetes Melitus 4

2.2 Data Warehouse 5

2.2.1. Metodologi Perancangan Data Warehouse 7

2.2.2. Star Schema 8

2.3. Data Mining 10

2.3.1. Klasifikasi dan Prediksi 13

2.3.2. Metodologi Data Mining 14

2.3.3. Teknik Data Mining 16

2.3.4. Membangun Model Prediksi 26

III. BAHAN DAN METODE 3.1. Bahan 29

3.2. Metode 31

3.2.1. Kerangka Pemikiran 31

3.2.2. Tata Laksana 33

IV. PERANCANGAN ARSITEKTUR SISTEM DATA MINING 4.1 Gambaran umum sistem 35

4.2. Pembangunan Data Warehouse 36

4.3. Pembangunan Model Klasifikasi 38

4.4. Antarmuka Pemakai 40

4.5. Basis Pengetahuan 40

(9)

Halaman V. IMPLEMENTASI

5.1. Preproses Data 44

5.2. Pembentukan Sampel Positif dan Sampel Negatif 46

5.3. Pembentukan PN Array 47

5.4. Pembentukan Gain 48

5.5. Program Aplikasi 51

VI. PENGUJIAN DAN PEMBAHASAN 6.1. Mekanisme Pengujian 52

6.2. Pelatihan Dengan Data Training 52

6.3. Proses Optimalisasi 58

VII. KESIMPULAN DAN SARAN 7.1. Kesimpulan 64

7.2. Saran 64

DAFTAR PUSTAKA 65

LAMPIRAN 66

(10)

DAFTAR GAMBAR

Halaman

1. Arsitektur Data Warehouse 7

2. Relasi antartabel dimensi dan table fakta sederhana 10 3. Data mining sebagai salah satu tahapan dalam proses

knowledge discovery 11

4. Model proses pembuatan data mining 15

5. Algoritme Appriori 18

6. Algoritme FOIL 22

7. Algoritma PRM 24

8. Metoda startCPAR 25

9. Metoda cparGeneration 25

10. Langkah-langkah membangun model pred iksi 28 11. Kerangka pemikiran pembangunan model

untuk diagnosis penyakit diabetes 32

12. Tahapan Proses data mining 33

13. Model aplikasi diabetes 35

14. Relasi antartabel skema bintang data warehouse diabetes 37 15. Ekstraksi dan Transformasi Basis Data SIM RSPP 38

16. Flowchart Algoritme CPAR 39

17 Grafik Gain data training untuk kelas positip diabetes 55 18. Grafik Gain data training untuk kelas negatip diabetes 55 19. Grafik Gain negatif diabetes setelah proses optimalisasi 60 20. Grafik Gain negatif diabetes setelah proses optimalisasi 60

(11)

DAFTAR TABEL

Halaman

1. Transaksi Penjualan Barang 18

2. Karakteristik umum data pasien 30

3. Rata-rata variabel pemeriksaan laboratorium 30 4. Klasifikasi Berat Badan berdasarkan IMT 42

5. Nilai referensi hasil laboratorium 44

6. Kategori untuk tabel sampel_data 45

7. Contoh sampel data 46

8. Sampel positif dari data pada Tabel 7 46

9. Sampel negatif dari data pada Tabel 7 47

10. PN Array 47

11. Kategori dan nilai Gain 48

12. Karakteristik umum data training 53

13. Rata-rata variabel pemeriksaan laboratorium data training 53

14. Perbandingan bobot sampel dan gain 54

15. Aturan yang dihasilkan dengan gain similarity ratio 99% 56 16. Aturan yang dihasilkan dengan gain similarity ratio 80% 56 17. Aturan yang dihasilkan dengan gain similarity ratio 50% 57 18. Aturan yang dihasilkan dengan gain similarity ratio 20% 57 19. Aturan yang dihasilkan dengan gain similarity ratio 10% 58 20. Kategori untuk tabel sampel_data setelah proses optimalisasi 58 21 Aturan setelah proses optimalisasi dengan

Gain similarity ratio 99% 61

22 Aturan setelah proses optimalisasi dengan

Gain similarity ratio 80% 61

23 Aturan setelah proses optimalisasi dengan

Gain similarity ratio 50% 62

24 Aturan setelah proses optimalisasi dengan

Gain similarity ratio 20% 62

25 Aturan setelah proses optimalisasi dengan

Gain similarity ratio 10% 63

(12)

DAFTAR LAMPIRAN

Halaman

1. Proses Pasien Rawat Jalan 66

2. Proses Pasien rawat Inap 67

3. Kamus Data Pasien Rawat Jalan dan Pasien Rawat Inap 68

4. Kamus Data Data Warehouse diabetes 74

5. Sampel data positif diabetes dan negatif diabetes 76

6. Tampilan halaman Status Pasien 77

7. Tampilan halaman Anamnes is 77

8. Tampilan halaman Riwayat DM 78

9. Tampilan halaman Anamnesis Keluarga 78

10. Tampilan halaman Pemeriksaan Fisis 79

11. Tampilan halaman Laboratoriu 79

12. Tampilan halaman Pemeriksaan Penunjang 80

13. Tampilan halaman Diagnosis 80

14. Tampilan halaman Terapi 81

Referensi

Dokumen terkait

Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Desember 2013 ini adalah indeks pembangunan regional, dengan judul Aplikasi Metode Range

Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2014 ini ialah sistem pakar, dengan judul Pengembangan Sistem Pakar Identifikasi Awal Penyakit

Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Oktober 2013 ini adalah Pembangunan Ruang Terbuka Hijau, dengan judul Pemetaan Polutan Udara dan

Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2012 ini ialah curah hujan, dengan judul Pendugaan Curah Hujan Musim Kemarau Menggunakan Data

Penelitian ini bertujuan mengana- lisis proses data mining dalam sistem pembelajaran berbantuan komputer pada praktikum kelas gabungan Laboratorium Sistem

Hasil dari data uji pada penelitian ini, sistem dapat melakukan diagnosis penyakit penglihatan kabur (blurred vision) dengan tingkat akurasi 87%.. Kata kunci : sistem

Penerapan data mining peminjaman buku perpustakaan merupakan sebuah sistem pencarian aturan asosiasi melalui pengolahan data transaksi peminjaman buku dari setiap

Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Nopember 2007 ini ialah masalah tracking error optimal pada sistem pendulum, dengan judul Pemodelan