BAB III
BAHAN DAN METODE 3.1. BAHAN
Sampel penelitian bersumber dari basis data dalam Sistem Informasi Manajemen Rumah Sakit Pusat Pertamina dan Sistem Informasi Laboratorium Rumah Sakit Pusat Pertamina. Periode pengambilan data dari tanggal 1 oktober 2004 sampai dengan 31 Desember 2005. Data tersebut meliputi:
1. Data pasien yang diduga menderita penyakit diabetes berjumlah 9.919 pasien. Pasien yang dipilih adalah pasien dengan minimal satu kali kunjungannya didiagnosa diabetes, pasien yang melahirkan bayi di atas 4.000 gr, pasien dengan tekanan darah tinggi, pasien dengan berat badan yang termasuk ke dalam kategori obesitas.
2. Data terapi obat serta hasil pemeriksaan laboratorium yang dilakukan pada pasien selama periode 01 Oktober 2004 sampai dengan 31 Desember 2005 baik yang berasal dari rawat jalan maupun rawat inap dikumpulkan.
Persyaratan catatan medis yang dijadikan sampel mengacu pada international classification of deseases tenth revision (ICD 10 ) dimana penyakit diabetes melitus diberi kode E.10 Insulin -dependent diabetes mellitus, E.11 Non-insulin -dependent diabetes mellitus, E.12 Malnutrition-related diabetes mellitus, E.13 Other specified diabetes mellitus dan E.14 Unspecified diabetes mellitus.
Dari 9.919 pasien yang diduga menderita penyakit diabetes didapat 159.476 record terapi obat dan 211.694 hasil laboratorium. Untuk membentuk data training dan testing, diambil 10 jenis data pemeriksaan hasil laboratorium yang paling banyak dilakukan yaitu Kolesterol Total (CHOL), Trigliserida (TG), Glukosa Urin Puasa (URN), Aseton Urin Puasa (ACTN), Glukosa Darah Puasa
Banyaknya pasien yang mempunyai catatan medis lengkap adalah 1.386 orang. Rata-rata umur ± standar deviasi (SD) dari data tersebut adalah 59.29 ± 10.25 tahun. Dari data tersebut diperoleh rasio laki-laki : perempuan adalah 4 : 6. Karakteristik umum data yang ditambang dapat dilihat pada Tabel 2, sedangkan rata-rata variabel hasil pemeriksaan laboratorium dapat dilihat pada Tabel 3. Tab el 2 Karakteristik umum data pasien
Data Sex Jumlah
Baris
Prosentase
Setiap Kelas Umur ± SD
Diabetes Laki-laki 121 7.37 59.88 ± 8.31
Perempuan 283 17.24 60.49 ± 8.71
Bukan Daibetes Laki-laki 469 28.56 59.20 ± 10.69
Perempuan 769 46.83 58.81 ± 10.72
Tabel 3 Rata-rata variabel pemeriksaan laboratorium
Variabel Mean ± SD
Glukosa Darah Puasa (mg/dl) 125.33 ± 55.59 Glukosa Darah 2 jam PP (mg/dl) 171.19 ± 86.50 Glukosa Urin 2 jam PP 0.74 ± 1.21
Aseton Urin Puasa 0.03 ± 0.23
Glukosa Urin Puasa 0.27 ± 0.80
Aseton Urin 2 jam PP 0.01 ± 0.16 Kolesterol LDL (mg/dl) 129.37 ± 38.66 Kolesterol HDL (mg/dl) 47.26 ± 12.61 Kolesterol Total (mg/dl) 207.82 ± 45.21 Trigliserida (mg/dl) 159.40 ± 100.58
Sumber data yang digunakan dalam penelitian ini selain dari basis data yang sudah tersedia juga berasal dari isian pertanyaan. Pertanyaan yang diajukan ke pasien terdiri dari pemeriksaan fisik meliputi tinggi badan, berat badan dan tekanan darah, serta riwayat diabetes. Riwayat diabetes meliputi awal diagnosis diabetes ditetapkan, riwayat keluarga diabetes, riwayat merokok, riwayat kehamilan, dan pengobatan diabetes yang dilakukan.
3.2. METODE
3.2.1. Kerangka Pemikiran
Meningkatnya penderita penyakit diabetes melitus di beberapa negara berkembang, akibat peningkatan kemakmuran di negara bersangkutan, akhir -akhir ini banyak disoroti. Peningkatan pendapatan per kapita dan perubahan gaya hidup terutama di kota-kota besar, menyebabkan peningkatan prevalansi penyakit degeneratif, seperti jantung koroner, hipertensi, hiperlipidemia, diabetes dan lain-lain. Menghadapi jumlah pasien diabetes melitus yang semakin meningkat, diperlukan peningkatan peran semua tingkat pelayanan kesehatan. Penanggulangan diabetes melitus perlu dilakukan secara tepat dan berkesinambungan dengan keterlibatan program dan sektor terkait.
Atas dasar pemikiran di atas, perlu kiranya dilakukan upaya-upaya penanganan agar dampak negatif penyakit ini dapat diminimalkan, dengan membuat dan menerapkan suatu sistem yang dapat memprediksi timbulnya penyakit diabetes melitus dalam upaya peringatan dini bagi pasien.
Sebagai langkah awal maka perlu adanya studi pustaka berkenaan dengan penyakit diabetes melitus untuk lebih mengenal dan memahami permasalahan penyakit ini. Kemudian dilakukan identifikasi dari permasalahan yang akan diteliti untuk memperjelas permasalahan dan penentuan alternatif solusi. Selanjutnya dilakukan pengumpulan data untuk menentukan parameter-parameter yang dapat menyebabkan timbulnya penyakit diabetes melitus. Sumber data yang dikumpulkan pada penelitian nanti barasal dari SIM RSPP dan LIS RSPP. Data tersebut kemudian akan disimpan dalam suatu data warehouse, yang selanjutnya dibuat suatu model menggunakan teknik classification based association untuk mengetahui keterkaitan antara parameter-parameter yang diduga sebagai penyebab timbulnya gejala penyakit diabetes. Gambar 9 menunjukkan garis besar
Mulai
Identifikasi Masalah
Pengumpulan Data
Pembuatan Clinical Data Warehouse dengan Star Schema
Pembuatan Model Prediksi Penyakit
Diabetes Melitus
Pembuatan Program Aplikasi
Sesuai Harapan Kelayakan Penerapan Selesai Ya Tidak Pengujian
3.2.2. Tata Laksana
Kegiatan penelitian ini dilakukan dengan dua tahapan utama, yaitu proses pembentukan model klasifikasi dan pembuatan program aplikasi untuk mendeteksi penyakit diabetes. Proses pembentukan model klasifikasi dilakukan berdasarkan urutan proses pada Gambar 12. Proses dimulai dengan pendefinisian masalah serta mempelajari bisnis proses dari sistem yang sedang berjalan. Pada tahap kedua yaitu pembentukan data warehouse diabetes dilakukan melalui dua tahapan yaitu membuat rancangan logik dan rancangan fisik serta melakukan proses Extraction, Transformation, Loading (ETL).
Membuat rancangan logik dan rancangan fisik
Pembuatan rancangan logik dilakukan dengan menentukan jenis in formasi yang dibutuhkan. Salah satu tekniknya adalah dengan menggunakan entity relationship modelling. Perancangan fisik dilakukan dengan menggunakan Structure Query Language (SQL).
Extraction, Transformation, Loading (ETL)
Setelah membuat basis data, langkah selanjutnya adalah melakukan proses Extraction Transformation dan Loading (ETL). Ekstraksi adalah operasi mengekstrak data dari sistem sumber untuk selanjutnya digunakan dalam lingkungan data warehouse. Setelah ekstraksi, data tersebut ditransformasi dan dimuat kedalam data warehouse. Metode ekstraksi yang dipilih adalah full extraction yaitu dengan mengekstrak seluruh data yang ada pada sistem sumber menggunakan export file.
Gambar 11 Kerangka pemikiran pembuatan aplikasi data mining untuk diagnosis penyakit diabetes
Data Warehouse Diabetes
Gambar 12 Tahapan proses data mining Data mining
Metodologi data mining didasarkan pada tiga tahapan yang dilakukan untuk mendeteksi penyakit diabetes. Ketiga tahapan tersebut adalah a) menangani data yang tidak lengkap melalui ekstraksi, b) merubah data yang bernilai kontinyu menjadi data yang bernilai diskrit serta c) rule mining dan klasifikasi. Pada tahap pertama, pemrosesan awal data diabetes dilakukan untuk menghapus data yang tidak lengkap dan mengekstrak data yang akan digunakan untuk mengelompokkan penyakit diabetes atau bukan. Pada tahap kedua setiap data yang bernilai kontinyu didiskritkan.. Hasil dari tahap pertama dan kedua diatas disimpan dalam working database. Pada tahap ketiga, algoritme association rule mining digunakan untuk menghasilkan aturan-aturan, yang berguna untuk mendeteksi penyakit diabetes atau bukan.
Merubah Data Kontinyu Menjadi Data Diskrit
Data sampel yang digunakan pada penelitian ini mempunyai atribut yang nilainya numerik, sedangkan algoritme CPAR bekerja dengan atribut-atribut yang nilainya nominal. Untuk menggunakan algoritme tersebut atribute yang bernilai numerik tersebut diganti dengan atribute yang bernilai nominal yang menunjukkan interval nilai dengan nilai-nilai diskrit. Proses ini dikenal sebagai diskritisasi dan berisi transformasi dari variabel quantitatif ke dalam variabel kualitatif.
Asimilasi Pengetahuan