III-1 BAB III ANALISIS
3.1 Data Understanding Phase
Pada penelitian ini, data kasus yang digunakan adalah data pasien liver. Data ini dikumpulkan dari timur laut bagian Andhra Pradesh, India. Data pasien liver terdiri dari 416 (empat ratus enam belas) pasien pengidap penyakit liver dan 167 (seratus enam puluh tujuh) pasien yang nonliver. Variabel yang terdapat pada data pasien liver tersebut adalah sebagai berikut :
1) Age (Usia)
2) Gender (Jenis Kelamin)
3) Total Bilirubin (Bilirubin Total) 4) Direct Bilirubin (Bilirubin Langsung) 5) Alkaline Phosphatase (ALP)
6) Serum Glutamic Pyruvic Transaminase (SGPT) / Alanin Aminotransferase (ALT)
7) Serum Glutamic Oxaloacetic Transaminase (SGOT) / Aspartate Aminotransferase (AST)
8) Total Protein (Protein Total) 9) Albumin
10) Albumin- Globulin Ratio (A/G Rasio) 11) Liver Patient (Yes/No)
Data pasien liver yang diambil dari UCI Machine Learning Repository berupa format comma separated values (CSV) seperti yang digambarkan pada Gambar 3.1 berikut.
Gambar 3.1 Data Pasien Liver dalam Format CSV
Data yang didapat tidak disertai keterangan yang menjelaskan maksud secara rinci mengenai maksud dari data, sehingga peneliti harus menganalisis dengan langkah awal melakukan pencarian informasi mengenai liver. Setelah melakukan pencarian tersebut, maka didapat beberapa informasi dan keterangan yang dapat membuat peneliti lebih memahami mengenai data pasien liver tersebut.
Variabel-variabel tersebut merupakan komponen yang mempengaruhi seseorang memiliki indikasi menderita penyakit liver. Beberapa atribut merupakan istilah-istilah dalam kedokteran atau kesehatan yang terkait dengan penyakit liver. Untuk keterangan lebih lanjut, pada Tabel 3.1 dijelaskan definisi dari istilah-istilah tersebut dari setiap komponen.
Tabel 3.1 Definisi Istilah
No Istilah Definisi
1 Total Bilirubin (Bilirubin Total)
Bilirubin adalah produk utama dari penguraian sel darah merah yang tua.
III-3
No Istilah Definisi
2 Direct Bilirubin (Bilirubin Langsung)
Bilirubin disaring dari darah oleh hati dan dikeluarkan pada cairan empedu. Sebagaimana hati menjadi semakin rusak, bilirubin total akan meningkat. Sebagian dari bilirubin total termetabolisme, dan bagian ini disebut sebagai bilirubin langsung. Bila bagian ini meningkat, penyebab biasanya di luar hati. Bilirubin langsung larut dalam air.
3 Alkaline Phosphatase (ALP)
enzim yang dibuat oleh hati, tulang, dan plasenta dan biasanya hadir dalam konsentrasi tinggi pada darah tumbuh dan empedu dan dalam konsentrasi rendah pada darah. ALP dilepaskan ke dalam darah dalam jumlah yang meningkat selama kerusakan sel-sel hati dan selama aktivitas normal seperti pertumbuhan tulang dan kehamilan
4 Serum Glutamic Pyruvic Transaminase (SGPT) / Alanin Aminotransferase (ALT)
Enzim yang diproduksi di hati ketika membran sel-sel hati rusak. Biasanya hadir di sel-sel hati dan jantung. SGPT dilepaskan ke dalam darah ketika hati atau jantung rusak. Tingkat ALT diukur untuk membantu menilai tingkat kerusakan hati dan menentukan seberapa baik pengobatan bekerja.
5 Serum Glutamic
Oxaloacetic Transaminase (SGOT) / Aspartate
Enzim yang diproduksi di dalam hati. Ketika sel-sel hati yang rusak, AST dilepaskan . Peningkatan kadar AST dapat
No Istilah Definisi
Aminotransferase (AST) mengindikasikan penyakit hati, tetapi juga terlihat pada orang dengan kerusakan otot. 6 Total Protein
(Protein Total)
Protein total terdiri atas albumin (60%) dan globulin (40%). Penurunan angka protein total dapat menggambarkan kerusakan hati, kerusakan ginjal atau kerusakan dimana protein tidak dicerna sepenuhnya
7 Albumin Protein darah yang diproduksi oleh hati dan
berperan dalam mempertahankan volume darah normal. Tingkat albumin yang rendah dikaitkan dengan sirosis hati.
8 Albumin-Globulin Ratio
(A/G Rasio)
Perbandingan albumin dengan globulin yang merupakan konstituen utama protein yang ditemukan dalam darah. Rasio yang abnormal terlihat ketika kadar albumin atau globulin meningkat atau menurun. Rasio abnormal terlihat pada berbagai gangguan, termasuk penyakit ginjal dan hati.
Batas normal setiap komponen-komponen yang terkait liver tersebut ditentukan oleh nilai laboratorium normal. Setiap laboratorium dalam menentukan nilai normal tergantung pada alat yang dipakai dan cara pemakaiannya. Saat peneliti mengambil data pasien liver tersebut tidak ada keterangan mengenai nilai laboratorium normal yang dipakai sebagai acuan untuk data tersebut, maka itu peneliti menentukan untuk mengambil salah satu nilai laboratorium normal yang diambil dari Paramount Health Service, yaitu sebuah organisasi pelayanan kesehatan di India yang menyediakan pelayanan inovatif terhadap kebutuhan kesehatan. Pada Tabel 3.2 menjelaskan nilai laboratorium normal pada nilai tes laboratorium Paramount Health Service :
III-5
Tabel 3.2 Nilai Laboratorium Normal Paramount Health Service
No Komponen Nilai
Normal Satuan
1 Total Bilirubin (Bilirubin Total) 0.2 – 1.0 mg/dL
(milligram per deciliter) 2 Direct Bilirubin
(Bilirubin Langsung
0.1 – 1.0 mg/dL
(milligram per deciliter)
3 Alkaline Phosphatase (ALP) 20 – 70 u/L
(unit per liters)
4 Serum Glutamic Pyruvic
Transaminase (SGPT) / Alanin Aminotransferase (ALT)
10 – 40 u/L
(unit per liters)
5 Serum Glutamic Oxaloacetic
Transaminase (SGOT) / Aspartate Aminotransferase (AST)
0 – 41 u/L
(unit per liters)
6 Total Protein (Protein Total) 6 – 8 g/dL
(gram per deciliter)
7 Albumin 3.8 – 5.0 g/dL
(gram per deciliter) 8 Albumin- Globulin Ratio
(A/G Rasio)
>1 g/dL
(gram per deciliter)
3.2 Data Preparation Phase
Pada fase pengolahan data ditentukan kasus dan variabel yang akan dianalisis. Dari data pasien liver ini, kolom yang diambil sebagai variabel keputusannya adalah kolom Liver Patient, sedangkan kolom yang diambil sebagai variabel penentu dalam pembentukan pohon keputusan adalah kolom :
1) Age (Usia)
2) Gender (Jenis Kelamin)
3) Total Bilirubin (Bilirubin Total) 4) Direct Bilirubin (Bilirubin Langsung)
5) Alkaline Phosphatase (ALP)
6) Serum Glutamic Pyruvic Transaminase (SGPT) / Alanin Aminotransferase (ALT)
7) Serum Glutamic Oxaloacetic Transaminase (SGOT) / Aspartate Aminotransferase (AST)
8) Total Protein (Protein Total) 9) Albumin
Tidak semua variabel dipilih dalam pembentukan pohon keputusan. Variabel Albumin/Globulin Ratio tidak dilibatkan karena sudah terwakili oleh Albumin. Berdasarkan variabel yang sudah dipilih, maka format data menjadi seperti pada Gambar 3.2.
Gambar 3.2 Format Baru Data Pasien Liver
Setelah ditemukan format data pasien liver yang baru, peneliti melakukan praproses dengan 2 (dua) cara sebagai berikut :
III-7
3.2.1 Praproses Menggunakan Rumus GINI
Rumus GINI digunakan untuk menentukan klasifikasi atribut yang bernilai kontinyu. Tahap-tahap praproses menggunakan rumus GINI adalah sebagai berikut :
1) Mengurutkan nilai-nilai pada atribut
2) Menghitung rata-rata dari setiap nilai yang bersebelahan setelah diurutkan 3) Menghitung GINI untuk semua nilai rata-rata
4) Nilai GINI paling kecil menjadi split untuk atribut tersebut
3.2.2 Praproses Pengklasifikasian Berdasarkan Referensi Kesehatan
Peneliti menggunakan referensi kesehatan dari World Health Organization (WHO) untuk pengelompokkan usia dan nilai laboratorium normal Paramount Health Service (PHS) untuk mengklasifikasi atribut yang lain pada data pasien liver. Berikut adalah pengelompokkan atribut-atribut yang perlu diklasifikasikan sebelum proses data :
1) Mengelompokkan age
Pengelompokkan age dilakukan dengan memasukkan usia pasien dalam range seperti pada Tabel 3.3. Klasifikasi age berdasarkan pembagian umur menurut WHO (World Health Organization).
Tabel 3.3 Klasifikasi Age
Klasifikasi Age (Tahun)
Batas Bawah Batas Atas
Child <=14
Young - Adult 15 49
Old >=50
2) Mengelompokkan nilai total bilirubin
Pengelompokkan total bilirubin dilakukan dengan memasukkan nilai bilirubin total dalam range seperti pada Tabel 3.4.
Tabel 3.4 Klasifikasi Total Bilirubin
Klasifikasi Total Bilirubin (mg/dL) Batas Bawah Batas Atas
1 <= 1.0
2 1.1 2.0
3 2.1 3.0
4 3.1 9.0
5 > 9.0
3) Mengelompokkan nilai direct bilirubin
Pengelompokkan direct bilirubin dilakukan dengan memasukkan nilai bilirubin langsung dalam range seperti pada Tabel 3.5.
Tabel 3.5 Klasifikasi Direct Bilirubin
Klasifikasi Direct Bilirubin(mg/dL) Batas Bawah Batas Atas
1 <= 1.0
2 1.1 2.0
3 2.1 5.0
4 > 5.0
4) Mengelompokkan nilai alkaline phosphatase/ALP
Pengelompokkan ALP dilakukan dengan memasukkan nilai ALP dalam range seperti pada Tabel 3.6.
Tabel 3.6 Klasifikasi Alkaline Phosphatase/ ALP
Klasifikasi Alkaline Phosphatase (u/L) Batas Bawah Batas Atas
1 <= 140
2 141 210
3 211 280
4 281 420
III-9
5) Mengelompokkan nilai SGPT/ALT
Pengelompokkan SGPT/ALT dilakukan dengan memasukkan nilai SGPT/ ALT dalam range seperti pada Tabel 3.7.
Tabel 3.7 Klasifikasi SGPT/ ALT
Klasifikasi SGPT/ALT (u/L) Batas Bawah Batas Atas
1 <= 40
2 41 80
3 81 120
4 121 200
5 > 200
6) Mengelompokkan nilai SGOT/AST
Pengelompokkan SGOT/AST dilakukan dengan memasukkan nilai SGOT/ AST dalam range seperti pada Tabel 3.8.
Tabel 3.8 Klasifikasi SGOT/AST
Klasifikasi SGOT/AST (u/L) Batas Bawah Batas Atas
1 <=41
2 42 82
3 83 164
4 > 164
7) Mengelompokkan nilai total protein
Pengelompokkan total protein dilakukan dengan memasukkan nilai protein total dalam range seperti pada Tabel 3.9.
Tabel 3.9 Klasifikasi Total Protein
Klasifikasi Total Protein (g/dL) Batas Bawah Batas Atas
1 >= 6.0
2 5.0 5.9
3 < 5.0
8) Mengelompokkan nilai albumin
Pengelompokkan albumin dilakukan dengan memasukkan nilai albumin dalam range seperti pada Tabel 3.10.
Tabel 3.10 Klasifikasi Albumin
Klasifikasi Albumin (g/dL) Batas Bawah Batas Atas
1 3.8 6.0
2 3.0 3.7
3 2.0 2.9
4 0.0 1.9
9) Menerjemahkan nilai liver patient
Penerjemahan liver patient dilakukan dengan mengganti nilai liver patient dengan nilai seperti pada Tabel 3.11.
Tabel 3.11 Penerjemahan Liver Patient Liver Patient Nilai Baru
1 Yes