BABI
PENDAHULUAN
1.1 Latar Belakang
Tubuh manusia tersusun atas berbagai macam organ vital yang menunjang kehidupan. Salah satu contoh organ vital manusia adalah jantung. Jantung bertugas memompa darah dari dan keseluruh tubuh. Jika jantung mengalami kelainan dan gangguan, maka distribusi nutrisi dan oksigen yang terkandung di dalam darah menjadi tidak normal, sehingga menyebabkan tubuh terganggu. Kondisi jantung dapat diamati berdasarkan cardiac action potential, suatu sinyal elektronis yang timbul akibat adanya kontraksi mekanis sel jantung yang diberikan stimulasi berupa arus listrik. [1], [2].
Electrocardiogram (ECG), merupakan salah satu isyarat fisiologi utama yang dihasilkan dari kerja elektrik jantung ketika fase repolarisation dan depolarisation[1]–[11]. ECG pertama kali diperkenalkan oleh Augustus Waller pada tahun 1887 [1]. Sejak saat itu, ECG menjadi salah satu isyarat yang penting dan paling sering digunakan untuk melakukan analisis terhadap perilaku jantung[1], [2], [5]–[7], [12]–[16]. ECG dapat dengan mudah diperoleh dengan perantara elektroda yang dipasang pada dada pasien [2]. Isyarat ECG menghasilkan data satu dimensi yang menunjukkan perubahan tegangan listrik yang dideteksi dari kulit manusia, pada rentang waktu tertentu [17], [18]. ECG termasuk metode non-invasive[9], [10], [19], [20], sehingga tidak menimbulkan efek samping terhadap pasien.
Jantung, sebagaimana organ tubuh yang lain, kinerjanya dapat menurun dan terserang penyakit. Salah satu penyakit jantung yang mempunyai angka kematian tinggi adalah CVD (cardiovascular disease). Berdasarkan data WHO, pada tahun 2007, dari setiap 100 ribu populasi, rata-rata terdapat 251 orang meninggal akibat CVD [20]. Pada tahun 2010, hampir 180.000 meninggal akibat CVD di Inggris [21], sedangkan di Brazil, CVD merupakan penyebab kematian tertinggi [22]. Salah satu komplikasi dari CVD antara lain adalah atrial dan
ventriculararrhythmia, yang terjadi akibat gangguan irama jantung atau cardiacarryhthmia[20], [21].
Cardiac arrhythmia, atau biasa disebut dengan arrhythmia saja, terjadi akibat adanya inisiai impuls dan konduksi yang tidak normal [1]. Terdapat berbagai jenis arrhythmia yang dapat dibagi berdasarkan asal mula gangguan di jantung (site of origin), atau dapat pula dikelompokkan berdasarkan kecepatan rata-rata detak jatungnya [1], [23]. Atrial Fibrillation (AF), salah satu dari penyebab cardiacarrhythmia, merupakan gangguan yang paling sering ditemui [23]–[25]. AF banyak ditemui pada kasus arrhythmia yang terjadi pada pasien dewasa, dengan tingkat prevalence secara umum adalah 1%, tetapi presentase tersebut meningkat tajam pada pasien yang berusia diatas 80 tahun, dengan presentase mencapai 7-14% pada pasien yang tinggal di kawasan western, dan 2-3% di Jepang [23]. Penelitian lain menyebutkan bahwa anak-anak dapat pula gangguan arrhythmia, dengan tingkat prevalence sekitar 1,25% pada anak sekolah dasar, dan 2,32% pada anak setingkat SLTP [1].
Gejala arrhythmia dapat didiagnosis berdasarkan bentuk morfologi dari ECG yang diperoleh dari pasien [2], [19]. Untuk memperoleh informasi yang detail, jantung pasien harus diamati secara kontinyu, yang mana membutuhkan perhatian khusus dari para dokter. Oleh karena banyaknya jumlah pasien yang membutuhkan monitoring dari para dokter secara kontinyu, dikembangkanlah sistem deteksi ECG secara umum, dan deteksi arrhythmia secara khusus, yang bersifat otomatis [5], [18], [19], [22], [26].
Sistem deteksi atau klasifikasi arrhythmia secara otomatis banyak dikembangkan dengan basis machine learning. Secara umum, sistem pemodelan klasifikasi dalam machine learning dapat dibagi menjadi tiga kelompok, yaitu decision tree classifier, rule-based classifier, dan mathematical / functional model classifier. Di antara ketiga kelompok tersebut, decisiontree classifier dan rule-based classifier secara umum lebih mudah dipahami karena representasi knowledge dalam bentuk tree atau rule lebih sesuai dengan intuisi manusia [27]. Namun, mathematical modelclassifier mempunyai keunggulan lebih baik dari segi
performa, dan oleh karenanya banyak digunakan sebagai core dalam penelitian sistem otomatisasi deteksi arrhythmia, antara lain menggunakan algoritme klasifikasi ANN (Artificial Neural Network) dan variannya [5], [7]–[9], [11], [13], [19], [20], [22], [28], [29] , SVM (Support Vector Machine) [13]–[15], [18], [20], dan KNN (K-Nearest Neighbour) [29], [30].
Fenomena perkembangan machine learning yang berkaitan dengan dunia medis tersebut diamati oleh Kononenko[31], seorang profesor dari Slovenia. Hasil pengamatannya adalah berupa kriteria yang seharusnya dipenuhi sistem machine learning sebagai alat bantu diagnosis dokter dan tenaga medis. Kriteria tersebut yang pertama, sistem mampu menghasilkan performa yang baik dan mampu mengurangi durasi atau jumlah interaksi dengan pasien. Kriteria lain yang menjadi pertimbangan adalah sistem machine learning tersebut harus mampu menjelaskan keputusan yang dihasilkan kepada tenaga medis. Knowledge yang dihasilkan oleh sistem harus dapat dianalisis dan dipahami oleh tenaga medis. Kondisi ini akan membantu tenaga medis untuk mengambil keputusan berdasarkan berbagai point of view, sehingga memperkaya knowledge dalam menangani kasus tertentu. Selain itu, dengan knowledge yang lebih transparan akan mengantisipasi bila terdapat ditemukan hasil keputusan sistem yang tidak masuk akal, tenaga medis mampu melihat lebih detail langkah pengambilan keputusan tersebut dan mengetahui kekurangan sistem. Jika hal ini tidak terpenuhi, maka akan dimungkinkan terjadi penurunan tingkat kepercayaan tenaga medis terhadap hasil keputusan sistem.
Transparansi knowledge pada sistem machine learning yang berkaitan dengan dunia medis dapat terpenuhi jika sistem dibangun menggunakan model klasifikasi based dan decision tree. Seperti yang telah dijelaskan, model rule-based dan decision tree lebih mudah dipahami dan sesuai dengan intuisi manusia. Akan tetapi, model-model tersebut belum mampu menghasilkan performa yang mendekati hasil klasifikasi menggunakan mathematical model. Untuk mengatasi hal ini, salah satu strateginya adalah meningkatkan performa klasifikasi dengan trade-off berupa transparansi model. Hal ini dapat dipenuhi dengan
mengimplementasikan struktur cascade atau bertingkat pada model klasifikasi berbasis rule dan decision tree.
Meta Classifier Decision Atribut-1 Atribut-2 Atribut-3 ... Atribut-n Base Classifier
Gambar 1.1 Ilustrasi struktur cascade classifier
Struktur cascade [32], sebagaimana yang diilustrasikan pada Gambar 1.1 diatas, merupakan suatu cara menyusun model klasifikasi secara bertingkat. Proses klasifikasi yang dilakukan tidak hanya sekali, melainkan dua kali atau lebih. Adapun metode yang digunakan dapat disesuaikan, bisa sama ataupun berbeda. Data mula-mula diklasifikasikan menggunakan meta-classifier. Output hasil model meta-classifier, ditambahkan ke dataset awal sebagai atribut baru. Data yang baru tersebut kemudian di klasifikasikan menggunakan base-classifier, selanjutnya keluaran base-classifier menjadi keluaran akhir sistem.
1.2 Perumusan masalah
Berdasarkan paparan diatas, dapat disimpulkan sebuah permasalahan yang masih dihadapi oleh sebagian besar sistem berbasis machine learning berkaitan dengan data medis, yaitu transparansi sistem. Sistem machine learning yang dikembangkan untuk mendeteksi penyakit arrhythmia secara otomatis sebagian besar menggunakan mathematical model classifier, yang secara umum lebih sulit dipahami oleh manusia, terutama bagi mereka yang tidak mempunyai backgroundilmu keteknikan. Oleh karena itu, untuk meningkatkan pemahaman dokter dan tenaga medis terhadap sistem klasifikasi, sebagaimana yang disarankan oleh Kononenko[31], perlu dikembangkan sistem klasifikasi yang lebih mudah dipahami knowledge-nya, yaitu menggunakan klasifikasi berbasisdecision tree
ataurule.
1.3 Keaslian penelitian
Penyakit jantung, khususnya arrhythmia, memiliki tingkat prevalence yang tinggi. Salah satu metode untuk mendiagnosis penyakit jantung dilakukan menggunakan ECG. Diagnosis hasil ECG pada secara umum dilakukan secara manual, akan tetapi karena kebutuhan yang tinggi, diperlukan sistem otomatis untuk membantu dalam pengambilan keputusan. Sistem otomatis diagnosis ECG berbasis machine learning telah banyak diteliti dan dikembangkan, seperti yang disajikan pada Tabel 1.1.
Tabel 1.1 Tabel penelitian-penelitian sebelumnya
Tahun Metode Klasifikasi Ektraksi Fitur Kelas
Klasifikasi Hasil 2000 Artificial Neural Network[22] LPF Beat Extraction using decimation; R-peak 3 class dengan semua data Overall akurasi 99,2% 2004 Fuzzy Neural Network[28] Wavelet; Normalize 7 rekaman pasien Overall akurasi 99,79% 2010 Ant Colony OptimizationClustering; Artificial Neural Network[33] PCA; Wavelet; Interval komponen ECG 6 kelas Overallakurasi 92 % 2012 Radial Basis Function[11] Wavelet; Beat Extraction 5 kelas @ 100 detak Overall akurasi 99.6% 2012 ANN,Fuzzy KNN; Fuzzy Inference System[9] PQRST detect; Beat Segmentation; Normalize 5 kelas @ 100 detak Overall akurasi 98 % 2012 K-Nearest Neighbour[30] Statistik dari Wavelet Packet Decomposition WPD AAMI, 5 kelas, 5.887 detak 90% SEN, 98% SPE, 92% SEL 2013 Artificial Neural Network, Support Vector Machine, Probabilistic Neural Network[20] Pan Tompkin; Ekstrak 200 detak; PCA,LDA,ICA AAMI, 5 kelas, 110.094 detak Overallakurasi 99,28% dengan ICA + PNN
Secara umum, sistem diagnosis arrhythmia yang telah diteliti menghasilkan performa yang memuaskan. Penelitian [30] menggunakan KNN,
diperoleh hasil sensitivity sebesar 98%. Selain itu, terdapat pula penelitian menggunakan ANN, SVM dan PNN (Probabilistic Neural Network) [20] yang menghasilkan akurasi terbaik mencapai 99,28%. Kedua penelitian tersebut mengklasifikasikan kelompok lima kelas dari 16 kelas yang ada, sesuai dengan standar AAMI (Association for the Advancement of Medical Instrumentation). Selain itu, klasifikasi arrhythmia juga dilakukan dengan lima kelas, akan tetapi tidak semua kelas penyakit digunakan seperti pada [11][9].
Dari semua penelitian yang dipaparkan padaTabel 1.1, terdapat celah yang masih dapat dikembangkan.Pertama, penelitian-penelitian tersebut menggunakan algoritme klasifikasi dengan luaran berupa model yang tidak mudah untuk dipahami, apalagi oleh dokter dan tenaga medis. Hal ini cukup bertolak belakang dengan saran mengenai transparansi model oleh Kononenko [31]. Oleh karena itu, diperlukan disain dan implementasi sistem klasifikasi penyakit arrhythmia dengan yang transparan.Celah lain yang dapat dikembangkan adalah pada penelitian sebelumnya, data ekstraksi ciri digunakan tanpa mempertimbangkan informasi dari data original.Data originaldan data hasil ekstraksi ciri memiliki kandungan informasi berbeda, sehingga penggabungan atribut akan memberikan informasi yang lebih lengkap. Sehingga, secara ringkas penelitian ini memberikan beberapa kontribusi, yaitu :
1. Mengembangkan metode klasifikasi transparan dengan performa yang reasonable, dengan menerapkan algoritme klasifikasi berbasis decision tree dan rule-based classifier,
2. Menggabungkan data hasil ekstraksi ciri dengan data original, dan implementasi struktur cascade untuk meningkatkan performa klasifikasi.
1.4 Tujuan penelitian
Tujuan dari penelitian ini adalah merancang dan mengimplementasikan sebuah sistem machine learning untuk klasifikasi arrhythmia berdasar EKG yang transparan, dengan tetap menghasilkan performa yang baik. Transparansi sistem
dapat ditingkatkan dengan berbagai cara, salah satunya adalah menggunakan classifier berupa decision tree atau rule.
1.5 Manfaat penelitian
Hasil penelitian ini dapat bermanfaat terhadap keilmuan mengenai pengembangan machine learning menggunakan model algoritme klasifikasiyang lebih mudah dipahami knowledge-nya, serta melakukan implementasi strategi cascade untuk meningkatkan akurasi klasifikasi. Transparansi sistem machine learning akan meningkatkan pemahaman engineer dan tenaga medis terhadap model yang dibentuk oleh sistem, sehingga mampu memahami alasan di balik diambilnya sebuah keputusan oleh sistem.