ISSN: p.2301-475X e.2656-7059
PENERAPAN DATA MINING UNTUK DIAGNOSA PENYAKIT JANTUNG DENGAN ALGORITMA REGRESI LINEAR
Muhlisin1, Andri Firmansyah 2, Aswan Supriyadi Sunge 3 Program Studi Teknik Informatika, Universitas Pelita Bangsa
Korespondensi email: [email protected]
Abstrak penelitian ini (usia, tekanan darah, dan hasil_test)berpengaruh signifikan terhadap penelitian terbukti dengan menggunakan algoritma regresi linear mampu memberikan hasil yang baik dengan nilai Root Mean Squared Error: 0.483 +/- 0.000 dan Squared Error: 0.233 +/- 0.123. Hal ini dikarenakan adanya korelasi atau hubungan fungsional (sebab – akibat) antara variabel yang satu (dependen atau kriteria) dengan variabel yang lain (independent atau predictor.
Salah satu Penyakit Tidak Menular yang rentan terjadi terutama saat seorang individu berada pada usia produktif yaitu penyakit jantung (HeartDisease). Terganggunya peredaran oksigen dan darah tersebut dapat disebabkan karena otot jantung yang melemah, adanya celah antara serambi kiri dan serambi kanan yang mengakibatkan darah bersih dan darah kotor tercampur. Tujuan dari penelitian ini adalah prediksi yang dapat digunakan dalam pengambilan keputusan ketika pasien terkena penyakit atau tidak.
Sumber data sebagai objek pada penelitian ini adalah data historis yang diambil dari situs Kaggle.com. Data yang digunakan dalam penelitian ini terdiri dari atribut atau variabel seperti tekanan darah, usia, dan hasil test.
Pengujian yang telah dilakukan bahwa variabel atau atribut yang digunakan dalam
Informasi Artikel Diterima: 01 Maret 2021 Direvisi: 18 Juli 2021
Dipublikasikan: 10 Agustus 2021 Keywords
Penyakit jantung, Prediksi, Algoritma Regresi Linear
I. Pendahuluan
Penyakit jantung adalah suatu keadaan dimana jantung tidak dapat melaksanakan fungsinya dengan baik, sehingga kerja jantung sebagai pemompa darah dan oksigen ke seluruh tubuh terganggu. Terganggunya peredaran oksigen dan darah tersebut dapat disebabkan karena otot jantung yang melemah, adanya celah antara serambi kiri dan serambi kanan yang mengakibatkan darah bersih dan darah kotor tercampur.
Penyakit Jantung juga sering disebut dengan istilah Penyakit Kardiovaskuler.
Berdasarkan data dari WHO (World Health Organization), 17.9 juta orang di dunia meninggal Setiap Tahun akibat penyakit jantung (kardiovaskuler), yang disebabkan oleh penyumbatan pembuluh darah. Ini termasuk masalah pembuluh darah seperti masalah detak jantung yang tidak teratur, otot jantung yang lemah, cacat jantung bawaan, penyakit kardio vaskular dan penyakit arteri koroner. Hal ini mengakibatkan pemeliharaan sejumlah besar data
ISSN: p.2301-475X e.2656-7059
terkait pasien setiap hari. Data yang disimpan dapat digunakan sebagai sumber untuk memprediksi kemungkinan penyakit di masa depan yang membuat teknik penambangan data memainkan peran sentral untuk ekstraksi pengetahuan dan prediksi.
Seperti yang diketahui, fungsi utama jantung adalah memompa darah ke seluruh tubuh untuk memastikan kelangsungan hidup kita. Jantung bisa mengalirkan lebih dari 14.000 Liter darah per hari nya ke seluruh tubuh.
Prediksi penyakit jantung adalah salah satu area yang tumbuh untuk prediksi tersebut. Berdasarkan uraian masalah diatas, maka dalam penelitian ini digunakan algoritma regresi linear sebagai proses identifikasi data dengan judul “PENERAPAN DATA MINING UNTUK DIAGNOSA PENYAKIT JANTUNG DENGAN ALGORITMA REGRESI LINEAR”.
Gambar 1.1 Kerangka Berfikir
II. Landasan Teori 1. Penyakit Jantung
Penyakit jantung atau yang disebut juga koroner adalah penyakit dengan kondisi dimana adanya timbunan
lemak di pembuluh darah arteri koroner pada jantung dan adanya hambatan aliran darah menuju jantung.
2. Data Mining
Data mining merupakan proses pengambilan data dari data warehouse berdasarkan prediksi variabel. Data mining juga sebagai penemuan pada KDD database.
Prediksi digunakan untuk menemukan data dari sekumpulan data yang ditentukan dengan berbagai domain seperti kecerdasan buatan, basis data, dan lain-lain.
3. Prediksi
Prediksi merupakan bagian awal dari proses pengembalian suatu keputusan. Sebelum memprediksi, harus diketahui terlebih dahulu apa sebenarnya persoalan dalam pengambilan keputusan. Prediksi adalah pemikiran terhadap besaran, permintaan terhadap satu.
4. Algoritma regresi Linier
Regresi Linear digunakan untuk mengetahui bagaimana variabel dependen/kriteria dapat diprediksikan melalui variabel independen atau variabel prediktor, secara individual.
5. Rapid Miner
Rapid Miner merupakan perangkat lunak yang dibuat oleh Dr.Markus Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari rapid-i.com dengan tampilan GUI (Graphical User Interface) sehingga memudahkan
ISSN: p.2301-475X e.2656-7059
pengguna dalam menggunakan perangkat lunak ini.
III. Metodologi
Pada penelitian ini, tahapan yang akan digunakan dalam melakukan prediksi terhadap data penyakit jantung dan penentuan atribut pasien atau pemeriksaan untuk mempermudah penelitian sehingga penelitian dapat berjalan dengan baik dan sistematis, serta memenuhi tujuan yang diinginkan.
Dalam melakukan prediksi data penyakit jantung yang akan di uji sesuai pemodelan data yang akan digunakan agar mempermudahkan penelitian dan berjalan sesuai dinginkan maka dibuat alur atau tahapan dalam penelitian ini sebagai berikut:
Gambar 3.2 Tahapan Penelitian IV. Pembahasan
1. Data Uji
Penelitian ini menggunakan algoritma Regresi Linear, untuk mengidentifikasikan penyakit penyakit jantung dan akan mendapatkan hasil Root Mean Square Error (RMSE) serta prediksi yang dapat digunakan dalam pengambilan keputusan ketika pasien terkena penyakit atau tidak.
2. Split Validation
Teknik validasi yang membagi data menjadi dua bagian secara acak, sebagian sebagai data training dan sebagian lainnya sebagai data testing. Dengan menggunakan Split Validation akan dilakukan percobaan training berdasarkan split ratio yang telah ditentukan sebelumnya, untuk kemudian sisa dari split ratio data training akan dianggap sebagai data testing.
Tabel 1.3 Dataset
3. Perhitungan regresi Linier
Tabel 2.3 Perhitungan Regresi Linier
Usia Tekanan Darah Prediksi
52 125 0
53 140 0
70 145 0
61 148 0
62 138 0
58 100 1
58 114 0
55 160 0
46 120 0
54 122 0
71 112 1
43 132 0
34 118 1
51 140 0
52 128 0
No Usia (X1)
Tekanan Darah (X2)
Prediksi
(Y) X1Y X2Y X1X2 X12 X22
1 52 125 0 0 0 6500 2704 15625
2 53 140 0 0 0 7420 2809 19600
3 70 145 0 0 0 10150 4900 21025
4 61 148 0 0 0 9028 3721 21904
5 62 138 0 0 0 8556 3844 19044
6 58 100 1 58 100 5800 3364 10000
ISSN: p.2301-475X e.2656-7059 𝒃𝟏= 𝑛 ∑(𝑥1𝑦) − (∑ 𝑥1)(∑𝑦)
𝑛(∑𝑥12)1− (∑𝑥1)2 𝒃𝟏= 100(2419) − (5402)(47)
100(300714) − (5402)2 𝒃𝟏= 241900 − 253894
30071400 − 29181604 𝒃𝟏 = −11994
889796 𝑏1 = − 𝟎. 𝟎𝟏𝟑𝟒𝟖 4. Proses Pengujian Data
Melakukan select attributes yaitu untuk mengetahui hasil prediksi dari rapidminer, hasil perhitungan manual dan hasil uji di rapidminer
Gambar 3.3 Proses Pengujian
Gambar 3.4. Hasil Prediksi
Gambar 3.5 Hasil Pengujian Root Mean Square Error dan Square Error 5. Analisa Hasil
Berdasarkan hasil pengujian yang telah dilakukan bahwa variabel atau atribut yang digunakan dalam penelitian ini (usia, tekanan darah, dan hasil_test) berpengaruh signifikan terhadap penelitian ini terbukti dengan menggunakan algoritma regresi linear mampu memberikan hasil yang baik dengan nilai Root Mean Squared Error:
0.483 +/- 0.000 dan Squared Error:
0.233 +/- 0.123. Hal ini dikarenakan adanya korelasi atau hubungan fungsional (sebab – akibat) antara variabel yang satu (dependen atau kriteria) dengan variabel yang lain (independen atau predictor). Proses pengujian ini dilakukan untuk mengidentifikasi penyakit jantung dengan algoritma regresi linear.
6. Kesimpulan
Berdasarkan hasil penelitian penulis yang dilakukan serta pembahasan yang dilakukan penulis maka dapat diambil kesimpulan sebagai berikut:
1. Pada penelitian ini dengan memanfaatkan beberapa data pasien penderita penyakit jantung yang telah tersimpan dalam basis data menggunakan beberapa atribut diantaranya: usia, tekanan darah dan hasil test. Sehingga dengan
ISSN: p.2301-475X e.2656-7059
menerapkan algoritma regresi linear dapat dilakukan suatu prediksi berdasarkan hubungan fungsional pada variable atau atribut didalam data tersebut.
2. Mengolah data penyakit jantung menggunakan algoritma regresi linear dimulai dari tahap seleksi data (atribut yang digunakan dan penentuan data training serta data testing), tahap pengujian algoritma (regresi linear), dan tahap uji akurasi (menggunakan split validation).
3. Proses pengujian data pada penelitian ini menggunakan algoritma regresi linear mampu memberikan hasil yang baik dengan nilai Root Mean Squared Error:
0.478 +/- 0.000 dan Squared Error:
0.228 +/- 0.139.
Berdasarkan hasil penelitian memberikan beberapa saran sebagai berikut;
1. Memaksimalkan atau menambah atribut yang lebih spesifik dan lebih banyak dalam menentukan prediksi penyakit jantung.
2. Perlu adanya penelitian lebih lanjut dalam melakukan pengujian dengan metode atau algoritma lain agar memperoleh perbandingan dengan tingkat akurasi yang paling baik dalam mengidentifikasi data penyakit jantung.
7. Ucapan Terima Kasih
Pada kesempatan kali ini, penulis ingin menyampaikan rasa terima kasih kepada pihak terkait. Karena penulis
menyadari tanpa adanya uluran dan bantuan mereka belum tentu laporan dan jurnal ini dapat diselesaikan. Dan pada akhirnya penulis hanya dapat berdo’a serta berharap semoga apa yang telah kalian berikan kepada penulis dapat dibalas dengan kebaikan Allah Subkhanahu Wa Ta’ala.
8. Journal Article
[1]Tri Retnasari, Eva Rahmawati.”Diagnosa Prediksi Penyakit Jatntung dengan Model Algoritma Naïve Bayes dan Algoritma”, Maret 2017, pp. 7~12 [2] Riski Annisa.”Analisi Komparasi Algoritma Klasifikasi Data Mining untuk Prediksi Penyakit Jantung”, Vol. 3 , No. 1, Jan 2019 [3] Guntur Eka Saputra, Karmilasari, Adrian Faisal, dan Ahmad Apandi. ”Perbandingan Penerapan Algoritma Neural Network Backropagation dengan Optimasi Algoritma LBFGS dan SGD untuk Prediksi Penyakit Jantung”, Volume 4 Nomor 1, 23 September 2020, ISSN : 2581-2327
[4] Abdul Rohman.”Komporasi Metode Klasifikasi Data Mining untuk Prediksi Penyakit Jantung”, Vol. 2 No.2, Desember 2016, hal.
21-28
[5] Pandito Dewa Putra, Dian Palupi Rini” Prediksi Penyakit Jantung dengan Algoritma Klasifikasi”, Vol.5 No.1
ISSN: p.2301-475X e.2656-7059
[6] Derisma.“Perbandingan Kinerja Algoritma untuk Prediksi Penyakit Jantung dengan Teknik Data Mining”, Vol.4, No.1, Juli 2020, pp. 84~88
[7] Ade Riani, dkk.” Implementasi Data Mining Untuk Memprediksi Penyakit
Jantung Mengunakan Metode Naive Bayes”, Vol.1, No.01, Desember 2019, pp.25-34
[8] Nur Aeni Widiastuti, Stefanus Santosa, Catur Supriyanto.”
ALGORITMA KLASIFIKASI DATA MINING NAÏVE BAYES BERBASIS PARTICLE SWARM
OPTIMIZATION UNTUK
DETEKSI PENYAKIT
JANTUNG”, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920 [9] Y. Silalahi, Kristiani Silalahi., Murfi, Hendri., Satria, “Studi Perbandingan Pemilihan Fitur untuk Support Vector Machine pada Klasifikasi Penilaian Risiko
Kredit,” vol. 1, no. 2, pp. 119–136, 2017.
[10] H. W. Herwanto, T.
Widiyaningtyas, and P. Indriana,
“Penerapan Algoritme Linear Regression untuk Prediksi Hasil Panen Tanaman Padi,” J. Nas.
Tek. Elektro dan Teknol. Inf., vol.
8, no. 4, p. 364, 2019, doi:
10.22146/jnteti.v8i4.537.
[11] D. S. O. Panggabean, E.
Buulolo, and N. Silalahi,
“Penerapan Data Mining Untuk Memprediksi Pemesanan Bibit Pohon Dengan Regresi Linear Berganda,” JURIKOM (Jurnal Ris. Komputer), vol. 7, no. 1, p.
56, 2020, doi:
10.30865/jurikom.v7i1.1947.
[12] Suyanto, Data Mining.
Yogyakarta: Informatika, 2017.
[13] Retno Tri vulandari, Data Mining. Yogyakarta: Gava Media, 2017.
[14] J. Gaussian, “1 , 2 , 3 1,” vol. 4, no. Dm, pp. 237–246, 2015