BAB I PENDAHULUAN
1.1. Latar Belakang Masalah
Analisis regresi adalah salah satu uji statistika yang memiliki dua pilihan model yang berbeda, yaitu model linier dan non-linear berdasarkan parameternya. Model linier merupakan model yang menggambarkan hubungan antara variabel respon (𝑌) dan variabel prediktor (𝑋) (Faraway dalam Santi,dkk. 2021). Model linier juga kerap kali dikenal sebagai metode regresi linier. Persamaan regresi sendiri merupakan persamaan matematik yang melakukan peramalan nilai-nilai suatu variabel dependen dari satu atau lebih variabel independen berdasarkan hal tersebut, analisis regresi bertujuan membuat perkiraan nilai suatu variabel dependen jika nilai variabel-variabel yang berhubungan sudah ditentukan.
Terdapat dua analisis dalam model linier yaitu analisis regresi sederhana dan analisis regresi berganda. Analisis regresi sederhana merupakan hubungan antara satu variabel dependen dan satu variabel independen. Sedangkan analisis regresi berganda merupakan hubungan antara tiga variabel atau lebih, dengan sekurang-kurangnya dua variabel independen dengan satu variabel dependen. Generalized Linear Model (GLM) merupakan bentuk umum yang dikembangkan dari bentuk dasarnya yaitu model linear.
GLM ini merupakan pengembangan model regresi untuk peubah respon yang tidak berdistribusi normal. GLM merupakan model yang kerap kali digunakan untuk menghitung atau memodelkan data biner (binary) (McCullagh and Nelder, 1983).
Model linier memiliki perbedaan dengan model kuadratik. Model linier memiliki gambar grafik hubungan antara variabel dependen dan independen yang berbentuk menyerupai satu garis lurus, sedangkan pada model kuadratik grafik hubungan yang terbentuk berupa grafik persamaan kuadrat. Model atau metode kuadratik merupakan model dimana nilai variabel dependen memiliki bentuk naik atau turun secara linier atau terjadi secara parabola atau kurva yang dihasilkan membentuk garis lengkung (Renyaan, 2018). Model kuadratik juga kerap kali disebut sebagai model non-linear.
Regresi non-linear model kuadratik merupakan hubungan antara dua peubah yang terdiri dari variabel dependen (𝑌) dan variabel independen (𝑋) sehingga akan diperoleh suatu kurva yang membentuk garis lengkung menaik atau menurun (Yusnandar, 2004).
Seperti yang telah disampaikan pada paragraf pertama, analisis regresi merupakan alat statistik yang dapat digunakan untuk mengetahui hubungan antara dua variabel atau lebih dengan salah satu variabel (variabel dependen) dapat diduga oleh variabel lain (variabel independen). Bentuk pola hubungan antara variabel dependen dan independen dapat bermacam-macam seperti linear, kuadratik, kubik dan sebagainya. Dalam suatu kejadian khusus sangat dimungkinkan terjadi kasus dimana variabel independen memiliki lebih dari satu pola hubungan dengan variabel dependennya, yaitu variabel independen dan dependen dimungkinkan memiliki pola hubungan yang tetap, namun pada saat variabel independen berada pada nilai-nilai tertentu ternyata memiliki persamaan garis regresi yang berbeda. Perbedaan garis regresi dapat merupakan penggabungan dua model yang berbeda seperti regresi model linear-kuadratik, dimana saat awal grafik membentuk garis linear hingga saat variabel independen pada nilai tertentu grafik menjadi bentuk grafik kuadratik. Model tersebut dikenal dengan regresi Linear-Quadratic Model.
Model regresi Linear-Quadratic sebelumnya telah dibahas dalam penelitian Pastor dan Guallar (1998). Pada penelitian yang berjudul “Use of Two-segmented Logistic Regression to Estimate Change-points in Epidemiologic Studies” tersebut Pastor dan Guallar memaparkan studi epidemiologi yang seringkali dirancang untuk mengeksplorasi hubungan antara variabel eksposur secara terus-menerus dan resiko penyakit. Pada proses tersebut, seringkali terdapat hubungan dosis-respon tiba-tiba berubah ketika variabel paparan mencapai tingkat ambang batas yang tidak diketahui yang disebut titik perubahan, tetapi tidak ada metode yang bisa menganalisis atau menyediakan prosedur inferensi untuk memperkirakan lokasi titik perubahan. Pada penelitian tersebut Pastor dan Guallar memaparkan sifat dan aplikasi regresi model Linear-Quadratic dan untuk memperoleh model dengan estimasi yang terbaik, maka kita perlu mengestimasikan nilai titik ubah dan nilai koefisien regresi.
Penelitian tersebut kemudian dikembangkan kembali oleh F. Zhang, J. Yang, L. Liu et al. (2021) dalam artikel yang berjudul “Generalized linear-quadratic model with a change point due to a covariate threshold”. Pada penelitian ini, peneliti mengembangkan model umum dari Linear-Quadratic dengan titik perubahan karena ambang kovariat dengan satu segmen garis linier dan segmen kuadrat lainnya
berpotongan di titik perubahan. Peneliti mengusulkan metode dua langkah untuk memperkirakan koefisien regresi dan titip ubah atau perubahan. Sifat asimtotik dari estimator diturunkan oleh teori proses empiris modern. Uji rasio sup-likelihood dengan bersamaan dengan distribusi terbatas digunakan untuk menguji keberadaan titik perubahan. Metode ini diaplikasikan pada data Down Syndrome dan Gagal Jantung yang mengungkapkan wawasan menarik.
Sindrom pernapasan akut yang disebabkan Corona Virus Disease (SARS-CoV-2) atau kita kenal sebagai Covid-19 pertama kali muncul pada Desember 2019 di Wuhan, Cina yang kemudian dengan cepat menjadi pandemi global (Weinberger, et al. 2020). Lebih dari 100 juta kasus dikonfirmasi sebagai penyakit Covid-19 dan lebih dari dua juta kematian disebabkan oleh Covid-19 (Dong E, 2020). Beberapa pasien yang terinfeksi Covid-19 tidak menunjukkan gejala sementara sebagian besar lainnya menunjukkan gejala yang menyebabkan penyakit ringan, hingga sedang seperti flu, demam, badan menggigil, batuk dan sakit tenggorokan (Wu and Gruselli et all, 2020). Beberapa pasien yang terinfeksi Covid-19 menjadi kritis dan membutuhkan perawatan intensif dengan menggunakan ventilator untuk membantu pernapasannya akibat kekurangan kadar oksigen dalam darah. Risiko kematian akibat Covid-19 sangat bergantung pada usia dan kondisi kesehatan sebelumnya. Pasien yang lebih tua dan Pasien yang memiliki penyakit bawaan kronis seperti jantung, hipertensi, diabetes dan paru-paru memiliki peluang lebih besar memasuki masa kritis saat terkena penyakit Covid-19 dan dapat berakibat fatal yaitu kematian (Wo and Coogan, and Mehra, et al, 2020).
Dalam tesis ini dibahas dua langkah metode untuk mengestimasi koefisien regresi dan keberadaan titik perubahan pada model umum regresi linier kuadratik pada studi kasus hubungan faktor-faktor (penyakit bawaan) yang mempengaruhi resiko kematian pasien akibat Covid-19. Metode ini terinspirasi atas pemaparan yang dilakukan oleh F. Zhang, J. Yang, L. Liu et al. (2021).
1.2. Tujuan dan Manfaat Penelitian
Tujuan dilakukan penelitian dan ditulisnya tesis ini, yaitu:
1. Mempelajari konsep model umum linear kuadratik dengan titik perubahan untuk melakukan estimasi koefisien regresi dan menentukan keberadaan titik perubahan.
2. Mengaplikasikan metode tersebut pada data Covid-19 untuk melihat hubungan antara faktor-faktor penyakit bawaan yang menyebabkan kematian pada Covid-19 sehingga dapat diperoleh faktor apakah yang paling berpengaruh pada penyebab kematian pasien Covid-19.
1.3. Pembatasan Masalah
Dalam tesis ini batasan masalah diperlukan agar peneliti dapat fokus pada tujuan awal dan tidak terjadi penyimpangan alur bahasan. Pembahasan hanya akan difokuskan pada model umum regresi berbentuk linier-kuadratik dengan titik perubahan. Metode tersebut kemudian akan digunakan atau diaplikasikan untuk menentukan estimasi dann titik perubahan pada data Covid-19 sehingga Peneliti dapat memberikan kesimpulan terkait faktor yang paling berpengaruh pada penyebab kematian pasien Covid-19.
1.4. Tinjauan Pustaka
Estimasi koefisien regresi dan menentukan keberadaan titik perubahan telah dilakukan dalam beberapa penelitian. Ada banyak penelitian dalam menentukan model titik perubahan dibawah regresi rata-rata tertentu untuk model regresi perubahan seperti:
Andrews, 1993; Bai and Perron, 1998; Kato, 2009; Lee et al., 2011. Dari penelitian- penelitian tersebut, terbatas pada topik bahasan yang terpaku pada GLM (Generalized Linear Model). Penelitian terakhir terkait titik perubahan dilakukan oleh Tapsoba et al.
(2020) yang memaparkan model umum untuk mengestimasi titik ubah (Change Point) yang dapat digunakan pada data yang paling tidak memiliki satu titik ubah (change point) yang tidak diketahui sehubungan dengan beberapa kovariat dalam GLM baik untuk data independen maupun data yang saling berkorelasi. Metode tersebut kemudian diaplikasikan pada data HIV dan data Diabetes.
Penelitian-penelitian tersebut hanya berfokus pada bentuk Linier-Linier belum pada bentuk Linier-Kuadratik. Pastor dan Elisio (1998) mulai memaparkan bentuk regesi logistik Linier-Kuadratik dalam penelitiannnya yang kemudian dikembangkan oleh F.
Zhang, J. Yang, L. Liu et al. (2021). Penelitian milik Zhang, et al. tersebut menjadi
Literatur utama dalam penulisan tesis ini dan metode yang digunakan akan diaplikasikan dalam data Covid-19. Penelitian tersebut bertujuan untuk untuk mengestimasi titik ubah (change point) yang tidak diketahui karena ambang kovariat pada bentuk Generalized Linear-Quadratic yang diaplikasikan pada Data tentang hubungan antara variabel usia dengan penyakit gagal jantung dan paket data hubungan antara usia dengan resiko ibu melahirkan anak Down Syndrome.
1.5. Metode Penelitian
Metode yang digunakan dalam penulisan tesis ini adalah studi literatur yang diperoleh dari sumber-sumber seperti buku, artikel jurnal dan sebagainya serta penerapan atau aplikasi metode pada studi kasus yang ada.
1.6. Sistematika Penulisan
Tesis ini membahas tentang pembentukan model umum Linear-Kuadratik dengan titik perubahan yang tidak diketahui dan aplikasi metode untuk mengestimasi koefisien regresi dan menentukan keberadaan titik perubahan pada data Covid-19. Topik bahasan tersebut akan dibagi ke dalam beberapa bab bahasan.
Bab I adalah bagian pendahuluan yang berisikan latar belakang masalah, tujuan penulisan, pembatasan masalah, tinjauan pustaka, metode penulisan dan sistematika penulisan. Bab II akan berisi uraian mengenai landasan teori yang digunakan dalam pembahasan, yaitu Regresi Linier, Regresi Kuadratik, Regresi Linear-Kuadratik, Generalized Linear-Quadratic Models, Titik Perubahan (Change Point), Covid-19. Bab III akan menjabarkan metode yang digunakan dan rancangan penelitian yang akan dilaksanakan. Bab IV akan berisi tentang aplikasi metode yang digunakan untuk menentukan estimasi koefisien regresi dan menentukan keberadaan titik perubahan pada data Covid-19. Bab V merupakan bab penutup yang berisi kesimpulan jawaban atas masalah yang berasal dari pembahasan masalah dan saran yang muncul akibat kekurangan-kekurangan pada proses pembahasan masalah.
Daftar Pustaka Sementara BAB I
Andrews, D. 1993. Tests for parameter instability and structural change with unknown change point.
Econometrica. Vol. 61: 821-856.
Bai, J., Perron, P., 1998. Estimating and testing linear models with multiple structural changes.
Econometrica Vol. 64, 47–78.
Dong, E., Du, H. & Gardner, L. 2020. An interactive web-based dashboard to track COVID-19 in real time. Lancet Infect. Dis. Vol. 20, 533–534.
Grasselli, G. et al. 2020. Baseline characteristics and outcomes of 1591 patients infected with SARS- CoV-2 admitted to ICUs of the Lombardy Region, Italy. JAMA 2020. Vol 323(16): 1574-1581.
Kato, K., 2009. Asymptotics for argmin processes: convexity arguments. J. Multivariate Anal. Vol. 100:
1816–1829.
Lee, S., Seo, M.H., Shin, Y., 2011. Testing for threshold effects in regression models. J. Amer. Statist.
Assoc. Vol. 106: 220–231.
McCullagh, P. and J.A. Nelder FRS. 1983. Generalized Linear Models Second Edition (Monographs on Statistics Applied Probability 37). New York: Chapman and Hall.
Mehra, M. R., Desai, S. S., Kuy, S., Henry, T. D. & Patel, A. N. 2020. Cardiovascular disease, drug therapy, and mortality in Covid-19. N. Engl. J. Med. Vol 382(25): e102(1)-e102(7).
Pastor, Roberto, and Eliseo Guallar. 1998. Use of Two-segmented Logistic Regression to Estimate Change-points in Epidemiologic Studies. American Journal of Epidemiology. Vol. 148 No. 7:
631-642.
Renyaan, Novy Ika Anthonia. 2018. Perbandingan Metode Regresi Linier dan Kuadratik dalam Peramalan Penjualan Sepeda Motor. Skripsi. Universitas Sanata Dharma Yogyakarta. Fakultas Sains dan Teknologi.
Santi,Vera Maya, dkk. 2021. Pemodelan Jumlah Kasus Malaria di Indonesia Menggunakan Generalized Linier Model. Jurnal Statistika dan Aplikasinya. Vol 5 Issue (1): 112-120.
Tapsoba, J.d.D., Wang, C.-Y., Zangeneh, S., Chen, Y.Q., 2020. Methods for generalized change-point models: with applications to human immunodeficiency virus surveillance and diabetes data. Stat.
Med. Vol. 39: 1167–1182.
Weinberger, et al. 2020. Estimation of Excess Deaths Associated With the COVID-19 Pandemic in the United States, March to May 2020. JAMA Intern Medical. Vol. 180(10): 1336-1334.
Wibisono, Yusuf. 2009. Metode Statistik. Yogyakarta: Universitas Gadjah Mada.
Wu, Z. & McGoogan, J. M. 2020. Characteristics of and important lessons from the coronavirus disease 2019 (COVID-19) outbreak in China: summary of a report of 72314 cases from the Chinese Center for Disease Control and Prevention. JAMA 2020. Vol 323(13): 1239-1242.
Yusnandar, M.E. 2004. Aplikasi Analisis Regresi Non-Linear Model Kuadratik Terhadap Produksi Susu Kambing Peranakan Etawah (PE) Selaa 90 hari Pertama Laktasi. Jurnal Informatika Pertanian.
Vol 13: 735-743.