REGRESI PADA DATA SIRKULAR
SKRIPSI
Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Sarjana Sains Bidang Matematika
DISUSUN OLEH :
DIDIN SUMARLIN
0807616
JURUSAN PENDIDIKAN MATEMATIKA
FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Didin Sumarlin, 2013
Regresi Pada Data Sirkular ii
REGRESI PADA DATA SIRKULAR
SKRIPSI
Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Sarjana Sains dalam bidang Matematika
Oleh :
DIDIN SUMARLIN
0807616
PROGRAM STUDI MATEMATIKA
FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PENDIDIKAN INDONESIA
LEMBAR PENGESAHAN
DIDIN SUMARLIN
0807616
REGRESI PADA DATA SIRKULAR
Disetujui dan Disahkan oleh Pembimbing :
Pembimbing I
Drs. Nar Herrhyanto, M.Pd.
NIP. 196106181987031001
Pembimbing II
Drs. Maman Suherman, M.Si.
NIP. 195202121974121001
Mengetahui
Ketua Jurusan Pendidikan Matematika
Drs. Turmudi, M.Ed., M.Sc., Ph.D.
Didin Sumarlin, 2013
Regresi Pada Data Sirkular iv
PERNYATAAN KEASLIAN
Dengan ini saya menyatakan bahwa skripsi yang berjudul “REGRESI PADA
DATA SIRKULAR” ini dan seluruh isinya adalah benar-benar karya saya sendiri, dan saya tidak melakukan penjiplakan atau pengutipan dengan cara-cara yang tidak sesuai dengan etika ilmu yang berlaku dalam masyarakat keilmuan. Atas pernyataan tersebut, saya siap menanggung risiko yang dijatuhkan kepada saya apabila dikemudian hari ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya ini, atau ada klaim dari pihak lain terhadap karya saya.
Bandung, Oktober 2013 Yang membuat pernyataan,
ABSTRAK
Beragam model regresi dikembangkan, namun model-model yang ada masih sering bertumpu pada data linear baik jenis data pada variabel bebasnya maupun variabel terikatnya. Di lapangan banyak ditemukan juga data berupa data sirkular, misalnya sudut, arah, waktu dan sebagainya. Paradigma pembagian data didasarkan atas pembagian data linear dan sirkular membawa konsekuensi perlunya metode khusus dalam pengolahan data sirkular, khususnya dalam masalah regresi. Pada penelitian ini dibahas mengenai model regresi sirkular lebih lengkapnya regresi sirkular sirkular, dimana baik variabel bebasnya maupun variabel terikatnya berupa data sirkular.
Pada model regresi ini, metode yang digunakan untuk menaksir koefisien adalah metode kuadrat terkecil. Sedangkan penentuan nilai polinomial dilakukan dengan menguji apakah penambahan derajat berpengaruh signifikan atau tidak.
Penerapan model regresi ini dilakukan terhadap variabel waktu dan arah angin di Lat=-33.06271, Lon=-66.39777 dan zona waktu= +2.5. Variabel waktu berperan sebagai variabel bebas, sedangkan variabel arah angin berperan sebagai variabel terikat. Hasil penelitian menunjukkan regresi signifikan hanya pada orde 1. Sedangkan korelasi antara variabel tersebut tidak signifikan.
Didin Sumarlin, 2013
Regresi Pada Data Sirkular
vi
ABSTRACT
Various regression models were developed, but existing models are still often based on linear data both types of data on the independent variables and the dependent variable. In the field, data is found also in circular form, such as angle, direction, time and so on. The paradigm of data division based on the linear and circular data consequences need for specialized methods of processing the data in a circular, particularly in regression problems. In this study discussed the circular regression model in the full name is circular-circular regression, where both the independent variables and the dependent variable is circular.
In this regression model, the method used to estimate the coefficients are the least squares method. Whereas the determination of the value of m polynomials is done by testing whether the addition of degree m +1 significant effect or not. The application of the regression model was applied on the variables of time and wind direction at the Lat = -33.06271, Lon = -66.39777 and time zone = +2.5. Time variable as the independent variable, whereas variable of wind direction as the dependent variable. The results showed significant regression only on the order of 1. Whereas the correlation between these variables was not significant .
DAFTAR ISI
Halaman
LEMBAR PENGESAHAN ... iii
PERNYATAAN KEASLIAN ... iv
ABSTRAK ... v
ABSTRACT ... vi
KATA PENGANTAR ... vii
UCAPAN TERIMA KASIH ... viii
DAFTAR ISI ... x
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiii
DAFTAR LAMPIRAN ... xiv
BAB I PENDAHULUAN ... 1
1.1. Latar Belakang Masalah ... 1
1.2. Rumusan Masalah ... 2
1.3. Tujuan Penulisan ... 2
1.4. Batasan Masalah ... 3
1.5. Manfaat Penelitian ... 3
1.6. Sistematika Penulisan ... 3
BAB II LANDASAN TEORI ... 5
2.1. Data Sirkular dan Representasinya ... 5
2.1.1 Pengertian Data Sirkular ... 5
2.2.2. Representasi Data Sirkular ... 5
2.2. Statistika Deskriptif ... 7
2.2.1 Penggambaran Data ... 7
2.2.2 Arah Rata-rata ... 8
2.2.3 Variansi dan Simpangan Baku Sirkular ... 10
2.3. Peluang Sirkular ... 10
Didin Sumarlin, 2013
BAB IV PENERAPAN REGRESI PADA DATA SIRKULAR ... 32
DAFTAR TABEL
Didin Sumarlin, 2013
Regresi Pada Data Sirkular xiii
DAFTAR GAMBAR
Halaman
Gambar 2.1 Data Sirkular dalam Koordinat Polar ... 6
Gambar 2.2 Data Sirkular dalam Koordinat Kartesius ... 7
Gambar 2.3 Data Sirkular dalam Bilangan Kompleks ... 7
Gambar 2.4 Plot Sirkular ... 8
Gambar 2.5 Diagram Ros ... 8
Gambar 2.6 Metode Kuadrat Terkecil ... 14
Gambar 4.1 Plot Waktu ... 34
Gambar 4.2 Plot Arah Angin ... 35
Gambar 4.3 Grafik Arah Angin dalam Koordinat Kartesius ... 36
Gambar 4.4 Plot Fitted Value ... 38
Gambar 4.5 Fitted Value dalam Koordinat Kartesius ... 39
Gambar 4.6 Data dan Fitted Value ... 39
DAFTAR LAMPIRAN
1
Analisis regresi merupakan salah satu analisis statistika yang berhubungan dengan pengolahan data dua variabel atau lebih yang dinyatakan dengan sebuah persamaan matematik. Analisis ini sering dipakai dalam bidang geografi, ekonomi, pertanian, manajemen dan bidang-bidang lainnya. Analisis ini sering digunakan untuk meramalkan atau memperkirakan nilai dari satu variabel dalam hubungannya dengan variabel lain setelah diketahui persamaan regresinya.
Analisis regresi merupakan suatu metode untuk melihat hubungan antara variabel acak (random) dimana variabel yang satu bertindak sebagai variabel bebas (independent variable) dan variabel lainnya bertindak sebagai variabel terikat (dependent variable). Hubungan ini sering juga dikatakan sebagai ketergantungan suatu variabel terikat terhadap satu atau lebih variabel bebas.
Ketergantungan dalam analisis regresi merupakan ketergantungan statistik (statistical dependent), bukan ketergantungan fungsional secara deterministik, seperti halnya dalam ilmu alam (fisika). Hubungan antarvariabel secara statistik berkenaan dengan variabel acak atau variabel stokastik (random or stochastic
variables) yang mempunyai peluang dan memperhitungkan adanya berbagai
kesalahan (error). Sedangkan hubungan fungsional yang deterministik sifatnya tidak memperhitungkan adanya kesalahan, ”seolah-olah” hubungan itu pasti. Misalnya beberapa rumus dalam fisika (Rohmana, 2010).
2
Bentuk-bentuk model regresi yang sering ditemukan adalah regresi linear baik sederhana maupun berganda dan regresi nonlinear, diantaranya adalah regresi kuadratik, logistik, s curve dan sebagainya.. Selain model-model tersebut masih banyak model-model lain yang dikembangkan baik berupa model turunan maupun model yang lebih baru.
Bentuk model-model regresi di atas masih bertumpu pada data linear, jika dipandang dari paradigma pembagian data berdasarkan atas data linear dan data sirkular. Beberapa data di lapangan banyak ditemukan juga data berupa data sirkular. Data sirkular merupakan data hasil pengukuran yang nilai-nilainya berulang secara periodik. Beberapa contoh data sirkular seperti jam, hari, tanggal, bulan, arah mata angin, letak geografis dan lain-lain.
Data yang akan diolah baik berupa data linear ataupun sirkular akan menjadi suatu variabel dalam proses pengolahannya. Menurut Abuzaid dkk. (2011), variabel linear dan sirkular mempunyai ruang topologi yang berbeda sehingga memerlukan analisis yang berbeda pula. Dari sini muncul pertanyaan
“Bagaimanakah pengolahan regresi pada data sirkular?”. Oleh karena itu, pada pembahasan karya ilmiah ini akan dikaji mengenai konsep regresi pada data sirkular. Selain itu, akan dibahas pula mengenai penerapannya dalam kehidupan sehari-hari.
1.2 Rumusan Masalah
Berdasarkan latar belakang masalah yang telah dipaparkan, dapat dirumuskan masalah sebagai berikut.
1. Bagaimana kajian regresi pada data sirkular?
2. Bagaimana pengolahan penerapan regresi sirkular berupa variabel waktu dan arah angin di Lat=-33.06271, Lon=-66.39777?
1.3 Tujuan Penulisan
3
Didin Sumarlin, 2013
Regresi Pada Data Sirkular
2. Mengetahui pengolahan penerapan konsep regresi pada data sirkular berupa variabel waktu dan arah angin.
1.4 Batasan Masalah
Permasalahan di atas akan dibatasi pada pencarian model regresi pada data sirkular khususnya regresi dimana baik variabel bebas maupun variabel terikatnya berupa data sirkular. Konsep korelasi meskipun berhubungan dengan regresi tidak menjadi pembahasan utama.
1.5 Manfaat
Manfaat dari penulisan karya ilmiah ini dibagi ke dalam dua bagian, yaitu: 1. Secara teoritis, sebagai wahana untuk mengembangkan pengetahuan
khususnya masalah regresi dimana pada kasus ini datanya berupa data sirkular sehingga regresinya berbentuk regresi sirkular.
2. Secara praktis, memberikan gambaran pada pembaca bagaimana mengolah suatu data sirkular, khususnya pada konsep regresi.
1.6 Sistematika Penulisan
Adapun sistematika penulisan pada karya ilmiah ini adalah sebagai berikut. BAB I PENDAHULUAN
Pada bab ini akan dibahas mengenai latar belakang masalah, rumusan masalah, tujuan penulisan, batasan masalah, manfaat, dn sistematika penulisan
BAB II LANDASAN TEORI
Pada bab ini akan dibahas mengenai teori-teori yang mendukung pembahasan berupa konsep matematika, konsep statistika dan statistika arah dan juga aplikasi R beserta paket sirkularnya.
BAB III REGRESI PADA DATA SIRKULAR
4
BAB IV PENERAPAN REGRESI PADA DATA SIRKULAR
Pada bab ini membahas contoh aplikasi dari regresi pada data sirkular dengan bantuan aplikasi R.
BAB V KESIMPULAN DAN SARAN
Pada bab ini memaparkan kesimpulan dari keseluruhan hasil pembahasan disertai ditutup dengan beberapa saran khususnya untuk pengembangan. DAFTAR PUSTAKA
23 (independent variable) dan variabel terikat (dependent variable). Jenis data pada variabel-variabel tersebut bisa berupa data linear atau data sirkular. Melihat jenis data yang diolah dalam variabel suatu regresi, maka pembahasan regresi akan meliputi 4 pokok bahasan, yaitu :
1. Regresi linear linear (linear linear regression)
Regresi ini membahas dimana baik variabel bebas maupun variabel terikatnya berupa data linear.
2. Regresi sirkular sirkular (circular circular regression)
Pada regresi ini membahas dimana baik variabel bebas maupun variabel terikatnya berupa data sirkular.
3. Regresi linear sirkular (circular linear regression)
Regresi ini membahas dimana variabel terikatnya berupa data linear sedangkan variabel bebasnya berupa data sirkular.
4. Regresi sirkular linear (linear circular regression)
Regresi ini membahas dimana variabel bebasnya berupa data linear sedangkan variabel terikatnya berupa data sirkular.
Pada pembahasan di sini akan dibahas salah satu dari regresi di atas, yaitu regresi sirkular sirkular dimana baik variabel bebas maupun variabel terikatnya berupa data sirkular. Selanjutnya penamaan regresi sirkular sirkular akan disingkat menjadi regresi sirkular saja.
3.1 Model Regresi Sirkular
24 Selain model-model di atas, masih banyak model-model lain yang diusulkan diantaranya ada yang membawa model regresi sirkular ke suatu persamaan lingkaran. Dalam pembahasan ini, model yang akan digunakan adalah model yang diusulkan oleh Sarma dan Jammalamadaka (1993) dalam jurnalnya yang berjudul
Circular Regression. Sarma dan Jammalamadaka (1993) membawa modelnya
kedalam ekspektasi bersyarat vektor jika diberikan , yaitu ( | ). Penjabaran model dari Sarma dan Jammalamadaka dijelaskan sebagai berikut. Misalkan mempunyai fungsi kepadatan peluang gabungan . Untuk memprediksi jika diberikan , dengan memperhatikan regresi atau ekspektasi bersyarat dari vektor diberikan , yaitu :
( | )
merepresentasikan arah rata-rata bersyarat diberikan dan konsentrasi bersyarat yang mengarah ke arah rata-rata. Persamaan di atas ekuivalen dengan
| | dimana ditentukan oleh
25
Persamaan di atas dapat ditulis dalam bentuk model linear umum yang dinyatakan sebagai berikut.
Dari model yang sudah didapatkan akan ditaksir koefisien-koefisien dari model regresi, yaitu
Misalnya menyatakan sampel acak berukuran . Persamaan untuk data observasi dapat dinyatakan sebagai
26
Jika dinyatakan dalam vektor tunggal, maka diperoleh
Dengan menggunakan metode kuadrat terkecil dan dengan asumsi mempunyai rank penuh , maka akan diperoleh
27
Didin Sumarlin, 2013
Regresi Pada Data Sirkular
3.2.2 Galat Baku (Standard Error)
Dalam suatu analisis regresi, galat baku mencerminkan standar deviasi yang mengukur variasi titik-titik di atas dan di bawah garis populasi. Nilai galat baku ini dibutuhkan terutama untuk keperluan inferesia. Sekarang akan ditaksir matriks kovarian yang nilai-nilainya berisi nilai galat baku. Matriks kovarian dapat
Akan dibuktikan entri dari sebagai berikut.
Masalah dalam pencocokan regresi polinomial adalah menentukan derajat suatu polinomial. Salah satu gagasan mendasar yang diberikan oleh Sarma dan Jammalamadaka (1993) untuk menentukan adalah dengan menambahkan kolom ke polinomial, kemudian dievaluasi hasilnya apakah meningkatkan jumlah kuadrat galat atau tidak. Berikut penjabarannya.
28
Kemudian vektor kolom diatas dan matriks dibentuk menjadi matriks augment sebagai berikut
[
]
merupakan matrik permutasi yang cocok untuk menyimpan dua kolom dari kedalam kolom ke dan . Modelnya sekarang menjadi
29
Kemudian tulis ruas kiri pertidaksamaan di atas sebagai sehingga menjadi
Untuk memutuskan apakah perlu menambahkan suku ke harus dihitung terlebih dahulu persamaan di atas. Jika menghasilkan nilai yang besar, maka akan diputuskan untuk memasukkan suku ke .
3.3.2 Uji Asimtot untuk menentukan
Penentuan dapat ditentukan berdasarkan . Rumus ini akan menentukan apakah suku ke perlu dimasukkan kedalam model atau tidak. Namun, untuk ukuran sampelnya cukup besar, diperlukan suatu rumusan yang lebih efisien, dalam hal ini dapat menggunakan uji asimtot.
Proposisi Pembuktian akan menggunakan bantuan teorema Lindeberg Feller tanpa bukti.
Teorema Lindeberg Feller
30
Perhatikan untuk kasus hanya satu regressor, untuk penyederhanan. Maka √ ∑ merupakan suatu skalar. Misalkan merupakan fungsi kepadatan peluang dari dan misalkan
∑ terbatas dan merupakan skalar tak nol. Selanjutnya akan ditunjukkan bahwa
31 yang cukup besar dapat didekati dengan distribusi berikut.
̂ ̂
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
1. Bentuk model regresi pada data sirkular dapat dimodelkan sebagai berikut.
∑
∑
Untuk nilai dapat dapat diperoleh dengan ̂
Koefisien-koefisien regresi di atas dapat ditaksir menggunakan kuadrat terkecil sehingga diperoleh koefisien regresi berikut.
̂
̂
Penentuan dapat dilakukan dengan pengujian asimtot yang menentukan apakah derajat dimasukkan kedalam model atau tidak.
2. Hasil pengolahan terhadap variabel waktu dan arah angin menunjukkan bahwa model regresinya signifikan hanya pada orde 1, dengan model sebagai berikut.
Nilai arah angin dapat diperoleh dari :
42
Didin Sumarlin, 2013
Regresi Pada Data Sirkular
Sementara itu, nilai korelasi pada kedua variabel tersebut tidak signifikan. Jika yang dicari adalah pencarian model matematik, maka model regresi tersebut masih bisa digunakan tanpa memandang nilai korelasi.
5.2 Saran
Skripsi ini membahas mengenai regresi sirkular, untuk pengembangan lebih lanjut dapat dipertimbangkan saran-saran berikut.
1. Regresi sirkular pada skripsi ini bisa dikembangkan lebih lanjut diantaranya dengan membuat ekspektasi bersyarat ( | ) mengikuti distribusi tertentu, misalnya distribusi von Mises.
DAFTAR PUSTAKA
Abuzaid, Ali et al. 2011. COVRATIO Statistic for Simple Circular Regression
Model. Chiang Mai J.Sci, 38(3),321-330.
Anton, H. 1998. Aljabar Linear Elementer. Jakarta : Erlangga.
Choudhary, P. 2009. A Practical Approach to Linear Algebra. Jaipur : Oxford. Everitt, B.S dan Hothorn, T. 2006. A Handbook of Statistical Analyses Using R.
Boca Raton : Chapman & Hall/CRC.
Everitt, B. S. dan Skrondal, A. 2010 .The Cambridge Dictionary Of Statistics. New York : Cambridge University.
Eves, H. 1966. Elementary Matrix Theory. Boston : Allyn and Bacon.
Herrhyanto, N. dan Gantini, T. 2009. Pengantar Statistika Matematis. Bandung : Yrama Widya.
Jammalamadaka, S. R. dan SenGupta, A. 2001. Topic In Circular Statistics. Singapore: World Scientific Publishing Co. Pte. Ltd.
Jammalamadaka, S. R. dan Lund, U. J. 2006. The Effect of Wind Direction on
Ozone Levels: a Case Study. Eviron Ecol Stat, 13, 287-298.
Kato, et. al. 2008. A Circular Cilcular Regression Model. Statistica Sinica, 18, 633-645.
Lund, U. dan Agostinelli, C. 2013. Package ‘Circular’. URL http://CRAN.R-project.org , Paket R Versi 0.4-3.
Lűtkepohl, H. 1996. Handbook Of Matrices. Chichester : John Wiley and Sons. Machmudi, S. H dan Suryadi H. S., D. 1998. Teori dan Soal Pendahuluan
Aljabar Linear. Jakarta : Ghalia Indonesia.
Mardia, K. V. dan Jupp, P. E. 1999. Directional Statistics. John Wiley & Sons. Rambli et. al. 2010. Identification of Influential Observations in Circular
Regression Model. Proceedings of the Regional Conference on
Statistical Sciences. 195-203.
44
Didin Sumarlin, 2013
Regresi Pada Data Sirkular
Ruminta. 2009. Matriks Persamaan Linier dan Pemrogaman Linier. Bandung: Rekayasa Sains.
Salusu, A. 2003. Teori dan Penyelesaian Kalkulus Lanjutan. Yogyakarta : Graha Ilmu.
Santoso, S. 2003. Statistik Deskriptif Konsep dan Aplikasi dengan Microsoft Excel
dan SPSS. Yogyakarta : Andi Yogyakarta.
Sarma, Y. R. dan Jammalamadaka, S. R. 1993. Circular Regression. Statistical Sciences and Data Analysis, 109-128.
Seber, G. A. F. dan Lee, A. J. 2003. Linear Regression Analysis. New Jersey : John Wiley & Sons.