PENDUGAAN KECEPATAN ARUS SUNGAI DENGAN
MENGGUNAKAN REGRESI PIECEWISE
(Studi Kasus Sungai Soos Creek di Negara Bagian Washington)
KHOIRUN IBNU FARID
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
KHOIRUN IBNU FARID. Pendugaan Kecepatan Arus Sungai dengan Menggunakan Regresi
Piecewise (Studi Kasus Sungai Soos Creek di Negara Bagian Washington). Di bimbing olehI MADE
SUMERTAJAYA dan DIAN KUSUMANINGRUM.
Pada aliran sungai Soos Creek yang berada di Negara bagian Washington, kecepatan arus aliran sungai meningkat pesat dengan meningkatnya debit, tetapi peningkatan kecepatan arus air mengalami penurunan ketika mendekati nilai tertentu. Hal tersebut mengindikasikan bahwa kecepatan aliran air dan debit air sungai Soos Creek memiliki hubungan yang non-linear. Regresi piecewise dapat diterapkan untuk menduga kecepatan aliran sungai Soos Creek. Regresi piecewise adalah salah satu model regresi yang dapat digunakan pada kondisi model linear berganda (multiple linear model) untuk memperoleh model pada rentang x yang berbeda. Titik perubahan trend kecepatan arus aliran sungai disebut titik patahan. Banyaknya titik patahan dapat ditentukan dari plot yang dibuat dengan menggunakan pemulusan nonparametrik LOESS fit.
Model regresi piecewise dibangun dengan menggunakan prosedur PROC NLIN yang
memerlukan parameter awal. Parameter awal regresi piecewise ditentukan dengan melakukan regresi
linear sederhana secara terpisah terhadap masing-masing segmen dengan setiap garis regresi dibuat sesuai dengan data yang memungkinkan untuk meminimumkan kuadrat tengah galat (KTG). Model regresi piecewise terbaik adalah
̂ = 0.680 + 0.018xi ; xi≤ 123.6
̂ = 2.607 + 0.002xi ; xi > 123.6
dengan nilai titik patahan yang dihasilkan terletak pada titik 123.6 cfs. Hasil analisis regresi piecewise ini menunjukkan bahwa kecepatan arus aliran sungai meningkat pesat dengan meningkatnya debit air sampai pada titik 123.6 cfs. Selanjutnya pada saat nilai debit air melebihi 123.6 cfs perubahan kecepatan arus aliran sungai mengalami penurunan. Model regresi piecewise mampu menjelaskan keragaman data yang lebih besar dari keragaman yang bisa dijelaskan oleh model regresi linear sederhana karena memberikan nilai koefisien determinasi yang lebih besar.
MENGGUNAKAN REGRESI
PIECEWISE
(Studi Kasus Sungai
Soos Creek
di Negara Bagian Washington)
KHOIRUN IBNU FARID
Skripsi
Sebagai salah satu syarat untuk memperoleh
gelar Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
NIM : G1406240
Menyetujui :
Pembimbing I,
Dr. Ir. I Made Sumertajaya, M.Si 19680702 199402 1 001
Pembimbing II,
Dian Kusumaningrum, S.Si, M.Si
Mengetahui : Ketua Departemen Statistika
Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, MS NIP. 19650421 199002 1 001
Puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala nikmat dan kemudahan yang diberikan kepada penulis sehingga penulis dapat menyelesaikan karya ilmiah ini. Sholawat serta salam semoga tercurah kepada junjungan kita Nabi Muhammad SAW, kepada keluarganya, sahabatnya, dan pengikutnya yang setia sampai akhir zaman.
Dengan telah selesainya penelitian hingga tersusunnya skripsi ini, penulis ingin menyampaikan penghargaan dan terima kasih yang sebesar-besarnya kepada Bapak Dr. Ir. I Made Sumertajaya, M.Si dan Ibu Dian Kusumaningrum, S.Si, M.Si. sebagai dosen pembimbing I dan pembimbing II yang telah memberikan bimbingan dan arahan sehingga skripsi ini dapat selesai dengan baik. Selain itu penulis juga menyampaikan penghargaan dan terima kasih yang sebesar-besarnya kepada seluruh dosen Departemen Statistika IPB atas ilmu dan nasihat yang bermanfaat bagi penulis. Seluruh staf Departemen Statistika IPB yang telah membantu penulis selama belajar di Departemen Statistika IPB. Kementerian Agama RI yang telah membiayai penulis selama studi. Kedua orang tua serta seluruh keluarga atas doa dan kasih sayang yang selama ini diberikan kepada penulis. Serta semua pihak yang telah membantu penulis selama proses penyusunan karya ilmiah ini, yang tidak dapat penulis tuliskan satu persatu.
Penulis menyadari bahwa masih banyak kekurangan dalam karya ilmiah ini. Oleh karena itu, penulis sangat mengharapkan saran dan kritik yang membangun demi kesempurnaan karya ilmiah ini. Akhirnya penulis berharap semoga tulisan ini bermanfaat.
Bogor, Agustus 2011
Penulis dilahirkan di Kulon Progo pada tanggal 23 Agustus 1988 dari pasangan Fauzan dan Waridah sebagai anak kedua dari tiga bersaudara. Penulis memulai pendidikan formalnya di SD Muhammadiyah Kedunggong dan lulus pada tahun 2000. Penulis melanjutkan pendidikan di MTs Islam Ngruki dan lulus pada tahun 2003. Pada tahun 2006 penulis menyelesaikan pendidikan menengah atas di Madrasah Aliyah Al Mukmin Sukoharjo. Tahun yang sama pula penulis diterima sebagai mahasiswa Institut Pertanian Bogor melalui program PBSB (Program Beasiswa Santri Berprestasi) yang diselenggarakan oleh Kementerian Agama Republik Indonesia. Penulis memilih Departemen Statistika, Falkultas Matematika dan Ilmu Pengetahuan Alam pada pemilihan mayor tahun 2007.
DAFTAR ISI
Halaman
DAFTAR GAMBAR ... vii
DAFTAR TABEL ... vii
DAFTAR LAMPIRAN ... vii
PENDAHULUAN Latar Belakang ... 1
Tujuan ... 1
TINJAUAN PUSTAKA
Regresi Linear Sederhana ... 1Regresi Piecewise ... 1
Regresi Piecewise dengan Dua Segmen ... 2
Regresi Piecewise dengan Tiga Segmen ... 2
Locally Weighted Scatterplot Smoothing ... 2
Metode Kuadrat Terkecil ... 3
BAHAN DAN METODE
Bahan ... 4Metode ... 4
HASIL DAN PEMBAHASAN
Eksplorasi Data ... 5Menduga Parameter pada Regresi Piecewise ... 5
Pemeriksaan Asumsi Model ... 7
Pengaruh Pencilan ... 8
Perbandingan Model Hasil Regresi Piecewise dengan Regresi Linear Sederhana ... 10
SIMPULAN DAN SARAN Simpulan ... 10
Saran ... 10
DAFTAR PUSTAKA ... 10
DAFTAR GAMBAR
Halaman
1 Fungsi pembobot tricube ... 2
2 Plot ideal apabila tidak terdapat masalah kehomogenan ragam ... 3
3 Plot apabila terdapat masalah ketidakhomogenan ragam ... 3
4 Plot apabila sisaan tidak saling bebas ... 4
5 Plot antara kecepatan air dan debit air sungai Soos Creek ... 5
6 Plot garis dengan menggunakan pemulusan nonparametrik LOESS fit... 6
7 Plot garis regresi linear sederhana ... 6
8 Plot garis regresi piecewise ... 6
9 Plot peluang kenormalan sisaan model regresi sederhana ... 7
10 Plot sisaan dengan dugaan peubah respon model regresi sederhana ... 7
11 Plot sisaan dengan dengan urutan sisaan model regresi sederhana ... 7
12 Plot garis regresi linear sederhana ketiga titik amatan terjauh dihilangkan ... 8
13 Plot garis regresi piecewise ketika ketiga titik amatan terjauh dihilangkan ... 9
DAFTAR TABEL
Halaman 1 Nilai awal estimasi regresi piecewise ... 6
2 Nilai kuadrat tengah galat dan koefisien determinasi ... 10
3 Nilai kuadrat tengah galat dan koefisien determinasi ketika tiga titik amatan terjauh dihilangkan ... 10
DAFTAR LAMPIRAN
Halaman 1 Diagram alur tahapan metode penelitian ... 13
2 Hasil keluaran PROC NLIN ... 14
3 Plot peluang kenormalan sisaan model regresi piecewise ... 15
4 Plot sisaan dengan dugaan peubah respon model regresi piecewise ... 15
5 Plot sisaan dengan urutan sisaan model regresi piecewise ... 15
6 Deteksi pencilan dan amatan berpengaruh ... 16
7 Plot pemeriksaan asumsi model regresi sederhana tanpa tiga amatan ... 18
8 Plot peluang kenormalan sisaan model regresi piecewise tanpa tiga amatan ... 19
9 Plot sisaan dengan dugaan peubah respon model regresi piecewise tanpa tiga amatan ... 19
PENDAHULUAN
Latar Belakang
Kecepatan arus sungai merupakan salah satu parameter hidrologi yang memegang peranan penting dalam penelitian suatu ekosistem badan perairan. Kecepatan arus dapat digunakan untuk memperkirakan kapan bahan pencemar akan mencapai lokasi tertentu, apabila bagian hulu mengalami pencemaran (Effendi 2003). Kecepatan arus juga dapat digunakan untuk memperkirakan kapan aliran air mencapai lokasi tertentu ketika terjadi peningkatan debit air di hulu sungai. Kecepatan aliran sungai dapat diduga melalui debit air sungai.
Pada aliran sungai Soos Creek yang berada di Negara bagian Washington, kecepatan arus
aliran sungai meningkat pesat dengan
meningkatnya debit, tetapi peningkatan
kecepatan arus air mengalami penurunan ketika mendekati nilai tertentu. Hal tersebut mengindikasikan bahwa kecepatan aliran air dan debit air sungai Soos Creek memiliki hubungan yang non-linear.
Ketika meneliti suatu hubungan antara peubah respon (Y) dan peubah bebas (X), mungkin saja terjadi hubungan nonlinear.
Model regresi sederhana tidak dapat
mengambarkan data yang memiliki hubungan non-linear karena model regresi linear sederhana mengabaikan perubahan trend. Salah satu model regresi yang dapat digunakan untuk mengatasi ketidaklinearan hubungan antara peubah respon dan peubah bebas adalah regresi piecewise. Regresi piecewise adalah salah satu bentuk regresi yang dapat digunakan pada kondisi model linear berganda (multiple linear model)untuk memperoleh model yang sesuai dengan data untuk rentang x yang berbeda (Jun Yang Xi
2009). Regresi piecewise merupakan
gabungan dua atau lebih segmen garis (kurva) regresi dimana segmen garis yang berdekatan mempunyai koefisien regresi yang berbeda.
Sifat tersegmen/terbagi inilah yang
memberikan fleksibelitas yang lebih baik daripada model regresi linear sederhana. Sifat
ini memungkinkan model regresi piecewise
menyesuaikan diri secara efektif terhadap pola dari data.
Titik pemisah yang menghubungkan antar
model linear disebut titik patahan
(breakpoint). Titik patahan ini mungkin saja diketahui sebelum dilakukan analisis, tetapi biasanya titik patahan ini tidak diketahui dan harus diduga (Ryan & Port 2002). Dalam kasus ini titik patahan merupakan titik dimana
terjadi penurunan pada nilai perubahan kecepatan arus aliran air.
Tujuan
Tujuan dari penelitian ini adalah
menerapkan analisis regresi piecewise dan membandingkan hasil yang diperoleh dengan hasil analisis regresi linear sederhana pada data kecepatan aliran sungai dan debit air sungai Soos Creek.
TINJAUAN PUSTAKA
Regresi Linear Sederhana
Analisis regresi merupakan alat statistika yang dapat digunakan untuk menyelidiki hubungan antara sebuah peubah respon (Y) dengan satu atau lebih peubah bebas (X). Dimana peubah bebas mempengaruhi peubah respon. Struktur model regresi yang paling sederhana adalah regresi linear sederhana. Disini istilah sederhana menyiratkan sebuah peubah respon dihubungkan dengan sebuah peubah bebas saja. Model regresi linear sederhana dapat dinyatakan sebagai berikut :
dengan dan adalah parameter regresi,
adalah galat/sisaan, Y adalah peubah respon, dan x adalah peubah bebas (Myers 1989).
Koefisien determinasi (R2) merupakan proporsi keragaman atau variasi total disekitar nilai tengah ( ̅) yang dapat dijelaskan oleh model regresi. Secara grafis mengukur jauh-dekatnya titik pengamatan terhadap garis regresi. Rentang nilai koefisien determinasi adalah antara 0 (tidak ada keragaman y yang
dapat dijelaskan oleh x) sampai 1 (100% keragaman y dapat dijelaskan oleh
keragaman x). Koefisien determinasi dapat diperoleh melalui :
∑∑ ̂ ̅
Regresi Piecewise
Regresi piecewise adalah suatu metode regresi dimana peubah bebas disekat kedalam interval dan suatu ruas garis terpisah yang cocok untuk masing-masing interval. Regresi piecewise bermanfaat untuk digunakan ketika
peubah bebas dikelompokkan kedalam
kelompok-kelompok yang berbeda
melalui regresi linear. Menurut Laird dan Davidian dalam (Li Xing 2005) persamaan regresi piecewise dapat dinyatakan sebagai berikut :
0 jika x ≤ ck dimana =
jika x ≥ ck dengan k =1,2,…,K-1
β1 adalah parameter yang
merepresentasikan kemiringan garis pada
segmen pertama, dan ∑
merepresentasikan kemiringan garis untuk
segmen ke-K .
Metode kuadrat terkecil diterapkan
terpisah terhadap masing-masing segmen dengan setiap garis regresi dibuat sesuai dengan data yang memungkinkan untuk meminimumkan kuadrat tengah galat (KTG). Selain jumlah kuadrat nilai titik patahan yang optimum juga dapat dilihat dari koefisien
determinasi yang maksimum di setiap
segmen.
Regresi Piecewise dengan Dua Segmen
Persamaan regresi piecewise untuk satu titik patahan merupakan persamaan regresi piecewise yang paling sederhana. Persamaan ini hanya menduga dua persamaan untuk dua selang yang berbeda. Persamaan regresi piecewise dapat dinyatakan sebagai berikut:
̂ = b01+ b11xi ; xi≤ c ̂ = b02+ b12xi ; xi > c
dimana xi adalah peubah bebas, ̂ adalah
peubah respon, b0K dan b1K (K=1,2) adalah
intercep dan koefisien kemiringan garis
regresi untuk segmen ke-K, dan c adalah nilai titik patahan.
Untuk fungsi regresi yang kontinu pada titik patahan, dua persamaan dari ̂ harus sama pada titik patahan (ketika xi= c) :
b01+ b11xi= b02+ b12xi
Persamaan diatas dapat juga ditulis sebagai : b02 = b01 + c(b11 - b12)
Kemudian dengan mengganti b02 dengan
persamaan diatas diperoleh persamaan regresi piecewise yang kontinu pada xi= c (Ryan &
Port 2002) :
̂ = b01+ b11xi ; xi≤ c
̂ ={ b01 + c(b11 - b12)} + b12xi ; xi > c
Regresi Piecewise dengan Tiga Segmen
Regresi piecewise dengan tiga segmen adalah pengembangan dari regresi piecewise dua segmen dengan penambahan titik patahan,
persamaan regresi, dan parameter. Persamaan regresi piecewise dengan kombinasi dua titik patahan dan tiga segmen linear dapat dinyatakan sebagai berikut :
̂ = b01 + b11xi ; xi≤ c1 ̂ = b02 + b12xi ; c1 < xi≤c2 ̂ = b02 + b13xi ; xi > c
Untuk fungsi regresi yang kontinu pada titik patahan persamaannya dapat dinyatakan sebagai berikut (Ryan & Port 2002):
̂ = b01+ b11xi ; xi≤ c1 ̂ = {b01 + c1(b11 - b12)}
+ b12xi ; c1 < xi≤ c2 ̂ = {b01+c1(b11 –b12)
+ c2(b12–b13)} + b13 xi ; xi > c2
Locally Weighted Scatterplot Smoothing
Locally Weighted Scatterplot Smoothing
(LOESS) yang akan digunakan pada
identifikasi awal penentuan parameter
piecewise merupakan pendekatan untuk
menaksir kurva dengan prosedur pemulusan. Fungsi pembobot pada LOESS adalah
fungsi pembobot W didefinisikan sebagai
berikut :
i. W(x) > 0 untuk |x| < 1 ii. W(-x) = W(x)
iii. W(x)adalah fungsi tidak naik untuk x > 0
iv. W(x)= 0 untuk |x| > 1
dengan W adalah pembobot
tricube:
; |x| < 1
0 ; |x |≥ 1
Fungsi pembobot W dapat diilustrasikan dengan Gambar 1.
Gambar 1 Fungsi pembobot tricube
Nilai awal f dapat ditentukan diantara 0
hingga 1. Untuk setiap i, menghitung
h
isebagai jarak dari xi ke r terdekat disekitar
x
i. Oleh karena itu,hi adalah bilangan
rdiantara | xi
x
j| terkecil dimanai
j
1,
2,...
n
. Untukk
1, 2,...,
n
, pembobotw
k(
x
i)
dapat ditentukan dengan persamaan :Prosedur pemulusan telah dibuat untuk memperhalus data dengan persamaan :
̂ = g(xi) + i
dengan g adalah fungsi penghalus dan i
merupakan peubah acak dengan rata-rata nol
dan varian 2
(Cleveland dan Devlin 1988). Sedangkan ̂ adalah taksiran dari g(xi). Pada
proses pemulusan kurva, titik disekitar (xi,yi)
dapat digunakan dalam pembentukan ̂.
Untuk fungsi pembobot W(x) nilainya
menurun setiap bertambahnya nilai x (positif naik) dan nilai pembobot wk(xi) menurun
seperti meningkatnya jarak xk dari xi . Titik
yang dekat dengan xiberpengaruh besar dalam
pembentukan ̂ dan sebaliknya.
Metode Kuadrat Terkecil
Salah satu metode penduga parameter dalam model regresi adalah metode kuadrat terkecil (MKT). Prinsip dasar dari MKT adalah meminimalkan jumlah kuadrat galat. Galat adalah selisih antara data sebenarnya dengan data dugaan. Jumlah kuadrat sisaan dapat dinyatakan sebagai berikut (Myers 1989):
∑ ̂
dengan
data aktual pada pengamatan ke-i ̂ data hasil pendugaan pada pengamatan ke-i
Metode ini memerlukan beberapa asumsi klasik yang harus dipenuhi oleh komponen (galat), yaitu memenuhi asumsi kenormalan, kehomogenan ragam, dan kebebasan sisaan (tidak memiliki autokorelasi).
Kehomogenan ragam sisaan
Asumsi kehomogenan ragam memiliki peran yang sangat penting dalam pendugaan parameter dengan metode kuadrat terkecil. Ketidakhomogenan ragam mengakibatkan beberapa pengamatan mengandung informasi yang lebih, pengamatan tersebut seharusnya
mendapatkan bobot yang lebih besar
dibandingkan pengamatan yang lain. Hal tersebut akan mengakibatkan presisi atau kecermatan dari metode kuadrat terkecil menjadi lebih kecil (Rawlings et al. 1998).
Kehomogenan ragam sisaan dapat
dideteksi secara eksplorasi dan uji formal. Secara eksplorasi dapat dilihat dari plot antara nilai sisaan dengan nilai dugaan. Jika plot antara sisaan tidak memiliki pola sebagaimana ditunjukkan pada Gambar 2 maka ragam sisaan homogen. Tetapi jika plot antara sisaan menunjukkan suatu pola seperti
terlihat pada Gambar 3 maka ragam sisaan tidak homogen.
ŷ
Gambar 2 Plot ideal apabila tidak terdapat masalah kehomogenan ragam
ŷ
Gambar 3 Plot apabila terdapat masalah ketidakhomogenan ragam Uji formal yang dapat digunakan untuk
mendeteksi kehomogenan ragam dapat
dilakukan dengan menggunakan uji White, yaitu dengan meregresikan residual kuadrat (ei2) dengan peubah bebas, peubah bebas
kuadrat dan perkalian peubah bebas. Misalnya dalam model dengan dua peubah bebas bisa dilakukan regresi berikut ini :
ei2 = 0 + 1x1+ 2x2+ 3x12+ 4x22 + 5x1 x2 + vi
Hipotesis yang di uji adalah
H0 : 0 = 1 = 2 … = k = 0 (ragam
sisaan homogen)
H1 : paling sedikit ada satu k dimana
k≠ 0 (ragam sisaan tidak homogen)
Statistik uji yang digunakan : nR2~ χ2 (k)
dengan : n : jumlah data
R2 : koefisien determinasi dari model regresi sisaan
k : banyaknya peubah penjelas
Sisaan homogen pada taraf nyata α jika nilai
nR2 < χ2 (k) pada tabel distribusi khi-kuadrat.
Kebebasan Sisaan
Sisaan saling bebas apabila antar sisaan tidak saling berkorelasi atau korelasinya hampir mendekati nol. Sisaan yang saling
berkorelasi mengakibatkan berkurangnya
Gambar 4 Plot apabila sisaan tidak saling bebas
Kebebasan sisaan dapat dideteksi secara ekplorasi dan uji formal. Secara eksplorasi dapat dilihat dari plot sisaan dengan urutan sisaan tersebut. Apabila sisaan saling bebas, maka plot tersebut tidak akan memiliki suatu pola. Sebaliknya jika sisaan tidak saling bebas maka plot tersebut akan memiliki suatu pola seperti terlihat pada Gambar 4.
Uji formal untuk mendeteksi kebebasan sisaan yaitu uji runtunan. Runtunan adalah suatu barisan bagian yang terdiri atas satu atau lebih lambang yang sama yang menyatakan sifat tertentu data tersebut. Uji runtunan membagi data menjadi dua penggolongan yang tidak saling berpotongan. Misalkan
bahwa n1 adalah banyaknya lambang yang
lebih sedikit, dan n2 adalah banyaknya
lambang yang lebih banyak, maka ukuran contoh n = n1 + n2. Hipotesis yang di uji
adalah
H0 : sisaan saling bebas H1 : sisaan tidak saling bebas
Statistik ujinya adalah u yaitu jumlah runtunan total.
Bila n1 dan n2 semakin besar, sebaran
penarikan contoh bagi u semakin
menghampiri sebaran normal dengan
µ dan 2
merupakan nilai tengah dan ragam bagi sebaran u yang diskret. Dengan demikian, bila n1 dan n2keduanya lebih besar
dari 10 statistik uji yang digunakan adalah
Nilai z merupakan suatu simpangan normal, n1 adalah jumlah amatan tipe satu, n2 jumlah amatan tipe lainnya. Sisaan saling bebas pada
taraf nyata α jika nilai-p pada tabel uji runtunan lebih besar dari taraf nyata α untuk statistik uji u, n1, dan n2 (Draper & Smith 1981)
Kenormalan sisaan
Asumsi bahwa sisaan menyebar normal tidak terlalu penting dalam pendugaan parameter regresi dan pemisahan total keragaman. Penduga dengan metode kuadrat terkecil tetap merupakan penduga tak bias
terbaik apabila asumsi lain terpenuhi.
Kenormalan hanya diperlukan pada waktu pengujian hipotesis dan penyusunan selang
kepercayaan bagi parameter (Rawlings,
Pantula dan Dickey 1998).
Kenormalan sisaan dapat dideteksi secara eksplorasi dan uji formal. Secara eksplorasi dapat dilihat dari plot peluang kenormalan sisaan. Plot peluang kenormalan sisaan yang tidak mengikuti garis lurus mengindikasikan ketidaknormalan data sisaan.
Uji formal untuk mendeteksi kenormalan
sisaan yaitu uji Kolmogorov-Smirnov.
Hipotesis yang di uji :
H0 : F(x) = F0(x) untuk semua nilai x
(sisaan menyebar normal) H1 : F(x) ≠ F0(x) untuk
sekurang-kurangnya sebuah nilai x (sisaan tidak menyebar normal)
Statistik uji yang digunakan : D = supx|S(x)– F0(x)|
dengan
S(x) : sebaran kumulatif contoh F0(x) : sebaran kumulatif normal.
Sisaan menyebar normal pada taraf nyata
α jika nilai D < D(1-α,n) pada tabel kritis uji Kolmogorov-Smirnov atau nilai-p lebih besar daripada taraf nyata.
BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini merupakan data sekuder yang dikumpulkan oleh United States Geological Survey untuk sungai Soos Creek yang berada di Negara bagian Washington. Data dapat diakses melalui http://www.seattlecentral.edu/qelp/set s/041/041.html. Data yang diperoleh berupa data kecepatan aliran sungai dan debit air
sungai Soos Creek. Peubah bebas dalam
penelitian ini adalah debit air dan kecepatan aliran air sebagai peubah respon. Satuan yang digunakan adalah cfs (cubic feet per second) untuk debit dan ft/sec (feet per second) untuk kecepatan.
Metode
Ada dua tahapan metode yang dilakukan
dalam penelitian ini, yaitu pendugaan
parameter dengan menggunakan model
regresi linear sederhana dan pendugaan
parameter dengan menggunakan model
regresi piecewise. Model regresi linear
sederhana digunakan sebagai model
pembanding bagi model regresi piecewise. Tahapan pendugaan parameter dengan menggunakan model regresi linear sederhana adalah :
1. Menduga parameter pada regresi linear
sederhana.
2. Menentukan nilai kuadrat tengah galat
model regresi sederhana dan R2.
3. Uji asumsi model regresi linear
sederhana
Tahapan pendugaan parameter
menggunakan model regresi piecewise
adalah:
1. Menentukan estimasi awal parameter
regresi piecewise (b01, b11, b12,…., b1n, c1, c2,…, cn-1)
a. Membuat scatter plot untuk
identifikasi awal dengan
menggunakan pemulusan
nonparametrik LOESS fit.
b. Menentukan estimasi awal jumlah
titik patahan dan nilai titik patahan (c1, c2,…, cn).
Estimasi nilai dan jumlah titik patahan dapat ditentukan dengan melihat hasil scatter plot LOESS fit dimana terjadi perubahan trend.
c. Menentukan persamaan regresi
disetiap patahan.
Parameter model regresi
disetiap patahan diduga dengan
menggunakan metode kuadrat
terkecil. Sehingga diperoleh : ̂= b01+ b11xi ; xi≤ c1 ̂= b02+ b12xi ; c1< xi≤c2
̂=b0n+ b1nxi ; xi > cn-1.
d. Memperbarui nilai titik patahan
dengan memilih nilai breakpoint
disekitar nilai estimasi awal.
Kemudian memilih model dengan nilai jumlah kuadrat galat (JKG) terkecil.
e. Mengambil nilai dugaan parameter b01, b11, b12,…., b1n, c1, c2,…, cn-1
dari persamaan regresi yang
dibentuk untuk dijadikan sebagai
estimasi awal nilai parameter
regresi piecewise.
2. Fitting Model
Nilai parameter model dari setiap patahan dan nilai titik patahan yang
diperoleh dijadikan estimasi awal
parameter regresi piecewise dengan
menggunakan PROC NLIN.
3. Menentukan nilai kuadrat tengah galat model regresi sederhana dan R2. 4. Uji asumsi model regresi piecewise.
5. Membandingkan model hasil regresi
piecewise dengan regesi linear dengan menggunakan nilai kuadrat tengah galat dan R2.
Diagram alur tahapan metode penelitian ini dapat dilihat pada Lampiran 1.
HASIL DAN PEMBAHASAN
Eksplorasi Data
Kecepatan arus aliran air meningkat pesat
dengan meningkatnya debit air tetapi
peningkatan kecepatan arus aliran air
mengalami penurunan ketika mendekati nilai tertentu. Hubungan antara kecepatan aliran air dan debit air sungai Soos Creek bisa dilihat pada Gambar 5.
Selain itu dari Gambar 5 juga terlihat tiga pengamatan yang nilai datanya jauh dari data lainnya. Ketiga titik pengamatan tersebut dapat memiliki pengaruh terhadap model regresi linear yang dibentuk. Ketiga titik pengamatan tersebut merupakan pengamatan ketika debit air melimpah yang diduga sebagai pencilan.
Gambar 5 Plot antara kecepatan air dan debit air sungai Soos Creek
Menduga Parameter pada Regresi Piecewise
Untuk dapat membentuk suatu model
regresi piecewise, diperlukan informasi
mengenai banyaknya titik patahan dan nilai estimasi awal parameter yang akan digunakan. Penentuan banyaknya titik patahan dan nilai estimasi awal parameter dapat ditentukan dengan membuat plot tebaran data seperti pada Gambar 5. Agar lebih mudah untuk
0 1 2 3 4 5
0 100 200 300 400 500 600 700
K e ce pat an arus (f t/s e c)
melihat banyaknya titik patahan plot dibuat
dengan menggunakan pemulusan
nonparametrik LOESS fit yang dapat dilihat pada Gambar 6. Gambar tersebut secara visual menunjukkan hanya terjadi satu titik patahan. Titik patahan ini berada diantara nilai 100 dan 150 cfs.
Gambar 6 Plot garis dengan menggunakan pemulusan nonparametrik LOESS fit
Pendugaan parameter regresi linear
sederhana juga dilakukan untuk data ini. Hal ini dilakukan untuk menunjukkan bahwa model regresi linear sederhana belum mampu menggambarkan hubungan antara kecepatan arus dan debit air sungai Soos Creek karena nilai-nilai yang terletak pada debit yang rendah tidak jatuh pada garis regresi linear sederhana (Gambar 7). Model regresi linear
sederhana digunakan sebagai model
pembanding bagi model regresi piecewise. Model regresi yang dihasilkan adalah :
̂ = 1.528 + 0.005xi
dengan nilai R2 sebesar 64.06% dan nilai KTG sebesar 0.329. Nilai R2 menunjukkan bahwa keragaman kecepatan arus mampu dijelaskan oleh keragaman debit air sebesar 64.06%. Hal ini menunjukkan bahwa model regresi linear sederhana tidak representatif untuk mewakili data.
Gambar 7 Plot garis regresi linear sederhana
Nilai parameter model regresi piecewise diperoleh dengan menggunakan PROC NLIN. Penentuan parameter awal (b01, b11, b12 ,c)
regresi piecewise diperlukan dalam prosedur PROC NLIN untuk memberikan nilai atau tempat memulai pengepasan model. Parameter awal regresi piecewise ditentukan dengan melakukan regresi linear sederhana di atas dan di bawah titik patahan. Karena titik patahan ini berada diantara nilai 100 dan 150 cfs akan lebih baik jika penentuan parameter awal dilakukan pada beberapa titik diantara 100 dan 150 cfs. Parameter regresi awal yang
digunakan adalah hasil regresi linear
sederhana yang memiliki jumlah kuadrat galat
terkecil. Nilai titik patahan yang
menghasilkan jumlah kuadrat galat terkecil terjadi pada titik 117 cfs dengan nilai 0.192. Nilai estimasi awal regresi piecewise dapat dilihat pada Tabel 1.
Tabel 1 Nilai awal estimasi regresi piecewise
Parameter Nilai estimasi
awal
b01 0.68
b11 0.018
c 117
b12 0.002
Nilai estimasi awal kemudian digunakan untuk melakukan pengepasan model dengan menggunakan PROC NLIN (Gambar 8). Hasil keluaran PROC NLIN dapat dilihat pada Lampiran 2. Dalam keluaran PROC NLIN
dibawah hasil iterasi terdapat catatan
“Convergence criterion met.” Hal ini
menunjukkan model yang diperoleh
konvergen dan titik patahan terjadi pada nilai 123.6 cfs.
Gambar 8 Plot garis regresi piecewise
Nilai dugaan parameter regresi piecewise yang didapatkan adalah
b01 = 0.68
b11 = 0.018
c = 123.6
b12 = 0.002
0 1 2 3 4 5 6
0 100 200 300 400 500 600 700
K
e
ce
pat
an
arus
(f
t/s
e
c)
5,5 5,0 4,5 4,0 3,5 3,0 2,5 2,0 1,5 1,0 0,5 0,0 -0,5 -1,0 -1,5 Dugaan Respon S is a a n 1,0 0,5 0,0 -0,5 -1,0 -1,5 99 95 90 80 70 60 50 40 30 20 10 5 1 Sisaan P e rc e n t
Normal Probability Plot
50 45 40 35 30 25 20 15 10 5 1 1,0 0,5 0,0 -0,5 -1,0 -1,5 Urutan Sisaan S is a a n
Sehingga persamaan regresi piecewise yang terbentuk adalah :
̂ = 0.680 + 0.018xi ; xi≤ 123.6
̂ = 2.607 + 0.002xi ; xi > 123.6
dengan nilai koefisien determinasi sebesar 90.23% dan nilai KTG sebesar 0.093. Nilai-p hasil uji-F untuk model ini sebesar 0.000 lebih
kecil dari taraf nyata (α = 0.05) yang berarti debit air berpengaruh secara nyata terhadap
kecepatan arus aliran sungai. Nilai R2
menunjukkan bahwa 90.23% keragaman kecepatan arus mampu dijelaskan oleh keragaman debit air. Hal ini menunjukkan bahwa model cukup representatif untuk mewakili data.
Pemeriksaan Asumsi Model
Pemeriksaan asumsi dilakukan untuk model regresi linear sederhana dan model
regresi piecewise. Pemeriksaan asumsi
dilakukan secara eksplorasi dan melakukan uji formal terhadap sisaan dari model yang telah dihasilkan. Pertama pemeriksaan asumsi dilakukan terhadap model regresi linear sederhana.
Pemeriksaan asumsi kenormalan secara eksplorasi dapat dilihat dari plot peluang kenormalan sisaan. Plot peluang kenormalan sisaan yang tidak mengikuti garis lurus mengindikasikan ketidaknormalan data sisaan Plot peluang kenormalan sisaan model regresi linear sederhana dapat dilihat pada Gambar 9. Plot peluang kenormalan sisaan mengikuti garis lurus sehingga dapat dikatakan bahwa sisaan menyebar normal. Hasil tersebut didukung oleh hasil uji Kolmogorov-Smirnov. Uji Kolmogorov-Smirnov menghasilkan nilai-p lebih besar dari taraf nyata (α = 0.05) yaitu sebesar 0.062. Hal ini menunjukkan bahwa sisaan menyebar normal.
Gambar 9 Plot peluang kenormalan sisaan model regresi sederhana
Plot sisaan yang dapat digunakan untuk pemeriksaan asumsi kehomogenan ragam adalah plot antara sisaan dengan dugaan respon. Plot antara sisaan dengan dugaan peubah respon model regresi linear sederhana dapat dilihat pada Gambar 10. Plot sisaan tersebut menunjukkan suatu pola, sehingga dapat dikatakan bahwa sisaan yang dihasilkan tidak homogen. Hasil tersebut didukung oleh hasil uji White. Uji White menghasilkan nilai statistik sebesar 17.35. Nilai tersebut lebih besar dibandingkan dengan nilai χ20.05(2)sebesar 5.991.
Gambar 10 Plot sisaan dengan dugaan peubah respon model regresi sederhana
Pemeriksaan asumsi kebebasan sisaan secara eksplorasi dapat dilihat dari plot antara sisaan dengan urutan sisaan model. Plot antara sisaan dengan urutan sisaan model regresi linear sederhana dapat dilihat pada Gambar 11. Plot sisaan model menunjukkan suatu pola sehingga dapat dikatakan bahwa sisaan dari persamaan yang dihasilkan tidak saling bebas. Hasil tersebut didukung oleh hasil uji Runtunan. Uji Runtunan menghasilkan nilai-p
lebih kecil dari taraf nyata (α = 0.05). Kedua
uji tersebut menunjukkan bahwa sisaan tidak homogen dan tidak saling bebas.
Untuk mengatasi pelanggaran asumsi maka dilakukan transformasi. Model regresi yang dihasilkan setelah transformasi adalah :
̂ = 4.40 - 18.2 xi-1/2
dengan nilai R2 sebesar 89,1% dan nilai KTG sebesar 0.1. Nilai R2 menunjukkan bahwa keragaman kecepatan arus mampu dijelaskan oleh keragaman debit air sebesar 89.1%.
Selanjutnya pemeriksaan asumsi
dilakukan terhadap model regresi piecewise.
Pemeriksaan asumsi kenormalan secara
eksplorasi dapat dilihat dari plot peluang kenormalan sisaan. Plot peluang kenormalan sisaan model regresi piecewise dapat dilihat pada Lampiran 3. Plot peluang kenormalan sisaan model sebelum dan sesudah nilai titik patahan mengikuti garis lurus sehingga dapat dikatakan bahwa sisaannya normal. Hasil tersebut didukung oleh hasil uji Kolmogorov-Smirnov. Nilai-p untuk model sebelum dan sesudah nilai titik patahan memperoleh lebih dari 0.05.
Plot sisaan yang dapat dipergunakan untuk pemeriksaan asumsi kehomogenan ragam adalah plot antara sisaan dengan dugaan respon. Plot antara sisaan dengan dugaan peubah respon model regresi piecewise dapat dilihat pada Lampiran 4. Plot sisaan sebelum dan sesudah nilai titik patahan tidak menunjukkan suatu pola, sehingga dapat dikatakan bahwa sisaan yang dihasilkan homogen. Hasil tersebut didukung oleh hasil uji White. Untuk model sebelum dan sesudah titik patahan memperoleh nilai statistik uji White 1.2 dan 3.72. Kedua nilai tersebut lebih kecil dibandingkan dengan nilai χ20.05(2)
sebesar 5.991.
Pemeriksaan asumsi kebebasan sisaan secara eksplorasi dapat dilihat dari plot antara sisaan dengan urutan sisaan model. Plot antara sisaan dengan urutan sisaan model regresi piecewise dapat dilihat pada Lampiran 5. Plot sisaan model sebelum dan sesudah nilai titik patahan tidak menunjukkan suatu pola sehingga dapat dikatakan bahwa sisaan dari persamaan yang dihasilkan saling bebas. Hasil tersebut didukung oleh hasil uji Runtunan. Nilai-p untuk model sebelum dan sesudah nilai titik patahan lebih besar dari taraf nyata
(α = 0.05).
Pengaruh Pencilan
Penilaian adanya pencilan dan amatan berpengaruh penting dalam suatu analisis. Dan penting untuk mengetahui bagaimana
pencilan dan amatan berpengaruh ini
mempengaruhi pengepasan model.
Berdasarkan Gambar 5 terlihat tiga
pengamatan yang nilai datanya jauh dari data lainnya yang diduga sebagai pencilan. Pengamatan tersebut merupakan pengamatan ke-11, 12, dan 26.
Pendeteksian pencilan dilakukan dengan menggunakan nilai internal studenization (ri).
Pada Lampiran 6 terlihat bahwa terlihat dua dari tiga pengamatan terjauh merupakan data pencilan yaitu pada data ke-11 dan 12. Hal ini dikarenakan nilai |ri| pada kedua data tersebut
lebih dari dua. Sedangkan dengan
menggunakan nilai leverage diketahui bahwa tiga amatan terjauh merupakan amatan berpengaruh. Hal ini terjadi karena nilai laverage > 2p/n = 0.08.
Dalam kasus ini tiga amatan terjauh mempengaruhi pengepasan model. Jika ketiga titik amatan tersebut dihapus dan dilakukan pengepasan model kembali maka akan dihasilkan dugaan parameter yang berbeda. Persamaan regresi linear sederhana jika ketiga titik terjauh dihilangkan adalah :
̂ = 1.039 + 0.011xi
dengan nilai R2 sebesar 83.9% dan nilai KTG sebesar 0.123. Nilai R2 menunjukkan bahwa keragaman kecepatan arus mampu dijelaskan oleh keragaman debit air sebesar 83.9%.
Terjadi perubahan koefisien kemiringan ketika ketiga titik amatan terjauh dihilangkan. Selain itu jika dilihat dari nilai koefisien determinasi model regresi linear sederhana mampu menerangkan keragaman dengan baik. Tetapi regresi linear sederhana tetap belum mampu menggambarkan hubungan antara kecepatan arus dan debit air sungai Soos Creek karena nilai-nilai yang pada kedua ujung debit banyak terletak dibawah garis regresi dan nilai-nilai yang berada ditengah debit terletak diatas garis regresi (Gambar 12).
Gambar 12 Plot garis regresi linear sederhana
ketiga titik amatan terjauh
dihilangkan
Pada regresi linear sederhana tanpa tiga amatan juga dilakukan pemeriksaan asumsi.
Pemeriksaan asumsi dilakukan secara
0 1 2 3 4
0 50 100 150 200 250 300
K e ce pat an arus (ft /s e c)
eksplorasi dan melakukan uji formal terhadap sisaan dari model yang telah dihasilkan.
Pemeriksaan asumsi kenormalan secara
eksplorasi dapat dilihat dari plot peluang kenormalan sisaan. Plot peluang kenormalan sisaan model regresi linear sederhana tanpa tiga amatan dapat dilihat pada Lampiran 7. Plot peluang kenormalan sisaan mengikuti garis lurus sehingga dapat dikatakan bahwa sisaannya normal. Hasil tersebut didukung oleh hasil uji Kolmogorov-Smirnov. Uji Kolmogorov-Smirnov menghasilkan nilai-p lebih besar dari taraf nyata (α = 0.05) dengan nilai lebih besar dari 0.15. Hal ini menunjukkan bahwa sisaan menyebar normal. Plot sisaan yang dapat dipergunakan untuk pemeriksaan asumsi kehomogenan ragam adalah plot antara sisaan dengan dugaan respon. Plot antara sisaan dengan dugaan peubah respon model regresi linear sederhana tanpa tiga amatan dapat dilihat pada Lampiran 7. Plot sisaan tidak menunjukkan suatu pola, sehingga dapat dikatakan bahwa sisaan yang dihasilkan homogen. Hasil tersebut didukung oleh hasil uji White. Uji White menghasilkan nilai statistik sebesar 4.23. Nilai tersebut lebih kecil dibandingkan dengan nilai χ20.05(2)
sebesar 5.991.
Pemeriksaan asumsi kebebasan sisaan secara eksplorasi dapat dilihat dari plot antara sisaan dengan urutan sisaan model. Plot antara sisaan dengan urutan sisaan model regresi linear sederhana tanpa tiga amatan dapat dilihat pada Lampiran 7. Plot sisaan model menunjukkan suatu pola sehingga dapat dikatakan bahwa sisaan dari persamaan yang dihasilkan tidak saling bebas. Hasil tersebut didukung oleh hasil uji Runtunan. Uji Runtunan menghasilkan nilai-p lebih kecil
dari taraf nyata (α = 0.05).
Untuk mengatasi pelanggaran asumsi maka dilakukan transformasi. Model regresi yang dihasilkan setelah transformasi adalah :
̂ = 0.589 + 0.01xi
dengan nilai R2 sebesar 69.6% dan nilai KTG sebesar 0.096. Nilai R2 menunjukkan bahwa keragaman kecepatan arus mampu dijelaskan oleh keragaman debit air sebesar 69.6%.
Persamaan regresi piecewise jika ketiga titik terjauh tersebut dihilangkan adalah :
̂ = 0.562 + 0.021xi ; xi≤ 91.02
̂ = 1.919 + 0.006xi ; xi > 91.02
Nilai titik patahan yang dihasilkan bergeser dari titik 123.6 ke 91.02 (Gambar 13).
Gambar 13 Plot garis regresi piecewise ketika
ketiga titik amatan terjauh
dihilangkan
Perbedaan nilai koefisien kemiringan pada model sebelum dan sesudah titik patahan mengindikasikan bahwa tetap ada dua segmen ketika ketiga titik amatan dihilangkan.
Hasil pemeriksaan asumsi menunjukkan bahwa semua asumsi terpenuhi. Pemeriksaan asumsi kenormalan secara eksplorasi dapat dilihat dari plot peluang kenormalan sisaan. Plot peluang kenormalan sisaan model regresi piecewise tanpa tiga amatan dapat dilihat pada Lampiran 8. Plot peluang kenormalan sisaan model sebelum dan sesudah nilai titik patahan
mengikuti garis lurus sehingga dapat
dikatakan bahwa sisaannya normal. Hasil tersebut didukung oleh hasil uji Kolmogorov-Smirnov. Nilai-p untuk model sebelum dan sesudah nilai titik patahan memperoleh lebih dari 0.05.
Plot sisaan yang dapat dipergunakan untuk pemeriksaan asumsi kehomogenan ragam adalah plot antara sisaan dengan dugaan respon. Plot antara sisaan dengan dugaan peubah respon model regresi piecewise tanpa tiga amatan dapat dilihat pada Lampiran 9. Plot sisaan sebelum dan sesudah nilai titik patahan tidak menunjukkan suatu pola, sehingga dapat dikatakan bahwa sisaan yang dihasilkan homogen. Hasil tersebut didukung oleh hasil uji White. Untuk model sebelum dan sesudah titik patahan memperoleh nilai statistik uji White 1.17 dan 1.68. Kedua nilai tersebut lebih kecil dibandingkan dengan nilai
χ2
0.05(2)sebesar 5.991.
Pemeriksaan asumsi kebebasan sisaan secara eksplorasi dapat dilihat dari plot antara sisaan dengan urutan sisaan model. Plot antara sisaan dengan urutan sisaan model regresi piecewise tanpa tiga amatan dapat dilihat pada Lampiran 10. Plot sisaan model sebelum dan sesudah nilai titik patahan tidak menunjukkan suatu pola sehingga dapat dikatakan bahwa sisaan dari persamaan yang dihasilkan saling bebas. Hasil tersebut didukung oleh hasil uji Runtunan. Nilai-p untuk model sebelum dan sesudah nilai titik patahan lebih besar dari
Perbandingan Model Regresi Piecewise
dengan Regesi Linear Sederhana
Perbandingan antara model regresi linear dan regresi piecewise dapat dilihat pada Tabel 2. Nilai KTG model regresi piecewise lebih kecil dibandingkan dengan nilai KTG regresi linear. Dan nilai koefisien determinasi regresi
piecewise lebih besar dibandingkan nilai
koefisien determinasi regresi linear sederhana. Koefisien determinasi yang lebih besar menunjukkan bahwa regresi piecewise lebih representatif terhadap data dan mampu menjelaskan keragaman data lebih besar dari keragaman yang dijelaskan oleh regresi linear sederhana. Hal ini menunjukkan model regresi piecewise lebih baik dibandingkan dengan model regresi linear sederhana.
Tabel 2 Nilai kuadrat tengah galat dan koefisien determinasi
Model KTG R2
Regresi linear 0.1 89.1%
Regresi piecewise 0.093 90.23%
Model untuk kecepatan aliran air sungai sebelum nilai debit air sebesar 123.6 cfs adalah ̂ = 0.680+ 0.018xi. Sedangkan untuk
setelah 123.6 cfs adalah ̂ = 2.607 + 0.002xi.
Hasil analisis regresi piecewise ini
menunjukkan bahwa kecepatan arus aliran sungai meningkat pesat dengan meningkatnya debit air sampai pada titik 123.6 cfs. Selanjutnya pada saat nilai debit air melebihi 123.6 cfs perubahan kecepatan arus aliran sungai mengalami penurunan.
Ketika tiga amatan berpengaruh tidak diikutsertakan nilai KTG yang dihasilkan regresi piecewise lebih kecil dibandingkan nilai KTG regresi linear sederhana. Dan nilai koefisien determinasi regresi piecewise lebih besar dibandingkan nilai koefisien determinasi regresi linear sederhana (Tabel 3). Hal ini menunjukkan bahwa model regresi piecewise tetap merupakan model yang lebih sesuai untuk digunakan ketika ketiga titik amatan dihilangkan.
Tabel 3 Nilai kuadrat tengah galat dan koefisien determinasi ketika tiga amatan terjauh dihilangkan
Model KTG R2
Regresi linear 0.096 69.6%
Regresi piecewise 0.079 90.13%
.
Ketiga titik pengamatan terjauh
merupakan pengamatan ketika debit air
melimpah. Debit air yang melimpah
merupakan kejadian yang ekstrem. Ketiga titik amatan terjauh memiliki pengaruh terhadap model yang dibentuk. Ketika ketiga titik amatan terjauh tidak diikutsertakan dalam analisis regresi piecewise masih terdapat perbedaan nilai koefisien kemiringan pada model sebelum dan sesudah titik patahan. Hal ini menunjukkan bahwa untuk kondisi normal tetap ada dua segmen. Dan belum ada alasan bahwa ketiga titik terjauh tersebut tidak valid. Oleh karena itu model dengan semua data yang tercantum adalah model yang lebih baik.
SIMPULAN DAN SARAN
Simpulan
Model persamaan regresi yang diperoleh dengan mengunakan regresi piecewise adalah sebagai berikut :
̂ = 0.680 + 0.018xi ; xi≤ 123.6 ̂ = 2.607 + 0.002xi ; xi > 123.6
dengan nilai titik patahan yang terjadi pada titik 123.6 cfs. Model regresi piecewise mampu menjelaskan keragaman data yang lebih besar dari keragaman yang bisa dijelaskan oleh model regresi linear sederhana
karena memberikan nilai koefisien
determinasi yang lebih besar.
Saran
Pada penelitian selanjutnya dapat dicoba menggunakan model-model hasil transformasi yang lain atau menggunakan model regresi nonlinear seperti model logarithma.
DAFTAR PUSTAKA
Brusilovskiy E. The Piecewise Regression Model as a Response Modeling Tool.
www.nesug.org/proceedings/nesug04/an/a n09.pdf. [30 Maret 2010]
Cleveland WS, Devlin SJ. 1988. Locally Weighted Regression : An Approach to Regression Analysis by Local Fitting. Journal of The American Statistical Association 83 : 596-610.
Drapper N, Smith H. 1981. Analisis regresi
Terapan Edisi Kedua. Sumantri B,
penerjemah. Jakarta: Gramedia.
Terjemahan dari : Applied Regression
Analysis.
Effendi, H. 2003. Telaah Kualitas Air Bagi
Pengelolaan Sumber Daya dan
Lingkungan Perairan. Yogyakarta:
Mahir RA, Wan-Rozita WD, Khairiah J, Ismail BJ.2009. Fitting a nonlinear regression model to gauge heavy metal uptake in spinach (Amaranthus hybridus L.). Jurnal American-Eurasian J. Agric. & Environ. Sci. 5 (2): 236-243.
Myers RH.1989. Classical and Modern
Regression with Application Second
Edition. Boston : PWS-KENT Publishing
Company.
Rawlings JO, Pantula SG, Dickey DA. 1998. Applied Regression Analysis New York : Springer-Verlag.
Ryan SE, Porth LS. 2002.Defining phases of
bedload transport using piecewise
regression. Earth Surface Processesand Landforms 27: 971-990.
Xi JY. 2009. Piecewise Regression: A Tool
for Understanding The Relationship
between the Attribute-Level Performance
and Customer Satisfaction.
www.im.cyu.edu.tw/2009_IM_Cenference /2010-01-26/A/a34.pdf
.
[30 Maret 2010]Lampiran 1 Diagram alur tahapan metode penelitian
Membandingkan nilai kuadrat tengah galat dan R2
Membuat Scatter Plot dengan menggunakan pemulusan nonparametrik seperti LOESS fit.
Menentukan estimasi awal nilai titik patahan (c1, c2,…, cn) dan
jumlah titik patahan.
Menentukan model persamaan regresi disetiap patahan.
Menentukan nilai kuadrat tengah galat
Menentukan nilai dugaan parameter (α, b1, b2,…., bn, c1,
c2,…, cn-1 ) sebagai estimasi awal nilai parameter regresi piecewise
Menentukan nilai kuadrat tengah galat
dan R2
Uji asumsi regresi
piecewise
Nilai KTG terkecil Menduga parameter
regresi sederhana
Menentukan nilai kuadrat tengah galat
dan R2
Uji asumsi model regresi sederhana
Ya
Lampiran 2 Hasil keluaran PROC NLIN
Iterasi a1 b1 c b2 Sum of
Squares
0 0.6801 0.0179 117.0 0.00231 4.5115
1 0.6801 0.0179 123.6 0.00231 4.2980
2 0.6801 0.0179 123.6 0.00231 4.2980
NOTE: Convergence criterion met.
Source DF Sum of
Squares
Mean
Square F Value
Approx Pr > F
Model 3 39.7194 13.2398 147.70 < 0.0001
Error 46 4.2980 0.0934
Corrected Total 49 44.0174
Parameter Estimate Approx
Std Error Approximate 95% Confidence Limits
a1 0.6801 0.1182 0.4422 0.9179
b1 0.0179 0.00204 0.0138 0.0220
c 123.6 11.5517 100.3 146.8
Lampiran 3 Plot peluang kenormalan sisaan model regresi piecewise
Lampiran 4 Plot sisaan dengan dugaan peubah respon model regresi piecewise
Lampiran 5 Plot sisaan dengan urutan sisaan model regresi piecewise 0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 99 95 90 80 70 60 50 40 30 20 10 5 1 Sisaan P e rc e n t
Data Arus Sungai Soos Creek
Sebelum Titik Patahan
0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 99 95 90 80 70 60 50 40 30 20 10 5 1 Sisaan P e rc e n t
Data Arus Sungai Soos Creek
Setelah Titik Patahan
4,2 4,0 3,8 3,6 3,4 3,2 3,0 0,75 0,50 0,25 0,00 -0,25 -0,50 Dugaan Respon S is a a n
Data Arus Sungai Soos Creek
Setelah Titik Patahan
-6,0 -6,2 -6,4 -6,6 -6,8 -7,0 -7,2 0,10 0,05 0,00 -0,05 -0,10 Dugaan Respon S is a a n
Data Arus Sungai Soos Creek
Sebelum Titik Patahan
30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0,50 0,25 0,00 -0,25 -0,50 Urutan Sisaan S is a a n
Data Arus Sungai Soos Creek
Sebelum Ttik Patahan
20 18 16 14 12 10 8 6 4 2 0,75 0,50 0,25 0,00 -0,25 -0,50 Urutan Sisaan S is a a n
Data Arus Sungai Soos Creek
Lampiran 6 Deteksi pencilan dan amatan berpengaruh
Xi Yi
Laverage
Value ri
1 42 0,027867 -1,3357
0,94 40 0,028235 -1,42271
3,28 246 0,034492 0,733067
2,61 148 0,020398 0,487179
2,75 139 0,020115 0,819522
1,32 51 0,026316 -0,85636
0,88 27 0,03083 -1,40562
0,74 24 0,03148 -1,62492
0,81 27 0,03083 -1,52944
1,11 38 0,028611 -1,10341
4,04 678 0,337125 -2,5172
3,57 600 0,253479 -2,46385
2,4 146 0,02032 0,136861
2,69 149 0,02044 0,618365
1,81 56 0,025527 -0,03967
1,09 33 0,029588 -1,09123
1,12 31 0,029994 -1,01918
3,43 219 0,028596 1,255406
3,08 162 0,021176 1,180508
3,53 250 0,035496 1,138117
2,49 111 0,020323 0,630236
1,99 76 0,0229 0,085762
1,17 37 0,028802 -0,98789
1,75 70 0,0236 -0,2796
2,93 165 0,021396 0,887874
4,21 508 0,171248 -0,15675
2,94 198 0,025068 0,590516
2,41 100 0,020856 0,594956
1,78 49 0,026646 -0,02542
1,5 35 0,029191 -0,38566
1,4 29 0,030408 -0,50501
2,51 117 0,02014 0,607928
2,81 238 0,032585 -0,02267
3,22 144 0,020251 1,598537
2,6 78 0,022683 1,141025
1,95 43 0,027686 0,332426
1,88 42 0,027867 0,218442
3,16 149 0,02044 1,445264
2,83 173 0,022076 0,63545
2,93 135 0,020044 1,174398
Lanjutan
Xi Yi
Laverage
Value ri
1,12 30 0,0302 -1,00967
1,34 33 0,029588 -0,64932
3,2 181 0,022891 1,210813
2,68 100 0,020856 1,070084
2,38 89 0,021642 0,647751
1,56 36 0,028995 -0,28921
1,5 35 0,029191 -0,38566
1,34 25 0,031261 -0,57287
Lampiran 7 Plot pemeriksaan asumsi model regresi sederhana tanpa tiga amatan
1,0 0,5
0,0 -0,5
-1,0 99
95 90
80 70 60 50 40 30 20
10 5
1
Sisaan
P
e
rc
e
n
t
Plot peluang kenormalan sisaan
45 40 35 30 25 20 15 10 5 1 0,5
0,0
-0,5
-1,0
Urutan Sisaan
S
is
a
a
n
Plot sisaan dengan urutan sisaan
4,0 3,5 3,0 2,5 2,0 1,5 1,0 0,5
0,0
-0,5
-1,0
Dugaan Respon
S
is
a
a
n
Lampiran 8 Plot peluang kenormalan sisaan model regresi piecewise tanpa tiga amatan
Lampiran 9 Plot sisaan dengan dugaan peubah respon model regresi piecewise tanpa tiga amatan
Lampiran 10 Plot sisaan dengan urutan sisaan model regresi piecewise tanpa tiga amatan 3,50 3,25 3,00 2,75 2,50 0,50 0,25 0,00 -0,25 -0,50 Dugaan Respon S is a a n
Setelah titik patahan
26 24 22 20 18 16 14 12 10 8 6 4 2 0,50 0,25 0,00 -0,25 -0,50 Urutan Sisaan S is a a n
Sebelum titik patahan
20 18 16 14 12 10 8 6 4 2 0,50 0,25 0,00 -0,25 -0,50 Urutan Sisaan S is a a n
Setelah titik patahan
0,50 0,25 0,00 -0,25 -0,50 99 95 90 80 70 60 50 40 30 20 10 5 1 Sisaan P e rc e n t
Setelah titik patahan
0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 99 95 90 80 70 60 50 40 30 20 10 5 1 Sisaan P e rc e n t
Sebelum titik patahan
2,6 2,4 2,2 2,0 1,8 1,6 1,4 1,2 1,0 0,50 0,25 0,00 -0,25 -0,50 Dugaan Respon S is a a n
KHOIRUN IBNU FARID. Pendugaan Kecepatan Arus Sungai dengan Menggunakan Regresi
Piecewise (Studi Kasus Sungai Soos Creek di Negara Bagian Washington). Di bimbing olehI MADE
SUMERTAJAYA dan DIAN KUSUMANINGRUM.
Pada aliran sungai Soos Creek yang berada di Negara bagian Washington, kecepatan arus aliran sungai meningkat pesat dengan meningkatnya debit, tetapi peningkatan kecepatan arus air mengalami penurunan ketika mendekati nilai tertentu. Hal tersebut mengindikasikan bahwa kecepatan aliran air dan debit air sungai Soos Creek memiliki hubungan yang non-linear. Regresi piecewise dapat diterapkan untuk menduga kecepatan aliran sungai Soos Creek. Regresi piecewise adalah salah satu model regresi yang dapat digunakan pada kondisi model linear berganda (multiple linear model) untuk memperoleh model pada rentang x yang berbeda. Titik perubahan trend kecepatan arus aliran sungai disebut titik patahan. Banyaknya titik patahan dapat ditentukan dari plot yang dibuat dengan menggunakan pemulusan nonparametrik LOESS fit.
Model regresi piecewise dibangun dengan menggunakan prosedur PROC NLIN yang
memerlukan parameter awal. Parameter awal regresi piecewise ditentukan dengan melakukan regresi
linear sederhana secara terpisah terhadap masing-masing segmen dengan setiap garis regresi dibuat sesuai dengan data yang memungkinkan untuk meminimumkan kuadrat tengah galat (KTG). Model regresi piecewise terbaik adalah
̂ = 0.680 + 0.018xi ; xi≤ 123.6 ̂ = 2.607 + 0.002xi ; xi > 123.6
dengan nilai titik patahan yang dihasilkan terletak pada titik 123.6 cfs. Hasil analisis regresi piecewise ini menunjukkan bahwa kecepatan arus aliran sungai meningkat pesat dengan meningkatnya debit air sampai pada titik 123.6 cfs. Selanjutnya pada saat nilai debit air melebihi 123.6 cfs perubahan kecepatan arus aliran sungai mengalami penurunan. Model regresi piecewise mampu menjelaskan keragaman data yang lebih besar dari keragaman yang bisa dijelaskan oleh model regresi linear sederhana karena memberikan nilai koefisien determinasi yang lebih besar.
PENDAHULUAN
Latar Belakang
Kecepatan arus sungai merupakan salah satu parameter hidrologi yang memegang peranan penting dalam penelitian suatu ekosistem badan perairan. Kecepatan arus dapat digunakan untuk memperkirakan kapan bahan pencemar akan mencapai lokasi tertentu, apabila bagian hulu mengalami pencemaran (Effendi 2003). Kecepatan arus juga dapat digunakan untuk memperkirakan kapan aliran air mencapai lokasi tertentu ketika terjadi peningkatan debit air di hulu sungai. Kecepatan aliran sungai dapat diduga melalui debit air sungai.
Pada aliran sungai Soos Creek yang berada di Negara bagian Washington, kecepatan arus
aliran sungai meningkat pesat dengan
meningkatnya debit, tetapi peningkatan
kecepatan arus air mengalami penurunan ketika mendekati nilai tertentu. Hal tersebut mengindikasikan bahwa kecepatan aliran air dan debit air sungai Soos Creek memiliki hubungan yang non-linear.
Ketika meneliti suatu hubungan antara peubah respon (Y) dan peubah bebas (X), mungkin saja terjadi hubungan nonlinear.
Model regresi sederhana tidak dapat
mengambarkan data yang memiliki hubungan non-linear karena model regresi linear sederhana mengabaikan perubahan trend. Salah satu model regresi yang dapat digunakan untuk mengatasi ketidaklinearan hubungan antara peubah respon dan peubah bebas adalah regresi piecewise. Regresi piecewise adalah salah satu bentuk regresi yang dapat digunakan pada kondisi model linear berganda (multiple linear model)untuk memperoleh model yang sesuai dengan data untuk rentang x yang berbeda (Jun Yang Xi
2009). Regresi piecewise merupakan
gabungan dua atau lebih segmen garis (kurva) regresi dimana segmen garis yang berdekatan mempunyai koefisien regresi yang berbeda.
Sifat tersegmen/terbagi inilah yang
memberikan fleksibelitas yang lebih baik daripada model regresi linear sederhana. Sifat
ini memungkinkan model regresi piecewise
menyesuaikan diri secara efektif terhadap pola dari data.
Titik pemisah yang menghubungkan antar
model linear disebut titik patahan
(breakpoint). Titik patahan ini mungkin saja diketahui sebelum dilakukan analisis, tetapi biasanya titik patahan ini tidak diketahui dan harus diduga (Ryan & Port 2002). Dalam kasus ini titik patahan merupakan titik dimana
terjadi penurunan pada nilai perubahan kecepatan arus aliran air.
Tujuan
Tujuan dari penelitian ini adalah
menerapkan analisis regresi piecewise dan membandingkan hasil yang diperoleh dengan hasil analisis regresi linear sederhana pada data kecepatan aliran sungai dan debit air sungai Soos Creek.
TINJAUAN PUSTAKA
Regresi Linear Sederhana
Analisis regresi merupakan alat statistika yang dapat digunakan untuk menyelidiki hubungan antara sebuah peubah respon (Y) dengan satu atau lebih peubah bebas (X). Dimana peubah bebas mempengaruhi peubah respon. Struktur model regresi yang paling sederhana adalah regresi linear sederhana. Disini istilah sederhana menyiratkan sebuah peubah respon dihubungkan dengan sebuah peubah bebas saja. Model regresi linear sederhana dapat dinyatakan sebagai berikut :
dengan dan adalah parameter regresi,
adalah galat/sisaan, Y adalah peubah respon, dan x adalah peubah bebas (Myers 1989).
Koefisien determinasi (R2) merupakan proporsi keragaman atau variasi total disekitar nilai tengah ( ̅) yang dapat dijelaskan oleh model regresi. Secara grafis mengukur jauh-dekatnya titik pengamatan terhadap garis regresi. Rentang nilai koefisien determinasi adalah antara 0 (tidak ada keragaman y yang
dapat dijelaskan oleh x) sampai 1 (100% keragaman y dapat dijelaskan oleh
keragaman x). Koefisien determinasi dapat diperoleh melalui :
∑∑ ̂ ̅
Regresi Piecewise
Regresi piecewise adalah suatu metode regresi dimana peubah bebas disekat kedalam interval dan suatu ruas garis terpisah yang cocok untuk masing-masing interval. Regresi piecewise bermanfaat untuk digunakan ketika
peubah bebas dikelompokkan kedalam
kelompok-kelompok yang berbeda
PENDAHULUAN
Latar Belakang
Kecepatan arus sungai merupakan salah satu parameter hidrologi yang memegang peranan penting dalam penelitian suatu ekosistem badan perairan. Kecepatan arus dapat digunakan untuk memperkirakan kapan bahan pencemar akan mencapai lokasi tertentu, apabila bagian hulu mengalami pencemaran (Effendi 2003). Kecepatan arus juga dapat digunakan untuk memperkirakan kapan aliran air mencapai lokasi tertentu ketika terjadi peningkatan debit air di hulu sungai. Kecepatan aliran sungai dapat diduga melalui debit air sungai.
Pada aliran sungai Soos Creek yang berada di Negara bagian Washington, kecepatan arus
aliran sungai meningkat pesat dengan
meningkatnya debit, tetapi peningkatan
kecepatan arus air mengalami penurunan ketika mendekati nilai tertentu. Hal tersebut mengindikasikan bahwa kecepatan aliran air dan debit air sungai Soos Creek memiliki hubungan yang non-linear.
Ketika meneliti suatu hubungan antara peubah respon (Y) dan peubah bebas (X), mungkin saja terjadi hubungan nonlinear.
Model regresi sederhana tidak dapat
mengambarkan data yang memiliki hubungan non-linear karena model regresi linear sederhana mengabaikan perubahan trend. Salah satu model regresi yang dapat digunakan untuk mengatasi ketidaklinearan hubungan antara peubah respon dan peubah bebas adalah regresi piecewise. Regresi piecewise adalah salah satu bentuk regresi yang dapat digunakan pada kondisi model linear berganda (multiple linear model)untuk memperoleh model yang sesuai dengan data untuk rentang x yang berbeda (Jun Yang Xi
2009). Regresi piecewise merupakan
gabungan dua atau lebih segmen garis (kurva) regresi dimana segmen garis yang berdekatan mempunyai koefisien regresi yang berbeda.
Sifat tersegmen/terbagi inilah yang
memberikan fleksibelitas yang lebih baik daripada model regresi linear sederhana. Sifat
ini memungkinkan model regresi piecewise
menyesuaikan diri secara efektif terhadap pola dari data.
Titik pemisah yang menghubungkan antar
model linear disebut titik patahan
(breakpoint). Titik patahan ini mungkin saja diketahui sebelum dilakukan analisis, tetapi biasanya titik patahan ini tidak diketahui dan harus diduga (Ryan & Port 2002). Dalam kasus ini titik patahan merupakan titik dimana
terjadi penurunan pada nilai perubahan kecepatan arus aliran air.
Tujuan
Tujuan dari penelitian ini adalah
menerapkan analisis regresi piecewise dan membandingkan hasil yang diperoleh dengan hasil analisis regresi linear sederhana pada data kecepatan aliran sungai dan debit air sungai Soos Creek.
TINJAUAN PUSTAKA
Regresi Linear Sederhana
Analisis regresi merupakan alat statistika yang dapat digunakan untuk menyelidiki hubungan antara sebuah peubah respon (Y) dengan satu atau lebih peubah bebas (X). Dimana peubah bebas mempengaruhi peubah respon. Struktur model regresi yang paling sederhana adalah regresi linear sederhana. Disini istilah sederhana menyiratkan sebuah peubah respon dihubungkan dengan sebuah peubah bebas saja. Model regresi linear sederhana dapat dinyatakan sebagai berikut :
dengan dan adalah parameter regresi,
adalah galat/sisaan, Y adalah peubah respon, dan x adalah peubah bebas (Myers 1989).
Koefisien determinasi (R2) merupakan proporsi keragaman atau variasi total disekitar nilai tengah ( ̅) yang dapat dijelaskan oleh model regresi. Secara grafis mengukur jauh-dekatnya titik pengamatan terhadap garis regresi. Rentang nilai koefisien determinasi adalah antara 0 (tidak ada keragaman y yang
dapat dijelaskan oleh x) sampai 1 (100% keragaman y dapat dijelaskan oleh
keragaman x). Koefisien determinasi dapat diperoleh melalui :
∑∑ ̂ ̅
Regresi Piecewise
Regresi piecewise adalah suatu metode regresi dimana peubah bebas disekat kedalam interval dan suatu ruas garis terpisah yang cocok untuk masing-masing interval. Regresi piecewise bermanfaat untuk digunakan ketika
peubah bebas dikelompokkan kedalam
kelompok-kelompok yang berbeda
melalui regresi linear. Menurut Laird dan Davidian dalam (Li Xing 2005) persamaan regresi piecewise dapat dinyatakan sebagai berikut :
0 jika x ≤ ck dimana =
jika x ≥ ck dengan k =1,2,…,K-1
β1 adalah parameter yang
merepresentasikan kemiringan garis pada
segmen pertama, dan ∑
merepresentasikan kemiringan garis untuk
segmen ke-K .
Metode kuadrat terkecil diterapkan
terpisah terhadap masing-masing segmen dengan setiap garis regresi dibuat sesuai dengan data yang memungkinkan untuk meminimumkan kuadrat tengah galat (KTG). Selain jumlah kuadrat nilai titik patahan yang optimum juga dapat dilihat dari koefisien
determinasi yang maksimum di setiap
segmen.
Regresi Piecewise dengan Dua Segmen
Persamaan regresi piecewise untuk satu titik patahan merupakan persamaan regresi piecewise yang paling sederhana. Persamaan ini hanya menduga dua persamaan untuk dua selang yang berbeda. Persamaan regresi piecewise dapat dinyatakan sebagai berikut:
̂ = b01+ b11xi ; xi≤ c ̂ = b02+ b12xi ; xi > c
dimana xi adalah peubah bebas, ̂ adalah
peubah respon, b0K dan b1K (K=1,2) adalah
intercep dan koefisien kemiringan garis
regresi untuk segmen ke-K, dan c adalah nilai titik patahan.
Untuk fungsi regresi yang kontinu pada titik patahan, dua persamaan dari ̂ harus sama pada titik patahan (ketika xi= c) :
b01+ b11xi= b02+ b12xi
Persamaan diatas dapat juga ditulis sebagai : b02 = b01 + c(b11 - b12)
Kemudian dengan mengganti b02 dengan
persamaan diatas diperoleh persamaan regresi piecewise yang kontinu pada xi= c