commit to user
BAB II
LANDASAN TEORI
Bab ini terdiri atas tiga bagian yaitu tinjuan pustaka, teori penunjang, dan kerangka pemikiran. Tinjauan pustaka berisi penelitian-penelitian sebelum- nya yang digunakan sebagai dasar dalam penelitian ini. Teori penunjang berisi definisi-definisi dan teori-teori yang digunakan untuk mencapai tujuan penelitian.
Kerangka pemikiran merupakan alur pemikiran dalam penelitian ini.
2.1 Tinjauan Pustaka
Suatu data yang terurut berdasarkan waktu disebut data runtun waktu.
Data runtun waktu dapat diterapkan secara parametrik yaitu ARMA. Suparti [13]
menyatakan bahwa model tersebut sering memiliki eror tidak memenuhi asumsi.
Alternatif untuk mengatasi masalah tersebut adalah model nonparametrik yang tidak memandang asumsi-asumsi sebagaimana model parametrik. Model nonpa- rametrik yang diusulkan oleh Hardle [7] adalah regresi nonparametrik. Menurut Eubank [5], regresi nonparametrik merupakan model yang digunakan pada data yang tidak diketahui bentuk fungsi regresinya. Fungsi regresi tersebut ditentukan melalui teknik pemulusan yaitu kernel dan spline.
Penelitian tentang regresi kernel dan regresi spline pernah dilakukan oleh Laome [9]. Kedua model tersebut diterapkan pada data pertumbuhan balita dan menunjukkan bahwa model regresi spline lebih baik dari model regresi kernel.
Tahun 2003, Ruppert et al. [12] mengembangkan model regresi spline menjadi model regresi penalized spline. Model regresi penalized spline merupakan model regresi yang bergantung pada titik knot dan parameter pemulus. Penambahan parameter pemulus menjadikan fungsi regresi yang diperoleh lebih mulus yaitu fungsi regresi mendekati pola data. Penelitian model regresi penalized spline
commit to user
pernah dilakukan oleh Agustina dkk. [1]. Penelitian tersebut menggunakan data indeks harga saham gabungan.
2.2 Teori Penunjang
Pada subbab ini diberikan teori-teori dan definisi-definisi untuk mencapai tujuan penelitian yaitu stasioner data, model ARMA, asumsi eror white noise, regresi nonparametrik, regresi spline, regresi penalized spline, dan validasi model.
2.2.1 Stasioner Data
Data yang berfluktuasi di sekitar rata-rata dan memiliki variansi konstan merupakan data stasioner. Menurut Tsay [14], data stasioner merupakan syarat awal pada analisis data runtun waktu. Jika data tidak stasioner, maka dilakukan pembedaan. Uji stasioner dilakukan dengan statsitik augmented Dickey Fuller (ADF). Berikut adalah langkah-langkah uji stasioner data.
1. Hipotesis
H0: δ = 1 (data tidak stasioner).
H1: δ < 1 (data stasioner).
2. Tingkat signifikansi: α = 0.05.
3. Daerah kritis (DK): DK = {|t| | |t| > |tm(α)|}.
4. Keputusan uji: H0 ditolak jika t∈ DK.
5. Statistik uji:
t = δˆ− 1
σ(ˆδ), (2.1)
dengan ˆδ =
∑n
i=1y∗i−1y∗i
∑n
i=1yi−1∗ 2 − 1 dan σ(ˆδ) =
√∑n
i=1(y∗i−ˆδyi∗−1)2 n−1 (∑n
i=1y∗i−12).
6. Kesimpulan:
menolak atau tidak menolak H0.
commit to user
2.2.2 Model ARMA
Menurut Tsay [14], model ARMA(p, q) merupakan gabungan model autoregressive (AR) orde p dan model moving average (MA) orde q. Bentuk umum model ARMA(p, q) adalah
y∗i =
∑p r=1
ϕry∗i−r+ ai −
∑q r=1
θrai−r,
dengan yi∗ adalah data runtun waktu stasioner ke-i, ϕ adalah parameter AR, p adalah orde AR, ai adalah eror acak (white noise) ke-i, θ adalah parameter MA, dan q adalah orde MA.
Identifikasi model ARMA(p, q) dilakukan dengan melihat plot autocorrelation function (ACF ) dan plot partial autocorrelation function (PACF ) dari data run- tun waktu stasioner. Jika sampel ACF meluruh menuju nol secara eksponensial dan sampel PACF terputus setelah lag p, maka dapat dibentuk model AR(p).
Jika sampel ACF terputus setelah lag q dan sampel PACF meluruh menu- ju nol secara eksponensial, maka dapat dibentuk model MA(q). Jika sampel ACF dan PACF meluruh menuju nol secara eksponensial, maka dapat dibentuk ARMA(p, q) (Andriyanto dan Basith [2]).
Parameter dari model ARMA(p, q) yang diperoleh, selanjutnya diuji signifi- kansi. Berikut langkah-langkah uji signifikansi parameter ϕ untuk AR(p).
1. Hipotesis
H0: ϕi = 0, i = 1, 2, ..., p (parameter tidak signifikan).
H1: ϕi ̸= 0 i = 1, 2, ...p (parameter signifikan).
2. Tingkat signifikansi: α = 0.05.
3. Daerah kritis (DK): DK = {Tc||Tc| > t(α2,n−1)}.
4. Keputusan uji: H0 ditolak jika |Tc| ∈ DK.
commit to user 5. Statistik uji:
Tc= ϕˆ
se( ˆϕ), (2.2)
dengan ˆϕ adalah nilai estimasi ϕ dan se( ˆϕ) adalah standar eror dari ˆϕ.
6. Kesimpulan:
menolak atau tidak menolak H0.
Uji signifikansi parameter θ untuk MA(q) dengan i = 1, 2, .., q dapat dilakukan dengan langkah yang sama seperti uji signifikansi parameter ϕ pada AR(p).
2.2.3 Asumsi Eror White Noise
Suatu model parametrik harus memenuhi asumsi eror white noise. Uji asumsi eror white noise terdiri atas uji independensi dan uji normalitas (Tsay [14]).
1. Uji Independensi. Uji independensi dilakukan untuk mengetahui ada ti- daknya korelasi eror setiap lag pada model ARMA(p,q). Uji ini dilakukan dengan statistik uji Ljung Box. Berikut adalah langkah-langkah uji inde- pendensi.
(a) Hipotesis
H0: ρ1 = ρ2 = ... = ρl= 0 (tidak terdapat korelasi eror antar lag).
H1: paling sedikit ada satu ρj ̸= 0, j = 1, 2, .., l (paling sedikit ada satu eror lag yang berkorelasi).
(b) Tingkat signifikansi: α = 0.05.
(c) Daerah kritis (DK): DK ={Q | Q > χ2(1−α,l−s)}.
(d) Keputusan uji: H0 ditolak jika Q ∈ DK.
(e) Statistik uji:
Q = n(n + 2)
∑l j=1
ˆ ρ2j
n− j, (2.3)
dengan n adalah banyaknya data yang diamati, l adalah lag maksi- mum, ˆρj adalah estimasi korelasi eror pada lag ke j, s adalah parame- ter yang diestimasi.
commit to user (f) Kesimpulan:
menolak atau tidak menolak H0.
2. Uji Normalitas. Uji normalitas dilakukan untuk mengetahui apakah eror model ARMA(p,q) mengikuti distribusi normal. Uji normalitas dilakukan dengan statistik uji Kolmogorov-Smirnov. Berikut adalah langkah-langkah uji normalitas.
(a) Hipotesis
H0: eror model ARMA(p,q) berdistribusi normal.
H1: eror model ARMA(p,q) tidak berdistribusi normal.
(b) Tingkat signifikansi: α = 0.05.
(c) Daerah kritis (DK): DK = {Di | Di ≥ D(α,n)}.
(d) Keputusan uji: H0 ditolak jika Di ∈ DK.
(e) Statistik uji:
Di = supx[|Fn(x)− F0(x)|], (2.4) dengan x adalah eror model ARMA(p,q), Fn(x) adalah probabilitas kumulatif normal pada eror ke-1, 2, . . . , n, dan F0(x) adalah probabi- litas kumulatif empiris pada eror ke-1, 2, . . . , n.
(f) Kesimpulan:
menolak atau tidak menolak H0.
2.2.4 Model Regresi Nonparametrik
Menurut Eubank [5], model regresi nonparametrik merupakan model yang tidak memandang asumsi-asumsi tertentu. Model regresi nonparametrik bersifat fleksibel dan diasumsikan memiliki kurva yang mulus.
commit to user
Model regresi nonparametrik secara umum ditulis sebagai
yi = f (xi) + εi, i = 1, 2, ..., n (2.5) dengan
yi : nilai variabel respon pada pengamatan ke-i, xi : nilai variabel prediktor pada pengamatan ke-i,
f (xi) : fungsi regresi yang tidak diketahui pada titik x1, x2,· · · ,xn,
εi : eror yang diasumsikan berdistribusi normal independen dengan rata- rata nol dan variansi σ2.
Model ARMA(p,q) yang tidak memenuhi asumsi dapat dimodelkan dengan regresi nonparametrik. Konstruksi regresi tersebut dilakukan dengan memperha- tikan orde AR(p). Bentuk umum model regresi nonparametrik pada data runtun waktu adalah
yi∗ = f (y∗i−p) + εi, i > p dengan
yi∗ : data runtun waktu pengamatan ke-i, yi∗−p : data runtun waktu pengamatan ke-(i− p),
f (y∗i−p) : fungsi regresi yang tidak diketahui pada titik-titik (i− p), εi : eror ke-(i− p).
Fungsi regresi nonparametrik yang tidak diketahui tersebut dapat ditentu- kan menggunakan teknik pemulusan. Teknik pemulusan yang digunakan adalah penalized spline. Penalized spline merupakan teknik pemulus spline yang bergan- tung titik knot dan parameter pemulus.
2.2.5 Model Regresi Spline
Menurut Eubank [5], spline merupakan polinomial tersegmen atau terpotong- potong pada selang k dan dapat menghasilkan fungsi regresi yang sesuai dengan data. Spline memiliki kemampuan yang baik untuk menangani data yang si- fatnya berubah-ubah pada interval tertentu. Estimasi spline bergantung pada titik knot. Titik knot merupakan titik yang terdapat pada perubahan pola data.
commit to user
Fungsi spline berorde m dengan K titik knot dinyatakan sebagai f (x) =
∑m w=0
βwxwi +
∑K k=1
βm+k(xi− τk)m+, (2.6) dengan
(xi− τk)m+ =
(xi − τk)m, xi > τk 0, xi ≤ τk.
Persamaan (2.6) disubstitusikan ke persamaan (2.5) diperoleh bentuk umum mo- del regresi spline orde m dengan K titik knot yang dinyatakan sebagai
yi =
∑m w=0
βwxwi +
∑K k=1
βm+k(xi− τk)m+ + εi, (2.7) dengan
yi : variabel respon pada pengamatan ke-i, i = 1, 2, . . . , n, βw : parameter model ke-w, w = 0, 1, . . . , m,
βm+k : parameter model pada titik knot ke-k, k = 1, 2, . . . , K, xi : variabel prediktor pada pengamatan ke-i,
τk : titik knot ke-k, dan εi : eror model ke-i.
2.2.6 Model Regresi Penalized Spline
Menurut Ruppert et al. [12], regresi penalized spline merupakan salah satu bentuk regresi spline yang memiliki fleksibilitas terhadap tingkat kemulusan kur- va. Kemulusan kurva tersebut dihasilkan oleh titik knot dan parameter pemulus.
Model regresi penalized spline memiliki alternatif dalam menentukan titik knot dan banyaknya titik knot (K ). Titik knot terletak pada titik-titik kuantil dari nilai tunggal variabel prediktor dan (K ) < n−m−1, n adalah banyak data yang digunakan, m adalah orde model regresi penalized spline.
Menurut Griggs [6], penalized spline merupakan model regresi yang dapat mengoptimalkan kecocokan data dengan menambahkan bobot pada ∑K
k=1βm+k persamaan (2.7) yang disebut matriks penalti (D) dengan bentuk diagonal. Pa- rameter model regresi penalized spline diestimasi menggunakan penalized least
commit to user
square (PLS ). Fungsi PLS merupakan fungsi yang terdiri atas jumlah kuadrat eror dan penalti kekasaran. Fungsi tersebut dinyatakan sebagai
P =
∑n i=1
(yi− f(xi))2+ λ2m
∑K k=1
βm+k2 , λ≥ 0. (2.8)
Persamaan (2.8) dalam bentuk matriks dapat ditulis sebagai P = ||Y − Xβββ||2+ λ2mβββTDβββ
= (Y− Xβββ)T(Y− Xβββ) + λ2mβββTDβββ
= YTY− YTXβββ− βββTXTY + βββTXTXβββ + λ2mβββTDβββ
= YTY− 2βββTXTY + βββTXTXβββ + λ2mβββTDβββ, (2.9) dengan
Y =
y1
y2 ... yn
, X =
1 x1 . . . xm1 (x1− r1)m+ . . . (x1 − rK)m+ ... ... . .. ... ... . .. ... 1 xn . . . xmn (xn− r1)m+ . . . (xn− rK)m+
,
βββ =
β0
... βm+1
... βm+K
, D =
0(m+1)×(m+1) 0(m+1)×K 0K×(m+1) IK×K
.
Notasi-notasi pada persamaan (2.9) menyatakan
βββ : matriks parameter model berukuran (m + K + 1)× 1, X : matriks prediktor berukuran n× (m + K + 1),
Y : matriks respon berukuran n× 1, λ : parameter pemulus, dan
D : matriks penalti diagonal berukuran (m + K + 1)× (m + K + 1).
Parameter βββ pada persamaan (2.9) dapat diperoleh estimasinya dengan metode kuadrat terkecil. Prinsip metode tersebut adalah meminimumkan fungsi
commit to user
P yaitu menurunkannya secara parsial terhadap βββ dengan nilai turunannya nol.
Turunan tersebut ditulis sebagai
∂P
∂βββ = 0
∂(YTY)
∂βββ − ∂(2βββTXTY)
∂βββ + ∂(βββTXTXβββ)
∂βββ − ∂(λ2mβββTDβββ)
∂βββ = 0 0− 2XTY + 2XTXβββ + 2λ2mDβββ = 0
XTXβββ + λ2mDβββ = XTY (XTX + λ2mD)βββ = XTY,
sehingga ˆβˆβˆβ dapat ditulis sebagai
βˆβˆβˆ = (XTX + λ2mD)−1XTY. (2.10)
Untuk membuktikan bahwa fungsi P minimum dilakukan dengan membuk- tikan bahwa turunan kedua fungsi P positif. Turunan kedua dari fungsi P ditulis sebagai
∂P
∂2β = ∂
∂β(∂(YTY)
∂βββ − ∂(2βββTXTY)
∂βββ +∂(βββTXTXβββ)
∂βββ − ∂(λ2mβββTDβββ)
∂βββ )
= ∂
∂β(−2XTY + 2XTXβββ + 2λ2mDβββ)
= 2XTX + 2λ2mD (2.11)
Matriks XTX pada persamaan (2.11) merupakan matriks simetri yang elemen di- agonalnya berbentuk kuadrat. Jika matriks tersebut dijumlahkan dengan matriks simetri λ2mD, maka elemen diagonalnya positif sehingga matriks tersebut definit positif dan determinannya lebih besar nol. Hal tersebut menunjukkan fungsi P minimum.
2.2.7 Titik Knot Optimum dan Parameter Pemulus Optimum
Model regresi penalized spline terbaik diperoleh berdasarkan titik knot op- timum dan parameter pemulus (λ) optimum. Titik knot merupakan titik pada
commit to user
perubahan pola data dan λ merupakan parameter pemulus yang dapat mengon- trol keseimbangan antara kecocokan data dan kemulusan kurva (Ruppert et al.
[12]). Cao et al. [4] menjelaskan bahwa pemilihan titik knot optimum dan λ opti- mum menggunakan generalized cross validation (GCV ). Rumus GCV dinyatakan sebagai
GCV (λ) = n−1∑n
i=1(yi− ˆyi)2 (
1−tr(Snλ))2 ,
dengan n adalah banyaknya data pengamatan dan Sλ = X(XTX + λ2mD)−1XT.
2.2.8 Validasi Model
Valid tidaknya model dapat diukur dengan root mean square error (RMSE ) (Makridakis et al. [10]). Nilai RMSE menunjukkan ukuran dari akar rata-rata selisih kuadrat antara nilai aktual dan nilai estimasi data. Rumus RMSE dinya- takan sebagai
RM SE = vu ut 1
n
∑n i=1
(yi− ˆyi)2 (2.12) dengan n adalah banyaknya data validasi yang digunakan, yi adalah nilai aktual y waktu ke-i, dan ˆyi adalah nilai estimasi y waktu ke-i.
Interval nilai RMSE dari 0 sampai∞. Nilai RMSE kecil menunjukkan bah- wa variasi nilai estimasi mendekati variasi nilai aktualnya. Model yang memiliki nilai RMSE kecil menunjukkan bahwa model baik untuk digunakan.
2.3 Kerangka Pemikiran
Berdasarkan tinjauan pustaka dapat disusun suatu kerangka pemikiran untuk mencapai tujuan penelitian. Data nilai ekspor rempah-rempah merupa- kan data runtun waktu ekonomi yang dapat dimodelkan dengan ARMA. Model tersebut harus memenuhi asumsi eror white noise. Eror model ARMA sering ti- dak memenuhi asumsi white noise karena data runtun waktu ekonomi memiliki volatilitas tinggi. Model yang dapat digunakan untuk mengatasi masalah ter- sebut adalah model nonparametrik. Model ini tidak memandang semua asumsi
commit to user
seperti model parametrik. Model nonparametrik yang sering digunakan adalah regresi. Salah satu model regresi nonparametrik adalah regresi spline. Regresi spline memiliki kelemahan dalam menentukan letak titik knot dan tidak meman- dang parameter pemulus. Berdasarkan permasalahan tersebut pada penelitian ini digunakan model regresi nonparametrik lain yaitu regresi penalized spline yang diterapkan pada data nilai ekspor rempah-rempah Indonesia.