BAB II LANDASAN TEORI

(1)

commit to user

BAB II

LANDASAN TEORI

Bab ini terdiri atas tiga bagian yaitu tinjuan pustaka, teori penunjang, dan kerangka pemikiran. Tinjauan pustaka berisi penelitian-penelitian sebelum- nya yang digunakan sebagai dasar dalam penelitian ini. Teori penunjang berisi definisi-definisi dan teori-teori yang digunakan untuk mencapai tujuan penelitian.

Kerangka pemikiran merupakan alur pemikiran dalam penelitian ini.

2.1 Tinjauan Pustaka

Suatu data yang terurut berdasarkan waktu disebut data runtun waktu.

Data runtun waktu dapat diterapkan secara parametrik yaitu ARMA. Suparti [13]

menyatakan bahwa model tersebut sering memiliki eror tidak memenuhi asumsi.

Alternatif untuk mengatasi masalah tersebut adalah model nonparametrik yang tidak memandang asumsi-asumsi sebagaimana model parametrik. Model nonparametrik yang diusulkan oleh Hardle [7] adalah regresi nonparametrik. Menurut Eubank [5], regresi nonparametrik merupakan model yang digunakan pada data yang tidak diketahui bentuk fungsi regresinya. Fungsi regresi tersebut ditentukan melalui teknik pemulusan yaitu kernel dan spline.

Penelitian tentang regresi kernel dan regresi spline pernah dilakukan oleh Laome [9]. Kedua model tersebut diterapkan pada data pertumbuhan balita dan menunjukkan bahwa model regresi spline lebih baik dari model regresi kernel.

Tahun 2003, Ruppert et al. [12] mengembangkan model regresi spline menjadi model regresi penalized spline. Model regresi penalized spline merupakan model regresi yang bergantung pada titik knot dan parameter pemulus. Penambahan parameter pemulus menjadikan fungsi regresi yang diperoleh lebih mulus yaitu fungsi regresi mendekati pola data. Penelitian model regresi penalized spline

(2)

commit to user

pernah dilakukan oleh Agustina dkk. [1]. Penelitian tersebut menggunakan data indeks harga saham gabungan.

2.2 Teori Penunjang

Pada subbab ini diberikan teori-teori dan definisi-definisi untuk mencapai tujuan penelitian yaitu stasioner data, model ARMA, asumsi eror white noise, regresi nonparametrik, regresi spline, regresi penalized spline, dan validasi model.

2.2.1 Stasioner Data

Data yang berfluktuasi di sekitar rata-rata dan memiliki variansi konstan merupakan data stasioner. Menurut Tsay [14], data stasioner merupakan syarat awal pada analisis data runtun waktu. Jika data tidak stasioner, maka dilakukan pembedaan. Uji stasioner dilakukan dengan statsitik augmented Dickey Fuller (ADF). Berikut adalah langkah-langkah uji stasioner data.

1. Hipotesis

H₀: δ = 1 (data tidak stasioner).

H₁: δ < 1 (data stasioner).

2. Tingkat signifikansi: α = 0.05.

3. Daerah kritis (DK): DK = {|t| | |t| > |tm(α)|}.

4. Keputusan uji: H₀ ditolak jika t∈ DK.

5. Statistik uji:

t = δˆ− 1

σ(ˆδ), (2.1)

dengan ˆδ =

∑n

i=1y^∗_i₋₁y^∗_i

∑n

i=1y_i−1^∗ ² − 1 dan σ(ˆδ) =

√_∑_n

i=1(y^∗_i−ˆδyi^∗−1)² n−1 (∑_n

i=1y^∗_i₋₁²).

6. Kesimpulan:

menolak atau tidak menolak H₀.

(3)

commit to user

2.2.2 Model ARMA

Menurut Tsay [14], model ARMA(p, q) merupakan gabungan model autoregressive (AR) orde p dan model moving average (MA) orde q. Bentuk umum model ARMA(p, q) adalah

y^∗_i =

∑p r=1

ϕ_ry^∗_i_−r+ a_i −

∑q r=1

θ_ra_i_−r,

dengan y_i^∗ adalah data runtun waktu stasioner ke-i, ϕ adalah parameter AR, p adalah orde AR, a_i adalah eror acak (white noise) ke-i, θ adalah parameter MA, dan q adalah orde MA.

Identifikasi model ARMA(p, q) dilakukan dengan melihat plot autocorrelation function (ACF ) dan plot partial autocorrelation function (PACF ) dari data run- tun waktu stasioner. Jika sampel ACF meluruh menuju nol secara eksponensial dan sampel PACF terputus setelah lag p, maka dapat dibentuk model AR(p).

Jika sampel ACF terputus setelah lag q dan sampel PACF meluruh menu- ju nol secara eksponensial, maka dapat dibentuk model MA(q). Jika sampel ACF dan PACF meluruh menuju nol secara eksponensial, maka dapat dibentuk ARMA(p, q) (Andriyanto dan Basith [2]).

Parameter dari model ARMA(p, q) yang diperoleh, selanjutnya diuji signifi- kansi. Berikut langkah-langkah uji signifikansi parameter ϕ untuk AR(p).

1. Hipotesis

H0: ϕi = 0, i = 1, 2, ..., p (parameter tidak signifikan).

H₁: ϕ_i ̸= 0 i = 1, 2, ...p (parameter signifikan).

2. Tingkat signifikansi: α = 0.05.

3. Daerah kritis (DK): DK = {Tc||Tc| > t(^α₂,n−1)}.

4. Keputusan uji: H₀ ditolak jika |Tc| ∈ DK.

(4)

commit to user 5. Statistik uji:

Tc= ϕˆ

se( ˆϕ), (2.2)

dengan ˆϕ adalah nilai estimasi ϕ dan se( ˆϕ) adalah standar eror dari ˆϕ.

6. Kesimpulan:

Uji signifikansi parameter θ untuk MA(q) dengan i = 1, 2, .., q dapat dilakukan dengan langkah yang sama seperti uji signifikansi parameter ϕ pada AR(p).

2.2.3 Asumsi Eror White Noise

Suatu model parametrik harus memenuhi asumsi eror white noise. Uji asumsi eror white noise terdiri atas uji independensi dan uji normalitas (Tsay [14]).

1. Uji Independensi. Uji independensi dilakukan untuk mengetahui ada ti- daknya korelasi eror setiap lag pada model ARMA(p,q). Uji ini dilakukan dengan statistik uji Ljung Box. Berikut adalah langkah-langkah uji independensi.

(a) Hipotesis

H₀: ρ₁ = ρ₂ = ... = ρ_l= 0 (tidak terdapat korelasi eror antar lag).

H₁: paling sedikit ada satu ρ_j ̸= 0, j = 1, 2, .., l (paling sedikit ada satu eror lag yang berkorelasi).

(b) Tingkat signifikansi: α = 0.05.

(c) Daerah kritis (DK): DK ={Q | Q > χ²₍₁_−α,l−s)}.

(d) Keputusan uji: H₀ ditolak jika Q ∈ DK.

(e) Statistik uji:

Q = n(n + 2)

∑l j=1

ˆ ρ²_j

n− j, (2.3)

dengan n adalah banyaknya data yang diamati, l adalah lag maksi- mum, ˆρj adalah estimasi korelasi eror pada lag ke j, s adalah parame- ter yang diestimasi.

(5)

commit to user (f) Kesimpulan:

2. Uji Normalitas. Uji normalitas dilakukan untuk mengetahui apakah eror model ARMA(p,q) mengikuti distribusi normal. Uji normalitas dilakukan dengan statistik uji Kolmogorov-Smirnov. Berikut adalah langkah-langkah uji normalitas.

(a) Hipotesis

H₀: eror model ARMA(p,q) berdistribusi normal.

H₁: eror model ARMA(p,q) tidak berdistribusi normal.

(b) Tingkat signifikansi: α = 0.05.

(c) Daerah kritis (DK): DK = {Di | Di ≥ D(α,n)}.

(d) Keputusan uji: H₀ ditolak jika D_i ∈ DK.

(e) Statistik uji:

Di = supx[|Fn(x)− F0(x)|], (2.4) dengan x adalah eror model ARMA(p,q), F_n(x) adalah probabilitas kumulatif normal pada eror ke-1, 2, . . . , n, dan F₀(x) adalah probabi- litas kumulatif empiris pada eror ke-1, 2, . . . , n.

(f) Kesimpulan:

2.2.4 Model Regresi Nonparametrik

Menurut Eubank [5], model regresi nonparametrik merupakan model yang tidak memandang asumsi-asumsi tertentu. Model regresi nonparametrik bersifat fleksibel dan diasumsikan memiliki kurva yang mulus.

(6)

commit to user

Model regresi nonparametrik secara umum ditulis sebagai

y_i = f (x_i) + ε_i, i = 1, 2, ..., n (2.5) dengan

yi : nilai variabel respon pada pengamatan ke-i, x_i : nilai variabel prediktor pada pengamatan ke-i,

f (xi) : fungsi regresi yang tidak diketahui pada titik x1, x2,· · · ,xn,

ε_i : eror yang diasumsikan berdistribusi normal independen dengan rata- rata nol dan variansi σ².

Model ARMA(p,q) yang tidak memenuhi asumsi dapat dimodelkan dengan regresi nonparametrik. Konstruksi regresi tersebut dilakukan dengan memperha- tikan orde AR(p). Bentuk umum model regresi nonparametrik pada data runtun waktu adalah

y_i^∗ = f (y^∗_i_−p) + ε_i, i > p dengan

y_i^∗ : data runtun waktu pengamatan ke-i, y_i^∗_−p : data runtun waktu pengamatan ke-(i− p),

f (y^∗_i_−p) : fungsi regresi yang tidak diketahui pada titik-titik (i− p), ε_i : eror ke-(i− p).

Fungsi regresi nonparametrik yang tidak diketahui tersebut dapat ditentukan menggunakan teknik pemulusan. Teknik pemulusan yang digunakan adalah penalized spline. Penalized spline merupakan teknik pemulus spline yang bergan- tung titik knot dan parameter pemulus.

2.2.5 Model Regresi Spline

Menurut Eubank [5], spline merupakan polinomial tersegmen atau terpotong- potong pada selang k dan dapat menghasilkan fungsi regresi yang sesuai dengan data. Spline memiliki kemampuan yang baik untuk menangani data yang si- fatnya berubah-ubah pada interval tertentu. Estimasi spline bergantung pada titik knot. Titik knot merupakan titik yang terdapat pada perubahan pola data.

(7)

commit to user

Fungsi spline berorde m dengan K titik knot dinyatakan sebagai f (x) =

∑m w=0

β_wx^w_i +

∑K k=1

β_m+k(x_i− τk)^m₊, (2.6) dengan

(xi− τk)^m₊ =





(x_i − τk)^m, x_i > τ_k 0, x_i ≤ τk.

Persamaan (2.6) disubstitusikan ke persamaan (2.5) diperoleh bentuk umum mo- del regresi spline orde m dengan K titik knot yang dinyatakan sebagai

yi =

∑m w=0

βwx^w_i +

∑K k=1

βm+k(xi− τk)^m₊ + εi, (2.7) dengan

y_i : variabel respon pada pengamatan ke-i, i = 1, 2, . . . , n, βw : parameter model ke-w, w = 0, 1, . . . , m,

β_m+k : parameter model pada titik knot ke-k, k = 1, 2, . . . , K, xi : variabel prediktor pada pengamatan ke-i,

τ_k : titik knot ke-k, dan εi : eror model ke-i.

2.2.6 Model Regresi Penalized Spline

Menurut Ruppert et al. [12], regresi penalized spline merupakan salah satu bentuk regresi spline yang memiliki fleksibilitas terhadap tingkat kemulusan kur- va. Kemulusan kurva tersebut dihasilkan oleh titik knot dan parameter pemulus.

Model regresi penalized spline memiliki alternatif dalam menentukan titik knot dan banyaknya titik knot (K ). Titik knot terletak pada titik-titik kuantil dari nilai tunggal variabel prediktor dan (K ) < n−m−1, n adalah banyak data yang digunakan, m adalah orde model regresi penalized spline.

Menurut Griggs [6], penalized spline merupakan model regresi yang dapat mengoptimalkan kecocokan data dengan menambahkan bobot pada ∑K

k=1β_m+k persamaan (2.7) yang disebut matriks penalti (D) dengan bentuk diagonal. Pa- rameter model regresi penalized spline diestimasi menggunakan penalized least

(8)

commit to user

square (PLS ). Fungsi PLS merupakan fungsi yang terdiri atas jumlah kuadrat eror dan penalti kekasaran. Fungsi tersebut dinyatakan sebagai

P =

∑n i=1

(y_i− f(xi))²+ λ^2m

∑K k=1

β_m+k² , λ≥ 0. (2.8)

Persamaan (2.8) dalam bentuk matriks dapat ditulis sebagai P = ||Y − Xβββ||²+ λ^2mβββ^TDβββ

= (Y− Xβββ)^T(Y− Xβββ) + λ^2mβββ^TDβββ

= Y^TY− Y^TXβββ− βββ^TX^TY + βββ^TX^TXβββ + λ^2mβββ^TDβββ

= Y^TY− 2βββ^TX^TY + βββ^TX^TXβββ + λ^2mβββ^TDβββ, (2.9) dengan

Y =





 y1

y₂ ... y_n





 , X =







1 x₁ . . . x^m₁ (x₁− r1)^m₊ . . . (x₁ − rK)^m₊ ... ... . .. ... ... . .. ... 1 x_n . . . x^m_n (x_n− r1)^m₊ . . . (x_n− rK)^m₊





,

βββ =





 β₀

... β_m+1

... β_m+K







, D =



 0_(m+1)_×(m+1) 0_(m+1)_×K 0_K_×(m+1) I_K_×K



 .

Notasi-notasi pada persamaan (2.9) menyatakan

βββ : matriks parameter model berukuran (m + K + 1)× 1, X : matriks prediktor berukuran n× (m + K + 1),

Y : matriks respon berukuran n× 1, λ : parameter pemulus, dan

D : matriks penalti diagonal berukuran (m + K + 1)× (m + K + 1).

Parameter βββ pada persamaan (2.9) dapat diperoleh estimasinya dengan metode kuadrat terkecil. Prinsip metode tersebut adalah meminimumkan fungsi

(9)

commit to user

P yaitu menurunkannya secara parsial terhadap βββ dengan nilai turunannya nol.

Turunan tersebut ditulis sebagai

∂P

∂βββ = 0

∂(Y^TY)

∂βββ − ∂(2βββ^TX^TY)

∂βββ + ∂(βββ^TX^TXβββ)

∂βββ − ∂(λ^2mβββ^TDβββ)

∂βββ = 0 0− 2X^TY + 2X^TXβββ + 2λ^2mDβββ = 0

X^TXβββ + λ^2mDβββ = X^TY (X^TX + λ^2mD)βββ = X^TY,

sehingga ˆβˆβˆβ dapat ditulis sebagai

βˆβˆβˆ = (X^TX + λ^2mD)⁻¹X^TY. (2.10)

Untuk membuktikan bahwa fungsi P minimum dilakukan dengan membuk- tikan bahwa turunan kedua fungsi P positif. Turunan kedua dari fungsi P ditulis sebagai

∂P

∂²β = ∂

∂β(∂(Y^TY)

∂βββ − ∂(2βββ^TX^TY)

∂βββ +∂(βββ^TX^TXβββ)

∂βββ − ∂(λ^2mβββ^TDβββ)

∂βββ )

= ∂

∂β(−2X^TY + 2X^TXβββ + 2λ^2mDβββ)

= 2X^TX + 2λ^2mD (2.11)

Matriks X^TX pada persamaan (2.11) merupakan matriks simetri yang elemen diagonalnya berbentuk kuadrat. Jika matriks tersebut dijumlahkan dengan matriks simetri λ^2mD, maka elemen diagonalnya positif sehingga matriks tersebut definit positif dan determinannya lebih besar nol. Hal tersebut menunjukkan fungsi P minimum.

2.2.7 Titik Knot Optimum dan Parameter Pemulus Optimum

Model regresi penalized spline terbaik diperoleh berdasarkan titik knot op- timum dan parameter pemulus (λ) optimum. Titik knot merupakan titik pada

(10)

commit to user

perubahan pola data dan λ merupakan parameter pemulus yang dapat mengon- trol keseimbangan antara kecocokan data dan kemulusan kurva (Ruppert et al.

[12]). Cao et al. [4] menjelaskan bahwa pemilihan titik knot optimum dan λ opti- mum menggunakan generalized cross validation (GCV ). Rumus GCV dinyatakan sebagai

GCV (λ) = n⁻¹∑n

i=1(yi− ˆyi)² (

1−^tr(S_n^λ⁾)2 ,

dengan n adalah banyaknya data pengamatan dan S_λ = X(X^TX + λ^2mD)⁻¹X^T.

2.2.8 Validasi Model

Valid tidaknya model dapat diukur dengan root mean square error (RMSE ) (Makridakis et al. [10]). Nilai RMSE menunjukkan ukuran dari akar rata-rata selisih kuadrat antara nilai aktual dan nilai estimasi data. Rumus RMSE dinya- takan sebagai

RM SE = vu ut 1

n

∑n i=1

(y_i− ˆyi)² (2.12) dengan n adalah banyaknya data validasi yang digunakan, y_i adalah nilai aktual y waktu ke-i, dan ˆy_i adalah nilai estimasi y waktu ke-i.

Interval nilai RMSE dari 0 sampai∞. Nilai RMSE kecil menunjukkan bah- wa variasi nilai estimasi mendekati variasi nilai aktualnya. Model yang memiliki nilai RMSE kecil menunjukkan bahwa model baik untuk digunakan.

2.3 Kerangka Pemikiran

Berdasarkan tinjauan pustaka dapat disusun suatu kerangka pemikiran untuk mencapai tujuan penelitian. Data nilai ekspor rempah-rempah merupa- kan data runtun waktu ekonomi yang dapat dimodelkan dengan ARMA. Model tersebut harus memenuhi asumsi eror white noise. Eror model ARMA sering ti- dak memenuhi asumsi white noise karena data runtun waktu ekonomi memiliki volatilitas tinggi. Model yang dapat digunakan untuk mengatasi masalah tersebut adalah model nonparametrik. Model ini tidak memandang semua asumsi

(11)

commit to user

seperti model parametrik. Model nonparametrik yang sering digunakan adalah regresi. Salah satu model regresi nonparametrik adalah regresi spline. Regresi spline memiliki kelemahan dalam menentukan letak titik knot dan tidak meman- dang parameter pemulus. Berdasarkan permasalahan tersebut pada penelitian ini digunakan model regresi nonparametrik lain yaitu regresi penalized spline yang diterapkan pada data nilai ekspor rempah-rempah Indonesia.