BAB II LANDASAN TEORI

(1)

BAB II

LANDASAN TEORI

Pada bagian pertama bab ini diberikan tinjauan pustaka yang berisi pe-nelitian sebelumnya yang mendasari pepe-nelitian ini. Pada bagian kedua bab ini diberikan teori penunjang yang berisi deﬁnisi-deﬁnisi sebagai dasar pengertian untuk memperoleh pembahasaan selanjutnya. Pada bagian ketiga dari bab ini disusun kerangka pemikiran yang menjelaskan alur pemikiran penulisan skripsi.

2.1 Tinjauan Pustaka

Regresi nonparametrik merupakan regresi yang diterapkan pada data de-ngan kurva fungsi regresinya tidak memiliki pola tertentu. Hardle [5] menyatakan bahwa pendekatan nonparametrik untuk mengestimasi kurva regresi mempunyai tujuan, yaitu memberikan metode yang baik untuk mengetahui hubungan di an-tara variabel prediktor dengan variabel respon dan memberikan model dari suatu pengamatan sehingga menghasilkan perkiraan yang tepat.

Dalam regresi nonparametrik terdapat metode yang digunakan untuk me-ngetahui pola dari kurva regresi yang tidak diketahui dan tidak terikat asumsi distribusi tertentu. Salah satu metode yang memiliki interpretasi statistik dan vi-sual yang baik adalah spline. Eubank [3] menyatakan bahwa penggunaan regresi

spline menjadikan data mudah terestimasi. Selain itu, Wahba [13] dan Budianta-ra [1] pernah membahas penghalusanspline dalam regresi nonparametrik. Elfrida dan Budiantara [2] menggunakan regresi nonparametrik spline untuk pemodelan laju pertumbuhan ekonomi di Jawa Timur.

(2)

2.2 Teori-teori Penunjang

Pada bagian ini dijelaskan deﬁnisi dan teori yang menunjang dalam men-capai tujuan penelitian. Selanjutnya diberikan gambaran tentang regresi, regresi nonparametrik, regresi nonparametrik spline, pemilihan titik knot, pendugaan parameter, pengujian parameter, pengujian asumsi sisaan, dan koeﬁsien determi-nasi.

2.2.1 Regresi

Regresi merupakan suatu metode statistika yang digunakan untuk me-ngetahui hubungan antara variabel prediktor dan variabel respon. Hubungan linier antara variabel prediktor dan variabel respon dapat dinyatakan sebagai:

y=m(xi) +εi, i= 1,2, . . . , n

dengan εi adalah sisaan yang diasumsikan independen dengan mean nol dan

variansi σ2_{, serta}_m(x

i) adalah fungsi regresi atau kurva regresi.

Pendekatan yang digunakan untuk mengestimasi fungsi regresi ada dua je-nis yaitu pendekatan model regresi parametrik dan regresi nonparametrik. Pen-dekatan regresi parametrik digunakan apabila fungsi m(x) telah diketahui dari informasi sebelumnya atau berdasarkan teori. Sedangkan pendekatan model re-gresi nonparametrik dilakukan berdasarkan pendekatan yang tidak terikat dengan asumsi bentuk kurva regresi tertentu, yang memberikan ﬂeksibilitas besar dalam bentuk yang mungkin dari kurva regresi atau fungsi regresi m(x).

2.2.2 Regresi Nonparametrik

Eubank [3] menyatakan bahwa regresi nonparametrik merupakan pende-katan untuk pola data yang tidak diketahui bentuk kurva regresinya atau tidak terdapat informasi distribusi mengenai bentuk pola data. Hardle [5] menyebutkan bahwa pendekatan nonparametrik untuk mengestimasi kurva regresi mempunyai tujuan diantaranya memberikan metode yang baik untuk mengetahui hubung-an hubung-antara dua variabel dhubung-an memberikhubung-an model dari suatu pengamathubung-an sehingga

(3)

menghasilkan prediksi yang tepat. Eubank [3] menyatakan bahwa model regresi nonparametrik secara umum adalah

yi =f(xi) +εi, i= 1,2, . . . , n (2.1)

dengan yi adalah variabel respon, f(xi) adalah nilai dari fungsi f yang tidak

diketahui pada titik x1, x2, . . . , xn, xi adalah variabel prediktor, i = 1,2, . . . , n,

εi adalah sisaan yang diasumsikan berdistribusi normal independen denganmean

nol dan variansiσ2_.

Estimasi fungsi regresi nonparametrik dilakukan berdasarkan data penga-matan dengan menggunakan beberapa metode. Metode dalam regresi nonpa-rametrik, yaitu kernel, k-nearest neighbor, deret ortogonal, dan spline (Hardle [5]).

2.2.3 Regresi Nonparametrik

Spline

Metode penghalusanspline merupakan metode yang paling banyak diguna-kan pada regresi nonparametrik (Lee [7]). Spline merupakan bentuk kurva yang terpotong-potong sehingga mampu mengatasi perubahan pola data pada sub in-terval tertentu. Pada metode spline digunakan bantuan titik-titik knot. Titik knot merupakan titik dimana terjadi pola perubahan perilaku dari suatu fungsi pada selang yang berbeda (Hardle [5]). Eubank [3] menyatakan bahwa dengan regresi nonparametrik spline estimasi parameter model dapat diperoleh dengan baik. Selain itu, spline juga memiliki kemampuan yang baik untuk menanga-ni data yang perilakunya berubah-ubah pada sub-sub interval tertentu. Bentuk umum regresi nonparametrikspline berorde m dinyatakan sebagai

y= m ∑ p=0 βpx p i + r ∑ l=1 βl+m(xi−Kl)m+ +εi (2.2) dengan (xi−Kl)m+ ={ (xi−Kl)m, xi≥Kl 0, xi<Kl ,

βp adalah parameter model, p = 0, . . . , m, βl+m adalah parameter pada

(4)

m = 1,2,3, Kl adalah titik-titik knot, l = 1,2, . . . , r, xi adalah variabel

pre-diktor, i = 1,2, . . . , n, εi adalah sisaan yang diasumsikan berdistribusi normal

mean nol dan variansiσ2.

Jika data pengamatan sejumlahn maka Persamaan (2.2) dapat dinyatakan dalam bentuk matriks sebagai

              y1 y2 y3 y4 .. . yn               =            1 x1₁ . . . xm₁ (x1−k1)m+ . . . (x1−kl)m+ 1 x12 . . . xm2 (x2−k1)m+ . . . (x2−kl)m+ 1 x1 3 . . . xm3 (x3−k1)m+ . . . (x3−kl)m+ .. . ... ... ... ... ... ... 1 x1 n . . . xmn (xn−k1)m+ . . . (xn−kl)m+                          β0 .. . βm βm+l .. . β(m+r)               +               ε1 ε2 ε3 ε4 .. . εn               . (2.3) Matriks dalam Persamaan (2.3) dapat disederhanakan menjadi

Y =XKβ+ε (2.4)

dengan matriks Y berukuran n× 1, matriks X berukuran n×(1 + m+mr), matriks β berukuran (1 +m+mr)×1, dan matriks ε berukuran n×1.

2.3 Estimasi Parameter

Eubank [3] menyatakan bahwa estimasi parameter pada regresi nonpara-metrik spline menggunakan metode kuadrat terkecil (MKT), yaitu dengan me-minimumkan jumlah kuadrat sisaan. Langkah awal estimasi yaitu dibentuk per-samaan sisaan dari Perper-samaan (2.4).

ε =Y −XKβ (2.5) ε′ε = (y−XKβ) ′ (y−XKβ) (2.6) = y′y−y′XKβ−(y ′ XKβ) ′ +β′X_K′ XKβ

Karenay′XKβmerupakan suatu skalar, maka identik dengantranspose-nya

yaitu (y′XKβ)

′

sehingga dapat ditulis y′XKβ = (y

′

XKβ)

′

(5)

menjadi:

ε′ε = y′y−2(y′XKβ)

′

+β′X_K′ XKβ (2.7)

= y′y−2β′X_K′ y+β′X_K′ XKβ

Untuk mendapatkan estimator dariβ yang meminimumkan jumlah kuadrat sisa-an maka ε′ε diturunkan terhadapβ.

∂(ε′ε) ∂β′ = ∂(y′y−2β′X_K′ y+β′X_K′ XKβ) ∂β′ = ∂(y ′ y) ∂β′ −2 ∂(β′X_K′ y) ∂β′ + ∂(β′X_K′ XKβ) ∂β′ = −2X_K′ y+ 2X_K′ XKβ ∂(ε′ε) ∂β = 0 maka −2X ′ Ky+ 2X ′ KXKβ = 0 X_K′ XKβ = X ′ Ky (X_K′ XK)−1X ′ KXKβ = (X ′ KXK)−1X ′ Ky Iβ = (X_K′ XK)−1X ′ Ky β = (X_K′ XK)−1X ′ Ky

Untuk menunjukkan bahwa ε′ε minimum, maka dicari turunan kedua dari ε′ε dan nilainya harus positif.

∂(ε′ε) ∂2_β′ = ∂ ∂β′( ∂(y′y)−2β′X_K′ y+β′X_K′ XKβ ∂β′ ) = ∂ ∂β′(−2X ′ Ky+ 2X ′ KXKβ) = 2X_K′ XK

Matriks 2X_K′ XK merupakan matriks deﬁnit positif sehingga determinannya>0.

Terbukti bahwa ˆβ = (X_K′ XK)−1X

′

Ky meminimumkan jumlah kuadrat sisaan.

2.4 Titik Knot Optimal

Estimator spline terbaik diperoleh dengan menggunakan titik knot opti-mal. Titik knot merupakan titik yang terdapat pada perubahan pola perilaku

(6)

fungsi. Wahba [13] menjelaskan bahwa metode yang digunakan untuk memilih titik knot optimal dengan metode generalized cross validation (GCV). Rumus

GCV dinyatakan sebagai

GCV(K1, K2, . . . , Kl) =

M SE(K1, K2, . . . , Kl)

(_n1tr[I−A(K1, K2, . . . , Kl)])2

(2.8)

dengan K1, K2, . . . , Kl merupakan titik knot dan matriks A(K1, K2, . . . , Kl)

di-peroleh dari rumusXK(XKTXK)−1XKT danmean squared error (MSE) merupakan

rata-rata sisaan yang dikuadratkan. RumusMSE diberikan sebagai

M SE(K1, K2, . . . , Kl) = 1 n n ∑ i=1 (yi−yˆi))2.

2.5 Pengujian Parameter

Pengujian parameter dilakukan untuk menentukan variabel prediktor yang memiliki pengaruh terhadap variabel respon. Mengacu pada Sembiring [11], ter-dapat dua tahap pengujian parameter.

1. Uji Serentak

Pengujian ini bertujuan untuk mengetahui apakah parameter model regresi telah signiﬁkan atau tidak. Hipotesis untuk pengujian parameter secara serentak adalah

H0: β1 = β2 = . . .= βp = 0

H1 : Minimal ada satu βk ̸=0, k= 1,2, . . . , p.

Statistik uji yang digunakan dalam pengujian ini adalah uji F yang dapat dinyatakan sebagai Fhitung = ∑n i=1(ˆyi −y)¯2/k (yi−yˆi)2/(n−k−1) (2.9) Daerah penolakan yaitu menolak H0 jika Fhitung lebih besar daripada

-Ftabel(F(α;(k,n−k−1))).

2. Uji Individu

(7)

masing-masing parameter signiﬁkan atau tidak. Uji hipotesis untuk pengu-jian parameter secara individu dapat dinyatakan sebagai

H0: βk = 0

H1 : βk ̸= 0, k= 1,2, . . . , p.

Statistik uji yang digunakan dalam pengujian individu adalah uji t

thitung = ˆ βk se( ˆβk) (2.10) dengan se( ˆβk) = √ _∑ (x−xi)2 n−1. (2.11)

Daerah penolakan yaituH0ditolak jika|thitung|lebih besar daripadattabel(tα

2,n−k)

2.6 Uji Asumsi Sisaan

Pengujian asumsi sisaan berkaitan dengan kebaikan model regresi. Menurut Budiantara [1] model regresi yang melanggar asumsi sisaan tidak disarankan di-pakai untuk menggambarkan pola hubungan antara variabel respon dan variabel prediktor. Asumsi sisaan yang digunakan, yaitu heteroskedastisitas, autokorelasi, dan kenormalan.

1. Uji Heteroskedastisitas

Pengujian asumsi heteroskedastisitas pada sisaan digunakan untuk melihat homogenitas variansi sisaan. Untuk mendeteksi adanya heteroskedastisitas digunakan uji Glejser. Sari [10] menjelaskan bahwa hipotesis yang diguna-kan adalah

H0: sisaan tidak terdapat heteroskedastisitas

H1: sisaan terdapat heteroskedastisitas.

Pada uji heteroskedastisitas statistik uji yang digunakan adalah

Fhitung = ∑n i=1(|eˆi| − |¯e|) 2_/(k₋₁₎ ∑n i=1(|ei| − |eˆi|)2/(n−k) (2.12) Daerah penolakan yaituH0ditolak jikaFhitung > Ftabel(Fα;(k−1,n−k)), dengan

(8)

2. Uji Autokorelasi

Pengujian asumsi ini digunakan untuk mengetahui apakah terdapat korelasi antar sisaan. Mengacu pada Sembiring [11], uji yang digunakan adalah uji Durbin Watson dengan hipotesisnya adalah

H0 : sisaan independen

H1 : sisaan tidak independen.

Statistik uji yang digunakan dapat dinyatakan sebagai dhitung = ∑n i=2_∑(ei−ei−1)2 n i=1e 2 i (2.13) Daerah penolakan yaitu H0 ditolak jika dhitung ≤ dU.α

2, dengan dU adalah

batas atas pada tabel DW. 3. Uji Kenormalan

Pengujian ini dilakukan untuk mengetahui apakah sisaan berdistribusi nor-mal atau tidak. Uji ini dilakukan dengan menggunakan uji Lilliefors (Guja-rati [4]). Hipotesis yang digunakan untuk uji kenormalan dari sisaan adalah H0 : sisaan berdistribusi normal

H1 : sisaan tidak berdistribusi normal.

Statistik uji untuk mengetahui kenormalan dari sisaan adalah

T =maks|F(zi)−S(zi)| (2.14)

dengan F(zi) merupakan peluang kumulatif normal dan S(zi) merupakan

proporsi cacah Z ≤ zi terhadap seluruh cacah zi. Daerah kritisnya

yai-tu t|t > tα,n dengan n adalah ukuran sampel sehingga keputusannya akan

menolak H0 jika t terletak di daerah kritis.

2.7 Koefisien Determinasi (

R

2

)

Koeﬁsien determinasi bertujuan untuk mengetahui dan mengukur proporsi keragaman total dari nilai observasiY di sekitar rataannya yang diterangkan oleh garis regresinya. Koeﬁsien determinasi dirumuskan sebagai

R2 = ∑n i=1(ˆyi−y)¯ 2 ∑n i=1(yi−y)¯ 2 .

(9)

Sembiring [11] menjelaskan bahwa nilai R2 berada di antara 0 dan 1. Apa-bila mendekati 1 maka model regresi nonparametrik spline yang terbentuk baik, tetapi apabila mendekati 0 maka model yang terbentuk kurang sesuai dan kurang baik untuk digunakan.

2.8 Kerangka Pemikiran

Berdasarkan tinjauan pustaka dapat disusun kerangka pemikiran sebagai berikut. Data produksi jagung di Jawa Tengah yang diperoleh dari Dinas Per-tanian, Tanaman Pangan, dan Holtikultura Jawa Tengah memiliki pola yang fluktuatif. Hal ini disebabkan karena adanya pengaruh dari berbagai faktor. Faktor-faktor yang mempengaruhi produksi jagung sebagian tidak memiliki po-la tertentu, sehingga untuk memprediksi didekati dengan menggunakan metode nonparametrik. Salah satu metode dalam regresi nonparametrik adalah estima-tor spline. Penelitian ini menggunakan regresi nonparametrikspline yang memi-liki sifat fleksibel sehingga dapat memodelkan produksi jagung dan mengetahui faktor-faktor signifikan yang mempengaruhi produksi jagung.