BAB II
LANDASAN TEORI
Pada bagian pertama bab ini diberikan tinjauan pustaka yang berisi pe-nelitian sebelumnya yang mendasari pepe-nelitian ini. Pada bagian kedua bab ini diberikan teori penunjang yang berisi definisi-definisi sebagai dasar pengertian untuk memperoleh pembahasaan selanjutnya. Pada bagian ketiga dari bab ini disusun kerangka pemikiran yang menjelaskan alur pemikiran penulisan skripsi.
2.1
Tinjauan Pustaka
Regresi nonparametrik merupakan regresi yang diterapkan pada data de-ngan kurva fungsi regresinya tidak memiliki pola tertentu. Hardle [5] menyatakan bahwa pendekatan nonparametrik untuk mengestimasi kurva regresi mempunyai tujuan, yaitu memberikan metode yang baik untuk mengetahui hubungan di an-tara variabel prediktor dengan variabel respon dan memberikan model dari suatu pengamatan sehingga menghasilkan perkiraan yang tepat.
Dalam regresi nonparametrik terdapat metode yang digunakan untuk me-ngetahui pola dari kurva regresi yang tidak diketahui dan tidak terikat asumsi distribusi tertentu. Salah satu metode yang memiliki interpretasi statistik dan vi-sual yang baik adalah spline. Eubank [3] menyatakan bahwa penggunaan regresi
spline menjadikan data mudah terestimasi. Selain itu, Wahba [13] dan Budianta-ra [1] pernah membahas penghalusanspline dalam regresi nonparametrik. Elfrida dan Budiantara [2] menggunakan regresi nonparametrik spline untuk pemodelan laju pertumbuhan ekonomi di Jawa Timur.
2.2
Teori-teori Penunjang
Pada bagian ini dijelaskan definisi dan teori yang menunjang dalam men-capai tujuan penelitian. Selanjutnya diberikan gambaran tentang regresi, regresi nonparametrik, regresi nonparametrik spline, pemilihan titik knot, pendugaan parameter, pengujian parameter, pengujian asumsi sisaan, dan koefisien determi-nasi.
2.2.1
Regresi
Regresi merupakan suatu metode statistika yang digunakan untuk me-ngetahui hubungan antara variabel prediktor dan variabel respon. Hubungan linier antara variabel prediktor dan variabel respon dapat dinyatakan sebagai:
y=m(xi) +εi, i= 1,2, . . . , n
dengan εi adalah sisaan yang diasumsikan independen dengan mean nol dan
variansi σ2, sertam(x
i) adalah fungsi regresi atau kurva regresi.
Pendekatan yang digunakan untuk mengestimasi fungsi regresi ada dua je-nis yaitu pendekatan model regresi parametrik dan regresi nonparametrik. Pen-dekatan regresi parametrik digunakan apabila fungsi m(x) telah diketahui dari informasi sebelumnya atau berdasarkan teori. Sedangkan pendekatan model re-gresi nonparametrik dilakukan berdasarkan pendekatan yang tidak terikat dengan asumsi bentuk kurva regresi tertentu, yang memberikan fleksibilitas besar dalam bentuk yang mungkin dari kurva regresi atau fungsi regresi m(x).
2.2.2
Regresi Nonparametrik
Eubank [3] menyatakan bahwa regresi nonparametrik merupakan pende-katan untuk pola data yang tidak diketahui bentuk kurva regresinya atau tidak terdapat informasi distribusi mengenai bentuk pola data. Hardle [5] menyebutkan bahwa pendekatan nonparametrik untuk mengestimasi kurva regresi mempunyai tujuan diantaranya memberikan metode yang baik untuk mengetahui hubung-an hubung-antara dua variabel dhubung-an memberikhubung-an model dari suatu pengamathubung-an sehingga
menghasilkan prediksi yang tepat. Eubank [3] menyatakan bahwa model regresi nonparametrik secara umum adalah
yi =f(xi) +εi, i= 1,2, . . . , n (2.1)
dengan yi adalah variabel respon, f(xi) adalah nilai dari fungsi f yang tidak
diketahui pada titik x1, x2, . . . , xn, xi adalah variabel prediktor, i = 1,2, . . . , n,
εi adalah sisaan yang diasumsikan berdistribusi normal independen denganmean
nol dan variansiσ2.
Estimasi fungsi regresi nonparametrik dilakukan berdasarkan data penga-matan dengan menggunakan beberapa metode. Metode dalam regresi nonpa-rametrik, yaitu kernel, k-nearest neighbor, deret ortogonal, dan spline (Hardle [5]).
2.2.3
Regresi Nonparametrik
Spline
Metode penghalusanspline merupakan metode yang paling banyak diguna-kan pada regresi nonparametrik (Lee [7]). Spline merupakan bentuk kurva yang terpotong-potong sehingga mampu mengatasi perubahan pola data pada sub in-terval tertentu. Pada metode spline digunakan bantuan titik-titik knot. Titik knot merupakan titik dimana terjadi pola perubahan perilaku dari suatu fungsi pada selang yang berbeda (Hardle [5]). Eubank [3] menyatakan bahwa dengan regresi nonparametrik spline estimasi parameter model dapat diperoleh dengan baik. Selain itu, spline juga memiliki kemampuan yang baik untuk menanga-ni data yang perilakunya berubah-ubah pada sub-sub interval tertentu. Bentuk umum regresi nonparametrikspline berorde m dinyatakan sebagai
y= m ∑ p=0 βpx p i + r ∑ l=1 βl+m(xi−Kl)m+ +εi (2.2) dengan (xi−Kl)m+ ={ (xi−Kl)m, xi≥Kl 0, xi<Kl ,
βp adalah parameter model, p = 0, . . . , m, βl+m adalah parameter pada
m = 1,2,3, Kl adalah titik-titik knot, l = 1,2, . . . , r, xi adalah variabel
pre-diktor, i = 1,2, . . . , n, εi adalah sisaan yang diasumsikan berdistribusi normal
mean nol dan variansiσ2.
Jika data pengamatan sejumlahn maka Persamaan (2.2) dapat dinyatakan dalam bentuk matriks sebagai
y1 y2 y3 y4 .. . yn = 1 x11 . . . xm1 (x1−k1)m+ . . . (x1−kl)m+ 1 x12 . . . xm2 (x2−k1)m+ . . . (x2−kl)m+ 1 x1 3 . . . xm3 (x3−k1)m+ . . . (x3−kl)m+ .. . ... ... ... ... ... ... 1 x1 n . . . xmn (xn−k1)m+ . . . (xn−kl)m+ β0 .. . βm βm+l .. . β(m+r) + ε1 ε2 ε3 ε4 .. . εn . (2.3) Matriks dalam Persamaan (2.3) dapat disederhanakan menjadi
Y =XKβ+ε (2.4)
dengan matriks Y berukuran n× 1, matriks X berukuran n×(1 + m+mr), matriks β berukuran (1 +m+mr)×1, dan matriks ε berukuran n×1.
2.3
Estimasi Parameter
Eubank [3] menyatakan bahwa estimasi parameter pada regresi nonpara-metrik spline menggunakan metode kuadrat terkecil (MKT), yaitu dengan me-minimumkan jumlah kuadrat sisaan. Langkah awal estimasi yaitu dibentuk per-samaan sisaan dari Perper-samaan (2.4).
ε =Y −XKβ (2.5) ε′ε = (y−XKβ) ′ (y−XKβ) (2.6) = y′y−y′XKβ−(y ′ XKβ) ′ +β′XK′ XKβ
Karenay′XKβmerupakan suatu skalar, maka identik dengantranspose-nya
yaitu (y′XKβ)
′
sehingga dapat ditulis y′XKβ = (y
′
XKβ)
′
menjadi:
ε′ε = y′y−2(y′XKβ)
′
+β′XK′ XKβ (2.7)
= y′y−2β′XK′ y+β′XK′ XKβ
Untuk mendapatkan estimator dariβ yang meminimumkan jumlah kuadrat sisa-an maka ε′ε diturunkan terhadapβ.
∂(ε′ε) ∂β′ = ∂(y′y−2β′XK′ y+β′XK′ XKβ) ∂β′ = ∂(y ′ y) ∂β′ −2 ∂(β′XK′ y) ∂β′ + ∂(β′XK′ XKβ) ∂β′ = −2XK′ y+ 2XK′ XKβ ∂(ε′ε) ∂β = 0 maka −2X ′ Ky+ 2X ′ KXKβ = 0 XK′ XKβ = X ′ Ky (XK′ XK)−1X ′ KXKβ = (X ′ KXK)−1X ′ Ky Iβ = (XK′ XK)−1X ′ Ky β = (XK′ XK)−1X ′ Ky
Untuk menunjukkan bahwa ε′ε minimum, maka dicari turunan kedua dari ε′ε dan nilainya harus positif.
∂(ε′ε) ∂2β′ = ∂ ∂β′( ∂(y′y)−2β′XK′ y+β′XK′ XKβ ∂β′ ) = ∂ ∂β′(−2X ′ Ky+ 2X ′ KXKβ) = 2XK′ XK
Matriks 2XK′ XK merupakan matriks definit positif sehingga determinannya>0.
Terbukti bahwa ˆβ = (XK′ XK)−1X
′
Ky meminimumkan jumlah kuadrat sisaan.
2.4
Titik Knot Optimal
Estimator spline terbaik diperoleh dengan menggunakan titik knot opti-mal. Titik knot merupakan titik yang terdapat pada perubahan pola perilaku
fungsi. Wahba [13] menjelaskan bahwa metode yang digunakan untuk memilih titik knot optimal dengan metode generalized cross validation (GCV). Rumus
GCV dinyatakan sebagai
GCV(K1, K2, . . . , Kl) =
M SE(K1, K2, . . . , Kl)
(n1tr[I−A(K1, K2, . . . , Kl)])2
(2.8)
dengan K1, K2, . . . , Kl merupakan titik knot dan matriks A(K1, K2, . . . , Kl)
di-peroleh dari rumusXK(XKTXK)−1XKT danmean squared error (MSE) merupakan
rata-rata sisaan yang dikuadratkan. RumusMSE diberikan sebagai
M SE(K1, K2, . . . , Kl) = 1 n n ∑ i=1 (yi−yˆi))2.
2.5
Pengujian Parameter
Pengujian parameter dilakukan untuk menentukan variabel prediktor yang memiliki pengaruh terhadap variabel respon. Mengacu pada Sembiring [11], ter-dapat dua tahap pengujian parameter.
1. Uji Serentak
Pengujian ini bertujuan untuk mengetahui apakah parameter model regresi telah signifikan atau tidak. Hipotesis untuk pengujian parameter secara serentak adalah
H0: β1 = β2 = . . .= βp = 0
H1 : Minimal ada satu βk ̸=0, k= 1,2, . . . , p.
Statistik uji yang digunakan dalam pengujian ini adalah uji F yang dapat dinyatakan sebagai Fhitung = ∑n i=1(ˆyi −y)¯2/k (yi−yˆi)2/(n−k−1) (2.9) Daerah penolakan yaitu menolak H0 jika Fhitung lebih besar daripada
-Ftabel(F(α;(k,n−k−1))).
2. Uji Individu
masing-masing parameter signifikan atau tidak. Uji hipotesis untuk pengu-jian parameter secara individu dapat dinyatakan sebagai
H0: βk = 0
H1 : βk ̸= 0, k= 1,2, . . . , p.
Statistik uji yang digunakan dalam pengujian individu adalah uji t
thitung = ˆ βk se( ˆβk) (2.10) dengan se( ˆβk) = √ ∑ (x−xi)2 n−1. (2.11)
Daerah penolakan yaituH0ditolak jika|thitung|lebih besar daripadattabel(tα
2,n−k)
2.6
Uji Asumsi Sisaan
Pengujian asumsi sisaan berkaitan dengan kebaikan model regresi. Menurut Budiantara [1] model regresi yang melanggar asumsi sisaan tidak disarankan di-pakai untuk menggambarkan pola hubungan antara variabel respon dan variabel prediktor. Asumsi sisaan yang digunakan, yaitu heteroskedastisitas, autokorelasi, dan kenormalan.
1. Uji Heteroskedastisitas
Pengujian asumsi heteroskedastisitas pada sisaan digunakan untuk melihat homogenitas variansi sisaan. Untuk mendeteksi adanya heteroskedastisitas digunakan uji Glejser. Sari [10] menjelaskan bahwa hipotesis yang diguna-kan adalah
H0: sisaan tidak terdapat heteroskedastisitas
H1: sisaan terdapat heteroskedastisitas.
Pada uji heteroskedastisitas statistik uji yang digunakan adalah
Fhitung = ∑n i=1(|eˆi| − |¯e|) 2/(k−1) ∑n i=1(|ei| − |eˆi|)2/(n−k) (2.12) Daerah penolakan yaituH0ditolak jikaFhitung > Ftabel(Fα;(k−1,n−k)), dengan
2. Uji Autokorelasi
Pengujian asumsi ini digunakan untuk mengetahui apakah terdapat korelasi antar sisaan. Mengacu pada Sembiring [11], uji yang digunakan adalah uji Durbin Watson dengan hipotesisnya adalah
H0 : sisaan independen
H1 : sisaan tidak independen.
Statistik uji yang digunakan dapat dinyatakan sebagai dhitung = ∑n i=2∑(ei−ei−1)2 n i=1e 2 i (2.13) Daerah penolakan yaitu H0 ditolak jika dhitung ≤ dU.α
2, dengan dU adalah
batas atas pada tabel DW. 3. Uji Kenormalan
Pengujian ini dilakukan untuk mengetahui apakah sisaan berdistribusi nor-mal atau tidak. Uji ini dilakukan dengan menggunakan uji Lilliefors (Guja-rati [4]). Hipotesis yang digunakan untuk uji kenormalan dari sisaan adalah H0 : sisaan berdistribusi normal
H1 : sisaan tidak berdistribusi normal.
Statistik uji untuk mengetahui kenormalan dari sisaan adalah
T =maks|F(zi)−S(zi)| (2.14)
dengan F(zi) merupakan peluang kumulatif normal dan S(zi) merupakan
proporsi cacah Z ≤ zi terhadap seluruh cacah zi. Daerah kritisnya
yai-tu t|t > tα,n dengan n adalah ukuran sampel sehingga keputusannya akan
menolak H0 jika t terletak di daerah kritis.
2.7
Koefisien Determinasi (
R
2)
Koefisien determinasi bertujuan untuk mengetahui dan mengukur proporsi keragaman total dari nilai observasiY di sekitar rataannya yang diterangkan oleh garis regresinya. Koefisien determinasi dirumuskan sebagai
R2 = ∑n i=1(ˆyi−y)¯ 2 ∑n i=1(yi−y)¯ 2 .
Sembiring [11] menjelaskan bahwa nilai R2 berada di antara 0 dan 1. Apa-bila mendekati 1 maka model regresi nonparametrik spline yang terbentuk baik, tetapi apabila mendekati 0 maka model yang terbentuk kurang sesuai dan kurang baik untuk digunakan.
2.8
Kerangka Pemikiran
Berdasarkan tinjauan pustaka dapat disusun kerangka pemikiran sebagai berikut. Data produksi jagung di Jawa Tengah yang diperoleh dari Dinas Per-tanian, Tanaman Pangan, dan Holtikultura Jawa Tengah memiliki pola yang fluktuatif. Hal ini disebabkan karena adanya pengaruh dari berbagai faktor. Faktor-faktor yang mempengaruhi produksi jagung sebagian tidak memiliki po-la tertentu, sehingga untuk memprediksi didekati dengan menggunakan metode nonparametrik. Salah satu metode dalam regresi nonparametrik adalah estima-tor spline. Penelitian ini menggunakan regresi nonparametrikspline yang memi-liki sifat fleksibel sehingga dapat memodelkan produksi jagung dan mengetahui faktor-faktor signifikan yang mempengaruhi produksi jagung.