• Tidak ada hasil yang ditemukan

PENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PEMBENTUKAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDO

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PEMBENTUKAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDO"

Copied!
12
0
0

Teks penuh

(1)

PENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PEMBENTUKAN

LIMBAH PABRIK GULA ASEMBAGUS SITUBONDO

1

Niarfie Radythia,

2

Ir. Mutiah Salamah Chamid, M Kes, dan

3

Jerry Dwi TP, S.Si, M.Si

1

Mahasiswa Jurusan Statistika FMIPA-ITS (1306100045) 2,3

Dosen Jurusan Statistika FMIPA-ITS

---

Abstrak

Masalah yang sering muncul dalam regresi adalah tidak semua variabel prediktor dapat didekati dengan pendekatan parametrik. Oleh karena itu diperlukan suatu pendekatan yang tidak terikat dengan asumsi bentuk kurva regresi tertentu dan memberikan fleksibilitas yang besar. Pendekatan semacam ini dinamakan regresi nonparametrik. Dengan menggabungkan kedua pendekatan ini akan di dapatkan suatu model regresi semiparametrik. Seiring dengan semakin dekatnya era pasar bebas, diperlukan upaya-upaya perbaikan dalam segala bidang termasuk proses pembuatan gula. Salah satu yang dapat dilakukan adalah menggambarkan pola hubungan antara bahan masukan proses dengan limbah yang dihasilkan. Dalam penelitian Rudianto (1997) terdapat lima variabel prediktor yaitu X1 adalah berat

kapur tohor, X2 adalah berat sulfur, X3 adalah berat flokulan, X4 adalah berat tebu, dan X5 adalah berat

fosfat, serta variabel respon Y adalah berat limbah/blotong. Dengan menggunakan metode All Possible Regression didapatkan bahwa model regresi Y dengan X2 dan X3 memiliki nilai R2 yang kecil yaitu

sebesar 50,9. Diperlukan metode alternatif untuk menjelaskan hubungan antara Y, X2 dan X3. Untuk

itulah dilakuan penelitian guna mendapatkan model semiparametrik pada proses pembentukan limbah pabrik gula Asembagus Situbondo.Metode yang digunakan adalah regresi semiparametrik dengan estimator spline. Didapatkan model yang lebih baik dari model parametrik pada penelitian Rudianto (1997) yaitu model semiparametrik dengan nilai koefisien determinasi dalam model ini sebesar 63,99%.

Kata-kata kunci : Limbah Pabrik Gula, Regresi Semiparametrik, Estimator Spline

1.

Pendahuluan

Masalah yang sering muncul dalam regresi adalah tidak semua variabel prediktor dapat didekati

dengan pendekatan parametrik. Oleh karena itu diperlukan suatu pendekatan yang tidak terikat dengan

asumsi bentuk kurva regresi tertentu dan memberikan fleksibilitas yang besar. Pendekatan semacam

ini dinamakan regresi nonparametrik. Dengan menggabungkan kedua pendekatan ini akan di dapatkan

suatu model regresi semiparametrik.

Seiring dengan semakin dekatnya era pasar bebas, diperlukan upaya-upaya perbaikan dalam

segala bidang termasuk proses pembuatan gula. Salah satu yang dapat dilakukan adalah

menggambarkan pola hubungan antara bahan masukan proses dengan limbah yang dihasilkan. Dalam

penelitian Rudianto (1997) terdapat

lima variabel prediktor yaitu X

1

adalah berat kapur tohor, X

2

adalah berat sulfur, X

3

adalah berat flokulan, X

4

adalah berat tebu, dan X

5

adalah berat fosfat,

serta variabel respon Y adalah berat limbah/blotong. Dengan menggunakan metode All Possible

Regression didapatkan bahwa model regresi Y dengan

X

2

dan

X

3

memiliki nilai R

2

yang kecil yaitu

sebesar 50,9. Diperlukan metode alternatif untuk menjelaskan hubungan antara Y,

X

2

dan

X

3

.

Berdasarkan Uraian di atas maka permasalahan yang akan diselesaikan dalam penelitian ini

adalah

bagaimana mendapatkan model semiparametrik pada proses pembentukan limbah

pabrik gula Asembagus Situbondo.

Manfaat yang diharapkan dari penelitian ini adalah

memberikan pemodelan alternatif pada proses pembentukan limbah pabrik gula Asembagus Situbondo

yaitu dengan metode regresi semiparametrik

.

2.

Tinjauan Pustaka

2.1

Regresi Parametrik

Regresi parametrik merupakan metode yang digunakan untuk mengetahui pola hubungan antara

variabel respon dan prediktor yang diketahui bentuk kurva regresinya (Eubank, 1988). Secara umum

bentuk regresi parametrik linear digambarkan sebagai berikut:

(2)

dengan:

y

= variabel respon ke-i

m x

= fungsi parametrik (mengikuti bentuk kurva regresi tertentu)

ε

= error ~ IIDN (0,

σ

2

)

Bila dinyatakan dalam bentuk matrik adalah sebagai berikut:

Estimasi dari perameter

γ

yaitu

γ

λ

dapat diperoleh dengan metode kuadrat terkecil sebagai

berikut:

2

Dari persamaan (2.2) didapatkan estimasi kurva regresi:

λ

=

X(X

'

X)

-1

X

'

y

dengan

X(X

'

X)

-1

X

'

3

Matrik A(

λ

) ini sering disebut matrik

hat

, yang memiliki peranan yang sangat penting dalam analisis

regresi.

2.2

Regresi Nonparametrik

Regresi nonparametrik adalah metode yang digunakan untuk mengetahui pola hubungan antara

variabel respon dan variabel prediktor yang tidak diketahui bentuk fungsinya. Secara umum bentuk

regresi nonparametrik digambarkan sebagai berikut:

y

f t

ε

, i

1,2, … , n 4

dengan:

y

= variabel respon ke-i

f t

= fungsi nonparametrik

ε

= error ~ IIDN (0,

σ

2

)

2.3 Regresi Semiparametrik

Model semiparametrik dikembangkan oleh Green, Jennison dan Scheult (1985); Engel, Granger,

Rice, Weiss (1986); Heckman (1986); Eubank (1988); Wahba (1990); Chen dan Shiau (1994); Shi dan

Li (1994); He dan Shi (1996); Ruppert, Wand, dan Caroll (2003). Model ini dirumuskan sebagai:

y

i

=x

i'

γ

+f t

i

+

ε

i

, i=1,2 (5)

dengan x

i'

= x

i1

,…,x

ip

dan t

i

, i = 1,2,…,n merupakan variabel-variabel prediktor. Vektor

γ

=(

γ

1

,…,

γ

p

)

'

R

p

tidak diketahui dan f diasumsikan merupakan anggota ruang sobolev

W

2m

0,1 = { f|f

(k)

,k=0,1,…,m-1) kontinu pada [0,1] dan

[f

(m)

t ]

2

dt<

}

1

0

. Residual

ε

i

berdistribusi

independen dengan mean nol dan variansi

σ

2

. Estimator f diperoleh dari meminimumkan

Penalized

Least Squared

(PLS):

I

λ

f

R f

λ

J f , f

W

2m

0,1

6

Fungsional

I

λ

f

memuat tiga komponen, yaitu komponen likelihood R(f), fungsional penalti J(f) dan

parameter penghalus

λ

. Estimator tipe PLS ini dikembangkan oleh Heckman (1986), Eubank (1988),

Wahba (1990), dan Chen dan Shiau (1994) untuk estimator spline parsial original, dengan mengambil

kesamaan-kesamaan:

(3)

J f =

[f

(m)

t ]

2

dt

1

0

8

Bentuk estimator

γ

λ

dan f

λ

diperoleh dengan meminimumkan PLS:

I

λ

f

n

y

x

γ

f t

λ

[f

(m)

t ]

2

dt

1 0

9

2.4

Spline dalam Regresi Nonparametrik

Ada berbagai macam pendekatan yang digunakan untuk mendapatkan estimator f, tergantung

pada kriteria yang diinginkan dimiliki estimator tersebut. Jika ingin didapatkan estimator f yang

smooth

, dalam arti estimator itu kontinu dan diferensiabel, digunakan pendekatan

Penalized Least

Square

(PLS), yaitu kriteria estimasi dengan memperhatikan kesesuaian terhadap data (

goodness of fit

)

dan kemulusan kurva.

Secara umum, fungsi spline berorde k-1 adalah sebarang fungsi yang dapat disajikan dalam

bentuk:

S t

α

t

δ

t

ξ

10

dengan

t

ξ

=

t

ξ

, t

ξ

0 , t

ξ

α

dan

δ

adalah konstanta real dan

ξ

1

,

ξ

2

, …,

ξ

h

adalah titik knots.

2.5 Pemilihan

λ Optimal

Parameter

λ

merupakan kemulusan kurva, dan pengontrol keseimbangan antara kesesuaian

kurva terhadap data. Penentuan

λ

yang optimal sangat diperlukan agar mendapat estimator yang

optimal. Salah satu metode pemilihan

λ

optimal adalah

Generalized Cross Validation

(GCV). Metode

ini dikembangkan oleh Craven dan Wahba (1979), Wahba (1985), Li (1986), Kohn (1991), Shao

(1993), Venter dan Snyman (1995). Kriteria GCV didefinisikan sebagai:

GCV λ

MSE λ

n tr I

A λ

11

dimana MSE(

λ

) didefinisikan sebagai:

MSE λ

n

y

f

12

dan matrik A(

λ

) dapat dicari dengan persamaan 2.3 dengan elemen matrik X sebagai berikut:

X

1 T

11

…T

11k

T

11

‐ξ

1 k

… T

11

‐ξ

n k

X

11

…X

11k

1 T

21

…T

21k

T

21

‐ξ

1 k

… T

21

‐ξ

n k

X

21

…X

21k

. . . .

. . . .

. . . .

1 T

n1

…T

n1k

T

n1

‐ξ

1 k

… T

n1

‐ξ

n k

X

n1

…X

n1k

(4)

2.6

Bentuk dan Sifat Estimator Spline Parsial

Diberikan data (t

i

, x

i

, y

i

) dan hubungan antara t

i

, x

i

dan y

i

diasumsikan mengikuti model

semiparametrik:

y

i

=x

i'

γ

+f t

i

+

ε

i

, t

i

0,1

(13

dengan x

i'

x … x

dan t

i

, i

1,2, … , n

variabel-variabel prediktor. Vektor parameter

γ

, … ,

R

tidak diketahui dan f anggota W

2

m

0,1 . Sesatan random

ε

i

berdistribusi normal

dengan mean nol dan varians

σ

2

. Bentuk estimator spline parsial diperoleh dengan meminimumkan

PLS:

n

y

x

γ

f t

λ

[f

(m)

t ]

2

dt

1

0

14

dengan

λ

merupakan parameter penghalus.

2.7

Pemeriksaan Asumsi Residual

Asumsi residual dalam analisis regresi meliputi identik, independen, dan berdistribusi normal

(0,

σ

2

).

a.

Pemeriksaan Asumsi Identik

Untuk pemeriksaan asumsi identik dilakukan dengan melihat Scatterplot atau diagram

pencar antara residual dengan fits (nilai taksiran dari variabel respon). Bila residual

dan fits saling independen atau plot yang dihasilkan acak dan tidak membentuk pola

tertentu, hal ini menandakan bahwa varians dari residual adalah sama atau identik.

b.

Pemeriksaan Asumsi Independen

Pemeriksaan asumsi independen untuk mengetahui apakah ada korelasi antar residual.

Dapat dilakukan dengan melihat plot ACF dari residual. Bila dalam plot ACF terdapat

lag yang keluar, menandakan adanya korelasi antar residual.

c.

Pemeriksaan Asumsi Distribusi Normal

Pengujian asumsi residual normal (0,

σ

2

) dapat dilakukan melalui uji Kolmogorov Smirnov.

Hipotesis yang digunakan adalah:

H

0

:F

0

(x)=F(x) (Residual berdistribusi normal (0,

σ

2

))

H

1

:F

0

(x)

F(x) (Residual tidak berdistribusi normal (0,

σ

2

))

Statistik Uji:

|

17

Pengambilan keputusan adalah tolak H

0

ditolak jika |D|>q

(1-α)

dimana q adalah nilai

berdasarkan tabel Kolmogorov Smirnov, dapat juga melalui P-value, dimana H

0

ditolak jika

nilai P-value<

α

2.8

Pengujian Parameter Model

Pengujian parameter dalam model regresi bertujuan untuk mengetahui apakah paraeter tersebut

telah menunjukkan hubungan yang nyata antara variabel prediktor dan variabel respon. Selain itu juga

untuk mengetahui kelayakan parameter dalam meerangkan model. Terdapat dua tahap pengujian yaitu

uji serentak (simultan) dan uji parsial (individu).

a.

Uji serentak atau simultan (Draper and Smith, 1981; Kutner

et al

., 2004)

1.

Hipotesis pengujian

H

0

:

γ

i

=

0

H

1

: paling sedikit ada satu

γ

i

0

, i= 0,1,…,p

dengan p adalah banyaknya variabel prediktor

2.

Statistik uji

F

MSRegresi

MSError

18

MSRegresi

Y

i

‐Y

2 n i 1

p‐1

dan

MSError

Y

i

‐Y

i 2 n i 1

n‐p

(5)

3.

Daerah penolakan

Tolak H

0

jika F > F

α;(v1=p-1, v2=n-p)

atau P-value <

α

.

b.

Uji individu atau parsial (Draper and Smith, 1981; Kutner

et al

., 2004)

1.

Hipotesis Pengujian

H

0

:

γ

i

= 0

H

1

:

γ

i

0 , i = 0,1,…,p

dengan p adalah banyaknya variabel prediktor

2.

Statistik uji

t

γ

i

stdev γ

i

19

3.

Daerah penolakan

Tolak H

0

jika |t| > t

α/2;df=n-p

atau P-value <

α

2.8 Tinjauan Non Statistik

Limbah padat yang dihasilkan dalam proses pembuatan gula di pabrik gula Asembagus

Situbondo secara ringkas dijelaskan bahwa terdapat enam stasiun dalam tahap pembuatan gula.

Stasiun tersebut bila diurutkan dari awal proses adalah dimulai dari stasiun penggilingan, stasiun

pemurnian, stasiun penguapan, stasiun masakan, stasiun putaran dan terakhir stasiun

finishing

. Akan

tetapi, limbah padat sudah dapat dikeluarkan pada tahap pemurnian, sehingga kotoran-kotoran dari

bahan dasar tebu tidak mengganggu proses selanjutnya sampai diperoleh hasil akhir berupa gula.

Berikut adalah dua proses di stasiun penggilingan dan stasiun pemurnian hingga didapatkannya limbah

padat.

1.

Proses di stasiun penggilingan bertujuan untuk mengambil nira sebanyak-banyaknya dari tebu.

Dengan memotong-motong batang tebu menjadi bagian-bagian yang kecil, lunak dan seragam

dengan penurunan volume yang kecil, maka pemerasan dengan hasil ekstraksi yang

maksimum dan efisien dapat dicapai. Penggilingan dilakukan dengan lima mesin gilingan dan

proses dilanjutkan ke stasiun pemurnian.

2.

Pada stasiun pemurnian, nira dari stasiun penggilingan dipanaskan (75

0

C) untuk membunuh

jasad renik. Pupuk TSP ditambahkan untuk membentuk inti endapan serta membantu dalam

proses pengendapan. Selanjutnya nira dimasukkan ke defekator dan ditambahkan susu kapur

agar terjadi penggumpalan. Setelah itu, dalam bejana sulfitir ditambahkan gas SO

2

agar

terbentuk endapan. Setelah dipanaskan, nira tersulfitir dipanaskan dan masuk wadah

pengendapan untuk memisahkan bahan padat (kotor) dan cair sehingga didapatkan nira kotor

dan nira cair. Untuk mempercepat proses pengendapan ini ditambahkan flokulan. Nira kotor

kemudian disaring di vakum filter untuk dipisahkan bagian padat dan cair. Setelah disiram

dengan air untuk menghilangkan nira yang tersisa, limbah padat (blotong) masuk ke tempat

yang disediakan dan dilakukan penimbangan.

Berdasarkan uraian proses terbentuknya limbah, maka variabel data yang digunakan dalam

penelitian ini adalah berat limbah (kuintal), berat kapur tohor (kuintal), berat sulfur (kg), berat

flokulan (kg), berat tebu (kuintal) dan berat fosfat (kg).

3.

Metodologi Penelitian

3.1

Sumber Data dan Identifikasi Variabel

Sumber data, alat dan identifikasi variabel dalam penelitian ini adalah sebagai berikut:

1.

Jurnal dan referensi yang terkait dengan tujuan penelitian.

2.

Data

yang digunakan berasal dari penelitian Rudianto (1997). Data tersebut

terdiri dari satu

variabel respon, yaitu berat limbah /blotong (Y), dan lima variabel prediktor yaitu berat kapur

tohor (X

1

), berat sulfur (X

2

), berat flokulan (X

3

), berat tebu (X

4

) dan berat fosfat (X

5

). Dengan

pendekatan regresi parametrik didapatkan hasil pengaruh berat sulfur (X

2

) dan berat flokulan

(X

3

) dalam model kecil dan dibuang dari model. Dengan menggunakan metode

All Possible

Regression

didapatkan bahwa model regresi Y dengan X

2

dan X

3

memiliki nilai R

2

yang kecil

yaitu sebesar 50,9 , ini menunjukkan bahwa X

2

dan X

3

memberikan kontribusi yang kecil

(6)

tersebut maka variabel berat sulfur dan berat flokulan akan di dekati dengan metode regresi

semiparametrik, maka variabel respon dan variabel prediktor yang digunakan dalam penelitian

ini:

Y = berat limbah/blotong

X

1

= berat flokulan (kg)

X

2

= berat sulfur (kg)

3.2

Metode Analisis

Langkah-langkah dalam menganalisis data adalah sebagai berikut :

a.

Deskripsi data untuk melihat pola perilaku hubungan dari data.

b.

Pemilihan parameter penghalus optimal dengan metode GCV.

c.

Memodelkan data limbah pabrik gula Asembagus Situbondo dengan pendekatan regresi

semiparametrik.

d.

Pemilihan model spline optimal.

e.

Melakukan analisis diagnostik residual.

f.

Melakukan pengujian signifikansi koefisien regresi secara simultan dan individu.

4.

Analisis dan Pembahasan

4.1

Deskripsi Data

Dari Gambar 4.1 dan Gambar 4.2 dapat dilihat untuk variabel berat flokulan dapat dijelaskan

bahwa model parametrik kurang tepat digunakan. Hal ini terlihat dari pola perilaku data dari satu

interval ke interval yang lain. Perubahan pola perilaku data dari satu interval ke interval yang lain ini

ditandai dengan titik knots.

X1 Y 9 8 7 6 5 4 3 800 700 600 500 400

(7)

7  param respon 3 4 5 6 7 8 9 400 500 600 700 800 param respon 3 4 5 6 7 8 9 400 500 600 700 800

Gambar 4.2 Plot antara Y dengan X1 dan Spline Kubik

Untuk variabel berat sulfur dapat digunakan pendekatan model parametrik (linier), karena

adanya kecenderungan hubungan antara berat limbah dengan berat sulfur tersebut mengikuti pola

linier, seperti yang terlihat pada Gambar 4.3 dan Gambar 4.4.

X2 Y 700 600 500 400 300 200 800 700 600 500 400

Gambar 4.3 Plot Y(berat limbah) dan X2(berat sulfur)

Sulfur Y 700 600 500 400 300 200 800 700 600 500 400

(8)

Bedasarkan plot antara berat limbah dan berat flokulan (Gambar 4.1 dan Gambar 4.2) terlihat

indikasi titik knots yang menunjukkan adanya perubahan perilaku dari data yaitu disekitar titik 4 dan

titik 5.

Tabel 4.1 Nilai GCV dengan dua titik knots

Orde

titik knots

GCV

3

4

4,8

5809,489

3

4

4,9

5809,489

3

4

5,0

5809,489

3

4

5,1

5813,185

3

4

5,2

5822,233

3

4

5,3

5834,733

3

4

5,4

5849,576

3

4

5,5

5865,959

3

4

5,6

5883,159

3

4

5,7

5900,389

3

4

5,8

5916,698

4

4

4,8

5527,947

4

4

4,9

5527,937*

4

4

5

5527,945

4

4

5,1

5528,222

4

4

5,2

5529,675

4

4

5,3

5532,683

4

4

5,4

5537,383

4

4

5,5

5543,906

4

4

5,6

5552,473

4

4

5,7

5563,434

4

4

5,8

5577,31

4

4

5,9

5594,846

4

4

6,0

5617,109

Keterangan : * = GCV Minimum

Berdasarkan Tabel 4.1, terlihat bahwa GCV minimum adalah 5527,937 terdapat pada titik knots

4 dan 4,9 pada variabel flokulan. Nilai GCV minimum menunjukkan estimasi model semiparametrik

yang terbaik, sehingga dari kedua titik knots ini didapatkan model semiparametrik sebagai berikut:

Y γ

0

γ

1

X

γ

2

X

2

γ

3

X

3

γ

4

X ‐4

3

γ

5

X ‐4,9

3

γ

6

X

ε

Dengan program S-Plus diperoleh estimasi model sebagai berikut:

Y

91213,64

73633,27X

19497,03X

1703,562X

2092,643 X

4

406,2007 X

4,9

0,5659328X

dengan Y adalah berat limbah pabrik gula, X

1

adalah variabel berat flokulan, dan X

2

adalah variabel

berat sulfur. Nilai koefisien determinasi dalam model ini sebesar 63,99%. Ini menunjukkan bahwa

variabel besar flokulan dan berat sulfur mampu menerangkan 63,99% keragaman berat limbah gula.

(9)

Variabel sulfur dan berat limbah pabrik gula mempunyai hubungan linier. Sedangkan hubungan

antara berat limbah pabrik gula dan berat flokulan berupa

piecewise polynomials

yang dapat dituliskan

dengan:

91213,64

73633,27X

19497,03X

1703,562X , X

4

91213,64

73633,27X

19497,03X

1703,562X

2092,643 X

4 , 4

X

4,9

91213,64

73633,27X

19497,03X

1703,562X

2092,643 X

4 406,2007 X

4,9 , X

4,9kg

Dari potongan polinomial ini terlihat bahwa berat limbah pabrik gula dipengaruhi oleh

perubahan berat flokulan pada tiga interval yang berbeda dan kontinu, yaitu berat flokulan kurang dari

4 kg, berat flokulan antara 4 kg sampai 4,9 kg, dan berat flokulan lebih dari 4,9 kg.

4.2

Model Pembanding

Berikutnya akan diselidiki kesesuaian antara berat limbah gula taksiran dengan berat limbah

gula sebenarnya pada titik-titik knots yang berbeda pada orde tertentu sebagai pembanding. Dipilih

titik knots 4 dan 5,8 pada orde ketiga (spline kuadratik). Titik knots yang dipilih memiliki nilai GCV

sebesar 5916,698 (Tabel 4.1). Nilai GCV yang besar mengindikasikan model semiparametrik yang

kurang sesuai untuk menjelaskan data berat limbah gula. Model regresi semiparametrik dengan

titik-titik knots ini menghasilkan nilai koefisien determinasi yang relatif kecil yaitu 55,91%. Model regresi

semiparametrik yang terbaik adalah model dengan orde 4 (spline kubik) dan titik knots 4 dan 4,9.

4.3 Analisis Diagnostik Residual

Berdasarkan analisis residual (Gambar 4.5) diperoleh bahwa spline kubik dengan dua titik knots

4 dan 4,9 residualnya tidak ada penyimpangan terhadap distribusi normal. Nilai P-value yang lebih

dari 0,10 yaitu > 0,150 menyatakan bahwa residual berdistribusi normal. Dari Gambar 4.6 dapat

dilihat bahwa residual dan fits(taksiran dari limbah pabrik gula) adalah saling bebas karena plot yang

dihasilkan tidak membentuk suatu pola atau acak, hal ini menandakan sifat residual yang identik.

Sedangkan pada Gambar 4.7 dapat dilihat bahwa tidak terjadi korelasi antar residual, ditandai dengan

tidak adanya lag yang keluar dari garis batas, hal ini menggambarkan sifat residual yang independen.

residual Pe rc e n t 150 100 50 0 -50 -100 -150 99 95 90 80 70 60 50 40 30 20 10 5 1 Mean >0.150 -0.0001273 StDev 57.98 N 30 KS 0.079 P-Value

Probability Plot of residual Normal

(10)

fits re si d u a l 850 800 750 700 650 600 550 500 100 50 0 -50 -100 -150

Scatterplot of residual vs fits

Gambar 4.6 Scatterplot Residual dan Fits

Lag A u to co rre la ti o n 8 7 6 5 4 3 2 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0

Gambar 4.7 Plot ACF Residual

4.4 Uji Signifikansi Koefisien Regresi dalam Model Semiparametrik

Berdasarkan hasil analisis diagnostik residual semua asumsi untuk residual yaitu varian konstan,

residual dan fits(nilai taksiran limbah pabrik gula) saling bebas, dan residualnya tidak ada

penyimpangan dari distribusi normal, sehingga dapat dilanjutkan untuk uji hipotesis koefisien regresi.

Pertama dilakukan uji serentak dengan hipotesis:

H

0

:

γ

i

=

0

H

1

: paling sedikit ada satu

γ

i

0

, i= 0,1,…,6

Tabel 4.2 Analisis Variansi Model Semiparametrik dengan titik knots 4 dan 4,9 (orde 4)

SK

db

JK

KT

Fhit

Ftabel

Regresi

6

173292

28882

6,814861

2,047227

Galat

23

97476,08

4238,09

Total

29

270768,8

Berdasarkan analisis variansi model semiparametrik (Tabel 4.2) dengan

α

= 0.10 diperoleh kesimpulan

bahwa paling sedikit ada satu koefisien regresi yang tidak bernilai nol, sehingga model signifikan.

(11)

11 

Selanjutnya dilakukan uji individu terhadap koefisien-koefisien regresi, terutama koefisien-koefisien

fungsi

truncated

dengan hipotesis sebagai berikut:

H

0

:

γ

i

= 0

H

1

:

γ

i

0

, i = 0,1,…,6

Tabel 4.3 memperlihatkan bahwa dengan nilai

α

= 0,10 diperoleh kesimpulan estimator spline

kubik dengan titik knots 4 dan 4,9 signifikan dalam model sehingga estimator spline kubik pada model

semiparametrik cukup memadai untuk data limbah pabrik gula tersebut.

Tabel 4.3 Inferensi Model Semiparametrik dengan titik knots 4 dan 4.9 (orde 4)

Koefisien

Estimasi

StDev

t-hitung

γ

0

-91213,64

42188,6

-2,16205

γ

1

73633,27

34152,12

2,156038

γ

2

-19497,03

9089,539

-2,145

γ

3

1703,562

797,1022

2,137194

γ

4

-2092,64

991,9244

-2,10968

γ

5

406,2007

204,9328

1,982116

γ

6

0,565933

0,15173

3,729873

Nilai tabel t : 1,713872

Model regresi semiparametrik ini memiliki nilai koefisien determinasi yang lebih baik dari

penelitian Rudianto (1997), yaitu sebesar 63,99%.

5.

Kesimpulan

Berdasarkan analisis yang dilakukan dapat diambil kesimpulan bahwa data berat limbah pabrik

gula Asembagus Situbondo dapat dimodelkan dengan model semiparametrik sebagai berikut:

Y

91213,64

73633,27X

19497,03X

1703,562X

2092,643 X

4

406,2007 X

4.9

0,5659328X

Variabel sulfur dan berat limbah pabrik gula mempunyai hubungan linier. Sedangkan hubungan

antara berat limbah pabrik gula dan berat flokulan berupa

piecewise polynomials

yang dapat dituliskan

dengan:

91213,64

73633,27X

19497,03X

1703,562X , X

4

91213,64

73633,27X

19497,03X

1703,562X

2092,643 X

4 , 4

X

4,9

91213,64

73633,27X

19497,03X

1703,562X

2092,643 X

4 406,2007 X

4,9 , X

4,9kg

(12)

Daftar Pustaka

Chen, H. dan Shiau, J.J.H.(1994).

Data Driven Efficient Estimators for a Partially Linear Model

.

The Annals of Statistics

, 22, 211-237

Craven an Wahba, G.(1979).

Smoothing Noisy Data With Spline Function: Estimating The Correct

Degree of Smoothing by The Method of Generalized Cross Validation

,

Numer. Math,

31,

377-403.

Draper, N.R., and Smith, H. (1981). Applied Regression Analysis. Second Edition, John

Wiley & Sons, Inc.

Engle, R.L., Granger, C., Rice, J., dan Weiss, A.(1986).

Semiparametric Estimates of Relation

Between Weather and Electricity Sales

,

Journal of The American Statistical Association

, 81,

310-320.

Eubank, R. (1988).

Spline Smoothing and Nonparametric Regression

. Marcel dekker, New York.

Green, P., Jennison, C., Scheult, A.(1985).

Analysis of field Experiments by Least Squared

Smoothing

,

Journal of The Royal Statistics Society

, Ser. B, 47, 299-314.

He, X. dan Shi, P.(1996).

Bivariate Tensor Product B-Spline in Partly Linear Models

,

Journal of

Multivariate Analysis

, 58, 162-181.

Heckman, N.(1986).

Spline Smoothing in a Partly Linear Models

,

Journal of Royal Statistics Society

,

Ser. B, 48, 244-248.

Kohn, R.(1991).

The Performance of Cross Validation and Maximum Likelihood Estimators of

Spline Smoothing Parameters

.

Journal of American Statistics Association

, 86, 1042-1050.

Kutner, M.H., Nachtsheim, C.J., and Neter, J. 2004. Applied Linear Regression Models,

McGraw Hill International, New York.

Li, K.C.(1986).

Asymtotic Optimality of C1 and Generalized Cross Validation in Ridge Regression

With Application to Spline Smoothing

,

Ann.Statist.

, 14, 1101-1112.

Pratiwi (2008).

Pemodelan Pertumbuhan Balita Menggunakan Regresi Spline Sebagai

Pendekatan Pola Kurva Kartu Menuju Sehat (KMS)

, Tugas Akhir ITS Surabaya.

Rudianto, N. (1997).

Implementasi Gibbs Sampler dan Bayesian Inference dalam Pemilihan

Model Terbaik Limbah Pabrik Gula Asembagus Situbondo

, Tugas Akhir, ITS, Surabaya.

Rupert, D, Wand, M.P, and Caroll, R.J. (2003).

Semiparametric Regression

, New York: Cambridge

University.

Shao, J.(1993).

Linear Model Selection by Cross Validation

.

Journal of The American Statistical

Assosiation

, 88, 486-494.

Shi, P., dan Li, G. (1994).

On The Rate Convergence of :Minimum L1-Norm” Estimates in a partly

Linear Model

,

Communication in Statistics, Theory and Methoda

, 23, 175-196.

Venter, J.H., dan Snyman, J.L.J.(1995).

A note on the Generalized Cross Validation Criterior in

Linear Model Selection

,

Biometrica

, 82, 215-219.

Wahba, G.(1985).

A Comparison of GCV and GML for Choosing the Smoothing Parameter in the

Generalized Spline Smoothing Problem

,

Journal The Annals of Statistics

, 13, 1378-1402.

Gambar

Gambar 4.1 Plot Y(berat limbah) dan X 1 (berat flokulan)
Gambar 4.2 Plot antara Y dengan X 1  dan Spline Kubik
Tabel 4.1 Nilai GCV dengan dua titik knots
Gambar 4.5 Plot Uji Kenormalan Residual
+3

Referensi

Dokumen terkait

Hasil penelitian yang selanjutnya adalah bahwa variabel anggaran belanja memiliki hubungan yang positif dengan variabel keterlambatan penetapan APBD yang berarti semakin

Mahasiswa dapat memahami cara melakukan penetapan Mahasiswa dapat memahami cara melakukan penetapan kadar senyawa marker EPMS kadar senyawa marker EPMS dalam sediaan kapsul yang

Tujuan dari penelitian ini adalah untuk mengetahui daya hambat ekstrak buah Patikala terhadap pertumbuhan Staphylococcus aureus dan untuk mengetahui konsentrasi

Aunurrahman berpendapat bahwa pemahaman konsep peserta didik merupakan faktor yang sangat penting dalam pelaksanaan pendidikan dan pembelajaran. Jika guru

b) Dampak era globalisasi di Pondok Pesantren Nurul Huda Al Mansyuriyyah sangat terasa karena eksistensi pesantren di tengah keterbatasan dan dominasi negara

kejadian dilapangan, kemudian dengan menghubungkan wawancara, data atau laporan bertujuan untuk mengambarkan Pelayanan Program Pendaftaran Mandiri Akta Tanah (PERMATA)

Mengubah Lampiran III Peraturan Menteri Keuangan Nomor 213/PMK.011/2011 tentang Penetapan Sistem Klasifikasi Barang Dan Pembebanan Tarif Bea Masuk Atas Barang

Ketiga rangkap tersebut kemudian diserahkan kepada bagian akuntansi yang dipegang oleh Ibu Dara Novianti untuk dibuatkan daftar gaji karyawan, daftar gaji yang