REGRESI NON-LINIER POLYNOMIAL BERDERAJAT TIGA (KUBIK)
Untuk memenuhi tugas matakuliah Analisis Regresi yang dibina oleh Bapak Hendro Permadi
Oleh: Kelas GG
Aldila Sakinah Putri 408312408014 Annisa Masruroh 408312408021 Winda Permatasari 409312417675 Rezha Kharisma Putri 409312417680 Inge Ratih Puspitasari 409312417682 Nine Winda Yunita 409312419793
UNIVERSITAS NEGERI MALANG
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI MATEMATIKA
BAB I PENDAHULUAN
1.1. Latar Belakang
Regresi dalam statistika adalah salah satu metode untuk menentukan
hubungan suatu variabel terhadap variabel yang lain. Variabel yang pertama disebut dengan variabel bebas atau variabel X karena seringkali digambarkan dalam grafik sebagai absis. Variabel yang kedua adalah variabel terikat atau
variabel Y, dalam grafik digambarkan sebagai ordinat. Kedua variabel ini
biasanya merupakan variabel acak (random).
Regresi yang dipelajari di sini dibatasi pada regresi linear, baik itu sederhana maupun berganda. Untuk regresi sederhana, regresi yang melibatkan satu peubah tak bebas (Y) dan satu peubah bebas (X), kelinearan regresi ̂ diyakinkan melalui pengujian hipotesis. Jika hipotesis linear diterima, kita yakin hingga tingkat keyakinan tertentu, bahwa regresi itu bentuknya linear tidak diragukan. Namun, apabila ternyata hipotesis linear ditolak, maka regresi linear tidak cocok untuk digunakan dalam mengambil kesimpulan dan karenanya perlu meningkat pada pencarian regresi non-linear atau lengkung.
Analisa regresi merupakan salah satu uji statistika yang memiliki dua jenis pilihan model yaitu linear dan non linear dalam parameternya. Model linear memiliki dua sifat yaitu regresi sederhana dan regresi berganda dengan kurva yang dihasilkan membentuk garis lurus. Untuk model non linear polynomial berderajat dua yang disebut kuadratik, berderajat tiga yang disebut kubik, berderajat empat disebul kuartil, dan seterusnya. Kurva yang dihasilkan
polynomial tersebut membentuk garis lengkung. Disini kami akan menganalisis tentang model regresi non linear dalam parameternya bersifat kubik. Regresi non linier yang bersifat kubik biasa dinyatakan dalam bentuk Yi = β0X0i + β1Xi + β2Xi2
+ β3Xi3
+ ε. Dalam makalah ini kami mengambil contoh tentang banyaknya
1.2. Rumusan Masalah
1. Bagaimana persamaan umum regresi non linear berderajat tiga? 2. Bagaimana aplikasi regresi non linear berderajat tiga?
3. Bagaimana menganalisa model regresi yang telah diperoleh?
1.3. Tujuan
1. Untuk mengetahui persamaan umum regresi non linear berderajat tiga. 2. Untuk mengetahui aplikasi regresi non linear berderajat tiga.
BAB II PEMBAHASAN
2.1 Kajian teori
Model regresi non linier polinomial berderajat tiga atau model regresi kubik mempunyai persamaan umum yang berbentuk :
Y = 0X0i + 1Xi + 2Xi2 + 3Xi3 + ε
Dimana:
Yi = nilai pengamatan ke-i
Xi = nilai peubah X yang ke-i
0 = titik potong / parameter intersep
1 - 3 = Parameter pengaruh peubah X1, X2, X3 terhadap peubah Y pada
derajat atau ordo ke 1, 2, 3.
ε = galat ke-i yang diasumsikan berdistribusi bebas normal dengan nilai rata- rata 0 dan ragam (σ2)
X0i = 1
i = 1, 2, 3, ..., n
Mengubah persamaan non linier bentuk kubik menjadi linier dengan menggunakan rumus di bawah ini:
Y = X b [ ] = [ ] [ ]
Didapatkan Yi*= b0 + b1Xi + b2Xi2 + b3Xi3. Bentuknya tetap berupa
polinomial kubik.
Asumsi yang diperlukan dalam model regresi polinomial berderajat tiga adalah:
1. Bahwa ε merupakan peubah acak dengan nilai tengah dan variansi σ2 . 2. Bahwa ε i dan ε j , i tidak sama dengan j ( i ≠ j ), tidak berkorelasi satu
1) Pendugaan koefisien regresi polinomial berderajat tiga
Jika suatu data yang diberikan hanya dapat disajikan melalui kurva regresi non linear, maka kita harus menentukan bentuk kurvanya dan menduga parameternya. Dalam pendugaan koefisien regresi terlebih dahulu diperlukan model sampel untuk mendekati data yang diperoleh dari sampel. Model sampel yang digunakan untuk regresi polinomial berderajat tiga adalah sebagai berikut:
Y1 = b0X0i + b1Xi + b2Xi2 + b3Xi3 + Є
dimana:
i = 1, 2, 3, ..., n
X0i = 1 , untuk i = 1, 2, 3, ...,n
Model sampel di atas terlihat bahwa koefisien b0 mengandung nilai
X0i. dimana nilainya sama dengan 1. Pemberian peubah tiruan X0i
bertujuan agar b0 dapat dihitung bersamaan dengan koefisien yang lainnya.
Untuk menduga koefisien b0, b1, b2, b3 dapat menggunakan metode
kuadrat terkecil yang dibantu dengan matriks.
Y = X b XT = XT X b (XT.X)-1 XT Y = (XT.X)-1 (XT.X) b = I b b = (XT.X)-1 XT Y [ ] = [ ] [ ]
Persamaan-persamaan di atas dapat diselesaikan secara serentak dengan menggunakan metode eliminasi, juga dengan metode Cramer. Sebaiknya pada permulaan sebelum mengidentifikasikan model regresi apa yag diperkirakan sesuai, maka perlu dilihat arah kecenderungan data untuk memperoleh gambaran awal kira-kira model regresi apa yang cocok, apakah model regresi linier atau regresi non linier.
Apabila data merupakan model regresi non linier, maka sebelum melakukan analisis perlu terlebih dahulu ditransformasikan agar
apabila data mempunyai jarak atau interval yang sama, maka untuk
memudahkan analisis regresi dapat dilakukan transformasi dari peubah asli menjadi peubah kode yaitu sebagai berikut :
Xi = { Ti – ( Tmin + Tmaks / 2} / { Tmaks – Tmin ) / 2 }
Dimana:
Xi = peubah bebas kode Ti = peubah bebas asli
Untuk mengetahui model regresi yang terbaik menggunakan analisis ragam regresi polinomial berderajat tiga. Pengujian untuk menentukan model regresi yang sesuai dilakukan mulai derajat yang paling rendah sampai dengan tiga, tetapi pengujian dapat dihentikan apabila diketahui bahwa tidak ada gunanya derajat yang lebih tinggi diuji. Berikut ini analisis ragam polinomial derajat tiga :
SK Db JK KT Regresi Kubik (pada X, X2, X3) 3 JKR3 KTR3 / 3 Regresi kuadratik (pada X, X2) 2 JKR2 KTR2 Sokongan oleh X3/(X, X2) 1 ( n-4 ) JKK2 = JKR3 – JKR2 JKS2 = JKT – JKR3 KTK2 = JKK2 KTS2 = JKS2 / (n-4) Dimana: JKRS = ∑ bs { ∑ XiS Yi – ( ∑ XiS ∑ Yi ) / n } JKt = ∑ Yi2 – ( ∑ Yi )2 / n
Fhitung = KTR / KTsisa dan Fhitung= KTS KTsisa
Untuk dapat menguji ketepatan model regresi, maka jumlah kuadrat galat perlu dipecah menjadi jumlah kuadrat galat murni dan jumlah kuadrat simpangan dari model (Gasperz 1900). Sehingga kuadratnya dapat ditulis sebagai berikut:
JKG = JKGM + JKSDM
JKGM = ∑{ ∑ Yi2 – ( ∑ Yi )2 / ni}
JKSDG = JKG JKGM
Xi = ulangan pada peubah bebas ke-i
Yi = pengamatan peubah tidak bebas ke-i
ni = banyaknya ulangan pada peubah bebas ke-i
Untuk menjelaskan keragaman pada regresi yang sesuai adalah dengan koefisien determinasi yaitu sebagai berikut:
R2 = JKregresi / JKtotal
Apabila persamaan regresi yang sesuai telah didapat maka dapat digunakan untuk peramalan pada peubah tidak bebas dan penentuan kondisi optimal pada peubah bebas. Namun dalam peramalan hanya berlaku pada daerah percobaan yang bersangkutan agar terhindar ekstrapolasi yang berlebihan. Tetapi sebelum melakukan penentuan kondisi optimal dan peramalan, maka perlu terlebih dahulu untuk melakukan pengujian keandalan model persamaan regresi yang telah dibangun. Dalam menentukan kondisi optimal pada peubah bebas agar diketahui kondisi yang maksimal dari peubah tidak bebas maka harus dipenuhi persyaratan sebagai berikut:
1. Syarat perlu:
δ ε / δx1 = 0 ; δ ε / δx2 = 0
2. Syarat cukup:
Determinai minor utama dari matriks Hessian (H) bersifat negatif, dimana matriks H yaitu:
H :
2) Menganalisa Model Regresi yang Telah Diperoleh
Jika telah diperoleh model regresi yang linear maka kita dapat melakukan analisa sebagai berikut:
1. Untuk menguji model regresi digunakan uji F, dengan hipotesis sebagai berikut
: model regresi berarti
Dengan alat bantu minitab, diperoleh nilai dari Anova, dan dari tabel
dapat diperoleh . Terima jika dan tolak jika .
2. Uji Koefisien regresi
Untuk menguji koefisien regresi menggunakan uji T, dengan hipotesis sebagai berikut
, artinya variabel bebas tidak berpengaruh terhadap variabel terikat. , artinya variabel bebas berpengaruh terhadap variabel terikat. Dengan alat bantu minitab, diperoleh nilai dari Anova, dan dari tabel dapat diperoleh . Terima jika dan tolak jika
.
3. Uji asumsi analisis regresi a) Normal residual
Untuk menguji kenormalan residual kita gunakan alat bantu minitab dan uji Anderson Darling dan mencari nilai P_value, dan dengan hipotesis sebagai berikut:
: Residual berdistribusi normal. : Residual tidak berdistribusi normal.
Untuk menentukan menolak atau menerima , dilakukan perbandingan P_value dengan suatu nilai (taraf kepercayaan) dengan ketentuan sebagai berikut:
, jika data diperoleh dari penelitian di lapangan. , jika data diperoleh dari penelitian di laboratorium. , jika data diperoleh dari penelitian terhadap manusia atau binatang.
, dalam bidang kedokteran. Terima jika P_value ,
Tolak jika P_value . b) Kebebasan residual
Untuk menguji kebebasan residual dilihat dari autokorelasi fungsi untuk residual. Homogenitas residual bersifat homogen atau tidak saling bebas jika ada korelasi antar sisa.
c) Homogenitas
Untuk mengetahui apakah sisa antara variable terikat dengan variable bebas mempunyai keragaman yang homogen, atau tidak menunjukkan kecenderungan tertentu. Jika standar sisa 95% berada diantara (-2,2) secara merata maka sisa dikatakan berada dalam sebaran sehingga mempunyai keragaman yang tetap.
Jika asumsi kehomogenan ini terpenuhi maka secara otomatis asumsi normalitas akan dipenuhi, jika sumsi ini tidak dipenuhi maka dilakukan cara untuk mengatasi salah satunya dengan cara melakukan transformasi terhadap data tersebut.
2.2 Aplikasi
Foto Copy “AREMA” menerima foto copy setiap harinya. Tetapi dalam makalah ini, banyaknya foto copy akan kami akumulasikan dalam setiap minggu dari bulan Juni – September 2011. Anggap 1 bulan = 4 minggu. Berikut data yang berhasil diperoleh :
X : Minggu ke-n
Y : Banyaknya Foto copy/rim
Minggu ke- (X) Banyaknya Foto copy/rim (Y) Minggu ke- (X) Banyaknya Foto copy/rim (Y) 1 43 9 62 2 49 10 61 3 52 11 56 4 58 12 55 5 62 13 62 6 58 14 63 7 59 15 66 8 62 16 72
Regresi linear
Persamaan regresi linear dari data yaitu Y = 49,3 + 1,12 X dengan grafik sebagai berikut:
Keterangan grafik:
Dari minitab diperoleh grafik yang menunjukkan taksiran garis regresi yang linier dengan koefisien determinasi ( ) sebesar 60.2% dan sisanya sebesar 39.8%. Ini menunjukkan bahwa keragaman variabel mempengaruhi sebesar 60.2%, sedangkan 39.8% dipengaruhi oleh variabel lain yang tidak masuk dalam model.
Regression
The regression equation is y = 49,3 + 1,12 x
Predictor Coef StDev T P Constant 49,250 2,346 20,99 0,000 x 1,1176 0,2427 4,61 0,000 S = 4,474 R-Sq = 60,2% R-Sq(adj) = 57,4% Analysis of Variance Source DF SS MS F P Regression 1 424,71 424,71 21,21 0,000 Residual Error 14 280,29 20,02 Total 15 705,00
Dari gambar di atas kita mengetahui bahwa R-Sq=60,2%, sedangkan apabila data tersebut merupakan model liniear seharusnya R-Sq mendekati 95%. Jadi dari uji linear ini kita mengetahui bahwa data yang kita peroleh tidak cocok menggunakan model liniear. Sehingga kita mencoba menguji data yang kita peroleh
menggunakan uji kuadratik seperti di bawah ini.
Regresi non-linear berderajat dua (kuadratik)
Persamaan regresi linear dari data yaitu Y = 46,6429 + 1,98669X - 5,11E-02X2 dengan grafik sebagai berikut:
Keterangan grafik:
Dari minitab diperoleh grafik yang menunjukkan taksiran garis regresi yang linier dengan koefisien determinasi ( ) sebesar 62.4% dan sisanya sebesar 37.6%. Ini menunjukkan bahwa keragaman variabel mempengaruhi sebesar 62.4%, sedangkan 37.6% dipengaruhi oleh variabel lain yang tidak masuk dalam model.
Polynomial Regression Y = 46,6429 + 1,98669X - 5,11E-02X**2 R-Sq = 62,4 % Analysis of Variance SOURCE DF SS MS F P Regression 2 439,633 219,817 10,7685 1,74E-03 Error 13 265,367 20,413
Total 15 705,000
SOURCE DF Seq SS F P Linear 1 424,706 21,2130 4,08E-04 Quadratic 1 14,927 0,731264 0,407958
Dari gambar di atas kita mengetahui bahwa R-Sq=62,4%, sedangkan apabila data tersebut merupakan model non-liniear berderajat dua seharusnya R-Sq mendekati 95%. Jadi dari uji non-linear berderajat dua ini kita mengetahui bahwa data yang kita peroleh tidak cocok menggunakan model non-liniear berderajat dua. Sehingga kita mencoba menguji data yang kita peroleh menggunakan uji kubik seperti di bawah ini.
Regresi non-linear berderajat tiga (kubik)
Dari minitab diketahui persamaan regresi non linear yang berbentuk kubik, yaitu
Y = 32,8159 + 10,4864X - 1,26401X2 + 4,76E-02X3, dengan grafik sebagai berikut:
Keterangan grafik:
Dari minitab diperoleh grafik yang menunjukkan taksiran garis regresi yang non linier dengan koefisien determinasi ( ) sebesar 91.5% dan sisanya sebesar 8.5%. Ini menunjukkan bahwa keragaman variabel mempengaruhi sebesar 91.5%, sedangkan 8.5% dipengaruhi oleh variabel lain yang tidak masuk dalam model.
Polynomial Regression Y = 32,8159 + 10,4864X - 1,26401X**2 + 4,76E-02X**3 R-Sq = 91,5 % Analysis of Variance SOURCE DF SS MS F P Regression 3 644,825 214,942 42,8634 1,09E-06 Error 12 60,175 5,015 Total 15 705,000 SOURCE DF Seq SS F P Linear 1 424,706 21,2130 4,08E-04 Quadratic 1 14,927 0,731264 0,407958 Cubic 1 205,192 40,9192 3,42E-05
Dari gambar di atas kita mengetahui bahwa R-Sq=91,5% merupakan model non-liniear berderajat tiga yang R-Sq mendekati 95% dibandingkan model linear dan model non-linear berderajat dua. Selain itu garis regresi mengikuti polt data. Jadi dari uji non-linear berderajat tiga ini kita mengetahui bahwa data yang kita peroleh cocok menggunakan model non-liniear berderajat tiga.
Model regresi yang telah diperoleh dapat kita analisis sebagai berikut:
1) Menguji model regresi
Model regresi Y = 49,3 + 1,12 X dan Y = 32,8159 + 10,4864X -
1,26401X2 + 4,76E-02X3 signifikan, karena: Data di atas dari data lapangan maka α = 0,05 Dari minitab diperoleh ANOVA sebagai berikut:
Polynomial Regression Y = 32,8159 + 10,4864X - 1,26401X**2 + 4,76E-02X**3 R-Sq = 91,5 % Analysis of Variance SOURCE DF SS MS F P Regression 3 644,825 214,942 42,8634 1,09E-06 Error 12 60,175 5,015
Total 15 705,000
SOURCE DF Seq SS F P Linear 1 424,706 21,2130 4,08E-04 Quadratic 1 14,927 0,731264 0,407958 Cubic 1 205,192 40,9192 3,42E-05
Dari ANOVA di atas diperoleh Fhitung Linear = 21,21, Fhitung Kuadratik =
0,73, Fhitung Kubik = 40,91. Untuk menguji model regresi digunakan uji F,
dengan hipotesis sebagai berikut: H0 : Model regresi tidak berarti
H1 : Model regresi berarti
Dari tabel didapat Ftabel=1,0000
Karena Fhitung < Ftabel pada regresi kuadratik maka menerima H0, jadi
model regresi tidak berarti dan tidak signifikan. Sedangkan Fhitung > Ftabel
pada regresi linear dan kubik maka menolak H0, jadi model regresi berarti
sehingga dapat disimpulkan bahwa model regresi signifikan. 2) Menguji koefisien regresi
Karena maka menggunakan uji T untuk menguji koefisian regresi, dengan hipotesis sebagai berikut:
Terima jika dan tolak jika .
artinya variabel bebas tidak berpengaruh terhadap variabel terikat.
artinya variabel bebas berpengaruh terhadap variabel terikat. Dengan alat bantu minitab, diperoleh
Regression
The regression equation is y = 49,3 + 1,12 x
Predictor Coef StDev T P Constant 49,250 2,346 20,99 0,000 x 1,1176 0,2427 4,61 0,000 S = 4,474 R-Sq = 60,2% R-Sq(adj) = 57,4% Analysis of Variance
Source DF SS MS F P Regression 1 424,71 424,71 21,21 0,000 Residual Error 14 280,29 20,02
Total 15 705,00
Hasil uji koefisien kemiringan garis regresi menunjukkan adanya pengaruh menit ( ) terhadap pengunjung ( ) dengan nilai , jadi
. Tanpa mencari dapat diketahui dari ( )
( ). Karena maka menolak dengan kata lain hipotesis artinya variabel bebas berpengaruh terhadap variabel terikat diterima. Jadi variabel bebas ( ) sangat mempengaruhi variabel tak bebas ( ).
3) Uji asumsi analisis regresi a) Uji Normalitas
Residual berdistribusi normal, karena:
Dari minitab diperoleh nilai P-value beserta grafiknya sebagai berikut:
Karena p-value = 0.284> 0,05 sehingga terima H0, jadi residual
berdistribusi normal. b) Uji Homogenitas
Untuk menguji homogenitas kita gunakan alat bantu minitab sebagai berikut:
Dari grafik di atas dapat dilihat bahwa standart sisa 95% berada di antara (-4, 3). Data sebagian besar menyebar, tidak membentuk lonceng dan merupakan data acak. Jadi data tersebut bersifat Homogen.
c) Uji Kebebasan
Ada autokorelasi atau data tidak saling bebas, karena:
Untuk menguji kebebasan residual dilihat dari autokorelasi fungsi untuk residual dengan menggunakan alat bantu minitab. Selain itu juga bisa menggunakan individual chart.
Dari I Chart dapat dilihat bahwa tidak ada data yang melebihi garis merah maka tidak ada data pencilan yang harus dihapus.
Dari Autocorelation dapat dilihat bahwa ada data yang melebihi garis merah maka dapat disimpulkan bahwa data tidak saling bebas.
BAB III PENUTUP
3.1 Kesimpulan
Regresi dapat dibedakan menjadi dua jenis, yaitu regresi linier dan non linier. Regresi linier merupakan regresi yang datanya membentuk persamaan linier dan grafiknya mendekati garis lurus, sedangkan regresi non linier merupakan regresi yang datanya membentuk persamaan non linier dan kurvanya lengkung.
Jika data yang diperoleh membentuk regresi yang non linier maka harus dilinierkan dulu dengan menggunakan transformasi yang sesuai. Untuk regresi non linier model kubik Y = 0X0i + 1Xi + 2Xi2 + 3Xi3 + ε.
Pendugaan model tentunya harus memperhatikan teori dari ilmu yang melandasinya atau melatarbelakanginya, apakah pola hubungan tersebut linier maupun non linier. Model regresi polinomial merupakan peningkatan orde yang lebih tinggi dari bentuk linier dan pada umumnya orde tertinggi yang biasa digunakan sampai orde tiga atau bentuk regresi kubik. Konsep pendugaan parameter persamaan garisnya sama dengan regresi linier sederhana yakni menggunakan metode kuadrat terkecil.
Dari aplikasi diatas disimpulkan bahwa hasil datanya merupakan model dari regresi non-linear berderajat tiga (kubik) dengan persamaan Y = 32,8159
+ 10,4864X - 1,26401X2 + 4,76E-02X3. Persamaan regresi linearnya adalah Y
= 49,3 + 1,12 X dan persamaan regresi non-linear berderajat dua (kuadratik)
adalah Y = 46,6429 + 1,98669X - 5,11E-02X2. Dari analisis didapat bahwa model signifikan, berdistribusi normal, homogen, tidak saling bebas dan menolak H0 karena P value > 0.05.
Lampiran
Data banyaknya foto copy yang diakumulasikan dalam setiap minggu dari bulan Juni – September 2011 pada Foto Copy “AREMA” yang menerima foto copy setiap harinya.
Bulan Minggu ke- Banyaknya Foto copy/rim
Juni I 43 II 49 III 52 IV 58 Juli I 62 II 58 III 59 IV 62 Agustus I 62 II 61 III 56 IV 55 September I 62 II 63 III 66 IV 72 Tertanda,