Pemodelan Angka Putus Sekolah Usia SMA di Jawa Timur dengan Pendekatan
Regresi Spline Multivariabel
Seminar Hasil Tugas Akhir
Mega Pradipta 1309100038
Pembimbing I : Dra. Madu Ratna, M.Si
Pembimbing II : Prof. Dr.Drs.I Nyoman Budiantara, M.S
PENDAHULUAN
TINJAUAN PUSTAKA
METODOLOGI PENELITIAN
ANALISIS DAN PEMBAHASAN
KESIMPULAN DAN SARAN
Kesejahteraan
Permasalah pendidikan
Angka putus sekolah pada usia SMA tahun 2011 sebesar
0.84 persen.
usia SD 0,14 persen usia SMP 0.4 persen
angka partisipasi usia SMA adalah 54,97 persen. Artinya hanya 55 persen saja anak usia SMA yang
Analisis regresi Parametrik Semiparametrik
Nonparametrik
Regresi Spline
Pemodelan Angka Putus Sekolah Usia SMA di Jawa Timur dengan Pendekatan Regresi Spline Multivariabel
• Pengaruh Kemampuan Ekonomi Keluarga dan Motivasi Belajar terhadap Kecenderungan Putus Sekolah Anak Usia Sekolah di Desa Dedel Kelurahan Lau Kecamatan Dawe Kabupaten Kudus Tahun 2008
Rahmawati (2008)
• Pemodelan Angka Putus Sekolah bagi Anak Usia Wajib Belajar di Jawa Timur dengan Pendekatan Generalized Poisson Regression
Wijayanti (2011)
Penelitian Sebelumnya
Pemodelan Nilai UN dengan pendekatan regresi semiparametrik spline di SMKN 1 Nguling Pasuruan
Purwahyuningsih (2010)
Faktor-Faktor yang Memepengaruhi Angka Buta Huruf (ABH) Kabupaten/Kota di Jawa Timur dengan Regresi Spline
Consetta (2013)
1
• Bagaimanakah karakteristik angka putus sekolah usia SMA di Jawa Timur secara deskriptif?
2
• Bagaimanakah pemodelan faktor-faktor yang
mempengaruhi angka putus sekolah usia SMA di Jawa
Timur dengan regresi spline?
1
• Menganalisis karakteristik angka putus sekolah usia SMA di Jawa Timur secara deskriptif.
2
• Memodelkan faktor-faktor yang mempengaruhi angka
putus sekolah usia SMA di Jawa Timur dengan regresi
spline
Manfaat
• 1. Menambah wawasan keilmuan dalam
penggunaan metode regresi spline pada bidang sosial
• 2. Memberikan
informasi terkait angka putus sekolah usia SMA di Jawa Timur dan
faktor-faktor yang mempengaruhinya
Batasan Masalah
• - Data yang digunakan pada penelitian ini
adalah data Badan Pusat Statistik hasil Susenas 2011 di 38
kabupaten/kota Provinsi Jawa Timur.
• - Pemilihan titik knot optimal menggunakan metode GCV
(Generalized Cross
Validation).
Regresi Parametrik Semiparametrik Nonparametrik Analisis Regresi
Analisis regresi merupakan salah satu analisis dalam statistika yang
digunakan untuk menyelidiki pola hubungan fungsional antara variabel
respon dan variabel prediktor.
Regresi nonparametrik merupakan metode pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuk kurva regresinya atau tidak terdapat informasi masa lalu yang lengkap tentang bentuk pola data
Regresi Nonparametrik
Bentuk umum model regresi Spline
dengan
k = Titik knot merupakan titik perpaduan bersama di mana terdapat perubahan pola perilaku pada interval yang berbeda
Regresi Nonparametrik Spline
J
j
m j i j m
j
j i j
i x x k
x F
1 0
) (
)
(
j i
j i m j m i
j
i x k
k x k
k x
x 0 ;
;
Pemilihan Titik Knot Optimal dan Model Terbaik menggunakan Metode Generalized Cross Validation (GCV)
Dengan
Titik knot yang optimal diperoleh dari nilai GCV yang paling minimum.
Pemilihan model terbaik
1 2
21
2 1 2
1 ( , , , )
) , , , ) (
, , , (
J J
J n tr I A K K K
K K
K K MSE
K K GCV
Uji Serentak Uji individu
Daerah kritis: tolak jika lebih besar dari
Daerah kritis: tolak jika lebih besar dari
Pengujian Signifikansi Parameter
Uji Asumsi Residual
Residual identik
Uji Glejser
Residual independen ACF
Residual berdistribusi Normal Uji Kolmogorov Smirnov
k n
e e
k e e
F n
i
i i n
i i
hitung
1
2 1
2
ˆ |)
|
| (|
1
|)
| ˆ | (|
) ( (x)
F S x
maks
D
Putus Sekolah
Putus sekolah adalah proses berhentinya siswa
secara terpaksa dari suatu lembaga pendidikan tempat dia
belajar atau terlantarnya anak dari sebuah lembaga
pendidikan formal, yang disebabkan oleh berbagai faktor.
Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh dari data Badan Pusat Statistik Jawa Timur dan data Dinas Pendidikan dan Kebudayaan Jawa Timur pada tahun 2011.
Unit sampel adalah 38 kab/kota di Jawa Timur
Variabel Keterangan Variabel
Y Angka putus sekolah usia SMA Kab/Kota di Jawa Timur
X1 Persentase keluarga miskin X2 Laju pertumbuhan ekonomi X Persentase sekolah
1. Melakukan analisis deskriptif karakteristik angka putus sekolah usia SMA di Jawa Timur, persentase keluarga miskin, laju pertumbuhan ekonomi , persentase jumlah sekolah, persentase tenaga pengajar
2. Memodelkan faktor-faktor yang mempengaruhi angka putus sekolah usia SMA di Jawa Timur dengan regresi spline multivariabel
a) Membuat scatterplot variabel respon dengan masing-masing variabel prediktor untuk mengetahui pola hubungan antara variabel respon dan variabel prediktor
b) Memodelkan variabel respon dengan berbagai model Spline dan berbagai titik knot c) Menetukan titik knot optimal berdasarkan nilai GCV minimum
d) Menentukan model Spline terbaik.
e) Menguji signifikansi parameter secara serentak dan individu.
f) Melakukan uji IIDN pada residual
g) Menghitung koefisien determinasi dan MSE
h) Menginterpretasikan hasil yang diperoleh dan mengambil kesimpulan.
0 0.5 1 1.5 2 2.5 3 3.5
mojokerto ngawi madiun pacitan pamekasan tuban pasuruan sidoarjo Surabaya gresik bangkalan sampang probolinggo kota malang situbondo magetan tulungagung sumenep lamongan kota madiun ponorogo bojonegoro blitar nganjuk malang jombang trenggalek kediri lumajang banyuwangi jember kota mojokerto kota probolinggo kota kediri kota batu kota pasuruan bondowoso kota blitar
Persentase Angka Putus Sekolah Usia SMA
Variabel Rata-rata Varians Minimum Maksimum
Y 0.9820 0.4610 0.2000 3.0300
X1 13.8160 34.6390 4.7400 30.2100
X2 6.8560 0.4160 6.1400 9.2000
X3 0.2453 0.0069 0.1530 0.5038
X4 7.558 13.7120 3.5660 18.6630
Sampang Kota Batu
Bojonegoro Sampang
Kediri Kota Madiun
30 25 20 15 10 5 3.0 2.5 2.0 1.5 1.0 0.5
0.0
penduduk miskin
angka putus sekolah
9.5 9.0 8.5 8.0 7.5 7.0 6.5 6.0 3.0 2.5 2.0 1.5 1.0 0.5
0.0
laju pertumbuhan ekonomi
angka putus sekolah
0.55 0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 3.0 2.5 2.0 1.5 1.0 0.5
0.0
persentase sekolah
angka putus sekolah
20.0 17.5 15.0 12.5 10.0 7.5 5.0 3.0 2.5 2.0 1.5 1.0 0.5
0.0
persentase tenaga pengajar
angka putus sekolah
Scatterplot antara Angka Putus
Sekolah (Y) dengan variabel
yang diduga Berpengaruh
Pemilihan Titik Knot Optimal dengan 1 Titik Knot
Model
ˆ ˆ ˆ ( ) ˆ ˆ ( )
ˆ 0 1x1 2 x1 K1 3x2 4 x2 K2
y
ˆ ( ) ˆ ˆ ( )
ˆ5x3 6 x3 K3 7x4 8 x4 K4
No x1 x2 x3 x4 GCV
1 .9380 6.7645 0.2246 6.6473
0.4636 2 12.5369 7.0767 0.2604 8.1878
0.4805 3 15.1359 7.3890 0.2962 9.7283
0.4110 4 16.1755 7.5139 0.3105 10.3445
0.4001 5 17.2151 7.6388 0.3248 10.9607 0.4065
Pemilihan Titik Knot Optimal dengan 2 Titik Knot
Model
ˆ0 ˆ1 1 ˆ2( 1 1) ˆ3( 1 2) ˆ4 2
ˆ x x K x K x
y
) ˆ ( ) ˆ ˆ ( ) ˆ (
5 3 8 3 7 4
2 6 3
2
5 x K x K x x K
) ˆ ˆ ( ) ˆ ( )
ˆ (
8 4
12 7
4 11 4
10 6
3
9 x K x x K x K
No X1 X2 X3 X4 GCV
1 10.4578 6.8269 0.2318 6.9554
0.3898 15.1359 7.389 0.2962 9.7283
2 10.4578 6.8269 0.2318 6.9554
0.3972 16.6953 7.5763 0.3177 10.6526
3 10.9776 6.8894 0.2389 7.2635
0.3959 13.5765 7.2016 0.2747 8.804
4 10.9776 6.8894 0.2389 7.2635
0.3988 15.6557 7.4514 0.3033 10.0364
5 12.0171 7.0143 0.2532 7.8797
0.3815 12.5369 7.0767 0.2604 8.1878
Pemilihan Titik Knot Optimal dengan 3 Titik Knot
Model
ˆ ˆ ˆ ( ) ˆ ( ) ˆ ( ) ˆ 0 1x1 2 x1 K1 3 x1 K2 4 x1 K3
y
ˆ ( ) ˆ ( ) ˆ ( ) ˆ5x2 6 x2 K4 7 x2 K5 8 x2 K6
ˆ ( ) ˆ ( ) ˆ ( ) ˆ9x3 10 x3 K7 11 x3 K8 12 x3 K9
ˆ ( ) ˆ ( ) ˆ ( )
ˆ13x4 14 x4 K10 15 x4 K11 16 x4 K12
No X1 X2 X3 X4 GCV
1
9.938 6.7645 0.2246 6.6473
0.3524
10.9776 6.8894 0.2389 7.2635
13.0567 7.1392 0.2675 8.4959
2
9.938 6.7645 0.2246 6.6473
0.3589
10.9776 6.8894 0.2389 7.2635
15.1359 7.389 0.2962 9.7283
3
9.938 6.7645 0.2246 6.6473
0.334
11.4973 6.9518 0.2461 7.5716
12.0171 7.0143 0.2532 7.8797
4
10.4578 6.8269 0.2318 6.9554
0.3125
10.9776 6.8894 0.2389 7.2635
12.0171 7.0143 0.2532 7.8797
Pemilihan Titik Knot Optimal dengan 4 Titik Knot
No X1 X2 X3 X4 GCV
1
5.6183 6.2455 0.1651 4.0870
0.3337
10.0097 6.7731 0.2256 6.6898
10.8879 6.8786 0.2377 7.2104
16.1576 7.5117 0.3103 10.3338
2
6.4966 6.3510 0.1772 4.6075
0.3177
9.1314 6.6676 0.2135 6.1693
10.8879 6.8786 0.2377 7.2104
17.0359 7.6172 0.3224 10.8544
3
6.4966 6.3510 0.1772 4.6075
0.3292
9.1314 6.6676 0.2135 6.1693
13.5228 7.1952 0.2740 8.7721
14.4010 7.3007 0.2861 9.2927
4
9.1314 6.6676 0.2135 6.1693
0.2810
10.0097 6.7731 0.2256 6.6898
10.8879 6.8786 0.2377 7.2104
12.6445 7.0897 0.2619 8.2516
5
9.1314 6.6676 0.2135 6.1693
0.2968
10.0097 6.7731 0.2256 6.6898
10.8879 6.8786 0.2377 7.2104
X
1
X
2
X
3
X
4
2 1 1 2
12.0171; 12.5369 7.5139
0.3105 7.8797; 8.1878
0.3118
Pemilihan Titik Knot Optimal dengan kombinasi Titik Knot
No
Variabel Prediktor
Kombinasi Titik
Knot Titik-Titik Knot GCV
1
X1 2 12.0171;
12.5369
0.3118
X2 1 7.5139
X3 1 0.3105
X4 2 7.8797; 8.1878
2
X1 3 10.4578;
10.9776;
12.0171
0.2772
X2 3 6.8269; 6.8894;
7.0143
X3 1 0.3105
X4 3 6.9554; 7.2635;
7.8797
3
X1 4 9.1314; 10.0097;
10.8879;
0.3026 12.6445
X2 3 6.8269; 6.8894;
Model Regresi GCV
1 titik knot 0.4001
2 titik knot 0.3815
3 titik knot 0.3125
4 titik knot 0.2810
Kombinasi titik knot 0.2772
Model terbaik
-0.3274 0.1381 -4.2647( 10.4578)
ˆ x1 x1
y
10.9776) 1.4826( 12.0171) (
5.4882 x1 x1
6.8269) 21.3459( 6.8894) (
19.7799 -
0.4464x2 x2 x2
7.0143) 10.3427 -15.3575( 0.3105) (
1.3540
- x2 x3 x3
0.8529( 6.9554) 1.2041( 7.2635) 0.7153
- x4 x4 x4
Model regresi nonparametrik spline linier multivariabel
menghasilkan koefisien determinasi sebesar 77.3740 persen dan MSE sebesar 0.1678.
Model
Pengujian Signifikansi Parameter Secara Serentak
Source of
Variation df
Sum of Square
Mean
Square Fhitung P-value Regression 14 13.1949 0.9425
5.6181 0.0001 Residual 23 3.8585 0.1678
Total 37 17.0534
* : signifikan pada alpha 0.05
Pengujian Signifikansi Parameter Secara Individu
Variabel Parameter Koefisien P-value Keterangan
X1 β1 0.1381 0.1021 Tidak Signifikan
β2 -4.2647 0.0014 Signifikan
β3 5.4882 0.0020 Signifikan
β4 -1.4826 0.0089 Signifikan
X2 β5 0.4464 0.5057 Tidak Signifikan
β6 -19.7799 0.0206 Signifikan
β7 21.3459 0.0440 Signifikan
β8 -1.3540 0.6814 Tidak Signifikan
X3 β9 10.3427 0.0012 Signifikan
β10 -15.3575 0.0011 Signifikan
X4 β11 -0.7153 0.0001 Signifikan
β12 0.8529 0.6211 Tidak Signifikan
β13 1.2041 0.6121 Tidak Signifikan
Pengujian Asumsi Residual Identik
2.5 2.0
1.5 1.0
0.5 0.0
0.50
0.25
0.00
-0.25
-0.50
-0.75
yhat
res
Scatterplot antara Residual dan Fit
Uji Glejser
Source of Variation
df Sum of Square
Mean Square
Fhitung P-value
Regressi
on 14 0.62292 0.04450
1.97 0.061 Residual 23 0.52064 0.02264
Total 37 1.34356
Asumsi residual identik terpenuhi
Pengujian Asumsi Residual Independen
10 9 8 7 6 5 4 3 2 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0
Lag
Autocorrelation
Plot ACF
0
0 : i
H 0
1 : i
H
(tidak ada korelasi antar residual) ( ada korelasi antar residual)
Karena tidak terdapat lag yang keluar maka asumsi independen pada residual terpenuhi.
Pengujian Asumsi Residual Berdistribusi Normal
0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 99
95 90
80 70 60 50 40 30 20
10 5
1
res
Percent
Mean -2.74936E-12
StDev 0.3229
N 38
KS 0.107
P-Value >0.150
Uji Kolmogorov Smirnov
0 : H
re sidu al berdi str ibu si norm al
H0: Residual berdistribusi Normal
H1: Residual tidak berdistribusi Normal
Asumsi residual berdistribusi
normal terpenuhi
Hubungan persentase penduduk miskin (X1) terhadap (Y)
0.1381 - 4.2647 ( 10.4578 )
ˆ x
1x
1y
10.9776 ) 1.4826 ( 12.0171 ) (
5.4882 x
1x
1
0171 .
12
; 1687
. 2 1210
. 0
0171 .
12 9776
. 10
; 6479 .
15 3616
. 1
9776 .
10 4578
. 10
; 5994 .
44 1266
. 4
4578 .
10
; 0.1381
1 1
1 1
1 1
1 1
x x
x x
x x
x x
Hubungan laju pertumbuhan ekonomi (X2) terhadap (Y)
0.4464 -19.7799( 6.8269) 21.3459( 6.8894)
ˆ x2 x2 x2
y
7.0143 )
( 1.3540
- x
2
0143 .
7
; 5277
. 2 6584
. 0
0143 .
7 8894
. 6
; 0251
. 12 0124
. 2
8894 .
6 8269
. 6
; 0353 .
135 3335
. 19
8269 .
6
; 0.4464
2 2
2 2
2 2
2 2
x x
x x
x x
x x
Hubungan persentase sekolah (X3) terhadap (Y)
10.3427 - 15.3575 ( 0.3105 )
ˆ x
3x
3y
3105 .
0
; 7685 .
4 0148
. 5
3105 .
0
; 3427
. 10
3 3
3 3
x x
x x
Hubungan persentase tenaga pengajar (X4) terhadap (Y)
0.7153 0.8529 ( 6.9554 )
1.2041 ( 7.2635 )
ˆ x
4x
4x
4y
7.8797 )
( 1.3732
- x
4
8797 .
7
; 8579
. 3 0315
. 0
8797 .
7 2635
. 7
; 6783 .
14 3417
. 1
2635 .
7 9554
. 6
; 9323 .
5 1376
. 0
9554 .
6
; 0.7153
-
4 4
4 4
4 4
4 4
x x
x x
x x
x x
1. Rata-rata angka putus sekolah usia SMA di Jawa Timur pada tahun 2011 adalah sebesar 0.9820 dengan varians sebesar 0.4610. Angka putus sekolah usia SMA terendah sebesar 0.2000 yaitu berada di Kabupaten Mojokerto. Kota Blitar menyumbang angka putus sekolah usia SMA tertinggi sebesar 3.0300.
2. Model regresi nonparametrik spline multivariabel terbaik yang terbentuk adalah model regresi spline linier dengan kombinasi knot. Nilai GCV yang diperoleh sebesar 0.2772 dengan Rsquare yaitu sebesar 77.3740 persen, sedangkan nilai MSEnya adalah 0.1678. Persamaan modelnya adalah sebagai berikut
-0.3274 0.1381 -4.2647( 10.4578)
ˆ x1 x1
y
10.9776) 1.4826( 12.0171) (
5.4882 x1 x1
6.8269) 21.3459( 6.8894) (
19.7799 -
0.4464x2 x2 x2
7.0143) 10.3427 -15.3575( 0.3105) (
1.3540
- x2 x3 x3
0.8529( 6.9554) 1.2041( 7.2635) 0.7153
- x4 x4 x4
7.8797)
( 1.3732
- x4
3. Variabel-variabel yang berpengaruh terhadap angka putus sekolah usia SMA
Jawa Timur adalah persentase penduduk miskin, laju pertumbuhan ekonomi,
persentase sekolah, dan persentase tenaga pengajar.
1. Pada penelitian selanjutnya dapat dilakukan penambahan variabel prediktor yang mempengaruhi angka putus sekolah usia SMA di Jawa Timur.
2. Penelitian ini masih terbatas menggunakan regresi Spline linier atau orde
satu. Pada penelitian selanjutnya dapat mencoba menggunakan regresi
spline orde dua atau orde tiga.
Badan Pusat Statistik. 2011, Indikator Pendidikan Ekonomi dan Sosial Provinsi Jawa Timur, Jakarta: BPS.
Budiantara, I.N. 2005, Model Spline Multivariabel dalam Regresi Nonparametrik. Makalah Seminar Nasional Matematika, Jurusan Matematika ITS Surabaya.
Budiantara, I.N. 2007, Model Keluarga Spline Polinomial Truncated Dalam Regresi Semiparametrik. Jurnal Matematika, Ilmu Pengetahuan Alam dan Pengajarannya (MIPA), Vol. 36, No.1, pp. 1-16. Malang:
Universitas Negeri Malang.
Budiantara, I. N. 2009, Spline dalam Regresi Nonparametrik dan Semiparametrik: Sebuah Pemodelan
Statistika Masa Kini dan Masa Mendatan". Pidato Pengukuhan untuk Jabatan Guru Besar dalam Bidang Ilmu Matematika Statistika dan Probabilitas, pada Jurusan Statistika, Fakultas MIPA. Surabaya: ITS Press.
Consetta, E. G. D. 2013, Tugas Akhir: Faktor-Faktor yang Memepengaruhi Angka Buta Huruf (ABH)
Kabupaten/Kota di Jawa Timur dengan Regresi Spline Semiparametrik, Surabaya: Institut Teknologi Sepuluh Nopember Surabaya.
Eubank, R. L. 1988, Spline Smoothing and Nonparametric Regression, New York: Marcel Deker Grahacendekia.2009, Anak Putus Sekolah dan Cara pembinaannya. Diunduh dari alamat
http://www.google.co.id/putus sekolah/Re-ferensi Penelitian Skripsi-Tesis pada Jumat 1 Februari 2012, 08.00 am
Gujarati, D. N. 2006, Dasar-Dasar Ekonometrika Edisi Pertama, Jakarta: Erlangga.
Rahmawati. 2008, Pengaruh Kemampuan Ekonomi Keluarga dan Motivasi Belajar terhadap
Kecenderungan Putus Sekolah Anak Usia Sekolah di Desa Dedel Kelurahan Lau Kecamatan Dawe Kabupaten Kudus Tahun 2008, Surakarta: Program Sarjana, Universitas Muhammadiyah.
Rasiyo. 2008, Pemerataan Pendidikan Belum Tercapai. Diunduh dari alamat
http://els.bappenas.go.id/upload/kliping/Pemerataan%20Pendidikan%20blm.pdf pada Kamis, 31 Januari 2013, 10.00 am.
Septiana, L. 2011, Tugas Akhir: Pemodelan Remaja Putus Sekolah Usia SMA di Provinsi Jawa Timur dengan Menggunakan Metode Regresi Spasial, Surabaya: Institut Teknologi Sepuluh Nopember Surabaya.
Wahba G. 1990, Spline Models for Observational Data, SIAM, Philadelphia. CBMS-NSF Regional Conference Series in Applied Mathematics, Vol. 59.
Wijayanti, T C. 2011, Tugas Akhir: Pemodelan Angka Putus Sekolah bagi Anak Usia Wajib Belajar di Jawa Timur dengan Pendekatan Generalized Poisson Regression, Surabaya: Institut Teknologi Sepuluh Nopember Surabaya.
Pemodelan Angka Putus Sekolah Usia SMA di Jawa Timur dengan Pendekatan
Regresi Spline Multivariabel
Seminar Hasil Tugas Akhir
Mega Pradipta 1309100038
Pembimbing I : Dra. Madu Ratna, M.Si
Pembimbing II : Prof. Dr.Drs.I Nyoman Budiantara, M.S