ARTIKEL Kornelius Ronald Demu M0113025 1

(1)

PADA DATA INDEKS PEMBANGUNAN MANUSIA (IPM) DI INDONESIA

Kornelius Ronald Demu, Dewi Retno Sari Saputro, Purnami Widyaningsih Program Studi Matematika FMIPA UNS

Abstrak. Standar ukur pembangunan manusia di suatu negara ditetapkan dalam Indeks Pembangunan Manusia (IPM). Beberapa faktor diduga memengaruhi IPM di Indonesia, yaitu angka harapan hidup, PDRB, jumlah penduduk miskin, dan persentase penduduk buta huruf. Pengaruh faktor-faktor tersebut terhadap IPM di Indonesia dapat diketahui melalui model regresi. Apabila data IPM dan faktor-faktor tersebut diplotkan maka me-nunjukkan pola data yang bersifat tidak mengikuti pola tertentu, sehingga data IPM di Indonesia dapat diterapkan pada model regresi nonparametrik spline truncated. Model regresi nonparametrikspline truncated terbaik dipengaruhi oleh pemilihan orde dan titik

knotoptimal. Dalam artikel ini diterapkan model regresi nonparametrikspline truncated

orde satu dengan 3,4, dan 5 titikknot pada data IPM di Indonesia. Berdasarkan pene-litian, diperoleh kombinasi titikknot optimal 5-5-5-4 dengan angka harapan hidup dan persentase penduduk buta huruf yang memengaruhi IPM di Indonesia.

Kata Kunci: IPM, model regresi nonparametrik, spline truncated, titik knot optimal. 1. Pendahuluan

Indeks Pembangunan Manusia (IPM) merupakan standar ukur pembangunan

manusia di suatu negara dengan mempertimbangkan aspek kesehatan, pendidikan,

dan kelayakan hidup. Dalam beberapa tahun terakhir, IPM di Indonesia

menun-jukkan peningkatan. Berdasarkan data BPS [2], pada tahun 2013, IPM di Indonesia

68.1%, kemudian dalam kurun waktu dua tahun berturut-turut meningkat menjadi

68.4% dan 68.6%. Faktor-faktor yang diduga memengaruhi IPM yaitu, angka

ha-rapan hidup, produk domestik regional bruto (PDRB), jumlah penduduk miskin,

dan persentase penduduk buta huruf (UNDP [9]). Pengaruh faktor-faktor

terse-but terhadap IPM dapat diketahui melalui model regresi. Apabila data IPM dan

faktor-faktor tersebut diplotkan, maka menunjukkan pola data yang bersifat tidak

mengikuti pola tertentu. Pendekatan model regresi yang digunakan pada pola data

tersebut adalah model regresi nonparametrik (Eubank [5]).

Menurut Hardle [7], metode yang dapat digunakan pada model regresi

non-parametrik yaitu spline. Metode spline memiliki fleksibilitas dalam mengatasi pola

data yang bersifat tidak mengikuti pola tertentu. Spline merupakan potongan

fung-si polinomial yang memiliki fung-sifat tersegmen. Spline truncated merupakan modifikasi

fungsi spline. Metode spline truncated dilakukan menggunakan titik knot

(Budi-antara [3]). Titik knot merupakan titik terjadinya perubahan perilaku pola data

(2)

diperoleh berdasarkan titikknot optimal (Budiantara [3]). Titik knot optimal

dipe-roleh berdasarkan nilai generalized cross validation (GCV) minimum (Wahba [10]).

Menurut Lee [8], estimasi parameter model regresi nonparametrik spline truncated

menggunakan metode kuadrat terkecil (MKT). Penelitian ini bertujuan untuk

me-nerapkan model regresi nonparametrik spline truncated pada data IPM di Indonesia

dan menentukan faktor yang memengaruhi IPM di Indonesia.

2. Model Regresi Nonparametrik Spline Truncated

Model regresi nonparametrikspline truncated merupakan model regresi

pende-katan nonparametrik dengan fungsi regresi yang berbentuk polinomial spline

trun-cated (Budiantara [3]). Menurut Hardle [7], polinomial spline truncated berorde m

dengan titik knot (K1, K2, ..., Kr) didefinisikan sebagai

f(xi) = β0+ Σsl=1Σmj=1βjxj_li+ Σrk=1βj+k(xli−Kkl)m+

dengan

(xli−Kkl)m+ =

{

(x_li−K_kl)m, x_li ≥K_kl; 0, x_li < K_kl.

β₀ adalah intersep, β_j adalah parameter model, j = 1,2, . . . , m, β_j₊_k adalah para-meter model pada orde ke-j dan titik knot ke-k,k = 1,2, . . . , r,r adalah banyaknya titik knot, K_kl adalah titik knot ke-k pada variabel prediktor ke-l, l = 1,2, . . . , s,

dan x_li adalah nilai variabel prediktor ke-l pada pengamatan ke-i, i= 1,2, . . . , n.

3. Pemilihan Titik Knot Optimal

Model regresi nonparametrik spline truncated terbaik diperoleh berdasarkan titik knot optimal. Menurut Wahba [10], titik knot optimal diperoleh berdasarkan nilai GCV minimum. Rumus GCV dituliskan sebagai

GCV(K1, K2, ..., Kr) =

M SE(K1, K2, ..., Kr)

(n−1trace[I−A(K₁, K₂, ..., K_r)])2

dengan M SE(K1, K2, ..., Kr) = n−1Σni=1(yi −f(xi))2 dan A(K1, K2, ..., Kr)

meru-pakan matriks yang diperoleh dari rumus X_K(X′ KXK)

−1 X_K′ .

4. Metode Penelitian

4.1. Data Penelitian. Penelitian ini merupakan penelitian terapan yaitu mene-rapkan data IPM untuk 34 provinsi di Indonesia menggunakan model regresi

non-parametrik spline truncated. Data yang digunakan adalah data sekunder dari BPS

(3)

harapan hidup menurut provinsi (X1), PDRB menurut pengeluaran tahunan

provin-si (X2), jumlah penduduk miskin menurut provinsi (X3), dan persentase penduduk

buta huruf menurut provinsi (X₄).

4.2. Langkah Penelitian. Langkah-langkah yang dilakukan pada penelitian ini di-mulai dari dibentuknya pola hubungan antara variabel respon dan masing-masing

variabel prediktor melalui scatter plot data. Kemudian ditentukan titik knot

opti-mal pada masing-masing variabel prediktor. Selanjutnya ditentukan model regresi

nonparametrik spline truncated terbaik berdasarkan titik knot optimal. Setelah itu

dilakukan estimasi parameter model dengan MKT. Tahapan terakhir penelitian ini

adalah dilakukannya uji signifikansi parameter, uji asumsi sisaan dan ditentukan

ko-efisien determinasi (R2_{) pada model regresi nonparametrik}_{spline truncated} _terbaik.

5. Hasil dan Pembahasan

5.1. Pola Hubungan Variabel Respon dan Variabel Prediktor. Pemilihan model regresi pendekatan nonparametrik dalam memodelkan data IPM di Indonesia

disebabkan oleh pola hubunganY dengan masing-masingX1,X2,X3, danX4bersifat

tidak mengikuti pola tertentu. Dua pola hubunganY dengan masing-masingX₁ dan

[image:3.595.167.455.530.643.2]

X₂ ditunjukkan pada Gambar 1(a) dan 1(b).

Gambar 1. Dua pola hubungan (a) Y danX1, (b)Y danX2

Berdasarkan Gambar 1(a) dan 1(b), nampak bahwa dua pola hubungan Y de-ngan masing-masingX1danX2 bersifat tidak mengikuti pola tertentu. Sama halnya

dengan pola hubungan Y dengan masing-masing X₃ dan X₄, sehingga pendekatan

model regresi yang digunakan adalah model regresi nonparametrik. Spline truncated

merupakan metode dalam model regresi nonparametrik yang baik digunakan apabila

(4)

5.2. Model Regresi Nonparametrik Spline Truncated. Titik knot optimal sebagai indikator model regresi nonparametrik spline truncated terbaik diperoleh

melalui nilai GCV minimum. Nilai GCV minimum dipengaruhi oleh pemilihan

orde (m) dan banyaknya titik knot (r). Berdasarkan penelitian, dipilih orde

sa-tu. Banyaknya titik knot yang digunakan yaitu 3, 4, dan 5 titik knot. Titik knot

yang dipilih pada masing-masing variabel prediktor dimulai dari 3 karena

pemilih-an bpemilih-anyaknya titik knot < 3 bersifat tidak mewakili keseluruhan data. Sedangkan untuk pemilihan banyaknya titik knot >5 akan menghasilkan nilai GCV yang tidak

minimum. Setelah dipilih orde dan banyaknya titikknot, selanjutnya dilakukan

per-hitungan nilai GCV. Nilai GCV minimum berdasarkan banyaknya titik knot yang

[image:4.595.192.426.380.466.2]

digunakan pada masing-masing variabel prediktor ditunjukkan pada Tabel 1.

Tabel 1. Nilai GCV minimum berdasarkan banyaknya titik knot yang digunakan

No. r(X1)-r(X2)-r(X3)-r(X4) GCV minimum

1 3 - 3 - 3 - 3 8.3966

2 4 - 4 - 4 - 4 9.3048

3 5 - 5 - 5 - 5 9.9343

4 5-3-4-5, 5-5-5-4,etc. 7.6307

Berdasarkan Tabel 1, nilai GCV minimum sebesar 7.6307 diperoleh dari kom-binasi 5-5-5-4 titik knot yang merupakan titik knot optimal. Banyaknya titik knot

optimal pada variabel X1,X2, dan X3 sebanyak 5 titik knot, sedangkan banyaknya

titik knot optimal pada variabel X₄ sebanyak 4 titik knot. Setelah diperoleh titik

knot optimal pada masing-masing variabel prediktor, dilakukan estimasi 24 para-meter model dengan MKT. Hasil estimasi parapara-meter model regresi nonparametrik

spline truncated dengan titik knot optimal ditunjukkan pada Tabel 2.

Tabel 2. Hasil estimasi parameter model

Parameter Estimasi Parameter Estimasi Parameter Estimasi ˆ

β0 −150.029 βˆ8 2.17312 ×10−

4 ˆ

β16 −2.05421 ×10− 2

ˆ

β1 3.45006 βˆ9 −1.73979 ×10−

4 ˆ

β17 0.003598 ˆ

β2 −18.1289 βˆ10 8.90236 ×10−

5 _ˆ

β18 2.29005 ×10− 2

ˆ

β3 30.1189 βˆ11 −8.86224 ×10−

5 _ˆ

β19 −19.6633 ˆ

β4 −20.0487 βˆ12 4.30924 ×10−

4 _ˆ

β20 20.2997

ˆ

β5 5.73218 βˆ13 8.08703 ×10−3 βˆ21 −0.58512 ˆ

β6 −18.646 βˆ14 −3.57964 ×10−2 βˆ22 4.7376 ˆ

β7 −8.68926 ×10−

5 ˆ

β15 3.65047 ×10−

2 ˆ

[image:4.595.100.522.623.787.2]

(5)

Berdasarkan hasil estimasi parameter model pada Tabel 2, diperoleh model regresi nonparametrik spline berikut.

ˆ

y = −150.029 + 3.45006x1−18.1289(x1−66.7) + 30.1189(x1−67.4)−

20.0487(x1−68.4) + 5.73218(x1−69.5)−18.646(x1−72.5)−

8.6892610×10−5_x

2+ 2.17312×10−4(x2−80461.57)−

1.73979×10−4₍_x

2−141270.88) + 8.90236×10−5(x2−252022.86)−

8.86224×10−5₍_x

2−450936.6) + 4.30924×10−4(x2−1354102.11) +

8.08703×10−3_x

3−3.57964×10−2(x3−245.54) + 3.65047×10−2

(x₃−495.56)−2.05421×10−2₍_x

3−893.21) + 0.003598(x3−1005.68) +

2.29005×10−2₍_x

3−1608.14)−19.6633x4+ 20.2997(x4−0.55)−

0.58512(x4−3.55) + 4.7376(x4−7.79)−5.54316(x4−9.4)+.

Model regresi nonparametrikspline yang terbentuk dapat dituliskan kembali da-lam bentuk model regresi nonparametrik spline truncated. Penulisan model regresi nonparametrik spline truncated dilakukan berdasarkan interval titik knot optimal pada masing-masing variabel prediktor. Berikut dituliskan model regresi nonpara-metrik spline truncated berdasarkan interval titik knot optimal pada X1. Adapun

titik knot optimal pada variabel X1 yaitu 66.7, 67.4, 68.4, 69.5, dan 72.5.

ˆ

y =

          

         

−150.029 + 3.45006x1, x1 <66.7;

1059.168−14.67884x1, 66.7≤x1<67.4;

−970.84 + 15.44x₁, 67.4≤x₁<68.4; 400.49−4.6087x1, 68.4≤x1<69.5; 2.1 + 1.12348x1, 69.5≤x1<72.5; 1359.35−17.5223x1, x1 ≥72.5.

Model regresi nonparametrik spline truncated berdasarkan interval titik knot

optimal pada X2,X3, danX4 dituliskan dengan cara yang sama. Titikknot optimal

pada variabel X2 yaitu 80461.57, 141270.88, 252022.86, 450936.6, dan 1354102.11.

Titik knot optimal pada variabel X₃ yaitu 245.54, 495.56, 893.21, 1005.68, dan 1608.14. Titik knot optimal pada variabel X4 yaitu 0.55, 3.55, 7.79, dan 9.4.

5.3. Uji Signifikansi Parameter. Setelah didapatkan model regresi nonparame-trik spline truncated berdasarkan interval titik knot optimal pada masing-masing

X₁, X₂, X₃, dan X₄, selanjutnya dilakukan uji signifikansi parameter. Uji signifi-kansi parameter bertujuan untuk mengetahui variabel prediktor yang berpengaruh

signifikan terhadap variabel respon (Gujarati [6]). Uji signifikansi parameter terdiri

(6)

5.3.1. Uji Keseluruhan. Hipotesis yang digunakan adalah H0 : β1 = β2 = β3 =

. . . = β23 = 0 (seluruh parameter model β tidak berpengaruh signifikan terhadap

model regresi) danH₁ : paling tidak terdapat satuβ_h ̸= 0, h= 1,2,3, . . . ,23 (paling tidak terdapat satu parameter model βh yang signifikan terhadap model regresi). Taraf signifikansi α = 0.05. Kesimpulan H0 ditolak jika DK = {Fhitung|Fhitung >

F₍_α,h,n₋_h₋₁₎ = F₀_.₀₅_,₂₃_,₁₀ = 2.75}. Statistik uji F_hitung = 8.6640. Karena 8.6640 ∈ DK, H0 ditolak yang berarti paling tidak terdapat satu parameter model βh yang signifikan terhadap model regresi. Kemudian dilakukan uji parsial untuk mengetahui

parameter model yang signifikan terhadap model regresi secara individu.

5.3.2. Uji Parsial. Hipotesis yang digunakan adalah H0 : βh = 0, h = 1,2, . . . ,23 (parameter model β_h tidak signifikan terhadap model regresi) dan H₁ :β_h ̸= 0, h=

1,2, . . . ,23 (parameter model β_h signifikan terhadap model regresi). Taraf signifi-kansi α = 0.05. Kesimpulan H0 ditolak jika DK = {thitung|thitung > t(α/2,n−h) =

t₀_.₀₂₅_,₁₁ = 2.20}. Berdasarkan nilai t_hitung, diperoleh parameter model yang signi-fikan dengan nilai t_hitung melebihi 2.20, masing-masing β₁ = 38.76, β₂ = 203.69,

β3 = 338.41, β4 = 225.27, β5 = 64.41, β6 = 209.51, β19 = 108.22, β20 = 111.27,

β₂₁ = 3.22, β₂₂ = 26.07 dan β₂₃ = 30.5. Karena nilai t_hitung dari β₁, β₂, β₃, β₄, β₅, β₆, β₁₉, β₂₀, β₂₁, β₂₂, dan β₂₃ ∈ DK, maka β₁, β₂, β₃, β₄, β₅, β₆, β₁₉, β₂₀, β₂₁, β₂₂, dan β23 merupakan parameter model yang signifikan terhadap model regresi. Hal

ini mengindikasikan angka harapan hidup (X₁) dan persentase penduduk buta huruf (X₄) merupakan variabel yang berpengaruh signifikan terhadap IPM di Indonesia.

Setelah dilakukan uji signifikansi parameter pada model regresi nonparametrik

spline truncated yang terbentuk, selanjutnya dilakukan uji asumsi sisaan untuk

menguji kelayakan model regresi.

5.4. Uji Asumsi Sisaan. Uji asumsi sisaan bertujuan untuk menguji kelayakan model regresi (Gujarati [6]). Uji asumsi sisaan meliputi 3 asumsi yang harus

dipe-nuhi, yaitu asumsi kenormalan, independensi, dan heteroskedastisitas. Pengujian

asumsi kenormalan dilakukan menggunakan uji Kolmogorov Smirnov

(Bintarini-ngrum dan Budiantara [1]). Pengujian asumsi independensi dilakukan menggunakan

uji Durbin Watson (Gujarati [6]). Pengujian asumsi heteroskedastisitas dilakukan

(7)

5.4.1. UjiKolmogorov Smirnov. Hipotesis yang digunakan adalahH0 : sisaan

berdis-tribusi normal dan H1 : sisaan tidak berdistribusi normal. Taraf signifikansi yang

digunakan pada penelitian yaitu, α= 0.05. Kesimpulan pada ujiKolmogorov

Smir-nov yaitu,H0 ditolak jikaDK ={KS|KS > q(1−α,n) =q(0.950,34)= 0.152}. Statistik uji Kolmogorov Smirnov (KS) =0.076. Karena 0.076̸∈ DK, H0 tidak ditolak yang

berarti sisaan berdistribusi normal. Asumsi kenormalan dipenuhi.

5.4.2. Uji Durbin Watson. Hipotesis yang digunakan adalah H₀ : tidak terdapat

autokorelasi pada sisaan dan H1 : terdapat autokorelasi pada sisaan. Taraf

sig-nifikansi yang digunakan pada penelitian yaitu, α = 0.05. Kesimpulan pada uji

Durbin Watson yaitu, H₀ ditolak jika DK = {d_hitung|d_hitung < d_l = 1.21 atau 4−dhitung < du = 1.73}. Statistik uji dhitung = 1.43 dan 4−dhitung = 2.57 . Ka-rena statistik uji d_hitung dan 4−d_hitung ̸∈ DK, H₀ tidak ditolak yang berarti tidak

terdapat autokorelasi pada sisaan. Asumsi independensi dipenuhi.

5.4.3. Uji Glejser. Hipotesis yang digunakan adalah H₀ : tidak terdapat

hetero-skedastisitas pada sisaan dan H1 : terdapat heteroskedastisitas pada sisaan. Taraf

signifikansi yang digunakan pada penelitian yaitu, α = 0.05. Kesimpulan H₀

di-tolak jika DK = {F_hitung|F_hitung > F₍_α,h₋₁_,n₋_h₎ = F₀_.₀₅_,₂₂_,₁₁ = 2.60}. Statistik uji

Fhitung =0.1979. Karena 0.1979̸∈DK,H0 tidak ditolak yang berarti tidak terdapat

heteroskedastisitas pada sisaan. Asumsi heteroskedastisitas dipenuhi.

5.5. Koefisien Determinasi. Koefisien determinasi (R2) pada model regresi di-hitung untuk mengetahui seberapa besar variabel respon dijelaskan oleh variabel

prediktor (Drapper and Smith [4]). Berdasarkan perhitungan, nilai R2 adalah

R2 = Σ n

i=1( ˆyi−y)¯ 2 Σn

i=1(yi−y¯)2

= 541.946

573.2278 = 0.9454

Berdasarkan model regresi yang terbentuk, diperoleh nilai R2 _{sebesar 0.9454. Hal}

tersebut mengindikasikan IPM di Indonesia dapat dijelaskan sebesar 94.54% oleh

angka harapan hidup dan persentase penduduk buta huruf. Sedangkan sisanya,

5.46% merupakan persentase faktor lain yang belum dimasukkan dalam model.

6. Kesimpulan

(8)

(1) Model regresi nonparametrik spline truncated pada data IPM di Indonesia yang sesuai adalah

ˆ y =                                             

−150.029 + 3.45006x₁, x₁ <66.7;

1059.168−14.67884x1, 66.7≤x1 <67.4;

−970.84 + 15.44x1, 67.4≤x1 <68.4; 400.49−4.6087x1, 68.4≤x1 <69.5; 2.1 + 1.12348x1, 69.5≤x1 <72.5; 1359.35−17.5223x1, x1 ≥72.5;

−150.029−19.6633x4, x4 <0.55;

−161.1938 + 0.6364x₄, 0.55≤x₄ <3.55;

−159.1166 + 0.05128x4, 3.55≤x4 <7.79;

−196.0225 + 4.7888x4, 7.79≤x4 <9.4;

−143.9168−0.75428x4, x4 ≥9.4.

(2) Faktor yang memengaruhi IPM di Indonesia yaitu angka harapan hidup

me-nurut provinsi (X₁) dan persentase penduduk buta huruf menurut provinsi (X4).

Daftar Pustaka

[1] Bintariningrum, M. F., dan I. N. Budiantara,Pemodelan Regresi Nonparametrik Spline Trun-cated dan Aplikasinya pada Angka Kelahiran Kasar Di Surabaya, Jurnal Sains dan Seni Pomits

Vol.3(2014), no. 1, 7-12.

[2] BPS, [Badan Pusat Statistik], Indeks Pembangunan Manusia di Negara Indonesia, Jakarta, 2015.

[3] Budiantara, I. N.,Penelitian Bidang Regresi Spline Menuju Terwujudnya Penelitian Statistika yang Mandiri dan Berkarakter, Seminar Nasional Matematika, Jurusan Matematika Universitas Pendidikan Ganesha, Bali, 2011.

[4] Drapper, N. R., and H. Smith, Applied Regression Analysis, Second edition, John Wiley and Sons, Inc., New York, 1992.

[5] Eubank, R. L.,Spline Smoothing and Nonparametric Regression, Second edition, Marcel Dek-ker, New York, 1999.

[6] Gujarati, N. D.,Essential Of Econometrics, Mc Graw-Hill. Inc, New York, 2006.

[7] Hardle, W.,Applied Nonparametric Regression, Cambridge University Press, New York, 1994. [8] Lee, T. C. M.,On Algorithms For Ordinary Least Squares Regression Spline Fitting:A

Compa-rative Study, Statistica,Vol.72(2002), no.8, 647-663.

[9] UNDP, [United Nations Development Programme], Human Development Report, New York, 1990.

[10] Wahba, G.,Spline Models For Observational Data, SIAM, Pennsylvania, 1990.