• Tidak ada hasil yang ditemukan

PEMILIHAN MODEL TERBAIK DENGAN METODE BACKWARD, FORWARD, STEPWISE, DAN BEST SUBSET PADA INDEKS PEMBANGUNAN MANUSIA (IPM) PROVINSI KALIMANTAN BARAT TAHUN 2020

N/A
N/A
068@Khalishah Ghina Fallah

Academic year: 2023

Membagikan "PEMILIHAN MODEL TERBAIK DENGAN METODE BACKWARD, FORWARD, STEPWISE, DAN BEST SUBSET PADA INDEKS PEMBANGUNAN MANUSIA (IPM) PROVINSI KALIMANTAN BARAT TAHUN 2020"

Copied!
19
0
0

Teks penuh

(1)

PEMILIHAN MODEL TERBAIK DENGAN METODE BACKWARD, FORWARD, STEPWISE, DAN BEST SUBSET PADA INDEKS

PEMBANGUNAN MANUSIA (IPM) PROVINSI KALIMANTAN BARAT TAHUN 2020

Disusun Oleh:

Putri Rahmadanti H1091211051

PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS TANJUNGPURA

2022

(2)

1. PENDAHULUAN

Indeks Pembangunan Manusia (IPM) adalah ukuran perbandingan dari harapan hidup, melek huruf, pendidikan dan standar hidup. IPM menjelaskan bagaimana penduduk dapat mengakses hasil pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan, dan sebagainya.

IPM diperkenalkan oleh Program Pembangunan Perserikatan Bangsa-Bangsa (PPPBB) pada tahun 1990 dan diterbitkan secara berkala dalam Laporan Pembangunan Manusia (LPM) setiap tahunnya. IPM digunakan untuk klasifikasi apakah sebuah negara adalah negara maju, negara berkembang atau negara terbelakang dan juga untuk mengukur pengaruh dari kebijaksanaan ekonomi terhadap kualitas hidup.

Menurut Badan Pusat Statisitik (BPS), Indeks Pembangunan Manusia (IPM) memiliki beberapa manfaat. IPM Sebagai indikator penting untuk mengukur keberhasilan dalam upaya membangun kualitas hidup manusia (masyarakat/penduduk) yang nantinya dapat menentukan peringkat atau level pembangunan suatu wilayah/negara. Bagi Indonesia, IPM merupakan data strategis karena selain sebagai ukuran kinerja pemerintah, IPM juga digunakan sebagai salah satu alokator penentuan Dana Alokasi Umum (DAU).

Indeks Pembangunan Manusia (IPM) memiliki tiga dimensi yang digunakan sebagai dasar penghitungannya. Pertama, kesehatan yang diukur dengan angka harapan hidup saat kelahiran. Kedua, pendidikan yang dihitung dari angka harapan sekolah dan angka rata-rata lama sekolah. Ketiga, standar hidup layak yang dihitung dari produk nasional bruto per kapita.

Dalam bidang statistika salah satu metode yang dapat menyelesaikan masalah ini adalah dengan menggunakan analisis regresi linier. Analisis regresi merupakan analisis yang dapat digunakan untuk mengkaji pengaruh variabel independen terhadap variabel dependen dan meramalkan variabel dependen berdasarkan variabel independen.

Berdasarkan banyaknya variabel independen yang digunakan analisis regresi linier terbagi atas dua jenis yaitu regresi linier sederhana dan regresi linier berganda. Regresi linier sederhana merupakan model regresi linier yang terdiri dari satu variabel dependen (Y) dan satu variabel independen (X), sedangkan regresi linier berganda merupakan model regresi yang terdiri dari satu variabel tak bebas dan memiliki lebih dari satu variabel bebas.

Dalam analisis regresi linier berganda dikenal beberapa metode untuk menentukan model terbaik, yaitu metode backward, forward, stepwise, dan best subset.

Penelitian ini akan dilakukan untuk menentukan model terbaik atau variabel independent yang paling berpengaruh untuk kasus Indeks Pembangunan Manusia (IPM).

2. PEMBAHASAN

2.1. Data dan Variabel Praktikum

Data yang digunakan dalam praktikum ini merupakan data sekunder, yang diperoleh dari Badan Pusat Statistik (BPS) Provinsi Kalimantan Barat. Jumlah sampel dalam penelitian ini berjumlah 1 yang merupakan data Indeks

(3)

Pembangunan Manusia pada tahun 2020. Variabel yang dilibatkan dalam penelitian ini terdiri dari 5, yaitu 1 variabel dependen dan 4 variabel independen.

Variabel dependen (Y) dalam praktikum ini adalah Indeks Pembangunan Masyarakat (IPM) Provinsi Kalimantan Barat pada tahun 2020, sedangkan variabel independent (X) terdiri dari:

( X1 )

Umur Harapan Hidup Penduduk Usia 0 Tahun Provinsi Kalimantan Barat pada Tahun 2020.

( X2 )

Jumlah Penduduk Miskin Provinsi Kalimantan Barat pada Tahun 2020.

( X3 )

Rata-rata Lama Sekolah (RLS) Provinsi Kalimantan Barat pada Tahun 2020.

( X4 )

Rumah Tangga dengan Akses Air Minum Bersih Provinsi Kalimantan Barat pada Tahun 2020.

2.2. Rumusan Masalah

Berdasarkan latar belakang dan data yang telah dijabarkan, maka dirumuskan permasalahan tentang variabel independen manakah yang merupakan model terbaik?

2.3. Metode Praktikum

Dalam menentukan model regresi, variabel bebas dapat masuk dalam model secara bersama-sama atau satu persatu. Jika variabel bebas masuk dalam model secara bersama-sama maka penghitungan akan ringkas, akan tetapi tidak akan kelihatan apa yang terjadi dalam penghitungan tersebut karena setiap variabel bebas yang masuk memberikan pengaruh yang berbeda, tergantung pada urutan variabel bebas tersebut yang masuk dalam model. Namun tidak berarti semua variabel yang masuk dalam model regresi menjadikan model tersebut model yang terbaik (Sembiring,1995). Model regresi terbaik adalah model yang dapat menjelaskan perilaku peubah tak bebas dengan sebaik-baiknya dengan memilih peubah-peubah bebas dari sekian banyak peubah bebas yang tersedia dalam data.

Metode yang digunakan untuk mengatasi kesulitan yang dihadapi dalam menentukan model terbaik dapat digunakan dengan beberapa cara yaitu metode prosedur eliminasi langkah mundur (the backward elimination), prosedur eliminasi maju (the forward elimination), prosedur regresi bertatar (the stepwise

(4)

regression procedure), serta regresi himpunan bagian terbaik (best subset regression).

2.4. Prosedur dan Hasil Praktikum

Prosedur dalam praktikum ini dapat diuraikan sebagai berikut:

1. Membentuk persamaan regresi linier dengan metode backward.

a. Metode backward menggunakan excel.

- Masukkan data ke excel.

- Pada metode backward dilakukan eliminasi satu persatu variabel X yang memiliki p-value > α terbesar dan paling mendekati |1|.

Diperlukan uji regresi untuk mendapatkan nilai p-value.

- Cara mencari nilai regresi adalah memilih menu: data, data analysis, regression.

- Masukkan variabel Y pada kotak input Y range dan semua variabel X pada kotak input X range, centang labels in first row jika label kolom

(5)

ikut dimasukkan, dan masukkan cell kosong pada output range untuk output nilai regresi.

- Diperoleh hasil regresi sebagai berikut

Dari hasil uji diatas, variabel X2 memiliki nilai p-value terbesar yaitu 0,80. Maka variabel X2 dihapus.

- Regresikan kembali variabel Y dengan variabel X yang tersisa, yaitu X1, X3,dan X4 .

- Diperoleh hasil regresi sebagai berikut

Dari hasil uji diatas, variabel X1 memiliki nilai p-value terbesar yaitu 0,71. Maka variabel X1 dihapus.

- Regresikan kembali variabel Y dengan variabel X yang tersisa, yaitu X3dan X4 .

- Diperoleh hasil regresi sebagai berikut

Dari hasil uji diatas, variabel X4 memiliki nilai p-value > α (5%) yaitu 0,28. Maka variabel X4 dihapus.

(6)

- Langkah terakhir adalah uji regresi antara variabel Y dan X3 . Diperoleh hasil sebagai berikut.

Dapat dilihat bahwa model terbaik yang diperoleh dari metode backward menggunakan excel adalah variabel X3 , karena p-value <

α.

- Jadi, diperoleh persamaan regresi dari model terbaik metode backward menggunakan excel adalah Y = 39.22 + 3.91 X3 .

b. Metode backward menggunakan minitab.

- Masukkan data ke minitab.

- Pilih menu: stat, regression, regression, fit regression model.

- Masukkan variabel Y pada kotak responses dan semua variabel X pada kotak continuous predictors.

- Kemudian klik stepwise… dan akan muncul kotak dialog seperti berikut. Lalu pilih backward elimination pada method dan pilih

(7)

include details for each step pada display the table of model selection details.

- Diperoleh hasil metode backward seperti berikut.

Dapat dilihat bahwa model terbaik yang diperoleh dari metode backward menggunakan minitab adalah variabel X3 .

- Jadi, diperoleh persamaan regresi dari model terbaik metode backward menggunakan minitab adalah Y = 39.22 + 3.91 X3 .

2. Membentuk persamaan regresi linier dengan metode forward.

a. Metode forward menggunakan excel.

- Memasukkan data ke excel.

- Identifikasi satu persatu hubungan (korelasi) variabel X dan variabel Y yang memiliki nilai korelasi paling besar. Cara menghitung nilai

(8)

korelasi antara variabel X dan Y adalah memilih menu: data, data analysis, correlation

- Selanjutnya akan muncul kotak dialog seperti ini:

- Masukkan semua variabel (X dan Y) pada kotak input range, centang labels in first row jika label kolom ikut dimasukkan, dan masukkan cell kosong pada output range untuk output nilai korelasi.

- Diperoleh nilai korelasi seperti berikut

Dari hasil penghitungan korelasi tersebut, didapat urutan nilai korelasi terbesar ke terkecil adalah X3, X1, X4, dan X2 .

- Maka dengan urutan tersebut, uji regresi satu persatu variabel yang akan dimasukkan ke dalam model.

(9)

- Mencari nilai regresi adalah memilih menu: data, data analysis, regression.

- Masukkan variabel Y pada kotak input Y range dan variabel X1 pada kotak input X range, centang labels in first row jika label kolom ikut dimasukkan, dan masukkan cell kosong pada output range untuk output nilai regresi.

- Ulangi uji regresi tersebut untuk X1, X2,dan X3 .

- Setelah dilakukan uji regresi, diperoleh ringkasan seperti berikut.

Diperoleh hasil regresi seperti di atas dan hanya X3 yang signifikan. Artinya hanya model X3 yang memnuhi syarat sebagai model terbaik.

- Jadi, diperoleh persamaan regresi dari model terbaik metode forward menggunakan minitab adalah Y = 39.21 + 3.91 X3 .

(10)

b. Metode forward menggunakan minitab.

- Masukkan data ke minitab.

- Pilih menu: stat, regression, regression, fit regression model.

- Masukkan variabel Y pada kotak responses dan semua variabel X pada kotak continuous predictors.

- Kemudian klik stepwise… dan akan muncul kotak dialog seperti berikut. Lalu pilih forward selection pada method dan pilih include details for each step pada display the table of model selection details.

(11)

- Diperoleh hasil metode forward seperti berikut.

Dapat dilihat bahwa model terbaik yang diperoleh dari metode forward menggunakan minitab adalah variabel X3 .

- Jadi, diperoleh persamaan regresi dari model terbaik metode forward menggunakan minitab adalah Y = 39.22 + 3.91 X3 .

3. Membentuk persamaan regresi linier dengan metode stepwise.

a. Metode stepwise menggunakan excel.

- Memasukkan data ke excel.

- Pada metode stepwise, Hitung koefisien korelasi setiap variabel independen dengan variabel dependen. Cara menghitung nilai korelasi antara variabel X dan Y adalah memilih menu: data, data analysis, correlation

(12)

- Selanjutnya akan muncul kotak dialog seperti ini:

- Masukkan semua variabel (X dan Y) pada kotak input range, centang labels in first row jika label kolom ikut dimasukkan, dan masukkan cell kosong pada output range untuk output nilai korelasi.

- Diperoleh nilai korelasi seperti berikut

Dari hasil penghitungan korelasi tersebut, didapat nilai korelasi terbesar dan paling mendekati |1| adalah variabel X3 . Maka X3 adalah variabel pertama yang masuk ke dalam model.

- Estimasi model regresi dengan variabel X3 .

(13)

Didapat p-value < α (5%), maka variabel X3 signifikan masuk ke dalam model.

- Hitung korelasi parsial variabel independen tersisa, X1 , X2 , dan X4 dengan Y, sebagai variabel kontrol adalah variabel yang sudah masuk ke dalam model, X3 .

- Uji korelasi kembali tanpa memasukkan variabel X3 .

Berdasarkan output di atas, X1 mempunyai koefisien korelasi parsial paling mendekati |1|, sehingga X1 masuk ke dalam model setelah X3 .

- Estimasi kembali model regresi, dengan memasukkan variabel X1 setelah X3 .

Didapat p-value X1 > α (5%), maka variabel X1 tidak masuk ke dalam model. Sedangkan p-value X3 < α (5%), maka variabel

X3 signifikan yang artinya tetap masuk ke dalam model.

- Hitung korelasi parsial variabel independen tersisa, X2 dan X4

dengan Y, sebagai variabel kontrol adalah variabel yang sudah masuk ke dalam model, X3 .

- Uji korelasi kembali tanpa memasukkan variabel X1dan X3 .

Berdasarkan output di atas, X4 mempunyai koefisien korelasi parsial paling mendekati |1|, sehingga X4 masuk ke dalam model setelah X3 .

- Estimasi kembali model regresi, dengan memasukkan variabel X4

setelah X3 .

(14)

Didapat p-value X4 > α (5%), maka variabel X4 tidak masuk ke dalam model. Sedangkan p-value X3 < α (5%), maka variabel

X3 signifikan yang artinya tetap masuk ke dalam model.

- Estimasi kembali model regresi dengan memasukkan variabel tersisa, X2 , setelah X3 .

Berdasarkan output di atas, p-value X2 > α (5%), maka variabel X2 tidak masuk ke dalam model. Sedangkan p-value X3 < α (5%).

- Maka, hanya variabel X3 signifikan dan masuk ke dalam model.

- Jadi, diperoleh persamaan regresi dari model terbaik metode forward menggunakan excel adalah Y = 39.28 + 3.92 X3 .

b. Metode stepwise menggunakan minitab.

- Masukkan data ke minitab.

- Pilih menu: stat, regression, regression, fit regression model.

- Masukkan variabel Y pada kotak responses dan semua variabel X pada kotak continuous predictors.

(15)

- Kemudian klik stepwise… dan akan muncul kotak dialog seperti berikut. Lalu pilih stepwise pada method dan pilih include details for each step pada display the table of model selection details.

- Diperoleh hasil metode stepwise seperti berikut.

(16)

Dapat dilihat bahwa model terbaik yang diperoleh dari metode stepwise menggunakan minitab adalah variabel X3 .

- Jadi, diperoleh persamaan regresi dari model terbaik metode stepwise menggunakan minitab adalah Y = 39.22 + 3.91 X3 .

4. Membentuk persamaan regresi linier dengan metode best subset menggunakan minitab.

- Masukkan data ke minitab.

- Pilih menu: stat, regression, regression, best subsets.

- Masukkan variabel Y pada kotak response dan semua variabel X pada kotak free predictors.

(17)

- Diperoleh hasil metode best subset seperti berikut.

Berdasarkan output tersebut, diperhatikan 3 kriteria untuk menentukan model terbaik, yaitu R-sq (adj) paling besar, S paling kecil, dan Cp Mallows paling mendekati jumlah variabel yang diestimasikan. Dari kriteria tersebut, harus dipertimbangkan pula variabel X yang paling sedikit, karena lebih sederhana maka semakin baik.

- Dengan memperhatikan pertimbangan tersebut, dipilihlah 1 variabel yaitu X3 , dengan R-sq (adj) 84.7, S 1.5698, dan Cp Mallows 0.3.

- Kemudian untuk mengecek benar atau tidaknya perkiraan tersebut dapat diuji dengan ilih menu: stat, regression, regression, fit regression model.

(18)

- Masukkan variabel Y pada kotak responses dan variabel X3 pada kotak continuous predictors.

- Lalu cek dengan klik stepwise… dan akan muncul kotak dialog seperti berikut. Lalu pastikan pilih none pada method.

- Kemudian didapat output seperti berikut

Dari output di atas p-value X3 < α (5%) yang artinya variabel dipertahnkan dan merupakan model terbaik dari metode best subset.

- Jadi, diperoleh persamaan regresi dari model terbaik metode best subset adalah Y = 39.22 + 3.91 X3 .

(19)

3. KESIMPULAN

Berdasarkan rumusan masalah, pembahasan dan hasil penelitian mengenai perbandingan metode backward, forward, stepwise, dan best subset pada regresi linier berganda, maka dapat diambil kesimpulan bahwa:

1. Model regresi yang dihasilkan dengan metode backward adalah:

Y = 39.22 + 3.91 X3

2. Model regresi yang dihasilkan dengan metode forward adalah:

Y = 39.22 + 3.91 X3

3. Model regresi yang dihasilkan dengan metode stepwise adalah:

Y = 39.22 + 3.91 X3

4. Model regresi yang dihasilkan dengan metode best subset adalah:

Y = 39.22 + 3.91 X3

Model regresi yang dihasilkan oleh metode backward, forward, stepwise, dan best subset hanya melibatkan satu variabel bebas ( X3 ), yaitu variabel Rata-rata Lama Sekolah (RLS) Provinsi Kalimantan Barat pada Tahun 2020 dengan nilai R2 yang sama yaitu sebesar 0,86 atau 86%. Sehingga tidak ada perbedaan model regresi baik menggunakan metode backward, forward, stepwise, dan best subset.

Referensi

Dokumen terkait