ESTIMASI PARAMETER REGRESI LOGISTIK DENGAN METODE
BOOTSTRAP DAN JACKKNIFE UNTUK SAMPEL KECIL
Dinda Tri Wisudawati1), Deden Istiawan2) Departemen Statistika, AIS Muhammadiyah Semarang
email: dindatriwisudawati@yahoo.co.id email: Dedenistiawan90@gmail.com
Abstract
Analysis about level of bankruptcies in the banking firm is usually reflected on finance report and it need to do because bank is necessary institute on economy. The method that can be used is logistic regression. It is generally used to determine a relationship between response variable which has only two or more possible values with one or more predictor variable. The usual method of logistic regression is Maximum Likelihood Estimation where the parameter estimation process is preceded by the formation of likelihood function. Logistic Regression Model Parameter Estimates with small sample is caused bias estimation, it is one of the problems of logistic regression. To solve the problem, it can use resampling on data with bootstrap and jackknife method. One of the advantages of both method is can solve the estimation problem with good level of accuracy. Bootstrap is resampling with replacement, whereas jackknife is resampling without replacement by deleting d observation from real sample. Computers are needed to use those methods. In this research, the best method will be chosen to get the best possible estimate based on small sample from the minimum standard error. The data from previously research is illustrated in determination about level of bankruptcies in the Indonesian banking firm. Based on the results, jackknife deleted-2 is the best method to reduce the standard errors the amount of 0,033971.
Keywords:Logistic Regression, Resampling, Bootstrap Method, Jackknife Method, Parameter Estimates
PENDAHULUAN
Statistika sudah banyak diketahui di kalangan masyarakat guna memperoleh suatu informasi. Upaya memperoleh dan mengolah informasi statistik mempunyai sejarah yang panjang, sepanjang peradaban manusia. Di Jepang, menurut Andrea Gabor pelajaran statistika telah diberikan sejak sekolah menengah umum (SMU), sehingga budaya statistika menjadi dasar bagi berkembangnya pengawasan mutu, dan pemahaman probabilitas telah memainkan peranan penting bagi suksesnya produk-produk Jepang (Suharyadi & Purwanto, 2009). Menurut Moore dalam (Sukestiyarno, 2013), secara sederhana mendefinisikan “Statistics is the science of collecting, organizing, and interpreting numerical facts”.
Dalam statistika terdapat berbagai jenis sub bahasan salah satunya yaitu regresi logistik. Regresi logistik pertama kali
diperkenalkan oleh Pierre Francois Verhulst yang merupakan seorang Professor dari Belgian Military College. Regresi Logistik digunakan untuk memodelkan populasi pada tahun 1800an yang merupakan salah satu bentuk regresi non linear dimana hubungan antara variabel bebas dan variabel terikatnya tidak berbentuk garis lurus setelah dibuatkan plotnya. Regresi logistik bersifat
dichotomous(berskala nominal atau ordinal dengan 2 kategori) atau polychotomous
(mempunyai skala nominal atau ordinal dengan lebih dari 2 kategori) dengan 1 atau lebih variabel prediktor. Sedangkan variabel respon bersifat kontinyu atau kategorik. Regresi logistik tepat digunakan untuk variabel respon yang bersifat dikotomi.
)
(Y yang bersifat biner atau dikotomous dengan variabel prediktor (X) besifat polikotomous. Variabel respon (Y) terdiri dari dua kategori yaitu “sukses” dan “gagal” yang dinotasikan dengan Y=1 (sukses) dan Y=0 (gagal). Variabel Y mengikuti distribusi Bernouli (Archer, Lemeshow, & Hosmer, 2007).
Asumsi regresi logistik salah satunya yaitu sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor atau independen (Anwar Hidayat, 2015). Berdasarkan pernyataan tersebut salah satu kelemahan regresi logistik yaitu ketika jumlah sampelnya kecil. Sampel kecil
mempunyai keterbatasan dalam
menyediakan informasi yang cukup (Maharani, Adji, Setiawan, & Hidayah, 2015). Sampel kecil adalah sampel dengan jumlahnya yang kurang dari 30 (Widi, 2015). Penelitian-penelitian sebelumnya mengenai sampel kecil pada regresi logistik telah banyak dilakukan. Salah satunya yaitu penelitian seputar sampel kecil untuk regresi logistik multinomial menggunakan A modified score function estimator (MPLE) dengan hasilnya yaitu, pada sampel kecil MPLE mampu mengurangi error lebih baik dibanding MLE (Bull, Mak, & Greenwood, 2002).
Pada penelitian ini, peneliti memfokuskan penelitian menggunakan metoderesampling
bootstrap dan jackknife. Didasarkan pada penelitian terdahulu karya Hana Fitrianingrum tahun 2013 dengan judul “Estimasi Parameter Model Regresi Logistik Menggunakan Metode Jackknife”. Bootstrap didasarkan pada observasi dan sampling error, sedangkan Jackknife didasarkan pada observasi terhapus-1 dan terhapus-d (Sahinler dan Topuz, 2007). Bootstrap diperkenalkan pertama kali oleh Efron tahun 1979. Bootstrap dapat digunakan untuk mengatasi permasalahan dalam statistika baik masalah data yang sedikit, data yang menyimpang dari asumsinya maupun data yang tidak memiliki atau bebas asumsi dalam distribusinya (Narso, Suyitno, & Artikel, 2013 dan Sungkono, 2013). Metode bootstrap dilakukan dengan mengambil sampel dari sampel asli dengan ukuran sama
dengan ukuran sampel asli dan dilakukan dengan pengembalian. Jackknife pertama kali diusulkan oleh M.H. Quenouille pada tahun 1949 kemudian disempurnakan oleh John Tukey pada tahun 1956. Penerapan Jackknife pada estimasi parameter dengan data yang kecil dilakukan untuk dapat mengoreksi pendugaanMaximum Likelihood Estimation(MSE) (Kurnia & A. Notodiputro, 2006). Metode Jackknife merupakan teknik
resampling nonparametrik, bertujuan dalam menyelesaikan masalah estimasi parameter dengan tingkat akurasi yang baik. Metode jackknife dilakukan dengan mengambil sampel dari sampel asli dengan ukuran sama dengan ukuran sampel asli dan dilakukan tanpa pengembalian. Estimasistandard error
untuk metode jackknife terbagi dalam jackknife terhapus-1 dan terhapus-d.
Secara garis besar tujuan dalam penelitian ini yaitu untuk membandingkan ketiga metode antara lain MLE, Bootstrap dan Jackknife dalam mengestimasi parameter regresi logistik dimana ukuran yang menjadi pembandingnya adalah nilai standard error
dari masing-masing metode yang akan dipilih berdasarkan nilai terkecilnya.
KAJIAN LITERATUR DAN PENGEMBANGAN HIPOTESIS 2.1 Dasar Penelitian
Penelitian-penelitian terdahulu yang membahas permasalahan sampel kecil pada regresi logistik yang memperoleh hasil estimasi yang bias telah dilakukan. Diantaranya penelitian yang dilakukan oleh Bull, Mak, dan Greenwood tahun 2002. Mereka menyebutkan bahwa, pemodelan regresi logistik biner mempunyai hasil dalam estimasi yang jika dilakukan terus menerus tidak sesuai untuk sampel kecil. Menurut Maiti & Pradhan dalam Gordóvil-merino, Guàrdia-olmos, & Peró-cebollero tahun 2012, menyebutkan bahwa estimasi parameter untuk analisis sampel kecil hasilnya bias.
logistik dengan mengilustrasikannya dalam penentuan tingkat kebangkrutan perusahaan perbankan di Indonesia dimana jumlah data yang ditangani adalah data kecil. Dan diperoleh kesimpulan bahwa metode Jackknife mampu memperkecil standard errorsampai Jackknife terhapus-2.
2.2 Regresi Logistik Biner
Regresi logistik biner merupakan suatu metode analisis untuk mencari hubungan antara variabel respon (y) yang bersifat biner atau dichotomous dengan variabel prediktor (x) besifat polychotomous. Variabel respon (y) terdiri dari dua kategori yaitu “sukses” dan “gagal” yang dinotasikan dengan y=1 (sukses) dan y=0 (gagal). Variabel y mengikuti distribusi Bernouli untuk setiap observasi tunggal (Archer et al., 2007).
Model regresi logistiknya adalah sebagai berikut:
dimana p= banyaknya variabel prediktor.
2.3 Metode Bootstrap
Bootstrap diperkenalkan pertama kali oleh Efron tahun 1979. Bootstrap adalah metode dan teknik resampling nonparametrik yang berbasis komputer dan sangat potensial untuk dipergunakan pada masalah keakurasian yang didasarkan pada simulasi data untuk keperluan inferensi statistik (Sungkono, 2013). Bootstrapping bertujuan untuk menentukan estimasi yang kuat daristandard error dan interval kepercayaan untuk mengestimasi proporsi, rerata, median, odds ratio, koefisien korelasi atau koefisien regresi (Widhiarso, 2012).
Sampel dengan pengembalian
memungkinkan untuk mendapatkan jumlah data yang sama dengan ketika 21 pertama kali kita melakukan sampling, dan memungkinkan satu data diambil beberapa kali. Mengingat besarnya jumlah resampling yang bisa mencapai ribuan kali sehingga sangatlah sulit untuk melakukan perhitungan secara manual (Ustyannie, 2014).
Sampel asli dilambangkan dengan }
{x1,...,xn
x dimana n1,2,3,...,n dan sampel bootstrap dilambangkan dengan
}
Peluang sampel dengan pengembalian dapat dinotasikan dengan:n
Masing-masing sampel bootstrap yang diambil setiap kali pengambilan adalah sama banyaknya dengan sampel asli.
2.4 Metode Jackknife
Metode Jackknife pertama kali ditemukan oleh Maurice Henry Quenouille pada tahun 1949 kemudian tahun 1956 John Wilder Tukey menyempurnakan nama metode jackknife tersebut. Quenouille menggunakan metode jackknife tersebut untuk mengoreksi dan memperkirakan bias dari suatu estimator dengan menghapus beberapa observasi sampel. Setelah itu, Tukey menggunakan metode tersebut untuk membangun interval kepercayaan untuk data yang memiliki variansi yang besar dari suatu estimator. Ini mirip dengan metode resampling bootstrap, namun tanpa pengembalian (Mcintosh, 1979; Sawyer, 2005).
Secara umum sampel jackknife dapat diperoleh melalui sampel berukuran
n
d
dari distribusi empiris
F
n(
x
)
tanpapengembalian, diperoleh J
d n J
J X X
X1 , 2,..., . Untuk selanjutnya analisis statistik dilakukan berdasarkan pada sampel Jackknife berukuran
n
d
tersebut (Ustyannie, 2014). Metode Jackknife sangat bergantung pada estimasi-estimasi dari sampel Jackknife. MisalkanX
1,
X
2,...,
X
n merupakan sampelacak berukuran
n
pengamatan yang menyebar bebas dan identik dari suatu sebaran peluang distribusi F yang tidak diketahui. Dari sampel tersebut dilakukan penarikan sampel kembali (resampling) sebanyakn
kali dimana setiap resamplingterdiri dari
n
1
pengamatan (terhapus 1 pengamatan secara berturut-turut). Selanjutnya, Fˆmerupakan suatu distribusiempiris yang memberi bobot n 1
, untuk
pengamatan pada data ke-i, tetapi juga dapat dilakukan dengan menghapus
d
pengamatan dari sampel yang diperoleh sehingga akan didapatkan jumlah resample sebanyak
d
n
N
N
,
.METODE PENELITIAN
Metode yang diusulkan pada penelitian ini yaitu untuk meningkatkan keakurasian Regresi Logistik dengan metoderesampling
untuk menangani sampel kecil pada prediksi tingkat kebangkrutan perusahaan perbankan di Indonesia. Metode resampling yang digunakan yaitu Bootstrap dan Jackknife. Sasaran yang dilihat dalam penelitian ini yaitu error dengan melihat nilai standard error nya. Hasil pengukuran kinerja menggunakan MLE, Bootstrap dan Jackknife dengan melihat standard error untuk mengetahui perbedaan kinerja model sebelum dan sesudah diterapkanresampling.
Dengan melihat nilaistandard errorterkecil, maka akan terpilih metode terbaik. Selanjutnya diketahui model regresi logistik yang terbentuk sesuai dengan metode terbaik. Model kerangka pemikiran metode yang diusulkan ditunjukan pada Gambar 1.
Gambar 1. Kerangka Pemikiran
1.1 Sumber Data
Data yang digunakan dalam penelitian adalah data sekunder yang telah digunakan pada penelitian sebelumnya yaitu penelitian karya Hana Fitianingrum tahun 2013 mengenai status 22 perusahaan perbankan di Indonesia.
1.2 Definisi Operasional Variabel Penelitian
Variabel-variabel yang digunakan dalam penelitian ini adalah:
3.2.1 Variabel Dependen
Variabel dependen merupakan variabel yang dipengaruhi oleh variabel independen. Variabel dependen dalam penelitian ini adalah status kebangkrutan perbankan di Indonesia dengan pengkategorian 1 adalah perusahaan perbankan yang telah mengalami kebangkrutan dan 0 adalah yang tidak mengalami kebangkrutan.
3.2.2 Variabel Independen
Variabel independen merupakan variabel yang mempengaruhi atau yang menjadi penyebab bagi variabel dependen. Variabel independen yang digunakan dalam penelitian ini adalah merupakan variabel-variabel dalam rasio keuangan dimana skala datanya yaitu interval. Variabel-variabel tersebut diantaranya:
i. CAR (X1)
CAR (Capital Adequancy Ratio) adalah rasio yang memperlihatkan seberapa besar jumlah seluruh aktiva bank yang mengandung risiko (kredit, penyertaan, surat berharga, tagihan pada bank lain). CAR digunakan untuk mengukur kemampuan bank dalam memenuhi kewajiban jangka panjang atau kemampuan bank untuk memenuhi kewajiban-kewajiban jika terjadi likuidasi. Serta digunakan untuk menilai keamanan dan kesehatan bank dari sisi modal pemiliknya.
Nilai Capital (CAR) suatu bank dikatakan baik/sehat apabila nilai pada tiap-tiap periode lebih besar dari kriteria tingkat kesehatan bank yang ditetapkan oleh BI yaitu sebesar 8% (Fauzan, 2007).
Rumusnya sebagai berikut: % 100
Keterangan:
ATMR : Aktiva Tertimbang Menurut Risiko
ii. BOPO (X2)
BOPO (Biaya Operasional terhadap Pendapatan Operasional) merupakan rasio yang sering disebut rasio efisiensi dan digunakan untuk mengukur kemampuan manajemen bank dalam mengendalikan biaya operasional terhadap pendapatan operasional. Semakin kecil rasio ini berarti semakin efisien biaya operasional yang dikeluarkan bank yang bersangkutan sehingga kemungkinan suatu bank dalam kondisi bermasalah semakin kecil. Biaya operasional dihitung berdasarkan penjumlahan dari total beban bunga dan total beban operasional lainnya. Pendapatan operasional adalah penjumlahan dari total pendapatan bunga dan total pendapatan operasional lainnya.
Nilai BOPO suatu bank dikatakan baik/sehat apabila nilai pada tiap- tiap periode lebih kecil dari kriteria tingkat kesehatan bank yang ditetapkan oleh BI yaitu sebesar 93,52% (Fauzan, 2007). Dirumuskan sebagai berikut:
% 100
tan
l Operasiona Pendapa
sional BiayaOpera BOPO
iii. LDR (X3)
LDR (Loan to Deposit Ratio) merupakan rasio yang digunakan untuk menilai likuiditas suatu bank yang dengan cara membagi jumlah kredit yang diberikan oleh bank terhadap dana pihak ketiga. Semakin tinggi rasio ini, semakin rendahnya kemampuan likuiditas bank yang bersangkutan sehingga kemungkinan suatu bank dalam kondisi bermasalah akan semakin besar. Kredit yang diberikan tidak termasuk kredit kepada bank lain sedangkan untuk dana pihak ketiga adalah giro, tabungan, simpanan berjangka, sertifikat deposito. Dirumuskan sebagai berikut:
% 100
ihakketiga Totaldanap
t Totalkredi LDR
3.3 Teknik Analisis
3.3.1 Estimasi Parameter menggunakan MLE (Maximum Likelihood Estimation)
Salah satu metode untuk mencari estimasi parameter logistik biner adalah metode
Maximum Likelihood Estimation (MLE) dengan asumsi respon berdistribusi binomial dan objek pengamatan yang saling bebas. Ide dasar dari metode ini adalah menggunakan nilai dalam suatu ruang parameter yang menghubungkan dengan data observasi yang memiliki kemungkinan (likelihood) terbesar sebagai penduga dari parameter yang tidak diketahui. Prosedur dari metode Maximum Likelihood Estimation (MLE), yaitu dengan cara memaksimumkan nilai L(θ) atau disebut dengan conditional log-likelihood function. Fungsi Likelihood ( ) mencapai maksimum bila turunan pertamanya sama dengan nol dan turunan kedua negatif.
Dimana nilai conditional log-likelihood function diperoleh dari probabilitas persamaan regresi logistik yang akan di estimasi. Sedangkan untuk mencari nilai
conditional log-likelihood yang maksimum pada metode maximum likelihood dapat menggunakan metode Newton-Rapshon, dimana metode ini digunakan untuk menemukan akar dari persamaan dengan asumsi f(x)0. Setelah diperoleh nilai estimasi parameter yang optimal, maka langkah selanjutnya yaitu memasukkan nilai tersebut ke dalam fungsi respon regresi logistik (logistic response function) untuk mendapatkanfitted value.
3.3.2 Estimasi Parameter menggunakan Bootstrap
Estimasi bootstrap untuk standard error
tidak memerlukan perhitungan teori seperti perhitungan lainnya dan selalu tersedia walaupun sekompleks apapun perhitungan statistika tersebut, artinya prosedur bootstrap untuk standard error selalu sama untuk semua bentuk distribusi data. Menurut Efron dan Tibshirani, langkah-langkah prosedur bootstrap untuk estimasi standar error sebagai berikut:
sebanyak B. Dinotasikan dengan
X , masing-masing berisi nilai data yang telah disampling secara random dengan pengembalian dari sampel X . 2. Evaluasi hasil bootstrap yang diperoleh
untuk masing-masing sampel bootstrap ) 3. Estimasi standard error untuk sampel
bootstrap
4. Mengulangi langkah 1, 2 dan 3 hingga B kali, sehingga akan diperoleh
B
Pendekatan bootstrap jika diulang lebih dari satu kali akan memberikan hasil yang berbeda, hal ini karena yang dilakukan adalah suatu simulasi. Jika dapat dilakukan menggunakan semua kemungkinan sampel yaitu nn maka hasilnya akan sama (Sungkono, 2013).
3.3.3 Estimasi Parameter menggunakan Jackknife
Dalam perkembangannya, metode Jackknife tidak hanya dilakukan dengan menghapus 1 dari
n
pengamatan pada data ke-i, tetapi dapat dilakukan dengan menghapusd
pengamatan dari sampel yang diperoleh sehingga akan didapatkan jumlahresample sebanyak
a. Metode Jackknife Terhapus-1
Prosedur metode Jackknife terhapus-1 adalah dengan cara menghapus satu observasi dari sampel asli, sehingga sampel berukuran
n
yaituX
1,
X
2,...,
X
n yangdiambil dari suatu populasi dan statistik
θ
ˆ
adalah estimasi untuk parameterθ
berdasar sampel asli. Berdasarkan uraian Jackknife menurut Efron dan Tibshirani, langkah-langkah Jackknife terhapus-1 dapat dituliskan sebagai berikut:1) Sampel Jackknife ke-
k
, dinotasikanX
JKadalah sampel asli dengan menghapus observasi ke-
k
, sehingga diperolehn
sampel yang masing-masing berukuran
1
n
.2) Menghitung
θ
ˆ
yang diinginkan darisampel Jackknife, sebut sebagai
θ
ˆ
JK, dimana k 1,2,...,n.3) Mengkonstruksikan suatu distribusi probabilitas dari
θ
ˆ
JK dengan memberikan probabilitas 1/n pada setiapJn J
J θ θ
θˆ 1, ˆ 2,..., ˆ . Distribusi tersebut
merupakan estimator Jackknife terhapus-1 untuk distribusi sampling
θ
ˆ
dandinotasikan dengan FˆJ
.
4) Estimasi untuk θ adalah mean dari
b. Metode Jackknife Terhapus-d
Jackknife terhapus-d merupakan perluasan dari Jackknife terhapus-1 yaitu dengan menghapus sebanyak
d
observasi dari sampel asli. Misalkan dimiliki sampel berukurann
yaituX
1,
X
2,...,
X
n yangdiambil dari satu populasi, maka sampel Jackknife yang diperoleh akan berukuran
d
n
. Secara umum, prosedur resamplingjackknife terhapus-d sama seperti jackknife 1. Berdasarkan jackknife terhapus-1, langkah-langkah jackknife terhapus-d sebagai berikut:
1) Sampel jackknife ke-
k
,X
JKadalah sampel asli dengan menghapusd
observasi, sehingga diperoleh sebanyak
N
, dimana masing-masing berukuran
n
d
.2) Menghitung
θ
ˆ
yang diinginkan dari sampel Jackknife, yang disebut sebagaiJK
3) Mengkonstruksikan suatu distribusi probabilitas dari
θ
ˆ
JK dengan memberikan probabilitas1
/
N
pada setiapJN J
J θ θ
θˆ 1, ˆ 2,..., ˆ
. Distribusi tersebut merupakan estimator Jackknife terhapus-d untuk distribusi sampling
θ
ˆ
dandinotasikan dengan FˆJ.
4) Estimasi untuk
θ
ˆ
adalah mean dariPada jackknife terhapus-d, nilai
d
yang digunakan dapat ditentukan berdasarkan ukuran sampel asli. Jika banyaknyakemungkinan sampel
N
masihmemungkinkan untuk perhitungan, maka untuk suatu sampel asli akan memberikan hasil yang konstan walaupun prosedur tersebut diulang beberapa kali. Akan tetapi, jika
N
sangat besar maka perhitungan menggunakan semua kemungkinan sampel sangat tidak mungkin. Sebagai solusinya digunakan pendekatan simulasi jackknife, pengambilan sampel Jackknife dari sampel asli dilakukan tanpa pengembalian dengan ukuran kurang darin
.c. Estimasi Standard Error Metode Jackknife
Nilaistandard errormerupakan akar dari nilai variansinya. Prosedur estimasistandard erroruntuk metode Jackknife terbagi dalam Jackknife 1 dan Jackknife terhapus-d sebagai berikut:
1) Untuk Jackknife terhapus-1 dengan estimator yang berasal dari data bayangan (Pseudo data) adalah
θ
ˆ
JK(untuk2) Untuk Jackknife terhapus-d dengan estimator yang berasal dari data bayangan
(Pseudo data) adalah
θ
ˆ
JK(untukFlowchart penelitian dapat dilihat pada Gambar 2, dimulai dengan Analisa permasalahan berdasarkan penelitian terkait. Selanjutnya memilih dataset yang akan diuji yaitu berasal dari penelitian sebelumnya mengenai status kebangkrutan perusahaan perbankan di Indonesia. Setelah itu, dilakukan pengujian Estimasi Regresi Logistik Biner menggunakan MLE dan dibandingkan dengan resampling Bootstrap dan Jackknife. Hasil pengujian tersebut untuk melihat keakurasian dengan sasaran yang diperhatikan yaitu nilai standard error dari masing-masing metode. Kemudian nilai
Gambar 2.FlowchartPenelitian
HASIL DAN PEMBAHASAN
Eksperimen yang dilakukan dalam penelitian ini menggunakan sebuah platform komputer berbasis Intel® Celeron® CPU 847 @1.10GHz, RAM 4GB, dan sistem operasi Microsoft Windows 7 Ultimate 32-bit. Sedangkan untuk analisa hasil eksperimen menggunakan aplikasi RStudio 0.94.110.
Dalam eksperimen yang dilakukan menggunakan 22 data dengan tiga variabel independen yaitu CAR, BOPO dan LDR. Metode yang diuji yaitu Regresi Logistik Biner tanpa resampling dan dengan
resampling. Resampling yang digunakan adalah Bootstrap dan Jackknife.
Hasil eksperimen untuk regresi logistik biner dengan Maximum Likelihood Estimation (MLE) disajikan dalam Tabel 1. Informasi yang disajikan adalah akurasi. Ukuran yang dilihat yaitu nilai standard erroruntuk masing-masing parameter. Hasil
eksperimen pada Tabel 1 menunjukkan rata-rata standard error dari keempat parameter pada 22 dataset status kebangkrutan perusahaan perbankan di Indonesia sebesar 1.328.
Tabel 1. Hasil Eksperimen Regresi Logistik
Parameter Standard Error
Konstanta 5.125
CAR 0.109
BOPO 0.028
LDR 0.051
Rata-rata 1.328
Pada Tabel 2 ditunjukan hasil eksperimen metode Regresi Logistik denganResampling
Jackknife untuk 22 dataset status kebangkrutan perusahaan perbankan di Indonesia. Hasil eksperimen yang disajikan adalah akurasi dengan melihat nilaistandard error. Hasil eksperimen pada Tabel 2 menunjukan rata-rata standard error untuk Jackknife terhapus-1 sebesar 0.072 , Jackknife terhapus-2 sebesar 0.034 dan Jackknife terhapus-3 sebesar 2.392. Dari ketiga resampling Jackknife tersebut, Jackknife terhapus-2 memiliki nilai rata-rata
standard error terkecil.. Maka untuk
resampling Jackknife terhapus-2 ini merupakan metode terbaik dari 2resampling
Jackknife yang lain.
Tabel 2. Hasil Eksperimen Resampling Jackknife
Parameter Jackknife
terhapus-1
Jackknife
terhapus-2
Jackknife
terhapus-3
Konstanta 0.273 0.129 8.805
CAR 0.007 0.004 0.365
BOPO 0.002 0.001 0.170
LDR 0.003 0.002 0.226
Rata-Rata 0.072 0.034 2.392
Perbandingan rata-rata standard error
standard error terkecil yaitu Jackknife terhapus-2 sebesar 0.034. Maka Jackknife terhapus-2 merupakan metode terbaik yang didapat dariresamplingJackknife.
Gambar 3. Perbandingan Rata-rata Standard Error Metode Jackknife
Pada Tabel 3 ditunjukan hasil eksperimen metode Regresi Logistik denganresampling
Bootstrap untuk 22 dataset status kebangkrutan perusahaan perbankan di Indonesia. Hasil eksperimen yang disajikan adalah akurasi dengan melihat nilaistandard error. Hasil eksperimen pada Tabel 3 menunjukan rata-ratastandard errormetode Bootstrap untuk R=5 sebesar 83.831, R=25 sebesar 664.151, R=50 sebesar 45.867, R=100 sebesar 96.940, R=150 sebesar 34.175, R=500 sebesar 59.273, R=1000 sebesar 156.054, R=5000 sebesar 170.240 dan R=20000 sebesar 178.599.
Dari hasil
tersebut diketahui bahwa rata-rata
standard error
dari R=150 memiliki nilai
terkecil yaitu
34.175, maka pengulangan
terbaik
yang
digunakan
Metode
Bootstrap dalam estimasi regresi logistik
biner ini adalah R=150.
Tabel 3. Hasil Eksperimen Resampling Bootstrap
Variabel Standard Error
R=5 R=25 R=50
Konstan 321.921 2551.530 167.959
CAR 6.972 55.370 9.734
BOPO 1.760 10.917 4.303
LDR 4.673 38.784 1.4727
Rata-rata
83.831 664.151 45.867
Variabel Standard Error
R=100 R=150 R=500
Konstan 356.391 117.458 223.479
CAR 25.884 10.856 7.776
BOPO 3.138 4.578 3.327
LDR 2.348 3.807 2.509
Rata-rata
96.940 34.175 59.273
Variabel Standard Error
R=1000 R=5000 R=20000
Konstan 592.373 647.537 678.928
CAR 19.067 20.252 21.535
BOPO 4.055 4.115 4.292
LDR 8.722 9.055 9.640
Rata-rata
156.054 170.240 178.599
Perbandingan rata-rata standard error
untuk resampling Bootstrap dapat dilihat pada Gambar 4. Didapat bahwa rata-rata
standard error terkecil yaitu Bootstrap (R=150) sebesar 34.175. Maka Bootstrap dengan replikasi sebanyak 150 merupakan metode terbaik yang didapat dariresampling
Bootstrap.
Standard Error Metode
Jackknife
83.831 664.150
45.86796.94034.17559.273
156.054
Gambar 4. Perbandingan Rata-rata Standard Error Metode Bootstrap
Selanjutnya pada Tabel 4 menunjukkan hasil eksperimen dari ketiga metode yang diusulkan untuk 22 dataset status kebangkrutan perusahaan perbankan di Indonesia. Ketiga metode tersebut diantaranyaMaximum Likelihood Estimation
(MLE), Resampling Bootstrap dan
Resampling Jackknife. Untuk resampling
Bootstrap dan Jackknife yang disajikan pada Tabel 4 adalah yang memiliki nilaistandard error terkecil yang sudah di seleksi terlebih dahulu. Hasilnya adalah Bootstrap dengan replikasi sebanyak 150 dan Jackknife terhapus-2.
Terlihat bahwa nilai standard error
terkecil untuk keempat parameter tersebut ketika menggunakan resampling Jackknife terhapus-2. Menghasilkan nilai standard error terbesar ketika menggunakan
resampling Bootstrap dengan banyaknya replikasi sebanyak 150.
Tabel 4. Hasil Standard Error Metode yang diusulkan
Parameter MLE (n=22)
Bootstrap (R=150)
Jackknife
terhapus-2
Konstanta 5.125 117.458 0.129
CAR 0.109 10.856 0.004
BOPO 0.028 4.578 0.001
LDR 0.051 3.807 0.002
Kemudian pada Gambar 5 menunjukkan nilai rata-rata standard error untuk ketiga metode tersebut agar lebih mudah dalam melihat metode apakah yang merupakan metode terbaik. Rata-rata standard error
MLE sebesar 1.328, Bootstrap (R=150)
sebesar 34.175 dan Jackknife terhapus-2 sebesar 0.034. Maka terlihat jelas bahwa, Jackknife terhapus-2 merupakan metode yang paling tepat dalam meningkatkan keakurasian pada sampel kecil karena mempunyai nilaistandard errorterkecil.
Gambar 5. Perbandingan Rata-rata Standard Error Terkecil dari Setiap Metode
KESIMPULAN
Penelitian ini dengan menerapkan metode
resampling yaitu Bootstrap dan Jackknife untuk penanganan sampel kecil yang merupakan salah satu kelemahan dari regresi logistik dimana data yang digunakan adalah data yang telah digunakan pada penelitian sebelumnya mengenai tingkat kebangkrutan perusahaan perbankan di Indonesia. Hasil eksperimen pada penelitian ini mendapatkan nilai rata-ratastandard erroruntukMaximum Likelihood Estimation (MLE) tanpa
resampling sebesar 1.328. Untuk metode Bootstrap dilakukan beberapa replikasi, kemudian diperoleh replikasi sebanyak 150 (R=150) yang memiliki rata-rata standard errorterkecil yaitu 34.175. Sedangkan, nilai rata-ratastandard errorterkecil pada metode Jackknife yaitu Jackknife terhapus-2 sebesar 0.034. Berdasarkan nilai rata-rata standard error dari ketiga metode tersebut diperoleh metode terbaik dalam meningkatkan keakurasian yaitu metode Jackknife terhapus-2 karena memiliki rata-rata standard error
yang terkecil. Dapat dilihat juga hasil rata-1.328
34.175
0.034
0 5 10 15 20 25 30 35 40
MLE Bootstrap (R=150)
Jackknife terhapus-2
R
at
a-ra
ta
S
ta
nda
rd
E
rr
or
Metode yang diusulkan
rata standard erroruntuk metode Jackknife terhapus-2 (dengan resampling) lebih kecil dibanding metode MLE (tanpa resampling). Nilai estimasi untuk parameternya yaitu konstanta sebesar 0.129; CAR sebesar 0,004; BOPO sebesar 0.001; dan LDR sebesar 0.002.
REFERENSI
Archer, K. J., Lemeshow, S., & Hosmer,
D. W. (2007).
Goodness-of-fit tests
for logistic regression models when
data are collected using a complex
sampling design
,
51
, 4450
–4464.
http://doi.org/10.1016/j.csda.2006.0
7.006.
Bull, S. B., Mak, C., & Greenwood, C. M.
T. (2002).
A modifed score function
estimator for multinomial logistic
regression in small samples
,
39
, 57
–74.
Fauzan.
(2007).
Analisis
Kinerja
Keuangan pada Perbankan Syari'ah
( Studi pada Bank Muammalat
Indonesia )
, 183
–207.
Hidayat, Anwar. 2015. Regresi Logistik,
http://www.statistikian.com/2015/ 02/regresi-logistik.html. (Diunduh 24 September 2016).
Kannurpatti, S. S., & Biswal, B. B.
(2005).
Bootstrap
resampling
method to estimate confidence
intervals of activation-induced CBF
changes
using
laser
Doppler
imaging,
146
,
61
–68.
http://doi.org/10.1016/j.jneumeth.20
05.01.021.
Kurnia, A., & A. Notodiputro, K. (2006).
Penerapan Metode Jackknife
,
11
(1),
12
–15.
Maharani, K., Adji, T. B., Setiawan, N.
A.,
&
Hidayah,
I.
(2015).
Comparison Analysis of Data Mining
Methodology
and
Student
Performance Improvement Influence
Factors in Small Data Set
, 169
–174.
Mcintosh, A. I. (1979).
The Jackknife
:
Introduction and Basic Properties
,
2
,
1
–11.
Narso, D., Suyitno, H., & Artikel, I.
(2013).
Estimasi
Parameter
Bootstrap pada Harga Saham
,
2
(1),
76
–83.
Sahinler, S., & Topuz, D. (2007).
S
tatistical Research by Surveys
:
Case Studies , Constraints and
Particularities
Bootstrap
And
Jackknife Resampling Algorithms
Statistical Research by Surveys
:
Case Studies
,.
Statistical Research
,
188
–199.
Sawyer, S. (2005).
Resampling Data
:
Using a Statistical Jackknife
,
1
(1),
1
–5.
Suharyadi, & Purwanto. (2009).
Statistika untuk Ekonomi & Keuangan Modern. Jakarta: Salemba Empat.Sukestiyarno, Y. (2013).
Statistika
Dasar
.
Yogyakarta: C.V. ANDIOFFSET.
Sungkono, J. (2013).
Bootstrap pada r
,
(84), 47
–54.
Ustyannie, W. (2014).
Perbandingan
Metode Bootstrap dan Jackknife
untuk Estimasi Parameter Model
.
Institut Sains&Teknologi AKPRIND
Yogyakarta
.
Widhiarso, W. (2012).
Berkenalan
dengan Bootstrap
, 1
–8.
Widi, Imah. 2015. Pengujian Hipotesa Sampel Kecil Bab 14 Fungsi, Variabel, dan Masalah dalam Analisis Regresi Bagian I Statistik Induktif Metode dan
Distribusi Sampling,