Aplikasi Spline Truncated dalam Regresi Nonparametrik

Teks penuh

(1)

BAB 1

PENDAHULUAN

1.1Latar Belakang

Dalam Statistika, analisis regresi digunakan untuk melihat pengaruh variabel bebas terhadap variabel terikat. Sebelum melakukan analisis lebih lanjut harus dilihat terlebih dahulu pola hubungan variabel tersebut. Hal ini dapat dilakukan melalui dua pendekatan yaitu pendekatan parametrik dan pendekatan nonparametrik. Pendekatan parametrik atau biasa disebut dengan regresi parametrik digunakan apabila diasumsikan bahwa bentuk model sudah ditentukan atau pola data sudah diketahui bentuknya. Namun pada kenyataannya tidak semua data diketahui pola hubungannya secara jelas atau bentuk model belum ditentukan. Apabila teknik pendekatan parametrik tetap digunakan sebagai model pola data, maka akan diperoleh hasil yang menyesatkan, sehingga pendekatan alternatif yang digunakan adalah pendekatan nonparametrik atau biasa disebut regresi nonparametrik. Regresi nonparametrik merupakan pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuknya, atau bisa dikatakan tidak terdapat informasi apapun tentang bentuk dari fungsi regresi. Pendekatan nonparametrik juga lebih fleksibel, hal ini dikarenakan tidak dibatasi oleh asumsi-asumsi seperti halnya pada pendekatan parametrik.

(2)

memberikan fleksibilitas lebih dari polinomial biasa, sehingga memungkinkan untuk menyesuaikan diri secara lebih efektif terhadap karakteristik lokal suatu fungsi atau data. Spline juga mempunyai keunggulan dalam mengatasi pola data yang cenderung naik/turun secara tajam, serta kurva yang dihasilkan relatif mulus.

Spline truncated adalah basis fungsi dalam spline yang merupakan model

polinomial yang tersegmen atau terbagi pada suatu titik fokus yang disebut knot. Untuk memperoleh regresi spline yang optimal maka perlu dipilih lokasi knot yang optimal pula. Masalah yang dihadapi dalam estimasi kurva adalah dalam memilih parameter λ (pemulus) yang pada hakekatnya memilih lokasi titik-titik knot juga.

Untuk nilai λ yang sangat besar akan menghasilkan bentuk kurva regresi yang sangat halus. Sebaliknya untuk nilai λ yang kecil akan memberikan bentuk kurva regresi yang sangat kasar, akibatnya pemilihan parameter penghalus optimal merupakan hal yang sangat penting dalam regresi nonparametrik. Tujuan dari pendekatan regresi nonparametrik, yakni ingin mendapatkan kurva mulus yang mempunyai λ optimal menggunakan data amatan sebanyak n, maka diperlukan ukuran kinerja atas estimator yang dapat diterima secara universal. Ada banyak metode untuk menentukan parameter pemulus, beberapa di antaranya adalah MSE (Mean Square Error) dan GCV (Generalized Cross Validation). Titik knot optimal diperoleh dari nilai MSE dan GCV yang paling minimum. MSE merupakan metode pemulus optimal yang paling sederhana, meskipun begitu penggunaan MSE sangat jarang digunakan secara khusus untuk memilih titik knot yang optimal, sedangkan GCV merupakan modifikasi dari CV (Cross Validation) dan merupakan metode yang paling banyak dipakai dan disukai karena kelebihannya yaitu memiliki sifat optimal asimtotik (Wahba, 1990, dalam Oktaviana dan Budiantara, 2011).

Pada penelitian ini akan dibahas tentang penggunaan estimasi spline

truncated dalam menentukan model terbaik regresi nonparametrik dengan

(3)

1.2 Rumusan Masalah

Sesuai dengan latar belakang masalah yang telah diuraikan maka yang menjadi pokok permasalahan dalam penelitian ini adalah bagaimana cara penggunaan estimator spline dengan basis truncated dalam menentukan model regresi dengan menggunakan MSE dan GCV sebagai metode pemulus optimal dalam menentukan model regresi terbaik dan melihat metode mana yang menghasilkan nilai yang paling minimum, serta penerapannya pada data.

1.3 Batasan Masalah

Dalam menentukan estimator spline digunakan basis fungsi truncated, dan untuk menentukan nilai parameter-parameternya digunakan metode kuadrat terkecil dengan pendekatan matriks, sedangkan metode yang dipakai untuk menentukan parameter penghalus adalah metode MSE dan GCV. Adapun data yang digunakan adalah data sekunder yang diperoleh dari Laboratorium Terpadu Departemen Fisika Universitas Sumatera Utara, yakni pengaruh lama waktu (menit) yang diberikan sebagai variabel bebas terhadap perubahan tegangan output sensor polimer (mv) sebagai variabel terikat dan hanya akan mencari model regresi

spline linier terbaik dengan satu titik knot, dan dua titik knot menggunakan

metode MSE dan GCV. Untuk mengetahui apakah parameter penghalus memiliki pengaruh terhadap model yang didapat atau tidak, digunakan uji hipotesis yaitu uji simultan dan uji normalitas Kolmogorov-Smirnov.

1.4 Tujuan Penelititan

Sesuai dengan rumusan masalah yang dikemukakan sebelumnya, tujuan dari penelitian ini adalah untuk mengkaji bentuk estimator spline dengan basis

truncated dalam menentukan model regresi dengan menggunakan MSE dan GCV

(4)

menentukan metode terbaik dalam menghasilkan nilai yang paling minimum, serta penerapannya pada data.

1.5 Manfaat Penelitian

Penelitian ini dilakukan untuk menambah pengetahuan serta memperkaya literatur mengenai analisis regresi nonparametrik sehingga dapat menjadi referensi untuk penelitian selanjutnya, baik dalam penentuan estimator model regresi nonparametrik ataupun penerapannya pada data rill.

Figur

Memperbarui...

Referensi

Memperbarui...