• Tidak ada hasil yang ditemukan

PENDEKATAN ESTIMATOR KERNEL UNTUK ESTIMASI DENSITAS MULUS

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENDEKATAN ESTIMATOR KERNEL UNTUK ESTIMASI DENSITAS MULUS"

Copied!
5
0
0

Teks penuh

(1)

PENDEKATAN ESTIMATOR KERNEL UNTUK ESTIMASI DENSITAS MULUS Laila Hayati

Program Studi Pendidikan Matematika PMIPA FKIP Universitas Mataram Jl. Majapahit No. 62 Mataram 83125

e-mail: [email protected]

Abstrak : Misalkan diberikan data pengamatan independen

Xi :i 1,2,...,n

dengan fungsi densitas f. Ada dua pendekatan dalam mengestimasi f yaitu dengan pendekatan parametrik dan pendekatan nonparametik. Pada pendekatan nonparametrik dilakukan jika asumsi bentuk f tidak diketahui. Dalam hal ini diasumsikan bahwa fungsi

f termuat dalam kelas fungsi mulus. Salah satu teknik untuk mengestimasi fungsi mulus adalah teknik pemulus kernel. Tingkat kemulusan fungsi estimasi ditentukan oleh parameter pemulus. Semakin besar parameter pemulusnya semakin mulus fungsi estimasi dan sebaliknya.

Kata-kata Kunci: densitas mulus, estimator kernel, parameter pemulus

KERNEL ESTIMATOR APPROACHES FOR ESTIMATES SMOOTH DENSITY

Abstract: Let Xi :i 1,2,...,n

be independent observation data from a distribution with density function

f. There are two basic approaches for estimating f, the parametric and the nonparametric approaches. In nonparametric approaches, an unknown density function f. The function f is assumed to be a smooth function, so the function f

could be estimated by kernel estimator. The smoothing level of kernel estimator depends to the smoothing parameter. The big smoothing parameter gives the estimation function which over smooth and the contrary.

Key Words: smooth density, kernel estimator, smoothing parameter

I. PENDAHULUAN

Dalam analisa regresi, tidak semua variabel penjelas dapat didekati dengan pendekatan parametrik, karena tidak adanya informasi yang jelas bagaimana bentuk hubungan variabel penjelas dengan variabel responnya sehingga harus digunakan pendekatan nonparametrik. Tujuan analisa regresi adalah menentukan hampiran untuk kurva regresi m.

Jika diberikan data pengamatan independen

Xi :i 1,2,..., n

, untuk menentukan distribusi dari X

ekivalen dengan menentukan fungsi densitasnya. Untuk mengestimasi fungsi densitas f dapat dilakukan dengan dua pendekatan yaitu pendekatan parametrik dan nonparametrik. Pendekatan nonparametrik dilakukan jika asumsi bentuk f tidak diketahui. Dalam hal ini diasumsikan bahwa fungsi f termuat dalam kelas fungsi mulus yaitu mempunyai turunan kontinu atau terintegralkan secara kuadrat.

Permasalahan dalam densitas nonparametrik adalah bagaimana mengkonstruksikan estimasi dari fungsi densitas tanpa membuat asumsi struktural seperti tentang bentuk fungsi, tetapi hanya mensyaratkan bahwa fungsi densitas tersebut sekurang-kurangnya mempunyai dua turunan yang terbatas.

Salah satu teknik untuk mengestimasi fungsi mulus adalah teknik pemulus kernel [1]. Metode yang paling sederhana adalah histogram. Teknik pemulus kernel pada estimator densitas merupakan pengembangan dari estimator histogram.

Dari Hayati [4], dengan menggunakan pendekatan regresi nonparametrik untuk menemukan estimator untuk fungsi regresi m diperoleh estimator yang konsisten (dengan menggunakan kernel normal, bandwidth

0.01; 0.1; dan 1), yaitu estimasi total populasi semakin mendekati total populasi dengan semakin bertambahnya

jumlah sampel (n). Semakin besar bandwidth, maka estimasi total populasi semakin menjauhi total populasi.

Dalam tulisan ini dibahas tentang pencarian estimator kernel dari densitas mulus, sifat-sifat dan contoh simulasinya dengan program S-Plus for Windows. Estimator Histogram [2]

Metode estimasi densitas secara nonparametrik yang paling populer adalah histogram. Namun sebenarnya, histogram ini bukanlah merupakan alat estimasi densitas yang baik, karena bentuknya yang sangat mudah dipengaruhi oleh jumlah kelas dan lokasi nilai tengahnya, dan juga estimasi densitas yang dihasilkan tidak kontinu pada batas kelas. Diketahui sampel random

Xi :i 1,2,...,n

dari suatu populasi dengan fungsi densitas tak diketahui f. Berdasarkan sampel random ini akan diestimasi fungsi densitasnya. Misalkan daerah nilai

x dibagi menjadi disjoin interval-interval dengan panjang

2h. Peluang observasi yang masuk ke dalam interval

X0 h,X0 h

adalah:

Diperoleh estimator histogram untuk f(x) yaitu:

X X h X h

nh x fh  # i  0  , 0  2 1 ) ( ˆ

untuk semua X

X0 h,X0 h

. ini berarti bahwa observasi yang masuk ke dalam interval yang tergantung

h, yakni

X0 h,X0 h

memberi sokongan yang sama besar terhadap

f

h

 

x

.

pemilihan lebar kelas h kecil, his-togram memuat banyak batang kecil-kecil, sedangkan untuk h besar histogram memuat sedikit batang besar-besar.

      h X h X dx x f h X h X X P 0 0 ) ( , 0 0 ISSN 1907-1744

(2)

Estimator Kernel [2]

Fungsi kernel K yang umum dipakai adalah fungsi densitas dan biasanya dilengkapi dengan asumsi-asumsi tertentu. Jika X

X1,X2,..., Xn

sampel random dari

suatu distribusi densitas f dan K suatu fungsi terbatas dan positif yang memenuhi sifat sebagai berikut:

Maka fungsi K yang memenuhi sifat di atas disebut dengan Kernel berorder-r. sifat-sifat lainnya adalah bahwa

K merupakan fungsi densitas dan simetrik sekitar nol. Ini didasarkan atas kenyataan bahwa:

1 ) ( 

   dy y K dan

( ) 0.    dy y

yK Kernel ini akan

digunakan untuk mengkonstruksikan estimator densitas nonparametrik dari

f

h

 

x

, yaitu:

Dengan h penghalus kernel, yang akan memegang peranan dalam mendefinisikan estimator

f

ˆ

h

(

x

)

dan menentukan variansi dan biasnya.

Beberapa contoh fungsi Kernel:

1. Kernel Uniform:

 

1

2 1   I u u K 2. Kernel Triangle: K

 

u

1 u

 

I u 1

3. Kernel Epanechnikov:

 

1

1

4 3 2    u I u u K 4. Kernel Quartic:

 

1

1

16 15 2 2 u I u u K 5. Kernel Triweight:

 

1

1

32 35 2 3    u I u u K 6. Kernel Gaussian:

 

u u I 

 

u K          , 2 2 1 exp 2 1 

dimana I adalah fungsi karakteristik.

Contoh: Kernel Uniform:

 

1

2 1   I u u K

akan ditunjukkan bahwa

K

 

u du 1

Sifat-sifat Statistik Densitas Kernel

Misalkan

 

Xi iN1 pengamatan variabel random yang berdistribusi independen dan identik, dengan densitas

f. Estimasi densitas kernel berdasarkan dua parameter yaitu:

Bandwidth h

Fungsi densitas kernel K

Dalam estimator kernel, parameter penghalus h merupakan pengontrol keseimbangan antara kesesuaian kurva terhadap data dan kemulusan kurva, maka sangat penting untuk menentukan hopt sehingga estimator yang diperoleh juga optimal.

Berikut diuraikan sifat-sifat statistik densitas kernel. Teorema 1.1 [3]

Jika

f

ˆ

h

 

x

diberikan oleh persamaan (*), maka untuk

,

0

h

fˆh

 

x tak bias secara asimtotis. Bukti:

Karena Xi berdistribusi independen dan identik maka:

Jadi estimasinya tak bias secara asimtotis.

Sifat bias dapat juga dianalisis menggunakan ekspansi Taylor dari

f

x

sh

disekitar x, yang diasumsikan

2

C

f  (kontinu diferensiabel dua kali). Teorema 1.2 [3]

Jika fˆh

 

x diberikan oleh persamaan (*), maka

 

 

 

 

, 0 2 ˆ 2 2 2     h f x K o h h x f Bias hdengan

 

2

 

. 2 K

s K s dsBukti:

 

  

  

, 1 1 ˆ 1 1 ds sh x f s K du u f u x K X x K E X x K E n X x K n E x f E h h i h n i n i i h h                

       

 

f x

K

   

s f x ds f

 

x E h sh x u h     

   ˆ : diperoleh , 0 untuk , substitusi dengan

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

s ds o

 

h f

 

x K s x f h ds s sK x f h ds s K x f x f ds h o x f s h x f hs x f s K x f ds sh x f s K x f Bias h                       

               2 2 2 2 2 2 2 ! 2 ! 1 ˆ            

   r i r r i i dy y K yi jika , 0 bilangan suatu untuk , 1 1 jika , 0 0 jika , 1 ) (

1 ...(*) 1 ) ( ˆ 1 1

            n i i n i i h h h X x K nh X x K n x f

         1 , 0 1 , 1 1 u jika u jika u I

 

        1 , 0 1 , 2 1 u jika u jika u K

 

0 1 2 1 0 1 1 1 1    

        du du du du u K

(3)

dimana,

Jadi estimasi densitas kernel:

Terlihat bahwa bias merupakan fungsi kuadrat dalam h. Oleh karena itu, dibutuhkan h yang kecil untuk menurunkan biasnya.

Teorema 1.3 [3]

Jika

f

ˆ

h

 

x

diberikan oleh persamaan (*), maka

 

fˆh x

nh

K f

 

xo

nh

,nh   var 2 1 2 1 dengan 2 2

 

. 2 K s ds K

Bukti:

Karena

X

i berdistribusi independen dan identik maka:

dimana,

Terlihat bahwa variansi proporsional dengan

 

nh 1. Oleh karena itu, dibutuhkan h yang besar untuk menurunkan variansinya. Hal ini bertentangan dengan biasnya, sehingga diperhatikan MSE yang memberikan kontrol antara bias kuadrat dan variansi.

 

 

 

sh x x dengan h untuk h f sh h o           , 0 , 0 ! 3 2 3 2

 

   

 

, 0 2 ˆ 2 2 2     h f x K o h h x f Bias h

 

            n i i h n i i h h X x K n X x K n Var x f Var 1 2 1 var 1 1 ˆ                                   h X x K E h X x K E nh 2 2 2 1

 

 

  

  

                                      

2 2 2 2 2 1 1 1 ds sh x f s K ds sh x f s K h n du u f h u x K du u f h u x K nh

  

 

 

 

 

 

 

 

                       

nh nh o x f K nh h o x f h o x f K h n h o x f ds sh x f s K h n , 1 1 1 1 1 1 2 2 2 2 2 2 2

 

 

 

sh x x dengan h untuk h f sh h o          , 0 , 0 ! 2 2

 

 

 

           nh nh untuk nh nh h o x f h h o K nh nh o , 0 , 0 1 1 2 2 2 1 1 II. PEMBAHASAN

Telah diketahui secara umum, bahwa permasalahan utama pada pemulus kernel tidak erletak

pada pemilihan kernel tetapi pada pemilihan

bandwidth.

Pemilihan bandwidth optimum lebih ditekankan pada penyeimbangan antara bias dan varians. Satu perumusan masalah yang dapat memperlihatkan hubungan antara bias dan varians adalah MSE, karena itu dengan meminimumkan MSE maka masalah antara bias dan varians dapat diminimumkan juga.

Teorema 2.1 [3]

Jika

f

ˆ

h

 

x

diberikan oleh persamaan (2.6), maka

 

f x

MSE ˆh

Bukti:

Dari persamaan (2.3), maka

 

f x

MSE ˆh Var

fˆh

 

x

+ Bias

fˆh

 

x

2 . D e n g a n

menggunakan teorema 2.6 dan 2.7 maka diperoleh:

 

 

 

 

       nh h h o nh o K x f h x f K nh , 0 , 4 1 4 1 2 2 4 2 2 

 

f x

MSE ˆh

 

 

 

 

       nh h h o nh o K x f h x f K nh , 0 , 4 1 4 1 2 2 4 2 2  Teorema 2.2 [3]

Jika

h

0

,

nh

,

maka

f

ˆ

h

 

x

adalah estimator konsisten untuk f(x).

Bukti:

Dari teorema 3.1, terlihat bahwa jika

h

0

,

nh

, maka MSE

fˆh

 

x

p 0. Dengan kata lain

 

x

f

 

x

f

ˆ

h



p . Selanjutnya didefinisikan bandwidth optimal

h

opt

,

yang diperoleh dari,

 

m x

MSE

h h

h

opt  arg min ˆ

sehingga diperoleh teorema berikut: Teorema 2.3 [3]

Jika

h

0

,

nh

, maka:

(i).

h

opt

o

n

1/5

(ii).

MSE

m

ˆ

hopt

o

n

4/5

Bukti:

(i). Dari teorema [3], dikatakan bahwa

Jika , maka Pendekatan MSE untuk

m

ˆ

h

 

x

adalah MSE(

m

ˆ

h

 

x

)=

 

 

 

   

 

 

K x f x f x m x m h K x f x nh 2 2 2 4 2 2 2 2 4 1              ,

1

 

4 h o nh o   

(4)

diperoleh: MSE( ) = dengan,

 

x

m

ˆ

h nh1 A h4 B 4 

 

 

 

   

 

x

 

K f x f x m x m B K x f x A 2 2 2 2 2 2 2               Apabila diambil

ˆ

 

 0,   h x m MSE h diperoleh:

o

n

1/5

 

B h A nh h x m MSE h 3 2 1 ˆ    

 

 

   

 

 

5 / 1 2 2 2 2 2 2 5 / 1 2                                           K x f x f x m x m n x f K nB A hopt  

(ii). Apabila nilai

h

opt disubstitusi ke MSE

mˆhopt

diperoleh:

o

n

4/5

 

 

   

 

 

5 / 1 2 2 2 5 / 4 2 2 2 5 / 1 5 / 4 5 / 1 5 / 4 2 4 5 4 1 ˆ                                        K x f x f x m x m K n x f B n A B n A m MSE hopt  

Contoh simulasi estimasi densitas Kernel

Bagaimana pengaruh fungsi Kernel (Triangle, Parzen, Gaussian) dan bandwidth(h=0.01; 0.05; 0.1; 0.5).

Misalkan:

Y

sin

2

t

))

1

,

0

(

(unif

sort

t

2

,

4

~

N

Estimasi densitas nonparametrik dengan menggunakan kernel di atas ditunjukkan pada gambar berikut ini:

(5)

Dari tampilan gambar 1, 2, dan 3 dapat dibuat kesimpulan yaitu:

1. Dengan bandwidth yang tetap, tidak ada perbedaan signifikan secara visual (grafik) dengan berubahnya fungsi kernel.

2. Dengan fungsi kernel yang tetap, terdapat perbedaan yang signifikan secara visual (grafik) dengan berubahnya bandwidth. Dimana semakin besar bandwidth maka garis grafik yang dihasilkan semakin mulus.

III. KESIMPULAN DAN SARAN

Dari uraian di atas, dapat disimpulkan bahwa untuk mengestimasi fungsi densitas f, jika informasi model distribusi X tak diketahui maka f dapat diestimasi dengan menggunakan pendekatan nonparametrik. Salah satu pendekatan nonparametrik dengan menggunakan teknik pemulus kernel. Tingkat kemulusan fungsi estimasi ditentukan oleh parameter pemulus. Semakin besar parameter pemulusnya semakin mulus fungsi estimasinya dan sebaliknya.

Adapun saran yang dapat dikemukakan adalah: perlu dilanjutkan pembahasan pada masalah fungsi kernel yang lainnya selain Kernel Triangle, Kernel Parzen, dan Kernel Gaussian, dengan bandwidth yang bervariasi, dan perlu dikaji juga teknik untuk mengestimasi fungsi mulus yang lainnya.

DAFTAR PUSTAKA

[1] Hardle, W. 1990. Applied Nonparametric Regression Analysis. Cambridge University Press, Cambridge.

[2] Hardle, W. 1990. Smoothing T echniques Wih Implementation in S. Springer Verlag, New York [3] Hardle, W. 1991. Sampling Technique . Springer

Verlag, London.

[4] Hayati, L. 2010. Regresi Nonparametrik Untuk Mengestimasi Total Populasi Berhingga. Jurnal Penelitian Universitas Mataram. 2 (15): 1-8.

Referensi

Dokumen terkait

Sebuah kejadian konflik dapat dikatakan serious conflict atau non-serious conflict dapat dilihat dari kecepatan para pengguna jalan yang terlibat konflik ketika sesaat

Dari hasil data tes awal (pre-test) bertujuan untuk mengetahui kemampuan awal siswa sebelum diberikan perlakuan dengan menggunakan strategi pembelajaran multiple

Berkaitan dengan target capaian pelaksanaan PKM ini, maka revitalisasi pemahaman paham Islam Ahlussunnah wal Jama’ah dan pengenalan diri pada Majelis Taklim Ummahat DDI

perguruan tinggi untuk masa depannya, kemudian indikator tindakan yang memiliki pernyataan pendidikan itu penting untuk menunjang kesuksesan kedepannya, dengan

Berdasarkan hasil penelitian dan pembahasan yang telah dijabarkan maka, dapat ditarik kesimpulan bahwa pertama terdapat pengaruh yang signifikan dan secara positif

Bencana gempa bumi dengan kekuatan 7,2 SR yang terjadi pada tanggal 14 Juli 2019 merusak 971 rumah dan memakan korban jiwa 4 orang serta korban luka – luka sebanyak 51 orang.

Jika tanah tidak mampu menahan air hujan di daerah yang tinggi maka akan terjadi.. Yang bukan merupakan upaya untuk mencegah tanah

khulu’ atau dengan lafadz yang menunjukan makna khulu’ seperti kata mubara’ah (melepas diri) atau fidyah (tebusan). Jika tidak dengan lafadz khulu’ atau lafadz yang