Fakultas MIPA, Universitas Negeri Yogyakarta, 2 Juni 2012
M-301
STUDI SIMULASI GRAFIK PENGENDALI BERDASARKAN
ESTIMASI FUNGSI DENSITAS KERNEL BIVARIAT
Selfie Pattihahuan, Adi Setiawan, Leopoldus Ricky Sasongko
Program Studi Matematika, Fakultas Sains dan Matematika Universitas Kristen Satya Wacana
Jl. Diponegoro 52-62 Salatiga 50711, email: selypatthy@rocketmail.com
Abstrak
Pengendalian kualitas secara statistik dapat dilakukan dengan menggunakan grafik pengendali, Salah satunya adalah penggunaan grafik pengendali berdasarkan Estimasi Fungsi Densitas Kernel. Data yang digunakan adalah dua titik sampel bivariat yaitu
1,2 1 x , x2
3,4 dan data simulasi bivariat yang dibangkitkan dari kombinasi dua distribusi normal bivariat dengan ukuran sampel (sample size) tertentu. Berdasarkan data tersebut dapat ditentukan estimasi densitas kernelnya (kernel density estimation) selanjutnya digunakan untuk membuat grafik pengendali dalam menentukan titik sampel yang out of control. Dari studi simulasi dapat dibangkitkan sampel dengan ukuran n berbeda- beda dan diperoleh hasil proporsi titik sampel out of control cenderung mendekati nilai batas kesalahan (level of significance)
0
,
0027
.Kata kunci : estimasi densitas kernel (kernel density estimation), grafik pengendali.
PENDAHULUAN
Latar Belakang
Pengendalian kualitas sangat dibutuhkan dalam proses produksi guna menjaga kestabilan suatu produk. Dalam pengendalian kualitas sering digunakan pengendalian proses statistik. Salah satu teknik pengendalian proses statistik adalah grafik pengendali (control chart). Mengingat karakteristik kualitas proses produksi tidak selalu berdistribusi normal, maka dikembangkan alternatif grafik pengendali dengan metode non-parametrik . Salah satunya adalah menggunakan estimasi fungsi densitas kernel (kernel density estimation).
Dalam makalah sebelumnya telah dijelaskan tentang penerapan grafik pengendali berdasarkan estimasi fungsi densitas kernel bivariat pada data bivariat karakteristik pH dan berat jenis sabun sirih (Pattihahuan et al., 2012). Selanjutnya, makalah ini akan membahas tentang bagaimana menerapkan grafik pengendali non-parametrik berdasarkan pendekatan fungsi densitas kernel bivariat untuk dua titik dan untuk data simulasi bivariat. Tujuan dari penelitian ini adalah menerapkan grafik pengendali non-parametrik berdasarkan pendekatan kernel untuk data simulasi bivariat dan mengidentifikasi titik sampel yang berada di luar grafik pengendali.
DASAR TEORI
Dasar teori yang dituliskan dalam makalah ini diambil dari makalah Pattihahuan et al. (2012) dan beberapa sumber seperti pada daftar pustaka.
Grafik Pengendali
Grafik pengendali adalah teknik pengendali proses pada jalur yang digunakan secara luas yang biasanya digunakan untuk menaksir parameter suatu proses produksi menentukan kemampuan dan memberikan informasi yang berguna dalam meningkatkan proses itu (Montgomery, 1990).
M-302 Estimasi Fungsi Densitas Bivariat
Estimasi fungsi densitas merupakan salah satu bagian dalam analisis data statistik, dimana estimasi fungsi densitas adalah suatu gambaran tentang sebuah sebaran data. Dalam statistik, estimasi fungsi densitas kernel merupakan salah satu metode non-parametrik untuk menduga fungsi kepadatan probabilitas dari suatu variabel acak (WEB1). Misalkan suatu sampel bivariat
n
X
X
X
1,
2,...,
yang diambil dari suatu populasi dengan fungsi densitas f, maka estimasi fungsi densitas kernelnya adalah
n i i H x X K n H x f 1 1 ; ˆdengan X1, X2, . . . ,Xn adalah sampel dari n data H adalah matrix bandwidth ,
T x xx 1, 2 dan
Ti i i
X
X
X
1,
2 untuk i = 1, 2,. . . ., n. Dalam hal ini KH
x H K
H x
2 1 21
dan
2 2 12 12 2 1 h h h h
H adalah matriks bandwidth yang simetris positif definit (definite positive) dengan
1 21 var Xi
h , h22 var
Xi2 danh
12
cov
X
i1,
X
i2
. Dalam hal ini
x x x K T 2 1 exp2
1 adalah kernel normal standard bivariat.Hal yang menjadi faktor penting dalam estimasi fungsi densitas kernel adalah memilih nilai
H
optimal untuk matriks bandwidth. Pemilihan nilaiH
optimal untuk matriks bandwidth dapat dilakukan dengan menggunakan metode Mean Integrated Squared Error (MISE) yang dijelaskan pada Tarn Duong dan Martin L. Hazelton (2003).METODE PENELITIAN
Dalam penelitian ini digunakan langkah-langkah yang dijelaskan sebagai berikut:
Membuat grafik pengendali berdasarkan estimasi densitas kernel untuk dua titik sampel
Membangkitkan data simulasi bivariat dari distribusi normal bivariat N dengan rumus
,
20
8
1
,
25
4
N
p
N
p
dengan bobot 0<p<1 dan matrik kovarians
1
5
.
0
5
.
0
1
. Jika digunakan ukuran sampel
(sample size) n=500 dengan p=0.5. Mencari nilai
H
bandwidth optimal dari data simulasi dengan menggunakan packages ks pada software R-2.15.2. Menghitung estimasi fungsi densitas kernel dari data simulasi berdasarkan nilai H bandwidth optimal. Membuat grafik pengendali untuk data simulasi bivariat berdasarkan estimasi fungsi densitas kernel. Menentukan banyaknya titik sampel yang out of control. Menentukan banyaknya titik yang out of control untuk n=500, n=1000, n=1500 dan p=0.5.
Melakukan pengulangan dengan p yang berbeda-beda yaitu p=0.1, p=0.8.
ANALISIS DAN PEMBAHASAN
Estimasi Kernel Densitas Bivariat dari Dua Titik
Jika dipunyai dua titik sembarang x1
1,2 dan x2
3,4 dan dengan menggunakanmatriks bandwidth identitas
1
0
0
1
H
maka estimasi densitas kernel dapat digambarkan denganFakultas MIPA, Universitas Negeri Yogyakarta, 2 Juni 2012
M-303
Gambar 1. Grafik Estimasi Densitas Bivariat 2 titik AZ 20 EL 25
Gambar 2. Grafik Estimasi Densitas Bivariat 2 titik AZ 60 EL 125
Berdasarkan estimasi densitas kernel dapat dibuat grafik pengendali bivariat untuk 2 titik yang ditunjukan pada Gambar 3. Kurva garis putus-putus menunjukkan batas grafik pengendali bivariat berdasarkan estimasi densitas kernel.
Gambar 3. Grafik Pengendali Berdasarkan Estimasi Densitas Bivariat 2 Titik
Estimasi Fungsi Densitas Bivariat Untuk Data Simulasi
Untuk memberikan gambaran, pada simulasi ini, dibangkitkan data acak bivariat dari distribusi normal
,
20
8
1
,
25
4
N
p
N
p
dengan bobot 0<p<1 dan matrik kovarians
1
5
.
0
5
.
0
1
. Pemilihan rata-rata distribusi bivariat
normal yaitu (4,25)T dan (8,20)T dan matriks kovariansi ∑ hanya untuk memberikan gambaran simulasi.Jika digunakan ukuran sampel (sample size) n=500 dengan p=0.5 dan dengan bantuan packages ks pada software R-2.15.2 diperoleh matriks bandwidth optimal adalah
dengan eigen value 1 0.3233,2 0.2433.
3214
.
0
0124
.
0
0124
.
0
2452
.
0
M-304
Selanjutnya, berdasarkan data hasil simulasi tersebut dapat ditentukan estimasi densitas kernel dengan menggunakan persamaan (1). Nilai estimasi fungsi densitas kernel untuk data simulasi yang dibangkitkan dapat ditunjukan pada Gambar 4. Terlihat kurang lebih separuh titik membentuk bukit pertama sedangkan separuh titik yang lain membentuk bukit kedua. Hal ini sesuai dengan yang diharapkan karena menggunakan bobot p=0.5.
Gambar 4. Grafik estimasi densitas kernel bivariat untuk data simulasi Dengan p=0.5 untuk n= 500
Berdasarkan estimasi densitas kernel bivariat pada Gambar 4, dapat dibuat grafik pengendali yang ditunjukkan pada Gambar 5. Kontur merah menunjukan batas spesifikasi dengan tingkat signifikansi α=0.0027 yang bersesuaian dengan level (nilai estimasi densitas kernel) adalah 0.0017. Dengan menggunakan batas spesifikasi tersebut diperoleh 2 titik sampel yang berada di luar kontur yaitu titik sampel ke-159 yang berada pada koordinat (12.2509, 23.6602) dengan level (nilai estimasi densita kernel) adalah 0.0014 dan titik sampel ke-224 yang berada pada koordinat (7.0671, 26.3783) dengan level adalah 0.0017.
Gambar 5. Grafik pengendali bivariat berdasarkan estimasi densitas kernel untuk data simulasi dengan p=0.5 untuk n= 500
Untuk perbandingan lebih jelas dari studi simulasi dengan sampel yang berbeda- beda ditunjukkan dalam Tabel 1. Grafik pengendali bivariat yang dibuat berdasarkan data acak berdistribusi normal dengan banyaknya sampel yang berbeda-beda yaitu n=500, n=1000, n=1500 dan n=2000 diperoleh proporsi banyaknya titik sampel out of control cenderung mendekati nilai
0027
,
0
Fakultas MIPA, Universitas Negeri Yogyakarta, 2 Juni 2012
M-305
kesalahan dalam proses produksi. Hasil yang analog bisa diperoleh untuk penganbilan bobot p yang lain sebagai contoh p=0.1, p=0.8.
Tabel 1. Tabel hasil simulasi untuk berbagai macam n
n Level
Banyaknya titik sampel yang out of
control
Proporsi out of control
500 0.0017 2
500
0
.
004
2
1000 0.0010 3
1000
0
.
003
3
1500 0.0007 5
1500
0
.
0033
5
KESIMPULAN
Dalam makalah ini dijelaskan proses pembentukan grafik pengendali bivariat berdasarkan estimasi densitas kernel untuk dua titik sampel dan untuk banyaknya sampel dengan n yang berbeda-beda sehingga dapat digunakan untuk mengidentifikasi titik-titik sampel yang out of control.
DAFTAR PUSTAKA
Chacón, J.E. and Duong, T. 2009. Multivariate plug-in bandwidth selection
with unconstrained pilot bandwidth matrices. Diunduh pada Minggu, 2 Januari 2012.
www.mvstat.net/tduong/research/.../chacon-duong-2010-test.pdf
Montgomery, Douglas C. 1990. Pengantar Pengendalian Kualitas Statistik. Yogyakarta: Gadjah Mada University Press.
Najib, Mohammad. 2007. Diagram Kontrol Statistik Non Parametrik Sum Of Ranks Untuk Target Pada Data Non-Normal. Diunduh pada Minggu, 1 Januari 2012.
http://digilib.its.ac.id/public/ITS-Undergraduate-8035-1303100018-Bab1.pdf
Pattihahuan, Selfie., Setiawan, A., & Sasongko, L, Ricky. Sasongko. 2012. Penerapan Grafik Pengendali Berdasarkan Estimasi Fungsi Densitas Kernel Bivariat. Seminar Nasional Pendidikan Matematika (LSM) XX UNY tanggal 24 Maret 2012.
Tarn Duong and Martin L. Hazelton. 2003.Plug-In Bandwith Matrices For Bivariate Kernel Density Estomation, hal. 17 - 20. Diunduh pada Minggu, 3 Januari 2012.
http://www.mvstat.net/tduong/research/
[WEB 1] Kernel Density Estimation. Diunduh pada Sabtu, 20 Agustus 2011.
http://en.wikipedia.org/wiki/Kernel_density_estimation
[WEB 2] Multivariate Kernel Density Estimation. Diunduh pada sabtu, 20 Agustus 2011.
M-306
0 2 4 6 8 10 12
1
5
2
0
2
5
3
0
hasil[,1]
h
a
s
il
[,
2
]
Lampiran 1 : Grafik Pengendali Bivariat Untuk n=1000, n=1500 dengan p=0.5
Gambar 6. Grafik pengendali bivariat berdasarkan estimasi densitas kernel untuk data simulasi dengan p=0.5 untuk n= 1000