PENENTUAN FREKUENSI DALAM METODE
POLINOM LOKAL KUADRAT TERKECIL
UNTUK MENDETEKSI LONCATAN
OLEH:
BAHARUDDIN
PROGRAM PASCASARJANA
INSTITUT PERTANIAN BOGOR
ABSTRAK
BAHARUDDIN. Penentuan Frekuensi dalam Metode Polinom Lokal Kuadrat Terkecil untuk Mendeteksi Loncatan. Dibimbing oleh BARIZI dan BUD1
SUSETYO.
Metode polinom lokal kuadrat terkecil adalah suatu metode statistika yang dapat digunakan untuk mendeteksi adanya loncatan persamaan regresi. Metode ini didasarkan pada pengepasan suatu f h g s i polinom terhadap tetangga terdekat dari beberapa data. Banyaknya data setiap tetangga disebut fiekuensi (k). Penentuan fiekuensi yang tepat diperlukan untuk mendapatkan hasil pendeteksian yang benar. Penentuan ini dilakukan dengan simulasi.
SURAT
PERNYATAAN
Dengan ini saya menyatakan bahwa tesis yang be rjudul:
Penentuan Frekuensi dalam Metode Polinom Lokal Kuadrat ~erkecil untuk Mendeteksi Loncatan
adalah hasil karya saya sendiri dan belum pemah dipublikasikan. Sumber data dan informasi yang digunakan telah dinyatakan dengan jelas dan dapat diperiksa kebenarannya.
Bogor, 13 Februari 2002
PENENTUAN FREKUENSI DALAM METODE
POLINOM LOKAL KUADRAT TERKECIL
UNTUK MENDETEKSI LONCATAN
BAHARUDDIN
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Statistika
PROGRAM PASCASARJANA
INSTITUT PERTANLAN BOGOR
Judul Tesis : Penentuan Frekuensi dalam Metode Polinom Lokal Kuadrat Terkecil mtuk Mendeteksi Loncatan
Nama : Baharuddin
NRP
: 99162Program Studi : Statistka
Menyetujui,
1. Komisi Pembimbing
Anggota
Mengetahui,
Penuhs dilahirkan
di
Sengkang pada tanggd 3 1 Januari 1972 sebagai anakpertama dari pasangan
H.
Muh. Said Mallo dan H.J. Sahri Toro. Pendidikan sarjana ditempuh di Jurusan Matematika FMlPA Universitas Hasanuddin Makassar, lulustahun 1995. Pada tahun 1999, penulis diterima di Program Studi Statistika pada Program Pascasarjana IPB. Beasiswa pendidikan pascasarjana (BPPS) diperoleh
dari DI rjen Dikti Departemen Pendidikan Nasional.
Penulis bekerja sebagai tenaga pengajar di Fakultas Matematika d m Ilmu
PRAKATA
Puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Shalawat dan salam penulis ucapkan kepada junjungan kita Nabi Muhammad SAW, segenap
keluarga dan sahabatnya serta siapa saja yang menyerukan dakwahnya hingga akhir zaman. Tema yang dipilih penulis dalam penelitian ini adalah metode
pendeteksi loncatan, dengan judul penentuan fiekuensi dalam metode polinom
lokal kuadrat terkecil untuk mendeteksi loncatan.
Terima kasih penylis ucapkan kepada Bapak Prof Dr. Baxizi, M.E.S. clan Bapak Dr. Budi Susetyo, M. S. selaku pembimbing, serta teman-teman mahasiswa
STK '99 yang telah banyak membenkan saran. Ungkapan terima kasih juga saya
sampaikan kepada kedua orangtua dan selunrh keluarga atas segala doanya. Semoga karya ilmiah ini bermanfaat.
Bogor, Februari 2002
DAFTAR IS1
Halaman
...
DAFTAR TABEL vi
DAFTAR GAMBAR ... vii
...
DAFTAR LAMPIRAN viii
PENDAHULUAN ... Latar Belakang ... Tujuan Penelitian ...
TINJAUAN PUSTAKA ... : ... ... Regresi Polinom
Regresi dengan Loncatan ... ... Metode Polinom Lokal Kuadrat Terkecil
DATA DAN METODE
...
Sumber Data...
Metode Penelitian ...HASIL DAN PEMBAHASAN ... Ukuran Contoh n = 100 ...
...
Ukuran Contoh n = 200
Ukuran Contoh n = 300 ...
Ukuran Contoh n = 400 ... Pembahasan Umwn ...
KESIMPULAN DAN SARAN ... Kesimpulan ...
Saran ...
DAFTAR TABEL
Halaman
1. Besar loncatan, jumlah data bangk~tan dan taraf kepercayaan
2,
,,
yang dipakai pada ukuran contoh n...
72. Jumlah data banglatan dengan banyaknya posisi loncatan yang
terdeteksi untuk pemakaian fiekuensi k dan n = 100 ... 10
3. Persentase data banglutan yang terdeteksi sebanyak tiga loncatan untuk pemakaian fiekuensi k pada berbagai kerapatan data antar
loncatan dan n = 100 ... 17 4. Nilai rancangan x, dan nilai standardisasi respon y, dari data
yang akan dideteksi
...
445. Koefisien
p,c')
dari b g s i polmom yang dipas terhadap tetanggadengan median xi ... 45
DAFTAR GAMBAR
Halaman
1. (a) Contoh pengepasan global (b) Contoh pengepasan lokal
...
terhadap dua segmen (posisi loncatan adalah x = 40) 1
2. Persentase data banglutan yang terdeteksi sebanyak tiga loncatan ...
untuk pemakaian fiekuensi k dan n = 100 11
3. Persentase data banglutan yang terdeteksi sebanyak tiga loncatan
...
untuk pemakaian eekuensi k dan n = 200 12
4. Persentase data banglatan yang terdeteksi sebanyak tiga loncatan
...
untuk pemakaian fiekuensi k dan n = 300 14
5. Persentase data banglatan yang terdeteksi sebanyak tiga loncatan
...
untuk pemakaian fiekuensi k dan n = 400 15
...
6. Diagram pencar dari data yang akan dideteksi 43
7. (a) Koefisien polinom
bf)
dari tetangga dengan median xi...
(b) Nilai operator A(:) dari tetangga dengan median xi 47
...
DAFTAR LAMPIRAN
Halaman
...
1 . Contoh fmgsi yang dijadkan sumber data banglatan 22
...
2 . Diagram pencar dari contoh data banglutan yang dipakai 23 ...
.
3 Contoh h a d pendeteksian untuk n = 100
...
4 . Contoh hasil pendeteksian untuk n = 200
...
.5 Contoh h a d pendeteksian untuk n = 300
...
6 . Contoh h a d pendeteksian untuk n = 400
... .
7 Makro minitab untuk mendeteksi loncatan
8 . Jumlah data banglutan dengan banyalcnya posisi loncatan yang
...
terdeteksi untuk pemakaian fiekuensi k dan n = 200
9 . Jumlah data bangkitan dengan banyaknya posisi loncatan yang
...
terdeteksi untuk pemakaian fiekuensi k dan n = 300
10 . Jumlah data bangkitan dengan banyaknya posisi loncatan yang ... terdeteksi untuk pemakaian fiekuensi k dan n = 400
1 1
.
Petunjuk penggunaan metode polinom lokal kuadrat terkecilPENDAHULUAN
Latar Belakang
Model regresi linear sederhana sering dtpakai untuk menyatakan hubungan
antara peubah respon Y dan peubah penjelas X. Apabila nilai-nil& (x, y) dianggap
sebagai satu kesatuan maka pengepasan global terhadap keseluruhan data dapat
dilakukan (Gambar la). Akan tetapi, jika nilai-nilai (x, y ) &pat dipartisi menjadi
beberapa segmen maka pengepasan lokal terhadap setiap segmen lebih tepat
digunakan (Gambar lb). Persamaan regresi diperoleh dengan menggabungkan
semua persamaan regresi lokal. Model regresi ini dinamakan regresi loncatan
(Guthery 1974; Wegman & Wright 1983; QLU & Yandell 1998). Pengepasan
global terhadap data regresi lmcatan dapat menyebabkan berkurangnya nilai
koefisien determinasi R ~ .
Regresi loncatan mempunyai beberapa bentuk. Dalam penelitian ini, suatu
persamaan regresi dikatakan mengalami loncatan apabila koefisien intersep dari
[image:83.582.136.474.514.676.2]dua segmen yang berdekatan adalah berbeda sedangkan koefisien lainnya sama
Loncatan persamaan regresi sering terjadi pada proses pengendalia. mutu
produksi, pergerakan harga barang atau data deret waktu. Loncatan pada proses
pengendalian mutu dapat disebabkan oleh menurunuya kemampuan mesin atau
operator menuut waktu dan pada suatu waktu tertentu dilakukan perbaikan atau
penggantian. Penyebab lain adalah adanya faktor atau pengaruh peubah lain yang
cukup signifikau terhadap respon yang diamati pada suatu waktu tertentu.
Metode polinom lokal kuadrat terkecil adalah suatu metode statistika yang
dapat digunakan untuk mendeteksi adanya loncatan. Metode
ini
dikembangkanoleh Qiu dan Yandell(1998). Metode tersebut didasarkan pada pengepasan suatu
h g s i polinom terhadap tetangga terdekat dari beberapa data dengan memakai
metode kuadrat terkecil. Setiap tetangga (neighborhood) terdiri atas k data yang
saling berdekatan. Bilangan k ini disebut fiekuensi.
Sebelum tetangga dibentuk, data yang berukuran n diurut berdasarkan nilai
X Tetangga pertama beranggotakan k data terkecil pertama. Tetangga kedua
terdiri atas data terkecil kedua sampai data terkecil ke-(k+l), demikian seterusnya
sampai terbentuk (n+ 1 -k) tetangga. Fungsi polinom yang dipas terhadap tetangga-
tetangga
ini
dinamakan polinom lokal.Metode polinom lokal mudah diimplementasikan karena didasarkan pada
penggunaan penduga kuadrat terkecil. Hampir semua perangkat lunak statistika
dapat digunakan menghtung penduga tersebut. Disamping itu, pengetahuan awal
tentang banyaknya loncatan yang te jadi tidak diperlukan.
Metode polinom lokal dikembangkan dengan asumsi bahwa paling banyak
posisi loncatan maka algoritma hanya menganggap satu loncatan yang terjadi
dalam tetangga tersebut. Pemakaian k yang relatif besar juga dapat menghasilkan
pendeteksian yang salah. Algoritma memunculkan suatu indikasi loncatan yang
sebenarnya tidak terjadi. Sebaliknya, jika k yang digunakan sangat kecil maka
indikasi loncatan sering hilang karena polinom-polinom lokal yang terbentuk
belum merepresentasikan persamaan regresi yang sesungguhnya (belum stabil).
Olehnya itu, penentuan fiekuensi (k) yang tepat dqerlukan untuk mendapatkan
hasil pendeteksian yang benar. Penentuan ini dapat dilakukan dengan simulasi.
Tujuan Penelitian
Tujuan penelitian
ihi
adalah menentukan fiekuensi terbaik dalam metodepolinom lokal kuadrat terkecil yang dapat digunakan untuk mendeteksi adanya
TINJAUAN PUSTAKA
Penentuan fiekuensi merupakan masalah umum dalam metode pengepasan lokal. Hastie dan Tibshiraai (1 987,1990) menyarankan pemakaian 10%-50% data
untuk setiap pemulus garis bergerak dalam algoritma penskoran lokal. Silvennan
(1 984), Htirdle, Hall dan Marron ( 1 988) menyarankan pemakaian metode validasi
silang untuk memilih the bandwidth.
Regresi Polinom
Model regresi polinom ordo ke-m dengan satu peubah penjelas ( X ) dapat
dinyatakan sebagai:
Y,
=Po
+&x, +..-+P,xy + E , (i=1,2;.;n) ( 1 )dengan nilai-nilai x, < x, <
.
<
x, dan galat-galat { E , ) mempunyai rataan no1 danragam a2. Jika m = 1 , maka model ( 1 ) menjadi persamaan regresi sederhana:
EtY
I XI
=Po
+ P1x ( 2 )dengan E[Y
I
x ] adalah nilai harapan dari Y pada saat x,Po
merupakan koefisienintersep dan
pl
adalah koefisien kemiringan garis regresi terhadap sumbu-x.Regresi dengan Loncatan
Suatu persamaan regresi dikatakan mengalami lacatan sebesar d pada
posisi x, ( 1 << a << n ) apabila:
1 . Terdapat nilai-nilai xu p.
<
.
< xu, < xu, dengan persamaan regresi yangdengan persamaan regresi yang stabil E[Y
1
x ] =+
fi:x+
.
+
p:xmdemikian sehingga
P:
t /3: dan koefisienP;
=PJ
untuk j = I,..
; nt.
lim lim
2. Besar loncatan d = &a,. + ~ : x + . - - + / ? : x ' ) - x + x , , - o
+ P ;
x + . . . +p i x m ) dengan Id1 > d,, untuk suatu d, > 0.
Metode Polinom Lokal Kuadrat Terkecil
Misalkan N ( x , ) = { x i ,
,
x ~ + ~ - ~,.
.,
X ,,.
-,
xi-,+,,
xi, } adalah tetangga terdekatdari xi dengan frekuensi k = 21
+
1 << n untuk I+
1I
i l n-
1. Dengan memakai metode kuadrat terkecil, dilakukan pengepasan suatu h g s i polinom ordo kern,9'"
=B f )
+ p y x
+. . .
+b"x-
terhadap N ( x i ) tersebut untuk 1
+
1 l i I n-
I .Pendeteksian loncatan dapat dilakukan dengan mengamati perubahan yang
terjadi pada { , { atau himpunan koefisien lain dari polinom-polinom
lokal ke-i. Pendeteksian yang didasarkan pada {B:"} dilakukan dengan mengepas
suatu garis
9'"
=BAi)
+
B:"x terhadap N ( x , ) untuk 1+
1 l i S n-
1. Untuk memperoleh informasi tentang adanya loncatan, dipakai suatu dzflerence operator,dengan k l i l n
-
k+
1. Sebagai penentu adanya loncatan, digunakan nilaidengan
6
adalah penduga a dan Z,,, adalah taraf kepercayaan. Apabila nilaiIA(;)~
> u, maka dapat diprediksi bahwa persamaan regresi mengalami loncatanpada suatu x, dalam tetangga N(xi)
.
Metode polinom lokal dikembangkan dengan asumsi bahwa paling banyak
satu loncatan yang te rjadi dalam setiap tetangga N(xi)
.
Jika suatu loncatan terjadipada xi maka tidak ada loncatan lain dalam N(x,-, ) u N(x, ) u N(x,+, )
.
Iniberarti bahwa diantara dua loncatan (kalau terdapat lebih dari satu) hams terdapat
banyak data. Untuk menghindari pelanggaran asumsi hi, data yang akan dideteksi sebaiknya berukuran besar (dalam hal hi, n besar sedanglcan k / n kecil).
Hubungan antara simpangan baku galat ( 6 )
,
taraf kepercayaan (Z,,, ) ,fiekuensi (k) yang dipakai, dengan besarnya loncatan (d) yang dapat dideteksi
oleh algoritma adalah:
Ini berarti bahwa jika k yang dipakai agak besar (dalam ha1 ini n juga lebih besar
DATA DAN METODE
Sumber Data
Data yang digunakan dalam penelitian ini adalah data banglatan. Data
dibanglatkan dari suatu h g s i linear f (x) untuk x = i l n dengan i = 1,2,..-, n dan
n = 100,200,300,400. Fungsi linear tersebut mempunyai kemiringan posiu, no1
atau negatif. Fungsi linear dijadikan sumber data banglatan karma merupakan
bentuk yang sederhana dari h g s i polinom. Nilai-nilai x dirancang demikiau
sehingga memudahkan pendeteksian untuk berbagai ukuran contoh n, sedan-
pemakaian berbagai d a i n diharapkan mewakili ukuran contoh yang kecil clan
sedang serta hasilnya dapat digeneralisasi pada ukuran contoh yang lain.
Fungsi linear yang dijadikau sumber data banglatan mempunyai tiga posisi
loncatan, yaitu pada x = 0,25, x = 0,50 dan x = 0,75 (Lampiran 1). Pmentuan
fiekuensi terbaik didasarkan pada kemampuan mendeteksi ketiga posisi loncatan
tersebut. Besarnya loncatan yang digunakan bergantung pa& ukuran contoh n
(Tabel 1). Hal ini disesuaikan dengan besar lmcatan yang &pat dideteksi oleh
algoritma (6) untuk penambahan galat yang berdistribusi normal baku.
Tabel 1. Besar loncatan, jumlah data bangk~tan dan taraf kepercayaan Z,,, yang dipakai pada ukuran contoh n
2 0 1 2
2,50 2,75 3,00 3,25 n = 100
n = 200
n = 300
n = 400
-2,7 atau 2,7. -2,O atau 2,O -2,O atau 2,O -2,O atau 2,O
-3,2 atau 3,2 -2,5 atau 2,5 -2,3 atau 2,3 -2,2 atau 2,2
-3,7 atau 3,7 -3,O atau 3,O -2,6 atau 2,6 -2,4 atau 2,4
Data bangkitan diperoleh dengan menambahkan suatu galat E
-
n(0,l)terhadap f h g s i f ( x ) yang telah dibentuk. J u d a h data bangkitan setiap ukuran
contoh ( n = 100,200,300 dan 400 ) adalah 240 dan proporsional terhadap jenis
fungsi sumber. Lampiran 2 menunjukkan diagram pencar dari beberapa contoh
data bangkitan yang digunakan.
Metode Penelitian
Penentuan fiekuensi terbaik dilakukan terhadap masing-masing ukuran
contoh. Setiap data bangkitan dalam suatu ukuran contoh yang ditinjau dideteksi
dengan menggunalcan berbagai fiekuensi (k) yang mungkin. Frekuensi yang dapat
digunakan untuk data yang bedcuran n = 100 dengan tiga posisi loncatan adalah
k = 3,5,7,
--,
23 ; untuk n = 200 dipakai k = 3,5,7,. .a, 49 ; untuk n = 300 dipakaik = 3,5,7,
.-,
73 ; sedangkan untuk n = 400 digunakan k = 3,5,7,.-,99.Taraf kepercayaan ( Z,
,,
) yang digunakan dalam penelitianini
bergantungpada ukuran contoh n. Penggunaan
ini
disesuaikan dengan rumus (6). Untukn = 100 dipakai Z,
,,
= 2,5 yang setara dengan a=
0,O 1 ; untuk n = 200 dipakaiZ,
,,
= 2,75 yang setara dengan a=
0,006 ; untuk n = 300 digunakan2,
,,
= 3,O atau dengan a=
0,0027 ; dan untuk n = 400 digunakan Z,,, = 3,25 atau dengana
=
0,001.Pendeteksian posisi loncatan dilakukan berdasarkan pemalcaian {&')}.
Pemakaian ini merupakan pendekatan sederhana dalam regresi polinom. Lagi
Prosedur pendeteksian mtuk setiap data banglatan dan fiekuensi ( k ) yang dipakai
mengikuti algoritma berikut:
1 . Pengepasan garis
fCi)
=&')
+
B,'"x terhadap tetangga N(x, ) dengan fiekuensi k = 2 1 + l untuk I + l S i S n - I .2. Nilai operator A!) dihitung dengan memakai rumus ( 4 ) untuk k S i S n
-
k+
1 .3. Nilai threshold u, dihitung dengan menggunakan rumus (5).
4. Jika terdapat satu atau lebih data x, E N(0,25) dengan nilai
IA:)~
>
u, makadikatakan bahwa satu posisi loncatan yang terdeteksi. Hal yang sama juga
berlaku untuk N(0,50) dm N(0,75). Jika terdapat suatu x, e [ N ( 0 , 2 5 ) u
~ ( 0 ~ 5 0 ) v ~ ( 0 , 7 5 ) ] dengan nilai [A:')
1
> u, maka dikatakan bahwa terjadi salah deteksi. Hasil-hasil yang diperoleh dicatat menurut ukuran contoh, nomor urutdata bangkitan dan fiekuensi yang digunakan (Lampiran 3-6).
5. Frekuensi (k) terkecil yang terbmyak mendeteksi ketiga loncatan yang ada
pada data-data banglutan dalam suatu ukuran contoh yang ditinjau ditetapkau
HASIL DAN PEMBAHASAN
Sembilan ratus enam puluh data banglutan telah diperoleh dengan
menggunakan Minitab release 1 1.12. Persamaan regresi daxi masing-masing data
banglutan tersebut mempunyai tiga posisi loncatan. Pendeteksian posisi loncatan
dilakukan dengan menggunakan makro minitab (Lampiran 7). H a d pendeteksian
dikelompokkan menurut fiekuensi (k) dan ukuran contoh data banglatan (n = 100,
200,300,400).
Ukuran Contoh n = 100
Frekuensi yang digunakan untuk mendeteksi posisi loncatan persamaan
regresi dari data yang berukuran n = 100 adalah k = 3,5,7,
..;
23. Tabel 2menunjukkan bahwa penggunaan k yang sangat kecil(3 d m 5) menyebabkan
algoritma tidak mampu mendeteksi ketiga posisi loncatan. Hal ini disebabkan oleh
polinom-polinom lokal yang terbentuk belum stabil sehingga tidak mampu
memunculkan indikasi loncatan dalam difference operator.
[image:92.578.83.498.585.718.2]Penggunaan fiekuensi 7 dan 9 secara umum baru mampu mendeteksi satu
posisi loncatan. Sedangkan pemakaian k = 1 1 baru mampu mendeteksi dua posisi
loncatan. Tiga posisi loncatan telah terdeteksi sebanyak 54,58% dengan memakai
k = 13 (Gambar 2). Namun demikian, h a d
ini
belum optimum.H a d pendeteksian optimum diperoleh dengan memakai fkekuensi k = 15
.
Algoritma mampu mendeteksi ketiga posisi loncatan sebanyak 96,25 persen darikeseluruhan data. Dengan demikian, fiekuensi terbaik untuk data yang berukura.
n = 100 adalah 15.
Gambar 2. Persentase data bangkitan yang terdeteksi sebanyak tiga loncatan untuk pemakaian fiekuensi k dan n = 100.
Penggunaan fiekuensi yang relatif besar (17, 19, 21 dan 23) menyebabkan
algoritma mendeteksi lebih dari tiga posisi loncatan. Disamping mendeteksi ketiga
loncatan yang sesungguhnya, algoritma juga memberikan indikasi loncatan yang
sebenarnya tidak ada. Indikasi loncatan tersebut muncul diantara posisi loncatan
yang sesungguhnya. Hal ini disebabkan oleh banyaknya data antara dua loncatan
dalam data bangkitan relatif sedikit untuk pemakaian fkekuensi tersebut, sehingga
[image:93.578.79.494.230.827.2]Ukuran Contoh n = 200
Frekuensi yang digunakan untuk mendeteksi posisi loncatan persamaan
regresi dari data yang berukuran n = 200 adalah k = 3,5,7,
--,
49. Penggunaanfiekuensi 3, 5 dan 7 menyebabkan algoritma belum m a q u mendeteksi ketiga
posisi loncatan (Lampiran 8). Hasil yang sama juga diperoleh jika dipakai k = 9
dan 11. Dengan memakai fiekuensi tersebut, algoritma baru mampu mendeteksi
satu posisi loncatan masing-masing sebanyak 25,83 persen dan 35 persen. Hal ini
disebabkan oleh polinompolinom lokal yang terbentuk belum stabil sehingga
tidak mampu memberikan indikasi loncatan dalam difference operator.
Pemakaian fiekuensi 13, 15 dan 17 secara umum baru mampu mendeteksi
satu posisi loncatan. Sedangkan penggunaan fi-ekuensi 19 dan 21 baru mampu
mendeteksi dua posisi loncatan. Tiga posisi loncatan telah terdeteksi masing-
masing sebanyak 49,58%; 65%; dan 75,83% dengan menggunakan fiekuensi 23;
25 ; dan 27 (Gambar 3). Namun demikian, hasil tersebut belum optimum.
Hasil pendeteksian optimum diperoleh dengan memakai fiekuensi k = 29
(Gambar 3). Algoritma mampu mendeteksi ketiga posisi loncatan sebanyak 97,08
persen dari keseluruhan data. Dengan demikian, fiekuensi terbaik untuk data yang
berukuran n = 200 adalah 29.
Penggunaan fiekuensi yang relatif besar ( 33,3 5,37,
.
-a, 49 ) menyebabkanalgoritma mendeteksi lebih dari tiga posisi loncatan. Disamping mendeteksi ketiga
loncatan yang sesungguhnya, algoritma juga memberilcan indikasi loncatan yang
sebenarnya tidak ada. Indikasi loncatan tersebut muncul diantara posisi loncatan
yang sesungguhnya. Hal ini disebabkan oleh banyaknya data antara dua loncatan
dalam data bangkitan relatif sedikit untuk pemakaian fiekuensi tersebut, sehingga
asurnsi yang ber& dalam metode polinom lokal tidak dqenuhi.
Ukuran Contoh n = 300
Frekuensi yang dipakai untuk mendeteksi posisi loncatan dari data yang
berukuran n = 300 adalah k = 3,5,
--.,
73.
Penggunaan fiekuensi yang sangat kecil( k = 3, 5, 7 dan 9) menyebabkan algoritma tidak mampu mendeteksi ketiga posisi
loncatan yang ada (Lampiran 9). Satu posisi loncatan baru terdeteksi dengan
memakai fiekuensi 1 1, 13 dan 15. Sedangkan penggunaan k = 17, 19, 2 1 dan 23
secara m u m baru mampu mendeteksi dua posisi loncatan.
Frekuensi yang berhasil mendeteksi ketiga posisi loncatan pada data yang
berukuran
n
= 300 lebih banyak dibandingkan dengan fiekuensi pada data yangberukuran 100 dan 200. Frekuensi tersebut adalah
k
= 25,27, -as, 43. Frekuensi 25;27; 29; 3 1; dan 33 mampu mendeteksi masing-masing sebanyak 46,25%; 61,25%;
menggunakan k = 35 (Gambar 4). Dengan menggunakan fiekuensi tersebut,
algoritma mampu mendeteksi ketiga posisi loncatan sebanyak 98,75%. Dengan
demikian, frekuensi terbaik
untuk
data yang berukuran n = 300 adalah 35.Gambar 4. Persentase data bangkitan yang terdeteksi sebanyak tiga loncatan
untuk
pemakaian fiekuensik
dan n = 300.Penggunaan fiekuensi 45,47,. -, 73 menyebabkan algoritma mendeteksi
lebih dari tiga posisi loncatan. Disarnping mendeteksi ketiga posisi loncatan yang
sesungguhnya, algoritma juga memberikan mdikasi loncatan yang sebenarnya
tidak ada. Indikasi tersebut muncul diantara posisi loncatan yang sesmgguhnya.
Hal ini disebabkan oleh banyaknya data antara dua loncatan dalam data bangkitan
relatif sedikit
untuk
pemakaian frekuensi tersebut, sehingga asumsi yang berlaku dalam metode polinom lokal tidak dipenuhi.Ukuran Contoh n = 400
Hasil pendeteksian yang diperoleh dari data dengan ukuran n = 400 secara
300. Apabila fiekuensi yang digunakan sangat kecil maka algoritma tidak mampu
mendeteksi ketiga posisi loncatan yang ada (Lampiran 10). Sebaliknya, jika k
yang digunakan relatif besar maka algoritma memberikan indikasi loncatan lebih
dari tiga.
Frekuensi yang mampu mendeteksi ketiga posisi loncatan yang ada adalah
25,27,-.a, 55. Frekuensi 25,27, a-, 33 mampu mendeteksi 68,75% sampai 84,16%.
Sedangkan penggunaan fi-ekuensi 35; 37; dan 39 menyebabkan algoritma mampu
mendeteksi masing-masing sebanyak 90,42%; 92,08%; d m 95,83%.
Hasil pendeteksian optimum diperoleh dengan memakai k = 4 1 , 4 3 dan 45
(Gambar 5). Dengan memakai fiekuensi tersebut, algoritma mampu mendeteksi
ketiga posisi loncatan sebanyak 98,75%. Hal ini menarik karena ada tiga fiekuensi
yang memberikan hasil pendeteksian yang sama. Namun demikian, berdasarkan
asumsi bahwa fi-ekuensi yang digunakan dalam metode polinom lokal adalah jauh
lebih kecil dari ukuran contoh. Ini berarti bahwa frekuensi terbaik untuk n = 400
adalah 4 1.
Pembahasan Umum
Berdasarkan uraian sebelumnya, fiekuensi yang dapat memberikan hasil
pendeteksian optimum bergantung pada ukuran contoh. Frekuensi terbaik untuk
n = 100 adalah 15; k terbaik untuk n = 200 adalah 29; k terbaik untuk n = 300
adalah 35; sedangkan untuk n = 400, fiekuensi terbaik adalah 4 1.
Rasio antara fiekuensi terbaik dengan ukuran contoh yang dipakai ( k 1 n )
adalah 15 1100 = 15% untuk n = 100 ; 29 1200 = 14,5% untuk n = 200 ; 35 1300
= 1 47% untuk n = 300 ; 4 11 400 = 10,25% untuk n = 400
.
H a d ini memberikan suatu gambaran bahwa semakin besar ukuran contoh yang digunakan maka rasioterbaik ( k 1 n ) adalah semakin m e n m .
Penggunaan fiekuensi terbaik terhadap data dengan ukuran n = 100; 200;
300; dan 400 menyebabkan algoritma mampu mendeteksi ketiga posisi loncatan
masing-masing sebanyak 96,25%; 97,08%; 98,75%; dan 98,75% dari keseluruhan
data bangkitan. hi menunjukkan bahwa semakin besar ukuran contoh yang
dipakai kemampuan algoritma mendeteksi loncatan juga semakin besar. Hal ini
disebabkan oleh banyaknya data diantara dua posisi loncatan semakin bertambah.
Hasil ini relevan dengan asumsi bahwa paling banyak satu loncatan yang termuat
dalam setiap tetangga.
Persamaan regresi dari data bangkitan yang digunakan dalam penelitian ini
mempunyai tiga posisi loncatan. Banyaknya data (kerapatan) diantara dua posisi
loncatan yang berdekatan untuk n = 100 adalah 25. Kerapatan ini memenuhi
asumsi untuk pemakaian fiekuensi terbaik, k = 15. Tabel 3 menunjukkan bahwa
semakin s e a t data yang terdapat antara dua loncatan, persentase data bangkitan
berkurang. Bahkan pemakaian k = 15 tidak lagi memberikan hasil yang optimum
apabila banyaknya data diantara dua loncatan sama dengan 20,21 clan 22. Hal ini
disebabkan oleh penggunaan k = 15 tidak memenuhi asumsi pa& kerapatan
tersebut.
Tabel 3. Persentase data bangkitan* yang terdeteksi sebanyak tiga lcmcatan mtuk pemakaian fiekuensi k pada berbagai kerapatan data
antar loncatan dan n = 100
*
Jumlah data bangkitan adalah 100.Berdasarkan uraian sebelumnya, penggunaan k =15 pada data dengan
ukuran n = 100 dapat menghadkan pendeteksian optimum apabila banyaknya
data diantara dua loncatan (jika terdapat lebih dari satu) lebih besar dari 22. Akan
tetapi, informasi tentang banyaknya data antar loncatan pada data real seringkali
tidak diketahui. Sebagai altematif, data yang akan dideteksi dengan metode
polinom lokal sebaiknya bemkuran besar. Apabila data yang dideteksi berukuran
kecil maka sebaiknya hasil yang diperoleh diperiksa ulang mtuk m e m a n
tidak terjadinya salah deteksi. Pemeriksaan dapat dilakukan dengan menglutung
besar lmcatan pada masing-masing posisi yang terdeteksi. Besar loncatan yang
sesuai dengan rumus (6) menunjukkan bahwa hasil pendeteksian yang diperoleh
[image:99.578.119.502.267.418.2]Beberapa karakteristik data yang &pat dijadikan petunjuk adanya loncatan
adalah (1) diagram pencar dari X-Y memperlihatkan kecendemgan data terbagi
menjadi beberapa populasi (segmen); (2) hubungan linear antara peubah X dan Y
tidak terlalu erat, dalarn hal
ini
nilai mutlak dari koefisien korelasiI
r1
relatifkecil;
(3) koefisienP,
dari hasil pmgepasan global adalah nyata, akan tetapi nilaikoefisien determinasi R, relatif kecil; dan (4) deretan awal dari suku-suku galat
ceudenmg berkorelasi serial, dalam hal ini diagram pencar dari galat terhadap X
tidak acak.
Metode polinom lokal kuadrat terkecil mempunyai beberapa keterbatasan,
diantaranya (1) merupakan metode pendeteksi kasar sehhgga hasil pendeteksian
yang diperoleh masih harus diperiksa ulang untuk memastikan tidak terjadinya
salah deteksi; (2) metode ini lebi. tepat digunakan pada data deret wakty dalam
hal ini setiap nilai peubah penjelas x mempunyai tepat satu nilai respon y; dan (3)
besar loncatan yang dapat dideteksi bergantung pada simpangan baku galat, taraf
kepercayaan ( 2,
,,
) dm fiekumsi (k) yang digunakan dimana nilai-nilai ini hamsKESIMPULAN DAN SARAN
Kesimpulan
Banyalcnya data (fiekuensi, k) setiap neighborhood dalam metode polinom
lokal yang &pat dipakai untuk mendeteksi adanya loncatan dengan menggunakan
w,'")
bergantung pada ukuran contoh (n). Semakin besar n, persentase n yangdapat digunakan sebagai k semakin kecil. Diantara k yang ganjil, k terbaik untuk
n = 100 adalah 15; k terbaik untuk n = 200 adalah 29; k terbaik untuk n = 300
adalah 35; dan k terbaik untuk n = 400 adalah 41. Frekuensi tersebut merupakan
fiekuensi terbaik apabila banyahya data yang terletak diantara dua loncatan
(kalau terdapat lebih dari satu loncatan) lebih besar dari (3k
-
1)/ 2. Batasan ini merupakan asumsi yang hams dipenuhi dalam metode polinom lokal.Saran
Metode polinom lokal lebih tepat digunakan pada data deret waktu
Beberapa karakteristik data yang dapat dipakai sebagai petunjuk adanya loncatan
adalah nilai koefisien determinasi R~ dari hasil pengepasan global relatif kecil
dan diagram pencar dari X-Y menunjukkan kecenderungan data terbagi menjadi
beberapa segmen (populasi).
Apabila data yang akan dideteksi berukuran kecil maka sebaiknya hasil
yang diperoleh diperiksa ulang untuk memastikan tidak terjadinya salah deteksi.
Pemeriksaan dapat dilakdcan dengan menghtung besar loncatan pada masing-
masing posisi yang terdeteksi. Apabila besar loncatan cukup si@kan maka hasil
DAFTAR
PUSTAKA
Guthery SB. 1974. Partition regression. J Amer Statist Assoc 69:945-947.
W d l e W, Hall P, Marron S. 1988. How far are the optimally chosen smoothing parameters &om their optimum?. J Amer Statist Assoc 83:86-95.
Hastie TJ, Tibshirani
RJ.
1987. Generalized additive mode&: some applications. J Amer Statist Assoc 82:37 1-386.Hastie TJ, Tibshirani RJ. 1990. Generalized Additive Models. New York: Chapman & Hall.
Q u P, Yandell B. 1998. A local polynomial jump-detection algorithm in non- parametric regression. Technometxics 40: 141-1 52.
Silverman BW. 1984. A fast and efficient cross-validation method fbr smoothing parameter choice in spline regression. J Amer Statist Assoc 79:584-589.
Lampiran 3. Contoh hasil pendeteksian untuk n = 100
Lampiran 3. Lanjutan
Lampiran 3. Lanjutan
Lampiran 4. Contoh hasil pendeteksian untuk n = 200
Lampiran 4. Lanjutan
Lampiran 4. Lanjutan
Lampiran 5. Contoh hasil pendeteksian
untuk
n = 300Lampiran 5 . Lanjutan
Lampiran 6 . Cantoh hasil pendeteksian mtuk n = 400
Lampiran 6. Lanjutan
Lampiran 7. Makro minitab untuk mendeteksi loncatan
gmacro deteksi noecho
name C1='X1 ## Nilai peubah penjelas X ciiketik berurut pada kolom C 1
name C2= ' Re spon Y
'
## Nilai peubah respon Y diketik pada kolom C2let kl=count (Cl) ## Ukuran data yang dideteksi
center C1 C3; MinMax 1 kl.
let C3=C3/kl ## Nil4 rancangan 0 c x, < 1 pada kolom C3
center C2 C4. ## Standardisasi respon Y pada kolom C4
let k2= ## Isi hkuensi yang dipakai (lihat kesimpulan penelitian ini)
let k3= ## Isi simpangan baku data
let k4= ## Isi taraf kepercayaan yang dipakai (bergantung jenis data)
let C1000 (1) =k2
name C1000='k' ## Nilai k tercetak pada kolom C 1000
## Nilai Threshold
let k5=SQRT ( (6* ( (5*k2) -3) ) / ( ( (k2) **2) -1) )
let k6=(k3) *(k4)*(kl/k2)*k5
let C999(1)=k6
name C999='u11 ## Nilai threshold tercetak pada kolom C999
let k7=1+ (-l+k2) /2 ## Indeks median 1+1 kolom x
let k8=1-k2+kl # Banyaknya polinom lokal
let k9=ll ## Lokasi cetak koefisien fi polinom pertama
do k10=1: k8 ## Loop untuk polinom ke-k 10
do kll=l: k2 # Baris 1 sampai baris k let kl2=-l+klO+kll
let C5(kll)=C3(k12) ##Nilaix,lokaltercetakpadakolomC5
let C6(kll)=C4(k12) ##PeubahY lokaltercetakpadakolomC6
enddo
Regress C6 1 C5; ## Menglutung koefisien regresi
coefficients Ck9. ## Lokasi cetak koefisien &
let C994 (k10) =Cl (k7) ## Nilai x untuk koefisien f i tercetak pada C994
let C995 (k10) =Ck9 (2) ## Nilai koefisien
PI
tercetak pada kolom C995let k9=l+k9 let k7=l+k7 enddo
Lampiran 7. Lanjutan
## Operator 6:)
let k13= (-l+k2) /2 let k14=l+k13
let k15=1+ (2*k13)
let k17=k2
## Nilai 1
## Indeks median 1+1
## Nilai k
do k18=1:k16
let C996 (k18)=Cl (k17) ## Nilai x untuk operator tercetak pada C996 let k19=C995(k14)-C995(k18)
let k20=C995 (k14) -C995 (k15)
let k21=abso (kl9)
let k22=abso (k20)
if k21=k22 or k21<k22 let C997 (k18) =k19 else if k21>k22
let C997 (k18) =k20 endif
## Nilai operator A!) tercetak pada C997
let k14=l+k14 let k15=l+k15 let k17=l+k17
let k23=C997 (k18)
let k24=abso (k23)
if k24>k6 ## Jika suatu loncatan terdeteksi
let c998 (k18)=1 ## maka tercetak angka 1 pada kolom C998 else if k24<k6 or k24=k6 ##Jikatidakadaloncatan
let c998 (k18) =0 ## maka tercetak angka 0 pada kolom C998 endif
enddo
name C996='x Operator' name C997='0peratorV name C998='Kode Deteksi'
Lampiran 1 1. Petunjuk penggunaan metode polinom lokal kuadrat terkecil untuk mendeteksi adanya loncatan
Misalkan terdapat suatu data dengan ukuran n = 100. X adalah peubah penjelas
dan Y adalah peubah respon.
Pasangan nilai ( x , y) kemudian ditebar dalam suatu diagram pencar. Gambar 6 menunjukkan adanya indikasi loncatan pada x = 61. Untuk memastikan adanya
loncatan tersebut diguuakan metode polinom lokal kuadrat terkecil. Prosedur
pendeteksian menghti algoritma berikut:
Gambar 6. Diagram pencar dari data yang akan dideteksi.
2. Skala nilai-nilai x diubah demikian sehingga nilai x terkecil sama dengau l l n
dan nilai x terbesar sama dengan 1, sedangkan nilai-nilai y distandardisasi. Hal
ini dilakukan untuk menyamakan penggunaan nilai threshold pada hrbagai skala data real. Tabel 4 menmjukkan perubahan skala x dan y tersebut.
3. Pasangan (x, y ) selanjutnya diberikan suatu indeks (x, , y, ) berdasarkan urutan
data. Berdasarkan tabel 4, (x,,, y,, ) = (0.61,0.33036) yang berpadanan dengan
data asli ( x , y ) = (6 1,82.06) pada tabel sebelumnya.
4. Bentuk tetangga terdekat dari suatu data. Karena n = 100 maka menurut hasil
penelitian ini, banyaknya data setiap tetangga adalah k = 15. Tetangga ke-1
beranggotakan lima belas nilai x, terkecil pertama. Tetangga ini dilambangkan dengan N(x,) yang berarti bahwa nilai-nil6 x, yang tennuat dalam tetangga
tersebut merupakan tetangga terdekat dari x, (median). Tetangga ke-2 terdiri
atas nilai x, sampai nilai x,, , dalam hal ini N(x9) = {x,,x,,..; X ~ , . . ; X , , , X , ~ ) .
Tetangga ke-3 adalah N(x,, ) = {x, , x, ,a ; x,, ,*.
.,
x,, , x,,).
Demikian seterusnyasampai terbentuk n
-
k+
1 = 86 tetangga.5. Tetapkan bentuk fimgsi polinom yang akan digunakan. Penetapan ini &pat dilakukan dengan memperhatikan trend data tetangga ke-1
.
Dalam ilustrasi ini, pendeteksian loncatan didasarkan pada penggunaan{B,(o),
karena trend dataTabel 4. Nilai rancangan x, dan nilai s;tandardisasi respan y, dari data yang akan dideteksi
Nilai-nilai x dirancang demitian sehingga nilai terkecil adalah x, = 1 1 n dan nilai terbesar adalah xm = 1.
7. Catat semua koefisien
b$
yang diperoleh dad pengepasan terhadap tetangga dengan median xi. Apabila pengepasan dllakukan dengan menggunakan h g s ikuadratik maka yang dicatat adalah koefisien
8:".
[image:127.545.69.471.199.686.2]8. Nilai operator A:) dihitung dengan memakai rumus:
dengan k 5 i 5 n - k + l dan I = ( k - 1 ) / 2 . Dalamilustrasiini, I = 7 .
Tabel 6. Nilai operator A(:) dari tetangga dengan median x,
9. Sebagai penentu adanya loncatan dipakai nilai threshold u,. Nilai ini diperoleh
dengan menggunakan rumus:
dengan
6
adalah penduga ragam data dan Z,,, adalah taraf kepercayaan [image:128.545.76.477.214.665.2]Penduga ragam & dapat diperoleh dari h a d pengepasan lokal telhadap
segmentasi pendahuluan. Gambar 6 menunjulckan adanya kecendenmgan data
terpartisi ke dalam dua segmen. Segmen pertama beranggotakan data (x,, y, )
dengan i = 1,2,.. ;60 dan segmen kedua beranggotakan (x,, y, ) dengan i =
6 1,62,.. .,loo. Segmentasi ini dapat dilakukan karena adanya indikasi lmcatan
pada x = 61 (Gambar 6). Nilai 3 yang diperoleh dari pengepasan ini adalah
& = 0,607 . Sedangkan taraf kepercayaan yang dipakai adalah Z,,, = 2,58
yang setara dengan a = 0,01 sehingga diperoleh nilai'threshold u, = 14.5706.
Tabel 6 menunjukkan bahwa nilai-nilai
IA\~)~, IA?')
1,
I A \ ~ ) ~
lebih besar dad u, .Dengan demikian ada tiga indikasi loncatan yang diberikan oleh algoritma.
Ketiga indlkasi ini berada dalam tetangga dengan median x6,. Ini berarti bahwa, suatu loncatan te jadi pada x,, yang berpadanan dengan x = 61.
10. Penentuan posisi loncatan juga dapat dilakukan dengan melihat diagram
pencar dari {pi')} dan diagram pencar dad {A:)}. Gambar 7(a) dan 7(b) juga
menunjukkan adanya indikasi loncatan pada x,,
.
11. Langkah terakhir adalah mengepas suatu kurva terhadap setiap segmen yang
diperoleh. Pengepasan ini dapat dilakukan dengan menggunakan metode
kuadrat terkecil, metode pemulusan atau metode pengepasan lainnya.
Gambar 7. (a) Koefisien polinom
iii)
dari tetangga dengan median x,.
[image:129.545.71.471.52.729.2] [image:129.545.81.468.470.645.2]Untuk memudahkan pendeteksian, pengguna dapat memakai makro minitab
(Lampiran 7). Makro tersebut dapat disimpan dalam suatu file notepad 0ump.txt).
Data yang akan dideteksi diketik pada lembar data minitab. Nilai-nilai peubah
penjelas X diketik b e m t pada kolom C 1, sedangkan nilai-nilai peubah respon Y
diketik pada kolom C2. Selanjutnya pada session window diketik %c:\jump.txt
[enter] (Gambar 8).
1 Worksheet size: 100000 cells
,
! Retrieving vorksheet f rom file: C:WAHAR.YITWi Worksheet vas saved on 2/13/2002
I, MTB > %c:\jump. txt
I
r
Gambar 8. Pendeteksian loncatan dengan makro minitab.
Hasil pendeteksian dapat dilihat pa& kolom C996 dan C998. Jika terjadi suatu
loncatan maka pada kolom C998 tercetak angka 1, sedangkan angka yang tercetak
[image:130.545.69.497.169.650.2]