TINJAUAN PUSTAKA Pohon Klasifikasi Konsep Dasar Metode Pohon Klasifikasi
Metode klasifikasi dengan struktur pohon untuk peubah respons tunggal diperkenalkan oleh Breiman et al. (1984). Klasifikasi berstruktur pohon untuk peubah respons tunggal disusun berdasarkan pemilahan secara iteratif terhadap peubah penjelasnya. Pemilahan pertama dilakukan terhadap seluruh amatan sehingga diperoleh dua gugus amatan. Pemilahan bcrikutnya dilakukan terhadap kedua gugus amatan tersebut sehingga diperoleh masing-masing dua gugus amatan berikutnya. Setiap pemilahan selalu melibatkan semua peubah penjelas dan selalu menghasilkan satu peubah pemilah yang mencerminkan karakteristik kedua gugus amatan yang terbentuk. Adapun pembentukan pohon klasifikasi terdii dari tahapan-tahapan sebagai berikut :
1 . Penentuan peubah-peubah dan nilai-niiai pemilah. 2. Penentuan simpul terminal
3. Penentuan ukuran pohon k l a s i f h i yang optimum.
Gambar 1 menampillcan sebuah struktur pohon sederhana yang mempunyai 3 lapisan simpul, yaitu :
1) Lapisan pertama terdiri dari simpul akar (root node).
2 ) Lapisan kedua terdiri 1 simpul dalam (internal node) dan 1 simpul terminal. 3) Lapisan ketiga terdii dari 2 simpul terminal (terminal node).
Simpul
Terminal Terminal
Setiap simpul dalam akan terpilah kembali menjadi dua anak simpul di bawabya, sedangkan simpul terminal adalah simpul akhir yang tidak dapat terpilah kembali dengan adanya aturan jumlah amatan minimum pada setiap simpul. Dengan demikian, simpul terminal ditentukan berdasarkan jumlah amatan minimum yang dikandungnya.
Peubah Respons Biner Ganda
Peubah respons yang digunakan dalam metode klasifikasi berstruktur pohon pada penelitian ini adalah peubah-peubah yang bersifat kategorik dengan dua kategori. Peubah respons tersebut banyak dijumpai dalam penelitian yang bersifat klinis clan observasional. Selanjutnya peubah respons tersebut dinamakan peubah respons biner ganda.
Kriteria Pernilahan Simpul
Berikut akan dipaparkan proses pembentukan pohon klasifikasi dan kriteriahkwan yang digunakannya. Misal terdapat sejumlah p peubah penjelas X dan q peubah respons b i e r Y untuk n individu yang diamati. Untuk individu ke-i, ukurannya adalah :
YI = (Y,I, YQ,
...,
ylq)' dan XI = (X,I,XQ,...,
xlp)' dengan i = l,2, ..., n Pohon klasifikasi dibentuk melalui pemilahan pa& simpul akar menjadi dua anak simpul, yaitu anak simpul kiri dan anak simpul kanan. Kedua anak simpul yang terbentuk dapat berupa simpul dalam atau simpul terminal. Jika berupa simpul dalam, maka simpul tersebut akan dipilah lagi menjadi anak simpul kanan dananak simpul kiri berikutnya. Misalkan x, &ah nilai-nilai amatan terurut dari suatu peubah penjelas X. Aturan pemilahan yang digunakan adalah sebagai berikut :
1. Tiap pemilahan tergantung pada nilai yang berasal dari satu peubah penjelas.
2. Untuk peubah penjelas yang bersifat kontinu, pemilahan hanya berasal dari pertanyaan "Apakah x, 5 c ?'untuk c E %I, dengan kata lain nilai
pemilah c harus berada di dalam rentang nilai-nilai yang diamati dalam X. Jadi, jika terdapat sebanyak-banyaknya k nilai amatan berbeda pada peubah penjelas X, maka akan terdapat sebanyak-banyaknya k-1
pemilahan (split) yang berbeda yang dibentuk oleh gugus pertanyaan ("Apakah xj 5 ci ?" ), defigan i = 1,2,3,
.
..,
a-1 dan c, &ah nilai tengah (midlepoint) antara dua nilai amatan b e m t a n dari peubah X.3. Untuk peubah penjelas kategorik, pemilahan yang terjadi berasal dari semua kemungkinan pemilahan berdasarkan terbentuknya dua anak gugus amatan yang saling lepas (disjoint). Jika peubah X merupakan peubah kategorik nominal bertaraf L, maka akan ada 2"'- 1 pemilahan, sedangkan jika X berupa peubah kategorik ordinal, maka akan ada L
-
1 pemilahanyang mungkin.
Simpul akar mengandung seluruh contoh yang diamati dan simpul-simpul lainnya berhubungan dengan sub-grup dari contoh yang diamati. Dua sub-grup yang ada di kiri dan kanan anak simpul tidak saling berkaitan dan gabungannya membentuk sub-grup untuk simpul induk. Dengan adanya sejumlah peubah penjelas clan sejumlah nilai pemilah, simpul akar dapat terbagi menjadi 2 simpul dengan banyak cara. Karenanya diperlukan kriteria untuk memilii sebuah pemilahan. Kriteria yang diiaksud yaitu pemilahan pada tiap simpul secara rekursif dengan cara sebagai berikut :
1. Cari semua kemungkinan pemilahan pada tiap peubah penjelas.
2. Pilih "pernilahan terbaik" dari masing-masing peubah penjelas dan pilih "pemilahan terbaik" dari "kumpulan pemilahan terbaik" tersebut. "Pemilahan terbaik" adalah pemilahan yang memaksimumkan ukuran homogenitas di dalam masing-masing anak simpul relatif terhadap simpul induknya dan yang memaksimumkan ukuran pernilahan antara dua anak simpul tersebut.
Ukuran Homogenitas Simpul
Misalkan terdapat peubah penjelas Xj dan peubah respons
YI,
Sebuah pemilahan dipilih jika sebaran nilai-nilai amatan padaYk
ddam anak sinipul bersifat homogen. Berikut adalah deskripsi untuk menentukan ukuran homogenitas simpul yang dijelaskan oleh Zhang (1998). Berikut ini adalahtabel yang dapat dibuat sebagai hasil dari pertanyaan " apakah xj
<
c ? " : yk'o yk= 1 Tidak Ya Simpul Kiri ( t~ ) xj S c n~ SimpulKanan
( t~ ) xjz
c nz. n I n.2Penentuan
ukuran
homogenitas dimulai dari simpul kiri ( tl ). Simpul kiui ( t~ ) hams mengandung rill yang lebih besar dari 1112 atau sebaliknya. Ukuran yang sering digunakan untuk homogenitas simpul ditentukan melalui fungsi entropi sebagai berikut :Sebuah pernilahan dipilih dengan memaksimalkan homogenitas simpul yang terboboti :
Hal yang perlu diperhatikan adalah bahwa h g s i entropi (1) memiliki sebuah interpretasi pararnetrik. Misalkan
Yk
pada simpul t~ mengikuti sebaran binomial dengan frekuensi 8 sebagai berikut :~ ( ~ k = l l t L ) = 6
Lalu fungsi log-likelihood dati nl, arnatan pada simpul kiri t~ adalah :
n,, log(@+ n12 log(1-e)
Nilai maksimum dari fungsi log-likelihood tersebut proporsional terhadap fungsi entropi (1). Lalu fungsi entropi (1) digeneralisasi untuk kasus dengan respons biner ganda. Sebuah pendekatan parametrik dilakukan untuk menstabilkan fungsi entropi yang digeneralisasi. Misalkan y mempunyai sebaran peluang bersama sebagai berikut :
fi
; Y, Q) = exp (Y'y+
Q'w - A(Y,Q)) denganA(Y,R) = fimgsi yang menormalisasi dan bergantung pada Y dan Q.
w = vekto~ acak yang memuat ( ~ 1 ~ 2 ,
.
.
.,yq-1yq,. .
., y1y2.
. .
yq)' Sebaran yang berasal dari keluarga sebaran eksponensial adalah dasar dari model parametrik yang digunakan untuk respons b i e r ganda. Kemudian asumsikan bahwa sebaran bersama y tergantung kepada kombinasi linier dan jumlah ordo kedua dari komponen tersebut saja. Lebih tepatnya, asumsikan bahwa sebaran bersama y adalah :j(y ; Y , 6 ) = exp (Y'y
+
Ow - A(Y,B)) (3)dengan w = C i < j y i y j
Maka fimgsi entropi yang digeneralisasi untuk homogenitas simpul kiri t~ d i d e f ~ s i k a n sebagai nilai maksimum bentuk log-likelihood dari sebaran y :
( subyek i E t,}
dengan Y dan
i
dapat dilihat sebagai nilai taksiran likelihood maksimum dari Y dan B. Ukuran homogenitas simpul t~ dapat ditentukan dengan cara yang sama dengan cara di atas. Setelah menentukan ukuran homogenitas, (2) digunakan kcmbali uituk memilih pemilahan yang diinginkan.Amatan dengan Data yang Hiang
Pennasalahan timbul pada saat beberapa peubah penjelas memiliki nilai-nilai amatan yang hilang (missing values). Untuk mengatasi masalah tersebut, digunakan metode yang disebut missing-together strategy (Clark dan Pregibon
1992; Zhang et al. 1996) dan peubah pengganti (surrogate) (Breiman et al. 1984). Ukuran Pohon Klasifikasi yang Optimum
Pohon klasifikasi yang dibentuk dengan aturan splitting dan aturan growing berukuran sangat besar. Hal ini karena aturan penghentian (stopping rule) yang digunakan hanya berdasarkan banyaknya amatan pada simpul akhir atau besarnya peningkatan pada ukuran homogenitas simpul. Semakin banyak pemilahan yang dilakukan maka semakin kecil tingkat kesalahan prediksi. Namun, pohon klasifikasi yang besar bisa menimbulkan overfiting. Cara mengatasi masalah
tersebut adalah dengan menentukan pohon klasifikasi dengan ukuran yang optimum dengan tahapa sebagzi beriklit :
1. Penentuan pohon awal yang besar.
2. Pemangkasan pohon (pruning) secara iteratif menjadi sekuen pohon yang
makin kecil.
3. Pemilihan pohon terbaik dari sekuen yang terbentuk dengan menggunakan contoh uji (test sample) atau contoh validasi silang (cross validation sample).
Pemangkasan pada langkah kedua di atas dilakukan dengan menggunakan ukuran
cost-complexity minimum (Breiman et al. 1993). Ukuran cost-complexity tersebut
menunjukkan banyaknya simpul terminal dari sebuah pohon klasifikasi.
Untuk melaksanakan langkah tersebut, cost-complexity dari sebuah pohon
klasifikasi ditentukan oleh :
dengan :
R,(
T ) = ukuran cost-complexity sebuah pohon klasifikasi4 2 0 ) = complexity parameter yang menentukan jumlah simpul
terminal
IT1
= jumlah simpul terminal Sedangkan nilai R(T) didefinisikan sebagai :dengan : f = fungsi yang telah dijelaskan pada (3)
@
dan8^
= parameter f yang ditaksir dari learning sampleSetelah
R&)
ditentukan, langkah berikutnya adalah menentukan sebuah sekuen dari sub-pohon optimal yang tersarang yang disimbolkan dengan :To 2 T I 2
...
2 T ,dengan To adalah pohon inisial dan T,,, adalah pohon yang mengandung simpul akar saja. Kemudian, validasi silang digunakan untuk menentukan sub-pohon T*
yang memiliki ukuran cost-complexity yang minimum, yaitu :
R N ( T * )
='&
R N ( T j )I=O (61
dengan : R N ( P ) = cost-complexity sub-pohon yang minimum
RN(T,.) = cost-complexity sub-pohon ke-j
Breiman et. a1 (1984) juga menyatakan bahwa posisi dari nilai R"(
q)
yang minimum tidak stabil. Karenanya, Breiman et. a1 (1984) menggunakan aturan 1-standard error (SE) untuk mengatasi hal tersebut. Sehingga, sub-pohon terkecilI;
*
diperoleh dengan ketentuan :R N ( T , * ) S R N ( T * ) + S E ( R N ( T * ) )
dengan S E ( R " (T *)) adalah simpangan baku dari R" (T*)
.
Kestabilan Pohon Klasifikasi
Kestabilan pohon yang terbentuk merniliki arti yang sangat penting (Breirnan, et. a1 1984). Pohon klasitikasi yang stabil memberkin informasi yang konsisten tentang hasil pengelompokan amatan, meskipun jumlah amatannya direduksi. Untuk menyelidiki kestabilan dari sebuah pohon, dilakukan tahapau sebagai berikut :
1. Membagi seluruh amatan menjadi dua kelompok amatan dengan jumlah yang sama. Kelompok amatan pertama disebut building set dan kelompok kedua disebut validnting set.
2. Sebuah pohon klasifikasi dibentuk dengan menggunakan amatan pada building set dan hasilnya dibandiigkan dengan pohon yang terbentuk dari seluruh amatan.
Sterilisasi pada Wanita
Definisi dan Cara Sterilisasi
Siswosudmo (2001) menyebutkan bahwa dalam ilmu kedokteran khususnya Giekologi, sterilisasi pada wanita didefinisikan sebagai setiap tindakan pada kedua tuba vulopii yang mengakibatkan tidak tetjadinya pertemuan antara sel telur wanitd dengan sperma. Cara sterilisasi yang sering digunakan hingga kini
adalah cara minilaparotomi dan cara laparoskopi (Fidruzal, 1993). Adapun teknik penyumbatan tub8 dapat dilakukan dengan beberape cara seperti ymg c!ijelaskan oleh Fidruzal(1993) dan Siswosudarmo (2001).
Efek Samping Sterilisasi
Fidruzal(1993) membedakan efek samping sterilisasi menjadi :
1. Efek samping dini, yaitu efek samping yang timbul kurang dari tiga minggu setelah menjalani sterilisasi. Efek samping yang terjadi berupa perdarahan, infeksi, traumalcedera organ dan kematian akibat tindakan sterilisasi.
2. Efek samping lanjut, yaitu efek samping yang timbul tiga minggu atau lebih setelah menjalani sterilisasi. Adapun faktor-faktor yang dilihat sebagai efek samping lanjut dari sterilisasi adalah :
a. Siklus haid, yaitu jarak antara hari pertama haid dengan hari pertama haid pada siklus bulan berikutnya yang dihitung dalam hari.
b. Haid teratur, yaitu haid yang datang setiap bulan dengan siklus antara 21 s.d. 35 hari.
c. Lama haid, yaitu jarak antara hari peasma keluarnya darah haid sampai dengan berhentinya darah haid yang dihitung dalam
hari.
d. Gangguan haid, yaitu keluhan fisik yang timbul selama haid.
e. Perubahan kehidupan seksual adalah perubahan daiam fiekuensi hubungan intim atau perubahan frekuensi orgasme pada setiap melahkan hubungan intim setelah menjalani sterilisasi.
Faktor-faktor Resiko Terjadinyn Efek Samping Sterilisasi
Fidruzal (1993) dalam penelitiannya mendeskripsikan bahwa menurut survei prevalensi cli Indonesia pada tahun 1987, dari 41,2 % wanita usia subur yang tidak ingin hamil !agi, hanya sebagian kecil yang memilih kontrasepsi sterilisasi. Hingga tahun 1991, baru 5,2 % dari jumlah pasangan usia subur yang memilih sterilisasi sebagai kontrasepsi. Sebagian b a a dari wanita tersebut menolak melakukan sterilisasi dengan berbagai alasan seperti perasaan takut, takut hamil lagi, haid jadi tidak teratur clan anggapan bahwa sterilisasi menyebabkan wanita menjadi "diigin" dalam kehidupan seksual.
Berdasarkan ha1 tersebut, perlu dilakukan usaha untuk menyediakan infcxrnasi tentang efek sunping sterilisasi, yGtu dengan mengelompokkan wanita peserta KB sterilisasi berdasarkan faktor-faktor yang dapat mempenganrhi te jadinya efek samping sterilisasi, sehingga wanita usia subur mengetahui secara pasti tentang faktor-faktor apa saja yang dapat menimbulkan efek samping sterilisasi.
Fidruzal (1993) menyebutkan bahwa faktor-faktor yang dapat menyebabkan atau mempengaruhi terjadinya efek samping sterilisasi berdasarkan hasil beberapa penelitian di dalam dan luar negeri adalah sebagai berikut :
1. Saat dan cara sterilisasi serta tipe penyumbatan tuba dapat menyebabkan kemsakan cabang-cabang pembuluh arteri uterina yang menuju ovarium, sehingga mempengaruhi tejadinya perubahan pola haid, lama haid dan juga jumlah darah haid.
2. Tejadinya kompliiasi s a t sterilisasi dapat menimbulkan efek samping secara psikologis seperti perasaan menyesal dan memburuknya kehidupan seks.
3. Jenis
KB
dan lama KB sebelum melakukan sterilisasi juga dapatmempengaruhi terjadimya pembahan pola haid. Sebagian besar alat kontrasepsi sangat mempengaruhi produksi honnon progesteron yang berperan &dam siklus haid dan jurnlah darah haid. Sehingga perubahan jenis
KB
yang digunakan juga akan mempengatuhi pola haid sewrang. 4. Usia pada saat sterilisasi juga sering mendapatkan perhatian dari beberapapeneliti. Dari hasil beberapa penelitian menunjukkan usia di atas 40 tahun dapat menjadi penyebab tejadinya efek samping sterilisasi.
5. Jumlah anak sebelum sterilisasi akan berdampak secara psikologis terhadap sterilisasi. Seseorang dengan jumlah anak yang banyak akan mengalami perasaan khawatir seandainya sterilisasi yang dilakukan temyata tidak berhasil, sehingga hal tersebut mempengaruhi kehidupan rumah tangganya.