• Tidak ada hasil yang ditemukan

1. Penentuan peubah-peubah dan nilai-niiai pemilah. 2. Penentuan simpul terminal

N/A
N/A
Protected

Academic year: 2021

Membagikan "1. Penentuan peubah-peubah dan nilai-niiai pemilah. 2. Penentuan simpul terminal"

Copied!
9
0
0

Teks penuh

(1)

TINJAUAN PUSTAKA Pohon Klasifikasi Konsep Dasar Metode Pohon Klasifikasi

Metode klasifikasi dengan struktur pohon untuk peubah respons tunggal diperkenalkan oleh Breiman et al. (1984). Klasifikasi berstruktur pohon untuk peubah respons tunggal disusun berdasarkan pemilahan secara iteratif terhadap peubah penjelasnya. Pemilahan pertama dilakukan terhadap seluruh amatan sehingga diperoleh dua gugus amatan. Pemilahan bcrikutnya dilakukan terhadap kedua gugus amatan tersebut sehingga diperoleh masing-masing dua gugus amatan berikutnya. Setiap pemilahan selalu melibatkan semua peubah penjelas dan selalu menghasilkan satu peubah pemilah yang mencerminkan karakteristik kedua gugus amatan yang terbentuk. Adapun pembentukan pohon klasifikasi terdii dari tahapan-tahapan sebagai berikut :

1 . Penentuan peubah-peubah dan nilai-niiai pemilah. 2. Penentuan simpul terminal

3. Penentuan ukuran pohon k l a s i f h i yang optimum.

Gambar 1 menampillcan sebuah struktur pohon sederhana yang mempunyai 3 lapisan simpul, yaitu :

1) Lapisan pertama terdiri dari simpul akar (root node).

2 ) Lapisan kedua terdiri 1 simpul dalam (internal node) dan 1 simpul terminal. 3) Lapisan ketiga terdii dari 2 simpul terminal (terminal node).

Simpul

Terminal Terminal

(2)

Setiap simpul dalam akan terpilah kembali menjadi dua anak simpul di bawabya, sedangkan simpul terminal adalah simpul akhir yang tidak dapat terpilah kembali dengan adanya aturan jumlah amatan minimum pada setiap simpul. Dengan demikian, simpul terminal ditentukan berdasarkan jumlah amatan minimum yang dikandungnya.

Peubah Respons Biner Ganda

Peubah respons yang digunakan dalam metode klasifikasi berstruktur pohon pada penelitian ini adalah peubah-peubah yang bersifat kategorik dengan dua kategori. Peubah respons tersebut banyak dijumpai dalam penelitian yang bersifat klinis clan observasional. Selanjutnya peubah respons tersebut dinamakan peubah respons biner ganda.

Kriteria Pernilahan Simpul

Berikut akan dipaparkan proses pembentukan pohon klasifikasi dan kriteriahkwan yang digunakannya. Misal terdapat sejumlah p peubah penjelas X dan q peubah respons b i e r Y untuk n individu yang diamati. Untuk individu ke-i, ukurannya adalah :

YI = (Y,I, YQ,

...,

ylq)' dan XI = (X,I,XQ,

...,

xlp)' dengan i = l,2, ..., n Pohon klasifikasi dibentuk melalui pemilahan pa& simpul akar menjadi dua anak simpul, yaitu anak simpul kiri dan anak simpul kanan. Kedua anak simpul yang terbentuk dapat berupa simpul dalam atau simpul terminal. Jika berupa simpul dalam, maka simpul tersebut akan dipilah lagi menjadi anak simpul kanan dan

anak simpul kiri berikutnya. Misalkan x, &ah nilai-nilai amatan terurut dari suatu peubah penjelas X. Aturan pemilahan yang digunakan adalah sebagai berikut :

1. Tiap pemilahan tergantung pada nilai yang berasal dari satu peubah penjelas.

2. Untuk peubah penjelas yang bersifat kontinu, pemilahan hanya berasal dari pertanyaan "Apakah x, 5 c ?'untuk c E %I, dengan kata lain nilai

pemilah c harus berada di dalam rentang nilai-nilai yang diamati dalam X. Jadi, jika terdapat sebanyak-banyaknya k nilai amatan berbeda pada peubah penjelas X, maka akan terdapat sebanyak-banyaknya k-1

(3)

pemilahan (split) yang berbeda yang dibentuk oleh gugus pertanyaan ("Apakah xj 5 ci ?" ), defigan i = 1,2,3,

.

..,

a-1 dan c, &ah nilai tengah (midlepoint) antara dua nilai amatan b e m t a n dari peubah X.

3. Untuk peubah penjelas kategorik, pemilahan yang terjadi berasal dari semua kemungkinan pemilahan berdasarkan terbentuknya dua anak gugus amatan yang saling lepas (disjoint). Jika peubah X merupakan peubah kategorik nominal bertaraf L, maka akan ada 2"'- 1 pemilahan, sedangkan jika X berupa peubah kategorik ordinal, maka akan ada L

-

1 pemilahan

yang mungkin.

Simpul akar mengandung seluruh contoh yang diamati dan simpul-simpul lainnya berhubungan dengan sub-grup dari contoh yang diamati. Dua sub-grup yang ada di kiri dan kanan anak simpul tidak saling berkaitan dan gabungannya membentuk sub-grup untuk simpul induk. Dengan adanya sejumlah peubah penjelas clan sejumlah nilai pemilah, simpul akar dapat terbagi menjadi 2 simpul dengan banyak cara. Karenanya diperlukan kriteria untuk memilii sebuah pemilahan. Kriteria yang diiaksud yaitu pemilahan pada tiap simpul secara rekursif dengan cara sebagai berikut :

1. Cari semua kemungkinan pemilahan pada tiap peubah penjelas.

2. Pilih "pernilahan terbaik" dari masing-masing peubah penjelas dan pilih "pemilahan terbaik" dari "kumpulan pemilahan terbaik" tersebut. "Pemilahan terbaik" adalah pemilahan yang memaksimumkan ukuran homogenitas di dalam masing-masing anak simpul relatif terhadap simpul induknya dan yang memaksimumkan ukuran pernilahan antara dua anak simpul tersebut.

Ukuran Homogenitas Simpul

Misalkan terdapat peubah penjelas Xj dan peubah respons

YI,

Sebuah pemilahan dipilih jika sebaran nilai-nilai amatan pada

Yk

ddam anak sinipul bersifat homogen. Berikut adalah deskripsi untuk menentukan ukuran homogenitas simpul yang dijelaskan oleh Zhang (1998). Berikut ini adalah

(4)

tabel yang dapat dibuat sebagai hasil dari pertanyaan " apakah xj

<

c ? " : yk'o yk= 1 Tidak Ya Simpul Kiri ( t~ ) xj S c n~ Simpul

Kanan

( t~ ) xj

z

c nz. n I n.2

Penentuan

ukuran

homogenitas dimulai dari simpul kiri ( tl ). Simpul kiui ( t~ ) hams mengandung rill yang lebih besar dari 1112 atau sebaliknya. Ukuran yang sering digunakan untuk homogenitas simpul ditentukan melalui fungsi entropi sebagai berikut :

Sebuah pernilahan dipilih dengan memaksimalkan homogenitas simpul yang terboboti :

Hal yang perlu diperhatikan adalah bahwa h g s i entropi (1) memiliki sebuah interpretasi pararnetrik. Misalkan

Yk

pada simpul t~ mengikuti sebaran binomial dengan frekuensi 8 sebagai berikut :

~ ( ~ k = l l t L ) = 6

Lalu fungsi log-likelihood dati nl, arnatan pada simpul kiri t~ adalah :

n,, log(@+ n12 log(1-e)

Nilai maksimum dari fungsi log-likelihood tersebut proporsional terhadap fungsi entropi (1). Lalu fungsi entropi (1) digeneralisasi untuk kasus dengan respons biner ganda. Sebuah pendekatan parametrik dilakukan untuk menstabilkan fungsi entropi yang digeneralisasi. Misalkan y mempunyai sebaran peluang bersama sebagai berikut :

fi

; Y, Q) = exp (Y'y

+

Q'w - A(Y,Q)) dengan

(5)

A(Y,R) = fimgsi yang menormalisasi dan bergantung pada Y dan Q.

w = vekto~ acak yang memuat ( ~ 1 ~ 2 ,

.

.

.,yq-1yq,

. .

., y1y2

.

. .

yq)' Sebaran yang berasal dari keluarga sebaran eksponensial adalah dasar dari model parametrik yang digunakan untuk respons b i e r ganda. Kemudian asumsikan bahwa sebaran bersama y tergantung kepada kombinasi linier dan jumlah ordo kedua dari komponen tersebut saja. Lebih tepatnya, asumsikan bahwa sebaran bersama y adalah :

j(y ; Y , 6 ) = exp (Y'y

+

Ow - A(Y,B)) (3)

dengan w = C i < j y i y j

Maka fimgsi entropi yang digeneralisasi untuk homogenitas simpul kiri t~ d i d e f ~ s i k a n sebagai nilai maksimum bentuk log-likelihood dari sebaran y :

( subyek i E t,}

dengan Y dan

i

dapat dilihat sebagai nilai taksiran likelihood maksimum dari Y dan B. Ukuran homogenitas simpul t~ dapat ditentukan dengan cara yang sama dengan cara di atas. Setelah menentukan ukuran homogenitas, (2) digunakan kcmbali uituk memilih pemilahan yang diinginkan.

Amatan dengan Data yang Hiang

Pennasalahan timbul pada saat beberapa peubah penjelas memiliki nilai-nilai amatan yang hilang (missing values). Untuk mengatasi masalah tersebut, digunakan metode yang disebut missing-together strategy (Clark dan Pregibon

1992; Zhang et al. 1996) dan peubah pengganti (surrogate) (Breiman et al. 1984). Ukuran Pohon Klasifikasi yang Optimum

Pohon klasifikasi yang dibentuk dengan aturan splitting dan aturan growing berukuran sangat besar. Hal ini karena aturan penghentian (stopping rule) yang digunakan hanya berdasarkan banyaknya amatan pada simpul akhir atau besarnya peningkatan pada ukuran homogenitas simpul. Semakin banyak pemilahan yang dilakukan maka semakin kecil tingkat kesalahan prediksi. Namun, pohon klasifikasi yang besar bisa menimbulkan overfiting. Cara mengatasi masalah

(6)

tersebut adalah dengan menentukan pohon klasifikasi dengan ukuran yang optimum dengan tahapa sebagzi beriklit :

1. Penentuan pohon awal yang besar.

2. Pemangkasan pohon (pruning) secara iteratif menjadi sekuen pohon yang

makin kecil.

3. Pemilihan pohon terbaik dari sekuen yang terbentuk dengan menggunakan contoh uji (test sample) atau contoh validasi silang (cross validation sample).

Pemangkasan pada langkah kedua di atas dilakukan dengan menggunakan ukuran

cost-complexity minimum (Breiman et al. 1993). Ukuran cost-complexity tersebut

menunjukkan banyaknya simpul terminal dari sebuah pohon klasifikasi.

Untuk melaksanakan langkah tersebut, cost-complexity dari sebuah pohon

klasifikasi ditentukan oleh :

dengan :

R,(

T ) = ukuran cost-complexity sebuah pohon klasifikasi

4 2 0 ) = complexity parameter yang menentukan jumlah simpul

terminal

IT1

= jumlah simpul terminal Sedangkan nilai R(T) didefinisikan sebagai :

dengan : f = fungsi yang telah dijelaskan pada (3)

@

dan

8^

= parameter f yang ditaksir dari learning sample

Setelah

R&)

ditentukan, langkah berikutnya adalah menentukan sebuah sekuen dari sub-pohon optimal yang tersarang yang disimbolkan dengan :

To 2 T I 2

...

2 T ,

dengan To adalah pohon inisial dan T,,, adalah pohon yang mengandung simpul akar saja. Kemudian, validasi silang digunakan untuk menentukan sub-pohon T*

(7)

yang memiliki ukuran cost-complexity yang minimum, yaitu :

R N ( T * )

='&

R N ( T j )

I=O (61

dengan : R N ( P ) = cost-complexity sub-pohon yang minimum

RN(T,.) = cost-complexity sub-pohon ke-j

Breiman et. a1 (1984) juga menyatakan bahwa posisi dari nilai R"(

q)

yang minimum tidak stabil. Karenanya, Breiman et. a1 (1984) menggunakan aturan 1-standard error (SE) untuk mengatasi hal tersebut. Sehingga, sub-pohon terkecil

I;

*

diperoleh dengan ketentuan :

R N ( T , * ) S R N ( T * ) + S E ( R N ( T * ) )

dengan S E ( R " (T *)) adalah simpangan baku dari R" (T*)

.

Kestabilan Pohon Klasifikasi

Kestabilan pohon yang terbentuk merniliki arti yang sangat penting (Breirnan, et. a1 1984). Pohon klasitikasi yang stabil memberkin informasi yang konsisten tentang hasil pengelompokan amatan, meskipun jumlah amatannya direduksi. Untuk menyelidiki kestabilan dari sebuah pohon, dilakukan tahapau sebagai berikut :

1. Membagi seluruh amatan menjadi dua kelompok amatan dengan jumlah yang sama. Kelompok amatan pertama disebut building set dan kelompok kedua disebut validnting set.

2. Sebuah pohon klasifikasi dibentuk dengan menggunakan amatan pada building set dan hasilnya dibandiigkan dengan pohon yang terbentuk dari seluruh amatan.

Sterilisasi pada Wanita

Definisi dan Cara Sterilisasi

Siswosudmo (2001) menyebutkan bahwa dalam ilmu kedokteran khususnya Giekologi, sterilisasi pada wanita didefinisikan sebagai setiap tindakan pada kedua tuba vulopii yang mengakibatkan tidak tetjadinya pertemuan antara sel telur wanitd dengan sperma. Cara sterilisasi yang sering digunakan hingga kini

(8)

adalah cara minilaparotomi dan cara laparoskopi (Fidruzal, 1993). Adapun teknik penyumbatan tub8 dapat dilakukan dengan beberape cara seperti ymg c!ijelaskan oleh Fidruzal(1993) dan Siswosudarmo (2001).

Efek Samping Sterilisasi

Fidruzal(1993) membedakan efek samping sterilisasi menjadi :

1. Efek samping dini, yaitu efek samping yang timbul kurang dari tiga minggu setelah menjalani sterilisasi. Efek samping yang terjadi berupa perdarahan, infeksi, traumalcedera organ dan kematian akibat tindakan sterilisasi.

2. Efek samping lanjut, yaitu efek samping yang timbul tiga minggu atau lebih setelah menjalani sterilisasi. Adapun faktor-faktor yang dilihat sebagai efek samping lanjut dari sterilisasi adalah :

a. Siklus haid, yaitu jarak antara hari pertama haid dengan hari pertama haid pada siklus bulan berikutnya yang dihitung dalam hari.

b. Haid teratur, yaitu haid yang datang setiap bulan dengan siklus antara 21 s.d. 35 hari.

c. Lama haid, yaitu jarak antara hari peasma keluarnya darah haid sampai dengan berhentinya darah haid yang dihitung dalam

hari.

d. Gangguan haid, yaitu keluhan fisik yang timbul selama haid.

e. Perubahan kehidupan seksual adalah perubahan daiam fiekuensi hubungan intim atau perubahan frekuensi orgasme pada setiap melahkan hubungan intim setelah menjalani sterilisasi.

Faktor-faktor Resiko Terjadinyn Efek Samping Sterilisasi

Fidruzal (1993) dalam penelitiannya mendeskripsikan bahwa menurut survei prevalensi cli Indonesia pada tahun 1987, dari 41,2 % wanita usia subur yang tidak ingin hamil !agi, hanya sebagian kecil yang memilih kontrasepsi sterilisasi. Hingga tahun 1991, baru 5,2 % dari jumlah pasangan usia subur yang memilih sterilisasi sebagai kontrasepsi. Sebagian b a a dari wanita tersebut menolak melakukan sterilisasi dengan berbagai alasan seperti perasaan takut, takut hamil lagi, haid jadi tidak teratur clan anggapan bahwa sterilisasi menyebabkan wanita menjadi "diigin" dalam kehidupan seksual.

(9)

Berdasarkan ha1 tersebut, perlu dilakukan usaha untuk menyediakan infcxrnasi tentang efek sunping sterilisasi, yGtu dengan mengelompokkan wanita peserta KB sterilisasi berdasarkan faktor-faktor yang dapat mempenganrhi te jadinya efek samping sterilisasi, sehingga wanita usia subur mengetahui secara pasti tentang faktor-faktor apa saja yang dapat menimbulkan efek samping sterilisasi.

Fidruzal (1993) menyebutkan bahwa faktor-faktor yang dapat menyebabkan atau mempengaruhi terjadinya efek samping sterilisasi berdasarkan hasil beberapa penelitian di dalam dan luar negeri adalah sebagai berikut :

1. Saat dan cara sterilisasi serta tipe penyumbatan tuba dapat menyebabkan kemsakan cabang-cabang pembuluh arteri uterina yang menuju ovarium, sehingga mempengaruhi tejadinya perubahan pola haid, lama haid dan juga jumlah darah haid.

2. Tejadinya kompliiasi s a t sterilisasi dapat menimbulkan efek samping secara psikologis seperti perasaan menyesal dan memburuknya kehidupan seks.

3. Jenis

KB

dan lama KB sebelum melakukan sterilisasi juga dapat

mempengaruhi terjadimya pembahan pola haid. Sebagian besar alat kontrasepsi sangat mempengaruhi produksi honnon progesteron yang berperan &dam siklus haid dan jurnlah darah haid. Sehingga perubahan jenis

KB

yang digunakan juga akan mempengatuhi pola haid sewrang. 4. Usia pada saat sterilisasi juga sering mendapatkan perhatian dari beberapa

peneliti. Dari hasil beberapa penelitian menunjukkan usia di atas 40 tahun dapat menjadi penyebab tejadinya efek samping sterilisasi.

5. Jumlah anak sebelum sterilisasi akan berdampak secara psikologis terhadap sterilisasi. Seseorang dengan jumlah anak yang banyak akan mengalami perasaan khawatir seandainya sterilisasi yang dilakukan temyata tidak berhasil, sehingga hal tersebut mempengaruhi kehidupan rumah tangganya.

Gambar

Gambar  1  menampillcan sebuah struktur pohon sederhana yang mempunyai 3  lapisan simpul, yaitu  :
tabel  yang  dapat  dibuat  sebagai  hasil  dari  pertanyaan  &#34;  apakah  xj  &lt;  c  ?  &#34;  :  yk'o  yk= 1  Tidak  Ya  Simpul Kiri  (  t~  )  xj  S  c  n~  Simpul  Kanan  (  t~  )  xj  z  c  nz

Referensi

Dokumen terkait

Kontribusi karyawan bagi organisasi sangatlah dominan, karena karyawan adalah penghasil kerja bagi organisasi.Hal ini berarti adalah setiap pekerjaan dalam organisasi

Teknik 1.500.000 BLU-FT Pebruari Pebruari-Maret 90 Pengadaan Lemari arsip untuk Subbag UMKAP PBJ 1 unit Fak.. Teknik 2.000.000 BLU-FT

40 Tahun 1999 Tentang Pers dalam Memberikan Perlindungan Kemerdekaan Pers Bagi Wartawan Kota Bandung. 40 tahun 1999 yang

Osteokalsin mempunyai peran penting dalam regulasi pembentukan kristal hidroksiapatit (mineralisasi), oleh karena itu osteoklasin baru bisa di deteksi pada fase reparatif

Berbeda dengan perubahan shift kerja (pada perawat) yang sering menimbulkan masalah yang bertahan lebih lama dalam penyesuaian pola tidur dengan tuntutan jadwal kerja, yang

Tujuan dari penelitian adalah untuk mengetahui perbedaan kuat lentur dan beban batas yang terjadi pada panel sirip bambu dengan takikan pada permukaan panel

Sebaliknya, jika suatu proses memiliki CPU burst yang lebih besar dibandingkan dengan waktu quantum, maka proses tersebut akan dihentikan sementara jika sudah mencapai waktu

Tidak ditemukan adanya hubungan yang signifikan pada variabel usia, tingkat stres, usia menarche, lama menstruasi dan siklus menstruasi dengan kejadian dismenore