Dosen Pembimbing :
Prof.Dr.Ir.Handayani TJandrasa,MSc.PhD
Harmonisasi Algoritma Hybrid Untuk
Membangun Struktur Bayesian Network
Pada Basisdata
Ilham M.Said
5108201020
Dosen Pembimbing :
Prof.Dr.Ir.Handayani TJandrasa,MSc.PhD
Harmonisasi Algoritma Hybrid Untuk
Membangun Struktur Bayesian Network
Pada Basisdata
Pada Basisdata
Ilham M.Said
5108201020
Latar Belakang Masalah
Masing-masing algoritma hanya dapat
bekerja pada pada data lengkap (algoritma
CB) dan data tidak lengkap (algortima BC)
untuk mengkotruksi struktur bayesiannya
untuk mengkotruksi struktur bayesiannya
Latar Belakang Masalah
Masing-masing algoritma hanya dapat
bekerja pada pada data lengkap (algoritma
CB) dan data tidak lengkap (algortima BC)
untuk mengkotruksi struktur bayesiannya
untuk mengkotruksi struktur bayesiannya
Rumusan masalah
Bagaimana algoritma Hybrid ini dapat
bekerja membangun struktur Bayesian
Network berdasarkan data lengkap dan
data tidak lengkap yang sesuai dengan
data tidak lengkap yang sesuai dengan
struktur asalnya?
Rumusan masalah
Bagaimana algoritma Hybrid ini dapat
bekerja membangun struktur Bayesian
Network berdasarkan data lengkap dan
data tidak lengkap yang sesuai dengan
data tidak lengkap yang sesuai dengan
struktur asalnya?
Batasan
Data yang di gunakan dengan
menggunakan data bernilai biner
Solusi yang hanya ingin di capai hanyalah
terbentuknya konstruksi struktur bayes
terbentuknya konstruksi struktur bayes
Batasan
Data yang di gunakan dengan
menggunakan data bernilai biner
Solusi yang hanya ingin di capai hanyalah
terbentuknya konstruksi struktur bayes
Fase Algoritma
Algoritma ini ada 2 fase yaitu :
Fase pertama menghasilkan node ordering
(CB)
Fase kedua untuk mengkonstruksi struktur
Bayesian Network (BC).
Fase Algoritma
Algoritma ini ada 2 fase yaitu :
Fase pertama menghasilkan node ordering
(CB)
Fase kedua untuk mengkonstruksi struktur
Tujuan
Studi Cara Kerja algoritma hybrid
Pembuktian dan evaluasi hasil konstruksi
struktur Algoritma Hybrid tersebut.
Tujuan
Studi Cara Kerja algoritma hybrid
Pembuktian dan evaluasi hasil konstruksi
struktur Algoritma Hybrid tersebut.
Gambaran Umum Sistem
Tahapan yang di Kerjakan Data Tidak Lengkap
Langkah algoritma
Pembentukan graf lengkap
Periksa kardinalitas node terhadap orde CI test untuk
melihat CI relation
Edge dimungkinkan dua arah (bidirected) karena tidak
semua orde CI test dilakukan sejumlah CI relation yang
tidak ditemukan sehingga muncul edge ekstra.
Pemberian arah berdasarkan aturan/rule bersifat
undirected edge maupun bidirected edge.
Langkah algoritma
Pembentukan graf lengkap
Periksa kardinalitas node terhadap orde CI test untuk
melihat CI relation
Edge dimungkinkan dua arah (bidirected) karena tidak
semua orde CI test dilakukan sejumlah CI relation yang
tidak ditemukan sehingga muncul edge ekstra.
Pemberian arah berdasarkan aturan/rule bersifat
Langkah algoritma
Membangkitkan node ordering yaitu himpunan parent untuk
masing-masing node. Edge Bersifat unidirected edge, dimana ada tail node dan heat node
Menampilkan edge yang masih undirected maupun bidirected.
Menampilkan edge yang masih undirected maupun bidirected.
Pembangkitan total order sebagai node ordering.
Himpun parent baru untuk tiap node dan menghitung probabilitas masing-masing node yang diperoleh.
memeriksa parent baru dari node jika ada.
Tampilkan konstruksi strukturnya.
Langkah algoritma
Membangkitkan node ordering yaitu himpunan parent untuk
masing-masing node. Edge Bersifat unidirected edge, dimana ada tail node dan heat node
Menampilkan edge yang masih undirected maupun bidirected
Menampilkan edge yang masih undirected maupun bidirected.
Pembangkitan total order sebagai node ordering.
Himpun parent baru untuk tiap node dan menghitung probabilitas masing-masing node yang diperoleh.
memeriksa parent baru dari node jika ada.
Struktur Asal kasus VisittoAsia
Basis Data
Uji Coba Hasil Struktur
Contoh Kasus
jika diberikan order X Y Z, maka pasangan
child-parent yang mungkin terjadi adalah (X,Y),
(X,Z) dan (Y,Z) Disini Y adalah parent dan
estimasi yang diinginkan adalah estimasi
estimasi yang diinginkan adalah estimasi
probabilitas kondisional P(X|Y).
Diasumsikan X dan Y adalah variabel biner
yang hanya memiliki dua kemungkinan nilai,
yaitu (0,1)
Contoh Kasus
jika diberikan order X Y Z, maka pasangan
child-parent yang mungkin terjadi adalah (X,Y),
X,Y),
X,Y
(X,Z) dan (Y,Z) Disini Y adalah parent dan
estimasi yang diinginkan adalah estimasi
estimasi yang diinginkan adalah estimasi
probabilitas kondisional P(X|Y).
X|Y).
X|Y
Diasumsikan X dan Y adalah variabel biner
yang hanya memiliki dua kemungkinan nilai,
yaitu (0,1)
Link Persamaan
Diperoleh empat buah kombinasi P(X|Y), yaitu
p(X=0|Y=0), p(X=1|Y=0), p(X=0|Y=1), p(X=1|Y=1),
selanjutnya akan ditulis sebagai p(0|0), p(1|0), p(0|1)
dan p(1|1).
Link Persamaan
Diperoleh empat buah kombinasi P(X|Y), yaitu
X|Y), yaitu
X|Y
p(X=0|Y=0), p(
Y=0), p(
Y
X=1|Y=0), p(
Y=0), p(
Y
X=0|Y=1), p(
Y=1), p(
Y
X=1|Y=1),
Y=1),
Y
selanjutnya akan ditulis sebagai p(0|0), p(1|0), p(0|1)
dan p(1|1).
Persamaan Nilai Min dan Max
Link Persamaan
Persamaan untuk Satu Nilai Estimasi
Total Nilai Joint Probabilitas
Distribusi (JPD)
Uji Data VisittoAsia dengan Conditional Probabilitas Tabel :
P[VisitAsia= a2]=0.9914 P[Smoking= f1]=0.5024 P[Tuberculosis=b2|VisitAsia=a2]=0.9933427476296147 P[LungCancer=e2|Smoking=f2]=0.9895498392282959 P[LungCancer=e2|Smoking=f2]=0.9895498392282959 P[TubOrLung=c2|(Tuberculosis=b2,LungCancer=e2)]=0.9366 P[Bronchitis=g2|Smoking=f2]=0.707395498392283 P[X_Ray=d1|TubOrLung=c1]=0.9716088328075709 P[Dyspnoea=h2|Bronchitis=g2]=0.8719824433065106 JPD =0.27482167584698997
Total Nilai Joint Probabilitas
Distribusi (JPD)
Uji Data VisittoAsia dengan Conditional Probabilitas Tabel :
P[VisitAsia= a2]=0.9914 P[Smoking= f1]=0.5024 P[Tuberculosis=b2|VisitAsia=a2]=0.9933427476296147 P[LungCancer=e2|Smoking=f2]=0.9895498392282959 P[LungCancer=e2|Smoking=f2]=0.9895498392282959 P[TubOrLung=c2|(Tuberculosis=b2,LungCancer=e2)]=0.9366 P[Bronchitis=g2|Smoking=f2]=0.707395498392283 P[X_Ray=d1|TubOrLung=c1]=0.9716088328075709 P[Dyspnoea=h2|Bronchitis=g2]=0.8719824433065106 JPD =0.27482167584698997
Kesimpulan
Jumlah ketidaklengkapan data yang besar atau kecil dari basis data tetap dapat menghasilkan struktur bayesian network yang sama atau dapat juga berbeda dari konstruksi struktur data yang lengkap hal ini disebabkan oleh pengaruh jumlah sample data, kombinasi dan pola data.
Konstruksi struktur yang di bangun sudah mendekati struktur asal.
Kesimpulan
Jumlah ketidaklengkapan data yang besar atau kecil dari basis data tetap dapat menghasilkan struktur bayesian network yang sama atau dapat juga berbeda dari konstruksi struktur data yang lengkap hal ini disebabkan oleh pengaruh jumlah sample data, kombinasi dan pola data.
saran
Mencoba melakukan perbandingan dengan Algoritma
lain yang juga mengkombinasikan dua algoritma
Mencoba mengkonstruksi struktur dari data dengan
Mencoba mengkonstruksi struktur dari data dengan
jumlah yang lebih besar sehingga diharapkan dapat
dilihat sejauh mana pengaruh data yang digunakan
terhadap hasil konstruksi
saran
Mencoba melakukan perbandingan dengan Algoritma
lain yang juga mengkombinasikan dua algoritma
Mencoba mengkonstruksi struktur dari data dengan
Mencoba mengkonstruksi struktur dari data dengan
jumlah yang lebih besar sehingga diharapkan dapat
dilihat sejauh mana pengaruh data yang digunakan
terhadap hasil konstruksi
Daftar pustaka
[SIT06] Sitohang, B., & Saptawati, P. (2006). Improvement of CB & BC Algorithm (CB*
Algorithm) for Learning Structure of Bayesian Networks as Classifier in Data Mining . Sekolah Teknik Elektro dan Informatika, ITB.
[PUS05] Sandhyaduhita, P., I. (2005). Algoritma CB: Algoritma yang Dibangun dengan Dua Pendekatan untuk Konstruksi Struktur Bayesian Network dalam Data Mining . Program Studi Teknik Informatika, STEI, ITB.
[Sel08] Selvia Lorena Br Ginting(2008). Studi algoritma CB Dalam Data Mining untuk Konstruksi Struktur Bayesian Network dari Basis Data Incomplete
Konstruksi Struktur Bayesian Network dari Basis Data Incomplete
[CHE97[a]] Cheng, J., Bell, D., & Liu, W. (1997). An Algorithm for Bayesian Belief Networks Construction from Data . Proceeding of Ai & STAT ’97 (pp.83-90). Ft. Lauderdale, Florida.
[CHE97[b]] Cheng, J., Bell, D., & Liu, W. (1998). Learning Bayesian Networks from Data : An Efficient Approach Based on Information Theory. Faculty of Informatics, University of Ulster, U.K.
[SEB97] Sebastiani, P., & Ramona, M. (1997). Bayesian Inference with Missing Data Using Bound and Collapse . Report KMi-TR-58, Knowledge Media Institute, The Open University.
[SIN95] Singh, M., & Valtorta, M. (1995). Construction of Bayesian Network Structures from Data: a Brief Survey and an Efficient Algorithm . Dept. of Computer Science, University of South Carolina, Columbia, USA.
Daftar pustaka
[SIT06] Sitohang, B., & Saptawati, P. (2006). Improvement of CB & BC Algorithm (CB*
Algorithm) for Learning Structure of Bayesian Networks as Classifier in Data Mining . Sekolah Teknik Elektro dan Informatika, ITB.
[PUS05] Sandhyaduhita, P., I. (2005). Algoritma CB: Algoritma yang Dibangun dengan Dua Pendekatan untuk Konstruksi Struktur Bayesian Network dalam Data Mining
Pendekatan untuk Konstruksi Struktur Bayesian Network dalam Data Mining
Pendekatan untuk Konstruksi Struktur Bayesian Network dalam . Program Studi Teknik Informatika, STEI, ITB.
[Sel08] Selvia Lorena Br Ginting(2008). Studi algoritma CB Dalam Data Mining untuk Konstruksi Struktur Bayesian Network dari Basis Data Incomplete
Konstruksi Struktur Bayesian Network dari Basis Data Incomplete
[CHE97[a]] Cheng, J., Bell, D., & Liu, W. (1997). An Algorithm for Bayesian Belief Networks Construction from Data
Construction from Data
Construction from . Proceeding of Ai & STAT ’97 (pp.83-90). Ft. Lauderdale, Florida. [CHE97[b]] Cheng, J., Bell, D., & Liu, W. (1998). Learning Bayesian Networks from Data : An Efficient Approach Based on Information Theory. Faculty of Informatics, University of Ulster, U.K. [SEB97] Sebastiani, P., & Ramona, M. (1997). Bayesian Inference with Missing Data Using
Bound and Collapse Bound and Collapse
Bound and Coll . Report KMi-TR-58, Knowledge Media Institute, The Open University. [SIN95] Singh, M., & Valtorta, M. (1995). Construction of Bayesian Network Structures from Data: a Brief Survey and an Efficient Algorithm . Dept. of Computer Science, University of South Carolina, Columbia, USA.