TUGAS 3
TUGAS 3
NAIVE BAYES
NAIVE BAYES
NAMA
NAMA : A A Ge: A A Gede Oka Kessawa de Oka Kessawa AA NIM
NIM : 0904505033: 0904505033
JURUSAN TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
UNIVERSITAS UDAYANA
UNIVERSITAS UDAYANA
2012
2012
Klasifikasi Naive Bayes Klasifikasi Naive Bayes
Teknik clasifikasi Bayes adalah sebuah bentuk klasifikasi probabilistik yang Teknik clasifikasi Bayes adalah sebuah bentuk klasifikasi probabilistik yang berdasarkan Teorema Bayes (dari statistik Bayesian) dengan
berdasarkan Teorema Bayes (dari statistik Bayesian) dengan strong (naive)strong (naive) independence assumptions
independence assumptions atau asusmsi bebas. Sebuah aturan yang lebih deskriptif atau asusmsi bebas. Sebuah aturan yang lebih deskriptif untuk dasar sebuah mode
untuk dasar sebuah model yang akan menjadi “model bercirikan kebebasan”.l yang akan menjadi “model bercirikan kebebasan”.
Dalam sebuah aturan yang mudah, sebuah klasifikasi Naive Bayes diasumsikan Dalam sebuah aturan yang mudah, sebuah klasifikasi Naive Bayes diasumsikan bahwa ada atau tidaknya ciri tertentu dari sebuah kelas tidak ada hubungannya dengan bahwa ada atau tidaknya ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya. Untuk contohnya, buah akan dianggap sebagai sebuah apel jika ciri dari kelas lainnya. Untuk contohnya, buah akan dianggap sebagai sebuah apel jika berwarna merah, berbentuk bulat dan berdiameter sekitar 6 cm. Walaupun jika ciri-ciri berwarna merah, berbentuk bulat dan berdiameter sekitar 6 cm. Walaupun jika ciri-ciri tersebut bergantung satu sama lainnya atau keberadaanya merupakan ciri dari kelas tersebut bergantung satu sama lainnya atau keberadaanya merupakan ciri dari kelas lainnya, klasifikasi Naive Bayes tetap menganggap bagian-bagian dari kelas tersebut lainnya, klasifikasi Naive Bayes tetap menganggap bagian-bagian dari kelas tersebut masing-masing memberikan jawaban bahwa kelas itu
masing-masing memberikan jawaban bahwa kelas itu adalah apel.adalah apel.
Berdasarkan dari ciri alami dari sebuah model probabilitas, klasifikasi naive Berdasarkan dari ciri alami dari sebuah model probabilitas, klasifikasi naive Bayes bisa dibuat lebih efisien dalam bentuk pembelajaran. Dalam beberapa bentuk Bayes bisa dibuat lebih efisien dalam bentuk pembelajaran. Dalam beberapa bentuk praktiknya, parameter untuk perhitungan model naive bayes menggunakan metode praktiknya, parameter untuk perhitungan model naive bayes menggunakan metode maximum likelihood
maximum likelihood , atau kemiripan tertinggi., atau kemiripan tertinggi.
Gambar 1
Gambar 1 Ilustrasi naive BayesIlustrasi naive Bayes
Jadi sebuah data akan dilakukan klasifikasi berdasarkan sekelompok data yang sudah Jadi sebuah data akan dilakukan klasifikasi berdasarkan sekelompok data yang sudah mengalami proses pembelajaran untuk menentukan termasuk data yang mana jika mengalami proses pembelajaran untuk menentukan termasuk data yang mana jika datum tersebut diklasifikasikan.
datum tersebut diklasifikasikan.
Data latih untuk Teorema Bayes membutuhkan paling tidak perkalian kartesius Data latih untuk Teorema Bayes membutuhkan paling tidak perkalian kartesius dari seluruh kelompok atribut yang mungkin, jika misalkan ada 16 atribut yang dari seluruh kelompok atribut yang mungkin, jika misalkan ada 16 atribut yang masing-masingnya berjenis Boolean tanpa missing value, maka data latih minimal yang masingnya berjenis Boolean tanpa missing value, maka data latih minimal yang dibutuhkan oleh Teorema bayes untuk digunakan dalam klasifikasi adalah 2
data, sehingga ada 3 masalah yang dihadapi untuk menggunakan teorema bayes dalam data, sehingga ada 3 masalah yang dihadapi untuk menggunakan teorema bayes dalam pengklasifikasia
pengklasifikasian, n, yaitu :yaitu : 1.
1. Kebanyakan data latih tidak memiliki varian klasifikasi sebanyak itu (olehKebanyakan data latih tidak memiliki varian klasifikasi sebanyak itu (oleh karenanya sering diambil sample) .
karenanya sering diambil sample) . 2.
2. Jumlah atribut dalam data sample dapat berjumlah lJumlah atribut dalam data sample dapat berjumlah lebih banyak (lebih dari 16)ebih banyak (lebih dari 16) 3.
3. Jenis nilai atribut dapat berjumlah lebih banyak [lebih dari 2Jenis nilai atribut dapat berjumlah lebih banyak [lebih dari 2 – – Boolean] terlebihBoolean] terlebih lagi untuk jenis nilai atribut yang bersifat tidak terbatas 1
-lagi untuk jenis nilai atribut yang bersifat tidak terbatas 1 - ∞ seperti numeric∞ seperti numeric dan kontiniu.
dan kontiniu. 4.
4. Jika suatu data X tidak ada dalam data latih, maka data X tidak dapat diJika suatu data X tidak ada dalam data latih, maka data X tidak dapat di klasifikasikan, karena peluang untuk data X di klasifikasikan kedalam suatu klasifikasikan, karena peluang untuk data X di klasifikasikan kedalam suatu kelas adalah sama untuk tiap kelas yang ada.
kelas adalah sama untuk tiap kelas yang ada.
Untuk mengatasi berbagai permasalahan diatas, berbagai varian dari Untuk mengatasi berbagai permasalahan diatas, berbagai varian dari pengklasifikasian yang menggunakan teorema bayes diajukan, salah satunya adalah pengklasifikasian yang menggunakan teorema bayes diajukan, salah satunya adalah Naïve Bayes, yaitu penggunaan Teorema Bayes dengan asumsi keidependenan atribut. Naïve Bayes, yaitu penggunaan Teorema Bayes dengan asumsi keidependenan atribut. Asumsi keidependenan atribut akan menghilangkan kebutuhan banyaknya jumlah data Asumsi keidependenan atribut akan menghilangkan kebutuhan banyaknya jumlah data latih dari perkalian kartesius seluruh atribut yang dibutuhkan untuk mengklasifikasikan latih dari perkalian kartesius seluruh atribut yang dibutuhkan untuk mengklasifikasikan suatu data.
suatu data.
Gambar 2 : Ilustrasi Naive Bayes Gambar 2 : Ilustrasi Naive Bayes
Dampak negative dari asumsi naïve tersebut adalah keterkaitan yang ada antara Dampak negative dari asumsi naïve tersebut adalah keterkaitan yang ada antara nilai-nilai atribut diabaikan sepenuhnya. Dampak ini secara intuitif akan berpengaruh nilai-nilai atribut diabaikan sepenuhnya. Dampak ini secara intuitif akan berpengaruh dalam pengklasifikasian, namun percobaan empiris mengatakan sebaliknya. Hal ini dalam pengklasifikasian, namun percobaan empiris mengatakan sebaliknya. Hal ini tentu saja cukup mengejutkan, karena dalam pengaplikasian dunia nyata, asumsi tentu saja cukup mengejutkan, karena dalam pengaplikasian dunia nyata, asumsi diabaikannya keterkaitan antara atribut selalu dilanggar.
Pertanyaan yang muncul adalah apakah yang menyebabkan baiknya performa Pertanyaan yang muncul adalah apakah yang menyebabkan baiknya performa yang didapatkan dari pengaplikasian asumsi naïve ini? Karena secara intuitif, asumsi yang didapatkan dari pengaplikasian asumsi naïve ini? Karena secara intuitif, asumsi keidependenan atribut dalam dunia nyata hampir tidak pernah terjadi. Seharusnya keidependenan atribut dalam dunia nyata hampir tidak pernah terjadi. Seharusnya dengan asumsi tersebut performa yang dihasilkan
dengan asumsi tersebut performa yang dihasilkan akan buruk.akan buruk.
Domingos dan Pazzani (1997) pada papernya untuk menjelaskan performa naïve Domingos dan Pazzani (1997) pada papernya untuk menjelaskan performa naïve bayes dalam fungsi zero-one loss. Fungsi zero-one loss ini mendefinisikan error hanya bayes dalam fungsi zero-one loss. Fungsi zero-one loss ini mendefinisikan error hanya sebagai pengklasifikasian yang salah. Tidak seperti fungsi error yang lain seperti sebagai pengklasifikasian yang salah. Tidak seperti fungsi error yang lain seperti squared e
squared error, fungsi zero-onrror, fungsi zero-one loss tidak e loss tidak member nmember nilai suatu kesilai suatu kesalahan perhitunalahan perhitungangan peluang selama peluang maksimum di tugaskan kedalam kelas yang benar. Ini berarti peluang selama peluang maksimum di tugaskan kedalam kelas yang benar. Ini berarti bahwa naïve bayes dapat mengubah peluang posterior dari tiap kelas, tetapi kelas bahwa naïve bayes dapat mengubah peluang posterior dari tiap kelas, tetapi kelas dengan nilai peluang posterior maksimum jarang diubah. Sebagai contoh, diasumsikan dengan nilai peluang posterior maksimum jarang diubah. Sebagai contoh, diasumsikan peluang
peluang sebenarnya sebenarnya dari dari dan dan , , sedangkan sedangkan peluang peluang yangyang dihasilkan
dihasilkan oleh oleh naïve naïve bayes bayes adalah adalah dan dan . . Nilai Nilai peluangpeluang tersebut ten
tersebut tentu saja tu saja berbeda jauberbeda jauh, namun h, namun pilihan kelas pilihan kelas tetap tidak tetap tidak terpengaruh.terpengaruh.
Bukti Optimal Naive Bayes Bukti Optimal Naive Bayes
Seperti yang telah di ketahui bahwa naïve Bayes bernilai optimal ketika seluruh Seperti yang telah di ketahui bahwa naïve Bayes bernilai optimal ketika seluruh atribut bernilai independen terhadap atribut lainnya.
atribut bernilai independen terhadap atribut lainnya. Pada bagian ini akan Pada bagian ini akan dibandingkadibandingkann antara nilai naïve bayes yang seluruh atribut independen terhadap atribut lainnya dan antara nilai naïve bayes yang seluruh atribut independen terhadap atribut lainnya dan nilai naïve bayes
nilai naïve bayes yang tidak seluruh atributnya independen.yang tidak seluruh atributnya independen.
Misalkan sebuah data latih, dengan atribut A, B dan C yang bersifat Boolean, Misalkan sebuah data latih, dengan atribut A, B dan C yang bersifat Boolean, dan
dan kelas kelas dan dan , , dengan dengan peluang peluang yang yang sebanding sebanding untuk untuk tiap tiap kelaskelas .
. A dan B berkorelasi penuh (A = B), seA dan B berkorelasi penuh (A = B), sehingga B dapat diabaikanhingga B dapat diabaikan..
Prosedur klasifikasi optimal untuk sebuah data tuple adalah untuk menugaskan data Prosedur klasifikasi optimal untuk sebuah data tuple adalah untuk menugaskan data tuple
tuple tersebut tersebut kedalam kedalam kelas kelas positif jika positif jika ::
Kelas
Dan sebaliknya
Dan sebaliknya, menugaskan kelomp, menugaskan kelompok atribut kepada kelas negok atribut kepada kelas negatif atif jika :jika : Kelas
Kelas negatif negatif ::
Kelas
Kelas acak acak ::
Sedangkan prosedur klasifikasi Naïve Bayes yang tidak optimal Sedangkan prosedur klasifikasi Naïve Bayes yang tidak optimal memperhitungkan juga nilai B seperti halnya nilai B sama sekali tidak berkorelasi memperhitungkan juga nilai B seperti halnya nilai B sama sekali tidak berkorelasi dengan nilai A. hal ini sama dengan menghitung nilai A dua kali. Untuk naïve bayes dengan nilai A. hal ini sama dengan menghitung nilai A dua kali. Untuk naïve bayes rumusnya adalah :
rumusnya adalah : Kelas
Kelas positif positif ::
Kelas
Kelas negatif negatif ::
Kelas
Kelas Acak Acak ::
Dengan mengaplikasikan naïve bayes untuk pengklasifikasian yang optimal, Dengan mengaplikasikan naïve bayes untuk pengklasifikasian yang optimal, maka
maka dapat dapat di di representasikan representasikan sebagaisebagai
Karena
Karena , , maka maka nilai nilai dan dan tidak tidak perlu perlu dihitung dihitung dandan dapat diabaikan dalam perhitungan, nilai P(A) dan P(C) juga mengeliminasi satu sama dapat diabaikan dalam perhitungan, nilai P(A) dan P(C) juga mengeliminasi satu sama lainnya dalam operasi pengurangan, sehingga nilai P(A) dan nilai P(C) tidak perlu di lainnya dalam operasi pengurangan, sehingga nilai P(A) dan nilai P(C) tidak perlu di hitung, sehingga setelah pengeliminasian perhitungan yang tidak di perlukan dan hitung, sehingga setelah pengeliminasian perhitungan yang tidak di perlukan dan didapatkan :
Untuk perhitungan korelasi optimal. Sedangkan untuk perhitungan korelasi Untuk perhitungan korelasi optimal. Sedangkan untuk perhitungan korelasi dengan Naïve Bayes :
dengan Naïve Bayes :
Karena dalam peluang nilai peluang maksimal adalah 1, maka dapat dituliskan : Karena dalam peluang nilai peluang maksimal adalah 1, maka dapat dituliskan :
Misalkan
Misalkan dan dan Sehingga Sehingga rumusnya rumusnya menjadi menjadi ::
untuk nilai
untuk nilai peluang optimal dengan asumsi keidependenan atribut.peluang optimal dengan asumsi keidependenan atribut.
untuk nilai
untuk nilai peluang naïve bayes tanpa keidependenan atribut.peluang naïve bayes tanpa keidependenan atribut.
Kedua kurva fungsi diatas digambarkan sebagai berikut : Kedua kurva fungsi diatas digambarkan sebagai berikut :
Gambar 2
Kurva diatas memperlihatkan bahwa walaupun asumsi keidependenan atribut Kurva diatas memperlihatkan bahwa walaupun asumsi keidependenan atribut dilanggar,
dilanggar, karena B=A, pengkarena B=A, pengklasifikasian naïve bayklasifikasian naïve bayes dengan asumsi atribut yaes dengan asumsi atribut yang tidak ng tidak independen tidak sama dengan pengklasifikasian naive bayes optimal dengan independen tidak sama dengan pengklasifikasian naive bayes optimal dengan keidependenan atribut hanya di dua bagian sempit, satu diatas kurva dan satu lagi keidependenan atribut hanya di dua bagian sempit, satu diatas kurva dan satu lagi dibawah, di tempat lain, naïve bayes menghasilkan klasifikasi yang benar, yaitu pada dibawah, di tempat lain, naïve bayes menghasilkan klasifikasi yang benar, yaitu pada (0,1) ( 0.5,0.5) (1,0) ini menunjukkan bahwa penggunaan klasifikasi naïve bayes bisa (0,1) ( 0.5,0.5) (1,0) ini menunjukkan bahwa penggunaan klasifikasi naïve bayes bisa lebih luas daripada yang dikira sebelumnya.
lebih luas daripada yang dikira sebelumnya.
Bentuk Klasifikasi Bentuk Klasifikasi
Klasifikasi Naive Bayes merupakan bentuk klasifikasi yang melakakukan teknik Klasifikasi Naive Bayes merupakan bentuk klasifikasi yang melakakukan teknik pengklasifikasian dengan menghitung derajat kecocokan. Jika derajat kecocokannya pengklasifikasian dengan menghitung derajat kecocokan. Jika derajat kecocokannya tinggi, maka data tersebut akan diklasifikasikan ke dalam kelas yang bersesuaian. Jika tinggi, maka data tersebut akan diklasifikasikan ke dalam kelas yang bersesuaian. Jika klasifikasi V
klasifikasi Vnbnb memiliki atribut amemiliki atribut a11, a, a22, ... a, ... ann, maka hasil dari V, maka hasil dari Vnbnb dapat dihitung dengan,dapat dihitung dengan,
(
(
|
|
))
Atau bisa dijabarkan menjadi bentuk seperti berikut. Atau bisa dijabarkan menjadi bentuk seperti berikut.
(
(
)
)
Menurut perhitungan di atas, masing-masing atribut akan menghasilkan nilai posterior Menurut perhitungan di atas, masing-masing atribut akan menghasilkan nilai posterior tersendiri, sehingga bisa juga dijabarkan per masing-masing atribut. Sehingga akan tersendiri, sehingga bisa juga dijabarkan per masing-masing atribut. Sehingga akan lebih jelas dalam jabaran berikut.
lebih jelas dalam jabaran berikut.
Atau tiap masing-masing atribut
Atau tiap masing-masing atribut yang dilambangkan denganyang dilambangkan dengan
Dimana, P(aDimana, P(aii|V|V j j))dihitung dengan menggunakan estimasi-m dihitung dengan menggunakan estimasi-m
(
(
|
|
))
Dimana:Dimana:
n= jumlah contoh dimana v = v n= jumlah contoh dimana v = v j j
n
ncc= jumlah contoh dimana v= jumlah contoh dimana v = v= v j jdan a = adan a = aii
p = prioritas
p = prioritas yang dihitung untuk yang dihitung untuk
(
(
|
|
))
m = persamaan ukuran sampelm = persamaan ukuran sampel v
v j j = dimana atribut = dimana atribut sama dengan kasus tertentu, misalnyasama dengan kasus tertentu, misalnya YESYES atauatau NO NO, diterima, diterima
atau tidak atau tidak
untuk nilai m, ditentukan sewenang-wenang namun dari beberapa sumber, nilai untuk nilai m, ditentukan sewenang-wenang namun dari beberapa sumber, nilai m disesuaikan dengan banyak jenis dari atribut. Sedangkan untuk nilai p, ditentukan m disesuaikan dengan banyak jenis dari atribut. Sedangkan untuk nilai p, ditentukan berdasarkan banyak kemungkinan yang muncul, perhitungan tersebut didapat dari 1 berdasarkan banyak kemungkinan yang muncul, perhitungan tersebut didapat dari 1 dibagi dengan banyak kemungkinan, misalkan ada 3 kemungkinan, maka nilai dari p dibagi dengan banyak kemungkinan, misalkan ada 3 kemungkinan, maka nilai dari p adalah 1/3 = 0,33
adalah 1/3 = 0,33
Model dan Langkah-Langkah Klasifikasi Naive Bayes Model dan Langkah-Langkah Klasifikasi Naive Bayes
Naive Bayes adalah sebuah bentuk klasifikasi yang tentu saja tujuannya adalah Naive Bayes adalah sebuah bentuk klasifikasi yang tentu saja tujuannya adalah untuk mengklasifikasikan terhadap data yang masuk atau diuji. Klasifikasi naive Bayes untuk mengklasifikasikan terhadap data yang masuk atau diuji. Klasifikasi naive Bayes adalah bentuk klasifikasi yang berdasarkan tentang pembelajaran, jadi perhitungan dan adalah bentuk klasifikasi yang berdasarkan tentang pembelajaran, jadi perhitungan dan klasifikasi akan terbentuk mengikuti data-data yang sudah digunakan untuk proses klasifikasi akan terbentuk mengikuti data-data yang sudah digunakan untuk proses pembelajaran.
Berikut adalah contoh data
Berikut adalah contoh data yang mengikuti proses pembelajaran.yang mengikuti proses pembelajaran.
Tabel 1
Tabel 1Data PembelajaranData Pembelajaran
no
no Atribut1 Atribut1 Atribut2 Atribut2 Atribut3 Atribut3 Result/hasilResult/hasil 1 1 X X A A 1 1 YAYA 2 2 X X B B 2 2 TIDAKTIDAK 3 3 Y Y A A 3 3 YAYA 4 4 X X B B 3 3 TIDAKTIDAK ... ... ... ... ... ... ... ... ... n n X X B B 1 1 YAYA
dari data yang digunakan untuk pembelajaran tersebut, dilakukan pengujian terhadap dari data yang digunakan untuk pembelajaran tersebut, dilakukan pengujian terhadap sebuah data, misalkan:
sebuah data, misalkan:
Tabel 2
Tabel 2Data diujiData diuji
Atribut1 Atribut2 Atribut3 Result/hasil
Atribut1 Atribut2 Atribut3 Result/hasil
X
X A A 2 2 ??
Untuk mencari apakah hasil bernilai ya atau tidak, dilakukan proses penghitungan Untuk mencari apakah hasil bernilai ya atau tidak, dilakukan proses penghitungan derajat kecocokan berdasarkan jumlah data bersesuaian per atributnya.
derajat kecocokan berdasarkan jumlah data bersesuaian per atributnya.
Tabel 3
Tabel 3tabel kecocokan atributtabel kecocokan atribut
no
no X dan X dan YA YA A A dan dan YA YA 2 2 dan dan YAYA 1
1 TRUE TRUE TRUE TRUE FALSEFALSE
2
2 FALSE FALSE FALSE FALSE FALSEFALSE
3
3 FALSE FALSE TRUE TRUE FALSEFALSE
4
4 FALSE FALSE FALSE FALSE FALSEFALSE
... ... n
n TRUE TRUE FALSE FALSE FALSEFALSE
Dari Tabel 3 tersebut, didapat data yang akan digunakan untuk mencari derajat Dari Tabel 3 tersebut, didapat data yang akan digunakan untuk mencari derajat kecocokan per atribut.
Tabel 4
Tabel 4tabel kecocokan per atributtabel kecocokan per atribut
YA TIDAK YA TIDAK X X XX n n 3 3 n n 33 n_c n_c 2 2 n_c n_c 11 p p 0,5 0,5 p p 0,50,5 m m 3 3 m m 33 A A AA n n 2 2 n n 22 n_c n_c 2 2 n_c n_c 00 p p 0,5 0,5 p p 0,50,5 m m 3 3 m m 33 2 2 22 n n 1 1 n n 11 n_c n_c 0 0 n_c n_c 11 p p 0,33 0,33 p p 0,330,33 m m 3 3 m m 33
Dari tabel tersebut, lalu dihitung nilai poseterior per atribut, per kemungkinan. Dari tabel tersebut, lalu dihitung nilai poseterior per atribut, per kemungkinan.
1) 1)
2) 2)
3) 3)
Sehingga, Sehingga,
Dihitung juga untuk V(TIDAK) Dihitung juga untuk V(TIDAK)
1) 1)
2) 2)
3) 3)
Sehingga, Sehingga,
V(YA) =0,0546, V(TIDAK)=0,039 V(YA) =0,0546, V(TIDAK)=0,039Karena V(YA)>V(TIDAK) maka data yang diuji tersebut termasuk tidak. Karena V(YA)>V(TIDAK) maka data yang diuji tersebut termasuk tidak.
Contoh Kasus Naive Bayes Contoh Kasus Naive Bayes
Sebuah Perusahaan bernama perusahaan NABA memiliki beberapa anak Sebuah Perusahaan bernama perusahaan NABA memiliki beberapa anak perusahaan. Salah satu anak perusahaan tersebut sedang melakukan pencarian pegawai perusahaan. Salah satu anak perusahaan tersebut sedang melakukan pencarian pegawai dan salah seorang analisis di perusahaan tersebut memiliki beberapa orang anak yang dan salah seorang analisis di perusahaan tersebut memiliki beberapa orang anak yang ingin dimasukkan ke dalam
ingin dimasukkan ke dalam perusahaaperusahaan tersebut. n tersebut. Berikut adalah data anak Berikut adalah data anak tersebut:tersebut: Tabel 5
Tabel 5Data anak diujiData anak diuji
no no
jenis jenis
kelamin
kelamin pendidikan pendidikan pengalaman pengalaman kerja kerja biaya biaya administrasiadministrasi
1
1 Laki Laki SMA SMA 1 1 100000100000
2
2 Perempuan Perempuan SMA SMA 3 3 300000300000
3
3 Laki Laki Diploma Diploma 3 3 500000500000
4
4 Perempuan Perempuan Sarjana Sarjana 2 2 100000100000
Kemudian bapak tersebut memiliki data salah satu anak perusahaan dan melakukan Kemudian bapak tersebut memiliki data salah satu anak perusahaan dan melakukan klasifikasi apakah anak-anak tersebut akan diterima atau tidak. Berikut
klasifikasi apakah anak-anak tersebut akan diterima atau tidak. Berikut data penerimaandata penerimaan pegawai tersebut
pegawai tersebut Tabel 6
Tabel 6data penerimaan pegawaidata penerimaan pegawai
no
no JenisJenis Kelamin
Kelamin PendidikanPendidikan
Lama Lama Pengalaman Pengalaman Kerja Kerja Biaya Biaya Administrasi
Administrasi statusstatus 1
1 Perempuan Perempuan SMA SMA 4 4 100100000 000 diterimaditerima
2
2 Perempuan Perempuan SMA SMA 5 5 300300000 000 diterimaditerima
3
3 Perempuan Perempuan Diploma Diploma 3 3 300000 300000 diterimaditerima
4
5
5 Laki Laki Sarjana Sarjana 3 3 100000 100000 diterimaditerima
6
6 Laki Laki SMA SMA 1 1 100000 tidak 100000 tidak
7
7 Laki Laki Diploma Diploma 1 1 300000 tidak 300000 tidak
8
8 Laki Laki Diploma Diploma 3 3 100000 diterima100000 diterima
9
9 Perempuan Perempuan Diploma Diploma 2 2 100000 100000 tidak tidak
10
10 Laki Laki Diploma Diploma 3 3 300000 diterima300000 diterima
11
11 Perempuan Perempuan Sarjana Sarjana 4 4 100000 100000 diterimaditerima
12
12 Perempuan Perempuan Diploma Diploma 2 2 300000 300000 diterimaditerima
13
13 Laki Laki Sarjana Sarjana 1 1 500000 500000 diterimaditerima
14
14 Laki Laki Sarjana Sarjana 1 1 100000 100000 tidak tidak
15
15 Perempuan Perempuan SMA SMA 5 5 100100000 000 diterimaditerima
16
16 Perempuan Perempuan Sarjana Sarjana 3 3 100000 100000 diterimaditerima
17
17 Perempuan Perempuan Sarjana Sarjana 1 1 100000 100000 tidak tidak
18
18 Laki Laki SMA SMA 2 2 300000 tidak 300000 tidak
19
19 Laki Laki SMA SMA 3 3 300000 tidak 300000 tidak
20
20 Laki Laki SMA SMA 1 1 100000 tidak 100000 tidak
Lalu perhitunganpun dilakukan Lalu perhitunganpun dilakukan
Tabel 7
Tabel 7Pengujian Data 1Pengujian Data 1
No No Laki dan Laki dan Diterima Diterima SMA dan SMA dan diterima
diterima 1 1 tahun tahun dan dan diterimaditerima
100ribu dan 100ribu dan diterima diterima
1
1 FALSE FALSE TRUE TRUE FALSE FALSE TRUETRUE
2
2 FALSE FALSE TRUE TRUE FALSE FALSE FALSEFALSE
3
3 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
4
4 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
5
5 TRUE TRUE FALSE FALSE FALSE FALSE TRUETRUE
6
6 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
7
7 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
8
8 TRUE TRUE FALSE FALSE FALSE FALSE TRUETRUE
9
9 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
10
10 TRUE TRUE FALSE FALSE FALFALSE SE FALSEFALSE
11
11 FALSE FALSE FALSE FALSE FALFALSE SE TRUETRUE
12
12 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
13
13 TRUE TRUE FALSE FALSE TRUE TRUE FALSEFALSE
14
15
15 FALSE FALSE TRUE TRUE FALSE FALSE TRUETRUE
16
16 FALSE FALSE FALSE FALSE FALFALSE SE TRUETRUE
17
17 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
18
18 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
19
19 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
20
20 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
Tabel 8
Tabel 8 data 1data 1
yes no yes no Laki Laki Laki Laki n n 10 10 n n 1010 n_c n_c 4 4 n_c n_c 66 p p 0,5 0,5 p p 0,50,5 m m 4 4 m m 44 P(Laki|YES)
P(Laki|YES) 0,428571429 0,428571429 P(LAKI|NO) P(LAKI|NO) 0,5714290,571429
SMA SMA SMA SMA n n 8 8 n n 88 n_c n_c 3 3 n_c n_c 55 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(SMA|YES)
P(SMA|YES) 0,36 0,36 P(SMA|NO) P(SMA|NO) 0,5266670,526667 1 1 11 n n 6 6 n n 66 n_c n_c 1 1 n_c n_c 55 p p 0,2 0,2 p p 0,20,2 m m 4 4 m m 44 P(1|YES)
P(1|YES) 0,18 0,18 P(1|NO) P(1|NO) 00,58,58
100000 100000 100000 100000 n n 11 11 n n 1111 n_c n_c 6 6 n_c n_c 55 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(100000|YE
P(100000|YES) S) 0,488 0,488 P(100000|NO) P(100000|NO) 0,4213330,421333 P(YES)
P(YES) 0,006776229 0,006776229 P(NO) P(NO) 0,0367720,036772 Karena P(YES)<P(NO) sehingga, data peserta uji satu
Karena P(YES)<P(NO) sehingga, data peserta uji satu tidaktidak diterima
Tabel 9
Tabel 9Pengujian Data 2Pengujian Data 2
N N o o Perempuan dan Perempuan dan Diterima Diterima SMA dan SMA dan diterima
diterima 3 3 tahun tahun dan dan diterimaditerima
300ribu dan 300ribu dan diterima diterima
1
1 TRUE TRUE TRUE TRUE FALSE FALSE FALSEFALSE
2
2 TRUE TRUE TRUE TRUE FALSE FALSE TRUETRUE
3
3 TRUE TRUE FALSE FALSE TRUE TRUE TRUETRUE
4
4 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
5
5 FALSE FALSE FALSE FALSE TRUE TRUE FALSEFALSE
6
6 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
7
7 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
8
8 FALSE FALSE FALSE FALSE TRUE TRUE FALSEFALSE
9
9 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
10
10 FALSE FALSE FALSE FALSE TRUE TRUE TRUETRUE
11
11 TRUE TRUE FALSE FALSE FALSE FALSE FALSEFALSE
12
12 TRUE TRUE FALSE FALSE FALSE FALSE TRUETRUE
13
13 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
14
14 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
15
15 TRUE TRUE TRUE TRUE FALSE FALSE FALSEFALSE
16
16 TRUE TRUE FALSE FALSE TRUE TRUE FALSEFALSE
17
17 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
18
18 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
19
19 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE
20
Tabel 10
Tabel 10 data 2data 2
yes no yes no Perempuan Perempuan Perempuan Perempuan n n 10 10 n n 1010 n_c n_c 7 7 n_c n_c 33 p p 0,5 0,5 p p 0,50,5 m m 4 4 m m 44 P(Perempuan|YES P(Perempuan|YES ) 0,642857143 ) 0,642857143 P(Perempuan|NO P(Perempuan|NO )) 0,35714 0,35714 3 3 SMA SMA SMA SMA n n 8 8 n n 88 n_c n_c 3 3 n_c n_c 55 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(SMA|YES)
P(SMA|YES) 0,36 0,36 P(SMA|NO)P(SMA|NO)
0,52666 0,52666 7 7 3 3 33 n n 6 6 n n 66 n_c n_c 5 5 n_c n_c 11 p p 0,2 0,2 p p 0,20,2 m m 4 4 m m 44 P(3|YES)
P(3|YES) 0,58 0,58 P(3|NO) P(3|NO) 0,180,18
300000 300000 300000 300000 n n 8 8 n n 88 n_c n_c 4 4 n_c n_c 44 p p 0,33 0,33 P P 0,330,33 m m 4 4 M M 44 P(300000|YES)
P(300000|YES) 0,443333333 0,443333333 P(300000|NO)P(300000|NO)
0,44333 0,44333 3 3
P(YES)
P(YES) 0,029754 0,029754 P(NO)P(NO)
0,00750 0,00750 5 5 Karena P(YES)>P(NO) sehingga, data peserta uji dua
Tabel 11
Tabel 11 Pengujian Data 3Pengujian Data 3 No
No Laki Laki dan dan DiterimaDiterima
Diploma dan Diploma dan diterima
diterima 3 3 tahun tahun dan dan diterimaditerima
500ribu dan 500ribu dan diterima diterima 1
1 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 2
2 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 3
3 FALSE FALSE TRUE TRUE TRUE TRUE FALSEFALSE 4
4 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 5
5 TRUE TRUE FALSE FALSE TRUE TRUE FALSEFALSE 6
6 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 7
7 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 8
8 TRUE TRUE TRUE TRUE TRUE TRUE FALSEFALSE 9
9 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 10
10 TRUE TRUE TRUE TRUE TRUE TRUE FALSEFALSE 11
11 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 12
12 FALSE FALSE TRUE TRUE FALSE FALSE FALSEFALSE 13
13 TRUE TRUE FALSE FALSE FALSE FALSE TRUETRUE 14
14 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 15
15 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 16
16 FALSE FALSE FALSE FALSE TRUE TRUE FALSEFALSE 17
17 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 18
18 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 19
19 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 20
Tabel 12
Tabel 12 data 3data 3
yes no yes no Laki Laki Laki Laki n n 10 10 n n 1010 n_c n_c 4 4 n_c n_c 66 p p 0,5 0,5 p p 0,50,5 m m 4 4 m m 44 P(Laki|YES)
P(Laki|YES) 0,428571429 0,428571429 P(LAKI|NO)P(LAKI|NO)
0,57142 0,57142 9 9 Diploma Diploma Diploma Diploma n n 6 6 n n 66 n_c n_c 4 4 n_c n_c 22 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(Diploma|YES P(Diploma|YES ) ) 0,532 0,532 P(Diploma|NO) P(Diploma|NO) 0,3320,332 3 3 33 n n 6 6 n n 66 n_c n_c 5 5 n_c n_c 11 p p 0,2 0,2 p p 0,20,2 m m 4 4 m m 44 P(3|YES)
P(3|YES) 0,58 0,58 P(3|NO) P(3|NO) 0,180,18
500000 500000 500000 500000 n n 1 1 n n 11 n_c n_c 1 1 n_c n_c 00 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(500000|YES)
P(500000|YES) 0,464 0,464 P(500000|NO) P(500000|NO) 0,2640,264
P(YES)
P(YES) 0,03067968 0,03067968 P(NO)P(NO)
0,00450 0,00450 8 8 Karena P(YES)>P(NO) sehingga, data peserta uji dua
Tabel 13
Tabel 13 Pengujian Data 4Pengujian Data 4
No
No
Perempuan dan
Perempuan dan
Diterima
Diterima
Sarjana dan
Sarjana dan
diterima
diterima
2 tahun dan
2 tahun dan
diterima
diterima
100ribu dan
100ribu dan
diterima
diterima
1
1
TRUE
TRUE
FALSE
FALSE
FALSE
FALSE
TRUE
TRUE
2
2
TRUE
TRUE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
3
3
TRUE
TRUE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
4
4
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
5
5
FALSE
FALSE
TRUE
TRUE
FALSE
FALSE
TRUE
TRUE
6
6
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
7
7
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
8
8
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
TRUE
TRUE
9
9
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
10
10
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
11
11
TRUE
TRUE
TRUE
TRUE
FALSE
FALSE
TRUE
TRUE
12
12
TRUE
TRUE
FALSE
FALSE
TRUE
TRUE
FALSE
FALSE
13
13
FALSE
FALSE
TRUE
TRUE
FALSE
FALSE
FALSE
FALSE
14
14
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
15
15
TRUE
TRUE
FALSE
FALSE
FALSE
FALSE
TRUE
TRUE
16
16
TRUE
TRUE
TRUE
TRUE
FALSE
FALSE
TRUE
TRUE
17
17
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
18
18
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
19
19
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
FALSE
20
Tabel 14
Tabel 14 data 4data 4
yes no yes no Perempuan Perempuan Perempuan Perempuan N N 10 10 n n 1010 n_c n_c 7 7 n_c n_c 33 P P 0,5 0,5 p p 0,50,5 M M 4 4 m m 44 P(Perempuan|YES P(Perempuan|YES ) 0,642857143 ) 0,642857143 P(Perempuan|NO P(Perempuan|NO )) 0,35714 0,35714 3 3 SMA SMA SMA SMA N N 6 6 n n 66 n_c n_c 4 4 n_c n_c 22 P P 0,33 0,33 p p 0,330,33 M M 4 4 m m 44 P(SMA|YES)
P(SMA|YES) 0,532 0,532 P(SMA|NO) P(SMA|NO) 0,3320,332 3 3 33 N N 4 4 n n 44 n_c n_c 1 1 n_c n_c 33 P P 0,2 0,2 p p 0,20,2 M M 4 4 m m 44 P(3|YES)
P(3|YES) 0,225 0,225 P(3|NO) P(3|NO) 0,4750,475
100000 100000 100000 100000 N N 11 11 n n 1111 n_c n_c 6 6 n_c n_c 55 P P 0,33 0,33 p p 0,330,33 M M 4 4 m m 44 P(300000|YES)
P(300000|YES) 0,488 0,488 P(300000|NO)P(300000|NO)
0,42133 0,42133 3 3
P(YES)
P(YES) 0,0187758 0,0187758 P(NO)P(NO)
0,01186 0,01186 5 5 Karena P(YES)>P(NO) sehingga, data peserta uji dua
Karena P(YES)>P(NO) sehingga, data peserta uji dua diterimaditerima
Dari 4 data tersebut, didapatkan kesimpulan bahwa Dari 4 data tersebut, didapatkan kesimpulan bahwa
data Status
data Status
1
1 Tidak Tidak diterimaditerima
2 Diterima 2 Diterima 3 Diterima 3 Diterima 4 Diterima 4 Diterima
Daftar Pustaka Daftar Pustaka
-- Wikipedia, Wikipedia, naive naive bayes bayes clasifiers, clasifiers, http://www.saylor.org/site/wp- http://www.saylor.org/site/wp-content/uploads/2011/02/Wikipedia-Naive-Bayes-Classifier.pdf ,diunduh pada content/uploads/2011/02/Wikipedia-Naive-Bayes-Classifier.pdf ,diunduh pada 10 Mei 2012
10 Mei 2012
-- Meisner, Meisner, E. E. Naive Naive Bayes Bayes example, example, 2003 2003 http://www.inf.u- http://www.inf.u-szeged.hu/~ormandi/ai2/06-naiveBayes-example.pdf , diunduh pada 10 Mei szeged.hu/~ormandi/ai2/06-naiveBayes-example.pdf , diunduh pada 10 Mei 2012
2012
-- Optimality Optimality of of Naive Naive Bayes, Bayes, http://courses.ischool.berkeley.edu/i290- http://courses.ischool.berkeley.edu/i290-dm/s11/SECURE/Optima
dm/s11/SECURE/Optimality_of_Naive_Baylity_of_Naive_Bayes.pdf , es.pdf , diunduh pada 10 Mei diunduh pada 10 Mei 20122012 -- Frank, E. Naive Bayes for Text Classification with Unbalanced Classes.Frank, E. Naive Bayes for Text Classification with Unbalanced Classes.
Computer Science Department, University of Waikato, New Zealand. Computer Science Department, University of Waikato, New Zealand. http://www.cs.waikato
http://www.cs.waikato.ac.nz/~eibe/pub.ac.nz/~eibe/pubs/FrankAndBous/FrankAndBouckaertPKDD06neckaertPKDD06new.pdf,w.pdf, diunduh pada 10 Mei 2012