Naive Bayes

(1)

TUGAS 3

NAIVE BAYES

NAMA

NAMA : A A Ge: A A Gede Oka Kessawa de Oka Kessawa AA NIM

NIM : 0904505033: 0904505033

JURUSAN TEKNIK INFORMATIKA

UNIVERSITAS UDAYANA

2012

(2)

Klasifikasi Naive Bayes Klasifikasi Naive Bayes

Teknik clasifikasi Bayes adalah sebuah bentuk klasifikasi probabilistik yang Teknik clasifikasi Bayes adalah sebuah bentuk klasifikasi probabilistik yang berdasarkan Teorema Bayes (dari statistik Bayesian) dengan

berdasarkan Teorema Bayes (dari statistik Bayesian) dengan strong (naive)strong (naive) independence assumptions

independence assumptions atau asusmsi bebas. Sebuah aturan yang lebih deskriptif atau asusmsi bebas. Sebuah aturan yang lebih deskriptif untuk dasar sebuah mode

untuk dasar sebuah model yang akan menjadi “model bercirikan kebebasan”.l yang akan menjadi “model bercirikan kebebasan”.

Dalam sebuah aturan yang mudah, sebuah klasifikasi Naive Bayes diasumsikan Dalam sebuah aturan yang mudah, sebuah klasifikasi Naive Bayes diasumsikan bahwa ada atau tidaknya ciri tertentu dari sebuah kelas tidak ada hubungannya dengan bahwa ada atau tidaknya ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya. Untuk contohnya, buah akan dianggap sebagai sebuah apel jika ciri dari kelas lainnya. Untuk contohnya, buah akan dianggap sebagai sebuah apel jika berwarna merah, berbentuk bulat dan berdiameter sekitar 6 cm. Walaupun jika ciri-ciri berwarna merah, berbentuk bulat dan berdiameter sekitar 6 cm. Walaupun jika ciri-ciri tersebut bergantung satu sama lainnya atau keberadaanya merupakan ciri dari kelas tersebut bergantung satu sama lainnya atau keberadaanya merupakan ciri dari kelas lainnya, klasifikasi Naive Bayes tetap menganggap bagian-bagian dari kelas tersebut lainnya, klasifikasi Naive Bayes tetap menganggap bagian-bagian dari kelas tersebut masing-masing memberikan jawaban bahwa kelas itu

masing-masing memberikan jawaban bahwa kelas itu adalah apel.adalah apel.

Berdasarkan dari ciri alami dari sebuah model probabilitas, klasifikasi naive Berdasarkan dari ciri alami dari sebuah model probabilitas, klasifikasi naive Bayes bisa dibuat lebih efisien dalam bentuk pembelajaran. Dalam beberapa bentuk Bayes bisa dibuat lebih efisien dalam bentuk pembelajaran. Dalam beberapa bentuk praktiknya, parameter untuk perhitungan model naive bayes menggunakan metode praktiknya, parameter untuk perhitungan model naive bayes menggunakan metode maximum likelihood

maximum likelihood , atau kemiripan tertinggi., atau kemiripan tertinggi.

Gambar 1

Gambar 1 Ilustrasi naive BayesIlustrasi naive Bayes

Jadi sebuah data akan dilakukan klasifikasi berdasarkan sekelompok data yang sudah Jadi sebuah data akan dilakukan klasifikasi berdasarkan sekelompok data yang sudah mengalami proses pembelajaran untuk menentukan termasuk data yang mana jika mengalami proses pembelajaran untuk menentukan termasuk data yang mana jika datum tersebut diklasifikasikan.

datum tersebut diklasifikasikan.

Data latih untuk Teorema Bayes membutuhkan paling tidak perkalian kartesius Data latih untuk Teorema Bayes membutuhkan paling tidak perkalian kartesius dari seluruh kelompok atribut yang mungkin, jika misalkan ada 16 atribut yang dari seluruh kelompok atribut yang mungkin, jika misalkan ada 16 atribut yang masing-masingnya berjenis Boolean tanpa missing value, maka data latih minimal yang masingnya berjenis Boolean tanpa missing value, maka data latih minimal yang dibutuhkan oleh Teorema bayes untuk digunakan dalam klasifikasi adalah 2

(3)

data, sehingga ada 3 masalah yang dihadapi untuk menggunakan teorema bayes dalam data, sehingga ada 3 masalah yang dihadapi untuk menggunakan teorema bayes dalam pengklasifikasia

pengklasifikasian, n, yaitu :yaitu : 1.

1. Kebanyakan data latih tidak memiliki varian klasifikasi sebanyak itu (olehKebanyakan data latih tidak memiliki varian klasifikasi sebanyak itu (oleh karenanya sering diambil sample) .

karenanya sering diambil sample) . 2.

2. Jumlah atribut dalam data sample dapat berjumlah lJumlah atribut dalam data sample dapat berjumlah lebih banyak (lebih dari 16)ebih banyak (lebih dari 16) 3.

3. Jenis nilai atribut dapat berjumlah lebih banyak [lebih dari 2Jenis nilai atribut dapat berjumlah lebih banyak [lebih dari 2 – – Boolean] terlebihBoolean] terlebih lagi untuk jenis nilai atribut yang bersifat tidak terbatas 1

-lagi untuk jenis nilai atribut yang bersifat tidak terbatas 1 - ∞ seperti numeric∞ seperti numeric dan kontiniu.

dan kontiniu. 4.

4. Jika suatu data X tidak ada dalam data latih, maka data X tidak dapat diJika suatu data X tidak ada dalam data latih, maka data X tidak dapat di klasifikasikan, karena peluang untuk data X di klasifikasikan kedalam suatu klasifikasikan, karena peluang untuk data X di klasifikasikan kedalam suatu kelas adalah sama untuk tiap kelas yang ada.

kelas adalah sama untuk tiap kelas yang ada.

Untuk mengatasi berbagai permasalahan diatas, berbagai varian dari Untuk mengatasi berbagai permasalahan diatas, berbagai varian dari pengklasifikasian yang menggunakan teorema bayes diajukan, salah satunya adalah pengklasifikasian yang menggunakan teorema bayes diajukan, salah satunya adalah Naïve Bayes, yaitu penggunaan Teorema Bayes dengan asumsi keidependenan atribut. Naïve Bayes, yaitu penggunaan Teorema Bayes dengan asumsi keidependenan atribut. Asumsi keidependenan atribut akan menghilangkan kebutuhan banyaknya jumlah data Asumsi keidependenan atribut akan menghilangkan kebutuhan banyaknya jumlah data latih dari perkalian kartesius seluruh atribut yang dibutuhkan untuk mengklasifikasikan latih dari perkalian kartesius seluruh atribut yang dibutuhkan untuk mengklasifikasikan suatu data.

suatu data.

Gambar 2 : Ilustrasi Naive Bayes Gambar 2 : Ilustrasi Naive Bayes

Dampak negative dari asumsi naïve tersebut adalah keterkaitan yang ada antara Dampak negative dari asumsi naïve tersebut adalah keterkaitan yang ada antara nilai-nilai atribut diabaikan sepenuhnya. Dampak ini secara intuitif akan berpengaruh nilai-nilai atribut diabaikan sepenuhnya. Dampak ini secara intuitif akan berpengaruh dalam pengklasifikasian, namun percobaan empiris mengatakan sebaliknya. Hal ini dalam pengklasifikasian, namun percobaan empiris mengatakan sebaliknya. Hal ini tentu saja cukup mengejutkan, karena dalam pengaplikasian dunia nyata, asumsi tentu saja cukup mengejutkan, karena dalam pengaplikasian dunia nyata, asumsi diabaikannya keterkaitan antara atribut selalu dilanggar.

(4)

Pertanyaan yang muncul adalah apakah yang menyebabkan baiknya performa Pertanyaan yang muncul adalah apakah yang menyebabkan baiknya performa yang didapatkan dari pengaplikasian asumsi naïve ini? Karena secara intuitif, asumsi yang didapatkan dari pengaplikasian asumsi naïve ini? Karena secara intuitif, asumsi keidependenan atribut dalam dunia nyata hampir tidak pernah terjadi. Seharusnya keidependenan atribut dalam dunia nyata hampir tidak pernah terjadi. Seharusnya dengan asumsi tersebut performa yang dihasilkan

dengan asumsi tersebut performa yang dihasilkan akan buruk.akan buruk.

Domingos dan Pazzani (1997) pada papernya untuk menjelaskan performa naïve Domingos dan Pazzani (1997) pada papernya untuk menjelaskan performa naïve bayes dalam fungsi zero-one loss. Fungsi zero-one loss ini mendefinisikan error hanya bayes dalam fungsi zero-one loss. Fungsi zero-one loss ini mendefinisikan error hanya sebagai pengklasifikasian yang salah. Tidak seperti fungsi error yang lain seperti sebagai pengklasifikasian yang salah. Tidak seperti fungsi error yang lain seperti squared e

squared error, fungsi zero-onrror, fungsi zero-one loss tidak e loss tidak member nmember nilai suatu kesilai suatu kesalahan perhitunalahan perhitungangan peluang selama peluang maksimum di tugaskan kedalam kelas yang benar. Ini berarti peluang selama peluang maksimum di tugaskan kedalam kelas yang benar. Ini berarti bahwa naïve bayes dapat mengubah peluang posterior dari tiap kelas, tetapi kelas bahwa naïve bayes dapat mengubah peluang posterior dari tiap kelas, tetapi kelas dengan nilai peluang posterior maksimum jarang diubah. Sebagai contoh, diasumsikan dengan nilai peluang posterior maksimum jarang diubah. Sebagai contoh, diasumsikan peluang

peluang sebenarnya sebenarnya dari dari dan dan , , sedangkan sedangkan peluang peluang yangyang dihasilkan

dihasilkan oleh oleh naïve naïve bayes bayes adalah adalah dan dan . . Nilai Nilai peluangpeluang tersebut ten

tersebut tentu saja tu saja berbeda jauberbeda jauh, namun h, namun pilihan kelas pilihan kelas tetap tidak tetap tidak terpengaruh.terpengaruh.

Bukti Optimal Naive Bayes Bukti Optimal Naive Bayes

Seperti yang telah di ketahui bahwa naïve Bayes bernilai optimal ketika seluruh Seperti yang telah di ketahui bahwa naïve Bayes bernilai optimal ketika seluruh atribut bernilai independen terhadap atribut lainnya.

atribut bernilai independen terhadap atribut lainnya. Pada bagian ini akan Pada bagian ini akan dibandingkadibandingkann antara nilai naïve bayes yang seluruh atribut independen terhadap atribut lainnya dan antara nilai naïve bayes yang seluruh atribut independen terhadap atribut lainnya dan nilai naïve bayes

nilai naïve bayes yang tidak seluruh atributnya independen.yang tidak seluruh atributnya independen.

Misalkan sebuah data latih, dengan atribut A, B dan C yang bersifat Boolean, Misalkan sebuah data latih, dengan atribut A, B dan C yang bersifat Boolean, dan

dan kelas kelas dan dan , , dengan dengan peluang peluang yang yang sebanding sebanding untuk untuk tiap tiap kelaskelas .

. A dan B berkorelasi penuh (A = B), seA dan B berkorelasi penuh (A = B), sehingga B dapat diabaikanhingga B dapat diabaikan..

Prosedur klasifikasi optimal untuk sebuah data tuple adalah untuk menugaskan data Prosedur klasifikasi optimal untuk sebuah data tuple adalah untuk menugaskan data tuple

tuple tersebut tersebut kedalam kedalam kelas kelas positif jika positif jika ::

Kelas

(5)

Dan sebaliknya

Dan sebaliknya, menugaskan kelomp, menugaskan kelompok atribut kepada kelas negok atribut kepada kelas negatif atif jika :jika : Kelas

Kelas negatif negatif ::

Kelas

Kelas acak acak ::

Sedangkan prosedur klasifikasi Naïve Bayes yang tidak optimal Sedangkan prosedur klasifikasi Naïve Bayes yang tidak optimal memperhitungkan juga nilai B seperti halnya nilai B sama sekali tidak berkorelasi memperhitungkan juga nilai B seperti halnya nilai B sama sekali tidak berkorelasi dengan nilai A. hal ini sama dengan menghitung nilai A dua kali. Untuk naïve bayes dengan nilai A. hal ini sama dengan menghitung nilai A dua kali. Untuk naïve bayes rumusnya adalah :

rumusnya adalah : Kelas

Kelas positif positif ::

Kelas

Kelas negatif negatif ::

Kelas

Kelas Acak Acak ::

Dengan mengaplikasikan naïve bayes untuk pengklasifikasian yang optimal, Dengan mengaplikasikan naïve bayes untuk pengklasifikasian yang optimal, maka

maka dapat dapat di di representasikan representasikan sebagaisebagai

Karena

Karena , , maka maka nilai nilai dan dan tidak tidak perlu perlu dihitung dihitung dandan dapat diabaikan dalam perhitungan, nilai P(A) dan P(C) juga mengeliminasi satu sama dapat diabaikan dalam perhitungan, nilai P(A) dan P(C) juga mengeliminasi satu sama lainnya dalam operasi pengurangan, sehingga nilai P(A) dan nilai P(C) tidak perlu di lainnya dalam operasi pengurangan, sehingga nilai P(A) dan nilai P(C) tidak perlu di hitung, sehingga setelah pengeliminasian perhitungan yang tidak di perlukan dan hitung, sehingga setelah pengeliminasian perhitungan yang tidak di perlukan dan didapatkan :

(6)

Untuk perhitungan korelasi optimal. Sedangkan untuk perhitungan korelasi Untuk perhitungan korelasi optimal. Sedangkan untuk perhitungan korelasi dengan Naïve Bayes :

dengan Naïve Bayes :

Karena dalam peluang nilai peluang maksimal adalah 1, maka dapat dituliskan : Karena dalam peluang nilai peluang maksimal adalah 1, maka dapat dituliskan :

Misalkan

Misalkan dan dan Sehingga Sehingga rumusnya rumusnya menjadi menjadi ::

untuk nilai

untuk nilai peluang optimal dengan asumsi keidependenan atribut.peluang optimal dengan asumsi keidependenan atribut.

untuk nilai

untuk nilai peluang naïve bayes tanpa keidependenan atribut.peluang naïve bayes tanpa keidependenan atribut.

Kedua kurva fungsi diatas digambarkan sebagai berikut : Kedua kurva fungsi diatas digambarkan sebagai berikut :

Gambar 2

(7)

Kurva diatas memperlihatkan bahwa walaupun asumsi keidependenan atribut Kurva diatas memperlihatkan bahwa walaupun asumsi keidependenan atribut dilanggar,

dilanggar, karena B=A, pengkarena B=A, pengklasifikasian naïve bayklasifikasian naïve bayes dengan asumsi atribut yaes dengan asumsi atribut yang tidak ng tidak independen tidak sama dengan pengklasifikasian naive bayes optimal dengan independen tidak sama dengan pengklasifikasian naive bayes optimal dengan keidependenan atribut hanya di dua bagian sempit, satu diatas kurva dan satu lagi keidependenan atribut hanya di dua bagian sempit, satu diatas kurva dan satu lagi dibawah, di tempat lain, naïve bayes menghasilkan klasifikasi yang benar, yaitu pada dibawah, di tempat lain, naïve bayes menghasilkan klasifikasi yang benar, yaitu pada (0,1) ( 0.5,0.5) (1,0) ini menunjukkan bahwa penggunaan klasifikasi naïve bayes bisa (0,1) ( 0.5,0.5) (1,0) ini menunjukkan bahwa penggunaan klasifikasi naïve bayes bisa lebih luas daripada yang dikira sebelumnya.

lebih luas daripada yang dikira sebelumnya.

Bentuk Klasifikasi Bentuk Klasifikasi

Klasifikasi Naive Bayes merupakan bentuk klasifikasi yang melakakukan teknik Klasifikasi Naive Bayes merupakan bentuk klasifikasi yang melakakukan teknik pengklasifikasian dengan menghitung derajat kecocokan. Jika derajat kecocokannya pengklasifikasian dengan menghitung derajat kecocokan. Jika derajat kecocokannya tinggi, maka data tersebut akan diklasifikasikan ke dalam kelas yang bersesuaian. Jika tinggi, maka data tersebut akan diklasifikasikan ke dalam kelas yang bersesuaian. Jika klasifikasi V

klasifikasi Vnbnb memiliki atribut amemiliki atribut a11, a, a22, ... a, ... ann, maka hasil dari V, maka hasil dari Vnbnb dapat dihitung dengan,dapat dihitung dengan,



__



 







__





(

(

_

|

_

))

Atau bisa dijabarkan menjadi bentuk seperti berikut. Atau bisa dijabarkan menjadi bentuk seperti berikut.



__



(



)





 











_



 

__



Menurut perhitungan di atas, masing-masing atribut akan menghasilkan nilai posterior Menurut perhitungan di atas, masing-masing atribut akan menghasilkan nilai posterior tersendiri, sehingga bisa juga dijabarkan per masing-masing atribut. Sehingga akan tersendiri, sehingga bisa juga dijabarkan per masing-masing atribut. Sehingga akan lebih jelas dalam jabaran berikut.

lebih jelas dalam jabaran berikut.



(8)

Atau tiap masing-masing atribut

Atau tiap masing-masing atribut yang dilambangkan denganyang dilambangkan dengan



_ Dimana, P(aDimana, P(aii|V|V j j))

dihitung dengan menggunakan estimasi-m dihitung dengan menggunakan estimasi-m

(

_

|

_

)) 









 



 

 



Dimana:

n= jumlah contoh dimana v = v n= jumlah contoh dimana v = v j j

n

ncc= jumlah contoh dimana v= jumlah contoh dimana v = v= v j jdan a = adan a = aii

p = prioritas

p = prioritas yang dihitung untuk yang dihitung untuk

(

_

|

_

))

m = persamaan ukuran sampel

m = persamaan ukuran sampel v

v j j = dimana atribut = dimana atribut sama dengan kasus tertentu, misalnyasama dengan kasus tertentu, misalnya YESYES atauatau NO NO, diterima, diterima

atau tidak atau tidak

untuk nilai m, ditentukan sewenang-wenang namun dari beberapa sumber, nilai untuk nilai m, ditentukan sewenang-wenang namun dari beberapa sumber, nilai m disesuaikan dengan banyak jenis dari atribut. Sedangkan untuk nilai p, ditentukan m disesuaikan dengan banyak jenis dari atribut. Sedangkan untuk nilai p, ditentukan berdasarkan banyak kemungkinan yang muncul, perhitungan tersebut didapat dari 1 berdasarkan banyak kemungkinan yang muncul, perhitungan tersebut didapat dari 1 dibagi dengan banyak kemungkinan, misalkan ada 3 kemungkinan, maka nilai dari p dibagi dengan banyak kemungkinan, misalkan ada 3 kemungkinan, maka nilai dari p adalah 1/3 = 0,33

adalah 1/3 = 0,33

Model dan Langkah-Langkah Klasifikasi Naive Bayes Model dan Langkah-Langkah Klasifikasi Naive Bayes

Naive Bayes adalah sebuah bentuk klasifikasi yang tentu saja tujuannya adalah Naive Bayes adalah sebuah bentuk klasifikasi yang tentu saja tujuannya adalah untuk mengklasifikasikan terhadap data yang masuk atau diuji. Klasifikasi naive Bayes untuk mengklasifikasikan terhadap data yang masuk atau diuji. Klasifikasi naive Bayes adalah bentuk klasifikasi yang berdasarkan tentang pembelajaran, jadi perhitungan dan adalah bentuk klasifikasi yang berdasarkan tentang pembelajaran, jadi perhitungan dan klasifikasi akan terbentuk mengikuti data-data yang sudah digunakan untuk proses klasifikasi akan terbentuk mengikuti data-data yang sudah digunakan untuk proses pembelajaran.

(9)

Berikut adalah contoh data

Berikut adalah contoh data yang mengikuti proses pembelajaran.yang mengikuti proses pembelajaran.

Tabel 1

Tabel 1Data PembelajaranData Pembelajaran

no

no Atribut1 Atribut1 Atribut2 Atribut2 Atribut3 Atribut3 Result/hasilResult/hasil 1 1 X X A A 1 1 YAYA 2 2 X X B B 2 2 TIDAKTIDAK 3 3 Y Y A A 3 3 YAYA 4 4 X X B B 3 3 TIDAKTIDAK ... ... ... ... ... ... ... ... ... n n X X B B 1 1 YAYA

dari data yang digunakan untuk pembelajaran tersebut, dilakukan pengujian terhadap dari data yang digunakan untuk pembelajaran tersebut, dilakukan pengujian terhadap sebuah data, misalkan:

sebuah data, misalkan:

Tabel 2

Tabel 2Data diujiData diuji

Atribut1 Atribut2 Atribut3 Result/hasil

X

X A A 2 2 ??

Untuk mencari apakah hasil bernilai ya atau tidak, dilakukan proses penghitungan Untuk mencari apakah hasil bernilai ya atau tidak, dilakukan proses penghitungan derajat kecocokan berdasarkan jumlah data bersesuaian per atributnya.

derajat kecocokan berdasarkan jumlah data bersesuaian per atributnya.

Tabel 3

Tabel 3tabel kecocokan atributtabel kecocokan atribut

no

no X dan X dan YA YA A A dan dan YA YA 2 2 dan dan YAYA 1

1 TRUE TRUE TRUE TRUE FALSEFALSE

2

2 FALSE FALSE FALSE FALSE FALSEFALSE

3

3 FALSE FALSE TRUE TRUE FALSEFALSE

4

4 FALSE FALSE FALSE FALSE FALSEFALSE

... ... n

n TRUE TRUE FALSE FALSE FALSEFALSE

Dari Tabel 3 tersebut, didapat data yang akan digunakan untuk mencari derajat Dari Tabel 3 tersebut, didapat data yang akan digunakan untuk mencari derajat kecocokan per atribut.

(10)

Tabel 4

Tabel 4tabel kecocokan per atributtabel kecocokan per atribut

YA TIDAK YA TIDAK X X XX n n 3 3 n n 33 n_c n_c 2 2 n_c n_c 11 p p 0,5 0,5 p p 0,50,5 m m 3 3 m m 33 A A AA n n 2 2 n n 22 n_c n_c 2 2 n_c n_c 00 p p 0,5 0,5 p p 0,50,5 m m 3 3 m m 33 2 2 22 n n 1 1 n n 11 n_c n_c 0 0 n_c n_c 11 p p 0,33 0,33 p p 0,330,33 m m 3 3 m m 33

Dari tabel tersebut, lalu dihitung nilai poseterior per atribut, per kemungkinan. Dari tabel tersebut, lalu dihitung nilai poseterior per atribut, per kemungkinan.

1) 1)



 



 



  



   



 





2) 2)



 



 



  



   



 

3) 3)





 



  



   



 





Sehingga, Sehingga,





 

 



  

 



  

 



  









 

        

 

Dihitung juga untuk V(TIDAK) Dihitung juga untuk V(TIDAK)

1) 1)



 



 



  



   



 





2) 2)



 



 



  



   



 

3) 3)





 



  



   



 





(11)

(12)

Sehingga, Sehingga,





 

 



  

 



  

 



  









 

        

 

V(YA) =0,0546, V(TIDAK)=0,039 V(YA) =0,0546, V(TIDAK)=0,039

Karena V(YA)>V(TIDAK) maka data yang diuji tersebut termasuk tidak. Karena V(YA)>V(TIDAK) maka data yang diuji tersebut termasuk tidak.

Contoh Kasus Naive Bayes Contoh Kasus Naive Bayes

Sebuah Perusahaan bernama perusahaan NABA memiliki beberapa anak Sebuah Perusahaan bernama perusahaan NABA memiliki beberapa anak perusahaan. Salah satu anak perusahaan tersebut sedang melakukan pencarian pegawai perusahaan. Salah satu anak perusahaan tersebut sedang melakukan pencarian pegawai dan salah seorang analisis di perusahaan tersebut memiliki beberapa orang anak yang dan salah seorang analisis di perusahaan tersebut memiliki beberapa orang anak yang ingin dimasukkan ke dalam

ingin dimasukkan ke dalam perusahaaperusahaan tersebut. n tersebut. Berikut adalah data anak Berikut adalah data anak tersebut:tersebut: Tabel 5

Tabel 5Data anak diujiData anak diuji

no no

jenis jenis

kelamin

kelamin pendidikan pendidikan pengalaman pengalaman kerja kerja biaya biaya administrasiadministrasi

1

1 Laki Laki SMA SMA 1 1 100000100000

2

2 Perempuan Perempuan SMA SMA 3 3 300000300000

3

3 Laki Laki Diploma Diploma 3 3 500000500000

4

4 Perempuan Perempuan Sarjana Sarjana 2 2 100000100000

Kemudian bapak tersebut memiliki data salah satu anak perusahaan dan melakukan Kemudian bapak tersebut memiliki data salah satu anak perusahaan dan melakukan klasifikasi apakah anak-anak tersebut akan diterima atau tidak. Berikut

klasifikasi apakah anak-anak tersebut akan diterima atau tidak. Berikut data penerimaandata penerimaan pegawai tersebut

pegawai tersebut Tabel 6

Tabel 6data penerimaan pegawaidata penerimaan pegawai

no

no JenisJenis Kelamin

Kelamin PendidikanPendidikan

Lama Lama Pengalaman Pengalaman Kerja Kerja Biaya Biaya Administrasi

Administrasi statusstatus 1

1 Perempuan Perempuan SMA SMA 4 4 100100000 000 diterimaditerima

2

3

3 Perempuan Perempuan Diploma Diploma 3 3 300000 300000 diterimaditerima

4

(13)

5

5 Laki Laki Sarjana Sarjana 3 3 100000 100000 diterimaditerima

6

6 Laki Laki SMA SMA 1 1 100000 tidak 100000 tidak

7

7 Laki Laki Diploma Diploma 1 1 300000 tidak 300000 tidak

8

8 Laki Laki Diploma Diploma 3 3 100000 diterima100000 diterima

9

9 Perempuan Perempuan Diploma Diploma 2 2 100000 100000 tidak tidak

10

10 Laki Laki Diploma Diploma 3 3 300000 diterima300000 diterima

11

11 Perempuan Perempuan Sarjana Sarjana 4 4 100000 100000 diterimaditerima

12

12 Perempuan Perempuan Diploma Diploma 2 2 300000 300000 diterimaditerima

13

13 Laki Laki Sarjana Sarjana 1 1 500000 500000 diterimaditerima

14

14 Laki Laki Sarjana Sarjana 1 1 100000 100000 tidak tidak

15

16

16 Perempuan Perempuan Sarjana Sarjana 3 3 100000 100000 diterimaditerima

17

17 Perempuan Perempuan Sarjana Sarjana 1 1 100000 100000 tidak tidak

18

19

20

Lalu perhitunganpun dilakukan Lalu perhitunganpun dilakukan

Tabel 7

Tabel 7Pengujian Data 1Pengujian Data 1

No No Laki dan Laki dan Diterima Diterima SMA dan SMA dan diterima

diterima 1 1 tahun tahun dan dan diterimaditerima

100ribu dan 100ribu dan diterima diterima

1

1 FALSE FALSE TRUE TRUE FALSE FALSE TRUETRUE

2

2 FALSE FALSE TRUE TRUE FALSE FALSE FALSEFALSE

3

3 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE

4

5

5 TRUE TRUE FALSE FALSE FALSE FALSE TRUETRUE

6

7

8

9

10

10 TRUE TRUE FALSE FALSE FALFALSE SE FALSEFALSE

11

11 FALSE FALSE FALSE FALSE FALFALSE SE TRUETRUE

12

13

13 TRUE TRUE FALSE FALSE TRUE TRUE FALSEFALSE

14

(14)

15

15 FALSE FALSE TRUE TRUE FALSE FALSE TRUETRUE

16

16 FALSE FALSE FALSE FALSE FALFALSE SE TRUETRUE

17

18

19

20

Tabel 8

Tabel 8 data 1data 1

yes no yes no Laki Laki Laki Laki n n 10 10 n n 1010 n_c n_c 4 4 n_c n_c 66 p p 0,5 0,5 p p 0,50,5 m m 4 4 m m 44 P(Laki|YES)

P(Laki|YES) 0,428571429 0,428571429 P(LAKI|NO) P(LAKI|NO) 0,5714290,571429

SMA SMA SMA SMA n n 8 8 n n 88 n_c n_c 3 3 n_c n_c 55 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(SMA|YES)

P(SMA|YES) 0,36 0,36 P(SMA|NO) P(SMA|NO) 0,5266670,526667 1 1 11 n n 6 6 n n 66 n_c n_c 1 1 n_c n_c 55 p p 0,2 0,2 p p 0,20,2 m m 4 4 m m 44 P(1|YES)

P(1|YES) 0,18 0,18 P(1|NO) P(1|NO) 00,58,58

100000 100000 100000 100000 n n 11 11 n n 1111 n_c n_c 6 6 n_c n_c 55 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(100000|YE

P(100000|YES) S) 0,488 0,488 P(100000|NO) P(100000|NO) 0,4213330,421333 P(YES)

P(YES) 0,006776229 0,006776229 P(NO) P(NO) 0,0367720,036772 Karena P(YES)<P(NO) sehingga, data peserta uji satu

Karena P(YES)<P(NO) sehingga, data peserta uji satu tidaktidak diterima

(15)

Tabel 9

Tabel 9Pengujian Data 2Pengujian Data 2

N N o o Perempuan dan Perempuan dan Diterima Diterima SMA dan SMA dan diterima

300ribu dan 300ribu dan diterima diterima

1

1 TRUE TRUE TRUE TRUE FALSE FALSE FALSEFALSE

2

2 TRUE TRUE TRUE TRUE FALSE FALSE TRUETRUE

3

3 TRUE TRUE FALSE FALSE TRUE TRUE TRUETRUE

4

5

5 FALSE FALSE FALSE FALSE TRUE TRUE FALSEFALSE

6

7

8

8 FALSE FALSE FALSE FALSE TRUE TRUE FALSEFALSE

9

10

10 FALSE FALSE FALSE FALSE TRUE TRUE TRUETRUE

11

11 TRUE TRUE FALSE FALSE FALSE FALSE FALSEFALSE

12

13

14

15

15 TRUE TRUE TRUE TRUE FALSE FALSE FALSEFALSE

16

16 TRUE TRUE FALSE FALSE TRUE TRUE FALSEFALSE

17

18

19

20

(16)

Tabel 10

yes no yes no Perempuan Perempuan Perempuan Perempuan n n 10 10 n n 1010 n_c n_c 7 7 n_c n_c 33 p p 0,5 0,5 p p 0,50,5 m m 4 4 m m 44 P(Perempuan|YES P(Perempuan|YES ) 0,642857143 ) 0,642857143 P(Perempuan|NO P(Perempuan|NO )) 0,35714 0,35714 3 3 SMA SMA SMA SMA n n 8 8 n n 88 n_c n_c 3 3 n_c n_c 55 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(SMA|YES)

P(SMA|YES) 0,36 0,36 P(SMA|NO)P(SMA|NO)

0,52666 0,52666 7 7 3 3 33 n n 6 6 n n 66 n_c n_c 5 5 n_c n_c 11 p p 0,2 0,2 p p 0,20,2 m m 4 4 m m 44 P(3|YES)

P(3|YES) 0,58 0,58 P(3|NO) P(3|NO) 0,180,18

300000 300000 300000 300000 n n 8 8 n n 88 n_c n_c 4 4 n_c n_c 44 p p 0,33 0,33 P P 0,330,33 m m 4 4 M M 44 P(300000|YES)

P(300000|YES) 0,443333333 0,443333333 P(300000|NO)P(300000|NO)

0,44333 0,44333 3 3

P(YES)

P(YES) 0,029754 0,029754 P(NO)P(NO)

0,00750 0,00750 5 5 Karena P(YES)>P(NO) sehingga, data peserta uji dua

(17)

Tabel 11

Tabel 11 Pengujian Data 3Pengujian Data 3 No

No Laki Laki dan dan DiterimaDiterima

Diploma dan Diploma dan diterima

500ribu dan 500ribu dan diterima diterima 1

1 FALSE FALSE FALSE FALSE FALSE FALSE FALSEFALSE 2

3 FALSE FALSE TRUE TRUE TRUE TRUE FALSEFALSE 4

5 TRUE TRUE FALSE FALSE TRUE TRUE FALSEFALSE 6

8 TRUE TRUE TRUE TRUE TRUE TRUE FALSEFALSE 9

10 TRUE TRUE TRUE TRUE TRUE TRUE FALSEFALSE 11

12 FALSE FALSE TRUE TRUE FALSE FALSE FALSEFALSE 13

13 TRUE TRUE FALSE FALSE FALSE FALSE TRUETRUE 14

16 FALSE FALSE FALSE FALSE TRUE TRUE FALSEFALSE 17

(18)

Tabel 12

yes no yes no Laki Laki Laki Laki n n 10 10 n n 1010 n_c n_c 4 4 n_c n_c 66 p p 0,5 0,5 p p 0,50,5 m m 4 4 m m 44 P(Laki|YES)

P(Laki|YES) 0,428571429 0,428571429 P(LAKI|NO)P(LAKI|NO)

0,57142 0,57142 9 9 Diploma Diploma Diploma Diploma n n 6 6 n n 66 n_c n_c 4 4 n_c n_c 22 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(Diploma|YES P(Diploma|YES ) ) 0,532 0,532 P(Diploma|NO) P(Diploma|NO) 0,3320,332 3 3 33 n n 6 6 n n 66 n_c n_c 5 5 n_c n_c 11 p p 0,2 0,2 p p 0,20,2 m m 4 4 m m 44 P(3|YES)

P(3|YES) 0,58 0,58 P(3|NO) P(3|NO) 0,180,18

500000 500000 500000 500000 n n 1 1 n n 11 n_c n_c 1 1 n_c n_c 00 p p 0,33 0,33 p p 0,330,33 m m 4 4 m m 44 P(500000|YES)

P(500000|YES) 0,464 0,464 P(500000|NO) P(500000|NO) 0,2640,264

P(YES)

P(YES) 0,03067968 0,03067968 P(NO)P(NO)

(19)

Tabel 13

Tabel 13 Pengujian Data 4Pengujian Data 4

No

Perempuan dan

Diterima

Sarjana dan

diterima

2 tahun dan

diterima

100ribu dan

diterima

1

1 TRUE

TRUE

FALSE

TRUE

2

2 TRUE

TRUE

FALSE

3

3 TRUE

TRUE

FALSE

4

4 FALSE

FALSE

5

5 FALSE

FALSE

TRUE

FALSE

TRUE

6

6 FALSE

FALSE

7

7 FALSE

FALSE

8

8 FALSE

FALSE

TRUE

9

9 FALSE

FALSE

10

10 FALSE

FALSE

11

11 TRUE

TRUE

FALSE

TRUE

12

12 TRUE

TRUE

FALSE

TRUE

FALSE

13

13 FALSE

FALSE

TRUE

FALSE

14

14 FALSE

FALSE

15

15 TRUE

TRUE

FALSE

TRUE

16

16 TRUE

TRUE

FALSE

TRUE

17

17 FALSE

FALSE

18

18 FALSE

FALSE

19

19 FALSE

FALSE

20

(20)

Tabel 14

yes no yes no Perempuan Perempuan Perempuan Perempuan N N 10 10 n n 1010 n_c n_c 7 7 n_c n_c 33 P P 0,5 0,5 p p 0,50,5 M M 4 4 m m 44 P(Perempuan|YES P(Perempuan|YES ) 0,642857143 ) 0,642857143 P(Perempuan|NO P(Perempuan|NO )) 0,35714 0,35714 3 3 SMA SMA SMA SMA N N 6 6 n n 66 n_c n_c 4 4 n_c n_c 22 P P 0,33 0,33 p p 0,330,33 M M 4 4 m m 44 P(SMA|YES)

P(SMA|YES) 0,532 0,532 P(SMA|NO) P(SMA|NO) 0,3320,332 3 3 33 N N 4 4 n n 44 n_c n_c 1 1 n_c n_c 33 P P 0,2 0,2 p p 0,20,2 M M 4 4 m m 44 P(3|YES)

P(3|YES) 0,225 0,225 P(3|NO) P(3|NO) 0,4750,475

100000 100000 100000 100000 N N 11 11 n n 1111 n_c n_c 6 6 n_c n_c 55 P P 0,33 0,33 p p 0,330,33 M M 4 4 m m 44 P(300000|YES)

P(300000|YES) 0,488 0,488 P(300000|NO)P(300000|NO)

0,42133 0,42133 3 3

P(YES)

P(YES) 0,0187758 0,0187758 P(NO)P(NO)

Karena P(YES)>P(NO) sehingga, data peserta uji dua diterimaditerima

Dari 4 data tersebut, didapatkan kesimpulan bahwa Dari 4 data tersebut, didapatkan kesimpulan bahwa

data Status

1

1 Tidak Tidak diterimaditerima

2 Diterima 2 Diterima 3 Diterima 3 Diterima 4 Diterima 4 Diterima

(21)

Daftar Pustaka Daftar Pustaka

-- Wikipedia, Wikipedia, naive naive bayes bayes clasifiers, clasifiers, http://www.saylor.org/site/wp- http://www.saylor.org/site/wp-content/uploads/2011/02/Wikipedia-Naive-Bayes-Classifier.pdf ,diunduh pada content/uploads/2011/02/Wikipedia-Naive-Bayes-Classifier.pdf ,diunduh pada 10 Mei 2012

10 Mei 2012

-- Meisner, Meisner, E. E. Naive Naive Bayes Bayes example, example, 2003 2003 http://www.inf.u- http://www.inf.u-szeged.hu/~ormandi/ai2/06-naiveBayes-example.pdf , diunduh pada 10 Mei szeged.hu/~ormandi/ai2/06-naiveBayes-example.pdf , diunduh pada 10 Mei 2012

2012

-- Optimality Optimality of of Naive Naive Bayes, Bayes, http://courses.ischool.berkeley.edu/i290- http://courses.ischool.berkeley.edu/i290-dm/s11/SECURE/Optima

dm/s11/SECURE/Optimality_of_Naive_Baylity_of_Naive_Bayes.pdf , es.pdf , diunduh pada 10 Mei diunduh pada 10 Mei 20122012 -- Frank, E. Naive Bayes for Text Classification with Unbalanced Classes.Frank, E. Naive Bayes for Text Classification with Unbalanced Classes.

Computer Science Department, University of Waikato, New Zealand. Computer Science Department, University of Waikato, New Zealand. http://www.cs.waikato

http://www.cs.waikato.ac.nz/~eibe/pub.ac.nz/~eibe/pubs/FrankAndBous/FrankAndBouckaertPKDD06neckaertPKDD06new.pdf,w.pdf, diunduh pada 10 Mei 2012