Tugas Naïve Bayes Makassar, 02 Mei 2024
DATA MINING
Nama : Muh Fadel Abdillah Stambuk : 13020210259
Kelas : A5
PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS MUSLIM INDONESIA
MAKASSAR
2024
Hitung Probabilitas Dasar :
• P(Cerah): Banyaknya hari cerah dibagi total hari 𝑃(𝐶𝑒𝑟𝑎ℎ)=515=0.33P(Cerah)=155=0.33
• P(Mendung): Banyaknya hari mendung dibagi total hari 𝑃(𝑀𝑒𝑛𝑑𝑢𝑛𝑔)=415=0.27P(Mendung)=154=0.27
• P(Hujan): Banyaknya hari hujan dibagi total hari 𝑃(𝐻𝑢𝑗𝑎𝑛)=615=0.4P(Hujan)=156=0.4
• P(Ya): Banyaknya hari bermain dibagi total hari 𝑃(𝑌𝑎)=915=0.6P(Ya)=159=0.6
• P(Tidak): Banyaknya hari tidak bermain dibagi total hari 𝑃(𝑇𝑖𝑑𝑎𝑘)=615=0.4P(Tidak)=156=0.4
Hitung Likelihood
• P(Cerah|Ya): Banyaknya hari cerah dan bermain dibagi total hari bermain 𝑃(𝐶𝑒𝑟𝑎ℎ∣𝑌𝑎)=49=0.44P(Cerah∣Ya)=94=0.44
• P(Cerah|Tidak): Banyaknya hari cerah dan tidak bermain dibagi total hari tidak bermain
𝑃(𝐶𝑒𝑟𝑎ℎ∣𝑇𝑖𝑑𝑎𝑘)=26=0.33P(Cerah∣Tidak)=62=0.33
Hitung Posterior Probabilities
• P(Ya|Cerah):
𝑃(𝑌𝑎∣𝐶𝑒𝑟𝑎ℎ)=𝑃(𝐶𝑒𝑟𝑎ℎ∣𝑌𝑎)×𝑃(𝑌𝑎)𝑃(𝐶𝑒𝑟𝑎ℎ)=0.44×0.60.33≈0.8P(Ya∣Cer ah)=P(Cerah)P(Cerah∣Ya)×P(Ya)=0.330.44×0.6≈0.8
• P(Tidak|Cerah):
𝑃(𝑇𝑖𝑑𝑎𝑘∣𝐶𝑒𝑟𝑎ℎ)=𝑃(𝐶𝑒𝑟𝑎ℎ∣𝑇𝑖𝑑𝑎𝑘)×𝑃(𝑇𝑖𝑑𝑎𝑘)𝑃(𝐶𝑒𝑟𝑎ℎ)=0.33×0.40.33=0.
4P(Tidak∣Cerah)=P(Cerah)P(Cerah∣Tidak)×P(Tidak)=0.330.33×0.4=0.4
Kesimpulan
Karena 𝑃(𝑌𝑎∣𝐶𝑒𝑟𝑎ℎ)=0.8P(Ya∣Cerah)=0.8 lebih besar daripada 𝑃(𝑇𝑖𝑑𝑎𝑘∣𝐶𝑒𝑟𝑎ℎ)=0.4P(Tidak∣Cerah)=0.4, maka pemain tennis cenderung akan bermain ketika cuaca cerah.
2. Berdasarkan Contoh di Bawah
Nilai Persamaan Distribusi Gaussian untuk Kondisi "Tidak Akan Bermain"
1. Hitung Nilai Gaussian
• f(suhu=66|Tidak):
𝑓(66∣𝑇𝑖𝑑𝑎𝑘)=12𝜋(6.2)2𝑒−(66−70)22(6.2)2≈0.0340f(66∣Tidak)=2π(6.2)21 e−2(6.2)2(66−70)2≈0.0340
• f(kelembapan=90|Tidak):
𝑓(90∣𝑇𝑖𝑑𝑎𝑘)=12𝜋(10.2)2𝑒−(90−80)22(10.2)2≈0.0221f(90∣Tidak)=2π(10.2 )21e−2(10.2)2(90−80)2≈0.0221
Lakukan Normalisasi
Dari contoh, kita juga memiliki nilai likelihood untuk kondisi "Ya" dan "Tidak".
• Likelihood dari "Ya":
𝑃(𝑌𝑎∣𝑑𝑎𝑡𝑎)∝𝑃(𝑌𝑎)×𝑓(𝑠𝑢ℎ𝑢=66∣𝑌𝑎)×𝑓(𝑘𝑒𝑙𝑒𝑚𝑏𝑎𝑝𝑎𝑛=90∣𝑌𝑎)≈0.000036P (Ya∣data)∝P(Ya)×f(suhu=66∣Ya)×f(kelembapan=90∣Ya)≈0.000036
• Likelihood dari "Tidak":
𝑃(𝑇𝑖𝑑𝑎𝑘∣𝑑𝑎𝑡𝑎)∝𝑃(𝑇𝑖𝑑𝑎𝑘)×𝑓(𝑠𝑢ℎ𝑢=66∣𝑇𝑖𝑑𝑎𝑘)×𝑓(𝑘𝑒𝑙𝑒𝑚𝑏𝑎𝑝𝑎𝑛=90∣𝑇𝑖𝑑𝑎 𝑘)≈0.00136P(Tidak∣data)∝P(Tidak)×f(suhu=66∣Tidak)×f(kelembapan=90∣
Tidak)≈0.00136
Normalisasi dilakukan dengan membagi setiap likelihood dengan total likelihood:
𝑃(𝑌𝑎∣𝑑𝑎𝑡𝑎)=0.0000360.000036+0.00136≈0.026P(Ya∣data)=0.000036+0.0 01360.000036≈0.026
𝑃(𝑇𝑖𝑑𝑎𝑘∣𝑑𝑎𝑡𝑎)=0.001360.000036+0.00136≈0.974P(Tidak∣data)=0.00003 6+0.001360.00136≈0.974
Interpretasi
Berdasarkan hasil normalisasi, probabilitas pemain tidak akan bermain sangat tinggi, yaitu 0.974. Oleh karena itu, dapat disimpulkan bahwa pemain tidak akan bermain pada kondisi hari berikutnya dengan cuaca cerah, suhu 66, kelembapan 90, dan berangin.