• Tidak ada hasil yang ditemukan

KLASIFIKASI BAYESIAN Data Mining

N/A
N/A
Protected

Academic year: 2018

Membagikan "KLASIFIKASI BAYESIAN Data Mining"

Copied!
20
0
0

Teks penuh

(1)

KLASIFIKASI

BAYESIAN

Kelompok

5

Bonggakarang Adrianus

Entaren Junvenly

Makagiansar Gaelle

Maingkolang Nirwanto

(2)
(3)

Overview

Today we learn:

• Bayesian classification

• E.g. How to decide if a patient is ill or healthy, based on

• A probabilistic model of the observed data

(4)

Introduction

Klasifikasi adalah salah satu tugas yang penting dalam data mining, dalam klasifikasi sebuah pengklasifikasi dibuat dari sekumpulan data latih dengan kelas yang telah ditentukan sebelumnya Naive Bayes adalah salah satu Algoritma

Klasifikasi yang populer, Performa naïve bayes yang

(5)
(6)

Classification problem

• Training data: examples of the form (d,h(d))

• where d are the data objects to classify (inputs)

• and h(d) are the correct class info for d, h(d){1,…K}

(7)
(8)
(9)

Why Bayesian?

• Provides practical learning algorithms

• E.g. Naïve Bayes

• Prior knowledge and observed data can be combined

• It is a generative (model based) approach, which offers

a useful conceptual framework

• E.g. sequences could also be classified, based on a probabilistic model specification

(10)

Probabilities

• Have two dice h1 and h2

• The probability of rolling an i given die h1 is denoted P(i|h1).

This is a conditional probability

• Pick a die at random with probability P(hj), j=1 or 2. The

probability for picking die hj and rolling an i with it is called

joint probability and is P(i, hj)=P(hj)P(i| hj).

• For any events X and Y, P(X,Y)=P(X|Y)P(Y)

• If we know P(X,Y), then the so-called marginal probability

P(X) can be computed as

Y

Y X P X

(11)
(12)

• Ex.

Misalkan si-A bercerita /bercakap-cakap akrab dengan seseorang lain di atas kereta api. Informasi yang didapat,

peluang si-A bercakap-cakap dengan perempuan adalah

50%. Sekarang misalkan si-A menyebut bahwa orang lain di

atas kereta api itu berambut panjang.

Dari keterangan baru ini tampaknya lebih boleh jadi si-A bercakap-cakap dengan perempuan, karena orang berambut panjang biasanya wanita.

Teorema Bayes dapat digunakan untuk menghitung besarnya peluang bahwa si-A berbicara dengan seorang wanita, berapa

(13)

• Misalkan:

W adalah kejadian percakapan dilakukan dengan seorang

wanita.

L adalah kejadian percakapan dilakukan dengan seorang

berambut panjang

(14)

• Kita dapat berasumsi bahwa wanita adalah setengah dari populasi. Artinya peluang si-A berbicara dengan wanita adalah 0,5.

P(W) = 0,5

• Misalkan juga bahwa diketahui 75 persen wanita berambut panjang. Ini berarti bila kita mengetahui bahwa seseorang adalah wanita, peluangnya berambut panjang adalah 0,75.

P(L/W) = 0,75

• Sebagai keterangan tambahan kita juga mengetahui bahwa peluang seorang pria berambut panjang adalah 0,3.

P(L/M) = 0,3.

• Di sini kita mengasumsikan bahwa seseorang itu adalah pria atau wanita, atau P(M) = 1 - P(W) = 0,5. Dengan kata lain M adalah kejadian

komplemen dari W.

(15)
(16)

• Dengan memasukkan nilai-nilai peluang yang diketahui ke dalam rumus di atas, kita mendapatkan peluang seseorang itu wanita bila diketahui dia berambut panjang adalah 0,714.

• Dari contoh di atas kita bisa merumuskan teorema Bayes secara

(17)

Klasifikasi teks adalah proses pengelompokan dokumen kedalam kelas berbeda, dalam tahapannya tiap dokumen d menunjuk pada satu kelas tertentu maka dibutuhkan proses untuk

(18)
(19)

Klasifikasi–klasifikasi Bayes adalah klasifikasi tatistik yang dapat memprediksi kelas suatu anggota probabilitas. Untuk klasifikasi Bayes sederhana yang lebih dikenal sebagai naïve Bayesian Classifier dapat diasumsikan bahwa efek dari suatu nilai atribut sebuah kelas yang diberikan adalah bebas dari atribut-atribut lain. Asumsi ini disebut class conditional independence yang dibuat untuk emudahkan

(20)

Remember!

• Bayes’ rule can be turned into a classifier

• Naive Bayes Classifier is a simple but effective Bayesian

classifier for vector data (i.e. data with several attributes) that assumes that attributes are independent given the class.

Referensi

Dokumen terkait

Partisipasi peserta dapat dilihat dari pertanyaan yang diajukan dalam kegiatan diskusi dan keseriusan peserta di dalam mengikuti simulasi yang berkaitan dengan Sadar Wisata Desa.

terlampir).JadwPelaksanaan penelitian dilakukan setelah mendapatkan persetujuan dari dosen pembimbing. Penelitian dilaksanakan pada semester.. Penulis terlebih dahulu

dalam fungsi ini jumlah data akan dibagi 4 dan disusun menjadi bagian training dan testing seperti pada ilustrasi Gambar 2.3 Ilustrasi 4-Fold Validation yang kemudian disimpan

Untuk negara-negara maju fungsi dan pemanfaatan jalur pedestrian atau trotoar sudah sangat jelas, yaitu sebagai jalur yang disediakan dan digunakan hanya untuk

untuk mengeser/memindahkan letak tabulasi, klik mouse pada tanda tabulasi, kemudian tekan tombol mouse dan jangan dilepas sambil mengesernya ketempat yang Anda inginkan, lepas

Berdasarkan hasil eksperimen yang kedua, jaringan diuji dengan menggunakan data baru yang berjumlah lima orang jaringan mampu memberikan akurasi sebesar 85,71% yang

Korelasi paling kuat yang bersifat positif antara stres kerja dengan kepuasan kerja terdapat pada pengukuran fisiologis pada skala stres kerja dengan pekerjaan itu

Menurut Drucker dalam Hurley and Hult dalam penelitian Sonah Sitohang (2006:293) menjelaskan bahwa perusahaan yang berorientasi terhadap inovasi produk akan mampu