• Tidak ada hasil yang ditemukan

5. Information Extraction and Named Entity Recognition

N/A
N/A
Protected

Academic year: 2019

Membagikan "5. Information Extraction and Named Entity Recognition"

Copied!
54
0
0

Teks penuh

(1)

Information

Extraction and

Named Entity

Recognition

Information

Extraction and

Named Entity

Recognition

Tim Teaching

(2)

Information Extraction

Information Extraction

Information extraction (IE) systems

Menemukan dan memahami bagian

tertentu yang relevan dalam teks yang tidak terstruktur

Mengumpulkan informasi dari banyak kumpulan teks

Menghasilkan sebuah representasi

informasi yang relevan dan terstruktur:

Relasi (seperti dalam database)

Sebuah Basis Pengetahuan

Information extraction (IE) systems

Menemukan dan memahami bagian

tertentu yang relevan dalam teks yang tidak terstruktur

Mengumpulkan informasi dari banyak

kumpulan teks

Menghasilkan sebuah representasi

informasi yang relevan dan terstruktur:

Relasi (seperti dalam database)

(3)

Information Extraction

Information Extraction

Information extraction (IE) systems

Tujuan:

1. Membuat informasi menjadi lebih terorganisir dengan baik sehingga berguna untuk manusia

2. Informasi ditampilkan dalam sebuah format yang tepat secara semantic sehingga memungkinkan dilakukan inferensi pada tahap selanjutnya oleh algoritma komputer

Information extraction (IE) systems

Tujuan:

1. Membuat informasi menjadi lebih

terorganisir dengan baik sehingga

berguna untuk manusia

2. Informasi ditampilkan dalam sebuah format yang tepat secara semantic

sehingga memungkinkan dilakukan

(4)

Information Extraction

Information Extraction

IE systems mengekstrak informasi

yang terstruktur, jelas dan faktual dari

teks yang tidak terstruktur

Singkatnya : Siapa melakukan apa ke siapa, kapan dan di mana?

IE systems mengekstrak informasi

yang terstruktur, jelas dan faktual dari

teks yang tidak terstruktur

Singkatnya : Siapa melakukan apa ke siapa,

(5)

Information Extraction

Information Extraction

Tugas yang sering dilakukan pada IE:

Mengidentifkasi entitas nama

Mengidentifkasi relasi antar entitas

Memasukkan ke database dengan format tertentu

Tugas yang lain:

Mengekstraksi Kejadian

Membuat Template Otomatis dari informasi dalam teksdsb

Manfaat dan Aplikasi: natural language

understanding, question-answering, summarization, dsb.

Tugas yang sering dilakukan pada IE:

Mengidentifkasi entitas nama

Mengidentifkasi relasi antar entitas

Memasukkan ke database dengan format tertentu

Tugas yang lain:

Mengekstraksi Kejadian

Membuat Template Otomatis dari informasi dalam teksdsb

Manfaat dan Aplikasi: natural language

(6)

Information Extraction

(7)

Information Extraction

Information Extraction

Contoh,

Mengumpulkan data pemasukan, laba, pimpinan, kantor dsb dari laporan

perusahaan

Kantor Pusat BHP Billiton Limited, dan kantor

utama BHP Billiton Group, terletak di Melbourne, Australia.

Kantor Pusat(“BHP Biliton Limited”, “Melbourne, Australia”)

Mempelajari interkasi produk obat dari literatur penelitian medis

Contoh,

Mengumpulkan data pemasukan, laba,

pimpinan, kantor dsb dari laporan perusahaan

Kantor Pusat BHP Billiton Limited, dan kantor

utama BHP Billiton Group, terletak di Melbourne, Australia.

Kantor Pusat(“BHP Biliton Limited”, “Melbourne, Australia”)

Mempelajari interkasi produk obat dari

(8)

Information Extraction

(9)

Low Level IE

Low Level IE

Contoh Low Level IE, deteksi event

pada Apple mail atau Gmail

Biasanya berbasis pada regular

expressions and name lists

Contoh Low Level IE, deteksi event

pada Apple mail atau Gmail

Biasanya berbasis pada regular

(10)

Low Level IE

(11)

Why is IE hard on the

web?

Why is IE hard on the

web?

Kalau manusia pasti tahu kalau ini adalah buku,

tapi bisa jadi komputer mengenalinya sebagai Toys, karena berada di bawah menu Toys

Kalau manusia pasti tahu kalau ini adalah buku, tapi bisa jadi komputer mengenalinya sebagai Toys, karena berada di bawah menu Toys

Need this price

Title

(12)

Why is IE hard on the

web?

Why is IE hard on the

web?

Judul tidak dituliskan secara eksplisit sebagai judul, hanya dibold dan memakai besar huruf

Judul tidak dituliskan secara eksplisit sebagai

judul, hanya dibold dan memakai besar huruf A book,

(13)

Why is IE hard on the

web?

Why is IE hard on the

web?

Judul tidak dituliskan secara eksplisit sebagai judul, hanya dibold dan memakai besar huruf

Judul tidak dituliskan secara eksplisit sebagai

judul, hanya dibold dan memakai besar huruf

(14)

Why is IE hard on the

web?

Why is IE hard on the

web?

Untuk harga – ada banyak harga yang ditampilkan,

harus pilih yang mana?

Untuk harga – ada banyak harga yang ditampilkan, harus pilih yang mana?

(15)

How is IE useful?

How is IE useful?

Background:

Plain text

advertisements

Mengkestrak

informasi dari iklan di koran lalu diformat menjadi seperti di samping.

Lalu bisa ditulis lagi

dengan menggunakan format lain tapi

informasinya tetap sama

Background:

Plain text

advertisements

Mengkestrak

informasi dari iklan di koran lalu diformat menjadi seperti di samping.

Lalu bisa ditulis lagi

dengan menggunakan format lain tapi

(16)

How is IE useful?

How is IE useful?

Mengambil informasi alamat rumah di web secara

otomatis

(17)

How is IE useful?

How is IE useful?

Mengambil informasi alamat rumah di web secara

otomatis

(18)

IE vs Information

Retrieval

IE vs Information

Retrieval

Information Retrieval

User Query -> Teks/dokumen yang relevanPendekatan: keyword matching

Query generality : full

Information Extraction

Analisis Linguistic yang ditargetkan pada informasi

yang relevan

User Query -> Informasi yang relevanPendekatan: Analisis linguistic

Query generality: Dibatasi pada target informasi

Information Retrieval

User Query -> Teks/dokumen yang relevanPendekatan: keyword matching

Query generality : full

Information Extraction

Analisis Linguistic yang ditargetkan pada informasi

yang relevan

User Query -> Informasi yang relevanPendekatan: Analisis linguistic

(19)

Named Entity Recognition

(NER)

Named Entity Recognition

(NER)

Named Entity Recognition (NER) adalah salah satu Subtask yang sangat penting dalam IE : Menemukan dan Mengklasifkasi nama-nama Entitas dalam teks

Nama Entitas apa saja? Tergantung pada Aplikasinya.

People, places, organizations, times, amounts, etc.Names of genes and proteins (Settles 05)

Names of college courses (McCallum 05)

Named Entity Recognition (NER) adalah salah

satu Subtask yang sangat penting dalam IE :

Menemukan dan Mengklasifkasi nama-nama Entitas dalam teks

Nama Entitas apa saja? Tergantung pada

Aplikasinya.

People, places, organizations, times, amounts, etc.

Names of genes and proteins (Settles 05)

(20)

Named Entity Recognition

(NER)

Named Entity Recognition

(NER)

NER untuk menemukan, contoh :

The decision by the independent MP Andrew Wilkie

to withdraw his support for the minority Labor government sounded dramatic but it should not further threaten its stability. When, after the 2010 election, Wilkie, Rob Oakeshott, Tony Windsor and the Greens agreed to support Labor, they gave just two guarantees: confdence and supply.

NER untuk menemukan, contoh :

The decision by the independent MP Andrew Wilkie

to withdraw his support for the minority Labor

government sounded dramatic but it should not further threaten its stability. When, after the 2010

(21)

Named Entity Recognition

(NER)

Named Entity Recognition

(NER)

NER untuk menemukan dan mengklasifkasi, contoh :

The decision by the independent MP Andrew

Wilkie to withdraw his support for the minority Labor government sounded

dramatic but it should not further threaten its stability. When, after the 2010 election,

Wilkie, Rob Oakeshott, Tony Windsor and the Greens agreed to support Labor, they gave just two guarantees: confdence and supply.  NER untuk menemukan dan

mengklasifkasi, contoh :

The decision by the independent MP Andrew

Wilkie to withdraw his support for the minority Labor government sounded

dramatic but it should not further threaten its stability. When, after the 2010 election,

Wilkie, Rob Oakeshott, Tony Windsor and the

Greens agreed to support Labor, they gave just two guarantees: confdence and supply.

Person

Date

(22)

Named Entity Recognition

(NER)

Named Entity Recognition

(NER)

Manfaat:

Melakukan Indeksi Entitas dsb.

Sentiment bisa disematkan pada perusahaan atau

produk

Banyak relasi IE relations yang menjadi asosiasi

antar entitas

Untuk question answering, jawaban kebanyakan

adalah entitas  Manfaat:

Melakukan Indeksi Entitas dsb.

Sentiment bisa disematkan pada perusahaan atau

produk

Banyak relasi IE relations yang menjadi asosiasi

antar entitas

Untuk question answering, jawaban kebanyakan

(23)

Named Entity Recognition

(NER)

Named Entity Recognition

(NER)

Tiga pendekatan Standart untuk NER

(dan IE)

1. Hand-written regular expressions 2. Using classifers

Generative: Naïve Bayes

Discriminative: Maxent models

3. Sequence models

HMMs

CMMs/MEMMs  CRFs

Tiga pendekatan Standart untuk NER

(dan IE)

1. Hand-written regular expressions

2. Using classifers

Generative: Naïve Bayes

Discriminative: Maxent models

3. Sequence models

HMMs

(24)

Rule Based NER

Rule Based NER

Information Extraction & NER

(25)

Rule Based NER

Rule Based NER

Ada 3 cara :

Menggunakan

regular expressions

Membuat aturan khusus untuk urutan

tertentu

Menggunakan

context patterns

Ada 3 cara :

Menggunakan

regular expressions

Membuat aturan khusus untuk urutan

tertentu

Menggunakan

context patterns

(26)

Rule Based NER (1)

Rule Based NER (1)

Membuat regular expressions untuk

mengekstraksi:

– Nomor Telephone – E-mail

– Nama yang diawali huruf Kapital

Membuat regular expressions untuk

mengekstraksi:

– Nomor Telephone

– E-mail

– Nama yang diawali huruf Kapital

(27)

Rule Based NER (1)

Rule Based NER (1)

Regular expressions

menyediakan cara yang

feksibel untuk mencocokkan string pada teks.

Tidak hanya mencocokkan kata yang memiliki

karakter-karakter yang sama, tapi bisa juga

dengan menggunakan karakter, kata, atau

pola tertentu.

Regular expressions menyediakan cara yang

feksibel untuk mencocokkan string pada teks.

Tidak hanya mencocokkan kata yang memiliki

karakter-karakter yang sama, tapi bisa juga

dengan menggunakan karakter, kata, atau

pola tertentu.

(28)

Rule Based NER (1)

Rule Based NER (1)

Misal, kita ingin mencari sebuah kata

yang

1. Diawali huruf besar “P”

2. Merupakan Huruf pertama pada sebuah

baris

3. Huruf setelahnya menggunakan huruf kecil

4. Cuma terdiri dari 3 huruf

5. Huruf ketiga adalah huruf vokal

Misal, kita ingin mencari sebuah kata

yang

1.

Diawali huruf besar “P”

2.

Merupakan Huruf pertama pada sebuah

baris

3.

Huruf setelahnya menggunakan huruf kecil

4.

Cuma terdiri dari 3 huruf

5.

Huruf ketiga adalah huruf vokal

(29)

Rule Based NER (1)

Rule Based NER (1)

Misal, kita ingin mencari sebuah kata yang :

1. Diawali huruf besar “P”

2. Merupakan Huruf pertama pada sebuah baris 3. Huruf setelahnya menggunakan huruf kecil 4. Cuma terdiri dari 3 huruf

5. Huruf ketiga adalah huruf vokal

Regular expressionnya : “^P[a-z][aeiou]” di mana :

^ - Mengindikasikan awal String

[a-z] – semua huruf kecil dari a sampzi z [aeiou] – semua huruf kecil vokal

Misal, kita ingin mencari sebuah kata yang :

1. Diawali huruf besar “P”

2. Merupakan Huruf pertama pada sebuah baris 3. Huruf setelahnya menggunakan huruf kecil 4. Cuma terdiri dari 3 huruf

5. Huruf ketiga adalah huruf vokal

Regular expressionnya : “^P[a-z][aeiou]” di mana :

^ - Mengindikasikan awal String

[a-z] – semua huruf kecil dari a sampzi z

(30)

Perl RegEx

Perl RegEx

\w (word char) any alpha-numeric\d (digit char) any digit

specifc range of number of occurrences: {min,max}.A{1,5} One to fve A’s.

A{5,} Five or more A’sA{5} Exactly fve A’s

\w (word char) any alpha-numeric\d (digit char) any digit

specifc range of number of occurrences: {min,max}.A{1,5} One to fve A’s.

A{5,} Five or more A’s

(31)

Rule Based NER (1)

Rule Based NER (1)

Membuat regular expressions untuk

mengekstraksi:

– Nomor Telephone

Contoh : 0341-551611, 0341-565420, 0857-467-45623 Nomor yang dipisah dengan Hypen (-)

RegEx = (\d+\-)+\d+

Membuat regular expressions untuk

mengekstraksi:

– Nomor Telephone

Contoh : 0341-551611, 0341-565420, 0857-467-45623 Nomor yang dipisah dengan Hypen (-)

RegEx = (\d+\-)+\d+

(32)

Rule Based NER (2)

Rule Based NER (2)

Membuat aturan untuk mengkestrak

lokasi

Kata yang diawali huruf besar + {city, center,

river} menandakan lokasi Ex. New York city

Hudson river

{Kota, Desa, Kecamatan, Kabupaten, Kelurahan} +

Kata yang diawali huruf besar menandakan lokasi Ex. Kota Kanor

Desa Kedung Primpen

Membuat aturan untuk mengkestrak

lokasi

Kata yang diawali huruf besar + {city, center, river} menandakan lokasi

Ex. New York city

Hudson river

{Kota, Desa, Kecamatan, Kabupaten, Kelurahan} + Kata yang diawali huruf besar menandakan lokasi Ex. Kota Kanor

(33)

Rule Based NER (3)

Rule Based NER (3)

Menggunakan context patterns [PERSON] earned [MONEY]

Ex. Frank earned $20

[PERSON] joined [ORGANIZATION]

Ex. Sam joined IBM

[PERSON],[JOBTITLE] Ex. Mary, the teacher

Menggunakan context patterns

[PERSON] earned [MONEY] Ex. Frank earned $20

[PERSON] joined [ORGANIZATION] Ex. Sam joined IBM

[PERSON],[JOBTITLE] Ex. Mary, the teacher

(34)

Rule Based NER (3)

Rule Based NER (3)

Menggunakan context patterns

[PERSON|ORGANIZATION|ANIMAL] fy to [LOCATION|

PERSON|EVENT]

Ex. Jerry few to Japan

Sarah fies to the party Delta fies to Europe

bird fies to trees

bee fies to the wood

Menggunakan context patterns

[PERSON|ORGANIZATION|ANIMAL] fy to [LOCATION|

PERSON|EVENT]

Ex. Jerry few to Japan

Sarah fies to the party Delta fies to Europe

bird fies to trees

bee fies to the wood

(35)

Why simple things would not

work?

Why simple things would not

work?

Huruf Kapital adalah indikasi yang kuat bahwa

kata tersebut adalah sebuah nama, tapi

kadang bisa juga sangat tricky:

Kata pertama dari kalimat pasti diawali huruf besar Kadang judul di website semuanya pake huruf besar

Ada juga yang mengandung huruf kecil

University of Southern California adalah Organization, of diawali dengan huruf kecil

Pada kasus khusu, yaitu Bahasa Jerman, semua kata

benda memakai huruf besar

Huruf Kapital adalah indikasi yang kuat bahwa

kata tersebut adalah sebuah nama, tapi

kadang bisa juga sangat tricky:

Kata pertama dari kalimat pasti diawali huruf besar Kadang judul di website semuanya pake huruf besar Ada juga yang mengandung huruf kecil

University of Southern California adalah Organization, of diawali dengan huruf kecil

Pada kasus khusu, yaitu Bahasa Jerman, semua kata

(36)

Why simple things would not

work?

Why simple things would not

work?

Entitas yang sama bisa jadi memiliki beberapa variasi

Pak Bisri prof. Bisri Bisri

Ada juga ambiguitas

Ahmad Yani orang vs. Ahmad Yani jalan

JFK the person vs. JFK the airport

May the person vs. May the month

Entitas yang sama bisa jadi memiliki beberapa

variasi

Pak Bisri prof. Bisri Bisri

Ada juga ambiguitas

Ahmad Yani orang vs. Ahmad Yani jalan

JFK the person vs. JFK the airport

(37)

Naive Bayes Based

NER

Naive Bayes Based

NER

Information Extraction & NER

(38)

Naive Bayes Based NER

Naive Bayes Based NER

D1 : Santika akan pergi ke Bali bersama

Supriadi

D2 : Hotel Santika berada di Jalan Merapi

D3 : Supriadi menginap di Hotel Santika

sebelum berangkat ke Merapi Center

D4 : Jalan Merapi macet sampai Jalan

Supriadi

D1 : Santika akan pergi ke Bali bersama

Supriadi

D2 : Hotel Santika berada di Jalan Merapi

D3 : Supriadi menginap di Hotel Santika

sebelum berangkat ke Merapi Center

D4 : Jalan Merapi macet sampai Jalan

Supriadi

(39)

Naive Bayes Based NER

Naive Bayes Based NER

D1 : Santika akan pergi ke Bali bersama

Supriadi

D2 : Hotel Santika berada di Jalan Merapi

D3 : Supriadi menginap di Hotel Santika

sebelum berangkat ke Merapi Center

D4 : Jalan Merapi macet sampai Jalan

Supriadi

D1 : Santika akan pergi ke

Bali

bersama

Supriadi

D2 : Hotel

Santika

berada di Jalan

Merapi

D3 : Supriadi menginap di Hotel

Santika

sebelum berangkat ke

Merapi

Center

D4 : Jalan

Merapi

macet sampai Jalan

Supriadi

(40)

Naive Bayes Based NER

Naive Bayes Based NER

Nama Person : Santika, Supriadi,

Supriadi

Nama Organisasi : Santika, Santika,

Merapi

Nama Lokasi : Merapi, Merapi, Bali,

Supriadi

Nama Person :

Santika, Supriadi,

Supriadi

Nama Organisasi :

Santika, Santika,

Merapi

Nama Lokasi :

Merapi, Merapi, Bali,

Supriadi

(41)

Naive Bayes Based NER

Naive Bayes Based NER

D5 : Supriadi akan menginap di Hotel

Santika

D5 : Supriadi akan menginap di Hotel

Santika

(42)

Multinomial Naive Bayes

Multinomial Naive Bayes

Nama Person (P) : Santika, Supriadi, SupriadiNama Organisasi (O) : Santika, Santika, MerapiNama Lokasi (L) : Merapi, Merapi, Bali, SupriadiD5 : Supriadi akan menginap di Hotel Santika

Nama Person (P) : Santika, Supriadi, SupriadiNama Organisasi (O) : Santika, Santika, MerapiNama Lokasi (L) : Merapi, Merapi, Bali, SupriadiD5 : Supriadi akan menginap di Hotel Santika

(43)

Multinomial Naive Bayes

Multinomial Naive Bayes

W adalah kata

C adalah kategori

P(c I w) : Peluang kategori c dengan syarat muncul

kata w

P(c) : Peluang munculnya kategori cP(w) : Peluang munculnya kata w

W adalah kata

C adalah kategori

P(c I w) : Peluang kategori c dengan syarat muncul

kata w

P(c) : Peluang munculnya kategori c

P(w) : Peluang munculnya kata w 43

(44)

Multinomial Naive Bayes

Multinomial Naive Bayes

Karena nilai P(w) selalu sama, bisa juga dituliskan

menjadi cukup :

P(w | c)* P(c)

Karena nilai P(w) selalu sama, bisa juga dituliskan

menjadi cukup :

P(w | c)* P(c)

(45)

Multinomial Naive Bayes

Multinomial Naive Bayes

Untuk menghindari adanya nilai 0 (nol), digunakan

add-one or Laplace smoothing

Untuk menghindari adanya nilai 0 (nol), digunakan

add-one or Laplace smoothing

45

(

)

=

�����

(

,

)

�����

(

)

 

(

)

=

�����

�����

(

,

)

+

1

(

)

+

¿

¿ ¿

(46)

Multinomial Naive Bayes

Multinomial Naive Bayes

• P(w|c) : Peluang munculnya kata w dengan syarat muncul kategori c

P(c) : Peluang kemunculan kategori c

• Count(w,c) : jumlah kata w pada kategori c

• Count (c) : jumlah seluruh kata pada kategori c

• |V| : jumlah kata-kata yang unik dalam seluruh dokumen

• P(w|c) : Peluang munculnya kata w dengan syarat muncul kategori c

P(c) : Peluang kemunculan kategori c

• Count(w,c) : jumlah kata w pada kategori c

• Count (c) : jumlah seluruh kata pada kategori c

• |V| : jumlah kata-kata yang unik dalam seluruh dokumen46

(

)

=

�����

�����

(

,

)

+

1

(

)

+

¿

¿ ¿

(47)

Multinomial Naive Bayes

Multinomial Naive Bayes

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(P)=1/3, P(O)=1/3, P(L) = 1/3P(Supriadi | P) = (2)+1/(3+4) = 3/7

P(Supriadi | O) = (0)+1/(3+4) = 1/7 P(Supriadi | L) = (1)+1/(4+4) = 2/8

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

(48)

Multinomial Naive Bayes

Multinomial Naive Bayes

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(P)=1/3, P(O)=1/3, P(L) = 1/3

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

(49)

Multinomial Naive Bayes

Multinomial Naive Bayes

Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk mencari kelas yang memiliki peluang terbesar.

Sehingga cukup memakai rumus

Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk mencari kelas yang memiliki peluang terbesar.

Sehingga cukup memakai rumus

49

(50)

Multinomial Naive Bayes

Multinomial Naive Bayes

Karena kelas P memiliki peluang terbesar, maka Supriadi masuk ke Entitas Nama Person (P)

Karena kelas P memiliki peluang terbesar, maka

Supriadi masuk ke Entitas Nama Person (P) 50

(51)

Multinomial Naive Bayes

Multinomial Naive Bayes

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(akan | P) = (0)+1/(3+4) = 1/7P(akan | O) = (0)+1/(3+4) = 1/7P(akan | L) = (0)+1/(4+4) = 1/8

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika • P(akan | P) = (0)+1/(3+4) = 1/7P(akan | O) = (0)+1/(3+4) = 1/7P(akan | L) = (0)+1/(4+4) = 1/8

(52)

Multinomial Naive Bayes

Multinomial Naive Bayes

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(P | akan) = P(akan | P) * P(P) = 1/7 *1/3 = 1/21P(O | akan) = P(akan | O) * P(O) = 1/7 *1/3 = 1/21P(L | akan) = P(akan | L) * P(L) = 1/8 *1/3 = 1/24Maka kata akan masuk ke Entitas Person atau

Organisasi

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(P | akan) = P(akan | P) * P(P) = 1/7 *1/3 = 1/21P(O | akan) = P(akan | O) * P(O) = 1/7 *1/3 = 1/21P(L | akan) = P(akan | L) * P(L) = 1/8 *1/3 = 1/24Maka kata akan masuk ke Entitas Person atau

Organisasi

(53)

Multinomial Naive Bayes

Multinomial Naive Bayes

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(Santika | P) = (1)+1/(3+4) = 2/7P(Santika | O) = (2)+1/(3+4) = 3/7 P(Santika | L) = (0)+1/(4+4) = 1/8

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika • P(Santika | P) = (1)+1/(3+4) = 2/7P(Santika | O) = (2)+1/(3+4) = 3/7 P(Santika | L) = (0)+1/(4+4) = 1/8

(54)

Multinomial Naive Bayes

Multinomial Naive Bayes

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(P | Santika) = P(Santika | P)*P(P) = 2/7 * 1/3 =

Maka Santika masuk ke Entitas Nama Organisasi (O)

• Nama Person (P) : Santika, Supriadi, Supriadi

• Nama Organisasi (O) : Santika, Santika, Merapi

• Nama Lokasi (L) : Merapi, Merapi, Bali, Supriadi

• D5 : Supriadi akan menginap di Hotel Santika

P(P | Santika) = P(Santika | P)*P(P) = 2/7 * 1/3 =

Referensi

Dokumen terkait

Kepala Satuan sebagaimana dimaksud dalam Pasal 5 ayat (1) huruf a, mempunyai tugas memimpin kegiatan pelayanan umum dan teknis Satuan Polisi Pamong Praja sesuai dengan kewenangan

[r]

Fokus bahasan pada berbagai konsep dan teori keperawatan serta kebijakan pemerintah dalam meningkatkan kesehatan wanita masa hamil, melahirkan dan setelah melahirkan serta

Peran bidan dalam menangani kasus diare adalah mengidentifikasi potensi dan permasalahan klinis, menganalisa masalah, mencari alternatif pemecahan masalah dan

Konsultan harus bekerjasama sepenuhnya dengan pengguna anggaran/pejabat pembuat komitmen dalam melakukan pengawasan teknis / supervisI teknis atas pelaksanaan pekerjaan

283 MLBI MULTI BINTANG INDONESIA Tbk SIDP1 - SIRCA DATAPRO PERDANA, PT 1000. 284 MLIA MULIA INDUSTRINDO Tbk BLCM1 - BLUE CHIP MULIA,

Selain itu pada tahap pelaksanan kegiatan mulai dari kegiatan peningkatan akses penggunaan air bersih yang aman dan bebas pencemaran, pelaksanaan penyuluhan secara partisipatif