• Tidak ada hasil yang ditemukan

Text Categorization Using Naive Bayes Algorithm - UUM Electronic Theses and Dissertation [eTheses]

N/A
N/A
Protected

Academic year: 2024

Membagikan "Text Categorization Using Naive Bayes Algorithm - UUM Electronic Theses and Dissertation [eTheses]"

Copied!
22
0
0

Teks penuh

(1)
(2)
(3)
(4)
(5)

ABSTRAK

Kewujutbn pelbagai sumber maklumat dalam dunla maya serta korporat masa kini telah nienarik minat para penyelidik dalam membantu melaksanakan proses pencaria.n, penapisan, dan pengurusan maklumat dengan lebih tepat Iagi. Teknik pengkategorian teks merupakan salah satu teknik yang boleh diadaptasikan di dalam si tuasi h i . Kajian ini menerangkan mengenai teknik pengkategorian teks herdasarkan a1 goritma naive Bayes. Algoritma ini telah lama digunakan dalam tugas penkategorian teks. Pengkelasan naive Bayes adalah berdasarkan model kebarangkalian yang menggabungkan andaian bebas yang kukuh di mana ianya tiada haitan dengan keadaan realiti. Tujuain kajian ini adalah untuk mengkategori kan dokumen yang berbentuk teks dengan menggunakan algoritma naive I3ayes dan untuk mengukur sejauh mana teknik yang dipilih ini dapat mengkategorikan dokumen dengan betul. Kajian ini juga turut membincangkan mengeniii eksperimen yang telah dijalankan clalam mengkategorikan arti kel dengan inenggunakan naive Bayes. Hasil daripada eksperimen ini menunjukkan ketepatan bagi 'training' adalah sebanyak 8 1.82% manakala ketepatan bagi 'testing' pula adalah sebanyak 47.62%.

ii

(6)

ABSTRACT

As the volume of information available on the internet and corporate intranet continues to increase, there is a growing interest in helping people better find, filter, arid manage all these resources. Text categorization is one of the techniques that can be applied in this situation. This paper presents text categorization system based on naive Bayes algorithm. This algorithm has long been used for text categorization tasks. Naive Bayes classifier is based on probability model that integrate strong independence assumptions which often have no bearing in reality.

The aims of this project are to categorize the textual document using naive Bayes algorithm and to measure the correctness of the chosen technique for the categorization process. This paper also discusses the experiment in categorizing articles using naive Bayes. The result shows thLat the accuracy for training is 8 1.82% whereas the accuracy for testing is 47.62%

ill ...

(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)

The contents of the thesis is for

internal user

only

(18)
(19)
(20)
(21)
(22)

Referensi

Dokumen terkait

Untuk pengembangan sistem yang dibuat pada penelitian ini, disarankan untuk menambah fungsi identifikasi sinonim Bahasa Indonesia, agar jika kata kunci yang masuk

COMPRESSING IMAGES USING MULTI-LEVEL WAVELET TRANSFORM ALGORITHM MWTA A project submitted to Dean of Kwang Haj Salleh Graduate School Office in partial Fulfillment of the

Prototaip sistem pesanan makanan secara mobile ini dibangunkan untuk memudahkan para pengguna khususnya pentadbir sistem, pengurus restoran, pelayan restoran, juruwang, pembantu dapur

Metodologi bagi model keperluan sistem ini mengandungi tiga fasa iaiti mentaknfkan keperluan, menganalisa keperluan dan menegsahkan model keperluan yang mana diperolehi daripada fasa

Colleges in UUM 3 The Group Development Stages of Tuckman and Jesen 1 997 1 1 The advantages and disadvantages of each method in group formation Previous researches on group

Oleh yang demikian, kerangkakerja ini menggunakan teknik set kabur dan penaakulan kabur bagi rrienentukan susunatur penilaian pencapaiari untuk sifat tertentu di dalam membuat

Kajian ini menghwaikan bebera pa teknik pengkelompokan seperti Porter Algorithm, Gusfield Algorithm, similarity based on document hierarchy, dan juga teknik Inverse Document Frequency

Penelitian ini bertujuan untuk mencari solusi dari permasalahan tersebut dengan membandingkan kinerja algoritma Naive Bayes dan Logistik regresi dalam mengklasifikasi data aplikasi