BAB I PENDAHULUAN
1.1. Latar Belakang
Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang ingin mencari tahu tentang undang-undang yang diperlukan atau berita tertentu yang ada pada web pemerintahan, maka, orang tersebut mencari pada mesin pencari. Namun, tidak semua situs pemerintahan tersebut rajin mengunggah informasi penting yang dibutuhkan oleh masyarakat.
Ada pula situs pemerintahan yang mengunggah informasi penting tetapi sangat jarang dilakukan, ada pula situs pemerintahan yang rajin mengunggah informasi tetapi informasi yang diberikan cenderung bukanlah informasi yang diperlukan oleh masyarakat, dan ada juga situs yang isi didalamnya kosong. Untuk itulah dibuatkannya Sistem klasifikasi reporting berita pada pemerintahan untuk dapat mengetahui seberapa sering suatu situs pemerintahan tersebut mengunggah berita atau informasi yang diperuntukan untuk masyarakat nantinya. Dengan ada reporting berita ini, diharapkan nantinya situs-situs yang lain dapat melihat seberapa banyak berita yang sudah di unggah oleh seluruh SKPD sesuai dengan katagori yang ada.
Klasifikasi reporting berita dengan menggunakan metode Naïve Bayes merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas. Konsep dasar yang digunakan oleh Naïve bayes adalah Teorema Bayes, yaitu teorema yang digunakan dalam statistika untuk menghitung suatu peluang. Bayes Optimal Classifier menghitung peluang dari satu kelas dari masing-masing kelompok atribut yang ada sehingga dapat menentukan kelas mana yang paling optimal.
Beberapa pengujian telah dilakukan menggunakan metode Naive Bayes itu
sendiri diantaranya Klasifikasi Teks Dengan Naïve Bayes Classifier (NBC) Untuk
Pengelompokan Teks Berita Dan Abstract Akademis (Amir Hamzah, 2012) yang
menggunakan 1000 dokumen berita dan 450 dokumen abstrak dengan hasil
persentase maksimal 91%. Klasifikasi Konten Berita Dengan Metode Text Mining (Bambang K, Syahril E,dan Opim Salim S, 2012) yang menggunakan 100 berita disetiap kategori, dimana 90 berita digunakan untuk proses training dan 10 berita digunakan untuk proses testing dengan menunjukan bahwa berita testing bisa terklasifikasi secara otomatis seluruhnya. Klasifikasi Dokumen Teks Berbahasa Indonesia Dengan Menggunakan Naive Bayes (Joko S, Surya S, Mochamad H, 2009) dengan hasil dari dokumen training yang mencapai 83,57% dan terus meningkat hingga 87.63%.
1.2. Rumusan Masalah
Berdasarkan dengan latar belakang yang telah dijelaskan di atas, maka dapat dirumuskan sebuah pokok permasalahan, yaitu
1. Bagaimana nantinya metode Naive Bayesian ini dapat diterapkan pada Sistem klasifikasi reporting berita pada pemerintahan?
2. Bagaimana merancang Sistem klasifikasi reporting berita pada pemerintahan menggunakan metode Naive Bayesian?
1.3. Tujuan Penelitian
Tujuan dilakukannya penelitian ini adalah:
1. Memberikan informasi kepada admin website portal tentang kelompok atau klasifikasi berita yang diunggah oleh dinas, sebagai alat bantu mempercepat penilaian kinerja SKPD dalam memberikan informasi publik melalui website subdomain.
2. Mengetahui kinerja dari Naive Bayes dalam melakukan klasifikasi berita.
1.4. Batasan Masalah
Adapun batasan masalah dari penelitian ini adalah:
1. Data yang digunakan dalam penelitian ini adalah berita-berita yang diunggah pada 42 situs SKPD di Bali.
2. Berita-berita yang ada di atur berdasarkan enam kelas yang telah
ditentukan.
3. Database yang digunakan dalam penelitian ini adalah database milik SKPD Bali
1.5. Manfaat Penelitian
Adapun manfaat dari Sistem klasifikasi berita pada pemerintahan menggunakan metode Naive Bayes adalah
1. Dapat meningkatkan pelayanan pemerintahan bagi masyarakat.
2. Dapat mengetahui SKPD mana yang memiliki tingkat keaktifan yang tinggi dan seberapa penting berita yang diunggah.
1.6. Metodelogi Penelitian
Pada metodologi penelitian ini akan mejelaskan mengenai apa saja langkah- langkah yang akan dilakukan dalam pembuatan Sistem Klasifikasi Reporting Berita Pada Pemerintahan.
1.6.1. Desain Penelitian
Desain dari penelitian ini menggunakan judul “Sistem Klasifikasi Reporting Berita Pada Pemerintahan” yang dimana penelitian ini mengambil situs resmi dari SKPD Bali. Pembangunan sistem ini akan dilakukan pada sistem yang sudah ada sebelumnya dengan menggunakan basis web. Data yang digunakan adalah data-data dari sistem SKPD itu sendiri. Terdapat enam kelas yang akan digunakan nantinya seperti: layanan publik, peraturan dan perundang-undangan, kegiatan, anggaran dinas, informasi umum, dan tata cara / SOP. Data-data tersebut kemudian akan diberikan label agar dapat disesuaikan dengan kelas yang ada agar dapat dilakukannya reporting. Dilakukan pula pengamatan dari hasil klasifikasi yang dilakukan, apakah hasil yang diberikan sudah sesuai dengan yang diharapakan. Yang dilakukan pada tahapan ini:
a. Mengumpulkan data-data pada situs-situs resmi SKPD di Bali.
b. Menganalisis kebutuhan Sistem klasifikasi reporting berita, baik dari segi functional, non-functional maupun kebutuhan yang lainnya.
c. Menentukan hasil output dari Sistem klasifikasi reporting berita
tersebut kedalam kelas-kelas yang sudah ditentukan sebelumnya.
Untuk gambaran dari sistem yang akan dibuat bisa dilihat dari flowchart berikut ini:
Mulai
Input berita
Case folding, tokenizing, stopwords, filtering, stemming
Hitung klasifikasi berita
selesai Hitung jumlah
probabilitas
Bandingkan hasil dengan setiap
kategori
Tambahkan Kategori Tentukan Kategori
Berita
Lihat Grafik
Y
Input SKPD dan Kategori
Tampilkan Grafik Y
T
T
Gambar 1. 1 Flowchart Sistem KlasifikasiReproting Berita
1.6.2. Pengumpulan Data
Dalam penelitian ini, data diperoleh dari situs SKPD bali dengan mengakses situs tersebut. Terdapat sekitar 42 SKDP di Bali yang nantinya akan diambil beritanya. Dalam setiap SKPD ini terdapat beberapa konten seperti pengumuman, berita utama, berita lain dan informasi. Berita-berita ini lah yang nantinya akan diklasifikasikan kedalam enam kelas yang telah ditentukan sebelumnya, enam kelas tersebut yaitu:
a. Layanan Publik b. Produk Hukum
c. Kegiatan Pemerintahan
d. Anggaran Dinas e. Informasi Umum f. Tata Cara / SOP
Kemudian berita-berita yang telah dikumpulkan tersebut akan dibagi menjadi dua, yaitu berita-berita untuk data training dan berita-berita untuk data uji.
1.6.3. Pengolahan Data Awal
Proses selanjutnya yang dilakukan setalah mendapatkan data yang terkait dengan penelitan adalah pengolahan data awal. Pengolahan data awal ini ditujukan untuk dapat mempersiapkan pada proses klasifikasi nantinya. Beberapa tahapan awal yang dilakukan dalam sistem:
1. Pembagian Data
Pada tahap pembagian data ini, data yang telah diperoleh sebelumnya akan dibagi menjadi dua kelompok data yaitu kelompok data untuk data training dan kelompok data untuk data set. Pada data training dan data set ini nantinya akan diberikan label yang sesuai dengan enam kelas yang sudah disebutkan sebelumnya.
2. Case Folding dan Tokenizing
Pada tahapan ini berita yang telah terkumpul setelah dibagi dan diberikan label sesuai kelanya, maka langkah selanjutnya adalah berita tersebut secara keseluruhan akan dirubah kedalam huruf kecil, dibuang tanda baca yang terdapat pada berita tersebut dan kemudian dipotong perkata pada setiap penyusunan kalimat pada berita tersebut.
3. Stop-word
Pada tahapan ini kata-kata yang sering kali hadir di dalam dokumen yang tergolong tidak berhubungan dengan subyek utama dari database akan dihilangkan atau dihapus, seperti misalnya “itu”, “ke”, “yang”, “dan”,
“atau” dan yang lainnya.
4. Stemming
Tahapan ini adalah tahapan terakhir dalam pengolahan data awal, yang
dimana pada tahapan ini kata-kata yang sudah dipisah, dihilangkan tanda
bacanya, dan kemudian dihapus kata-kata yang tidak berhubungan dengan
subyek utama tersebut akan dihilangkan semua imbuhannya, baik yang
terdiri dari awalan (prefix), akhiran (surfix), sisipan (infix), bentuk perulangan dan kombinasi antara awalan dan akhiran (confix).
1.6.4. Metode yang Digunakan
Sistem klasifikasi reporting berita ini menggunakan metode Naive Bayes untuk dapat mengetahui suatu berita tersebut termasuk kedalam kelas-kelas yang ada. Selain itu juga digunakan text mining dalam menentukan inti dari judul berita tersebut sehingga memudahkan kerja metode Naive Bayes dalam menetukan dan memberikan label kelas yang sesuai. Penggunaan Naive Bayes ini desuaikan dengan persamaan bayes dimana seperti pada persamaan (4) dengan asumsi bahwa tidak adanya hubungan antara satu kata dengan kata yang lainnya. Namun, tidak semua kata dapat diasumsikan bahwa antara satu kata dengan kata lainnya tidak memiliki hubungan karena kata-kata yang bersifat individual tergolong jarang. Untuk dapat mengatasi hal tersebut dilakukanlah proses training sehingga nantinya kita dapat mengestimasikan probabilitas suatu kalimat berita itu termasuk kelas yang mana serta dapat menghitung seberapa sering data tersebut muncul. Sehingga untuk dapat menyelesaikan permasalahan tersebut dapat digunakan persamaan :
P(berita) =
𝑗𝑢𝑚𝑙𝑎 ℎ 𝑡𝑖𝑎𝑝 𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖 𝑘𝑒𝑙𝑎𝑠𝑗𝑢𝑚𝑙𝑎 ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑔𝑢𝑛𝑎𝑘𝑎𝑛
... (1) atau
P(berita|kata)=
𝑗𝑢𝑚𝑙𝑎 ℎ 𝑘𝑒𝑚𝑢𝑛𝑐𝑢𝑙𝑎𝑛 𝑘𝑎𝑡𝑎 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑎𝑠 +1𝑗𝑢𝑚𝑙𝑎 ℎ 𝑠𝑒𝑚𝑢𝑎 𝑘𝑎𝑡𝑎 𝑑𝑎𝑙𝑎𝑚 𝑘𝑒𝑙𝑎𝑠 +𝑗𝑢𝑚𝑙𝑎 ℎ 𝑠𝑒𝑚𝑢𝑎 𝑘𝑎𝑡𝑎