• Tidak ada hasil yang ditemukan

Universitas Dian Nuswantoro; Jl. Imam Bonjol 207 & Jl. Nakula I 5-11 Semarang Telp (024) /Fax. (024)

N/A
N/A
Protected

Academic year: 2021

Membagikan "Universitas Dian Nuswantoro; Jl. Imam Bonjol 207 & Jl. Nakula I 5-11 Semarang Telp (024) /Fax. (024)"

Copied!
8
0
0

Teks penuh

(1)

Kategorisasi Laporan Masyarakat Kota Semarang

Menggunakan Metode Naïve Bayes Classifier

Categorization of community reports in semarang city using naive bayes classifier

method

Basirudin Ansor1,Ajib Susanto2

1,2Universitas Dian Nuswantoro; Jl. Imam Bonjol 207 & Jl. Nakula I 5-11 Semarang Telp (024)3512761/Fax. (024)3569684

3Jurusan Teknik Informatika, Fakultas Ilmu Komputer Universitas Dian Nuswantoro, Semarang e-mail: 1111201307713@mhs.dinus.ac.id, 2ajibsusanto@gmail.com

Abstrak

Komunikasi meruapakan hal sangat dibutuhkan oleh berbagai lapisan masyarakat agar komunikasi dapat tersampaikan dengan cepat. Dengan adanya komunikasi digital masyarakat mampu memberikan keluhan serta memberikan aspirasi kepada pemerintah dengan cara melaporkan permasalahannya ke pihak pemerintahan hanya dengan melalui SMS(short message service), media sosial(twitter,facebook, dan instagram), ataupun melalui website pemerintahan. Di kota Semarang masyarakat mampu melaporkan masalahnya dengan menggunakan hal tersebut. Dalam mengkategorikan laporan, pemerintah kota Semarang bagian pelaporan harus mengkategorisasikan manual dengan cara membaca serta memahami isi dari laporan yang dilakukan itu merupakan laporan Aspirasi, Permintaan Informasi atau Pengaduan. Maka dari itu perlu dirancang sebuah sistem untuk mengkategorisasikan laporan secara otomatis. Dalam mengkategorisasikan dokumen uji dapat digunakan metode Naïve Bayes Classifieri. Dengan metode Naïve Bayes untuk menentukan kategori Permintaan Informasi, Aspirasi, dan Pengaduan, digunakan data sebanyak 300 dokumen pelatihan yang masing masing kategori adalah 100 dokumen pelatihan serta 35 data uji, metode Baïve Bayes mampu mengklasifikasikan dokumen dengan akurasi 71,45% masih dapat dikatakan tingkat akurasi yang cukup tinggi.

Kata kunci—kategorisasi, klasifikasi teks, naïve bayes classifier, text mining Abstract

Communication is very needed by various layers of society for communication can be delivered quickly. With the digital communication, the community is able to give complaints and give aspiration to the government by reporting the problems to the government only through SMS (short message service), social media (twitter, facebook, and instagram), or through the government website. In the city of Semarang people are able to report the problem by using it. In categorizing the report, the city government of Semarang's reporting section should categorize the manual by reading and understanding the contents of the report that it is a report of Aspiration, Request for Information or Complaint. Therefore it is necessary to design a system to categorize reports automatically. In categorizing the test documents can be used method Naïve Bayes Classifier. With the Naïve Bayes method of determining the Information Demand, Aspiration, and Complaint category, 300 documentation of each category is 100 training documents and 35 test data, Baïve Bayes method is able to classify documents with an accuracy of 71.45% that can be said the level of accuracy is quite high.

(2)

1. PENDAHULUAN

ada saat ini komunikasi menggunakan sesuatu yang digital sangat dibutuhkan oleh berbagai lapisan masyarakat agar komunikasi dapat tersampaikan dengan cepat. Arus informasi yang sangat cepat, bahkan hampir sampai tidak terkontrol ini dapat disebut salah satu dampak positif, karena mampu memberikan informasi mengenai suatu kejadian secara cepat, meskipun terkadang tidak akurat dan tidak tepat[1].

Dengan adanya komunikasi digital masyarakat mampu melaporkan permasalahan kepada pihak pemerintah dengan mudah. Masyarakat dapat melapor dengan menggunakan pesan singkat melalui sms(short message service), melalui web pemerintahan maupun melalui media sosial seperti twitter, facebook, instagram dan lain-lain[2].

Di Kota Semarang terdapat beberapa cara untuk melakukan pelaporan,yaitu dengan sistem LAPOR!. LAPOR! merupakan singkatan dari Layanan Aspirasi dan Pengaduan Online Rakyat yang merupakan layanan aspirasi serta pengaduan masyarakat menggunakan media sosial di Indonesia, dengan cara yang mudah, terpadu dan tuntas dalam mengawasi program-program pembangunan dan layanan publik[2]. Cara melakukan LAPOR! sangatlah mudah hanya dengan SMS ke nomor 1708 dengan format Lapor Hendy (spasi) Aduan masyarakat dapat melaporkan segala permohanan informasi, keluhan dan pelaporan. Setelah itu SMS tersebut akan diverifikasi maksimal tiga hari kerja oleh admin dan lima hari kerja oleh SKPD terkait/ Pemerintah pusat/Pemerintah daerah. Kemudian akan dapat jawaban maksimal dua hari kerja.

Dengan peningkatan jumlah laporan tentang pelayanan publik yang masuk ke pihak pemerintahan[3] membuat pegawai pemerintahan harus cermat serta cepat dalam mengkategorikan suatu laporan yang dilakukan oleh masyarakat. Menurut Ibu Istikomah, pada tahun 2016 Pemerintah Kota Semarang mampu menerima rata-rata 1500 laporan yang dilakukan oleh masyarakat dan rata-rata per hari mampu menerima laporan sebanyak 50 laporan yang dilakukan oleh masyarakat dengan jenis-jenis laporan yang berbeda-beda dan berbagai macam kategorinya. Pemerintah Kota Semarang merupakan salah satu bagian dari pemerintahan yang melakukan tindak lanjut untuk pelaporan yang dilakukan oleh masyarakat di kota semarang. Tidak hanya warga kota semarang yang melaporkan masalahnya, terkadang masyarakat kabupaten semarang atau diluar kota semarang sering melaporkan masalahnya ke pihak Pemerintah Kota Semarang, hal tersebut membuat pegawai pemerintahan semakin banyak menerima laporan.

Karena semakin banyak laporan yang diterima[3], maka akan semakin lama dalam mengkategorikan laporan yang dilakukan sehingga laporan yang dilakukan masyarakat akan lebih lama pula untuk diselesaikan oleh bidangnya. Dalam mengkategorikan laporan pegawai di bagian pelaporan atau harus membaca serta memahami isi dari laporan yang dilakukan itu merupakan laporan Permintaan Informasi, Aspirasi atau Pengaduan.

Kategorisasi atau klasifikasi teks dokumen menjadi suatu yang paling tepat untuk menyelesaikan permasalahan tersebut, yaitu dengan melakukan sistem temu kembali atau Information Retrieval. Information Retrieval untuk mengklasifikasi dokumen mempunyai beberapa metode, salah satunya adalah Naïve Bayes Classification. Naïve Bayes merupakan metode klasifikasi yang sederhana mampu mengklasifikasi teks dengan berbagai kategori, sebagai contoh Naïve Bayes mampu melakukan klasifikasi postingan twitter untuk kemacetan lalulintas kota bandung dengan menggunakan dokumen sampel sebanyak 100, Naïve Bayes mampu memberikan akurasi sebesar 78% serta memperoleh akurasi 91,60% dengan dokumen uji sebanyak 13106 [4]. Hal ini membuktikan Naïve Bayes mampu memberikan akurasi yang sangat tinggi hanya dengan dokumen yang tidak terlalu banyak. Pada penelitian yang dilakukan oleh Hamzah pada tahun 2012 Naïve Bayes mampu mengklasifikasi dokumen akademik dengan akurasi maksimal sampai 82% dengan 450 dokumen sampel yang digunakan[5].

Berdasarkan uraian diatas penulis mempunyai keinginan untuk melakukan penelitian dengan merancang dan membangun aplikasi kategorisasi laporan masyarakat berdasarkan data

(3)

pengaduan masyarakat lebih mudah dalam mengkategorisasi laporan yang dilakukan oleh masyarakat di kota semarang sehingga mempercepat dalam penanganan dari laporan tersebut. Jika dalam suatu laporan membutuhkan tiga hari kerja oleh admin untuk proses verifikasi diharapkan dengan penelitian ini proses verifikasi admin akan lebih cepat sehingga penanganan pelaporan mampu dijawab dengan lebih cepat juga.

2. METODE PENELITIAN 2.1 Prosedur Pengumpulan Data

2.1.1 Wawancara

Untuk mengetahui kendala dan berbagai data yang dibutuhkan pada proses penelitian, peneliti melakukan wawancara langsung terhadap Ibu Istikomah selaku Kepala Bidang Pengaduan Masyarakat Pemerintah Kota Semarang Hal ini sangat diperlukan untuk mengetahui bagaimana dan seperti apa data yang merupakan kategori laporan aspirasi, pengaduan atau permintaan informasi.

2.1.2 Permohonan Data Laporan

Data laporan diperoleh dari pihak pengaduan pemerintah kota semarang berupa data kasar yang akan digunakan sebagai data training dan data uji merupakan hasil laporan dari masyarakat ke pemerintah melalui Short Message Service SMS dengan format laporhendi(spasi)aduan_anda kirim ke 1708, melalui website www. semarangkota.go.id di layanan pengaduan, melalui twitter dengan hashtag #Laporhendi dan mention ke @pemkotSMG ataupun pengaduan langsung melalui pihak pengaduan di Pusat Informasi Publik(PIP) Semarang.

2.1.3 Pencarian Dengan Hashtag Laporhendi

Dikarenakan data training yang belum memenuhi kebutuhan sebagai data training dikarenakan data yang diberikan dari permohonan hanya 18 sebanyak 30 data, merupakan data yang belum memenuhi seluruh konteks pelaporan sehingga dikhawatirkan akurasi yang dicapai terlalu sedikit dan melenceng jauh dari kategori yang seharusnya ditetapkan. Maka dari itu pengumpulan metode dengan hashtag laporhendi sangatlah dibutuhkan agar data pelatihan yang digunakan mampu mencukup seluruh permasalahan dan mampu mengkategorikan dengan akurasi yang lebih baik.

2.2 Teknink Analisis Data

Setelah mendapatkan data laporan dari pihak pengaduan, maka dilakukan tahap analisis data yang dilakukan sebagai berikut :

1. Data Latih/Training.

Data yang digunakan sebagai data latih dalam penelitian ini dibagi menjadi tiga kategori yaitu kategori Aspirasi sebanyak 100 dokumen, Pengaduan sebanyak 100 dokumen dan Permintaan Informasi 100 dokumen sehingga total dokumen yang digunakan sebagai data latih adalah 100 dokumen. Data latih ini digunakan sebagai acuan dalam menentukan pola kategori dari data yang nantinya diujikan. Data latih dipilih dengan pelabelan secara manual dikarenakan data yang digunakan merupakan data yang tidak terlalu banyak. Tidak perlu menggunakan teknik Cluster, namun pelabelan ini dilakukan oleh pihak Pengaduan Pemerintah Kota Semarang sehingga data latih dengan label/kategori tersebut dapat dipertanggungjawabkan kebenarannya.

(4)

Berikut merupakan beberapa contoh data latih yang telah dilabeli secara manual: Tabel 1. Contoh Laporan Masyarakat

No Isi Kelas

1 Saya ingin menanyakan bagaimana caranya naik bus Trans Semarang dari pasar bulu menuju terminal penggaron ? Terimakasih

Permintaan Informasi 2 Lapor Hendi. Tolong bis Trans Semarang

yang baru dirawat dan dijaga lebih baik dari yang sebelumnya.

Aspirasi

3 Pak Hendi , armada Trans Semarang yg baru

kok sudah berasap hitam..mengganggu pengguna dibelakangnya.Pripun Niki?

Pengaduan

2. Data Uji

Berikut adalah dokumen contoh yang digunakan untuk data uji : Tabel 2. Contoh Data Uji

No Laporan

1 Siang pak Hendi mohon ias diberikan jadwal pelayanan di kelurahan karena saya datang di kelurahan yang ada baru petugas bersih bersih

2 Assalamualaikum wb pak hendi mohon trotoar di sepanjang jalan ngaliyan berubah fungsi pejalan kaki tidak dapat tempat jalan mohon dibantu para pejalan kaki terima kasih

2.3 Proses Tahap Implementasi Metode Naïve Bayes 2.3.1 Proses Pelatihan Data

Gambar 1.Proses Pelatihan Data

1. Pelabelan untuk data training yang telah ditentukan, input data tersebut kedalam database berdasarkan kategori Permintaan Informasi, Aspriasi dan Pengaduan 2. Lakukan tahap Preprosesing yaitu dengan melakukan tahap tokenisasi,

stopword removal, dan stemming.

3. Dari hasil hasil preprosesing, hitung jumlah kemunculan setiap kata pada masing-masing dokumen.

(5)

4. Lakukan perhitungan probabilitas tiap-tiap kategori dengan rumus tiap-tiap kategori dibagi dengan jumlah kategori keseluruhan.

5. Perhitungan probabilitas setiap term terhadap tiap-tiap kategori. 6. Proses Pelatihan Selesai

2.3.2 Proses Pengujian Data

Gambar 2. Proses Pengujian Data

proses pengujian sebagai berikut :

1. Masukkan dokumen uji yang telah disediakan 2. Lakukan tahap preprocessing.

3. Menghitung nilai probabilitas masing masing term terhadap tiap tiap dokumen latih yang sudah diinputkan sebelumnya, serta probabilitas masing masing kategori.

4. Dari hasil yang didapat maka lakukan pencarian nilai probabilitas tertinggi antara aspirasi, pengaduan atau permintaan informasi.

5. Didapatkan output hasil kategorisasi dokumen 6. Proses pengujian selesai.

(6)

3. HASIL DAN PEMBAHASAN 3.1 Hasil Penelitian

Dalam penelitian ini, program yang dihasilkan berupa aplikasi yang berbasis website. Mulai dari input data training, pemrosesan data berupa pada tahap preprocessing serta perhitungan probailitas, serta sampai ke pengujian data untuk menentukan kategori dari suatu laporan. Berikut ini adalah langkah langkah proses untuk menggunakan aplikasi :

1. Input Data Latih

Gambar 4. Input data latih

Langkah langkah untuk menginputkan data latih adalah seperti berikut : a. Pilih data training dibagian sidemenu program.

b. Klik Tombol tambah informasi/tambah aspirasi/tambah pengaduan sesuai dengan kategori data training yang ingin diinputkan.

c. Inputkan data training yang sudah diketahui labelnya. d. Klik tambah maka data tersebut akan tersimpa di database.

2. Pengujian data

Gambar 5. Pengujian Data Pengujian data dapat dilakukan seperti dibawah ini :

a. Pada halaman utama terdapat form yang digunakan untuk melakukan

pengujian.

b. Inputkakn data uji yang ingin dilakukan uji seperti pada nomor1

c. Klik tombol kategorikan, sistem akan melakukan perhitungan probabilitas kata

yang ada di data uji tersebut berdasarkan data training yang sudah diinputkan sebelumnya.

d. Setelah itu sistem akan menampilkan hasil dari probabilitas tertinggi dan menampilkan output label yang mempunyai probabilitas tertinggi.

e. Simpan kategori seperti yang ditunjuk di nomor 3 itu akan melakukan

penyimpanan ke data lapor yang telah dilakukan berdasarkan kategori yang telah didapatkan.

(7)

3.2 Pembahasan

Berdasarkan hasil yang telah didapat pada tabel hasil pengujian menggunakan 35, dapat dihasilkan akurasi sebagai berikut :

Tabel 5.3 Perhitungan Confussion Matrix Aktual Permintaan Informasi Aktual Aspirasi Aktual pengaduan

Prediksi Permintaan Informasi 7 1 1

Prediksi Aspirasi 3 5 4

Prediksi Pengaduan 1 1 13

Dari hasil perhitungan yang didapatkan dengan menggunakan data uji sebanyak 35 yang masing masing data uji dengan nilai aktual sebanyak 11 data permintaan informasi 7 data aspirasi dan 18 data pengaduan didapatkan nilai akurasi sebagai berikut :

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 =

7+5+13

35

x

100% = 71,45%

4. KESIMPULAN

Berdasarkan hasil pengujian yang telah dilakukan. Sistem kategorisasi laporan masyarakat Kota Semarang dengan menggunakan metode Naïve Bayes dapat disimpulkan sebagai berikut :

1. Metode Naïve Bayes Classifier dapat diterapkan untuk mengkategorisasikan laporan yang dilakukan masyarakat Kota Semarang.

2. Dengan menggunakan data latih sebanyak 300 data yang masing masing kategori adalah 100 data dan 35 data uji yang digunakan, dapat di hasilkan akurasi sebesar 71,45% dengan menggunakan teknik pengujian confussion matrix

3. Sistem masih menginputkan kategori berdasarkan orang yang melakukan input, masih bersifat subjektif berdasarkan orang yang melakukan input data.

4. Sistem masih dapat mengkategorisasikan laporan yang tidak valid, yang seharusnya tanpa perlu lagi diproses.

5. SARAN

Berdasarkan hasil penelitian yang telah dilakukan dengan adanya sistem kategorisasi laporan masyarakat di kota semarang terdapat saran sebagai berikut :

1. Dibuatkan kategorisasi untuk laporan masyarakat Kota Semarang menggunakan metode klasifikasi lain

2. Dibuatkan kamus untuk stemming kata-kata singkatan yang umum dikalangan masyarakat, kata kata bahasa jawa, kata kata non formal agar akurasi yang diperoleh kemungkinan akan lebih tinggi.

3. Sistem untuk verifikasi laporan valid atau laporan yang tidak valid, agar sitem kategorisasi laporan mampu mengkategorikan laporan yang benar serta laporan yang valid.

UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada semua pihak, baik instansi pemerintahan, orang tua, keluarga, para dosen, dan teman-teman yang telah memberi dukungan financial terhadap penelitian ini.

(8)

DAFTAR PUSTAKA

[1] S. K. Dini, “Dampak Positif dan Negatif Penggunaan Teknologi Informasi dan Komunikasi,” Dosen IT, 2015. [Online]. Available: http://dosenit.com/kuliah- it/teknologi-informasi/dampak-positif-dan-negatif-penggunaan-teknologi-informasi-dan-komunikasi. [Accessed: 04-May-2017].

[2] Tribun Jateng, “Ada Keluhan dan Kritik untuk Kota Semarang, Silakan SMS ke 1708, Begini Caranya,” Tribun Jateng, 2016. [Online]. Available: http://jateng.tribunnews.com/2016/05/03/ada-keluhan-dan-kritik-untuk-kota-semarang-silakan-sms-ke-1708-begini-caranya. [Accessed: 05-Apr-2017].

[3] L. M. PUTRA, “Ombudsman: Keluhan Masyarakat Terhadap Pelayanan Publik Semakin

Meningkat,” Kompas, 2017. [Online]. Available:

http://nasional.kompas.com/read/2017/03/14/00574011/ombudsman.keluhan.masyarakat .terhadap.pelayanan.publik.semakin.meningkat. [Accessed: 12-May-2017].

[4] S. Rodiyansyah and E. Winarko, “Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification,” IJCCS-Indonesian J. …, vol. 7, no. 1, pp. 13–22, 2013.

[5] A. Hamzah, “Klasifikasi teks dengan naïve bayes classifier (nbc) untuk pengelompokan teks berita dan abstract akademis,” in Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) Periode III, 2012, no. 2011, pp. 269–277.

Gambar

Gambar 1.Proses Pelatihan Data
Gambar 2. Proses Pengujian Data
Gambar 5. Pengujian Data  Pengujian data dapat dilakukan seperti dibawah ini :
Tabel 5.3 Perhitungan Confussion Matrix     Aktual Permintaan Informasi  Aktual  Aspirasi  Aktual  pengaduan

Referensi

Dokumen terkait

Kegiatan observasi dilakukan untuk membantu dalam menemukan program yang akan dilaksanakan selama PPL dan memberikan gambaran penyusunan segala sesuatu yang dibutuhkan

Salah satu indikator keberhasilan keluarga muslim dalam mendidik anak adalah jika karakter yang dimiliki oleh anak sesuai dengan nila-nilai Islam. Metode pendidikan

Guru terlihat memahami strategi pengembangan nilai-nilai agama dan moral hanya sebatas pada kegiatan ritinitas pembiasaan dan bahkan ada yang menyebutkan kegiatan khusus

“Lost Opportunity” atau “kesempatan yang hilang”, terkait dengan penurunan pangsa pasar pada produk- produk yang dinamis, adalah posisi yang paling tidak diinginkan..

Lima senyawa yang berhasil diidentifikasi dalam tanaman genus ini yaitu apigenin 7-glucoside, hispidulin, scutellarein-7-O-beta-D-glucuronate, acteoside dan

SIBBioPeS::Pengguna pengguna login_as_Pengguna notifikasi_login Lokasi_industri pilihan_lokasi_industri lokasi_terpilih PembiayaanSyariah Nisbah_pembiayaan

Hasil penelitian ini dapat digunakan sebagai bahan masukan kepada pemangku kebijakan program (Pemerintah Daerah dan Dinas Kesehatan Kabupaten) untuk mengevaluasi program yang

23 Halaman Admin (kebutuhan) Pemrosesan Komplain Kerusakan Barang Tidak Bergaransi & Kebutuhan Perbaikan ... 24 Halaman Admin Proses Pembuatan Surat Penawaran Harga Untuk