• Tidak ada hasil yang ditemukan

Klasifikasi Data Penduduk Untuk Menerima Bantuan Pangan Non Tunai Menggunakan Algoritma Naïve Bayes

N/A
N/A
Protected

Academic year: 2024

Membagikan "Klasifikasi Data Penduduk Untuk Menerima Bantuan Pangan Non Tunai Menggunakan Algoritma Naïve Bayes"

Copied!
9
0
0

Teks penuh

(1)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom

Klasifikasi Data Penduduk Untuk Menerima Bantuan Pangan Non Tunai Menggunakan Algoritma Naïve Bayes

Nurahman1,*, Muhammad Mastur Alfitri2, Eddy Mashamy3

1,2 Fakultas Ilmu Komputer, Program Studi Sistem Informasi, Universitas Darwan Ali, Sampit, Indonesia

3 Dinas Pemberdayaan Masyarakat dan Desa Kabupaten Kotawaringin Timur, Indonesia Email: 1*[email protected], 2,[email protected], 3[email protected]

Email Penulis Korespondensi: [email protected] Submitted 12-08-2022; Accepted 24-08-2022; Published 30-08-2022

Abstrak

Penduduk Indonesia mencapai 273.879.750 jiwa, serta diketahui bahwa setiap tahun semakin bertambah sehingga mulai terjadinya perpindahan penduduk dari pulau ke pulau. Perpindahan penduduk dilakukan setiap orang dengan tujuan mendapatkan pekerjaan demi pemenuhan kebutuhan hidup. Tetapi, tidak semua dapat terpenuhi bahkan masih terdapat penduduk yang masuk dalam kategori miskin, salah satunya adalah sebagian penduduk di desa bapinang hulu. Pada desa bapinang hulu terdapat Bantuan Pangan Non Tunai yang digunakan untuk membantu penduduk miskin. Program Pemberian Bantuan Pangan Non Tunai kepada penduduk miskin sudah selayaknya harus dilakukan dengan tepat sasaran. Untuk mengatasi hal tersebut sehingga perlu dilakukan analisis terhadap data penduduk. Analisis yang dilakukan menggunakan Algoritma naïve bayes dengan membagi dataset menjadi data training dan data testing. Pengujian data sebanyak 9 kali untuk mengetahui keakuratan dari hasil analisis penelitian dalam pencarian nilai Accuracy performance vector. Hasil penelitian menunjukkan nilai Accuracy performance vector mencapai 90.00%. Sehingga diketahui bahwa algoritma naïve bayes mampu melakukan analisis terdapat data penduduk untuk penentuan bantuan pangan non tunai pada desa bapinang hulu.

Kata Kunci: Bantuan Pangan Non-Tunai; Naive Bayes; Performa Vektor; Algoritma Abstract

Indonesia's population reaches 273,879,750 people, and it is known that every year it is increasing, so that population movements begin to occur from island to island. The population movement is carried out by everyone with the aim of getting a job to fulfill the necessities of life. However, not all of them can be fulfilled, even though there are still people who fall into the poor category, one of which is part of the population in the village of Bapinang Hulu. In the Bapinang Hulu village there is a Non-Cash Food Aid which is used to help the poor. The Non-Cash Food Assistance Program for the poor should be carried out with the right target. To overcome this, it is necessary to analyze population data. The analysis was carried out using the Nave Bayes Algorithm by dividing the dataset into training data and testing data. Testing the data 9 times to determine the accuracy of the results of research analysis in the search for the Accuracy performance vector value. The results showed that the accuracy performance vector value reached 90.00%. So it is known that the Naive Bayes algorithm is able to analyze population data for determining Non-Cash Food Aid in the upstream bapinang village.

Keywords: Non-Cash Food Aid; Naive Bayes; Vector Performance; Algorithm

1. PENDAHULUAN

Indonesia salah satu negara yang memiliki sebaran penduduk dibayak pulau. Pulau-pulau dihuni oleh penduduk dengan beragam kondisi. Jumlah penduduk yang menghuni setiap pulau memiliki kepadatan yang berbeda-beda pula. Mendagri telah merilis data kependudukan di Indonesia mencapai 273.879.750 jiwa [1].

Penduduk Indonesia semakin banyak, serta mulai terjadinya perpindahan penduduk yang terjadi dari pulau satu menuju pulau yang lainnya. Hal ini dilakukan oleh penduduk tentunya untuk mendapatkan kehidupan yang layak. Setiap penduduk dalam memenuhi kebutuhan hidupnya telah melakukan berbagai upaya yaitu dengan bekerja sebagai petani, wirausaha, karyawan swasta dan pekerjaan yang lain. Pekerjaan-pekerjaan yang telah dilakukan terkadang juga masih belum dapat memenuhi kebutuhan hidup penduduk. Hal tersebut dapat dilihat dilingkungan sekitar masih ada penduduk yang berada pada kategori miskin. Sebagaimana disampaikan pada penelitian [2] salah satu indikator penilaian kemiskinan adalah faktor ekonomi. Pertumbuhan ekonomi di Indonesia tidak merata [3] salah satunya adalah di Desa Bapinang Hulu.

Desa Bapinang Hulu merupakan salah satu desa dari 14 desa di kecmatan Pulau Hanaut, Kabupaten Kotawaring Timur. Desa Bapinang Hulu dikenal dengan nama kampung kenanga. Karena kondisi geografis, maka transportasi umum yang digunakan pada kecamatan Pulau Hanaut adalah darat dan air. Pada desa Bapinang Hulu masih memiliki data penduduk miskin yang perlu mendapatkan bantuan sosial untuk membantu dalam pemenuhan kebutuhan hidup. Salah satu bantuan sosial tersebut adalah bantuan pangan non tunai (BPNT) yang diberikan kepada penduduk Bapinang Hulu yang tergolong penduduk miskin.

Program pemberian bantuan pangan non tunai kepada penduduk miskin sudah selayaknya harus dilakukan dengan tepat sasaran. Pemberian bantuan yang dilakukan tepat sasaran tidak akan menimbulkan kecemburuan sosial. Namun, terkadang masih banyak terjadi pemberian bantuan dilakukan tidak tepat sasaran [4]. Pemberian bantuan perlu melakukan pengamatan dan analisis terhadap data-data penduduk yang masuk dalam kategori miskin. Dalam melakukan analisis terhadap penduduk miskin dapat menggunakan metode bidang ilmu data mining seperti yang dilakukan pada penelitian [5]. Penelitian tersebut menunjukkan bahwa berdasarkan positive class desa yang menjadi objek penelitian berada dalam kelas masyarakat miskin.

(2)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom Naive Bayes Classifier merupakan salah satu algoritma klasifikasi pada data mining yang berakar pada teorema Bayes [6]. Algoritma ini melakukan pengklasifikasian dengan menggunakan teknik probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes. Algoritma naïve bayes mampu memprediksi peluang dimasa depan berdasarkan pengalaman dimasa sebelumnya [7]. Karena kemampuannya tersebut sehingga algoritma ini dikenal sebagai Teorema Bayes. Ciri utama dari Naïve Bayes Classifier ini adalah asumsi yg sangat kuat (naif) akan independensi dari masing-masing kondisi/kejadian.

Algoritma Naive Bayes dapat digunakan untuk mengklasifikas dokumen teks, metode mechine learning berbasis probabilitas, membuat diagnosis medis secara otomatis, dan Mendeteksi atau menyaring spam. Pada algoritma Naïve Bayes juga memiliki kelebihan sebagai berikut :

a. Dapat digunakan untuk data kuantitatif maupun kualitatif b. Tidak memerlukan jumlah data yang banyak

c. Tidak perlu melakukan data training yang banyak

d. Jika ada nilai yang hilang, maka dapat diabaikan dalam perhitungan.

e. Perhitungannya cepat dan efisien f. Mudah dipahami

g. Pengklasifikasian dokumen dapat dipersonalisasi, disesuaikan dengan kebutuhan setiap orang h. Jika digunakan dalaam bahasa pemrograman, code-nya sederhana

i. Bisa digunakan untuk klasifikasi masalah biner ataupun multiclass

Penelitian mengenai implementasi algoritma naïve bayes untuk klasifikasi penerima PKH memperoleh nilai akurasi 88% [8]. Pada penelitian tersebut menunjukan bahwah algoritma naive bayes berhasil mengklasifikasi data penerima bantuan PKH dengan kategori Good Classification. Sedangkan penelitian mengenai klasifikasi penduduk miskin di kecamatan tibawa menghasilkan nilai akurasi sebesar 73% dengan kategori Good Classification [3]. Selain memiliki kemampuan mencapai nilai akurasi dengan kategori Good Classification, dari pengujian perhitungan confusion matrix, algoritma naïve bayes merupakan algoritma yang efektif untuk menentukan keluarga penerima manfaat dibandingkan Fuzzy C-Means [9]. Kemudian perbandingan algoritma naïve bayes dan K-Nearst Neighbor dinyatakan bahwa algoritma naïve bayes memiliki performance accuracy lebih tinggi dengan nilai accuracy 99.89% sedangkan K- Nearst Neighbor hanya mencapai nilai accuracy 66,46% [10].

Nilai akurasi merupakan salah satu cara dari beberapa metode untuk mengetahui tingkat performa algoritma dalam mengolah suatu data. Untuk itu, dalam penelitian sangat dibutuhkan data yang relevan dan data yang telah melalui tahapan-tahapan preprosesing untuk mempersiapkan data sebelum diproses dalam pegolahan data. Semakin tinggi nilai akurasi yang diperoleh maka akan dikategorikan bahwa algoritma telah mampu mengolah data dengan hasil yang lebih baik.

Semakin banyak data training dan testing serta kelas yang bernilai benar, maka akan semakin mempengaruhi akurasi yang dihasilkan [11]. Karena nilai akurasi terpengaruhi sehingga dapat dinyatakan semakin banyak data latih yang mirip dengan data testing maka hasil klasifikasi akan semakin bagus [12]. Dari penelitian tersebut dapat dinyatakan bahwa klasifikasi data menggunakan algoritma naïve bayes dengan memperhatikan data training dan data testing pada beberapa penelitian sebelumnya dapat mengahsilkan nilai akurasi dalam kategori Good Classification.

Berdasarkan permasalahan yang diketahui pada pengelolaan program bantuan sosial di desa Bapinang Hulu, serta referensi dari beberapa penelitian terdahulu, maka pada artikel ini membahas mengenai bagaimana melakukan analisis terhadapat data penerima bantuan pangan non tunai di desa bapinang hulu. Selain itu, penelitian ini juga membahas mengenai bagaimana performa algoritma dalam mengklasifikasi data bantuan sosial pada desa Bapinang Hulu. Klasifikasi data akan dilakukan dengan menggunakan algoritma naïve bayes. Algoritma naïve bayes dipilih sebagai Algoritma yang diterapkan dalam penelitian ini karena algoritma naïve bayes adalah salah satu algoritma klasifikasi data yang mampu menghasilkan nilai akurasi mencapai kategori Good Classification sebagaimana yang disampaikan pada penelitian terdahulu. Selain itu, naïve bayes juga memiliki kelebihan sederhana, cepat dan memiliki akurasi tinggi [13].

Penelitian ini bertujuan untuk melakukan analisis terhadapt dataset penelitian yang diperoleh dari desa bapinang hulu. Analisis data dilakukan dengan membagi data menjadi data training dan data testing. Kemudian penelitian ini juga akan mencari nilai Accuracy performance vector dengan melakukan analisis terhadap data penduduk desa Bapinang Hulu dengan label menerima bantuan atau tidak menerima bantuan pangan non tunai. Hasil Penerapan data mining juga dapat digunakan sebagai rekomendasi penetapan pemberian bantuan kepada yang berhak menerima dengan cepat dan tepat.

Artikel ini akan memberikan pembahasan secara berurutan. Tahapan yang dibahas dalam artikel ini diantaran abstrak, bagian ini akan memberikan pembahasan menyeluruh artikel secara singkat dan jelas. Pada tahapan berikutnya akan membahas mengenai pendahuluan yang berisi tentang apa saja yang melatar belakangi penelitian ini diangkat, baik dari permasalahan, penelitian terdahulu pendukung dalam penelitian, alasan dipilihnya algoritma, dan tujuan penelitian.

Kemudian pada metode penelitian akan menjelaskan tahapan tahapan yang dilakukan dalam penelitian. Hasil dan pembahasan akan menjelaskan mengenai ulasan proses mendapatkan hasil penelitian. bagian terakhir dari artikel ini adalah kesimpulan yang berisi tentang inti dari bagimana penelitian ini memdapatkan hasil penelitian yang dilakukan.

(3)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom

2. METODOLOGI PENELITIAN

Penelitian ini melakukan tahapan tahapan penelitian untuk memperoleh suatu pengetahuan baru dari data yang dipilih dalam penelitian atau biasa disebut dengan Knowledge Discovery. Adapun tahapan tahapan yang dilakukan dalam penelitian ini di sajikan pada gambar 1. beberapa tahapan yang dilakukan pada penelitian ini adalah identifikasi masalah, literatur review, rumusan masalah, pengumpulan data, preprocessing data, pengolahan dan analisis data kemudian akhir dari penelitian ini adalah menyiapkan hasil dan menyususn lapporan.

Gambar 1. Tahapan Penelitian

Pada gambar 1 menunjukkan tahapan tahapan penelitian mulai dari identifikasi masalah hingga hasil dan penyusunan laporan. Tahapan penelitian disusun secara sistematis dan terarah agar hasil penelitian dapat diperoleh sesuai dengan tujuan penelitian. Tahapan penelitian ini dilakukan sebagaimana penjelasan berikut ini.

a. Identifikasi Masalah

Identifikasi masalah yang dilakukan dalam penelitian ini yaitu dengan melakukan studi lapangan memahami kondisi wilayah wilayah yang dapat dijadikan sebagai topik permasalahan. Dalam kasus penelitian ini yaitu dengan memilih topik mengenai klasifikasi data penduduk untuk menentukan penerima bantuan pangan non tunai pada suatu wilayah yaitu desa Bapinang Hulu.

b. Literatur Review

Literatur Review yang dilakukan dalam penelitian ini yaitu dengan membaca berbagai referensi baik buku dan paper terkait penelitian terdahulu. Tahapan ini dilakukan untuk dapat memili Algoritma yang tepat sesuai dengan kebutuhan data penelitian.

c. Rumusan Masalah

Tahapan rumusan ini dilakukan setelah mengidentifikasi masalah dan literatur review. Hal ini dilakukan demikian agar merumuskan suatu masalah dapat kami tentukan dengan memahami kondisi lapangan dan teori maupun argumen ilmiah yag dapat menguatkan hasil penelitian nantinya.

d. Pengumpulan Data

Pengumpulan data dilakukan dengan observasi, wawancara, dan telaah dokumen-dokumen terkait data penduduk serta penerima bantuan pagan non tunai.

e. Preprocessing Data

Preprocessing data dilakukan untuk menyiapkan data penelitian menjadi data yang relevan sesuai kebutuhan penelitian.

f. Pengolahan dan Analisis Data

Pengolahan data dilakukan dengan menerapkan algoritma klasifikasi yaitu algoritma naive bayes. Hasil pengolahan data kemudian akan di uji dengan melihat tingkat akurasi. Selanjutnya Hasil pengolahan dan pengujian data akan dianalisis sesuai dengan kebutuhan penelitian.

g. Hasil dan Penyusunan Laporan

Hasil dan Penyusunan laporan dilakukan untuk menyajikan informasi dari hasil penelitian menjadi informasi yang mudah difahami dan dipresentasikan. Hasil penelitian juga disajikan dalam bentuk artikel ilmiah yang dipublikasi pada jurnal ilmiah.

2.1 Aloritma Naïve Bayes

Algoritma naïve bayes memiliki kemampuan untuk memprediksi peluang atau kejadian dimasa depan berdasarkan data atau pengalaman sebelumnya [14]. Kemampuan dalam memprediksi algoritma naïve bayes melakukan klasifikasi data untuk mengetahui probabilitas keanggotaan suatu class [15], [16]. Bentuk persamaan dari algoritma naïve bayes ada pada persamaan 1.

𝑃(𝐻|𝑋) =

𝑃(

𝑋

|

𝐻

).𝑃(𝐻)

𝑃(𝑋) (1)

Pada persamaan 1 dapat dijelaskan bahwa X merupakan nilai class yang belum diketahu. H merupakan hipotesis data X yang menjadi Class spesifik. Sehingga untuk dapat mengetahui nilai posteriori probabitas P(H|X) atau probabilitas hipotesis H berdasarkan kondisi X. maka terlebih dahulu perlu mengetahui nilai dari P(X|H), P(H) dan nilai P(X). Nilai P(X|H) merupakan probabilitas hipotesis X berdasarkan konndisi H. Nilai P(X|H) akan dikali dengan nilai P(H). Dimana

Identifikasi Masalah Literatur Review Rumusan Masalah Pengumpulan Data

Preprocessing Data Pengolahan dan

Analisis Data Hasil dan

Penyusunan Laporan

(4)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom dapat dijelaskan bahwa P(H) merupakan nilai prior probabilitas atau probabilitas hipotesis H. Selanjutnya hasil dari perkalian nilai P(X|H) dan nilai P(H) akan dibagi dengan nilai probabilitas X atau nilai P(X).

2.2 Akurasi

Akurasi sering disebut dengan ketepatan atau keakuratan pengukuran. Pada tahapan ini melakukan analisis berdasarkan evaluasi terhadapat hasil pengolahan data. Algoritma yang digunakan untuk mengolah data dievaluasi dengan melihat nilai akurasi atau keakuratan dalam pegolahannya. Bentuk persamaan untuk melihat nilai akurasi dapat dilakukan sebagaimana pada persamaan 2.

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 =

𝑡𝑝+𝑡𝑛

𝑡𝑝+𝑡𝑛+𝑓𝑝+𝑓𝑛

(2)

Pada persamaan 2 nilai akurasi diperoleh dari nilai true positive dijumlah dengan nilai true negative yang kemudian nilai hasil tersebut akan dibagi dengan nilai penjumlahan dari true positive, true negative, false positive, dan false negative.

3. HASIL DAN PEMBAHASAN

Pada penelitian ini dilakukan tahapan sebagaimana yang telah direncanakan di metode penelitian. Pada tahapan identifikasi dan literatur review dapat menemukan topik penelitian yaitu mengenai klasifikasi batuan sosial pada desa bapinang hulu. Berdasarkan literatur review kami menemukan bahwa Algortma naive bayes mampu menghasilkan nilai akurasi mencapai kategori Good Classification, untuk itu naïve bayes dipilih sebagai aloritma pengolah data bantuan sosial yang dilakukan dalam penelitian. Setelah melakukan rumusan maka diketahui permasalahan dan algoritma yang akan digunakan dalam penelitian, langkah selanjutnya yaitu melakukan pengumpulan data.

3.1 Dataset

Dataset merupakan sebuah komponenn penting yang diperlukan untuk tahapan data latih dan data uji pada penelitian kecerdasan buatan [17]. Pada penelitian sentimen analisis dataset yang lengkap dan akurat sangat dibutuhkan karena dataset akan sangat mempengaruhi sepenuhnya terhadap hasil penelitian [18]. Teknik data mining dapat digunakan untuk memperolah informasi baru yang tersimpan pada sebuah dataset [19]. untuk itu, kebutuhan dataset dalam sebuah penelitian penjadi hal yang penting. Dataset dapat diperoleh dengan berbagai cara. Pada penelitian ini pengumpulan dataset dilakukan dengan observasi ke desa bapinang hulu. Selanjutnya melakukan wawancara dengan pihak-pihak pengelola bantuan sosial yang ada di desa bapinang hulu. Pada tahapan wawancara juga dilakukan telaah terhadap dokumen dokumen kependudukan dan penerima bantuan sosial. Hasil dari observasi, wawancara dan telaah dokumen yang dilakukan diperoleh sampel dataset dalam penelitian ini sebanyak 102 record.

Dataset terdiri dari sekumpulan atribut-atribut dengan banyak record. Dataset dapat diperoleh dari berbagai sumber data, misalkan wawancara, observasi, telaah dokumen, database dan lain sebagainya. Pada database tidak semua data kita gunakan sebagai atribut dalam penelitian, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil [20]. Pada penelitian ini, atribut atribut yang dianggap sesuai untuk kebutuhan analisis terdiri dari 14 atribut.

Atribut pada penelitian ini dapat dilihat pada tabel 1.

Tabel 1. Atribut Dataset

No Kolom Type Data

1 Jenis Kelamin Binomonal

2 Penghasilan Integer

3 Jumlah Anak Laki-Laki Integer

4 Jumlah Anak Perempuan Integer

5 Jumlah Anggota Keluarga Yang Hamil Integer

6 RT Integer

7 Pendidikan Polynominal

8 Pekerjaan Polynominal

9 Jumlah Anak SD Integer

10 Jumlah Anak SMP Integer

11 Jumlah Anak SMA Integer

12 Jumlah Usia Dini Integer

13 Jumlah Lansia Integer

14 Penerima Bantuan Binominal (Class/Label)

Pada tabel 1 diketahui bahwa dataset memiliki 3 type data yaitu binominal, polynominal, dan Integer. Type data binominal digunakan untuk data yang memiliki dua kategori. Polynominal digunakan untuk data yang memiliki lebih dari 2 kategori pada data yang diperoleh dalam pengumpulan data. Kemudian type data integer digunakan untuk data penelitian yang bernilai bilangan bulat.

(5)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom 3.2 Preprocessing Data

Preprocessing Data merupakan suatu tahapan persiapan data sebelum dilakukan pengolahan dan analisis data penelitian.

Salah satu manfaat dari preprocessing adalah mempercepat scanning data saat data digunakan dalam penerapan algoritma [21]. Pada tahapan ini dilakukan cleaning data. Cleaning data merupakan salah satu teknik dalam Preprocessing Data yang dilakukan dengan membersihkan data dari noise dan data tidak konsisten [22]. Dari data yang berjumlah 102 record terdapat beberapa data yang dianggap tidak konsisten, sehingga dilakukan pemahaman terhadap tersebut. Pada tahapan penelitian ini kami melakukan konfirmasi kepada pihak sumber data hingga data yang kami peroleh menjadi data yang bersih dari noise dan data tidak konsisten. Hasil dari Preprocessing Data diperoleh data tetap sebanyak 102 record.

3.3 Pengolahan dan Analisis Data

Dataset penelitian ini terdiri 14 atribut, yang mana setiap atribut memiliki Attribute values. Attribute values dapat berupa nilai angka atau symbol-symbol tertentu yang dimiliki setiap atribut pada dataset. Setiap masing-masing atribut akan memiliki bentuk nilai sesuai dengan record data yang dimiliki pada sumber data. Record data pada atribut yang dibutuhkan untuk dilakukannya pengolahan dan analisis data harus dalam kondisi data konsisten sehingga dapat menghasilkan pengetahuan baru yang lebih akurat. Dataset pada tabel 2 menunjukkan adanya beberapa bentuk nilai yang dimiliki dataset.

Tabel 2. Nilai Dataset

Nama Atribut Range Nilai

Jenis Kelamin Laki-laki / Perempuan

Penghasilan Rp. 7.500 – 3.500.000

Jumlah anak Laki-laki 0 - 4

Jumlah Anak Perempuan 0 - 3

Jumlah Anggota Keluarga yang Hamil 0 -1

RT 1 - 9

Pendidikan SD – S1

Pekerjaan IRT / Honorer / Pensiun / Petani / PNS / Swasta / Tukang

Jumlah Anak SD 0 - 2

Jumlah Anak SMP 0 - 1

Jumlah Anak SMA 0 - 2

Jumlah Usia DINI 0 - 2

Jumlah Lansia 0 - 2

Penerima Bantuan 0,1 = Penerima / Tidak Penerima

Tabel 2 menunjukan setiap atribut pada dataset telah memiliki nilai. Nilai-nilai pada atribut terdiri dari nilai nominal dengan type data binominal dan polynominal. Kemudian pada tabel 2 juga terdapat nilai numerik dengan type data yang digunakan adalah integer.

3.4 Klasifikasi dengan Algoritma Naïve Bayes

Klasifikasi data penerima bantuan pangan non tunai dengan menggunakan algoritma naïve bayes dilakukan pada software rapid minner. Klasifikasi dilakukan dengan membagi data menjadi data training dan data testing. Klasifikasi data dilakukan sebanyak 9 kali. Pada tabel 3 menunjukan bahwa algoritma naïve bayes mampu mengklasifikasi data bantuan pangan non tunai di desa bapinang hulu.

Tabel 3. Hasil Klasifikasi Data

No Data Training Data Testing Jumlah Data Testing Jumlah Prediksi sama Jumlah Prediksi berbeda

1 10% 90% 92 57 35

2 20% 80% 82 68 14

3 30% 70% 71 51 20

4 40% 60% 61 41 20

5 50% 50% 51 44 7

6 60% 40% 41 34 7

7 70% 30% 31 26 5

8 80% 20% 20 16 4

9 90% 10% 10 9 1

Pada tabel 3 dapat diketahui bahwa memiliki perbedaan terhadap hasil prediksi yang dilakukan dengan membagi dataset menjadi data training dan testing. Hasil klasifikasi menggunakan algoritma naïve bayes dengan dataset berjumlah 102 record dilakukan pembagian data training 10% dan data testing 90% maka berhasil memprediksi data sebanyak 57 record benar atau sesuai dengan sumber data. Jumlah kesalahan algoritma naïve bayes dalam memprediksi sebanyak 35

(6)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom record. Hal ini menunjukkan bahwa masih banyak jumlah kesalahan algoritma naïve bayes dalam memprediksi jika hanya menggunakan data training sebanyak 10% dari 102 record data.

Pada tahapan klasifikasi kedua data training yang diberikan sebanyak 20% dan data testing 80% dari dataset berjumlah 102 record. Maka diperolah hasil kemampuan algoritma naïve bayes dalam memprediksi data sebanyak 68 record benar atau hasil sesuai dengan sumber data dan 14 record salah dalam mempredisi atau tidak sesuai sumber data.

Hasil prediksi pada tahap satu dan dua memiliki perbedaan. Diketahui bahwa tahap dua memperoleh hasil prediksi menjadi lebih baik daripada hasil prediksi tahap satu. Pada tahap satu algoritma naïve bayes hanya mampu memprediksi data dengan benar sebanyak 57 record dari data training 10% sedangkan tahap dua mampu memprediksi data sebanyak 68 record dengan data training 20%.

Algoritma naïve bayes memiliki penurunan kemampuan dalam memprediksi dataset bantuan sosial pada penelitian ini. Penurunan dalam memprediksi terlihat pada tahap klasifikasi ketiga. Pada klasifikasi ketiga kemampuan algoritma naïve bayes mampu memprediksi sebanyak 51 record dengan data training 30% dan data testing 70% dari 102 record dataset. Dilihat dari tabel 3 bahwa kemampuan algoritma naïve bayes dalam memprediksi megalami ketidak konsistenan jika menggunakan data training kurang dari atau sama dengan 50% dari dataset penelitian. Tetapi hasil dari klasifikasi pada table 3, algoritma akan mengalami peningkatan kemampuan dalam mengklasifikasi dataset jika data training yang digunakan lebih dari 50%.

Penerapan data training sebanyak 90% dapat diperoleh tingkat kesalahan dalam memprediksi sebanyak 1 record data. Hasil klasifikasi data menggunakan algoritma naïve bayes yang terdapat pada tabel 3 menunjukkan bahwa semakin banyak data training yang digunakan dalam penelitian tidak selalu mengurangi kesalahan dalam memprediksi. Hal ini ditunjukan antara data training 20% memperoleh kesalahan prediksi sebanyak 14 record sedangkan pada data training 30% dan 40% memiliki kesalahan prediksi sebanyak 20 record.

3.5 Evaluasi Performa Algoritma Naïve Bayes

Evaluasi performa dilakukan untuk melihat seberapa jauh tangkat performa algoritma dalam melakukan klasifikasi dataset penelitian. Salah satu langkah yang dapat dilakukan yaitu dengan mendapatkan nilai akurasi. Untuk memperoleh nilai akurasi perlu dilakukan pencarian nilai true positive, true negative, false positive, dan false negative. Pada penelitian ini true positive di proporsikan pada para penerima bantuan yang klasifikasikan menerima bantuan (benar menerima). True negative diproporsikan kepada penduduk yang tidak penerima bantuan diklasifikasikan tidak menerima bantuan (benar tidak menerima). False positive diproporsikan kepada penduduk yang tidak menerima bantuan diklasifikasikan menerima bantuan (salah menerima). False negative diproporsikan kepada penduduk yang menerima bantuan diklasifikasikan tidak menerima bantuan (salah tidak menerima).

Pembagian proporsi pada setiap klasifikasi dapat dibentuk menjadi sebuah confusion matrix. Confusion matrix ini digunakan sebagai pernyataan hasil klasifikasi data yang telah menghasilkan nilai uji dengan pernyataan benar dan nilai uji dengan pernyataan salah. Tabel 4 menunjukkan nilai dari confusion matrix.

Tabel 4. Confusion Matrix

Pengujian Ke true 1 true 0

1 Data Training 10%

pred. 1 21 2

pred. 0 33 36

2 Data Training 20%

pred. 1 41 7

pred. 0 7 27

3 Data Training 30%

pred. 1 37 15

pred. 0 5 14

4 Data Training 40%

pred. 1 30 14

pred. 0 6 11

5 Data Training 50%

pred. 1 28 5

pred. 0 2 16

6 Data Training 60%

pred. 1 23 6

pred. 0 1 11

7 Data Training 70%

pred. 1 18 5

pred. 0 0 8

8 Data Training 80%

pred. 1 12 4

pred. 0 0 4

9 Data Training 90%

(7)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom

pred. 1 6 1

pred. 0 0 3

Pada tabel 4 dapat diketahui bahwah evaluasi performa di uji sebanyak 9 kali. Setiap pengujian memilki proporsi data masing masing. Pada pengujian satu deketahui bahwa data yang digunakan sebagai pembelajaran sebanyak 10% dari dataset yang dimiliki dalam penelitian. Hingga pada pengujian kesembilan data pembelajaran yang digunakan adalah 90% dari dataset yang dimiliki pada penelitain.

Kemudian setelah kami menemukan nilai confusion matrix pada setiap pengujian klasifikasi data, maka dapat dilakukan perhitungan nilai akurasi. Nilai akurasi yang dihasilkan disajikan pada tabel 5. Perhitungan nilai akurasi dilakukan untuk mengetahui tingkat performa algoritma dalam melakukan klasifikasi dataset penerima bantuan pangan non tuni pada desa bapinang hulu.

Tabel 5. Nilai akurasi

Pengujian ke Data Training Data Testing 𝒕𝒑 + 𝒕𝒏

𝒕𝒑 + 𝒕𝒏 + 𝒇𝒑 + 𝒇𝒏 Akurasi

1 10% 90% 21 + 36

21 + 36 + 33 + 2

61.96%

2 20% 80% 41 + 27

41 + 27 + 7 + 7

82.93%

3 30% 70% 37 + 14

37 + 14 + 5 + 15

71.83%

4 40% 60% 30 + 11

30 + 11 + 6 + 14

67.21%

5 50% 50% 28 + 16

28 + 16 + 2 + 5

86.27%

6 60% 40% 23 + 11

23 + 11 + 1 + 6

82.93%

7 70% 30% 18 + 8

18 + 8 + 0 + 5

83.87%

8 80% 20% 12 + 4

12 + 4 + 0 + 4

80.00%

9 90% 10% 6 + 3

6 + 3 + 0 + 1

90.00%

Pada tabel 5 diketahui hasil dari confusion matrix setiap pengujian dataset memiliki nilai akurasi. Nilai akurasi terendah terdapat pada pengujian satu yaitu dengan nilai akurasi 61,96%. Pada pengujian satu menggunakan data training sebanyak 10% dan data testing sebanyak 90% dari dataset penelitian. Nilai akurasi tertinggi ditunjukkan pada pengujian kesembilan. Pada pengujian kesembilan menggunakan data training 90% dan data testing 10% sehingga menghasilkan nilai akurasi 90,00%.

Pengujian dataset menggunakan Tools rapid minner dapat menghasilkan description pervormance vector. Pada Description pervormance vector yang dihasilkan pada tools rapid minner juga menunjukan nilai akurasi dari performa algoritma yang dihasilkan dari confusion matrix. Gambar 2 menunjukkan mengenai Description pervormance vector hasil pengujian kesembilan dengan data training 90% dan testing 10% dari dataset menggunakan tools rapid minner.

Gambar 2. Pervormance Vector

Confusion matrix pada Gambar 2 memiliki 2 kolom dan 2 baris. Setiap kolom dan baris diberi atibut 0 dan 1.

Pada kolom 1 menunjukkan bahwa status penduduk (class) berada pada posisi penerima bantuan sosial. Sedangkan pada kolom 0 status penduduk (class) adalah tidak menerima bantuan pangan non tunai. Kemudian baris 1 menunjukkan hasil dari klasifikasi menerima bantuan pangan non tunai. Sedangkan baris 0 adalah hasil klasifikasi tidak menerima bantuan pangan non tunai..

(8)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom Proporsi pada gambar 2 dapat dijelaskan bahwa penduduk yang menerima bantuan pangan non tunai berjumlah 6 dengan hasil klasifikasi menerima bantuan sosial (TP). Nilai true negative dari gambar 2 adalah terdapat 3 penduduk yang tidak menerima bantuan pangan non tunai dengan hasil klasifikasinya adalah tidak menerima bantuan pangan non tunai (TN). Selanjutnya terdapat 1 penduduk yang tidak menerima bantuan dengan hasil klasifikasi adalah menerima bantuan sosial (FP). Serta di ketahui juga terdapat 0 penduduk yang menerima bantuan dengan hasil klasifikasinya adalah tidak menerima (FN).

Accuracy performance vector gambar 2 diperoleh dengan menerapkan rumus pada persamaan (2). Sehingga dapat di uraikan sebagai berikut.

Diketahui : TP = 6 TN =3 FP=1 FN=0

Pertanyaan : Accuracy performance vector?

Jawab :

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 6 + 3 6 + 3 + 1 + 0 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 0,9

Hasil perhitungan diketahui dengan menerapkan persamaan (2) nilai Accuracy performance vector adalah 0,9.

Nilai tersebut akan di rubah kedalam bentuk persentase sehingga nilai menjadi 90.00%.

4. KESIMPULAN

Sebagian penduduk desa bapinang hulu masuk dalam kreteria penerima bantuan sosial. Sehingga diperlukan pengklasifikasian data penduduk. Klasifikasi data penduduk dilakukan untuk mengetahui penduduk yang berhak menerima bantuan pangan non tunai. Klasifikasi dilakukan dengan menggunakan algoritma naive bayes. Klasifikasi data penduduk di uji dengan membagi presentase dataset menjadi data training dan data testing. Hasil penelitian menunjukkan bahwah algoritma naive bayes mampu mengklasifikasi data penduduk untuk menentukan penduduk yang berhak menerima bantuan pangan non tunai. Performa vektor accuracy mencapai 90.00% dengan menggunakan data trainning 90% dan data testing 10%. Berdasarkan hasil penelitian ini, maka algoritma naive bayes dapat dijadikan rekomendasi dalam menganalisis penerima bantuan pangan non tunai pada desa bapinang hulu.

REFERENCES

[1] Kemendagri, “273 Juta Penduduk Indonesia Terupdate Versi Kemendagri,” Direktorat Jendral kependudukan dan Pencatatan Sipil kementrian dalam negeri republik Indonesia, Feb. 21, 2022. https://dukcapil.kemendagri.go.id/berita/baca/1032/273-juta- penduduk-indonesia-terupdate-versi-kemendagri

[2] N. Nurahman and D. Tjahjo Seabtian, “Classification of Poverty Reduction Program Recipients with Neural Network Algorithm in East Kotawaringin Communities,” E-Komtek, vol. 5, no. 2, pp. 190–202, 2021, doi: 10.37339/e-komtek.v5i2.751.

[3] H. Annur, “Klasifikasi Masyarakat Miskin Menggunakan Metode Naive Bayes,” ILKOM Jurnal Ilmiah, vol. 10, no. 2, 2018, doi:

10.33096/ilkom.v10i2.303.160-165.

[4] A. Damuri, U. Riyanto, H. Rusdianto, and M. Aminudin, “Implementasi Data Mining dengan Algoritma Naïve Bayes Untuk Klasifikasi Kelayakan Penerima Bantuan Sembako,” Jurnal Riset Komputer, vol. 8, no. 6, 2021, doi:

10.30865/jurikom.v8i6.3655.

[5] W. P. Nurmayanti, “Penerapan Naive Bayes dalam Mengklasifikasikan Masyarakat Miskin di Desa Lepak,” Geodika: Jurnal Kajian Ilmu dan Pendidikan Geografi, vol. 5, no. 1, pp. 123–132, Jun. 2021, doi: 10.29408/geodika.v5i1.3430.

[6] A. Basit, “Implementasi Algoritma Naive Bayes Untuk Memprediksi Hasil Panen Padi,” Jurnal Teknik Informatika Kaputama (JTIK) 2020, vol. 4, no. 2, 2020.

[7] D. Ayuningsih and N. A. Hasibuan, “Sistem Pakar Mendiagnosa Kerusakan Pada Mesin Penggilingan Padi Menggunakan Metode Naive Bayes,” Jurnal JURIKOM (Jurnal Riset Komputer), vol. 5, no. 4, 2018.

[8] A. A. A. Arifin, W. Handoko, and Z. Efendi, “Implementasi Metode Naive Bayes Untuk Klasifikasi Penerima Program Keluarga Harapan,” J-Com (Journal of Computer), vol. 2, no. 1, 2022, doi: 10.33330/j-com.v2i1.1577.

[9] P. S. Saputra, “Perbandingan Algoritma Fuzzy C-Means dan Algoritma Naive Bayes dalam Menentukan Keluarga Penerima Manfaat (KPM) Berdasarkan Status Sosial Ekonomi (SSE) Terendah,” JST (Jurnal Sains dan Teknologi), vol. 10, no. 1, 2021, doi: 10.23887/jst-undiksha.v10i1.23340.

[10] H. Putri, A. I. Purnamasari, A. R. Dikananda, O. Nurdiawan, and S. Anwar, “Penerima Manfaat Bantuan Non Tunai Kartu Keluarga Sejahtera Menggunakan Metode NAÏVE BAYES dan KNN,” Building of Informatics, Technology and Science (BITS), vol. 3, no. 3, 2021, doi: 10.47065/bits.v3i3.1093.

[11] R. Indra Borman and M. Wati, “Penerapan Data Maining Dalam Klasifikasi Data Anggota Kopdit Sejahtera Bandarlampung Dengan Algoritma Naïve Bayes,” Jurnal Ilmiah Fakultas Ilmu Komputer, vol. 09, no. 01, pp. 25–34, 2020.

[12] P. S. M. Suryani, L. Linawati, and K. O. Saputra, “Penggunaan Metode Naïve Bayes Classifier pada Analisis Sentimen Facebook Berbahasa Indonesia,” Majalah Ilmiah Teknologi Elektro, vol. 18, no. 1, 2019, doi: 10.24843/mite.2019.v18i01.p22.

[13] E. Indrayuni, “Klasifikasi Text Mining Review Produk Kosmetik Untuk Teks Bahasa Indonesia Menggunakan Algoritma Naive Bayes,” Jurnal Khatulistiwa Informatika, vol. 7, no. 1, 2019, doi: 10.31294/jki.v7i1.1.

(9)

JURIKOM (Jurnal Riset Komputer), Vol. 9 No. 4, Agustus 2022 e-ISSN 2715-7393 (Media Online), p-ISSN 2407-389X (Media Cetak) DOI 10.30865/jurikom.v9i4.4678

Hal 1035−1043 http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom [14] I. Arfanda, W. Ramdhan, and R. A. Yusda, “Naive Bayes Dalam Menentukan Penerima Bantuan Langsung Tunai,” Digital

Transformation Technology, vol. 1, no. 1, 2021, doi: 10.47709/digitech.v1i1.1091.

[15] H. D. Wijaya and S. Dwiasnati, “Implementasi Data Mining dengan Algoritma Naïve Bayes pada Penjualan Obat,” Jurnal Informatika, vol. 7, no. 1, 2020, doi: 10.31311/ji.v7i1.6203.

[16] F. Firdaus and A. Mukhlis, “Implementasi Algoritma Naive Bayes Pada Data Set Kualitatif Prediksi Kebangkrutan,” JURIKOM (Jurnal Riset Komputer), vol. 7, no. 1, 2020, doi: 10.30865/jurikom.v7i1.1757.

[17] F. Iglesias, T. Zseby, D. Ferreira, and A. Zimek, “MDCGen: Multidimensional Dataset Generator for Clustering,” Journal of Classification, vol. 36, no. 3, 2019, doi: 10.1007/s00357-019-9312-3.

[18] K. A. Nugraha, “Pembentukan Dataset Token Sentimen Berdasarkan Akun Instagram Brand Elektronik Menggunakan K-Nearest Neighbors,” Jurnal Buana Informatika, vol. 12, no. 1, 2021, doi: 10.24002/jbi.v12i1.4472.

[19] N. Novianti, M. Zarlis, and P. Sihombing, “Penerapan Algoritma Adaboost Untuk Peningkatan Kinerja Klasifikasi Data Mining Pada Imbalance Dataset Diabetes,” Jurnal Media Informatika Budidarma, vol. 6, no. April, pp. 1200–1206, 2022, doi:

10.30865/mib.v6i2.4017.

[20] F. Marisa, “Educational Data Mining (Konsep dan Penerapan),” Jurnal Teknologi Informasi, vol. 4, no. 2, 2013.

[21] A. Riani, Y. Susianto, and N. Rahman, “Implementasi Data Mining Untuk Memprediksi Penyakit Jantung Mengunakan Metode Naive Bayes,” Journal of Innovation Information Technology and Application (JINITA), vol. 1, no. 01, 2019, doi:

10.35970/jinita.v1i01.64.

[22] H. Sulastri and A. I. Gufroni, “Penerapan Data Mining Dalam Pengelompokan Penderita Thalassaemia,” Jurnal Nasional Teknologi dan Sistem Informasi, vol. 3, no. 2, 2017, doi: 10.25077/teknosi.v3i2.2017.299-305.

Referensi

Dokumen terkait

Naïve Bayes dilakukan komparasi, hasil yang diperoleh bahwa algoritma LDA lebih baik dibandingkan dengan algoritma Naïve Bayes untuk klasifikasi citra Pap Smear..

Selanjutnya Analisis konten pada apli- kasi diajukan oleh [4], adalah penerapan algoritma Naïve Bayes dengan meng- klasifikasi beragam topik pembicaraan yang popular pada

Hasil klasifikasi pada pembagian data training : testing 60:40 pada pengujian ke-20 dengan metode Naïve Bayes divisualisasikan dalam peta digital yaitu peta

Penelitian yang dilakukan ialah menerapkan algoritma klasifikasi naïve bayes yang didahului dengan pemilihan atribut menggunakan teknik korelasi atribut untuk mendeteksi

Confusion matrix diterapkan pada 300 data testing yang sudah disiapkan, data testing tersebut dihitung dengan menggunakan algoritma naïve bayes, kemudian hasil dari semua

Tujuan dari penelitian ini untuk mengetahui bagaimana penerapan Algoritma Naïve Bayes dalam mengklasifikasi calon Penerima Bantuan Pangan Non Tunai di Desa Nanjung

Selanjutnya Analisis konten pada apli- kasi diajukan oleh [4], adalah penerapan algoritma Naïve Bayes dengan meng- klasifikasi beragam topik pembicaraan yang popular pada

Terdapat beberapa proses yang harus dilakukan yaitu pelabelan, preprocessing, pemilahan data ujicoba, ujicoba klasifikasi menggunakan Naïve Bayes dengan MAD