• Tidak ada hasil yang ditemukan

IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI KELAYAKAN EDIBILITAS PADA JAMUR SKRIPSI

N/A
N/A
Protected

Academic year: 2022

Membagikan "IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI KELAYAKAN EDIBILITAS PADA JAMUR SKRIPSI"

Copied!
14
0
0

Teks penuh

(1)

IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI

KELAYAKAN EDIBILITAS PADA JAMUR SKRIPSI

Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer (S.Kom.)

Mario Siswanto 00000012956

PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG 2020

(2)

ii

LEMBAR PENGESAHAN

IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI

KELAYAKAN EDIBILITAS PADA JAMUR

Oleh

Nama : Mario Siswanto

NIM : 00000012956

Program Studi : Informatika

Fakultas : Teknik & Informatika Tangerang, 16 April 2020

Ketua Sidang Dosen Penguji

Dr. P.M. Winarno, M.Kom. Dennis Gunawan, S.Kom., M.Sc.

Dosen Pembimbing

Marlinda Vasty Overbeek S.Kom., M.Kom.

Mengetahui,

Ketua Program Studi Informatika

Nunik Afriliana, S.Kom., MMSI

(3)

iii

PERNYATAAN TIDAK MELAKUKAN PLAGIAT

Dengan ini saya:

Nama : Mario Siswanto

NIM : 00000012956

Program Studi : Informatika

Fakultas : Teknik dan Informatika

menyatakan bahwa Skripsi yang berjudul “IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI KELAYAKAN EDIBILITAS PADA JAMUR” ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah yang ditulis oleh orang lain atau Lembaga lain, dan semua karya ilmiah orang lain atau Lembaga lain yang dirujuk dalam Skripsi ini telah disebutkan sumber kutipannya serta dicantumkan di Daftar Pustaka.

Jika di kemudian hari terbukti ditemukan kecurangan/ penyimpangan, baik dalam pelaksanaan Skripsi maupun dalam penulisan laporan Skripsi, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah Skripsi yang saya tempuh.

Tangerang, 25 Maret 2020

Mario Siswanto

(4)

iv

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Sebagai sivitas akademik Universitas Multimedia Nusantara, saya yang bertanda tangan di bawah ini:

Nama : Mario Siswanto

NIM : 00000013047

Program Studi : Informatika

Fakultas : Teknik dan Informatika Jenis Karya : Skripsi

Demi pengembangan ilmu pengetahuan, menyetujui dan memberikan izin kepada Universitas Multimedia Nusantara hak Bebas Royalti Non-eksklusif (Non- exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul:

Implementasi Algoritma Random Forest Classifier Dalam Melakukan Klasifikasi

Kelayakan Edibilitas Pada Jamur beserta perangkat yang diperlukan.

Dengan Hak Bebas Royalti Non-Eksklusif ini, pihak Universitas Multimedia Nusantara berhak menyimpan, mengalihmedia atau format-kan, mengelola dalam bentuk pangkalan data (database), merawat, dan mendistribusi dan menampilkan atau mempublikasikan karya ilmiah saya di internet atau media lain untuk kepentingan akademis, tanpa perlu meminta izin dari saya maupun memberikan royalti kepada saya, selama tetap mencantumkan nama saya sebagai penulis karya ilmiah tersebut.

Demikian pernyataan ini saya buat dengan sebenarnya untuk dipergunakan sebagaimana mestinya.

Tangerang, 25 Maret 2020

Mario Siswanto

(5)

v

HALAMAN PERSEMBAHAN/ MOTO

Karya ini kupersembahkan bagi Kedua Orang Tua dan Adik-Adikku terkasih

Your life will change in a blink of an eye, you should stay focus and look forward to it more

~~Mario Siswanto~~

(6)

vi

KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa yang telah memberikan kasih dan sayang-Nya kepada kita, atas terselesaikannya laporan Skripsi yang berjudul “IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI KELAYAKAN EDIBILITAS PADA JAMUR”. Tujuan dari penyusunan laporan Skripsi ini, yakni untuk memenuhi salah satu persyaratan dalam menyelesaikan mata kuliah final project.

Di dalam pengerjaan laporan Kerja Magang ini, penulis telah mendapatkan bantuan dari berbagai pihak yang sangat membantu dalam banyak hal. Maka dari itu, penulis juga mengucapkan terima kasih sebesar – besarnya kepada :

1. Bapak Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara

2. Bapak Dr. Eng. Niki Prastomo, S.T., M.Sc., selaku Dekan Fakultas Teknik dan Informatika

3. Ibu Nunik Afriliana, S.Kom., MMSI selaku Ketua Program Studi Informatika Universitas Multimedia Nusantara.

4. Ibu Marlinda Vasty Overbeek S.Kom., M.Kom. selaku dosen pembimbing yang telah memberikan bimbingan selama penelitian dilakukan dan mengajarkan penulis untuk menuliskan laporan skripsi dengan baik dan benar.

5. Keluarga yang memberikan dukungan dan doa dalam menyelesaikan laporan skripsi.

(7)

vii

6. Teman-teman penulis yang selalu memberikan dukungan dan menghibur penulis serta membantu memberikan refrensi dalam penyusunan laporan skripsi.

7. Anna Jeane selaku senior penulis yang selalu memberikan dukungan, hiburan, saran serta nasihat sehingga membuat penyusunan laporan jauh lebih baik.

8. Pihak-pihak lain yang telah membantu pembuatan dan penyusunan laporan magang ini yang tidak dapat penulis sebutkan satu per satu.

Penulis sadar bahwa dalam penulisan laporan ini masih banyak terdapat kekurangan maupun kesalahan, Semoga laporan Skripsi ini dapat bermanfaat, baik sebagai sumber informasi maupun sumber inspirasi bagi para pembaca.

Tangerang, 25 Maret 2019

Mario Siswanto

(8)

viii

IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI

KELAYAKAN EDIBILITAS PADA JAMUR

ABSTRAK

Jamur merupakan salah satu tumbuhan liar yang banyak tersebar di alam liar. Tidak semua jamur itu beracun dan dapat dimakan. Sejatinya jamur dapat diklasifikasikan dengan mata telanjang. Namun, terdapat kendala yang dihadapi. Jamur memiliki keberagaman, sehingga masih sulit diidentifikasi. Sebagai solusi dari permasalahan tersebut, dibutuhkan bantuan komputer agar klasifikasi jamur yang layak konsumsi dengan jamur yang beracun dapat dilakukan dengan data mining. Data mining dapat dilakukan dengan metode pembelajaran mesin. Machine learning atau pembelajaran mesin memungkinkan pengguna untuk memberikan ilmu kepada komputer dan membuat komputer tersebut menganalisa, dan membuat rekomendasi ataupun keputusan berdasarkan data yang diberikan sehingga merupakan pilihan tepat untuk melakukan klasifikasi. Random Forest (RF) merupakan salah satu ensemble learning kombinasi decision tree yang memberikan akurasi yang tergolong lebih tinggi karena algoritma ini akan menangani missing values dan tetap menjaga keakuratan data dengan jumlah besar. Random Forest ini akan diimplementasikan ke dalam aplikasi sistem untuk melakukan klasifikasi yang akan diterapkan pada perangkat PC berbasis offline yang diharapkan dapat membantu pengguna dalam melakukan klasifikasi pada jamur. Penelitian ini berhasil menerapkan algoritma random forest untuk melakukan klasifikasi jamur menjadi 2 label poisonous dan edible Hasilnya sistem dapat melakukan klasifikasi jamur dengan akurasi sebesar 98.0307% dari data test hasil training model.

Kata Kunci: Implementasi, Jamur, Data Mining, Algoritma Random Forest, Aplikasi berbasis web offline

(9)

ix

IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI

KELAYAKAN EDIBILITAS PADA JAMUR

ABSTRACT

Mushrooms are one of the wild plants that are widely spread in the wild. Not all mushrooms are poisonous and can be eaten. Actually mushrooms can be classified with the naked eye. However, there are obstacles faced. Mushrooms have diversity, so it is still difficult to identify. As a solution to these problems, computer assistance is needed so that the classification of mushrooms that are suitable for consumption with poisonous mushrooms can be done with data mining. Data mining can be done by machine learning methods. Machine learning allows users to provide knowledge to the computer and make the computer analyze, and make recommendations or decisions based on the data provided so that it is the right choice for classification.

Random Forest (RF) is an ensemble learning decision tree combination that provides higher accuracy because this algorithm will handle missing values while maintaining the accuracy of large amounts of data. Random Forest will be implemented into a system application to carry out a classification that will be applied to an offline-based PC device which is expected to assist users in classifying mushrooms. This research successfully applied random forest algorithm to classify mushroom into 2 classes, edible and poisonous. As the result, system can classify the mushrooms with 98.0307% accuracy from datatest.

Keywords: Implementation, Mushrooms, Data Mining, Random Forest Algorithm , Offline Web Application

(10)

x

DAFTAR ISI

LEMBAR PENGESAHAN ... ii

PERNYATAAN TIDAK MELAKUKAN PLAGIAT ... iii

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... iv

HALAMAN PERSEMBAHAN/ MOTO ... v

KATA PENGANTAR ... vi

ABSTRAK ... viii

ABSTRACT ... ix

DAFTAR ISI ... x

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiii

DAFTAR LAMPIRAN ... xiv

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang Masalah ... 1

1.2. Rumusan Masalah ... 5

1.3. Batasan Masalah ... 5

1.4. Tujuan Penelitian ... 6

1.5. Manfaat Penelitian ... 6

1.6. Sistematika Penulisan ... 7

BAB II LANDASAN TEORI ... 8

2.1. Jamur ... 8

2.2. Data Mining ... 9

2.3. Machine Learning ... 12

2.4. Decision Tree ... 13

2.5. Ensemble Learning ... 16

2.6. Random Forest ... 17

2.7. Evaluasi Performa ... 18

BAB III METODOLOGI PENELITIAN DAN PERANCANGAN SISTEM ... 20

3.1. Sistematika Penelitian ... 20

3.2. Metodologi Penelitian ... 21

BAB IV HASIL DAN PEMBAHASAN ... 32

(11)

xi

4.1. Spesifikasi Sistem ... 32

4.2. Implementasi Sistem ... 33

4.3. Pengujian Data ... 39

4.4. Evaluasi Sistem ... 67

4.5. Hasil Tampilan Aplikasi ... 69

BAB V SIMPULAN DAN SARAN ... 76

5.1. Simpulan ... 76

5.2. Saran ... 76

DAFTAR PUSTAKA ... 77

LAMPIRAN ... 80

(12)

xii

DAFTAR GAMBAR

Gambar 2.1. Struktur Karakteristik Jamur ... 9

Gambar 2.2 (a) Desain Alur Pendekatan Dalam Teknik Konvensional; dan (b) Baseline Metode Pembelajaran Mesin. ... 12

Gambar 2.3 Jenis Pembelajaran Mesin. ... 13

Gambar 2.4. Konsep Contoh Pohon Keputusan... 14

Gambar 2.5. Konsep Contoh Random Forest ... 17

Gambar 3.1 Flowchart Alur Implementasi Algoritma Random Forest ... 22

Gambar 3.2 Visualisasi Data Dalam Dataset ... 23

Gambar 3.3 Flowchart Pra-Proses ... 23

Gambar 3.4 Visualisasi Pembagian Data Pada Dataset ... 25

Gambar 3.5 Flowchart Umum Aplikasi Klasifikasi Jamur ... 28

Gambar 3.6 Mockup Antarmuka Bagian Input Dan Submit ... 30

Gambar 3.7 Mockup Antarmuka Bagian Hasil Klasifikasi ... 30

Gambar 4.1 Potongan Kode Praproses... 33

Gambar 4.2 Heatmap Missing Values ... 34

Gambar 4.3 Potongan Kode Integer Encoding ... 35

Gambar 4.4 Potongan Kode Pembagian Data ... 36

Gambar 4.5 Pembuatan Model Random Forest Dan Ekspor Ke Dalam Pickle.... 37

Gambar 4.6 Pengujian Kualitas Model ... 38

Gambar 4.7 Decision Tree Pertama ... 63

Gambar 4.8 Decision Tree Kedua ... 63

Gambar 4.9 Decision Tree Ketiga ... 64

Gambar 4.10 Decision Tree Keempat ... 64

Gambar 4.11 Data Pengujian ... 65

Gambar 4.12 Tangkapan Layar Tampilan Awal Aplikasi ... 69

Gambar 4.13 Tangkapan Layar Bagian Input Data ... 70

Gambar 4.14 Tangkapan Layar Bagian Hasil Klasifikasi ... 71

Gambar 4.15 Tangkapan Layar Hasil Klasifikasi Aplikasi ... 71

Gambar 4.16. Tangkapan Layar Bagian Informasi Jamur Yang Sering Ditemui . 72 Gambar 4.17 Tangkapan Layar Bagian Informasi Struktur Jamur Dan Dataset .. 73

Gambar 4.18 Tangkapan Layar Aplikasi Klasifikasi Jamur Berbasis Mobile ... 74

Gambar 4.19 Tangkapan Layar Hasil Klasifikasi ... 75

(13)

xiii

DAFTAR TABEL

Tabel 2.1 Confusion Matrix ... 19

Tabel 4.1 Jumlah Kejadian ... 39

Tabel 4.1 Jumlah Kejadian (Lanjutan) ... 40

Tabel 4.1 Jumlah Kejadian (Lanjutan) ... 41

Tabel 4.1 Jumlah Kejadian (Lanjutan) ... 42

Tabel 4.2 Information Gain Decision Tree Pertama ... 46

Tabel 4.3 Information Gain Decision Tree Pertama (Lanjutan) ... 47

Tabel 4.3 Information Gain Decision Tree Kedua Node Pertama ... 48

Tabel 4.4 Information Gain Decision Tree Kedua Node Kedua ... 50

Tabel 4.5 Information Gain Decision Tree Ketiga Node Pertama ... 51

Tabel 4.5 Information Gain Decision Tree Ketiga Node Pertama (Lanjutan) ... 52

Tabel 4.6 Information Gain Decision Tree Ketiga Node Kedua ... 53

Tabel 4.7 Information Gain Decision Tree Ketiga Node Ketiga ... 54

Tabel 4.7 Information Gain Decision Tree Ketiga Node Ketiga (Lanjutan) ... 55

Tabel 4.8 Information Gain Decision Tree Keempat Node Pertama ... 56

Tabel 4.9 Information Gain Decision Tree Keempat Node Kedua ... 57

Tabel 4.9 Information Gain Decision Tree Keempat Node Kedua (Lanjutan) ... 58

Tabel 4.10 Information Gain Decision Tree Keempat Node Ketiga ... 59

Tabel 4.11 Information Gain Decision Tree Keempat Node Keempat ... 60

Tabel 4.12 Information Gain Decision Tree Keempat Node Kelima ... 61

Tabel 4.12 Information Gain Decision Tree Keempat Node Kelima (Lanjutan) .. 62

Tabel 4.13 Hasil Pengujian Data ... 65

Tabel 4.14 Hasil Pengujian Data Random Forest ... 67

Tabel 4.15 Confusion Matrix Klasifikasi Jamur Pengujian Data ... 68

Tabel 4.16 Confusion Matrix Klasifikasi Jamur Data Test ... 68

(14)

xiv

DAFTAR LAMPIRAN

Lampiran 1 Form Bimbingan Skripsi

Lampiran 2 Tabel Perhitungan Node Internal Entropy Decision Tree Pertama Lampiran 3 Tabel Perhitungan Node Internal Pertama Entropy Decision Tree Kedua

Lampiran 4 Tabel Penghitungan Node Internal Kedua Entropy Decision Tree Kedua

Referensi

Dokumen terkait

Wibisono dan Fahrurozi (2019) membandingkan algoritma klasifikasi Naïve Bayes, K-Nearest Neighbor, Decision Tree dan Random Forest dalam pengklasifikasian data

Puji syukur penulis panjatkan kepada Allah SWT, karena atas berkat dan rahmat- Nya, penulis dapat menyelesaikan laporan Skripsi dengan judul Implementasi Metode Random

Pada proses perancangan model algoritma Random Forest, model algoritma Random Forest yang dibangun dengan menggunakan ‘n’ pohon Decision Tree dengan mencari nilai

Alur Klasifikasi 2.5 Model Klasifikasi Metode yang akan digunakan pada penelitian adalah Algoritma C4.5, Random Forest, SVM dan Naive Bayes.. Dalam permodelan ini Algoritma C4.5,

Implementasi Algoritma Naïve Bayes Classifier NBC untuk Klasifikasi Penyakit Ginjal Kronik Qurotul A’yuniyah*, Ena Tasia, Nanda Nazira, Pangeran Fadillah Pratama, Muhammad Ridho

Pada penelitian ini dilakukan klasifikasi terhadap penyakit kardiovaskular menggunakan algoritma Random Forest dengan hyperparameter tuning menggunakan Grid Search.. Pada penelitian ini

Metode Penelitian Pada penelitian ini dilakukan penggunaan algoritma CNN dan Random Forest sebagai algoritma untuk melakukan klasifikasi terhadap penyakit daun tanaman, proses

Sintaks Modeling Random Forest Setelah pemodelan dengan algoritma Support Vector Machine dan Random Forest, langkah selanjutnya adalah menerapkan algoritma Logistic Regression pada