• Tidak ada hasil yang ditemukan

Pemetaan Klasifikasi Data Tweet Kemacetan Lalu Lintas Menggunakan Algoritma C4.5 Halaman Awal

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pemetaan Klasifikasi Data Tweet Kemacetan Lalu Lintas Menggunakan Algoritma C4.5 Halaman Awal"

Copied!
13
0
0

Teks penuh

(1)

PEMETAAN KLASIFIKASI DATA TWEET KEMACETAN

LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu

Program Studi Informatika

Disusun Oleh:

FACHRI YAFELLI

NIM. M0512019

PROGRAM STUDI INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

(2)

ii SKRIPSI

PEMETAAN KLASIFIKASI DATA TWET KEMACETAN

LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

Disusun Oleh :

FACHRI YAFELLI

M0512019

Skripsi ini telah disetujui untuk dipertahankan di hadapan dewan penguji,

pada tanggal:

Pembimbing I Pembimbing II

Dr. Wiranto M.Kom., M.Cs. Afrizal DoewesS.Kom., M.Sc

NIP.19661230 199302 1 001 NIP.198508312012121004

(3)

SKRIPSI

PEMETAAN KLASIFIKASI DATA TWEETKEMACETAN

LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

Disusun Oleh :

FACHRI YAFELLI

M0512019

Skripsi ini telah disetujui untuk dipertahankan di hadapan dewan penguji,

pada tanggal:

Susunan Dewan Penguji

1. Dr. Wiranto M.Kom., M.Cs. ( )

NIP. 19661230 199302 1 001

2. Afrizal Doewes S.Kom., M.Sc ( )

NIP. 198508312012121004

3. Sari Widya Sihwi S.Kom.,MTI ( )

NIP. 198304122009122003

4. Ristu Saptono S.Si, M.T ( )

NIP. 197902102002121001

Disahkan Oleh

Kepala Program Studi Informatika

Drs Bambang Harjito M.App.Sc, PhD

(4)

iv

MOTTO

“Semua orang pernah jatuh dan terpuruk tetapi yang membedakan orang keren

dengan orang biasa adalah orang keren apabila jatuh, jatuhnya orang keren itu

tidak jauh-jauh dari kesuksesan”Ewin Yafelli

“Allah SWT hanya memberikan kepada orang yang siap bukan kepada orang

yang hanya menginginkan, maka persiapkanlah!”Yafrizal

(5)

PERSEMBAHAN

Karya ini penulis persembahkan kepada:

“Ibu Elli Yanti dan Bapak Yafrizal atas segala kasih sayang, cinta, doa, semangat

dan motivasi yang tiada henti”

“Ewin Yafelli, abang terbaik”

(6)

vi

KATA PENGANTAR

Segala puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya

karena rahmat dan karunia-Nya, penulis dapat menyelesaikan skripsi dengan judul

PemetaanKlasifikasi Data Tweet Kemacetan Lalu Lintas Menggunakan Algoritma C4.5”, yang merupakan salah satu syarat untuk mendapatkan gelar

strata satu program studi Informatika Universitas Sebelas Maret.

Keberhasilan dalam penyusunan skripsi ini tidak terlepas dari bantuan

beberapa pihak. Untuk itu, penulis ingin mengucapkan terima kasih untuk

bimbingan, dukungan, saran dan doa serta semangat tanpa batas selama penelitian

ini. Penulis mengucapkan terima kasih kepada:

1. Allah SWT atas segala limpahan rahmat dan karunia-Nya sehingga skripsi ini

dapat diselesaikan.

2. Bapak Prof. Ir. Ari Handono Ramelan M.Sc.(Hons), Ph.D. selaku Dekan

FMIPA UNS.

3. Bapak Drs Bambang Harjito M.App.Sc, PhD selaku Kepala Program Studi

S1 Informatika FMIPA UNS.

4. Bapak Dr. Wiranto M.Kom., M.Cs. dan Bapak Afrizal Doewes S.Kom., M.Sc

selaku Pembimbing yang telah memberikan banyak bimbingan, pengarahan

dan motivasi kepada penulis selama proses penyusunan skripsi ini.

5. Ibu Elli Yanti dan Bapak Yafrizal, selaku kedua orang tua yang selalu

mendukung, membimbing dan mendoakan tiada henti.

6. Abang Ewin Yafelli dan Uni Dwi Puspita Yafelli, selaku saudara kandung

yang luar biasa yang selalu memberikan kejutan dan semangat yang tak

terduga kepada penulis.

7. Bapak dan Ibu dosen Program Studi S1 Informatika FMIPA UNS yang telah

memberikan pengajaran kepada penulis selama masa studi.

8. Keluarga besar S1 Informatika FMIPA UNS, khususnya angkatan 2012.

Surakarta, 24 Juni 2016

Penulis

(7)

PEMETAAN KLASIFIKASIDATA TWEETKEMACETAN

LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

FACHRI YAFELLI

Program Studi Informatika,

Fakultas Matematika dan Ilmu Pengetahuan Alam,

Universitas Sebelas Maret

ABSTRAK

Informasi mengenai kemacetan pasti sangat dibutuhkan oleh pengendara dalam

menghindari kemacetan.Informasi ini dapat diperoleh dengan mudah melalui

jejaring sosial sepertitwitter.Akan tetapi, informasi yang dibagikan di twitter

tersebut masih berupa teks dan belum terkategori.Selain itu informasi tersebut

masih belum tervisualisasi ke dalam bentuk peta. Maka dalam penelitian ini akan

dilakukan pemetaan klasifikasi data tweet kemacetan lalu lintas menggunakan

algoritma C4.5. Tujuan dari penelitian ini adalah mengimplementasikan algoritma

C4.5 dalam mengklasifikasi data teks kemacetan lalu lintas dan

memvisualisasikannya ke dalam bentuk peta sehingga mampu memberikan

informasi seputar kemacetan.Pada peneltian iniakandigunakan algoritma C4.5

untuk membentuk pohon keputusan yang akan digunakan dalam proses klasifikasi

data kemacetan. Untuk setiap data lokasi yang terdapat pada tweetakan melewati

proses geocoding sehingga data lokasi dapat dipetakan ke dalam peta digital.

Proses klasifikasi akan diuji menggunakan metode k-fold cross validation dengan

nilai k=10 dengan menghitung nilai accuracy, precision dan recall. Hasil dalam

penelitian ini menunjukkan tingkat accuracy pohon keputusan yang dibangun

sebesar 99.92% sementara itu nilai masing-masing precision dan recall pohon

keputusan yang dibangun sebesar99.94% dan 96.74%.

(8)

viii viii viii

TRAFFIC CONGESTION DATA TWEET MAPPING USING

C4.5 ALGORITHM

FACHRI YAFELLI

Department of Informatics, Mathematics

and Natural Science Faculty, Sebelas

Maret University

ABSTRACT

Traffic Congestion Information certainly needed by the driver to avoiding

congestion. Information can be obtained easily through social network like

twitter. However, the information shared on twitter is still in the form of text and

still not categorized. Moreover the information has not yet been visualized in the

map. So in this study will be carried out traffic congestion data tweet

classification mapping using C4.5 algorithm. The purpose of this study is to

implement the C4.5 Algorithm in classifying traffic congestion text data and

visualize it to a map so it can provide information about traffic congestion. This

research will use the C4.5 algorithm to form a decision tree to be used in the

process of classifying data traffic congestion. For each location data contained in

tweet will go through the process of geocoding so that location data can be

mapped into the digital map. Classification will be tested using k-fold cross

validation with k = 10 to calculate the value of accuracy, precision and recall.

The results in this study indicate the level of accuracy of decision trees

constructed by 99.92% while the respective values of precision and recall

decision tree constructed by 99.94% and 96.74%.

Keywords: C4.5 Algorithm, Decision Trees, Mapping, Traffic Jam.

(9)

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PERSETUJUAN ... ii

HALAMAN PENGESAHAN... iii

MOTTO ... iv

PERSEMBAHAN ... v

KATA PENGANTAR ... vi

ABSTRAK ... vii

ABSTRACT ... viii

DAFTAR ISI ... ix

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

DAFTAR LAMPIRAN ... xiii

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Rumusan Masalah ... 2

1.3. Batasan Masalah ... 2

1.4. Tujuan Penelitian... 3

1.5. Manfaat Penelitian... 3

1.6. Sistematika Penulisan ... 3

BAB II TINJAUAN PUSTAKA... 4

2.1. Dasar Teori ... 4

2.1.1. Smart City ... 4

2.1.2. Text Mining ... 5

2.1.3. Algoritma C4.5... 6

2.2. Penelitian Terkait ... 7

2.3. Kerangka Pemikiran ... 9

BAB III METODOLOGI ... 12

3.1. Pengumpulan Data ... 12

3.2. Implementasi dan Pengembangan Aplikasi... 13

(10)

x

BAB IV PEMBAHASAN... 18

4.1. Pengumpulan Data ... 18

4.2. Pre-processing Data ... 19

4.3. Algoritma C4.5 ... 20

4.4. Pengujian dan Hasil ... 21

4.5. Geocoding dan Pemetaan ... 23

BAB V PENUTUP... 25

5.1. Kesimpulan... 25

5.2. Saran ... 25

DAFTAR PUSTAKA ... 26

LAMPIRAN ... 28

(11)

DAFTAR TABEL

Tabel 2.1 Matriks Penelitian ... 9

Tabel 3.1 Contoh data yang dibutuhkan dan tidak dibutuhkan... 13

Tabel 3.2 Penerapan case folding... 13

Tabel 3.3 Penerapan tokenizing ... 14

Tabel 3.4 Penerapan filtering ... 14

Tabel 3.5 Contoh klasifikasi kemacetan ... 15

Tabel 3.6 Confusionmatrix yang digunakan ... 16

Tabel 4.1 Data Sample ... 18

Tabel 4.2 Data sample setelah melewati tahap pre-processing ... 19

Tabel 4.3 Perhitungan iterasi ke-1 ... 20

Tabel 4.4 Perhitungan iterasi ke-2 ... 20

(12)

xii

DAFTAR GAMBAR

Gambar 3.1 Metodologi penelitian ... 12

Gambar 4.1 Hasil pohon keputusan yang didapatkan ... 21

Gambar 4.2 Hasil aturan yang didapatkan ... 21

Gambar 4.3 Hasil Pemetaan Menggunakan Geocoding ... 23

Gambar 4.4 Hasil pemetaan dengan kasus lancar ... 24

Gambar 4.5 Hasil pemetaan dengan kasus macet ... 24

Gambar 4.6 Hasil pemetaan dengan kasus macet sekali ... 24

Gambar 4.7 Hasil pemetaan dengan kasus tidak bisa lewat... 24

(13)

DAFTAR LAMPIRAN

Lampiran 1. Database Wordlist Klasifikasi... 28

Lampiran 2. Database Nama Jalan ... 29

Gambar

Gambar 3.1 Metodologi penelitian ......................................................................

Referensi

Dokumen terkait

Penelitian ini dilakukan dengan tujuan untuk membangun sistem informasi geografis yang dapat menyajikan hasil prediksi pemakaian air bersih kota Bandar Lampung dalam wilayah

Berdasarkan tabel diatas dapat dilihat rata-rata pengetahuan ibu hamil tentang kehamilan resiko tinggi pada kelompok kontrol pretest adalah 58,50 sedangkan rata-rata

HGLEOH ¿OP dapat dilakukan dengan penggantian komponen lilin lebah dengan senyawa hidropobik yang bersifat tidak mudah mengkristal pada suhu kamar dan mengandung asam lemak

Metode pengumpulan data dengan menggunakan skala, yaitu skala kepatuhan terhadap peraturan keselamatan lalu lintas, dan skala persepsi terhadap Polisi lalu

Sedangkan menurut Suryani, dkk (2015:2), Surat adalah secarik kertas atau lebih yang berisi percakapan (bahan komunikasi) yang disampaikan oleh seseorang kepada orang

Tujuan dari tugas akhir ini adalah membuat aplikasi peta tiga dimensi gedung Medical Center Institut Teknologi Sepuluh Nopember yang interaktif dan informatif, yang

dari perbuatan yang salah. h) Dalam situasi kelompok para anggota menemukan bahwa mereka tidak perlu mengutuk dirinya sendiri karena memiliki masalah.. i) Melalui balikan dari

Berdasarkan tabel 4.3 (Penilaian Pemenuhan Kriteria pada Perusahaan yang Terdaftar di Bursa Efek Indonesia dengan Indeks LQ 45), perusahaan di Indonesia yang