• Tidak ada hasil yang ditemukan

TUGAS AKHIR

N/A
N/A
Protected

Academic year: 2023

Membagikan "TUGAS AKHIR"

Copied!
59
0
0

Teks penuh

(1)

KLASIFIKASI INDEKS PRESTASI MAHASISWA FAKULTAS SAINS DAN TEKNOLOGI UIN SUSKA RIAU BEDASARKAN BIODATA MAHASISWA MENGGUNAKAN

METODE CART

TUGAS AKHIR

Di aj ukan sebagai Sal a h Sat u Sy arat untuk Memperoleh Gelar Sarjana Sains

pada Program Studi Matematika

oleh:

EVA LISYHANA 11754202018

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU PEKANBARU

2023

(2)
(3)
(4)
(5)

iv

LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL

Tugas Akhir yang tidak diterbitkan ini terdaftar dan tersedia di Perpustakaan Universitas Islam Negeri Sultan Syarif Kasim Riau adalah terbuka untuk umum dengan ketentuan bahwa hak cipta pada penulis. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau ringkasan hanya dapat dilakukan seizin penulis dan harus disertai dengan kebiasaan ilmiah untuk menyebutkan sumbernya.

Penggandaan atau penerbitan sebagian atau seluruh Tugas Akhir ini harus memperoleh izin dari Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau. Perpustakaan yang meminjamkan Tugas Akhir ini untuk anggotanya diharapkan untuk mengisi nama, tanda peminjaman dan tanggal pinjam.

(6)

v

LEMBAR PERNYATAAN

Dengan ini saya menyatakan bahwa dalam Tugas Akhir ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka.

Pekanbaru, 03 Januari 2023 Yang membuat pernyataan,

EVA LISYHANA 11754202018

(7)

vi

LEMBAR PERSEMBAHAN

Bismillahirrohmanirrohim

Alhamdulillah Alhamdulillah Hirobbilalamin yang paling utama dari segala isi langit dan yang ada dimuka bumi sujud syukur kita ucapkan kepada Allah Subhanahu wa Ta’ala atas segala rahmat, nikmat dan hidayah-nya yang telah memberikan segala kelancaran dan kemudahan dalam segala bentuk

macam urusan dunia kepadaku dan atas kehendakmu akhirnya tugas akhir ini dapat terselesaikan.

Sholawat dan salam tak lupa pula kita selalu mengucapkan kepada Nabi besar Nabi Muhammad Shallallahu Alaihi Wasallam.

# Untuk Kedua Orangtua yang Kucintai #

Ayahanda Zulkamardi dan Ibunda Ernawati Terima kasih ku persembahkan kepada kedua orang tua yang sangat kucintai yang telah membesarkan dan merawatku sampai aku bisa menjadi seperti in, yang selalu dan tiada henti-hentinya mendoakan ku dimanapun dan kapanpun. Kalian adalah sumber kehidupanku,

sumber kebahagiaanku dan sumber motivasiku…

Terimalah persembahan karya sederhana ini sebagai bukti perjuangan mu dalam mendidikku dan kesungguhan ku dalam menuntut ilmu.

# keluarga besar #

Terimakasih kepada abang dan adik-adik yang ku sayangi ( Bang adal, nopal, nosal, kiki) yang selalu ada dan selalu mendukungku baik berupa semangat dan arahan selama ini, dan terimakasih untuk seluruh

keluarga besar yang selalu mendoakan ku dimanapun dan kapanpun.

# dosen Pembimbingku #

Ibu Ari Pani Desvina, M.Sc. Ananda mengucapkan banyak terima kasih kepada Ibu yang telah meluangkan waktunya dalam membimbing dan memberikan masukan kepada penulis dalam mengerjakan tugas akhir ini. Untuk terwujudnya tugas akhir yang baik untuk referensi kedepannya. Tugas akhir ini sebagai bentuk

perwujudan dari rasa terimakasih Ananda kepada Ibu.

# sahabatku #

Terimakasih untuk segala bentuk semangat dan motivasi serta tawa yang selalu kalian berikan. Segala banyak bentuk rintangan dan perjuangan yang kita lalui bersama dan terimakasih untuk segala kenangan

yang telah terukir selama ini.

Tugas akhir ini ku persembahkan ^-^

(8)

vii

KLASIFIKASI INDEKS PRESTASI MAHASISWA FAKULTAS SAINS DAN TEKNOLOGI UIN SUSKA RIAU BERDASARKAN BIODATA MAHASISWA MENGGUNAKAN METODE CART

EVA LISYHANA NIM: 11754202018

Tanggal Sidang : 03 Januari 2023 Tanggal Wisuda :

Program Studi Matematika Fakultas Sains dan Teknologi

Universitas Islam Negeri Sultan Syarif Kasim Riau Jl. Soebrantas No. 155 Pekanbaru

ABSTRAK

Classification and Regression Tree (CART) merupakan pohon keputusan yang termasuk dalam metode nonparametrik berstruktur pohon yang menggambarkan hubungan antara variabel terikat dengan satu atau lebih variabel bebas. Pada penelitian ini metode CART digunakan untuk mengklasifikasi indeks prestasi mahasiswa yang diidentifikasi berdasarkan biodata mahasiswanya.

Data yang digunakan adalah data indeks prestasi dan biodata mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau pada semester satu. Berdasarkan hasil pengklasifikasian indeks prestasi mahasiswa variabel terpenting yang membentuk suatu pohon klasifikasi ialah jenis kelamin, jalur masuk dan pendidikan ibu. Tingkat akurasi dari klasifikasi indeks prestasi mahasiswa yang telah diteliti sebesar 58%.

Kata Kunci : Classification and Regression Tree (CART), Indeks Prestasi, Pohon Klasifikasi.

(9)

viii

CLASSIFICATION OF STUDENT ACHIEVEMENT INDEX OF SCIENCE AND TECHNOLOGY FACULTY OF UIN SUSKA RIAU BASED ON STUDENT PERSONAL IDENTITY

USING THE CART METHOD

EVA LISYHANA NIM : 11754202018

Date of Final Exam : 03 January 2023 Date of Graduation :

Department of Mathematics Faculty of Science and Technology

State Islamic University of Sultan Syarif Kasim Riau Soebrantas St. No. 155 Pekanbaru ‐ Indonesia

ABSTRACT

Classification and Regression Tree (CART) is a decision tree which is classified as nonparametric method like a tree structure that describe the relation of dependent variable to one or more independent variables. In this study the CART method is used to classify student achievement index which identified based on student personal identity. The datas that are used on this study are student achievement index and student personal identity of Science and Technology of UIN Suska Riau on the first semester. Based on the results of student achievement index classification the most important variables that create the classification tree are gender, university admission, and mother's study background. The accuration level of student achievement index that has been researched is 58%.

Keywords: Achievement index, Classification and Regression Tree (CART), Classification Tree.

(10)

ix

KATA PENGANTAR

Assalamu’alaikum warahmatullahi wabarakatuh

Alhamdulillahirabbil’alamiin. Segala bentuk syukur kita ucapkan kepada Allah Subhanahu Wa Ta’ala atas segala rahmat, karunia, nikmat, dan kemudahan serta hidayah-Nya penulis dapat menyelesaikan Tugas Akhir yang berjudul

“Klasifikasi Indeks Prestasi Mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau Berdasarkan Biodata Mahasiswa Menggunakan Metode CART”. Shalawat beserta salam kita hadiahkan kepada Nabi besar Nabi Muhammad Shalallahu

‘Alahi Wasallam, semoga kita semua mendapat syafaat-Nya. Penulisan tugas akhir ini bermaksud untuk memenuhi salah satu syarat dalam rangka menyelesaikan studi Strata 1 (S1) pada Program Studi Matematika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Sultan Syarif Kasim Riau.

Dalam setiap proses penyusunan tugas akhir ini penulis banyak mendapatkan bimbingan, masukan serta arahan dari berbagai pihak. Untuk itu, Penulis mengucapkan beribu-ribu banyak terima kasih yang paling utama kepada kedua orang tua yang sangat saya cintai yakni Ayahanda Zulkamardi dan Ibunda Ernawati yang selalu dan tiada henti-hentinya mendoakan penulis dalam kelancaran penyusunan tugas akhir ini. Serta, Penulis juga mengucapkan banyak terimakasih kepada:

1. Bapak Prof. Dr. Hairunas, M.Ag. selaku Rektor Universitas Islam Negeri Sultan Syarif Kasim Riau.

2. Bapak Dr. Hartono, M.Pd. selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau.

3. Bapak Wartono, M.Sc. selaku Ketua Program Studi Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau.

4. Bapak Nilwan Andiraja, M.Sc. selaku Sekretaris Program Studi Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau.

(11)

x

5. Ibu Ari Pani Desvina, M.Sc., selaku pembimbing PA dan pembimbing tugas akhir penulis yang selalu memberikan arahan dan banyak membantu serta selalu dengan sabar dan ikhlas mengajarkan penulis dalam menyelesaikan tugas akhir ini.

6. Ibu Rahmadeni, S.Si, M.Si., selaku Penguji I yang telah banyak memberikan masukan dan arahan serta dukungan pada penulisan tugas akhir.

7. Bapak M. Marizal, M.Sc., selaku Penguji II yang telah banyak memberikan masukan dan arahan serta dukungan pada penulisan tugas akhir.

8. Seluruh Bapak dan Ibu dosen Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau.

9. Keluarga besar dan seluruh teman-teman Angkatan 2017, yang selalu memberikan dukungan dan dorongan baik secara moril maupun materi selama menempuh jenjang pendidikan, serta kakak-kakak yang selalu membantu dan adik penulis tersayang yakni Kak Gin, Kak Mer, Nouval Ditya Mufty, Nousal Ditya Mufti, dan Athar Rizky.

10. Dan seluruh pihak yang telah memberikan banyak bantuan dari awal penyusunan tugas akhir hingga selesai, yang tidak dapat penulis sebutkan satu-persatu.

Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat banyak kesalahan dan kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran dari semua pihak demi kesempurnaan tugas akhir ini. Semoga tugas akhir ini dapat bermanfaat bagi kita semua. Aamiin ya Robbal’alamiin.

Wassalamu’alaikum warahmatullahi wabarakatuh

Pekanbaru, 03 Januari 2023

EVA LISYHANA 11754202018

(12)

xi

DAFTAR ISI

LEMBAR PERSETUJUAN ... ii

LEMBAR PENGESAHAN ... iii

LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL ... iv

LEMBAR PERNYATAAN ... v

LEMBAR PERSEMBAHAN ... vi

ABSTRAK ... vii

ABSTRACT ... viii

KATA PENGANTAR ... ix

DAFTAR ISI ... xii

DAFTAR GAMBAR ... xiii

DAFTAR TABEL ... xiv

DAFTAR LAMPIRAN ... xv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 3

1.3 Batasan Masalah ... 3

1.4 Tujuan Masalah ... 3

1.5 Manfaat Penelitian ... 3

1.6 Sistematika Penelitian ... 4

BAB II LANDASAN TEORI ... 5

2.1 Statistika Deskriptif ... 5

2.2 Pohon Keputusan (Decision Tree) ... 5

2.3 Klasifikasi Pohon ... 7

2.3.1 Classification and Regression Tree (CART) ... 7

2.3.2 Pembentukan Pohon Klasifikasi CART... 9

2.3.3 Ukuran Keakuratan Klasifikasi ... 15

2.4 Indeks Prestasi ... 16

BAB III METODE PENELITIAN ... 18

3.1 Jenis dan Sumber Data ... 18

(13)

xii

3.2 Tempat dan Waktu Penelitian ... 18

3.3 Populasi dan Sampel Penelitian ... 18

3.4 Variabel Penelitian ... 18

3.5 Metodologi Penelitian ... 20

3.6 Alat dan Cara Organisir Data ... 22

BAB IV PEMBAHASAN ... 23

4.1 Gambaran Umum Data ... 23

4.2 Pengolahan Metode Classification and Regression Tree ... 29

4.2.1 Pemilihan Pemilah ... 29

4.2.2 Menentukan Penyekatan Terbaik (GOS) ... 31

4.2.3 Pemangkasan Pohon Klasifikasi ... 37

4.2.4 Pohon Klasifikasi Optimal ... 41

4.2.5 Interpretasi Pada Pohon Optimal ... 44

4.2.6 Confusion Matrix (Ketepatan Pengklasifikasian) ... 50

BAB V PENUTUP ... 51

5.1 Kesimpulan ... 51

5.2 Saran ... 52

DAFTAR PUSTAKA ... 53 LAMPIRAN

DAFTAR RIWAYAT HIDUP

(14)

xiii

DAFTAR GAMBAR

Gambar 2.1 Model Pohon Keputusan ... 6

Gambar 2.2 Skema Pohon Klasifikasi dan Regresi ... 9

Gambar 3.1 Flowchart Tahapan CART ... 21

Gambar 4.1 Gambaran Deskriptif Indeks Prestasi Mahasiswa ... 23

Gambar 4.2 Pohon Klasifikasi Maksimal ... 33

Gambar 4.3 Pemangkasan Pertama Pohon Klasifikasi ... 40

Gambar 4.4 Bentuk Pohon Klasifikasi Optimal... 42

(15)

xiv

DAFTAR TABEL

Tabel 2.1 Confusion Matrix ... 15

Tabel 3.1 Variabel Penelitian ... 19

Tabel 4.1 Crosstabulation Indeks Prestasi dan Jenis Kelamin ... 24

Tabel 4.2 Crosstabulation Indeks Prestasi dan Jalur Masuk ... 24

Tabel 4.3 Crosstabulation Indeks Prestasi dan Asal Sekolah ... 25

Tabel 4.4 Crosstabulation Indeks Prestasi dan Pendapatan Orangtua ... 26

Tabel 4.5 Crosstabulation Indeks Prestasi dan Pekerjaan Orangtua ... 26

Tabel 4.6 Crosstabulation Indeks Prestasi dan Pendidikan Ayah ... 27

Tabel 4.7 Crosstabulation Indeks Prestasi dan Pendidikan Ibu ... 28

Tabel 4.8 Pemilahan Memaksimumkan nilai GOS ... 32

Tabel 4.9 Proposisi Kesalahan Tree (V-fold) ... 41

Tabel 4.10 Variabel Terpenting ... 43

Tabel 4.11 Keakuratan Pengklasifikasian ... 50

(16)

xv

DAFTAR LAMPIRAN

Lampiran 1 Data Biodata Mahasiswa Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau Tahun 2020 ... 55 Lampiran 2 Pemangkasan Pohon Klasifikasi... 65 Lampiran 3 Cross Validation Estimate ... 69

(17)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Pendidikan ialah suatu cara penunjang mencerdaskan kehidupan bangsa dalam aspek kehidupan manusia. Sementara itu, peningkatan mutu pendidikan dapat dimulai dengan jenjang pendidikan dasar sampai dengan tingkat perguruan tinggi.

Sehingga tujuan utama yakni dapat menciptakan manusia yang bermanfaat dan terampil hingga mampu menghadapi setiap perubahan maupun permasalahan yang semakin berkembang saat ini [1].

Perguruan tinggi menjadi suatu lembaga pendidikan formal di Indonesia dituntut sebagai perkembangan pengetahuan bagi para mahasiswa di lingkungan universitas. Adanya standarisasi ISO 9001 mengharuskan mahasiswa melaksanakan pendidikan yang memiliki komitmen untuk meningkatkan indeks prestasi (IP) bagi setiap mahasiswa di perguruan tinggi [2]. Keberhasilan mahasiswa di perguruan tinggi dapat dilihat dan diketahui melalui nilai indeks prestasi (IP) yang diperoleh [2]. Indeks prestasi (IP) ialah nilai kredit rata-rata yang dimaksudkan sebagai satuan nilai akhir yang diperoleh dari hasil proses belajar setiap semester sehingga dikatakan dalam besaran atau angka yang membuktikan prestasi keberhasilan terhadap proses belajar mahasiswa dalam tingkatan semesternya [3].

Mahasiswa dengan indeks nilai tinggi dapat dikatakan mampu melaksanakan perkuliahan dengan baik, begitu pula kebalikannya, indeks nilai yang lebih rendah menyatakan mahasiswa tidak mampu mengikuti perkuliahan dengan baik di awal semester. Meskipun belum tentu, dapat diasumsikan bahwa orang dengan indikator kinerja yang baik memiliki kemampuan akademik yang baik dan akan memiliki hasil yang baik di masa depan.

Untuk itu dalam setiap universitas yang menerima mahasiswa baru banyak hal- hal yang dapat mempengaruhi hasil dari nilai indeks prestasi mahasiswa tersebut diantaranya, mahasiswa universitas Islam Negeri Sultan Syarif Kasim Riau dimana

(18)

2

mahasiwa awal semester Fakultas Sains dan Teknologi yang telah menginjak jenjang perguruan tinggi.

Mengingat banyaknya jalur masuk dari berbagai daerah bagi para mahasiswa yang mendaftar ke universitas islam negeri Sultan Syarif Kasim Riau serta dilihat berdasarkan pada biodata mahasiwa. Oleh sebab itu, diperlukan adanya pengklasifikasian yakni suatu metode statistik digunakan dengan pengelompokkan atau mengklasifikasi suatu data yang tersusun secara sistematis dimana teknik ini dapat memprediksi tabel kelas. Tujuan utama klasifikasi adalah kebenaran dalam memprediksi sebuah nilai [4].

Metode klasifikasi yang dijelaskan pada penelitian [5] dapat dilakukan dengan metode parametrik dan nonparametrik. Salah satu metode klasifikasi dalam metode nonparametrik adalah metode klasifikasi struktur pohon yang dikembangkan oleh Leo Breiman, Jerome H. Friedman, Richard A. Olshen dan Charles J. Stone yaitu pada tahun 1984 empat ilmuwan menghasilkan metode klasifikasi atau yang bisa disebut dengan metode klasifikasi. metode klasifikasi CART. (Pohon Klasifikasi dan Regresi) adalah metode pohon regresi. Variabel dependen yang digunakan adalah tipe klasifikasi, sehingga CART mendapatkan Pohon Klasifikasi, sedangkan jika variabel dependen yang digunakan adalah tipe kontinu yaitu numerik, CART menghasilkan Pohon Regresi [6].

Metode CART (Classification and Regression Tree) merupakan metode statistik nonparametrik yang dapat digambarkan sebagai hubungan antara variabel respon (variabel dependen) dengan satu atau lebih variabel prediktor (variabel independen). Tujuan utama CART adalah untuk menghasilkan kumpulan data yang akurat sebagai hasil dari klasifikasi [7].

Oleh karenanya, dari pemaparan uraian diatas membuat penulis tertarik dalam pengambilan judul penelitian yakni, “Klasifikasi Indeks Prestasi Mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau Berdasarkan Biodata Mahasiswa Menggunakan Metode CART“.

(19)

3 1.2 Rumusan Masalah

Dari penjabaran latar belakang yang telah dijabarkan diatas sehingga dapat dihasilkan rumusan masalah yang diperoleh dalam penelitian ini yakni Bagaimana mengidentifikasi indeks prestasi mahasiswa berdasarkan biodata mahasiswa Fakultas Sains dan Teknologi menggunakan metode Classification and Regression Tree?

1.3 Batasan Masalah

Supaya pembahasan didalam permasalahan ini berkorelasi dengan tujuan penelitian. Untuk itu, diperlukan adanya batasan masalah yakni penelitian diperoleh dari biodata mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau. Data yang diolah ialah data IP mahasiswa semester satu angkatan 2020/2021 pada fakultas tersebut.

1.4 Tujuan Penelitian

Tujuan penelitan ini adalah untuk mengetahui hasil identifikasi indeks prestasi mahasiswa berdasarkan biodata mahasiswa Fakultas Sains dan Teknologi menggunakan metode Classification and Regression Tree.

1.5 Manfaat Penelitian

Manfaat yang dihasilkan berdasarkan penulisan tugas akhir ini yakni:

a. Bagi Akademis dan Ilmu Pengetahuan

Diharapkan pada penelitian tugas akhir ini dapat menyampaikan informasi serta ilmu pengetahuan bagi pembaca mengenai pengaplikasian metode CART dalam mengklasifikasi indeks prestasi mahasiswa.

b. Bagi Penulis

Dimana penulis dapat mengaplikasikan metode Classification and Regression Tree (CART) didalam kasus yang berbeda yakni dapat mengklasifikasikan dan menganalisa data yang lainnya dengan menerapkan metode ini.

c. Bagi Lembaga Pendidikan

(20)

4

Diharapkan agar didalam penelitian ini bisa menambahkan referensi matematika pada proses penyusunan penelitian tugas akhir.

d. Bagi Instansi/Pemerintahan

Diharapkan semoga dapat memberikan informasi maupun gambaran pada pengklasifikasian dalam mengklasifikasi indeks prestasi mahasiswa Fakultas Sains dan Teknologi di UIN Suska Riau nantinya.

1.6 Sistematika Penulisan

Pembagian sistematika didalam penulisan tugas akhir ke dalam beberapa bab yakni terdapat bagian-bagian yang dijelaskan pada setiap bab:

BAB I PENDAHULUAN

Bab ini berisikan latar belakang masalah, rumusan masalah,batasan masalah, tujuan penelitian, manfaat penelitian serta sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini berisikan tentang penjelasan terkait berupa pemecahan setiap masalah yang digunakan pada penulisan laporan tugas akhir serta permasalahan yang berkorelasi dengan judul penelitian ini.

BAB III METODOLOGI PENELITIAN

Bab ini memaparkan tahapan-tahapan maupun metode yang akan digunakan pada penelitian sehingga mendapatkan hasil yang diperlukan dalam penulisan dan pengerjaan tugas akhir.

BAB IV PEMBAHASAN

Bab ini membahas tahapan pengklasifikasian indeks prestasi mahasiswa yang diolah dengan metode Classification and Regression Tree serta menjelaskan dan memaparkan cara memperoleh hasil dalam pengerjaan tugas akhir.

BAB V PENUTUP

Bab ini berisikan kesimpulan dan saran dari seluruh pembahasan yang dijelaskan pada penelitian tugas akhir.

(21)

5

BAB II

LANDASAN TEORI

Beberapa kaitan teori-teori yang mencakup teori pendukung didalam penelitian tugas akhir ini yakni:

2.1 Statistika Deskriptif

Statistika deskriptif ialah statistika yang digunakan untuk menggambarkan maupun menganalisisa data hasil dari suatu penelitian namun tidak dalam pengambilan kesimpulan yang lebih luas terhadap ciri-ciri populasi. Statistika deskriptif ialah suatu metode yang berhubungan terhadap pengumpulan serta suatu data yang disajikan akibatnya dapat menyampaikan suatu informasi yang berguna [8].

Statistika deskriptif difungsikan dalam pendeskripsian maupun memberikan gambaran dalam suatu penelitian objek berdasarkan suatu data sampel atau populasi. Biasanya penyajian data dibentuk pada ukuran pemusatan data [8].

Ukuran pemusatan data yang sering digunakan yakni mean. Dengan kata lain, dalam bentuk ukuran pemusatan data juga bisa ditampilkan kedalam sebuah diagram maupun tabel [9].

2.2 Pohon Keputusan (Decision Tree)

Decision Tree (pohon keputusan) yakni suatu kondisi yang digunakan dalam klasifikasi objek, biasanya ditunjukkan dengan gambar daun serta cabang (Cho dan Ngai). Leaf (Daun) pada Decision Tree diidenfikasikan sebagai kelas, sedangkan suatu kondisi berdasarkan atribut objek yang telah diukur diwakili oleh cabangnya (internal node). Level node yang paling atas dari sebuah Decision Tree ialah akar (root) yang umumnya berbentuk atribut yang paling berpengaruh besar didalam suatu kelas tertentu. Pengunaana Decision Tree terhadap semua kasus yang memiliki nilai diskrit pada keluarannya (<=50K dan >50K, ya dan tidak, dll) [7].

(22)

6

Pohon keputusan yakni sebuah penyekatan yang dapat dikatakan sebagai sebuah penyekatan terulang. komponen penting pohon yaitu simpul dan sisi. Bagian yang terdapat didalam suatu pohon keputusan dapat berupa yakni [6]:

a. Simpul akar/utama (root node), simpul yang tidak mempunyai sisi yang masuk namun memiliki sisi yang keluar.

b. Simpul dalam (internal node), simpul yang memiliki 1 (satu) sisi yang masuk dan 2 (dua) maupun lebih sisi yang keluar.

c. Simpul terminal/akhir (terminal node), simpul yang mempunyai sisi masuk dan tidak ada sisi keluar . simpul terminal/akhir dapat dikatakan sebagai label kelas.

Dapat dilihat berdasarkan gambar [10] dari bentuk model pohon keputusan yakni:

Gambar 2.1 Model Pohon Keputusan

Pohon keputusan (Decision Tree) yakni suatu metode klasifikasi serta prediksi yang lumayan diketahui oleh sebagian orang. Ada beberapa keunggulan dalam pembentukan Decision Tree yakni seperti [11] :

1. Prediksi dan pengklasifikasian yang dapat dikatakan cukup akurat.

2. Penyajian berupa suatu gambar dan sangat mudah untuk dipahami serta juga memudahkan untuk pelaporan.

3. Menghasilkan penjelasan klasifikasi maupun alasan bagaimana suatu keputusan itu diambil.

(23)

7

4. Memaparkan peraturan (rule) yang dapat diterjemahkan kedalam bahasa sehari-hari dan lebih mudah dipahami.

5. Pembelajaran algoritma dapat dilakukan dengan cepat.

Terdapat syarat-syarat yang semestinya dipenuhi terhadap penerapan Decision Tree yakni seperti dibawah ini [6]:

1. Algoritma Decision Tree menampilkan supervised learning (baik input ataupun output datanya akan terlihat).

2. Data training yang beragam serta memiliki jumlah banyak.

3. Kelas atribut target diharuskan diskrit.

Sebagian jenis Decision Tree (pohon keputusan) yang umumnya digunakan ialah Classification and Regression Tree (CART); Quick, Unbiased, Efficient Statistical Tree (QUEST); Commercial Version 5.0 (C5.0); dan Chi-Squared Automatic Interaction Detector (CHAID). Dalam penelitian ini hanya dibahas Classification Tree memakai metode Classification and Regression Tree (CART).

2.3 Klasifikasi Pohon

2.3.1 Classification and Regression Tree (CART)

CART ialah suatu metode atau algoritma melalui teknik pohon keputusan.

Jika variabel respon bertipe kontinu maka menggunakan metode regresi pohon (Regression Tree), sementara andaikan variabel respon mempunyai skala kategorik sehingga menggunakan metode klasifikasi pohon (Classification Tree) [5].

Variabel respon yang akan digunakan dalam penelitian ini yakni menggunakan data kategorik. Oleh karena itu, metode yang akan dipakai ialah metode klasifikasi pohon [10].

Dibandingkan dengan metode klasifikasi lainnya, CART memiliki banyak keunggulan, yaitu hasil yang lebih dapat diinterpretasikan, lebih akurat, dan lebih cepat untuk dihitung. Tidak hanya itu, CART sering digunakan untuk dataset besar dengan banyak variabel melalui skala variabel campuran berdasarkan prosedur ordinasi biner [11]. Data pembelajaran digunakan untuk membentuk pohon klasifikasi yang optimal, sedangkan data uji digunakan untuk memvalidasi model,

(24)

8

yaitu seberapa baik model memprediksi data baru. Metode Classification and Regression Tree juga mempunyai beberapa kekurangan yaitu [7]:

a. Kemungkinan tidak stabilnya CART dalam Decesion Tree (Pohon Keputusan) dikarenakan oleh kesensitifan Classification and Regression Tree (CART) dengan data baru.

b. CART ditentukan dengan jumlah sampel, apabila sampel data learning dan testing mengalami perubahan sehingga hasil dari pohon keputusan juga akan berubah.

c. Setiap pemilihan bergantung terhadap nilai yang hanya terdapat pada satu variabel penjelas.

Sebuah pohon keputusan dibentuk dengan menggunakan algoritma partisi rekursif biner. Sorting adalah membagi data menjadi dua grup, grup node kiri dan grup node kanan. Terapkan splitter ke setiap node untuk mendapatkan node Akhir.

Variabel yang menjadi pembatas utama pada node merupakan variabel terpenting dalam pendugaan kelas dalam pengamatan [10]. Pohon klasifikasi dan regresi adalah metode biner pertama yang membagi semua pengamatan yang terdapat dalam simpul akar menjadi dua bagian, yang disebut simpul anak. Untuk tahap selanjutnya, masing-masing node anak ini akan menghasilkan node induk baru, yang akan dibagi lagi menjadi 2 node anak baru. dan seterusnya sampai Anda mendapatkan semua node yang tidak bisa atau tidak bisa lagi disekat [5].

Perkembangan metode oleh Leo Breiman, Jerome H. Friedman, Richard A.

Olshen dan Charles J. Stone ini ialah suatu teknik klasifikasi dengan menggunakan algoritma penyekatan. Pohon klasifikasi akan dihasilkan oleh CART apabila variabel respon memiliki skala kategorik serta pohon regresi apabila variabel respon adalah data kontinu [5]. Keutamaan tujuan dari Classification and Regression Tree (CART) yakni untuk memperoleh suatu keakuratan kelompok data sebagai penciri dalam suatu pengklasifikasian. Hasil dari prosedur penyekatan disajikan dalam bentuk struktur atau skema pohon klasifikasi dapat disampaikan dari gambar berikut, yakni:

(25)

9

Gambar 2.2 Skema Pohon Klasifikasi dan Regresi

2.3.2 Pembentukan Pohon Klasifikasi CART

Dalam pembentukan metode CART data yang digunakan berupa data training dan data testing. Pembentukan Pohon Classification and Regression Tree baik klasifikasi dan juga regresi terhadap metode ini dihasilkan dari ruang peubah penjelas yang disekat.

Pembentukan pohon regresi melalui penyekatan dilakukan dengan pertimbangan pada tingkat kehomogenan respon pada setiap simpul, sementara pohon klasifikasi penyekatan terbentuk melalui nilai perubahan impurity yang maksimum terhadap setiap simpul. Adapun tahapan pembuatan pohon klasifikasi dapat ditentukan melalui tahapan yakni [5]:

a. Mencari penyekatan pada setiap simpul

b. Mencari penyekatan yang terbaik (Goodness of split) yang memaksimumkan perubahan impurity

c. Menetapkan simpul akhir atau penghentian penyekatan (Terminal Node) d. Melakukan pemangkasan pohon klasifikasi

e. Menetapkan nilai dugaan pada setiap simpul akhir/Pohon klasifikasi optimal Suatu proses pembentukan pada pohon klasifikasi CART dapat dihasilkan berdasarkan aturan yakni [6]:

Simpul Asal

Cabang Ya Tidak

Simpul Dalam

Simpul Terminal

𝑡1

(26)

10

Pembentukan suatu pohon klasifikasi terdiri dari dalam empat tahapan proses yakni:

a. Menentukan Penyekatan setiap simpul / Pemilihan Pemilah

Dalam tahapan ini, misalkan peubah respon 𝑌 yang dimana suatu peubah kategorik akan diduga oleh 𝑚 peubah penjelas yakni X =

(

x1,x2,x3,,xm

)

. Beberapa peubah penjelas dapat berupa peubah nominal, ordinal, interval dan rasio [5].

Proses pembentukan pohon awal yaitu misalkan A  X yang mana X merupakan suatu ruang peubah penjelas dan A yakni suatu himpunan sekatan.

Penyekatan yang dibentuk berdasarkan pertanyaan yaitu {Apakah x A} jika

“iya” dipastikan amatan dalam simpul t termasuk kedalam sekatan himpunan A , jika jawabanya “tidak” maka amatan yang terdapat pada simpul t termasuk kedalam sekatan A yakni komplemen dari himpunan A [5]. c

Data yang diolah ialah data sampel data learning bersifat heterogen yang selanjutnya dipilah melalui aturan pemilihan goodness of split, yakni himpunan bagian dari hasil pemilihan harus lebih homogen dibandingkan dari pemilihan sebelumnya. Setiap pemilahan hanya disesuaikan terhadap nilai yang didapatkan dari suatu variabel independent.

Fungsi keheterogenan yang bisa dikatakan mudah serta sesuai diterapkan kepada berbagai kasus ialah kriteria gini yang dimana kriteria tersebut mengakibatkan pemisahan suatu kelas beserta anggota yang paling besar maupun kelas terpenting didalam simpul yang lebih didahului. Pemilahan yang merupakan pemilahan terbaik adalah hasil dari pemilahan yang menurunkan keheterogenan tertinggi [5]. Pemilihan sekatan yang baik terhadap penggunaan perhitungan kriteria gini yang dilihat dari nilai perubahan impurity yang maksimum [5]. Diawali dengan mencari nilai peluang setiap variabel atau dari setiap simpul dengan menggunakan kriteria gini.

Metode pemilihan pemilah dalam CART yang menggunakan indeks gini 𝑖(𝑡) dimana, ukuran ketingkatan ragam kelas pada simpul tertentu terhadap klasifikasi maka dapat membantu menentukan keoptimalan fungsi pemilah. Indeks gini

(27)

11

merupakan pemakaian fungsi keragaman yang mana pemilihan atribut dapat menghasilkan suatu pohon biner. kriteria gini merupakan pengukuran keragaman antara probabilitas suatu nilai atribut target [10]. Yakni suatu fungsi Indeks Gini dapat diperoleh dimana:

( )

t P

( )

jt

i = −

j= 1

1 2 (2.1) Keterangan:

𝑖(𝑡) : Indeks gini

𝑃(𝑗|𝑡) : Proporsi pada kelas j dalam simpul t dimana j =1,2,3,...,n dengan

( ) ( ) ( )

t n

t t n j

P = j

𝑛𝑗(𝑡) : Banyak pengamatan kelas j dalam simpul t 𝑛(𝑡) : Banyak pengamatan dalam simpul t

Ataribut yang dipilih dapat menghasilkan sebuah himpunan kelas yang dikatakan sebagai simpul atau node. Pemilihan secara rekursif yang pasti terjadi pada simpul hingga memperoleh terminal akhir.

b. Menetukan sekatan terbaik (Goodness of split)

Kemudian, langkah yang diperlukan yakni menentukan kriteria goodness-of- split dimana diperoleh nilai impurity berdasarkan suatu sekatan pemilihan oleh pemilah split 𝑠 pada 𝑡 yang akan dikatakan sebagai penurunan keheterogenan dengan cara mencarinya yakni [10]:

△ 𝐼(𝑠, 𝑡) = 𝑖(𝑡) − 𝑃𝐿𝑖(𝑡𝐿) − 𝑃𝑅𝑖(𝑡𝑅) (2.2) Keterangan:

𝑡𝑅 : Simpul kanan (right node) 𝑡𝐿 : Simpul kiri (left node)

𝑃𝑅 : Proporsi banyaknya objek yang termasuk dalam 𝑡𝑅 𝑃𝐿 : Proporsi banyaknya objek yang termasuk dalam 𝑡𝐿

Probabilitas banyaknya objek yang termasuk dalam 𝑡𝑅 dan 𝑡𝐿 akan melalui perhitungan (Mardiani, 2012):

𝑃

𝐿

=

𝑐𝑎𝑙𝑜𝑛 𝑠𝑖𝑚𝑝𝑢𝑙 𝑘𝑖𝑟𝑖

𝑑𝑎𝑡𝑎 𝑙𝑎𝑡𝑖ℎ𝑎𝑛

(2.3)

(28)

12

𝑃

𝑅

=

𝑐𝑎𝑙𝑜𝑛 𝑠𝑖𝑚𝑝𝑢𝑙 𝑘𝑎𝑛𝑎𝑛

𝑑𝑎𝑡𝑎 𝑙𝑎𝑡𝑖ℎ𝑎𝑛 (2.4) Pengembangan pohon diperoleh dengan menemukan beragam kemungkinan pemilah dari setiap penyekatan simpul 𝑡 yang selanjutnya akan didapat pemilah 𝑠 yang menghasilkan sekatan terbaik sehingga dapat memaksimumkan perubahan impurity dimana [5] :

△ 𝐼 = (𝑠, 𝑡) 𝑚𝑎𝑥𝑠𝜖𝑆 △ 𝐼(𝑠, 𝑡) (2.5) Pemilah yang memperoleh nilai tertinggi ialah pemilah yang terbaik dikarenakan hal ini berkemungkinan dalam keheterogenan yang direduksi secara lebih signifikat. Dalam penentuan pemilihan pemilah terbaik Metode yang sering digunakan yakni metode pemilahan indeks gini atau kriteria sekatan terbaik disebabkan lebih mudah serta sesu untuk dilaksanakan pada berbagai kasus serta memiliki kesederhanaan dan kecepatan perhitungan [5].

c. Penetuan Simpul Terminal/Penghentian Penyekatan

Simpul 𝑡 akan menjadi suatu simpul terminal atau tidaknya jika pada simpul 𝑡 tidak mengalami penurunan keheterogenan berdasarkan kriteria goodness-of-split maupun hanya menghasilkan satu pengamatan untuk setiap simpul anak atau jumlah kasus minimun pada suatu terminal akhir didalam pengamatan berjumlah kurang atau sama dengan yang telah ditetapkan. Misalkan 𝛽 > 0 ialah batas minimum impurity sehingga penyekatan akan berhenti apabila 𝑚𝑎𝑥𝑠∈𝑆 △ 𝐼(𝑠, 𝑡) <

𝛽. Oleh karena itu, terhentinya pembentukan pohon jika sudah berada pada batas jumlah level yang telah ditetapkan maupun dalam tingkat kedalaman dalam pohon maksimal [5].

Terhentinya proses pembentukan pohon klasifikasi bisa terjadi apabila pemecahan suatu simpul yang berulang-ulang tidak memungkinkan untuk dilakukan proses pemecahan, dikarenakan pada ujung pohon klasifikasi simpul akhir memiliki kelas yang sama (homogen) sehingga simpul akhir tidak dapat dipecah lagi [12].

(29)

13 d. Pemangkasan Pohon klasifikasi

Pembentukan pohon melalui aturan sekatan pemilihan pemilah dan kriteria goodness-of-split yang memiliki ukuran sangat besar dikarenakan pemberhentian pohon dilihat dari banyaknya pengamatan dalam simpul terminal (simpul akhir) atau besarnya tingkat kehomogenan, sehingga banyak jumlah sekatan semakin besar pohon yang dihasilkan yang memiliki tingkat kesalahan yang kecil. Pohon yang berukuran besar dapat menimbulkan overfitting (akurasi rendah), tetapi apabila terbatasnya pengamatan pohon terhadap ketepatan batas tertentu sehingga dapat menimbulkan underfitting.

Oleh karena itu, untuk memperoleh suatu kelayakan ukuran pohon (Optimal) dilakukan pemangkasan pohon menggunakan (cost complexity) minimum atau ukuran biaya kompleksitas, didefinisikan pembentukan pohon besar melalui prosedur penyekatan ialah 𝑇𝑚𝑎𝑥 dan 𝑇 < 𝑇𝑚𝑎𝑥 adalah sub pohon dari 𝑇𝑚𝑎𝑥. |𝑇̃|

yakni ukuran kompleksitas jumlah dari simpul akhir yang diperoleh [10]. Kriteria cost complexity yakni:

𝑅𝛼(𝑇) = 𝑅(𝑇) + 𝛼|𝑇̃| (2.6) yang dimana,

𝑅𝛼(𝑇) : Ukuran kompleksitas biaya

𝑅(𝑇) : Kesalahan pengklasifikasian pada node 𝑡 dalam pohon pada kompleksitas simpul akhir

|𝑇̃| : Banyaknya simpul akhir pada pohon 𝑇 𝛼 : Parameter kompleksitas biaya

𝑔𝑚 : Complexity Parameter

Cabang yang dipangkas ialah cabang yang memiliki nilai terkecil/terlemah untuk setiap simpul dalam node 𝑡, yaitu:

𝑔𝑚(𝑡) =𝑅(𝑡)−𝑅(𝑇|𝑇̃ 1)

1|−1 (2.7)

Sehingga jalur terlemah yakni cabang yang akan dipangkas didefenisikan:

𝑔𝑚 = 𝑚𝑖𝑛𝑡𝜖𝑇𝑔𝑚(𝑡)

(2.8)

(30)

14

Kesalahan pengklasifikasian dalam node 𝑡 didapatkan menggunakan rumus yakni:

𝑅(𝑡) = 𝑟(𝑡). 𝑃(𝑡) (2.9) Keterangan:

𝑟(𝑡) : Probabilitas atau peluang mengalami kesalahan dalam klasifikasi node 𝑡 dengan 𝑟(𝑡) = 1 − 𝑚𝑎𝑘𝑠 𝑃(𝑗|𝑡)

𝑃(𝑡) : Jumlah roporsi objek dalam simpul 𝑡

Pemangkasan pohon yang berukuran sangat besar dapat juga diperoleh dengan mengambil simpul pada 𝑡𝐿 yang merupakan simpul anak kiri dan 𝑡𝑅 yang merupakan simpul anak kanan dari pohon 𝑇𝑚𝑎𝑥 atau dapat dikatakan simpul induk (parent node) 𝑡. Untuk itu jika diperoleh kriteria:

𝑅𝑡= 𝑅(𝑡𝐿) + 𝑅(𝑡𝑅) (2.10)

maka simpul anak 𝑡𝐿 simpul kiri dan 𝑡𝑅 simpul kanan dipangkas. Proses tersebut diulang sampai tidak ada lagi pemangkasan yang memungkinkan untuk dilakukan [12].

e. Menentukan Pohon Klasifikasi Optimal

Besarnya ukuran pohon dapat menyebabkan nilai kompleksitas yang tinggi dimana struktur data yang tergambar lebih kompleks, oleh sebab itu dilakukan keoptimalan pemilihan pohon yang memiliki ukuran sederhana yang memperoleh nilai penduga pengganti yang terkecil. Dimana penduga yang sering digunakan yakni penduga validasi silang lipat V (cross validation V-fold estimate) [10].

Penggunaan penduga validasi silang lipat V untuk data yang tidak terlalu besar yakni berjumlah kurang dari < 3000 data. Untuk pengamatan cross validation V- fold estimate pengamatan dalam 𝐿 pembagian dengan random berupa V bagian yang saling lepas dalam ukuran kurang lebih sama besar dalam setiap kelasnya [10].

Pembentukan pohon 𝑇𝑣 melalui sampel learning ke-𝑣 yang mana 𝑣 = 1,2,3, … , 𝑉.

Penduga sampel uji dalam 𝑅(𝑇𝑡(𝑣)) diperoleh menggunakan rumus:

𝑅 (𝑇

𝑡(𝑣)

) =

1

𝑁𝑣

∑ 𝑋(𝑑

𝑉 (𝑣)

)

(2.11) Dimana,

(31)

15 𝑋(𝑑(𝑣)) : Hasil pengklasifikasian 𝑁𝑣 : Jumlah pengamatan dalam 𝐿𝑣

Keoptimalan pohon klasifikasi yang dapat ditetapkan pohon klasifikasi yang memiliki cross validation yang paling terkecil dimana pohon klasifikasi yang memiliki tingkat kesalahan pengklasifikasian terkecil mencapai persamaan sebagai berikut [7]:

APER

= 1 −

𝑛11+𝑛22

𝑁 (2.12) Dimana,

𝑛11 : Jumlah observasi dari kelas 1 dalam ketepatan prediksi sebagai kelas 1.

𝑛 : Jumlah observasi dari kelas 2 dalam ketepatan prediksi sebagai kelas 2.

2.3.3 Ukuran Keakuratan Klasifikasi

Ukuran keakuran klasifikasi digunakan untuk mengetahui apakah pengklasifikasian data yang sudah benar atau tidaknya dimana dapat diketahui seberapa baik sistem dalam mengklasifikasi data. Cara yang biasa digunakan dalam pengukuran keakuratan menggunakan metode Confusion Matrix, salah satu metode yang dalam pengukuran kinerja klasifikasi. Confusion Matrix dapat mengetahui informasi dalam perbandingan hasil klasifikasi yang dilakukan melalui sistem dengan hasil klasifikasi yang semestinya [10].

Pengukuran menggunakan Confusion Matrix memiliki empat istilah hasil proses klasifikasi yakni True Positive, True Negative, False Positif, dan False Negative [10]. Bentuk tabel confusion matrix dapat disajikan seperti tabel berikut [7]:

Tabel 2.1 Confusion Matrix

Terklasifikasi Positive Terklasifikasi Negative

Positif True Positive True Negative

Negatif False Positive False Negative

(32)

16

Penggambaran keakuratan sistem bisa mengklasifikasi data secara benar melalui nilai akurasi yang didapatkan. Yang dimana nilai akurasi ialah perbandingan antara klasifikasi data secara keseluruhan data yang telah diolah, yakni dapat diperoleh menggunakan persamaan sebagai berikut [10]:

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑇𝑃+𝑇𝑁

𝑇𝑃+𝐹𝑃+𝑇𝑁+𝐹𝑁 × 100% (2.13)

Dalam pencarian akurasi nilai True Negative (TN) ialah jumlah data negatif yang sudah dideteksi benar, sementara nilai False Positive (FP) ialah data negatif namun terdeteksi sebagai data positif. Selanjutnya True Positive (TP) ialah data positif yang terdeteksi benar, Sementara itu False Negative (FN) ialah data positif namun terdeteksi negatif [10].

2.4 Indeks Prestasi

Kemampuan akademik sebanding lurus dengan prestasi yang didapatkan, semakin baik kemampuan akademik seorang mahasiswa sehingga semakin baik juga prestasi yang diperoleh. keberhasilan mahasiswa terhadap penyelesaian kurikulum diketahui melalui prestasi akademik yang diperoleh, dan dapat dilihat dari hasil nilai Indeks Prestasi yang didapatkan pada tiap semester [13].

Indeks prestasi yakni salah satu alat ukur untuk mengetahui prestasi suatu mahasiswa dibidang akademik yang diduduki, Memiliki tingkatan dari yang amat baik sampai dengan gagal. Pada tingkat perguruan tinggi IP (indeks prestasi) dihitung berdasarkan bobot angka kredit normal nilai berkisaran antara 4(terbaik) sampai 0(gagal) [13].

Indeks prestasi suatu mahasiswa dapat diperoleh melalui perhitungan hasil setiap semester mahasiswa, untuk itu pada tahap awal semester pertama pecapaian indeks prestasi yang diperoleh dapat dipengaruhi dari berbagai banyak faktor internal maupun faktor eksternal, baik itu berupa pengaruh terhadap pekerjaan orang tua, asal sekolah, melalui jalur masuk maupun pendidikan orang tuanya [14].

Suatu nilai indeks prestasi yang memiliki batas atau perhitungan kelulusan tertentu yang mempunyai rentang nilai dari A,A-,B+,B,B-,C+,C,C-,D dan E.

dimana hasil pencapaian nilai yang diperoleh dapat dikategorikan berupa dengan

(33)

17

pujian, sangat memuaskan, memuaskan, dan cukup dari hasil indeks prestasi mahasiswa yang diperoleh pada awal semesternya [13].

Indeks prestasi yang diperoleh pada tiap semester tergantung dari pencapaian belajar yang dijalankan pada tiap-tiap mahasiswa baik berupa presentasi maupun evaluasi kemajuan belajar mahasiswa maupun dalam menyelesaikan tiap-tiap tugas yang diberikan [14].

Tingkat kelulusan suatu indeks prestasi dapat dihasilkan dari berbagai hal yang telah dilaksanakan pada tiap mahasiswa dalam menjalani proses belajar pada saat dikelas, baik berupa aktif dalam keikutsertaan kegiatan tanya jawab pada saat dosen mau pun pengajar menjelaskan dan dapat berupa tingginya nilai tugas-tugas serta ujian yang di perolehnya.

Setiap universitas maupun kampus lain mempunyai bobot indeks prestasi yang sama pada tiap tahap semester yang dijalani para mahasiswa, salah satunya Universitas Islam Negeri sultan Syarif Kasim Riau yang dimana data mahasiswa yang didapat berupa data mahasiswa Fakultas Sains dan Teknologi dari biodata tiap mahasiswa yang terdaftar didalam Fakultas Sains dan Teknologi di UIN Suska.

(34)

18

BAB III

METODE PENELITIAN

3.1 Jenis dan Sumber Data

Berdasarkan penelitian yang diperoleh jenis data yang terdapat pada penelitian ini yakni data sekunder diambil dari data mahasiswa Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau semester satu.

Pengambilan dan sumber data diperoleh dari kampus UIN Suska Riau yang didapat pada bagian Pusat Teknologi Informasi dan Pangkalan Data (PTIPD) Universitas Islam Negeri Sultan Syarif Kasim Riau.

3.2 Tempat dan Waktu Penelitian

Penelitian ini dilakukan dan diperoleh di Pusat Teknologi Informasi dan Pangkalan Data (PTIPD) Universitas Islam Negeri Sultan Syarif Kasim Riau pada bulan Juni tahun 2021.

3.3 Populasi dan Sampel Penelitian

Populasi yang terdapat didalam penelitian ini ialah mahasiswa Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau. Serta sampel yang digunakan dalam penelitian ini yakni seluruh mahasiswa semester satu tahun 2020 Fakultas Sains dan Teknologi UIN Suska riau.

3.4 Variabel Penelitian

Dalam penelitian ini terdapat variabel terikat dan variabel bebas yang akan diolah didalam penelitian yakni variabel-variabel berikut:

a. Variabel Terikat ( y ) yakni Indeks Prestasi Mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau pada semester pertama.

b. Variabel Bebas (x) yang akan dipakai dalam penelitian ini yakni jenis kelamin, jalur masuk, asal sekolah, pendapatan orang tua, pekerjaan orang tua, pendidikan ayah, dan pendidikan ibu.

(35)

19

Data variabel yang digunakan dapat dilihat dalam tabel 3.1 yakni variabel- variabel yang digunakan didalam penelitian sebagai berikut:

Tabel 3.1 Variabel Penelitian

No. Variabel Hasil Ukur

1. Indeks Prestasi 1: Dengan Pujian (3.51-4.00)

2: Sangat Memuaskan (2.76-3.50)

3: Memuaskan (2.75-2.25)

4: Cukup (< 2.25)

2. Jenis Kelamin 1: Laki-laki

2: Perempuan

3. Jalur Masuk

1: PBUD (Penelusuran Bibit Unggul Daerah)

2: SNMPTN

3: SBMPTN

4: Ujian Mandiri

4. Asal Sekolah 1: Kota Pekanbaru

2: Luar Kota/Luar Pekanbaru

5.

Pendapatan Orangtua/Bln (x 1.000

Rupiah) 1: < 500

2: 500 ≤ Pendapatan < 1500

3: 1500 ≤ Pendapatan < 2500

4: > 2500

6. Pekerjaan Orang Tua 1: PNS

2: Pedagang/Wirausaha

3: Karyawan Swasta

4: Tidak Bekerja

7. Pendidikan Ayah 1: Tidak tamat SD

2: SD

3: SMP

4: SMA

5: Diploma (DI/DII/DIII/DIV)

6: S1,S2,S3

8. Pendidikan Ibu 1: Tidak tamat SD

2: SD

3: SMP

4: SMA

5: Diploma (DI/DII/DIII/DIV)

6: S1,S2,S3

(36)

20 3.5 Metodologi Penelitian

Pada penelitian yang diolah menggunakan metode Classificasion and Regression Tree ini, berikut pengaplikasian metode yang digunakan dalam pembentukan pohon klasifikasi menggunakan CART dengan langkah-langkah:

1. Penginputan data indeks prestasi dan biodata mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau yang diperoleh dari Bagian PTIPD.

2. Deskriptif Data.

3. Mencari tabel tabulasi silang pada setiap peubah variabel independent yakni 𝑥1, 𝑥 , 𝑥 , 𝑥 ,…, 𝑥7.

4. Mencari penyekatan pada setiap simpul menggunakan kriteria gini yang menghasilkan 𝑡𝐿 dan 𝑡𝑅 serta menghasilkan nilai peubah impurity.

5. Menetukan sekatan terbaik dari kriteria Goodness of Split yang mana nilai yang memaksimumkan peubah impurity.

6. Penghentian pohon yakni menetapkan simpul terminal (apabila nilai pada peubah impurity menghasilkan nilai yang homogen) pohon klasifikasi terhenti.

7. Pembentukan pohon klasifikasi maksimal.

8. Menetukan pemangkasan pada pohon klasifikasi maksimal untuk mencari pohon yang paling terbaik.

9. Hasil diperoleh pohon terbaik yakni pohon optimal dengan nilai Cross Validation Estimate terkecil.

10. Interprestasi pohon optimal untuk mengidentifikasi indeks prestasi mahasiswa berdasarkan biodata menggunakan metode CART. Langkah-langkah CART ditampilkan pada Gambar 3.1 Diagram alur yakni:

(37)

21

Gambar 3.1 Flowchart Tahapan CART

Data indeks prestasi dan biodata mahasiswa

Pohon Klasifikasi Maksimal

Pohon Klasifikasi Optimal

Interpretasi Mulai

Mencari tabulasi silang pada seluruh variabel

Mencari penyekatan setiap simpul 𝑡𝐿 dan 𝑡𝑅

Menentukan sekatan terbaik

Penghentian Pohon

Menentukan pemangkasan pohon

Selesai

(38)

22 3.6 Alat dan Cara Organisir Data

Penelitian yang digunakan didalamnya berupa pengolahan data dengan menggunakan metode CART untuk mengetahui klasifikasi indeks prestasi mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau semester satu berdasarkan biodata mahasiswa. Hasil dalam penerapan metode CART akan ditampilkan kedalam bentuk sebuah diagram pohon keputusan (Decession Tree) dikarenakan data yang diperoleh merupakan data kategorik.

(39)

51

BAB V PENUTUP

5.1 Kesimpulan

Berdasarkan hasil identifikasi indeks prestasi dan biodata mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau pada semester satu menggunakan metode CART. Pohon optimal yang terbentuk memiliki 19 node dan memiliki 10 simpul terminal pada pohon optimal variabel terpenting yang berpengaruh terhadap indeks prestasi mahasiswa dan membentuk suatu pohon optimal ialah jenis kelamin, jalur masuk, dan pendidikan ibu. Dapat dilihat:

a. Pada simpul terminal node 18 indeks prestasi yang dikategorikan sangat memuaskan sebanyak 42 orang mahasiswa laki-laki berasal dari luar kota pekanbaru yang masuk melalui jalur SBMNPTN dengan pekerjaan orang tua sebagai wirausaha yang latar belakang pendidikan ibunya tamatan SMA, Diploma, dan Sarjana.

b. Pada simpul terminal node 17 indeks prestasi yang dikategorikan dengan pujian sebanyak 24 orang mahasiswa laki-laki berasal dari kota pekanbaru yang masuk melalui jalur SBMNPTN yang orang tuanya bekerja sebagai wirausaha dengan latar belakang pendidikan ibu tamatan SMA, Diploma dan Sarjana.

c. Pada simpul terminal node 15 indeks prestasi yang dikategorikan dengan pujian sebanyak 28 orang mahasiswa perempuan yang jalur masuknya melalui ujian mandiri dengan latar belakang pendidikan ibunya tamatan SMA, Diploma dan Sarjana.

d. Pada simpul node 16 indeks prestasi yang dikategorikan sangat memuaskan sebanyak 39 orang mahasiswa perempuan berasal dari luar kota pekanbaru dengan jalur masuk melalui ujian mandiri yang latar belakang pendidikan ibunya tamatan SMA, Diploma dan Sarjana.

(40)

52

Pada proses pengklasifikasian tingkat akurasi yang diperoleh sebesar 58%.

Untuk itu, dapat dikatakan ada faktor lain yang dapat mempengaruhi indeks prestasi mahasiswa Fakultas Sains dan Teknologi UIN Suska Riau.

5.2 Saran

Adapun saran didalam penelitian tugas akhir ini ialah diharapkan dalam penelitian ini dapat bermanfaat bagi yang membaca dan selanjutnya dapat diaplikasikan menggunakan metode klasifikasi yang berbeda untuk membandingkan hasil klasifikasi indeks prestasi pada Universitas Islam Negeri Sultan Syarif Kasim Riau dan Universitas lainnya.

(41)

53

DAFTAR PUSTAKA

[1] M. Muhardi, “Kontribusi pendidikan dalam meningkatkan kualitas bangsa Indonesia,” Mimbar. Jurnal. Sosial dan Pembangunan., vol. 20, no. 4, pp.

478–492, 2004.

[2] T. W. Soerjaningsih, “Peningkatan mutu proses Perguruan Tinggi melalui sistem mutu ISO 9000,” The Winners, vol. 5, no. 2, pp. 79–89, 2004.

[3] K. Daely, U. Sinulingga, and A. Manurung, “Analisis Statistik Faktor-Faktor yang mempengaruhi indeks prestasi mahasiswa,” Saintia Matematika., vol.

1, no. 5, pp. 483–494, 2013.

[4] W. David and A. R. A. Djamaris, “Metode Statiska Untuk Ilmu dan Teknologi Pangan,” Universitas Bakrie, 2018.

[5] L. Breiman, J. H. Friedman, R. A. Olshen, and C. J. Stone, Classification and regression trees. Routledge, 2017.

[6] S. H. Sumartini, “Penggunaan metode classification and regression trees (CART) untuk klasifikasi rekurensi pasien kanker serviks di RSUD Dr.

Soetomo Surabaya.” Institut Teknologi Sepuluh Nopember, 2015.

[7] A. N. AN, “Penerapan Metode CART (Classification and Regression Tree) Pada Tingkat Partisipasi Angkatan Kerja di Kota Makassar.” Universitas Islam Negeri Alauddin Makassar, 2019.

[8] Y. Nalim and S. Turmudi, “Statistika Deskriptif.pdf.” pp. 1–191, 2012.

[9] A. . S. Arigunanti, “Modul Matematika Statistika,” Modul Matematika.

Statiska, vol. 224538, no. Ukuran Pemusatan Data, Ukuran Letak Data, Ukuran Penyebaran Data, pp. 6–12, 2020.

(42)

54

[10] A. Y. Sari, “Penerapan Metode Classification and Regression Tress Pada Klasifikasi Kelayakan Peserta BPJS-PBI di Kelurahan Meranti Pandak Kota Pekanbaru.” Universitas Islam Negeri Sultan Syarif Kasim Riau, 2020.

[11] D. Siahaan, S. Wahyuningsih, and F. D. T. Amijaya, “Aplikasi Classification and Regression Tree (CART) dan Regresi Logistik Ordinal dalam Bidang Pendididikan (Studi Kasus: Predikat Kelulusan Mahasiswa S1 Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Mulawarman),” Jurnal Eksponensial, vol. 7, no. 1, pp. 95–104, 2016.

[12] Z. W. Mardika, M. A. Mukid, and H. Yasin, “Pembentukan Pohon Klasifikasi Biner Dengan Algoritma Cart (Classification And Regression Trees)(Studi Kasus: Kredit Macet di PD. BPR-BKK Purwokerto Utara),”

Jurnal Gaussian, vol. 5, no. 3, pp. 583–592, 2016.

[13] P. Hendikawati, “Analisis faktor yang mempengaruhi indeks prestasi mahasiswa,” Kreano, Jurnal Matematika Kreatif-Inovatif., vol. 2, no. 1, pp.

27–35, 2011.

[14] W. A. Mulyono, H. Purwandari, and R. H. Permana, “Pengaruh pelatihan gaya belajar terhadap peningkatan indeks prestasi mahasiswa,” Jurnal.

Keperawatan Soedirman, vol. 2, no. 3, pp. 134–140, 2007.

(43)

55

LAMPIRAN 1

DATA BIODATA MAHASISWA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU Tahun 2020

NO INDEKS JENIS JALUR ASAL PENDAPATAN PEKERJAAN PENDIDIKAN PENDIDIKAN

PRESTASI KELAMIN MASUK SEKOLAH ORANGTUA ORANGTUA AYAH IBU

1 2 1 2 1 1 3 3 3

2 1 1 2 1 4 1 6 4

3 1 1 2 2 2 4 4 4

4 1 1 2 1 4 3 4 4

5 2 1 2 2 4 1 4 6

6 1 1 2 1 4 3 4 4

7 2 1 2 2 3 4 4 4

8 2 1 2 2 4 2 4 3

9 2 1 2 2 4 1 6 4

10 1 1 2 2 1 4 3 2

11 2 1 2 2 1 4 4 3

12 1 1 2 1 4 1 6 6

13 2 1 2 1 4 4 5 6

14 2 1 2 2 1 4 4 4

15 4 1 2 1 1 4 6 6

16 2 1 2 1 1 4 4 3

17 2 1 2 1 2 2 4 3

18 2 1 2 2 1 4 4 4

19 1 1 2 2 4 2 2 3

(44)

56

20 1 1 2 2 4 1 4 2

21 1 1 2 2 4 4 4 6

22 2 1 2 2 4 2 4 6

23 2 1 2 2 1 4 3 3

24 2 1 2 2 4 1 4 6

25 2 1 2 2 1 4 2 3

26 2 1 2 2 4 1 4 6

27 1 1 2 2 4 1 6 4

28 4 1 2 1 2 4 4 6

29 1 2 2 2 1 4 4 3

30 2 2 2 1 4 4 3 4

31 2 2 2 2 2 2 4 3

32 1 2 2 2 1 4 4 3

33 2 2 2 2 4 1 3 6

34 1 2 2 2 1 4 4 4

35 1 2 2 2 1 3 4 4

36 2 2 2 2 4 1 6 3

37 1 2 2 2 4 3 4 4

38 2 2 2 2 4 2 4 4

39 1 2 2 2 1 4 2 3

40 1 2 2 2 4 1 5 4

41 4 2 2 2 2 3 3 4

42 1 2 2 2 1 4 3 2

43 2 2 2 1 4 2 2 3

44 2 2 2 2 4 2 3 2

45 2 2 2 2 1 4 4 3

Referensi

Dokumen terkait

Rumusan masalah yang akan diangkat dalam penelitian ini dilakukan dengan memperhatikan penjelasan latar belakang yang telah diberikan sehingga rumusan masalah yang akan ditelaah

Berdasarkan latar belakang masalah diatas, rumusan masalah dalam penelitian ini adalah berapa besar akurasi yang dihasilkan sistem menggunakan algoritma

Berdasarkan latar belakang yang telah diuraikan diatas, maka rumusan masalah yang didapatkan adalah “Bagaimana merancang media interaktif Manasik Haji untuk membantu para calon

Berdasarkan latar belakang diatas, maka penulis mencoba untuk merumuskan masalah yang menjadi perhatian dalam penelitian ini adalah potensi faktor-faktor yang dapat

Rumusan Masalah Berdasarkan uraian dari latar belakang di atas yang menjadi rumusan masalah adalah “Bagaimana pelayanan asuhan kebidanan secara komprehensif pengkajian, identifikasi

1.2 Rumusan Masalah Dari uraian latar belakang di atas yang menjadi rumusan masalah adalah “Bagaimana pelayanan asuhan kebidanan secara komprehensif pada masa kehamilan, persalinan,

1.2 Rumusan Masalah Berdasarkan latar belakang yang telah dijabarkan diatas, maka uang menjadi tujuan utama dalam penelitian ini adalah menguji beberapa variabel penelitian yaitu

Berdasarkan latar belakang yang dijabarkan diatas, maka di bangun sistem pendukung keputusan penentuan kelulusan Ujian Kompetensi Keahlian UKK pada jurusan Otomotif Alat Berat di Smk