• Tidak ada hasil yang ditemukan

D E P A R T E M E N T E K N I K I N D U S T R I F A K U L T A S T E K N I K UNIVERSITAS SUMATERA UTARA M E D A N

N/A
N/A
Protected

Academic year: 2022

Membagikan "D E P A R T E M E N T E K N I K I N D U S T R I F A K U L T A S T E K N I K UNIVERSITAS SUMATERA UTARA M E D A N"

Copied!
115
0
0

Teks penuh

(1)

ANALISIS PREDIKSI KELULUSAN MAHASISWA TEPAT WAKTU BERDASARKAN KINERJA AKADEMIS MAHASISWA

MENGGUNAKAN ALGORITMA NAÏVE BAYES DENGAN IMPLEMENTASI DATA MINING

STUDI KASUS : DEPARTEMEN TEKNIK INDUSTRI USU

DRAFT TUGAS SARJANA

Diajukan untuk Memenuhi Sebagian dari Syarat- syarat Penulisan Tugas Sarjana

Oleh: Ratu H Tambunan NIM : 160403079

D E P A R T E M E N T E K N I K I N D U S T R I F A K U L T A S T E K N I K

UNIVERSITAS SUMATERA UTARA M E D A N

2 0 2 0

(2)
(3)
(4)

KATA PENGANTAR

Segala puji dan syukur penulis ucapkan kehadirat Allah SWT, atas limpahan rahmat dan karunia-Nya, sehingga penulis dapat merampungkan Penelitian Tugas Sarjana ini.

Laporan Tugas Sarjana ini merupakan salah satu persyaratan yang diajukan kepada Departemen Teknik Industri, Fakultas Teknik, Universitas Sumatera Utara untuk memperoleh Gelar Sarjana Teknik (Strata Satu Teknik Industri). Adapun Tugas Sarjana ini berjudul Analisis Prediksi Kelulusan Mahasiswa Tepat Waktu berdasarkan Kinerja Akademis Mahasiswa Menggunakan Algoritma Naïve Bayes dengan Implementasi Data Mining. Studi Kasus : Departemen Teknik Industri USU.

Penulis menyadari bahwa penyusunan tugas sarjana ini masih terdapat kekurangan sehingga diperlukan perbaikan dan penyesuaian lebih lanjut. Untuk itu penulis mengharapkan kritik atau saran yang membangun dalam penyempurnaan laporan. Semoga Tugas Sarjana ini membawa manfaat dan berguna bagi penelitian selanjutnya.

UNIVERSITAS SUMATERA UTARA PENULIS,

MEDAN, JUNI 2020 RATU H TAMBUNAN

(5)

UCAPAN TERIMA KASIH

Dalam penyusunan penelitian tugas sarjana ini, tidak terlepas dari dukungan banyak pihak. Peneliti secara khusus mengucapkan terima kasih yang sebesar-besarnya kepada semua pihak yang telah membantu. Peneliti banyak menerima bimbingan, petunjuk dan bantuan serta dorongan dari berbagai pihak baik yang bersifat moral maupun material. Pada kesempatan ini penulis menyampaikan rasa terima kasih yang sebesar-besarnya kepada:

1. Allah SWT dengan segala rahmat serta karunia-Nya yang memberikan kekuatan bagi peneliti dalam menyelesaikan skripsi ini.

2. Kedua orang tua tercinta yang selama ini telah membantu peneliti dalam bentuk perhatian, kasih sayang, semangat, serta doa yang tidak henti-hentinya mengalir demi kelancaran dan kesuksesan peneliti dalam menyelesaikan tugas sarjana ini.

3. Ibu Dr. Ir. Meilita Tryana Sembiring, MT., IPM., selaku Ketua Departemen Teknik Industri, Fakultas Teknik, Universitas Sumatera Utara, Medan sekaligus dosen pembimbing Tugas Sarjana yang telah banyak meluangkan waktu dan pikirannya untuk membimbing penulis dalam penyelesaian laporan tugas sarjana ini.

4. Bapak Prof. Dr. Ir. Harmein Nasution, MSIE selaku Koordinator Tugas Akhir yang telah memberikan arahan dan masukan terkait topik tugas sarjana penulis.

(6)

5. Seluruh Dosen Departemen Teknik Industri, Fakultas Teknik, Universitas Sumatera Utara yang telah mendidik penulis selama perkuliahan berlangsung.

6. Seluruh Rekan sahabat KITA SQUAD yang telah mendukung dan memberi motivasi dalam penyelesaian laporan tugas sarjana ini.

7. Rekan-rekan asisten Laboratorium Sistem Produksi yang telah memberikan bantuan, motivasi, dukungan dan semangat kepada penulis dalam penyelesaian Laporan tugas sarjana ini.

8. Sahabat-sahabat penulis di Departemen Teknik Industri, Fakultas Teknik USU khususnya teman-teman angkatan 2016 “FIERLAS” yang tidak dapat disebutkan satu per satu yang telah memberikan dukungan kepada penulis dalam penyelesaian Laporan Tugas Sarjana ini.

9. Seluruh staf dan karyawan Departemen Teknik Industri, Fakultas Teknik, Universitas Sumatera Utara yang banyak membantu dan memberikan dukungan kepada penulis.

10. Semua pihak yang telah banyak membantu penulis dalam menyelesaikan laporan ini yang tidak dapat disebutkan satu per satu.

(7)

ABSTRAK

Salah satu indikator kinerja Perguruan Tinggi adalah presentasi kelulusan mahasiswa tepat waktu. Berlimpahnya data dalam Sistem Informasi Akademik (SIA) Perguruan Tinggi tidak dimanfaatkan dalam mengukur kinerja suatu Perguruan Tinggi khususnya Program Studi. Departemen Teknik Industri merangkum data mahasiswa di dalam SIA sebagai database dan mengolahnya sesuai dengan hal yang dibutuhkan. Selama ini data yang berlimpah di SIA belum dimanfaatkan untuk menilai kinerja mahasiswa. Ketika Program Studi melakukan evaluasi akademis mahasiswa, Program Studi mengevaluasi berdasarkan variabel jumlah SKS, IPK dan kendala mahasiswa tersebut. Dalam Program Studi perlu suatu klasifikasi yang tepat untuk mempermudah mengevaluasi performansi mahasiswa. Metode yang digunakan adalah algoritma Naïve Bayes dalam mengklasifikasi kinerja akademik mahasiswa Departemen Teknik Industri USU.

Atribut yang digunakan antara lain NIM, Nama, Jenis Kelamin, Asal Daerah, Asal Sekolah, Jalur Masuk, dan IPK. Dari hasil uji coba 173 data sampel menggunakan algoritma Naïve Bayes, pola yang dibentuk mempunyai akurasi kecocokan sebesar 70,83% yang artinya pola tersebut efektif dalam melakukan prediksi kelulusan mahasiswa yang selanjutnya menjadi evaluasi untuk performansi mahasiswa dengan rule rekomendasi yang diusulkan untuk pihak universitas dianalisis menggunakan metode Decision Tree yang menunjukkan atribut paling berpengaruh diantaranya IPK, Jalur Masuk, Jenis Kelamin, dan Asal Sekolah.

Kata Kunci : Data Mining, Algoritma Naive Bayes, Rapidminer 7.3, Decision Tree, Kinerja Akademis, Kelulusan Mahasiswa

(8)

ABSTRACT

One indicator of Higher Education performance is the presentation of student graduation on time. Abundant data in the Academic Information System (SIA) of Higher Education is not utilized in measuring the performance of an Higher Education, especially Study Programs. The Industrial Engineering Department summarizes student data in the SIA as a database and processes it according to what is needed. So far, the abundant data in SIA has not been utilized to assess student performance. When the Study Program conducts an academic evaluation of students, the Study Program evaluates based on the variable number of SKS, GPA and constraints of the student. In the Study Program needs an appropriate classification to facilitate evaluating student performance. The method used is the Naïve Bayes algorithm in classifying academic performance of USU Department of Industrial Engineering students. The attributes used include NIM, Name, Gender, Regional Origin, School of Origin, Entry Path, and GPA. From the trial results of 173 sample data using the Naïve Bayes algorithm, the pattern formed has a matching accuracy of 70.83% which means the pattern is effective in predicting student graduation which then becomes an evaluation for student performance with the recommended rule recommendations for the university analyzed using Decision Tree method which shows the most influential attributes including GPA, Entry Path, Gender, and School Origin.

Keywords: Data Mining, Naive Bayes Algorithm, Rapidminer 7.3, Decision Tree, Academic Performance, Student Graduation

(9)

DAFTAR ISI

BAB HALAMAN

LEMBAR JUDUL... i

LEMBAR PENGESAHAN... ii

KATA PENGANTAR... iii

UCAPAN TERIMA KASIH... iv

DAFTAR ISI... vi

DAFTAR TABEL... xi

DAFTAR GAMBAR ... xiii

DAFTAR LAMPIRAN... xiv

I PENDAHULUAN... I-1 1.1. Latar Belakang... I-1 1.2. Rumusan Masalah ... I-3 1.3. Tujuan Penelitian ... I-4 1.4. Manfaat Penelitian ... I-4 1.5. Batasan Masalah dan Asumsi ... I-5 1.6. Sistematika Penulisan Laporan ... I-6

II GAMBARAN UMUM... II-1 2.1. Sejarah Ringkas Tentang Departemen Teknik Industri ... II-1 2.2. Ruang Lingkup Departemen Teknik Industri... II-2

(10)

DAFTAR ISI (LANJUTAN)

ii

BAB HALAMAN

2.3. Organisasi dan Manajemen... II-3 2.3.1. Staf Akademik... II-4 2.3.2. Fasilitas Departemen Teknik Industri... II-7

III TINJAUAN PUSTAKA... III-1 3.1. Data Mining... III-1 3.2. Metode Pelatihan... III-2

3.3. Pengelompokkan Data Mining... III-2 3.4. Tahap-tahap Data Mining... III-3 3.5. Jenis Data yang Bisa Ditambang... III-6 3.6. Tools Data mining ... III-8 3.6.1. Weka... III-8 3.6.2. KEEL... III-9 3.6.3. R... III-10 3.6.4. KNIME... III-11 3.6.5. RAPID MINER... III-13 3.6.5.1. Parameter Akurasi Pada Rapidminer... III-14 3.6.6. ORANGE... III-14 3.7. Algoritma Naïve Bayes... III-15 ..

3.8. Pohon Keputusan (Decision Tree)... III-16 3.9. Peraturan Terkait Mahasiswa dan Perguruan Tinggi... III-17

(11)

DAFTAR ISI (LANJUTAN)

iii

BAB HALAMAN

3.9.1. Luaran dan Capaian Tridharma... III-19 3.9.1.1. Fokus Penilaian... III-19 3.9.1.2. Indikator dan Deskripsi Penilaian... III-20 IV METODOLOGI PENELITIAN ... IV-1

4.1. Tempat dan Waktu Penelitian... IV-1 4.2. Jenis Penelitian... IV-1 4.3. Objek Penelitian... IV-1 4.4. Variabel Penelitian ... IV-2

4.4.1. Variabel Dependen ... IV-2 4.4.2. Variabel Independen ... IV-2 4.5. Kerangka Konseptual... IV-3 4.6. Metode Pengumpulan Data... IV-4 4.7. Metode Pengolahan Data... IV-4 4.8. Kesimpulan dan Saran... IV-6

V PENGUMPULAN DAN PENGOLAHAN DATA ... V-1 5.1. Pengumpulan Data... V-1 5.1.1. Pembersihan Data (Data Cleaning) ... V-1 5.1.2. Integrasi Data... V-2 5.1.3. Transformasi Data ... V-2

(12)

DAFTAR ISI (LANJUTAN)

iv

BAB HALAMAN

5.2. Pengolahan Data ... V-3 5.2.1. Penerapan Algoritma Naïve Bayes... V-3

5.2.2. Implementasi Perhitungan menggunakan Model Naïve

Bayes ... V-20 5.2.3. Implementasi Pada Software Rapidminer 7.3 ... V-28 5.2.3.1. Pengujian Akurasi Prediksi... V-28

5.2.3.2. Rule Pengambilan Keputusan menggunakan Metode Pohon Keputusan (Decision

Tree)... V-32

VI ANALISIS DAN PEMBAHASAN ... VI-1 6.1. Penentuan Model dengan Kasus ... VI-1 6.2. Penentuan Atribut yang Dipakai dalam Membangun Model.... VI-1 6.3. Analisa Penerapan Algoritma Naïve Bayes... VI-3 6.4. Analisa Penggunaan Software Rapidminer 7.3... VI-3 6.5. Analisis Performansi Akurasi Prediksi Kelulusan Mahasiswa... VI-4

6.6. Analisis Parameter Performansi Penjadwalan Metode

Perusahaan dan Metode Tabu Search... VI-5 6.7. Analisis Rekomendasi Atribut Keputusan Paling Berpengaruh

pada Prediksi Kelulusan Mahasiswa...

VI-6

(13)

DAFTAR ISI (LANJUTAN)

v

BAB HALAMAN

6.7.1. Keluaran Rekomendasi Atribut IPK ... VI-1 6.7.2. Keluaran Rekomendasi Atribut Jenis Kelamin... VI-10 6.7.3. Keluaran Rekomendasi Atribut Jalur Masuk... VI-11 6.7.4. Keluaran Rekomendasi Atribut Asal Sekolah... VI-11 6.8. Evaluasi Performansi Akurasi Prediksi Kelulusan Mahasiswa... VI-12 6.9. Evaluasi Kelulusan Mahasiswa Tidak Tepat Waktu berdasarkan

BPMN Pendidikan ... VI-12

VII KESIMPULAN DAN SARAN... VII-1 7.1. Kesimpulan ... VII-1

7.2. Saran ... VII-2

(14)

DAFTAR TABEL

TABEL HALAMAN

2.1. Daftar Staf Pengajar Tetap... II-4 2.2. Daftar Staf Pengajar Tidak Tetap ... II-6 2.3. Staf Pegawai Administrasi di Departemen Teknik Industri USU ... II-6 3.1. Informasi mengenai software We k a... III-9 3.2. Informasi mengenai software KEEL ... III-10 3.3. Informasi mengenai software R... III-11 3.4. Informasi mengenai software K N I M E ... III-12 3.5. Informasi mengenai software R a p i d Mi ne r ... III-13 3.6. Parameter Akurasi pada R a p i d Mi ne r ... III-14 3.7. Informasi mengenai software O r a n g e ... III-15 5.1. Data Training ... V-5 5.2. Rekapan Hasil Perhitungan Peluang Tiap Atribut Kategorial... V-14 5.3. Rekapan Normalisasi Data Kelulusan Tepat... V-16 5.4. Rekapan Normalisasi Data Kelulusan Terlambat... V-17 5.5. Rekapan Hasil Perhitungan P (IPK) Kelulusan Tepat dan

Terlambat... V-19 5.6. Data Testing ... V-21 5.7. Hasil Prediksi Kelulusan Pada Data Testing ... V-25 6.1. Desain Data Input pada Software Rapidminer ... VI-4 6.2. Desain Data Output pada Software Rapidminer ... VI-4 6.3. Contoh Data Bukti Penelitian ... VI-8

(15)

DAFTAR GAMBAR

GAMBAR HALAMAN

2.1. Struktur Organisasi Departemen Teknik Industri USU... II-3 3.1. Tahap-tahap Data Mining... III-4 3.2. Metode Data Mining... III-5 3.3. Konsep Decision Tree... III-17 3.4. Diagram Proses Akreditasi... III-18 4.1. Kerangka Konseptual ... IV-4 4.2. Blok Diagram Pengolahan Data... IV-5 5.1. Tampilan Jendela Awal Rapidminer 7.3... V-28 5.2. Data Training BS... V-29 5.3. Data Setelah Penggantian Type... V-29 5.4. Data Masuk Pada Software Rapidminer... V-30 5.5. Panel Terhubung... ... V-30 5.6. Hasil Uji Akurasi Menggunakan Rapidminer 7.3... V-31 5.7. Proses Pembangunan Pohon Keputusan... V-32 5.8. Decision Tree Kelulusan Mahasiswa... V-33 5.9. Description Result... V-34 6.1. Hasil Pengujian Validitas Atribut Keseluruhan... VI-2 6.2. Hasil Uji Akurasi Menggunakan Rapidminer 7.3... VI-5 6.3. Dashboard Business Intelligent Kelulusan Mahasiswa... VI-5 6.4. Dashboard Business Intelligent Keterkaitan IPK dengan

Atribut Penelitian Lain... VI-9 6.5. Dashboard Business Intelligent Keterkaitan Jenis Kelamin

dengan Atribut Penelitian Lain... VI-10 6.6. Business Process Model and Notation (BPMN) Pendidikan VI-13

(16)

DAFTAR LAMPIRAN

1. Surat Keputusan (SK) Tugas Akhir 2. Form Pengajuan Tugas Akhir 3. Berita Acara Bimbingan

(17)

I-1 BAB I PENDAHULUAN

1.1. Latar Belakang

Kemajuan teknologi informasi sudah semakin berkembang pesat disegala bidang kehidupan. Banyak sekali data yang dihasilkan oleh teknologi informasi, mulai dari bidang industri, ekonomi, ilmu dan teknologi serta berbagai bidang kehidupan lainnya. Data-data tersebut begitu berlimpah namun masih tersembunyi sehingga tidak termanfaatkan dengan baik. (Oscar, Johan. 2013).

Pengolahan data tersembunyi dapat dimulai dengan melakukan penambangan data atau yang biasa disebut data mining. Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih, dengan menggunakan teknik atau metode tertentu. Data mining atau Knowledge Discovery in Database (KDD) merupakan proses ekstraksi informasi-informasi penting atau knowledge dari basis data yang besar. Data mining menspesifikasikan pola-pola yang ditemukan pada kumpulan data tersebut sehingga data yang telah ada itu lebih bermanfaat dalam kehidupan nyata.

(Kapiudin, Maulani. 2007).

Perkembangan dunia usaha semakin meningkat ditunjang dengan perkembangan komunikasi yang mempermudah organisasi atau perusahaan untuk mengakses data, sehingga mengubah manajemen basis data menjadi manajemen basis data tingkat lanjut didukung dengan fasilitas data warehousing dan fasilitas

(18)

I-2

basis data berbasis web sebagai salah satu strategi organisasi dalam meningkatkan kinerja dan keuntungan organisasi.

Pada institusi pendidikan perguruan tinggi, data mahasiswa dan data jumlah kelulusan mahasiswa dapat menghasilkan informasi yang berlimpah. Salah satu indikator kinerja Perguruan Tinggi adalah presentasi kelulusan mahasiswa tepat waktu. (Peraturan Badan Akreditasi Nasional Perguruan Tinggi Nomor 3 tahun 2019 tentang Instrumen Akreditasi Perguruan Tinggi). Berlimpahnya data dalam Sistem Informasi Akademik (SIA) Perguruan Tinggi tidak dimanfaatkan dalam mengukur kinerja suatu Perguruan Tinggi khususnya Program Studi.

Padahal banyak data berupa jumlah kelulusan setiap tahunnya, profil, dan hasil akademik mahasiswa memberikan informasi yang tersembunyi yang dapat diketahui dengan cara melakukan pengolahan terhadap data mahasiswa sehingga berguna bagi pihak universitas

Departemen Teknik Industri merangkum data mahasiswa di dalam SIA sebagai database dan mengolahnya sesuai dengan hal yang dibutuhkan. Selama ini data yang berlimpah di SIA belum dimanfaatkan untuk menilai kinerja mahasiswa. Ketika Program Studi melakukan evaluasi akademis mahasiswa, Program Studi mengevaluasi berdasarkan variabel jumlah SKS, IPK dan kendala mahasiswa tersebut. Sementara variabel data SIA lainnya belum dimanfaatkan sebagai penilaian kinerja mahasiswa seperti jenis kelamin, asal sekolah, asal daerah, jalur masuk bahkan adanya pengelompokan kelas berdasarkan jalur masuk. Dalam Program Studi perlu suatu klasifikasi yang tepat untuk mempermudah mengevaluasi kinerja mahasiswa. Metode yang digunakan adalah

(19)

I-3

algoritma Naïve Bayes dalam mengklasifikasi kinerja akademik mahasiswa Departemen Teknik Industri USU.

Beberapa penelitian terkait dengan topik penelitian pernah dilakukan dengan mengevaluasi kinerja akademik mahasiswa menggunakan algoritma naïve bayes dengan memanfaatkan indikator indeks prestasi (ip) sebagai penentu mahasiswa lulus atau lulus tidak tepat waktu dengan hasil akurasi sebesar 70%

pada Perguruan Tinggi Negeri Universitas Brawijaya, Malang (Mujib, Hadi Suyono. 2013). Juga penelitian yang dilakukan dengan analisis data mining untuk pemetaan mahasiswa yang membutuhkan bimbingan dan konseling menggunakan algoritma naïve bayes classifier pada Perguruan Tinggi Negeri Universitas Negeri Padang (Saputra, Kurnia Hadi.2018). Penelitian ini nantinya diharapkan dapat membantu kinerja departemen dalam meningkatkan jumlah kelulusan mahasiswa tepat waktu dengan mempertimbangkan analisis dan evaluasi penelitian.

1.2. Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan diatas, masalah yang perlu dicari pemecahannya melalui penelitian ini adalah :

1. Bagaimana tingkat kelulusan mahasiswa di Teknik Industri USU?

2. Bagaimana klasifikasi mahasiswa di Teknik Industri USU?

3. Bagaimana membuat rekomendasi terhadap performansi mahasiswa agar lulus tepat waktu?

(20)

I-4

1.3. Tujuan Penelitian

Tujuan umum yang akan dicapai dalam penelitian tugas akhir ini adalah untuk mengklasifikasikan mahasiswa program studi S1 jurusan Teknik Industri USU yang dapat lulus tepat waktu dan tidak dapat lulus tepat waktu menggunakan algoritma Naïve Bayes.

Adapun tujuan khusus yang ingin dicapai dalam penelitian tugas akhir ini adalah:

1. Mengetahui tingkat kelulusan mahasiswa Departemen Teknik Industri, Fakultas Teknik, Universitas Sumatera Utara stambuk 2016.

2. Mengklasifikasikan kelulusan mahasiswa program studi S1 jurusan Teknik Industri USU menggunakan algoritma Naïve Bayes.

3. Membuat rekomendasi terhadap performansi mahasiswa agar lulus tepat waktu.

1.4. Manfaat Penelitian

Manfaat yang hendak dicapai dalam melakukan penelitian ini adalah sebagai berikut:

1. Manfaat bagi mahasiswa

a. Mahasiswa dapat mengaplikasikan teori yang diperoleh selama kuliah di lapangan kerja dan menambah keterampilan dan pengalaman dalam menganalisis masalah serta memecahkan masalah sebelum memasuki dunia kerja.

(21)

I-5

b. Mahasiswa dapat mempelajari dan mengetahui prediksi lama masa studi dari setiap mahasiswa yang telah menempuh kuliah hingga minimal semester IV dengan menggunakan dasar data kelulusan sebelumnya.

2. Manfaat bagi Universitas

Penelitian ini dapat dijadikan referensi bagi pihak Universitas dalam melakukan perekrutan mahasiswa baru khususnya untuk prodi S1 Teknik Industri.

3. Bagi Departemen Teknik Industri USU

Departemen dapat meningkatkan hubungan kerjasama denganpihak Universitas terkait performansi mahasiswa dan membantu kinerja departemen dalam mengklasifikasikan kelulusan mahasiswa.

1.5. Batasan Masalah dan Asumsi

Batasan masalah dalam penelitian ini adalah sebagai berikut:

1. Data yang digunakan adalah data mahasiswa Teknik Industri USU kelulusan tahun 2017, 2018, 2019.

2. Variabel yang digunakan antara lain NIM, Nama Mahasiswa, Asal Sekolah, Jalur Masuk, SKS, IPK, Tahun Lulus.

3. Sumber data diperoleh berdasarkan data yang diambil dari SIA Departemen Teknik Industri.

4. Data yang diambil berupa data mahasiswa stambuk 2013 sampai 2015 yang digunakan sebagai data training dan data mahasiswa stambuk 2016 sebagai data target.

(22)

I-6

5. Mengaplikasikan algoritma naïve bayes dalam klasifikasikasi data.

6. Mengaplikasikan software Rapid Minner 7.3 sebagai alat bantu dalam uji klasifikasi data menggunakan algoritma naïve bayes.

Asumsi-asumsi yang digunakan dalam penelitian ini adalah sebagai berikut:

1. Hubungan antar variabel yang diamati memiliki hubungan korelasi yang positif.

2. Data yang digunakan merupakan data yang diperoleh dari sumber yang valid.

3. Data yang diambil mewakili keseluruhan mahasiswa Teknik Industri, Fakultas Teknik, Universitas Sumatera Utara.

1.6. Sistematika Penulisan Tugas Akhir

Sistematika yang digunakan dalam penulisan tugas akhir ini adalah sebagai berikut:

Bab I Pendahuluan, menguraikan latar belakang masalah yang mendasari penelitian dilakukan, rumusan masalah, tujuan dan manfaat penelitian, batasan masalah dan asumsi penelitian, serta sistematika penulisan tugas sarjana.

Bab II Tinjauan Pustaka, menguraikan teori-teori yang digunakan dalam penelitian yaitu Teori Data Mining, Jenis Data Mining, Tahapan Data Mining, Metode Data Mining, Tools Data Mining, dan Algoritma Naïve Bayes. Sumber teori atau literatur yang digunakan diambil dari referensi buku dan jurnal penelitian yang berhubungan dengan topik penelitian yang dapat dilihat pada Daftar Pustaka.

(23)

I-7

Bab III Metodologi Penelitian, menguraikan tahap-tahap yang dilakukan dalam penelitian yaitu persiapan penelitian meliputi penentuan lokasi penelitian, objek penelitian, jenis penelitian, kerangka konseptual, variabel peneltian, dan instrumen pengumpulan data serta langkah-langkah penelitian meliputi pengumpulan data, pengolahan data, analisis pemecahan masalah sampai kesimpulan dan saran.

Bab IV, yaitu Pengumpulan dan Pengolahan Data, memuat data-data yang dikumpulkan peneliti yang berhubungan dengan pemecahan permasalahan penelitian, baik data primer maupun data sekunder, serta bagaimana data-data tersebut diolah untuk memperoleh hasil yang menjadi dasar pemecahan permasalahan tersebut.

Bab V Analisis dan Pembahasan, yang memaparkan analisis terhadap hasil dari pengolahan data dan hasil pemecahan permasalahan penelitian sehingga dapat dilihat seberapa besar peningkatan yang dapat diberikan kepada perusahaan.

Bab VI Kesimpulan dan Saran, memberikan hasil yang ditunjukkan oleh penelitian seperti usulan perbaikan yang diperoleh dari pemecahan masalah serta saran-saran yang berkaitan dengan penelitian.

(24)

II-1 BAB II

GAMBARAN UMUM

2.1. Sejarah Ringkas Tentang Departemen Teknik Industri

Program Studi Teknik Industri didirikan tahun 1965 dan berada di lingkungan Fakultas Teknik Universitas Sumatera Utara. Sesuai dengan surat Keputusan Menteri P&K No.0174/0/1983 tanggal 14 Maret 1983 dan No.

0535/0/1983 tanggal 8 Desember 1983 nama Program Studi Teknik Industri berubah menjadi Program Studi Teknik dan Manajemen Industri. Selanjutnya sesuai dengan keputusan Mendikbud No. 0218/U/1995 tertanggal 25 Juli 1995 Program Studi Teknik dan Manajemen Industri berubah kembali menjadi Program Studi Teknik Industri hingga saat ini.

Saat ini Departemen Teknik Industri FT-USU telah memiliki tiga pembidangan yaitu:

1. Rekayasa Sistem Manufaktur : perancangan , operasi yang saling berhubungan dengan tujuan menjembatani fungsi-fungsi produksi, agar dicapai performansi produktivitas total sistem yang optimal seperti waktu produksi, ongkos dan utilitas mesin.

2. Manajemen : suatu proses dalam rangka mencapai tujuan dengan bekerjasama melalui orang-orang dan sumber daya organisasi lainnya.

3. Ergonomi dan Perancangan Kerja : suatu cabang ilmu yang sistematis untuk mencapai suatu tujuan yang diinginkan melalui pekerjaan itu dengan efektif dan nyaman.

(25)

II-2

2.2. Ruang Lingkup Departemen Teknik Industri

Ruang lingkup teknik industri adalah perguruan tinggi yang selalu berkecimpung dalam bidang akademis. Hal ini terjamin dalam visi dan misi Departemen Teknik Industri Fakultas Teknik USU. Adapun visi dan misi Departemen Teknik Industri Fakultas Teknik USU adalah :

Visi :

Menjadi Program Studi Teknik Industri yang maju dan unggul dalam perancangan, perbaikan dan instalasi sitem terpadu yang mampu bersaing secara global.

Misi :

1. Menyelenggarakan kegiatan belajar mengajar yang bermutu tinggi untuk menghasilkan lulusan yang berjunjung tinggi etika profesi dan handal dalam perancangan, perbaikan dan instalasi sistem terpadu sesuai dengan kebutuhan dunia industri manufakturing dan jasa dalam era persaingan global.

2. Melakukan penelitian dan meningkatkan mutu secara berkelanjutan terutama dalam bidang rekayasa manufakturing dan jasa.

3. Menggalakkan pengabdian pada masyarakat khususnya pengembangan sistem terpadu dalam upaya meningkatkan mutu kerja produktif masyarakat pada umumnya dan dunia industri pada khususnya.

(26)

II-3

2.3. Organisasi dan Manajemen

Departemen Teknik Industri FT-USU saat ini telah mendapatkan sertifikasi ISO 9000:2000 dan struktur organisasi departemen telah dikembangkan sesuai dengan kemajuannya. Struktur Organisasi Departemen Teknik Industri berbentuk Organisasi Lini, karena setiap bagian-bagian yang ada langsung berada dibawah seorang pemimpin serta pemberian wewenang dan tanggung jawab bergerak vertikal kebawah dengan pendelegasian yang tegas, melalui jenjang hirarki yang ada.Adapun struktur organisasi Departemen Teknik Industri Fakultas Teknik USU dapat dilihat pada Gambar 2.1. berikut ini.

KETUA PRODI

&

SEKRETARIS PRODI

GUGUS KENDALI

MUTU MR ISO

PENASIHAT AKADEMIK

KEPALA LABORATORIUM

KOORDINATOR TUGAS AKHIR

KOORDINATOR KERJA PRAKTEK

KOORDINATOR PERPUSTAKAAN

TENAGA

ADMINISTRASI DC ISO

Sumber : Departemen Teknik Industri USU

Gambar 2.1. Struktur Organisasi Departemen Teknik Industri USU

(27)

II-4

2.3.1. Staf Akademik

Staf pengajar yang ada di Departemen Teknik Industri fakultas Teknik USU terdapat staf pengajar dan staf yang tidak tetap.

a. Staf Pengajar tetap

Staf pengajar tetap yang ada di Departemen Teknik Industri Fakultas Teknik USU dapat dilihat pada Tabel 2.1.

Tabel 2.1. Daftar Staf Pengajar Tetap

No Nama Staf Pengajar

1. Prof. Dr. Ir. Sukaria Sinulingga, M.Eng 2. Ir. Abadi Ginting, MSIE

3. Prof. Dr. Ir. Harmein Nasution, MSIE 4. Prof. Dr. Ir. A. Rahim Matondang, MSIE 5. Dr. Ir. Sugiharto, MM, IPU

6. Prof. Dr. Ir. Humala L. Napitupulu, DEA 7. Ir. Mangara M. Tambunan, MSc

8. Ir. Khawarita Siregar, MT 9. Dr. Ir. Nazaruddin, MSIE 10. Ir. Ukurta Tarigan, MT 11. Ir. Rosnani Ginting, MT, PhD 12. Ir. Dini Wahyuni, MT

13. Buchari, ST, M.kes 14. Aulia Ishak, ST, MT, PhD

Sumber : Departemen Teknik Industri USU

(28)

II-5

Tabel 2.1. Daftar Staf Pengajar Tetap (Lanjutan)

No Nama Staf Pengajar

15. Ir. Nurhayati, MT

16. Dr. Ir. Juliza Hidayati, MT 17. Ir. Anizar, M.kes

18. Dr. Ir. Listiani Nurul Huda, MT

19. Dr. Ir. Meilita Tryana Sembiring, MT, IPM 20. Tuti Sarma Sinaga, ST, MT

21. Erwin Sitorus, ST, MT 22. Khalida Syahputri ST, MT 23. Rahmi Sari, ST, MM(T) 24. Ikhsan Siregar, ST, M.Eng 25. Ivo Andika Hasugian, ST, MT 26. Indah Rizkya Tarigan, ST, MT 27. Chalis Fajri Hasibuan, ST, MSc

Sumber : Departemen Teknik Industri USU

b. Staf Pengajar Tidak Tetap

Staf pengajar tidak tetap yang ada di Departemen Teknik Industri Fakultas Teknik USU diurut menurut gelar, spesialis dan pendidikan dapat diliht pada Tabel 2.2. Staf pengajar tidak tetap ini berasal dari fakultas-fakultas di lingkungan USU.

(29)

II-6

Tabel 2.2. Daftar Staf Pengajar Tidak Tetap

No Nama Staf Pengajar

1. Prof. Dr. Ir. Darwin Sitompul, M.Eng 2. Dra. Herlina M.hum

3. Ir. Syahrul Siregar, MT 4. Dra. Zuria Sitorus 5. Dra. Nurcahaya Bangun 6. Ir. Syahril Gultom

7 Ir. Tania, MT

8 Dr. Ir. Erikson Sianipar, MM

Sumber : Departemen Teknik Industri USU

Staf pegawai administrasi yang di Departemen Teknik Industri Fakultas Teknik USU dan jenjang pendidikannya dapat dilihat pada Tabel 2.3.

Tabel 2.3. Staf Pegawai Administrasi di Departemen Teknik Industri USU

No. Nama Pendidikan

1 Ester SMTA

2 Aniati SMTA

3 Nurmansyah SMTA

4 Tumijo SMTA

5 Rahma SMTA

6 Edi SMTA

7 Awal SMTA

8 Neneng S1

Sumber : Departemen Teknik Industri USU

(30)

II-7

2.3.2. Fasilitas Departemen Teknik Industri

Terdapat beberapa fasilitas yang disediakan di Departemen Teknik Industri untuk menunjang kelancaran belajar dan mengajar Departemen Teknik Industri, antara lain:

1. Ruang kuliah yang memadai dengan kapasitas ± 40 meja dan kursi untuk tiap ruangan yang dilengkapi dengan papan tulis whiteboard dan AC.

2. Peralatan pendukung perkuliahan lainnya seperti proyektor.

3. Laboratorium-laboratorium yang dilengkapi dengan peralatan laboratorium yang memadai.

(31)

III-1 BAB III

TINJAUAN PUSTAKA

3.1. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Pemilihan metode, teknik, atau algoritma yang tepat sangat bergantung pada tujuan dan proses penggalian data secara keseluruhan. Data mining atau Knowledge Discovery in Database (KDD) merupakan proses ekstraksi informasi-informasi penting atau knowledge dari basis data yang besar. Data mining menspesifikasikan pola-pola yang ditemukan pada kumpulan data tersebut sehingga data yang telah ada itu lebih bermanfaat dalam kehidupan nyata. Dengan sejarah luas yang mengakar dalam pembelajaran mesin, kecerdasan buatan, basis data bersama dengan data mining statistik diciptakan sangat awal. (Kapiudin, Maulani. 2007).

Data mining sangat terkait dengan ilmu data yang melibatkan manipulasi dan klasifikasi data dengan menerapkan konsep statistik dan matematika. Data mining adalah fase penting dalam penemuan pengetahuan dan termasuk penerapan terhadap penemuan dan metode analitik pada data untuk menghasilkan model spesifik lintas data. Data tersedia di mana-mana, dapat digunakan untuk memprediksi masa depan menggunakan pendekatan statistic. Data mining adalah perpanjangan dari analisis data tradisional dan pendekatan statistik karena menggabungkan teknik analisis yang diambil dari berbagai disiplin ilmu.

Ketersediaan kumpulan data yang besar, kompleks, dan kaya informasi,

(32)

III-2

kemampuan untuk melakukan ekstrak pengetahuan bermanfaat yang tersembunyi dalam data ini dan untuk bertindak berdasarkan pengetahuan itu menjadi semakin penting di dunia yang kompetitif zaman sekarang. Jadi data mining adalah analisis dari set data pengamatan besar untuk menemukan hubungan yang tidak terduga dan untuk meringkas data dengan cara-cara baru yang bisa dimengerti dan bermanfaat bagi pemilik data (Rangra, Kalpana. 2014).

3.2. Metode Pelatihan

Secara garis besar metode pelatihan yang digunakan dalam teknik-teknik Data mining dibedakan ke dalam dua pendekatan, yaitu :

1. Unsupervised learning, metode ini dierapkan tanpa adanya latihan (training) dan tanpa ada guru (teacher). Guru di sini adalah label dari data.

2. Supervised learning, yaitu metode belajar dengan adanya latihan dan pelatih. Dalam pendekatan ini, untuk menemukan fungsi keputusan, fungsi pemisah atau fungsi regresi, digunakan beberapa contoh data yang mempunyai output atau label selama proses training.

3.3. Pengelompokan Data mining

Ada beberapa teknik yang dimiliki data mining berdasarkan tugas yang bisa dilakukan, yaitu:

1. Deskripsi

Para peneliti biasanya mencoba menemukan cara untuk mendeskripsikan pola dan trend yang tersembunyi dalam data.

(33)

III-3

2. Estimasi

Estimasi mirip dengan klasifikasi, kecuali variabel tujuan yang lebih kearah numerik dari pada kategori.

3. Prediksi

Prediksi memiliki kemiripan dengan estimasi dan klasifikasi. Hanya saja, prediksi hasilnya menunjukkan sesuatu yang belum terjadi (mungkin terjadi di masa depan).

4. Klasifikasi

Dalam klasifikasi variabel, tujuan bersifat kategorik. Misalnya, kita akan mengklasifikasikan pendapatan dalam tiga kelas, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.

5. Clustering

Clustering lebih ke arah pengelompokan record, pengamatan, atau kasus dalam kelas yang memiliki kemiripan.

6. Asosiasi

Mengidentifikasi hubungan antara berbagai peristiwa yang terjadi pada satu waktu.

3.4. Tahap-tahap Data mining

Sebagai suatu rangkaian proses, data miningdapat dibagi menjadi beberapa tahap proses yang diilustrasikan pada Gambar 3.1. Tahap-tahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base.

(34)

III-4

Sumber : Ridwan, Mujib. Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier

Gambar 3.1. Tahap – tahap Data mining

Tahap-tahap Data mining adalah sebagai berikut:

a. Pembersihan data (data cleaning)

Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan.

b. Integrasi data (data integration)

Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru.

c. Seleksi data (data selection)

Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database.

(35)

III-5

d. Transformasi data (data transformation)

Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining.

e. Proses mining

Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.

Beberapa metode yang dapat digunakan berdasarkan pengelompokan data mining dapat dilihat pada Gambar 3.2

Sumber : Ridwan, Mujib. Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier

Gambar 3.2. Metode Data mining f. Evaluasi pola (pattern evaluation)

Untuk mengidentifikasi pola-pola menarik ke dalam knowledge based yang ditemukan.

g. Presentasi pengetahuan (knowledge presentation)

Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.

(36)

III-6

3.5. Jenis Data yang Bisa Ditambang

a. File flat : File flat sebenarnya adalah sumber data yang paling umum untuk algoritma penambangan data, terutama pada penelitian tingkat. File flat adalah file data sederhana dalam format teks atau biner dengan struktur yang dikenal dengan algoritma dimana data mining diterapkan. Data dalam file ini dapat berupa transaksi, data deret waktu, pengukuran ilmiah, dll.

b. Database Relasional : Secara singkat, database relasional terdiri dari satu set tabel yang berisi nilai entitas atribut, atau nilai atribut dari hubungan entitas. Tabel memiliki kolom dan baris, di mana kolom mewakili atribut dan baris mewakili tupel. Sebuah tupel dalam tabel relasional berhubungan dengan objek atau hubungan antara objek dan diidentifikasi oleh seperangkat nilai atribut yang mewakili kunci unik.

c. Gudang Data : Gudang data sebagai gudang, adalah gudang data yang dikumpulkan dari berbagai sumber data (sering heterogen) dan dimaksudkan untuk digunakan secara keseluruhan di bawah skema terpadu yang sama. Data warehouse memberikan pilihan untuk menganalisis data dari berbagai sumber di bawah satu atap.

d. Basis Data Transaksi : Basis data transaksi adalah kumpulan catatan yang mewakili transaksi, masing-masing dengan stempel waktu, pengidentifikasi dan satu set item. Terkait dengan file transaksi juga bisa menjadi data deskriptif untuk item. Untuk contoh, dalam kasus toko video dan tabel rental.

(37)

III-7

e. Basis Data Multimedia : Basis data multimedia mencakup video, gambar, audio dan media teks. Mereka dapat disimpan database objek-relasional atau berorientasi objek diperluas, atau hanya pada sistem file. Multimedia ditandai olehnya dimensionalitas tinggi, yang membuat penambangan data semakin menantang. Penambangan data dari repositori multimedia mungkin memerlukan penglihatan komputer, grafik komputer, interpretasi gambar, dan pemrosesan bahasa alami metodologi.

f. Database Spasial : Database spasial adalah database yang, selain data biasa, menyimpan informasi geografis seperti peta, dan penentuan posisi global atau regional. Database spasial seperti itu menghadirkan tantangan baru dalam penambangan data algoritma.

g. World Wide Web : World Wide Web adalah repositori paling heterogen dan dinamis yang tersedia. Sangat besar jumlah penulis dan penerbit terus berkontribusi terhadap pertumbuhan dan metamorfosis, dan massif jumlah pengguna mengakses sumber dayanya setiap hari. Data di World Wide Web diatur secara saling terkoneksi dokumen. Dokumen-dokumen ini dapat berupa teks, audio, video, data mentah, dan bahkan aplikasi. Secara Konseptual, World Wide Web terdiri dari tiga komponen utama: Konten Web, yang meliputi dokumen tersedia; struktur Web, yang mencakup hyperlink dan hubungan antar dokumen; dan penggunaan web, menjelaskan bagaimana dan kapan sumber daya diakses.

h. Database Time-Series: Database time-series berisi data terkait waktu seperti data pasar saham atau aktivitas yang dicatat. Basis data ini biasanya

(38)

III-8

memiliki aliran data baru yang berkelanjutan, yang kadang-kadang menyebabkan kebutuhan akan sebuah analisis real time yang menantang. Data mining dalam database seperti itu biasanya mencakup studi tren dan korelasi antara evolusi variabel yang berbeda, serta prediksi tren dan pergerakan variabel dalam waktu.

3.6. Tools Data mining 3.6.1. Weka

Weka adalah kumpulan algoritma pembelajaran mesin untuk data mining. Algoritma ini dapat diterapkan langsung ke kumpulan data atau dapat dipanggil dari kode Java anda sendiri. Weka (diucapkan Weh-Kuh) meja kerja berisi kumpulan beberapa alat untuk visualisasi dan algoritma untuk analisis data dan pemodelan prediktif, bersama dengan antarmuka pengguna grafis untuk akses mudah ke fungsi ini. Informasi mengenai software Weka dapat dilihat pada tabel di bawah ini.

(39)

III-9

Tabel 3.1. Informasi mengenai software Weka

Sumber : Rangra, Kalpana. Comparative Study of Data Mining Tools

3.6.2. KEEL

Ekstraksi Pengetahuan berdasarkan Evolutionary Learning adalah paket aplikasi alat perangkat lunak pembelajaran mesin . KEEL dirancang untuk memberikan solusi untuk masalah data mining dan menilai algoritma evolusioner. KEEL memilikikoleksi perpustakaan untuk teknik preprocessing dan post-processing untuk memanipulasi data, metode komputasi lunak dipengetahuan

tentang penggalian dan pembelajaran, dan menyediakan metode ilmiah dan penelitian. Informasi mengenai software KEEL dapat dilihat pada tabel di bawah ini.

NO Spesifikasi

Teknis Spesialisasi Keuntungan Batasan

1

Pertama kali dirilis pada tahun 1997.

Paling cocok untuk aturan asosiasi data mining

memuat file data dalam format ARFF, CSV, C4.5, biner

Kitchen Sink Syndrome, di mana sistem diperbarui terus-menerus

2

Versi terbaru yang tersedia adalah WEKA 3.6.11.

Lebih kuat dalam teknik pembelajaran mesin.

Gratis, dapat diperpanjang,

dan bisa

diintegrasikan ke dalam paket java

Konektivitas yang lebih

buruk ke

lembar Excel dan basis data non-Java.

3

Memiliki lisensi publik umum GNU.

Cocok untuk

pembelajaran mesin. -

Pembaca CSV tidak sekuat di Rapid Miner 4

Platform perangkat lunak independen.

Cocok untuk

mengembangkan skema pembelajaran mesin baru

-

Jauh lebih lemah dalam statistik klasik 5 Didukung oleh

Java - - -

(40)

III-10

Tabel 3.2. Informasi Mengenai Software KEEL

Sumber : Rangra, Kalpana. Comparative Study of Data Mining Tools

3.6.3. R

Revolution adalah bahasa pemrograman perangkat lunak bebas dan lingkungan perangkat lunak untuk komputasi statistik dan grafik. Bahasa R banyak digunakan di kalangan ahli statistik dan penambang data untuk mengembangkan perangkat lunak statistik dan analisis data. Salah satu kekuatan NO Spesifikasi

Teknis Spesialisasi Keuntungan Batasan

1

Pertama kali dirilis pada 2004

alat perangkat lunak untuk menilai algoritma evolusioner untuk masalah data mining

Memuat regresi, klasifikasi,

pengelompokan, dan penambangan

pola dan

sebagainya.

Efisiensi

dibatasi oleh jumlah

algoritma yang didukungnya dibandingkan dengan alat lain.

2

Versi terbaru yang tersedia adalah KEEL 2.0

Machine learning tool

Koleksi besar algoritma

ekstraksi pengetahuan klasik, teknik preprocessing (misalnya seleksi, pemilihan fitur, diskritisasi, metode imputasi untuk nilai yang hilang, dll.)

-

3

Dilisensikan oleh GNU, lisensi publik umum

- - -

4

Dapat berjalan di platform apa pun

- - -

5 Didukung oleh

Java - - -

(41)

III-11

R adalah kemudahannya menghasilkan plot kualitas publikasi yang dirancang dengan baik, termasuk simbol dan formula matematika di mana diperlukan.

Informasi mengenai software R dapat dilihat pada tabel di bawah ini.

Tabel 3.3. Informasi mengenai software R

Sumber : Rangra, Kalpana. Comparative Study of Data Mining Tools

3.6.4. KNIME

Konstanz Information Miner, adalah platform analitik, pelaporan, dan integrasi data sumber terbuka, berdasar pada platform Eclipse dan, melalui API modularnya, dan mudah diperluas. Adat node dan tipe dapat diimplementasikan NO Spesifikasi

Teknis Spesialisasi Keuntungan Batasan

1

Pertama kali dirilis pada tahun 1997

Memiliki sejumlah besar pengguna, khususnya di bidang bio-informatika dan ilmu sosial

Perpustakaan statistik yang sangat luas

Kurang terspesialisasi dalam data mining

2

Versi terbaru yang Tersedia adalah 3.1.0

Cocok untuk

Komputasi Statistik

Menggunakan bahasa array elegan yang kuat dalam tradisi APL, Matematika dan MATLAB, tetapi jugaLISP / Skema

Ada kurva belajar yang curam, kecuali jika Anda terbiasa dengan bahasa array

3

Dilisensikan oleh Lisensi Publik Umum

GNU -

Kemampuan untuk membuat program

pembelajaran mesin bekerja hanya dalam 40 baris kode

-

4 Lintas Platform

- R memiliki grafik

yang lebih baik - 5

C, Fortran dan Rwww.r-

project.org

- R memiliki grafik

yang lebih baik -

(42)

III-12

dalam KNIME dalam beberapa jam sehingga memperluas KNIME untuk memahami dan memberikan dukungan pertama tingkat untuk format data yang sangat spesifik untuk domain. Informasi mengenai software KNIME dapat dilihat pada tabel di bawah ini.

Tabel 3.4. Informasi mengenai software KNIME

Sumber : Rangra, Kalpana. Comparative Study of Data Mining Tools

NO Spesifikasi

Teknis Spesialisasi Keuntungan Batasan

1

Dirilis pada 2004

Integrasi Kit Pengembangan Kimia dengan node tambahan untuk pemrosesan struktur kimia, senyawa, dll.

Mengintegrasikan semua modul analisis yang terkenal

Hanya punya metode

pengukuran kesalahan terbatas

2

Versi terbaru yang tersedia adalah

KNIME2.9

Khusus untuk

pelaporan

perusahaan, business inteligent, dan data mining

Mudah untuk dicoba karena tidak memerlukan instalasi selain mengunduh dan membatalkan pengarsipan.

Tidak memiliki metode

pembungkus untuk pemilihan deskriptor

3

Dilisensikan oleh Lisensi Publik Umum

GNU -

Kemampuan untuk berinteraksi program yang memungkinkan untuk visualisasi dan analisis data molekuler

Tidak memiliki fasilitas

otomatis untuk optimasi

Parameter dari pembelajaran mesin / metode statistik

4

Kompatibel dengan Linux,

OS X,

Windows

- R memiliki grafik

yang lebih baik - 5 Ditulis dalam

java - R memiliki grafik

yang lebih baik -

(43)

III-13

3.6.5. RAPID MINER

Rapid Miner adalah platform perangkat lunak yang dikembangkan oleh perusahaan dengan nama yang sama yang menyediakan lingkungan terintegrasi untuk mesin pembelajaran, data mining, penambangan teks, analitik prediktif dan analitik bisnis, digunakan untuk bisnis dan industri aplikasi serta untuk penelitian, pendidikan, pelatihan, prototyping cepat, dan pengembangan aplikasi dan mendukung semua langkah-langkah proses data mining. Rapid Miner menggunakan model klien / server dengan server yang ditawarkan sebagai perangkat lunak sebagai layanan atau pada infrastruktur cloud. Informasi mengenai software Rapid Miner dapat dilihat pada tabel di bawah ini.

Tabel 3.5. Informasi mengenai software RapidMiner

Sumber : Rangra, Kalpana. Comparative Study of Data Mining Tools

NO Spesifikasi

Teknis Spesialisasi Keuntungan Batasan

1

Dirilis pada 2006

Menyediakan

dukungan untuk sebagian besar jenis database, yang berarti pengguna dapat mengimpor informasi berbagai sumber basis data untuk diperiksa dan dianalisis

Memiliki fasilitas lengkap untuk evaluasi model menggunakan set validasi silang dan validasi independen

Perangkat lunak membutuhkan

kemampuan untuk

memanipulasi pernyataan dan file SQL.

2

Versi terbaru yang tersedia adalah Rapid miner 6

Khusus untuk solusi

bisnis yang

mencakup analisis prediktif dan komputasi statistik

Lebih dari 1.500 metode untuk integrasi data, transformasi data, analisis dan, pemodelan

-

3

Dilisensikan oleh AGPL Proprietary

-

RapidMiner menawarkan banyak prosedur

-

(44)

III-14

3.6.5.1. Parameter Akurasi pada Rapidminer

Pada Rapidminer, terdapat parameter akurasi dengan rentang nilai yang bervariasi. Parameter tersebut dapat dilihat pada Tabel 2.6. berikut ini.

Tabel 3.6. Parameter Akurasi pada Rapidminer Nilai Akurasi (%) Hasil Prediksi

90-100 Sangat Baik

80-90 Baik

70-80 Sedang

60-70 Lemah

50-60 Sangat Lemah

Sumber : Galih. 2019. Data Mining di Bidang Pendidikan untuk Analisa Prediksi Kinerja Mahasiswa dengan Komparasi 2 Model Klasifikasi pada STMIK Jabar

3.6.6. ORANGE

Orange adalah perangkat lunak data mining dan pembelajaran mesin yang berbasis komponen , termasuk satu set komponen untuk preprocessing data, penilaian dan penyaringan fitur, pemodelan, evaluasi model, dan eksplorasi teknik yang diimplementasikan dalam C ++ dan Python. Antarmuka pengguna grafisnya dibangun di atas kerangka lintas platform. Informasi mengenai software Orange dapat dilihat pada tabel di bawah ini.

(45)

III-15

Tabel 3.7. Informasi mengenai software Orange

Sumber : Rangra, Kalpana. Comparative Study of Data Mining Tools

3.7. Algoritma Naive Bayes

Bayesian classification adalah pengklasifikasian statistik yang dapat digunakan untuk memprediski probabilitas keanggotaan suatu class. Bayesian classification didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan decesion tree dan neural network. Bayesian classification terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar. (Kusrini.2009). NBC NO Spesifikasi

Teknis Spesialisasi Keuntungan Batasan

1

Dikembangkan pada tahun 2009

Visualisasi dan analisis data open source untuk pemula dan para ahli

Paket

penambangan data open source yang dibangun di atas Python, NumPy,

dibungkus C, C ++ dan Qt.

Instal besar karena Anda perlu

menginstal QT

2

Versi terbaru yang tersedia adalah Orange 2.7

Berisi komponen untuk pembelajaran mesin dan add-on untuk bioinformatika dan data mining

Bekerja baik sebagai skrip dan dengan GUI alur kerja ETL

Pembelajaran mesin tidak ditangani secara seragam antara perpustakaan yang berbeda

3

Dilisensikan oleh Lisensi Publik Umum GNU

Khusus untuk

visualisasi data bersama dengan penambangan

Skrip terpendek untuk melakukan pelatihan, validasi silang,

perbandingan algoritma, dan prediksi

Orange lemah dalam statistik klasik

4

Kompatibel dengan Python, C ++, C

-

Memiliki

debugger yang lebih baik

-

(46)

III-16

merupakan salah satu algoritma dalam teknik data mining yang menerapkan teori Bayes dalam klasifikasi. Teorema keputusan Bayes adalah adalah pendekatan statistik yang fundamental dalam pengenalan pola (pattern recoginition). Naive bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secara konditional saling bebas jika diberikan nilai output. Dengan kata lain, diberikan nilai output, probabilitas mengamati secara bersama adalah produk dari probabilitas individu. (Santosa. 2007).

Teorema Bayes memiliki bentuk umum sebagai berikut : P (H / X ) = P (X / H | P (H))

P (X) X = Data dengan class yang belum diketahui

H = Hipotesis data X merupakan suatu class spesifik

P(H|X) = Probabilitas hipotesis H berdasarkan kondisi x (posteriori prob.) P(H) = Probabilitas hipotesis H (prior prob.)

P(X|H) = Probabilitas X berdasarkan kondisi tersebut P(X) = Probabilitas dari X

3.8. Pohon Keputusan (Decision Tree)

Pohon keputusan merupakan salah satu metode klasifikasi yang kuat dan terkenal. Metode pohon keputusan mengubah fakta yang besar menjadi pohon keputusan yang merepresentasikan aturan, aturan tersebut dapat dengan mudah untuk diinterpretasi oleh manusia. Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah variabel

(47)

III-17

input dengan sebuah variabel target (Berry & Linoff, 2004).

Model pohon keputusan terdiri dari sekumpulan aturan untuk membagi sejumlah populasi yang heterogen menjadi lebih kecil (homogen) dengan memperhatikan variabel tujuannya. Variabel tujuan biasanya dikelompokkan dengan pasti dan model pohon keputusan lebih mengarah pada perhitungan probabilitas dari tiap-tiap record terhadap kategori tersebut atau untuk mengklasifikasi record dengan mengelompokkannya dalam satu kelas. Sebuah pohon keputusan dapat dibangun dengan menerapkan salah satu algoritma pohon keputusan untuk memodelkan himpunan data yang belum terklasifikasi kelasnya (Kusrini, 2009).

Konsep dari pohon keputusan adalah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan.

Sumber : Maslahah, Susi. Prediksi Kelulusan Mahasiswa menggunakan Decision Tree dengan Penerapan Algoritma C.45

Gambar 3.3. Konsep Decision Tree

3.9. Peraturan Terkait Mahasiswa dan Perguruan Tinggi

Akreditasi merupakan salah satu bentuk penilaian (evaluasi) kelayakan dan mutu perguruan tinggi atau program studi yang dilakukan oleh organisasi atau badan mandiridi luar perguruan tinggi. Bentuk penilaian mutu eksternal yang lain adalah penilaian yang berkaitan dengan akuntabilitas, pemberian izin, pemberian

(48)

III-18

lisensi oleh badan tertentu. Berbeda dari bentuk penilaian mutu lainnya, akreditasi dilakukan oleh pakar sejawat dan mereka yang memahami hakikatpengelolaan perguruan tinggi sebagai Tim atau Kelompok Asesor. (Peraturan BAN PT Nomor 3 Tahun 2019 tentang Instrumen Akreditasi Perguruan Tinggi). Diagram proses akreditasi dapat dilihat pada gambar di bawah ini.

Sumber : Peraturan BAN PT Nomor 3 Tahun 2019 tentang Instrumen Akreditasi Perguruan Tinggi

Gambar 3.4. Diagram Proses Akreditasi

Penilaian akreditasi dilakukan secara uji tuntas dan komprehensif yang mencakup elemen pemenuhan (compliance) terhadap Standar Nasional Pendidikan Tinggi (SN-Dikti), Standar Pendidikan Tinggi yang ditetapkanoleh perguruan tinggi, dan peraturan perundang-undangan tentang pengelolaan pendidikan tinggi, serta konformasi (conformance) yang diukur melalui kinerja mutu (performance) dalam konteks akuntabilitas publik. Rujukan-rujukan penting yang perlu diperhatikan dalam penilaian akreditasi perguruan tinggi adalah:

a) Permenristekdikti No. 44 tahun 2015 tentang Standar Nasional Pendidikan Tinggi

(49)

III-19

b) Permenristekdikti No. 50 tahun 2018 tentang Perubahan atas Peraturan Menteri Riset, Teknologi, dan Pendidikan Tinggi Nomor 44 Tahun 2015 tentang Standar Nasional Pendidikan Tinggi

c) Permenristekdikti No. 62 tahun 2016 tentang Sistem Penjaminan Mutu Pendidikan Tinggi

d) Permenristekdikti No. 32 tahun 2016 tentang Akreditasi Program Studi dan Perguruan Tinggi

e) Peraturan Pemerintah Nomor 4 Tahun 2014 tentang Penyelenggaraan Pendidikan Tinggi dan Pengelolaan Perguruan Tinggi

f) Permenristekdikti No. 51 tahun 2018 tentang Pendirian, Perubahan, Pembubaran Perguruan Tinggi Negeri dan Pendirian, Perubahan, Pencabutan Izin Perguruan Tinggi Swasta

3.9.1. Luaran dan Capaian Tridharma 3.9.1.1.Fokus Penilaian

Penilaian kriteria ini difokuskan pada: 1) produktivitas program pendidikan, dinilai dari efisiensi edukasi dan masa studi mahasiswa, 2) hasil penelusuran lulusan, umpan balik dari pengguna lulusan, dan persepsi publik terhadap mutu lulusan sesuai dengan capaian pembelajaran lulusan yang ditetapkan oleh program studi, 3) jumlah dan keungggulan publikasi ilmiah, jumlah sitasi, jumlah hak kekayaan intelektual, dan kemanfaatan/dampak hasil penelitian terhadap pewujudan visi dan penyelenggaraan misi, serta kontribusi pengabdian kepada masyarakat pada pengembangan dan pemberdayaan sosial,

(50)

III-20

ekonomi, dan kesejahteraan masyarakat, serta 4) adopsi hasil penelitian dan pelembagaan hasil pengabdian kepada masyarakat oleh pemangku kepentingan dan masyarakat.

3.9.1.2. Indikator dan Deskripsi Penilaian

Adapun indikator dan deskripsi penelitian disajikan dalam beberapa poin diantaranya:

a. Rata-rata IPK mahasiswa dalam 3 tahun terakhir.

b. Jumlah lulusan yang memiliki sertifikat kompetensi/profesi/industry (pada perguruan tinggi vokasi).

c. Jumlah prestasi akademik mahasiswa di tingkat provinsi/wilayah, nasional, dan/atau internasional terhadap jumlah mahasiswa dalam 3 tahun terakhir (TS-2 s.d. TS).

d. Jumlah prestasi non-akademik mahasiswa di tingkat provinsi/wilayah, nasional, dan/atau internasional terhadap jumlah mahasiswa dalam 3 tahun terakhir (TS-2 s.d. TS).

e. Lama studi mahasiswa untuk setiap program dalam 3 tahun terakhir.

f. Persentase kelulusan tepat waktu untuk setiap program.

g. Persentase keberhasilan studi untuk setiap program.

h. Lama waktu tunggu lulusan program utama di perguruan tinggi untuk mendapatkan pekerjaan pertama.

i. Kesesuaian bidang kerja lulusan dari program utama di perguruan tinggi terhadap kompetensi bidang studi.

(51)

III-21

j. Tingkat kepuasan pengguna lulusan.

k. Tingkat dan ukuran tempat kerja lulusan.

l. Jumlah publikasi di jurnal dalam 3 tahun terakhir.

m. Jumlah publikasi di seminar/ tulisan di media massa dalam 3 tahun terakhir.

n. Jumlah artikel karya ilmiah dosen tetap yang disitasi dalam 3 tahun terakhir (pada perguruan tinggi akademik).

o. Jumlah produk/jasa yang diadopsi oleh industri/masyarakat dalam 3 tahun terakhir (pada perguruan tinggi vokasi).

p. Jumlah luaran penelitian dan PkM dosen tetap dalam 3 tahun terakhir.

(52)

IV-1 BAB IV

METODOLOGI PENELITIAN

4.1. Tempat dan Waktu Penelitian

Penelitian ini dilakukan di Departemen Teknik Industri Fakultas Teknis Universitas Sumatera Utara yang mengolah data mahasiswa jurusan teknik industri. Departemen Teknik Industri berlokasi di Jalan Almamater USU Padang Bulan Kecamatan Medan Baru, Kota Medan, Sumatera Utara 20222. Penelitian ini dilakukan dari Februari-sekarang.

4.2. Jenis Penelitian

Penelitian tugas sarjana ini adalah penelitian kuantitatif adalah metode penelitian yang berlandaskan filsafat positivisme, digunakan untuk meneliti populasi atau sampel tertentu dengan memakai instrumen pengumpulan data dan analisis yang bersifat kuantitatif. (Sinulingga, 2015). Penelitian ini berupaya untuk memprediksi kelulusan dengan memperhatikan tingkat akurasi agar mendapat rekomendasi untuk perbaikan sehingga didapat efisiensi.

4.3. Objek Penelitian

Objek penelitian yang diamati adalah kinerja akademis mahasiswa Departemen Teknik Industri USU.

(53)

IV-2

4.4. Variabel Penelitian

Penelitian ini adalah penelitian kuantitatif yang menggunakan variabel dependen dan variabel independen. Variabel dependen adalah variabel yang dipengaruhi oleh variabel lain. Sedangkan variabel independen adalah variabel bebas yang tidak dipengaruhi oleh variabel lain dan sifatnya mempengaruhi variabel dependen.

4.4.1 Variabel Dependen

Variabel dependen yang digunakan dalam penelitian ini adalah kelulusan mahasiswa lulus tepat (tepat waktu) dan terlambat (tidak tepat waktu). Penentuan tepat atau terlambatnya mahasiswa ditentukan dari lama studi mahasiswa.

4.4.2. Variabel Independen

Merupakan dasar pengukuran variabel dependen, diantaranya adalah jenis kelamin, asal sekolah, jalur masuk, dan indek prestasi kumulatif (IPK) mahasiswa Program Studi Teknik Industri, Fakultas Teknik Universitas Sumatera Utara.

Pembagian jenis atribut dapat dilihat sebagai berikut:

1. NIM sebagai atribut data nomor induk mahasiswa 2. NAMA sebagai atribut nama lengkap mahasiswa

3. Jenis kelamin sebagai variabel independen kategorial L/P

4. Asal Daerah sebagai variabel independen kategorial Medan dan Luar Medan

(54)

IV-3

5. Asal Sekolah sebagai variabel independen kategorial MAN, SMAN, SMAS, SMTA Lain-lain

6. Jalur Masuk sebagai variabel independen kategorial SNMPTN, SPMB, dan SPMPRM.

7. IPK (Indeks Prestasi Kumulatif) sebagai variabel independen numerikal.

Merupakan hasil studi yang dinyatakan dengan indeks tertentu yang diakumulasikan dari mata kuliah yang telah ditempuh oleh mahasiswa.

IPK menunjukkan hasil studi melalui ujian-ujian yang dilakukan selama mengambil mata kuliah. IPK (Indeks Prestasi Kumulatif) yang digunakan oleh Universitas Sumatera Utara dihitung berdasarkan rumus sebagai berikut:

4.5. Kerangka Konseptual

Kerangka konseptual merupakan suatu bentuk kerangka berpikir yang dapat digunakan sebagai pendekatan dalam memecahkan masalah. Biasanya kerangka penelitian ini menggunakan pendekatan ilmiah dan memperlihatkan hubungan antar variabel dalam proses analisisnya. Adapun gambar kerangka konseptual dalam penelitian ini dapat dilihat pada Gambar 4.1.

(55)

IV-4

Data Training

Data Testing

X-validation Algoritma Naïve Bayes

Apply Model &

Performance

Hasil Prediksi

Nilai performansi

akurasi

Sumber : Pengumpulan Data

Gambar 4.1. Kerangka Konseptual

4.6. Metode Pengumpulan Data

Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari database mahasiswa Jurusan Teknik Industri, Universitas Sumatera Utara. Dataset yang digunakan yaitu: Pertama, data mahasiswa yang memiliki 80 atribut dan 483 record yang terdiri no, nim, nama, jenis kelamin, kota lahir, tanggal lahir, agama, asal sekolah,tahun lulus,nama orangtua,dan sebagainya. Kedua, data kelulusan yang terdiri dari 21 atribut dan 178 record yang terdiri dari no, nim, nama, berat badan, tinggi, program studi, lama studi, ipk, predikat kelulusan, dan sebagainya.

4.7. Metode Pengolahan Data

Pengolahan data yang dilakukan dalam prediksi kelulusan mahasiswa tepat waktu secara garis besar dapat dijelaskan dengan blok diagram sebagai berikut

(56)

IV-5

Input data training

Penerapan Algoritma Naïve Bayes

Pembentukan Aturan/ Rule

Input data testing

Proses testing

Perhitungan performance

Hasil klasifikasi

TRAINING TESTING

Sumber: Pengolahan Data

Gambar 4.2. Blok Diagram Pengolahan Data

1. Proses Training.

Pada proses training yaitu memasukkan data training ke dalam tabel yang disiapkan untuk proses perhitungan. Tabel tersebut meliputi atribut, jumlah data keseluruhan, jumlah data yang sudah terklasifikasi berdasarkan target yang ditentukan, dalam kasus ini yaitu lulus tepat atau terlambat. Tahapan

(57)

IV-6

selanjutnya yaitu penerapan algoritma Naïve Bayes yaitu menghitung nilai probabilitas pada tiap-tiap atribut untuk dijadikan bentukmodel prediksi yang akan diterapkan pada proses testing.

2. Proses Testing

Pada proses testing ini langkah yang dilakukan yaitu memasukkan data uji atau data testing. Atribut yang digunakan pada proses testing ini harus sesuai dengan atribut pada proses training. Setiap data atribut akan dibandingkan dengan aturan yang sudah terbentuk pada perhitungan data training sebelumnya. Selanjutnya data tersebut akan diklasifikasikan berdasarkan target yang ingin diketahui yaitu data mahasiswa dengan kondisi atribut ini dapat lulus tepat waktu atau terlambat.

4.8. Kesimpulan dan Saran

Berdasarkan metode perhitungan dan analisis yang digunakan, kesimpulan yang diharapkan dalam penelitian ini adalah prediksi kelulusan mahasiswa tepat waktu dan terlambat berdasarkan akurasi yang paling tepat dengan rekomendasi yang sesuai.

Referensi

Dokumen terkait

Perjalanan penumpang dari Medan ke Pangaribuan dan sebaliknya terdiri dari sembilan zona perjalanan dengan melibatkan beberapa ruas yang dipakai bersama, mengakibatkan

Judul untuk tugas sarjana ini adalah “ Penerapan Concurrent Engineering Dengan Menggunakan Tools Quality Function Deployment (QFD), Failure Mode And Effect Analysis (FMEA)

Tujuan dari penelitian Tugas Akhir ini adalah mengetahui nilai yang didapat perusahaan dari pengukuran kinerja Green Supply Chain Management dengan menggunakan model

Penelitian ini bertujuan untuk mengetahui nilai kinerja manufaktur halal pada UMKM Noerlen dengan menggunakan Metode SCOR (Supply Chain Operation Reference dan

Berdasarkan hasil analisis Cause and Effect Diagram yang telah dilakukan, diketahui penyebab kecacatan cacat fisik yaitu mesin rolling mill tidak bekerja optimal, terdapat

Perbaikan tata letak pabrik diperlukan untuk membuat layout lebih efisien dengan mempertimbangkan faktor derajat kedekatan antar departemen dan frekuensi perpindahan

Berdasarkan tabel 6.6 dapat diperolah usulan perbaikan dari faktor lingkungan, mesin, metode dan manusia dengan metode 5W+1H indikator kecekatan dalam melayani pesanan bahan

Metode acceptance sampling dengan menggunakan pendekatan logika fuzzy dapat digunakan untuk menentukan penerimaan ataupun penolakan lot bahan baku yang dikirim oleh