Penerapan algoritma Naive Bayesian untuk seleksi pegawai studi kasus PT. Mega Andalan Kalasan Yogyakarta

(1)

PENERAPAN ALGORITMA NAÏVE BAYESIAN UNTUK

SELEKSI PEGAWAI

(Studi Kasus Pada PT. Mega Andalan Kalasan Yogyakarta)

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Oleh:

Valentina Dian Indriani

NIM : 085314047

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA

(2)

IMPLEMENTATION OF NAÏVE BAYESIAN ALGORITM FOR

EMPLOYEE SELECTION

(Case Study At PT. Mega Andalan Kalasan Yogyakarta)

A Thesis

Presented as Partial Fullfillment of the Requirements To Obtain the Sarjana Komputer Degree In Study Program of Informatics Engineering

By:

Valentina Dian Indriani

NIM : 085314047

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY YOGYAKARTA

(3)

(4)

(5)

“Berbahagialah orang yang bertahan dalam pencobaan. Sebab apabila ia sudah

tahan uji, ia akan menerima mahkota kehidupan yang dijanjikan Allah pada barang siapa yang percaya kepada-Nya.” (Yakobus 1 : 12)

“Pencobaan-pencobaan yang kamu alami ialah pencobaan- pencobaan biasa, yang tidak melebihi kekuatan manusia. Sebab Allah setia dan karena itu Ia tidak akan membiarkan kamu dicobai melampaui kekuatanmu. Pada waktu kamu dicobai Ia akan memberikan kepadamu jalan keluar, sehingga kamu

dapat menanggungnya.” ( 1 Korintus 10 :

13)

“Mintalah, maka akan diberikan kepadamu; Carilah, maka kamu akan

mendapat; Ketoklah, maka pintu akan dibukakan bagimu. Karena setiap orang yang meminta, menerima, dan setiap orang yang mencari, mendapat, dan setiap

orang yang mengetok, baginya pintu dibukakan.” ( Lukas 11 :9-10)

“Kita meminta apa yang kita inginkan, dan Allah memberikan yang paling kita

perlukan. Itulah yang diberikan-Nya dengan berlimpah!”

(6)

“Karena itu AKU berkata kepadamu

: Apa saja yang kamu minta dan

doakan, percayalah bahwa kamu

telah menerimanya, maka hal itu

akan diberikannya kepadamu.”

( Markus 11 : 24)

Ku Persembahkan karya kecilku untuk:

Orangtua Tercinta, Adik Tersayang, Dosen, dan Teman-Teman

(7)

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini

tidak memuat karya atau bagian dari karya orang lain, kecuali yang telah disebutkan

dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 27 Mei 2013

Penulis

(8)

PENERAPAN ALGORITMA NAÏVE BAYESIAN UNTUK

SELEKSI PEGAWAI

(Studi Kasus PT. Mega Andalan Kalasan Yogyakarta)

ABSTRAK

Dalam lingkup perusahaan sumber daya manusia yaitu pegawai mempunyai peranan yang sangat penting dalam kemajuan suatu perusahaan. Seleksi pegawai mempunyai peran yang strategis, sehingga dapat ditentukan orang yang layak dan berkemampuan untuk diterima dalam perusahaan sesuai dengan penilaian yang sudah dilakukan dalam seleksi penerimaan pegawai.

Dari data kepegawaian tersebut bisa dimanfaatkan untuk diolah menggunakan teknik penambangan data dengan menggunakan algoritma naïve Bayesian. Algoritma

naïve Bayesian akan menghitung probabilitas posterior untuk setiap nilai kejadian dari atribut target pada setiap kasus (sampel data). Selanjutnya, naïve Bayesian akan mengklasifikasikan sampel data tersebut ke kelas yang mempunyai nilai probabilitas posterior tertinggi.

Keluaran sistem adalah rekomendasi seorang pelamar yang akan lolos ke tahap training calon pegawai. Pengujian dilakukan pada 325 record data menggunakan

5-fold cross-validation dengan tingkat rata-rata akurasi yang dihasilkan dari data pengujian sebesar 50%.

(9)

IMPLEMENTATION OF NAÏVE BAYESIAN ALGORITM FOR

EMPLOYEE SELECTION

(Case Study At PT. Mega Andalan Kalasan Yogyakarta)

ABSTRACT

In the scope of human resource company, employees have an important role in the progress of the company. The employee selection has a strategic role that can determine the individuals who are worthy and capable of being accepted in the company in accordance with the employee selection which has been done.

The employment data can be used to process the data by using data mining tehnic of naive Bayesian algorithm. Naive Bayesian Algorithm will count the posterior probability for each value of event from the target attribute in each case (data sample). After that, naive Bayesian will clarify the data sample to the class which has the highest posterior probability score.

System output is a recommendation that an applicant will qualify for the training phase of the prospective employee. Tests performed on 325 data records using a 5-fold cross-validation with an average accuracy rate resulting from the test data by 50%.

(10)

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata

Dharma:

Nama : Valentina Dian Indriani

NIM : 08 5314 047

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan

Universitas Sanata Dharma karya ilmiah saya yang berjudul:

PENERAPAN ALGORITMA NAÏVE BAYESIAN UNTUK SELEKSI PEGAWAI

(Studi Kasus PT. Mega Andalan Kalasan Yogyakarta)

Dengan demikian saya memberikan kepada Universitas Sanata Dharma hak

untuk menyiapkan, mengalihkan dalam bentuk media lain, mengelola dalam bentuk

pangkalan data, mendistribusikan secara terbatas, dan mempublikasikan di internet

atau media lain untuk kepentingan akademis tanpa perlu meminta izin dari saya

maupun memberi royalty kepada saya selama tetap mencantumkan nama saya

sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di Yogyakarta

Pada Tanggal: 27 Mei 2013

Yang menyatakan,

(11)

KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa, karena

hanya dengan berkat dan karunia-Nya, serta campur tangan-Nya, penulis dapat menyelesaikan skripsi yang berjudul “PENERAPAN ALGORITMA NAÏVE

BAYESIAN UNTUK SELEKSI PEGAWAI (Studi Kasus PT. Mega Andalan

Kalasan Yogyakarta)” dengan baik.

Pada kesempatan ini penulis juga ingin mengucapkan rasa terima kasih

kepada:

1. Tuhan Yesus Kristus dan Bunda Maria untuk semua berkat yang sangat

melimpah yang penulis terima.

2. Bapak Puspaningtyas Sanjoyo Adi S.T., M.T., selaku dosen pembimbing

yang sudah meluangkan waktu dan dengan sabar membimbing penulis,

sehingga skripsi ini dapat diselesaikan dengan baik.

3. Ibu P. H. Prima Rosa, S.Si., M.Sc. dan Ibu Ridowati Gunawan S.Kom.,

M.T. selaku dosen penguji.

4. Pihak sekretariat dan laboran Fakultas Sains dan Teknologi yang turut

membantu penulis dalam studi dan menyelesaikan tugas akhir ini.

5. Kepada kedua orang tua tercinta, Bapak Petrus Mariyanto dan Ibu

Elizabeth Eni Ristiyanti, yang selalu memberikan kasih sayang, semangat,

dukungan serta doa yang melimpah kepada penulis.

6. Adik tersayang Yustina Nila Herdiani yang selalu memberikan hiburan,

semangat, serta kasih sayang kepada penulis.

7. Sahabat hati tersayang, Leo Sukoto, S.T., terimakasih atas semangat,

motivasi, bantuan, dan hiburan yang selalu diberikan kepada penulis.

8. Sahabat dan teman-teman : teman- teman TI tersayang Maria Roswita

V.A, S.Kom, Gadis Pujiningtyas R, S.Kom, Putri Nastiti, S.Kom, Laurina

Silvianti D, S.Kom, Christina Rusma A, S.Kom, Petra Valentin W,

S.Kom, Aristawati C, S.Kom, Ilana F yang bangun pagi untuk saling

menyemangati. Untuk kakak Daditya Nugroho, S.T., Atanasius Tendy,

(12)

dukungannya kepada penulis dan seluruh teman-teman TI 2008 terima

kasih untuk dukungan dan perjuangannya selama ini.

9. Untuk teman kost „Pak Kuat‟, kost Kartika Dewi, dan teman-teman kost

PATRIA yang spartan terima kasih untuk menjadi saudara di jogja. Adik

kost tersayang Adven dan Erni terima kasih sudah saling berbagi suka dan

duka dengan penulis.

10.Tante Rini Veronica, om Kingkin Teja Angkasa, dek Benedictus Elang P

terima kasih karena menjadi saudara di jogja yang memberikan semangat,

dukungan, dan doa.

Penulis menyadari bahwa penelitian tugas akhir ini masih memiliki banyak

kekurangan. Untuk itu, penulis sangat membutuhkan saran dan kritik untuk

perbaikan di masa yang akan datang. Semoga penelitian tugas akhir ini dapat

membawa manfaat bagi semua pihak.

Yogyakarta, 27 Mei 2013

(13)

DAFTAR ISI

HALAMAN JUDUL... ii

HALAMAN PERSETUJUAN... iii

HALAMAN PENGESAHAN... iv

MOTTO... v

HALAMAN PERSEMBAHAN... vi

PERNYATAAN KEASLIAN KARYA... vii

ABSTRAK... viii

ABSTRACT... ix

LEMBAR PERSETUJUAN PUBLIKASI... x

KATA PENGANTAR... xi

DAFTAR ISI... xiii

DAFTAR TABEL... xv

DAFTAR GAMBAR... xvi

BAB I PENDAHULUAN... 1

BAB II LANDASANTEORI... 8

2.1 Penambangan Data... 8

BAB III ANALISA DAN PERANCANGAN SISTEM... 23

3.1 Analisis Sistem... 23

3.1.1 Identifikasi Permasalahan... 23

3.1.2 Analisa Kebutuhan Pengguna... 26

3.2 Masukan Sistem... 26

(14)

3.4 Arsitektur Sistem... 33

BAB IV IMPLEMENTASI DAN ANALISI SISTEM... 44

4.1 Tahap Implementasi... 44

4.1.1 Spesifikasi Software dan Hardware... 44

4.2 Implementasi Use Case... 45

4.3 Implementasi Diagram Kelas... 45

4.4 Pengujian Hasil Sistem... 46

4.4.1 Pengujian 5-fold cross validation... 46

4.4.2 Analisis Struktur Algoritma Naive Bayesian... 51

BAB V KESIMPULAN DAN SARAN... 57

5.1 Kesimpulan... 57

5.2 Saran... 58

5.2.1 Untuk Pengembangan Program... 58

DAFTAR PUSTAKA... 59

(15)

DAFTAR TABEL

Tabel 2.1 Data Mobil Tercuri... 18

Tabel 3.1 Tabel Pelamar... 40

Tabel 3.2 Tabel Calon Pegawai... 41

Tabel 3.3 Tabel Pegawai Tetap... 43

Tabel 4.1 Tabel Hasil Perhitungan Akurasi... 48

Tabel 4.2 Tabel Data Anomali... 50

Tabel 4.3 Tabel nilai likelihood STTB dengan status diterima... 52

Tabel 4.4 Tabel nilai likelihood STTB dengan status tidak diterima... 52

Tabel 4.5 Tabel nilai likelihood test tertulis dengan status diterima... 53

Tabel 4.6 Tabel nilai likelihood test tertulis dengan status tidak diterima... 54

Tabel 4.7 Tabel nilai likelihood test psikologi dengan status diterima... 54

Tabel 4.8 Tabel nilai likelihood test psikologi dengan status tidak diterima.... 55

Tabel 4.9 Tabel nilai likelihood test wawancara dengan status diterima... 55

Tabel 4.10 Tabel nilai likelihood test wawancara status tidak diterima... 56

Tabel 4.11 Tabel nilai likelihood test kesehatan dengan status diterima... 56

(16)

DAFTAR GAMBAR

Gambar 2.1 Langkah Penambangan Data... 8

Gambar 3.1 Alur Pengangkatan Pegawai Tetap... 19

Gambar 3.3 Arsitektur Sistem... 29

Gambar 3.4 Arsitektur Aplikasi untuk Admin... 30

Gambar 3.4 Arsitektur Aplikasi untuk Manager... 31

Gambar 3.5 Diagram Model Use Case Sistem... 32

(17)

BAB I

PENDAHULUAN

1.1Latar Belakang Masalah

Dalam waktu tertentu manusia dihadapkan pada kewajiban mengambil

keputusan. Pada umumnya dapat dilihat bahwa tidak semua keputusan yang

diambil membawa hasil seperti yang diinginkan. Berhasil atau tidaknya suatu

keputusan tergantung dari berbagai faktor. Semakin banyak faktor yang harus

dipertimbangkan, maka semakin relatif sulit untuk mengambil keputusan dari

suatu permasalahan. Apalagi jika upaya pengambilan keputusan dari suatu

permasalahan tertentu, selain mempertimbangkan faktor/kriteria yang beragam,

juga melibatkan beberapa orang pengambil keputusan.

Dalam lingkup perusahaan sumber daya manusia dalam hal ini pegawai

mempunyai peranan yang sangat penting dalam kemajuan suatu perusahaan.

Hanya pegawai berkemampuan dan penempatan pada bagian yang tepat akan

membuat tujuan dari perusahaan tercapai. Seleksi pegawai tetap mempunyai peran

yang strategis, sehingga dapat ditentukan orang yang layak dan berkemampuan

untuk diterima dalam perusahaan sesuai dengan penilaian yang sudah dilakukan

dalam seleksi penerimaan pegawai.

PT. Mega Andalan Kalasan (MAK) adalah perusahaan manufaktur yang

memproduksi peralatan rumah sakit (hospital equipment). Perusahaan tersebut

memiliki pegawai yang cukup banyak dan hampir setiap tahun merekrut pegawai

(18)

Rekrutasi Trainee dan semua hasil penilaian diserahkan yang kemudian diproses

oleh bagian Human Resource Department (HRD). Beberapa hambatan dalam

proses seleksi adalah banyaknya alternatif pegawai serta tahap seleksi manual

yang sudah ditentukan. Berikut ini adalah tahap seleksi pegawai tetap PT. Mega

Andalan Kalasan :

1. Rekrutmen

Pada tahap ini pelamar mengikuti 5 tahap seleksi yaitu seleksi

administrasi, test tertulis, test psikologi, test wawancara teknik dan non

teknik, dan test kesehatan.

2. Pelatihan keahlian / training

Pada tahun 2008 jumlah lamaran yang masuk ke Panitia Rekrutasi Trainee

sejumlah 2010 lamaran. HRD dan Wakil Direktur berkonsultasi dengan pihak

manajemen menyangkut rencana jumlah pegawai yang akan diterima. Arahan

penerima training dari manajemen pada tahun 2008 yaitu 100 pegawai. Setiap

tahun nya kapasitas pegawai yang diterima berbeda-beda, hal ini menurut strategi

bisnis perusahaan. Sebanyak 966 pelamar lolos dalam seleksi Administrasi,

dimana penilaian dilihat dari kualifikasi kelengkapan dokumen lamaran. Sebelum

memasuki tahap seleksi Psikologi terdapat tahap seleksi internal psikologi, namun

seleksi ini hnaya digunakan untuk untuk meminimalkan jumlah peserta test

Psikologi. Pada seleksi Internal Psikologi penilaian diambil dari nilai eksak mata

pelajaran matematika dan fisika dengan jumlah pelamar yang lolos yaitu 456

pelamar. Dalam seleksi Internal Psikologi ini proses seleksi masih dilakukan

secara manual dengan menyeleksi kembali ijasah pelamar misalnya, nilai

(19)

Pencarian keputusan pegawai yang masih dilakukan secara manual

memiliki kelemahan karena membutuhkan waktu yang relatif lama, serta faktor

human error seperti pengolahan, penyajian laporan hasil seleksi, penyimpanan

dan perawatan dokumen berbentuk kertas masih belum dapat ditangani dengan

baik. Selain itu pencarian keputusan pegawai juga hanya mempertimbangkan nilai

calon pegawai dalam masa training. Data rekrutmen belum dimanfaatkan

mempertimbangkan keputusan pengangkatan pegawai tetap.

Dari data kepegawaian tersebut bisa dimanfaatkan untuk diolah

menggunakan teknik penambangan data dengan menggunakan algoritma naïve

Bayesian. Naïve Bayesian merupakan salah satu metode penambangan data yang

digunakan pada persoalan klasifikasi. Algoritma naïve Bayesian akan menghitung

probabilitas posterior untuk setiap nilai kejadian dari atribut target pada setiap

kasus (sampel data). Selanjutnya, naïve Bayesian akan mengklasifikasikan sampel

data tersebut ke kelas yang mempunyai nilai probabilitas posterior tertinggi [5].

Dengan perkembangan dan diterapkannya teknologi komputer atau

teknologi informatika pengolahan data maupun penyajian informasi secara cepat

dan akurat akan sangat membantu untuk meningkatkan kinerja agar lebih efektif

dan efisien. Sistem ini diharapkan membantu dalam menentukan pegawai yang

(20)

1.2Perumusan Masalah

Perumusan masalah yang akan diselesaikan dalam penelitian Tugas Akhir ini

sebagaiberikut :

1. Bagaimana memilih calon pegawai yang memiliki potensi lolos dalam

masa training menggunakan algoritma Naive Bayesian dengan atribut

test rekrutmen yaitu nilai STTB, test psikologi, test tertulis, test

wawancara, dan test kesehatan ?

1.3 Tujuan

Tujuan dari penelitian Tugas Akhir ini adalah :

1. Menerapkan algoritma Naïve Bayesian sebagai salah satu algoritma

dalam penambangan data untuk membantu memberikan rekomendasi

dalam seleksi pegawai di PT. Mega Andalan Kalasan.

1.4 Batasan Masalah

Dalam tugas akhir ini batasan masalah yang akan diambil dalam pembahasan

adalah sebagai berikut:

1. Obyek yang diteliti adalah data pegawai PT. Mega Andalan kalasan

Yogyakarta.

2. Data yang diteliti adalah data pegawai dari jenjang pendidikan Sekolah

Menengah Kejuruan (SMK).

3. Data yang digunakan sebagai atribut adalah data pegawai yang sudah

melalui seleksi yang ditetapkan oleh PT. Mega Andalan Kalasan berkisar

(21)

rentang tahun ini, masih relevan untuk menggambarkan situasi perekrutan

pegawai.

4. Penelitian ini menerapkan algoritma Naïve Bayesian dan dilakukan

pengujian tingkat akurasi algoritma dalam memprediksi seleksi pegawai

pada PT. Mega Andalan Kalasan.

5. Pengguna sistem adalah Human Resource Department (HRD).

1.5 Luaran

Sebuah hasil prediksi dari algoritma Naïve Bayesian. Hasil prediksi tersebut

dapat digunakan Human Resource Department (HRD) sebagai alat bantu dalam

seleksi pegawai tetap.

1.6 Metodologi Penelitian

Langkah-langkah yang dilakukan untuk menyelesaikan masalah pada tugas

akhir ini adalah :

1. Studi literatur

Penulis melakukan studi pustaka dengan mempelajari teori-teori serta

serta referensi yang mendukung penelitian ini terutama yang berhubungan

dengan algoritma Naïve Bayesian. Selain itu penulis juga mengumpulkan

data mengenai sistem seleksi pegawai untuk mengumpulkan informasi

yang digunakan untuk penelitian ini. Dalam penelitian ini penulis

melakukan studi kasus di PT. Mega Andalan Kalasan.

(22)

Pembuatan sistem dilakukan berdasarkan ide kebutuhan sistem seleksi

pegawai. Metode yang dipakai untuk mengembangkan sistem yang

dipakai adalah pendekatan algoritma Naïve Bayesian.

3. Implementasi

Mengimplementasikan hasil perancangan sistem seleksi pegawai.

4. Evaluasi sistem

Melakukan pengujian atau evaluasi terhadap system yang telah

dibangun. Evaluasi dilakukan dengan menguji sistem berdasar beberapa

masukan (inputan).

1.7 Sistematika Penulisan

Adapun sistematika penulisan tugas akhir ini adalah sebagai berikut :

Halaman Judul

Abstrak, berisi tentang rangkuman Tugas Akhir.

Daftar Isi

Bab I Pendahuluan

Bab ini berisi tentang pembahasan latar belakang, perumusan

masalah, tujuan penelitian, batasan masalah, luaran, kegunaan,

metodologi penelitian, serta sistematika penulisan.

Bab II Landasan Teori

Bab ini berisi tentang teori yang dapat menunjang penelitian,

berupa pengertian penambangan data, proses penambangan data,

klasifikasi, dan algoritma Naïve Bayesian.

(23)

Dalam bab ini akan diidentifikasikan masalah yang akan

diselesaikan serta tahap-tahap penyelesaian masalah tersebut

dengan menggunakan algoritma Naïve Bayesian.

Bab IV Analisa Hasil dan Pembahasan

Bab ini memuat implementasi program dan hasil implementasi dari

algoritma yang digunakan, yaitu algoritma Naïve Bayesian serta

pembahasan dari program yang telah dibangun.

Bab V Kesimpulan dan Saran

Bab ini berisi kesimpulan dari sistem yang telah dibuat serta saran

untuk pengembangan dan penyempurnaan tugas akhir ini.

(24)

BAB II

LANDASAN TEORI

2.1. Penambangan Data

2.1.1. Pengertian Penambangan Data

Penambangan Data, sering juga disebut Knowledge Discovery in

Database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian

data historis untuk menemukan keteraturan, pola atau hubungan dalam set

data berukuran besar [1]. Hasil dari penambangan data ini bisa digunakan

untuk memperbaiki pengambilan keputusan masa depan. Secara

sederhana, penambangan data adalah langkah-langkah dalam

mendapatkan/menemukan pengetahuan [2].

Gambar 2.1 Langkah Penambangan Data

(25)

Penemuan pengetahuan ini merupakan sebuah proses seperti

ditunjukkan pada gambar 2.1 dan terdiri dari urutan-urutan sebagai berikut

[2] :

1. Pembersihan data (data cleaning)

Pada langkah ini noice dan data yang tidak konsisten akan dihapus.

Langkah pertama yang dilakukan dalam proses pembersihan data

(data cleaning atau disebut juga data cleansing) adalah deteksi

ketidakcocokan. Ketidakcocokan tersebut dapat disebabkan oleh

beberapa faktor antara lain desain form masukan data yang kurang

baik sehingga menyebabkan munculnya banyak field, adanya

kesalahan petugas ketika memasukkan data, adanya kesalahan yang

disengaja dan adanya data yang rusak.

2. Integrasi data (data integration)

Pada langkah ini akan dilakukan penggabungan data. Data dari

bermacam-macam tempat penyimpanan data akan digabungkan ke

dalam satu tempat penyimpanan data yang koheren. Macam-macam

tempat penyimpanan data tersebut termasuk multiple database, data

cube, atau file flat. Pada langkah ini, ada beberapa hal yang perlu

diperhatikan yaitu integrasi skema dan pencocokan objek,

redundansi data, deteksi dan resolusi konflik nilai data. Selama

melakukan integrasi data, hal yang perlu dipertimbangkan secara

khusus adalah masalah struktur data. Struktur data perlu diperhatikan

(26)

3. Seleksi data (data selection)

Data yang relevan akan diambil dari basis data untuk dianalisis. Pada

langkah ini akan dilakukan analisis korelasi untuk analisi fitur.

Atribut-atribut data akan dicek apakah relevan untuk dilakukan

penambangan data. Atribut yang tidak relevan ataupun atribut yang

mengalami redundansi tidak akan digunakan. Atribut yang

diharapkan adalah atribut yang bersifat independen. Artinya, antara

atribut satu dengan atribut yang lain tidak saling mempengaruhi.

4. Transformasi data (data transformation)

Data ditransformasikan ke dalam bentuk yang tepat untuk

ditambang. Yang termasuk dalam langkah transformasi data adalah

penghalusan (smooting) yaitu menghilangkan noise yang ada pada

data, pengumpulan (aggregation) yaitu mengaplikasikan kesimpulan

pada data, generalisasi (generalization) yaitu mengganti data

primitif/data level rendah menjadi data level tinggi), normalisasi

(normalization) yaitu mengemas data atribut ke dalam skala yang

kecil, sebagai contoh -1.0 sampai 1.0, dan konstruksi atribut/fitur

(attribute construction/feature construction) yaitu mengkonstruksi

dan menambahkan atribut baru untuk membantu proses

penambangan.

5. Penambangan data (data mining)

Langkah ini adalah langkah yang penting di mana akan diaplikasikan

metode yang tepat untuk mengekstrak pola data.

(27)

Langkah ini berguna untuk mengidentifikasi pola yang benar dan

menarik. Pola tersebut akan direpresentasikan dalam bentuk

pengetahuan berdasarkan beberapa pengukuran yang penting.

7. Presentasi pengetahuan (knowledge presentation)

Pada langkah ini informasi yang sudah ditambang akan

divisualisasikan dan direpresentasikan kepada pengguna. Langkah 1

sampai dengan langkah 4 merupakan langkah praproses data di mana

data akan disiapkan terlebih dahulu selanjutnya dilakukan

penambangan.

Pada langkah penambangan data, pengguna atau basis pengetahuan bisa

dilibatkan. Kemudian pola yang menarik akan direpresentasikan kepada

pengguna dan akan disimpan sebagai pengetahuan yang baru.

2.1.2. Pengelompokan Penambangan Data

Penambangan data dibagi menjadi beberapa kelompok berdasarkan

tugas yang dapat dilakukan, yaitu (Larose,2005):

a. Deskripsi

Terkadang peneliti dan analisis secara sederhana ingin mencari cara

untuk menggambarkan pola dan kecenderungan yang terdapat dalam

data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat

menemukan keterangan atau fakta bahwa siapa yang tidak cukup

professional akan sedikit didukung dalam pemilihan presiden. Deskripsi

dari pola dan kecenderungan sering memberikan kemungkinan

(28)

b. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali atribut target lebih

kearah numerik daripada kearah kategori. Model dibangun

menggunakan record lengkap yang menyediakan nilai dari atribut target

sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi

niali dari atribut target dibuat berdasarkan atribut prediksi.

c. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa

dalam prediksi nilai dari hasil aka nada di masa mendatang.

d. Klasifikasi

Dalam klasifikasi, terdapat target atribut kategori. Sebagai contoh,

menentukan apakah suatu transaksi kartu kredit merupakan transaksi

yang curang atau bukan.

e. Pengklusteran

Pengklusteran merupakan pengelompokkan record¸pengamatan, atau

memperhatikan dan membentuk kelas objek-objek yang memiliki

kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan

satu dengan yang lainnya dan memiliki ketidakmiripan dengan

record-record dalam kluster lain.

Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya atribut

target dalam pengklusteran.Algoritma ini mencoba untuk melakukan

pembagian terhadap keseluruhan data menjadi kelompok-kelompok

(29)

dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan

dengan record dalam kelompok lain akan bernilai minimal.

f. Asosiasi

Tugas asosiasi dalam penambangan data adalah menemukan atribut

yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut

market basket analisis.

2.1.3. Klasifikasi

Klasifikasi merupakan model atau classfier yang

dikonstruksikan untuk memprediksi kategori label (categorical labels).

Misalnya : aman atau berbahaya untuk sebuah data aplikasi, ya dan

tidak untuk data penjualan. Klasifikasi dan prediksi numerik adalah

dua tipe utama dari masalah-masalah prediksi (prediction problems)

[2]. Cara klasifikasi bekerja, di mana klasifikasi data (data

classification) terdiri dari dua langkah proses, yaitu :

1. Langkah pertama, penggolong (classifier) mendiskripsikan pembangunan himpunan dari kelas-kelas data atau

konsep-konsep yang telah ditetapkan. Bagian ini merupakan langkah

pembelajaran atau fase pelatihan (learning step atau training

phase), di mana algoritma klasifikasi yang dibangun

digolongkan melalui menganalisa atau dari mana pembelajaran

itu berasal “ learning from”, sebuah training set akan dibuat dari

database tuples dan label-label kelas yang berhubungan satu dan

(30)

n-dimensional attribute vector, di mana X = (x1, x2,…,xn),

menggambarkan ukuran n tuple dari n atribut-atribut basisdata,

A1,A2, …., An. Setiap tuple , X, diasumsikan termasuk dalam

kelas predefined yang ditentukan oleh atribut basis data lainnya

yang disebut class label attribute. Karena label kelas dari setiap

tuple pelatihan sudah tersedia maka fase ini juga dikenal

dengan sebutan fase supervised learning.

2. Langkah kedua, mengenai akurasi dari klasifikasi. Model langsung akan langsung digunakan untuk diklasifikasi.Pertama,

akan ditaksir seberapa akurat prediksi yang dibuat oleh

classifier. Jika kekuatan classifier diukur dengan menggunakan

data pelatihan, maka taksiran ini akan baik karena classifier

cenderung overfit data. Maka dari itu, perlu digunakan

sekumpulan data uji. Data tersebut dipilih secara acak dari

sekumpulan data umum. Data yang diuji ini bersifat independen/

berdiri sendiri dari data pelatihan, artinya data yang diuji

tersebut tidak lagi digunakan untuk membuat classifier.

2.2. Teorema Bayesian

2.2.1 Pengertian Teorema Bayesian

Teori keputusan Bayes atau sering disebut Teorema bayes adalah

pendekatan statistic yang fundamental dalam pengenalan pola (pattern

recognition) [1]. Pendekatan Teorema Bayes ini didasarkan pada

(31)

menggunakan probabilitas dan nilai yang muncul dalam

keputusan-keputusan tersebut.

Jika X adalah bukti atau kumpulan data pelatihan dan adalah

hipotesis. Jika class variable memiliki hubungan tidak deterministic

dengan atribut, maka dapat diperlukan X dan sebagai atribut acak dan

menangkap hubungan peluang menggunakan � . Peluang bersyarat ini

juga dikenal dengan probabilitas posterior untuk , dan �( ) adalah

probabilitas prior. Untuk mengestimasi peluang posterior secara akurat

untuk setiap kombinasi label kelas yang mungkin dan nilai atribut adalah

masalah sulit karena membutuhkan training set sangat besar, meski untuk

jumlah moderate atribut. Penggunaan teorema Bayes untuk melakukan

klasifikasi sangat bermanfaat karena menyediakan pernyataan istilah

peluang posterior dari peluang prior �( ), peluang kelas bersyarat �

dan bukti �( ) seperti pada Rumus 2.1 berikut [3] :

( Rumus 2.1)

Dalam hal ini :

X = himpunan data training

Y = hipotesis.

� ( | ) = probabilitas posterior, yaitu probabilitas bersyarat dari

hipotesis Y berdasarkan kondisi X.

�( ) = probabilitas prior dari hipotesis Y, yaitu probabilitas bahwa

hipotesis Y bernilai benar sebelum data X muncul.

(32)

� ( | ) = probabilitas bersyarat dari X berdasarkan kondisi pada

hipotesis Y, dan biasa disebut dengan likelihood. Likelihood ini mudah

untuk dihitung ketika memberikan nilai 1 saat X dan Y konsisten, dan

memberikan nilai 0 saat X dan Y tidak konsisten.

2.2.2 Klasifikasi Naïve Bayesian

Klasifikasi Naïve Bayesian merupakan salah satu metode

pengklasifikasi yang berdasarkan pada penerapan Teorema Bayes dengan

asumsi antar atribut penjelas saling bebas (independen). Algoritma ini

memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh

ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa

depan berdasarkan pengalaman dimasa sebelumnya.

Klasifikasi Naïve Bayes diasumsikan dimana nilai atribut dari

sebuah kelas dianggap terpisah dan independen dengan nilai atribut

lainnya. [3]:

( Rumus 2.2 )

Keterangan :

X = himpunan data training

Y = hipotesis.

�( | ) = probabilitas posterior, yaitu probabilitas bersyarat dari hipotesis

Y berdasarkan kondisi X.

�( ) = probabilitas prior dari hipotesis Y, yaitu probabilitas bahwa

hipotesis Y bernilai benar sebelum data X muncul.

(33)

�( 1| ) , �( 2| ) , �( | ) = probabilitas dari X1, X2, Xn untuk hipotesis

Y, biasa disebut dengan likelihood.

Karena P(X) irrelevant maka untuk mencari peluang hanya menggunakan

rumus berikut ini :

( Rumus 2.3 )

Jika ada P(Xn|Y) yang memiliki nilai 0, maka P(Y|X) = 0. Maka

klasifikasi Naïve Bayesian tidak bisa memprediksi record yang salah satu

atributnya memiliki probabilitas bersyarat (likelihood) = 0. Untuk

mengatasi hal itu maka dilakukan penambahan nilai 1 ke setiap evidence

dalam perhitungan sehingga probabilitas tidak akan bernilai 0. Langkah ini

sering disebut Laplace Estimator dengan rumus sebagai berikut [1] :

( Rumus 2.4 )

Dimana :

= total jumlah instances dari kelas

� = jumlah contoh training dari yang menerima nilai

(34)

Pada tabel 2.1 adalah contoh kasus yang akan diselesaikan dengan

algoritma naïve bayes.

Tabel 2.1 Data Mobil Tercuri

Warna Tipe Asal Kelas : Tercuri ?

Merah Sport Domestik Tidak

Kuning Sport Domestik Tidak

Kuning Sport Import Ya

Kuning SUV Import Ya

Kuning SUV Domestik Tidak

Merah SUV Import Ya

Merah Sport Import Ya

Tabel 2.1 memperlihatkan data training dengan atribut : warna, tipe, asal.

Sedangkan atribut label kelas adalah tercuri. Berikut ini adalah

penyelesaian contoh kasus mengguakan algoritma naïve bayes :

Terdapat dua class dari klasifikasi yang dibentuk, yaitu :

1 = tercuri= “ya” 2 = tercuri = “tidak”

Data yang akan diklasifikasikan adalah =(warna=merah, tipe=SUV,

(35)

Penyelesaian :

�( ) merupakan probabilitas prior (untuk setiap class) yang dapat

dihitung berdasarkan data training pada Tabel 2.1.

P(tercuri = ya) = 5/10 = 0.5

P(tercuri = tidak) = 5/10 = 0.5

Untuk menghitung

�

,

untuk i=1,2 akan dihitung probabilitas

bersyarat (likelihood) sebagai berikut :

Likelihood atribut warna :

P(warna=merah | tercuri = ya) = 2/5 = 0.4

P(warna=merah | tercuri = tidak) = 3/5 = 0.6

P(warna=kuning | tercuri = ya) = 3/5 = 0.6

P(warna=kuning | tercuri = tidak) = 2/5 = 0.4

Likelihood atribut tipe :

P(tipe=SUV | tercuri = ya) = 3/5 = 0.6

P(tipe=SUV | tercuri = tidak) = 1/5 = 0.2

P(tipe=sport | tercuri = ya) = 2/5 = 0.4

P(tipe=sport | tercuri = tidak) = 4/5 = 0.8

Likelihood atribut asal :

P(asal=domestik | tercuri = ya) = 0/5 = 0

P(asal=domestik | tercuri = tidak) = 5/5 = 1

P(asal=import | tercuri = ya) = 5/5 = 1

(36)

Laplace Estimator

Bila ditemukan salah satu atribut yang memiliki probabilitas bersyarat

(likelihood)=0, maka dilakukan penambahan nilai satu ke setiap evidence

sehingga tidak ada probabilitas yang akan bernilai 0. Berikut ialah nilai

likelihood untuk atribut asal setelah dilakukan laplace estimator.

Likelihood atribut asal :

P(asal=domestik | tercuri = ya) = 1/7 = 0.14

P(asal=domestik | tercuri = tidak) = 6/7 = 0.86

P(asal=import | tercuri = ya) = 6/7 = 0.86

P(asal=import | tercuri = tidak) = 1/7 = 0.14

Dari probabilitas-probabilitas tersebut, maka diperoleh

P( |tercuri=ya) = P(warna=merah | tercuri = ya) x P(tipe=SUV | tercuri = ya) x P(asal=domestik | tercuri = ya)

= 0.4 x 0.6 x 0.14

= 0.0336

P( |tercuri=tidak) = P(warna=merah | tercuri = tidak) x P(tipe=SUV | tercuri = tidak) x P(asal=domestik | tercuri = tidak)

= 0.6 x 0.2 x 0.86

(37)

Untuk menemukan kelas �( ), maksimalkan � �( ) dengan

menghitung P( |tercuri=ya)P(tercuri=ya) = 0.0336 x 0.5 = 0.0168

P( | tercuri=tidak) P(tercuri=tidak) = 0.1032 x 0.5 = 0.0516

Persentasi prediksi untuk tercuri =”ya” adalah :

0. 0168/(0. 0168+0. 0516) x 100% = 24.6%

Persentasi prediksi untuk tercuri =“tidak” adalah :

0. 0516/(0. 0168+0. 0516) x 100% = 75.4%

Kesimpulan :

Jika mobil warna=merah, tipe=SUV, asal=domestik maka klasifikasi

naïve bayes memprediksi “tidak tercuri”, dengan presentase 75,4%.

3. K-Fold Cross Validation

Cross Validation adalah salah satu metode yang bisa digunakan untuk

mengukur kinerja dari sebuah model prediktif. Dalam k-fold Cross Validation,

data akan dipartisi secara acak ke dalam k partisi, D1, D2, …Dk, masing-masing

D mempunyai jumlah yang sama. Pada iterasi ke – i partisi Di digunakan sebagai

data uji, sedangkan sisa partisi digunakan sebagai data pelatihan. Maka dari itu

pada iterasi pertama, D1 digunakan sebagai data uji dan D2, D3, ….Dk digunakan

sebagai data pelatihan. Pada iterasi kedua, D2 digunakan sebagai data uji,

sedangakan D1, D3, ….Dk digunakan sebagai data pelatihan. Pada iterasi ketiga,

D3 digunakan sebagai data uji, sedangkan D1, D2, …Dk digunakan sebagai data

(38)

uji dan berkali-kali sebagai data pelatihan. Untuk pengklasifikasian, pengukuran

keakurasian dapat dihitung dengan rumus sebagai berikut :

(39)

BAB III

ANALISA DAN PERANCANGAN SISTEM

3.1. Analisis Sistem

3.1.1. Identifikasi Permasalahan

Dalam proses rekrutmen pelamar mengikuti 5 rangkaian test, yaitu

test administrasi, test tertulis, test psikologi, test wawancara, dan yang

terakhir test kesehatan. Proses rekrutmen ditangani oleh Panitia Rekrutasi

Trainee dan semua hasil penilaian diserahkan yang kemudian diproses

oleh bagian HRD. Pelamar yang lolos dalam rekrutmen menjadi calon

pegawai dan diterima di Unit Training Center PT.Mega Andalan Kalasan

untuk menempuh pelatihan dan pendidikan sebelum resmi di angkat

sebagai pegawai tetap. Dibawah ini adalah alur yang dilakukan HRD

untuk dari pelamar sampai menjadi pegawai tetap.

Gambar 3.1 Alur Pengangkatan Pegawai Tetap

Seleksi dan pengambilan keputusan penerimaan pegawai baru di

PT. Mega Andalan Kalasan masih dilakukan secara manual, belum

menggunakan sistem yang terkomputerisasi dengan baik untuk membatu

seleksi penerimaan pegawai baru. Langkah-langkah yang dilakukan dalam

(40)

1. Panitia Rekrutasi Trainee menerima semua berkas lamaran yang masuk,

kemudian di seleksi dalam seleksi administrasi.

2. Apabila jumlah pelamar yang memenuhi standar dalam jumlah yang

banyak maka panitia akan menerapkan seleksi internal psikologi.

Seleksi internal psikologi adalah langkah alternatif sebelum dilakukan

test psikologi. Panitia menyeleksi secara manual ijasah pelamar dengan

menyeleksi nilai eksak mata pelajaran matematika dan fisika.

3. Panitia Rekrutasi Trainee membuat surat panggilan test psikologi

kepada pelamar.

4. Karena PT. Mega Andalan Kalasan tidak memiliki panitia dan fasilitas

untuk test psikologi, maka test dilaksanakan oleh Lembaga Psikologi.

Kemudian hasil test diserahkan kembali ke Panitia Rekrutasi Trainee.

5. Panitia Rekrutasi Trainee kembali membuat surat panggilan test

kesehatan kepada pelamar.

6. Dalam Test Kesehatan PT. Mega Andalan Kalasan menggunakan jasa

Balai Hiperkes dan KK DISNAKERTRANS Propinsi DI.Yoykakarta.

Test kesehatan meliputi : test mata, jantung, paru-paru, darah urine, dan

cek kesehatan secara umum.

7. Panitia Rekrutasi Trainee kembali membuat surat panggilan test

(41)

8. Test wawancara teknik dan non teknik dilakukan oleh pihak HRD

dengan skor penilaian antara 0-100. Diterima atau tidaknya pelamar

sesuai ranking penilaian akhir.

9. Pengumuman akhir perekrutan pegawai

10.Penyerahan pegawai baru ke Unit Training Center.

11.Laporan akhir hasil rekrutmen dan seleksi.

Dalam Tugas Akhir ini data rekrutmen pegawai akan diteliti apakah

hasil rekrutmen mempengaruhi hasil akhir seleksi pegawai. Keberhasil

training calon pegawai dapat direpresentasikan dengan berbagai aspek

penilaian dan indeks prestasi kumulatif. Data kepegawaian tersebut bisa

dimanfaatkan untuk diolah menggunakan teknik penambangan data dengan

menggunakan algoritma Naïve Bayesian.

Data yang digunakan untuk penelitian ini adalah data hasil rekrutmen

dan data hasil training pegawai PT. Mega Andalan Kalasan yang di dapat

dari Human Resource Department (HRD). Data diberikan dalam format

ekstensi xls yang terdiri dari tahun 2000, 2002, 2003, 2006, 2008, dan

2010. Data pegawai tersebut terdiri dari atribut nomor, nama, tempat lahir,

tanggal lahir, alamat, agama, nama sekolah, jurusan, nilai STTB, hasil

rekomendasi psikotest, hasil test tertulis, hasil test wawancara, hasil test

(42)

3.1.2. Analisis Kebutuhan Pengguna

Manager dan Administrator adalah pelaku (user) dalam sistem ini.

Selama menjalani proses taining calon pegawai mendapatkan pelatihan

dan penilaian. Manager adalah user yang memiliki wewenang dalam

memberikan keputusan seorang pelamar diterima atau tidak. Manager juga

memiliki wewenang dalam memberikan penilaian bagi calon pegawai,

serta memutuskan calon pegawai diangkat menjadi pegawai tetap atau

tidak. Manager juga memiliki wewenang untuk mengakses sistem, serta

dapat melakukan seleksi calon pegawai dan seleksi pegawai tetap.

Sedangkan administrator memiliki wewenang untuk melakukan kegiatan

menambah, mengubah, menampilkan data calon pegawai dan pegawai

tetap.

3.2. Masukan Sistem

Pada bagian ini, data yang menjadi masukkan sistem dibagi menjadi 2

bagian yaitu : data pelatihan dan data uji. Pada data pelatihan terdapat 5 variabel,

meliputi: nilai sttb, test psikologi, test tertulis, test wawancara, dan test kesehatan.

Sedangkan data uji, semua variabel tetap digunakan hanya variabel hasil sistem

(43)

3.3. Proses Sistem

Proses sistem menggunakan algoritma Naive Bayesian sebagai berikut:

a.) Dalam sistem ini kelas-kelas yang muncul dari atribut target. X1 untuk

kelas dengan status penerimaan = Diterima, dan X2 untuk kelas dengan

status penerimaan = Tidak Diterima.

b.) Menghitung nilai Probabilitas Prior untuk masing-masing kelas X1 dan X2

yaitu sebagai berikut :

P(X1 = Diterima) =

P(X2 = Tidak Diterima) =

c.) Menghitung Probabilitas Bersyarat atau yang disebut Likelihood untuk

setiap kelas X1 dan X2 sesuai dengan atribut :

(44)

(45)

(46)

(47)

(48)

d.) Melakukan proses prediksi dengan menghitung Probabilitas Posterior dari

data yang akan diprediksi. Misalnya dari model data dibawah ini akan

diprediksi dengan menggunakan algoritma Naive Bayesian dengan

menghitung nilai probabilitas posterior sebagai berikut:

nilai_sttb test_psikologi test_tertulis test_wawancara test_kesehatan

8.5 Masih

Disarankan

75 3.8 A

Probabilitas posterior status penerimaan = Diterima :

P (status_penerimaan=diterima | K)

= (K|status_penerimaan=diterima) . (status_penerimaan=diterima)

={P(nilai_sttb=8.5|status_penerimaan=diterima).P(test_psikologi=masihdi sarankan | status_penerimaan = diterima) . P(test_tertulis = 75 | status_penerimaan = diterima) . P(test_wawancara =3.8 | status_penerimaan = diterima) . P(test_kesehatan =A | status_penerimaan = diterima) }. P(Status = diterima)

Probabilitas posterior status penerimaan = Tidak Diterima :

P (status_penerimaan=tidak diterima | K)

= (K|status_penerimaan= tidak diterima) . (status_penerimaan= tidak diterima)

(49)

status_penerimaan = tidak diterima) . P(test_kesehatan = A | status_penerimaan = tidak diterima) }. P (Status = tidak diterima)

e.) Setelah probabilitas posterior sudah didapatkan, nilai probabilitas akan

dibandingkan dan nilai yang paling besar diambil unutuk menjadi nilai

hasil prediksi.

3.4. Arsitektur Sistem

Gambar 3.3 Arsitektur Sistem

Gambar 3.3 merupakan arsitektur sistem yang akan dibangun. Dalam arsitektur

tersebut administrator menggunakan aplikasi untuk dapat mengakses dan

mengelola data yang ada di database. Sedangkan manager menggunakan aplikasi

untuk dapat mengakses data dari database untuk melakukan seleksi.

Administrator Aplikasi

Database Server

(50)

Gambar 3.4 Arsitektur Aplikasi untuk Admin

Gambar 3.4 merupakan arsitektur aplikasi untuk Administrator yang akan

dibangun. Dalam Arsitektur tersebut administrator akan memasukan data pelamar

berupa ID pelamar, nama, tempat lahir, tanggal lahir, alamat, agama, nama

pendidikan, jurusan, nilai test , tanggal rekrutmen. Sedangkan untuk data calon

pegawai yaitu nilai training dan evaluasi kinerja pegawai. Saat ada perubahan

yang dilakukan oleh administrator maka data yang baru akan disimpan di

database.

Perubahan Database Kepegawaian User

Data kepegawaian telah berubah

(51)

Gambar 3.4 Arsitektur Aplikasi untuk Manager

Gambar 3.4 merupakan arsitektur aplikasi untuk manager yang akan dibangun.

Dalam Arsitektur tersebut manager akan mengambil data pelamar baru dari

database, kemudian manager melakukan proses seleksi. Sedangkan untuk seleksi

calon pegawai yaitu dengan mengambil data dari database kemudian melakukan

proses seleksi. Saat ada perubahan yang dilakukan oleh manager maka data yang

baru akan disimpan di database.

Perubahan Database Kepegawaian User

Data kepegawaian telah berubah

(52)

3.5. Perancangan Umum Sistem

Pada subbab ini akan dijelaskan gambaran umum dari sistem yang akan

dibangun berupa diagram use case, narasi use case, diagram aktivitas, model

analisis, diagram kelas, dan desain basis data.

3.5.1.Diagram Model Use Case

Login

Seleksi Calon Pegawai Seleksi Pegawai Tetap Kelola Data Pelamar

Kelola Data Calon Pegawai

<<depends on>> <<depends on>>

Packages Adminiatrator Packages Manager

Gambar 3.5 Diagram Model Use Case Sistem

Gambar 3.5 adalah diagram use case HRD yang bertindak sebagai User. Dalam

sistem ini terdapat 2 user yaitu Manager dan Administrator. Manager memiliki

wewenang untuk melakukan seleksi calon pegawai dan seleksi pegawai tetap.

Sementara Administrator bertugas mengelola data pelamar dan mengelola data

calon pegawai yaitu menambah, mengubah, dan menampilkan data.

3.5.2. Narasi Use Case

Aktivitas usecase akan di deskripsikan secara tertulis dalam narasi usecase.

Skenario dari diagram usecase pada Gambar 3.4 terdapat pada lampiran I pada

halaman 61.

(53)

3.5.3. Diagram Aktivitas

Diagram Aktivitas merupakan diagram yang menjelaskan aktivitas user

dengan sistem. Secara lebih terperinci tahap diagram aktivitas dapat dilihat di

lampiran II pada halaman 75.

3.5.4. Model Analisis

Diagram Aktivitas merupakan diagram yang menjelaskan aktivitas user

dengan sistem. Secara lebih terperinci tahap diagram aktivitas dapat dilihat di

(54)

3.5.5. Diagram Kelas

(55)

3.5.6. Perancangan Basis Data

Berikut ini adalah desain konseptual dan desain basis data fisikal yang

terbentuk dalam sistem.

a.)Desain Konseptual

Diagram Relasi Entitas (ER Diagram)

(56)

b.)Desain Basis Data Fisikal

Tabel Pelamar

Tabel Pelamar digunakan untuk menyimpan semua informasi pelamar.

Tabel 3.1 Tabel Pelamar

Field Tipe Fungsi

id_pelamar Varchar

Menyimpan ID pelamar serta

sebagai primary key dari tabel

pelamar.

nama Varchar Menyimpan nama pelamar

tempat_lahir Varchar Menyimpan tempat lahir pelamar

tanggal_lahir Varchar Menyimpan tanggal lahir pelamar

agama Varchar Menyimpan agama pelamar

nama_pendidikan Varchar

Menyimpan nama_pendidikan

pelamar

jurusan Varchar Menyimpan jurusan pelamar

alamat Varchar Menyimpan alamat pelamar

nilai_sttb Decimal Menyimpan nilai STTB pelamar

test_psikologi Varchar

Menyimpan hasil final test

(57)

test_tertulis Int

Menyimpan hasil final test tertulis

pelamar

test_wawancara Decimal

wawancara pelamar

test_kesehatan Varchar

kesehatan pelamar

tanggal_rekrutmen Date

Menyimpan tanggal

diselenggarakannya rekrutmen

hasil_rekomendasi Int

Menyimpan hasil prediksi dari

klasifikasi Naive Bayesian

status_penerimaan Int

Menyimpan status penerimaan

calon pegawai

Tabel calonpegawai

Tabel calonpegawai digunakan untuk menyimpan semua informasi

pelamar yang diterima sebagai calon pegawai.

Tabel 3.2 Tabel Calon Pegawai

id_capeg Varchar

Menyimpan ID calon pegawai serta

(58)

nilai_training Decimal

Menyimpan nilai akhir calon

pegawai melakukan training

mutu Int

Menyimpan nilai mutu dalam

evaluasi kinerja calon pegawai

kehandalan Int

Menyimpan nilai kehandalam dalam

ketersediaan Int

Menyimpan nilai ketersediaan dalam

produktivitas Int

Menyimpan nilai produktivitas

dalam evaluasi kinerja calon pegawai

ketergantungan Int

Menyimpan nilai ketergantungan

dalam evaluasi kinerja calon pegawai

status_penerimaan Varchar

Menyimpan status calon pegawai

apakah diterima menjadi pegawai

(59)

Tabel Pegawai Tetap

Tabel Pegawai Tetap digunakan untuk menyimpan semua informasi calon

pegawai yang diterima menjadi pegawai tetap.

Tabel 3.3 Tabel Pegawai Tetap

id_pegawai Varchar

Menyimpan ID pegawai tetap serta sebagai

primary key dari tabel pegawai tetap.

Nama Varchar Menyimpan nama pegawai tetap

3.6. Model Desain

Pada model desain akan ditampilkan perancangan dari tiap use case yang

akan diimplementasikan. Perancangan antarmuka pengguna secara lebih lengkap

(60)

BAB IV

IMPLEMENTASI DAN ANALISIS SISTEM

Pada bab ini berisi tentang implementasi dan analisis sistem. Implementasi

sistem berdasarkan pada analisis dan perancangan sistem pada bab sebelumnya

untuk memprediksi nilai rekrutmen calon pegawai. Implementasi yang dijelaskan

berupa implementasi software dan hardware yang digunakan dalam implementasi

sistem, implementasi file, serta implementasi use case yang terbentuk dari

pembuatan sistem.

4.1. Tahap Implementasi

4.1.1. Spesifikasi Software dan Hardware

Spesifikasi software yang digunakan dalam implementasi sistem ini

adalah:

Bahasa pemrograman : Java Netbeans IDE 6.8

DBMS : SQLyog814Enterprise

Spesifikasi hardware yang digunakan dalam implementasi sistem ini

adalah :

Processor : Intel corei3 2.53 GHz

Memori : 2 GB

(61)

4.2. Implementasi Use Case

Use case yang telah dirancang pada Bab III, telah diimplementasikan ke

dalam sebuah tampilan antarmuka. Antarmuka atau biasa dikenal dengan GUI

(Graphical User Interface) merupakan tampilan yang langsung berinteraksi

dengan pengguna (user). Antar muka dari program yang telah dibangun dapat

dilihat di lampiran V pada halaman 111.

4.3. Implementasi Diagram Kelas

Pada bab III sebelumnya sudah dibuat rancangan untuk kelas-kelas yang

nantinya akan digunakan oleh sistem. Berikut ini adalah bentuk implementasi dari

desain kelas menjadi implementasi file yang digunakan sistem yang telah dibuat :

Use Case Kelas Desain Implementasi Jenis

Login Login LoginJFrame.java Interface

Login LoginControl.java Controller

koneksiDatabase koneksiDatabase.java Controller

Account Account.java Entity

Kelola

Data

Pelamar

TambahDataPelamar TambahDataPelamar Interface

EditDataPelamar EditDataPelamar Interface

LihatDataPelamar LihatDataPelamar Interface

CapegControl CapegControl Controller

Pelamar Pelamar Entity

Kelola

Data

Calon

TambahDataCapeg TambahDataCapeg Interface

EditDataCapeg EditDataCapeg Interface

(62)

Pegawai PegawaiTetapControl PegawaiTetapControl Controller

CalonPegawai CalonPegawai Entity

Seleksi

Calon

Pegawai

SeleksiCalonPegawai SeleksiCalonPegawai Interface

SeleksiControl SeleksiControl Controller

PegawaiTetap PegawaiTetap Entity

Seleksi

Pegawai

Tetap

SeleksiPegawaiTetap SeleksiPegawaiTetap Interface

SeleksiControl SeleksiControl Controller

PegawaiTetap PegawaiTetap Entity

Implementasi file secara lebih lengkap akan dijelaskan di lampiran VI pada

halaman 125.

Berikut ini adalah tabel file yang digunakan sebagai tools :

No Nama File Fungsi

1. mysql-connector-java-5.0.5-bin.jar Koneksi ke database

2. jcalendar-1.3.2.jar Library untuk pallete Calendar

4.4. Pengujian Hasil Sistem

4.4.1. Pengujian 5-fold cross validation

Setelah semua usecase berhasil diimplementasikan dan dapat

diakses langsung oleh user, tahap akhir dari penelitian ini adalah

pengujian sistem yang telah dibangun. Sistem seleksi pegawai yang

(63)

penulis menggunakan teknik k-fold cross validation dengan 5-fold. Tahap

pengujian sistem sebagai berikut:

1. Penentuan 5 kelompok data

Dalam penelitian ini terdapat data sebanyak 325 data. Data dibagi

menjadi 5 kelompok atau bagian yang hampir sama, seperti yang terlihat

pada gambar dibawah ini:

2. Pengujian dan Perhitungan Akurasi

Setelah data dikelompokan menjadi 5 bagian, maka langkah

selanjutnya adalah pengujian dan perhitungan akurasi. Proses pengujian

dilakukan dengan 5-fold cross validation. Sedangkan proses perhitungan

(64)

Hasil pengujian dan perhitungan akurasi dengan menggunakan 5-fold sebagai berikut :

Tabel 4.1 Tabel Hasil Perhitungan Akurasi

Pengujian Data Training Data

Testing

Total Data

Training

Total Data

Testing

Data Tidak

Sesuai

Data

Sesuai

AKURASI

I B,C, D, E A 259 66 29 37 56%

II A,C,D,E B 259 66 32 34 52%

III A,B,D,E C 259 66 38 28 42%

IV A,B,C,E D 259 66 37 29 44%

V A,B,C,D E 264 61 32 34 56%

(65)

Dari hasil pengujian akurasi seperti terlihat pada tabel diatas, dapat

disimpulkan bahwa :

1. Menggunakan teknik 5-fold cross validation, pengujian dengan

presentase akurasi yang paling jelek terdapat pada pengujian III

dengan akurasi data sebesar 42%. Sedangkan yang paling bagus

terdapat pada pengujian I dengan tingkat akurasi sebesar 56%.

2. Pada pengujian III dan penhujian IV masih memiliki nilai akurasi di

bawah 50%. Hal ini dapat disebabkan karena variasi data untuk tiap

atribut data test rekrutmen berbeda-beda tetapi metode untuk

pengelompokkan datanya sama. Oleh karena itu, jumlah variasi

klasifikasi yang dihasilkan pun berbeda-beda.

Asumsi lain yang dimiliki adalah dengan adanya data-data anomali pada

data training dapat memengaruhi nilai akurasi sistem. Dari data training

sebanyak 325 dataterdapat 7 record yang memiliki pola data seperti pada

(66)

Tabel 4.2 Tabel Data Anomali

ID Nama nilai_

STTB

test_ psikologi test_ tertulis test_ wawancara

test_ kesehatan

status_ penerimaan

TRN-02039 Mustangin 7,88 Kurang Disarankan 76 3,1 A Diterima

TRN-03024 Susanto 6,80 Kurang Disarankan 81 2,7 A Diterima

TRN-03040 Muh. Puji Astoko 6,92 Kurang Disarankan 75 3,4 A Diterima

TRN-03050 Wibowo Rokhmadi 7,88 Kurang Disarankan 78 3,2 A Diterima

TRN-08047 Andreas Tommy Guntoro 7,07 Kurang Disarankan 80 3,1 A Diterima

TRN-10037 Sayat 8,22 Kurang Disarankan 81 3,0 A Diterima

TRN-10055 Slamet Yunianto 7,45 Kurang Disarankan 84 3,3 A Diterima

Data pada tabel 4.2 dianggap bersifat anomali karena status penerimaan= diterima yang didapat seorang pelamar ketika menjadi

pegawai tidak merepresentasikan kemampuan akademis pelamar yang dilihat dari nilai test rekrutmen yaitu nilai STTB, test

(67)

4.4.2. Analisis Struktur Algoritma Naive Bayesian

Dalam analisis struktur algoritma naive bayesian ini data yang

digunakan sebagai sampel data adalah pengujian I dengan jumlah data

sebanyak 256 record. Data pengujian I terdiri dari 5 atribut yaitu nilai

STTB, test tertulis, test psikologi, test wawancara, test kesehatan. Dari

data tersebut terbentuk klasifikasi algoritma naive bayesian untuk setiap

atribut sebagai berikut :

1. Nilai STTB

Tabel 4.3 menampilkan hasil klasifikasi algoritma naive bayesian untuk

nilai STTB dengan status penerimaan diterima.

Tabel 4.3 Tabel nilai likelihood STTB dengan status diterima

Keterangan Nilai Likelihood

Nilai STTB = A 0.08796

Nilai STTB = B 0.4352

Nilai STTB = C 0.3333

Nilai STTB = D 0.3333

Nilai STTB = E 0.0092

Tabel 4.4 menampilkan hasil klasifikasi algoritma naive bayesian untuk

nilai STTB dengan status penerimaan tidak diterima.

Tabel 4.4 Tabel nilai likelihood STTB dengan status tidak diterima

(68)

Nilai STTB = B 0.05

Nilai STTB = C 0.025

Nilai STTB = D 0.06

Nilai STTB = E 0.35

Dari data pengujian I dengan variabel nilai STTB urutan probabilitas status

penerimaan diterima terbesar sampai terkecil yaitu nilai STTB = B, nilai

STTB = C, nilai STTB = D, nilai STTB = A, nilai STTB = E. Sedangkan

status penerimaan tidak diterima nilai STTB = E mempunyai probabilitas

paling kecil. Sehingga dari data diatas dapat disimpulkan bahwa calon

pegawai yang memiliki peluang terbesar untuk diterima dengan nilai

STTB = B dan yang memiliki peluang terbesar untuk tidak diterima

dengan nilai STTB = E.

2. Test Tertulis

Tabel 4.5 menampilkan hasil klasifikasi algoritma naive bayesian untuk

nilai test tertulis dengan status penerimaan diterima.

Tabel 4.5 Tabel nilai likelihood test tertulis dengan status diterima

Nilai Test Tertulis = A 0.0045

Nilai Test Tertulis = B 0.0045

Nilai Test Tertulis = C 0.009

Nilai Test Tertulis = D 0.1409

(69)

nilai test tertulis dengan status penerimaan tidak diterima.

Tabel 4.6 Tabel nilai likelihood test tertulis dengan status tidak diterima

Nilai Test Tertulis = A 0.0227

Nilai Test Tertulis = B 0.0227

Nilai Test Tertulis = C 0.0454

Nilai Test Tertulis = D 0.659

Nilai Test Tertulis = E 0.2272

Dari data diatas dapat dilihat bahwa probabilitas status penerimaan

diterima terbesar adalah test tertulis = D. Sedangkan probabilitas status

penerimaan tidak diterima terbesar adalah test tertulis = D.

3. Test Psikologi

nilai test psikologi dengan status penerimaan diterima.

Tabel 4.7 Tabel nilai likelihood test psikologi dengan status diterima

Nilai Psikologi = Disarankan 0.367

Nilai Psikologi = Masih Disarankan 0.6147

Nilai Psikologi = Kurang Disarankan 0.0092

(70)

nilai test psikologi dengan status penerimaan tidak diterima.

Tabel 4.8 Tabel nilai likelihood test psikologi dengan status tidak diterima

Nilai Psikologi = Disarankan 0.0238

Nilai Psikologi = Masih Disarankan 0.1428

Nilai Psikologi = Kurang Disarankan 0.5238

Nilai Psikologi = Tidak Disarankan 0.5238

Dari data diatas dapat dilihat bahwa calon pegawai yang memiliki peluang

diterima yaitu dengan nilai test psikologi = Masih Disarankan. Dan yang

memiliki peluang paling besar untuk tidak diterima yaitu dengan nilai test

psikologi = Kurang Disarankan dan Tidak Disarankan.

4. Test Wawancara

nilai test wawancara dengan status penerimaan diterima.

Tabel 4.9 Tabel nilai likelihood test wawancara dengan status diterima

Nilai Wawancara = A 0.054

Nilai Wawancara = B 0.0045

Nilai Wawancara = C 0.3513

Nilai Wawancara = D 0.1982

(71)

nilai test wawancara dengan status penerimaan tidak diterima.

Tabel 4.10 Tabel nilai likelihood test wawancara status tidak diterima

Nilai Wawancara = A 0.0217

Nilai Wawancara = B 0.0217

Nilai Wawancara = C 0.0435

Nilai Wawancara = D 0.413

Nilai Wawancara = E 0.4348

Dari data diatas dapat dilihat bahwa probabilitas status penerimaan

diterima terbesar adalah test wawancara = C. Sedangkan probabilitas

status penerimaan tidak diterima terbesar adalah test wawancara = E.

5. Test Kesehatan

nilai test kesehatan dengan status penerimaan diterima.

Tabel 4.11 Tabel nilai likelihood test kesehatan dengan status diterima

Nilai Kesehatan = A 0.0045

Nilai Kesehatan = B 0.0946

Nilai Kesehatan = C 0.360

(72)

Tabel 4.12 Tabel nilai likelihood test kesehatan status tidak diterima

Nilai Kesehatan = A 0.0652

Nilai Kesehatan = B 0.6087

Nilai Kesehatan = C 0.2174

Dari data diatas dapat dilihat bahwa test kesehatan dengan status

penerimaan diterima maupun tidak diterima memiliki probabilitas yang

kecil. Sehingga dari contoh data ini nilai test kesehatan tidak begitu

(73)

BAB V

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Sistem seleksi pegawai yang dibangun menggunakan algoritma Naive

Bayesian untuk memberikan rekomendasi kepada user. Penelitian ini merupakan

studi untuk mengetahui pengaruh hasil nilai rekrutmen dengan hasil akhir seleksi

pegawai menggunakan algoritma Naive Bayesian. Kesimpulan yang dapat diambil

dari penelitian ini adalah sebagai berikut :

1. Sistem seleksi pegawai yang dibangun mempunyai masukan data test

pelamar baru yaitu nilai STTB, nilai test psikologi, nilai test tertulis, nilai

test wawancara, dan nilai test kesehatan. Keluaran sistem adalah

rekomendasi seorang pelamar yang akan lolos ke tahap training calon

pegawai. Persentase rata-rata keakuratan program yang dihasilkan untuk

pengujian sistem menggunakan algoritma Naive Bayesian ini adalah

sebesar 50%.

2. Dari hasil analisis struktur algoritma Naive Bayesian dari data pengujian I

calon pegawai yang dapat disarankan untuk diterima yaitu test psikologi

dengan hasil rekomendasi masih disarankan, nilai STTB = B dengan nilai

7,9-8,47, test kesehatan dengan nilai A, test wawancara = C dengan nilai