KLASIFIKASI MUTASI JABATAN STRUKTURAL PEGAWAI NEGERI SIPIL MENGGUNAKAN METODE DECISION TREE

(1)

KLASIFIKASI MUTASI JABATAN STRUKTURAL PEGAWAI NEGERI

SIPIL MENGGUNAKAN METODE DECISION TREE

Yanti, I Ketut Edy Purnama, dan Surya Sumpeno Teknik Elektro,Institut Teknologi Sepuluh Nopember

Alamat: Gedung B, C & AJ Kampus ITS Sukolilo, Surabaya, 60111, Indonesia Email: yanti.cgbmajid@gmail.com

ABSTRAK

Pemberian rekomendasi usulan mutasi jabatan struktural selama ini membutuhkan waktu yang relatif lama karena dilakukan secara manual serta tidak memiliki pola atau belum bisa mengikuti aturan yang berlaku. Untuk mengatasi hal tersebut dibutuhkan sistem klasifikasi agar memiliki pola serta waktu yang relatif singkat dengan teknik klasifikasi data mining

menggunakan metode Decision Tree C4.5, Label data sebanyak 6 kelas, pengujian sistem

menggunakan data testing sebanyak 25% dari data yang ada. Dalam pengklasifikasian

digunakan pemilihan kriteria atribut berdasarkan information gain, gain ratio dan gini indeks

yang akan diperbandingkan untuk mengetahui tingkat akurasinya. Hasil dari penelitian ini menunjukkan bahwa sistem klasifikasi yang dibangun memiliki tingkat akurasi yang berbeda

berdasarkan tabel confusion Matrix yaitu information gain sebesar 87,18%, gini indeks

86,75% dan gain ratio 82,48%, masing-masing membutuhkan waktu 3 (tiga) detik dalam

pembentukan sistem klasifikasi. Melihat tingkat akurasi dari ketiga pemilihan atribut tersebut maka information gain dapat dipergunakan dalam pemberian rekomendasi mutasi jabatan struktural untuk pengambilan keputusan lebih lanjut.

Kata kunci: Mutasi Jabatan Struktural, Data Mining, Decision Tree C4.5, Information Gain, Gain Ratio, Gini Indeks.

PENDAHULUAN

Pemberian rekomendasi mutasi jabatan struktural masih belum berjalan dengan maksimal sesuai dengan aturan yang berlaku atau tidak memiliki pola mutasi jabatan struktural serta waktu yang relatif lama karena dilakukan secara manual. Hal ini menjadi salah satu penyebab penurunan kinerja Pegawai Negeri Sipil (PNS) dalam bekerja atau pun dalam memberikan layanan ke masyarakat sehingga dibutuhkan sistem klasifikasi yang diharapkan mampu memberikan solusi terhadap pelaksanaan mutasi jabatan struktural dengan membuat pola mutasi jabatan struktural dengan waktu yang relatif singkat.

Ada beberapa penelitian sebelumnya yang membahas tentang mutasi jabatan struktural di lingkup pemerintah daerah seperti yang dilakukan oleh (Pramutoko, 2012) dan (Sriyana, 2013) namun belum ada yang penulis temukan penelitian yang membahas tentang pengklasifikasian mutasi jabatan struktural sehingga penulis anggap bahwa hal tersebut layak untuk diteliti dalam rangka membantu dalam pemberian rekomendasi usulan mutasi.

Metode decision tree yang merupakan pengembangan dari algoritme ID3 (Iterative

Dichotomiser 3) dan juga salah satu algoritme pohon keputusan yang terkenal karena memiliki kelebihan antara lain: mudah dimengerti serta menarik karena dapat divisualisasikan dalam bentuk gambar berupa pohon keputusan (Prabowo Pudjo Widodo, 2013) (Bhatt, 2012) .

Metode klasifikasi Decision Tree merupakan metode yang masuk kelas frequency tabel yaitu

(2)

fitur/variable, metode lainnya yang masuk kelas tersebut antara lain (Sayad, 2010-2012) : One R, ZeroR dan Naive Bayesian.

Dengan memanfaatkan data yang berhubungan dengan kepegawaian serta melihat banyak usulan mutasi jabatan struktural struktural dari Satuan Kerja Perangkat Daerah (SKPD) setiap saat dengan jenjang dan jumlah yang relatif bervariasi, diharapkan mampu memberikan sebuah solusi untuk menjawab persolan pola mutasi jabatan struktural yang ada di daerah. Penelitian ini bukan bertujuan untuk membuat sistem pendukung keputusan mutasi jabatan struktural untuk menduduki jabatan tertentu karena keterbatasan data yang dimiliki namun hanya sebatas mendapatkan model pola klasifikasi mutasi jabatan struktural berdasarkan

eselon menggunakan metode decision tree yang lebih cepat dibandingkan dengan cara manual

yang di harapkan bisa dipergunakan untuk pemberian rekomendasi usulan mutasi jabatan struktural ke pengambil kebijakan sebagai pengambil keputusan lebih lanjut jika sistem klasifikasi yang dibangun memiliki akurasi di atas 70%.

METODE

Penelitian yang dilakukan menggunakan teknik klasifikasi data mining dengan algoritme

Decision Tree C4.5 denganpemilihan kriteria atribut berdasarkan information gain, gain ratio dan gini indeks sebagai kriteria pemilihan atribut yang terkenal dalam Decision Tree (Santosa, 2007) . Proses penelitian dapat dilihat pada blok diagram Gambar 1.

Berdasarkan Gambar 1, dapat dijelaskan blok diagram tersebut sebagai berikut : Melakukan pengumpulan data dari berbagai file yang berhubungan dengan data kepegawaian yaitu gaji = 4471 data, riwayat pendidikan = 13331 data, Data PNS = 4627 data, riwayat diklat = 221 data, riwayat jabatan = 9772 data, calon latpim 2012 = 121 data, latpim III tahun 2005 = 40 data, latpim IV tahun 2004 = 40 data, calon latpim IV tahun 2004 = 49 data, Lampiran SK ijin/tubel serta bantuan ijin/tubel = 59 sheet.

Tahap selanjutnya adalah menentukan parameter input dan output seperti terlihat pada Tabel 1 sebelum menyatukan dalam satu file baru sebagai database. Atribut total jabatan, masa kerja jabatan akhir, total masa kerja jabatan dan masa kerja keseluruhan tidak terdapat dalam data awal namun penulis melakukan perhitungan sendiri berdasarkan data yang telah

ada. Melakukan pembersihan data untuk mengatasi data yang bermasalah seperti missing

value/tidak lengkap dan noisy (Hermawati, 2013) (Bhatt, 2012) agar didapatkan data dengan kualitas yang baik sesuai kebutuhan. Total data yang didapatkan pada tahap ini adalah sebesar 934 data, masing-masing terdiri atas eselon II.b 28 data, III.a 44 data, III.b 75 data, IV.a 324 data, IV.b 55 data, dan Non eselon 408 data.

Data olah terdiri atas data nominal dan numerik, tidak dilakukan metode untuk

mengkategorikan data karena Decision Tree C4.5 bisa menangani data numerik. Data numerik

secara otomatis akan diubah menjadi kategori dengan 2 rentang nilai tiap kategori.

Melakukan training data menggunakan pemilihan kriteria atribut information gain, gain

ratio dan gini indeks dalam penentuan simpul akar/cabang. Dilakukan beberapa perubahan parameter agar didapatkan hasil akurasi yang lebih tinggi dengan pre pruning data yaitu mininal jumlah data tiap daun, minimal jumlah data tiap cabang, minimal gain, kedalaman

pohon, konfidensi. Melakukan pengujian sistem klasifikasi menggunakan data testing untuk

mengetahui tingkat akurasi berdasarkan tabel confusion Matrix sebanyak 25% (234 data) data

dengan pemilihan secara stratified. Pemilihan kriteria atribut yang paling akurat yang akan

(3)

Gambar 1. Blok Diagram Tabel 1 Parameter Input Data

No. Masukan Keterangan

1. Pangkat/Gol Akhir III/a - IV/d

2. Jenjang Pendidikan Jenjang Pendidikan terakhir

3. Masa kerja golongan akhir Tahun berjalan – tahun golongan akhir 4. Masa kerja Masa kerja keseluruhan PNS

5. Usia Usia PNS

6. Diklat Kepemimpinan Latpim II, III, IV, - (belum latpim) 7. Total Jabatan Jumlah jabatan yang pernah di duduki 8. Masa kerja jabatan terakhir Tahun berjalan – tahun jabatan terakhir 9. Total masa kerja jabatan Tahun berjalan – tahun jabatan pertama

Parameter data keluaran yang dihasilkan adalah penentuan eselon/jabatan yang diberikan kepada PNS tersebut yaitu : Non Eselon, IV.b, IV.a, III.b, III.a, II.b.

Information gain

Merupakan pemilihan atribut dengan mengukur seberapa baik atribut dipisahkan ke

dalam kelas yang ada namun sebelumnya dihitung nilai entropy yang berfungsi mengetahui

bobot suatu atribut dengan formula sebagai berikut (Bhatt, 2012) :

Entropy (S)= �- p_i

n

i=1

.log₂p_i (1) Dimana S adalah himpunan kasus/keputusan, n adalah jumlah partisi S dan Pi adalah

proporsi keputusan terhadap S.

Gain (S,A)=Entropy (S)- �|Si| |S|

n

i=1

*Entropy (S_i) (2 ) Dimana : n adalah jumlah partisi atribut A, A adalah semua nilai yang mungkin dari atribut tersebut, |si| adalah bagian/subset nilai S, |s| adalah jumlah kasus dalam S

Gain ratio

Menghitung nilai split information untuk dipergunakan dalam menghitung nilai gain

ratio. Formula untuk split information dan gain ratio adalah sebagai berikut (Bhatt, 2012) :

SplitInformation (S,A)=-�|Si| |S| n i=1 log₂|Si| |S| (3)

Gainratio (S,A)= Gain(S,A)

SplitInformation (S,A) (4)

Gini indeks

Pengumpulan Data

Pemilihan Masukan/

keluaran Integrasi Data

Validasi/ Pembersihan Data Training Data Pengujian Klasifikasi

(4)

Formula untuk menghitung gini indeks isi setiap atribut adalah sebagai berikut (Hermawati, 2013) : IG(A)=1-�P_n2 n i=1 (5)

Dimana : Pn adalah Rasio observasi dalam kotak A yang masuk kelas i, n adalah jumlah

kelas/variabel dari cabang/kotak A. Langkah selanjunya adalah menghitung gini split sebagai

penentuan simpul akar/cabang dengan formula sebagai berikut (Hermawati, 2013) :

GiniSplit (A)=� |Si|

|S|IG(A)

n

i=1

(6)

Information gain dan gain ratio menggunakna nilai tertinggi untuk menentukan simpuk akar/cabang pohon sedangkan gini indeks berdasarkan nilai terkecil.

Pengujian Klasifikasi

Melakukan testing klasfikasi untuk mengetahui tingkat akurasi berdasarkan tabel

confusion matrix dengan formula sebagai berikut (Sayad, 2010-2012) :

Akurasi= ∑Data Benar

∑Total Data Uji x 100% (7)

HASIL DAN PEMBAHASAN

Hasil Training Pemilihan Kriteria Atribut Berdasarkan Information Gain

Pada Gambar 2 yang merupakan sebagian dari hasil pohon keputusan yang dibentuk

berdasarkan pemilihan kriteria information gain. Pada Gambar tersebut dapat dilihat bahwa

node yang paling atas adalah Golongan yang menjadi simpul akar karena memiliki nilai

information gain tertinggi dibandingkan atribut yang lain. Golongan terbagi ke dalam 7 split

sesuai jumlah golongan yang ada dalam data, dari III/a sampai dengan IV/c, sebagai contoh

split untuk Gol akhir III/d yang melakukan perulangan untuk menghasilkan kelas data. Untuk melihat urutannnya, bisa dilakukan dengan melihat arah anak panah yang dihasilkan dari suatu simpul dan akhir dari simpul tersebut adalah kelas data dengan lambang berbentuk kotak.

Salah satu contoh penentuan eselon IV.a berdasarkan Golongan III/d adalah sebagai berikut : Jika Golongan = III/d & Diklatpim = IV & Masa kerja jab. Akhir ≤ 3,5 Maka Eselon

IV.a. Total aturan keputusan berdasarkan pemilihan kriteria information gain adalah 24

aturan keputusan yang terbagi ke dalam 6 kelas data.

Hasil Training Pemilihan Kriteria Atribut Berdasarkan Gini Indeks

Pada Gambar 3 yang merupakan sebagian dari hasil pohon keputusan yang dibentuk

berdasarkan pemilihan kriteria gini indeks. Pada Gambar tesebut dapat dilihat bahwa node

yang paling atas adalah Golongan yang menjadi simpul akar karena memiliki nilai gini indeks

terkecil dibandingkan atribut yang lain. Golongan terbagi ke dalam tujuh split sesuai jumlah golongan yang ada dalam data dari III/a sampai dengan IV/c, sebagai contoh split untuk Golongan III/c yang melakukan perulangan untuk menghasilkan kelas data.

Salah satu contoh penentuan eselon III.b berdasarkan Golongan akhir III/c adalah sebagai berikut : Jika Golongan = III/c & Pend. Akhir = S2 & Masa kerja Jab. Akhir = ≤1,5 &

Masa kerja keseluruhan > 11,5 maka Eselon III.b. Total aturan keputusan berdasarkan gini

(5)

Gambar 2 Bagian Pohon Keputusan Pemilihan Atribut Information Gain

Gambar 3 Bagian Pohon Keputusan Pemilihan Atribut Gini Indeks Hasil Training Pemilihan Kriteria Atribut Berdasarkan Gain Ratio

Pada Gambar 4 yang merupakan sebagian dari hasil pohon keputusan yang dibentuk berdasarkan pemilihan kriteria gain rati. Pada gambar tersebut dapat dilihat bahwa node yang

paling atas adalah Total jabatan yang menjadi simpul akar karena memiliki nilai gain ratio

terbesar dibandingkan atribut yang lain. Total jabatan terbagi atas 2 splityaitu >0,5 dan ≤0,5.

Sebagai contoh split untuk >0,5 yang melakukan perulangan untuk menghasilkan kelas data

sedangkan split ≤0,5 langsung menghasilkan kelas data.

Golongan

Diklatpim III/d

Masa Kerja Jab Akhir III.b III IV IV.a - Usia IV.a ≤3,5 ≤43,5 >3,5 IV.a >43,5 Pend. Akhir S1 III.b IV.a S2 Golongan Pend. Akhir Diklatpim IV S2 S1 III/c Masa Kerja Jab. Akhir >1,5 Diklatpim IV -

Masa kerja Gol. Akhir Tot. Jabatan >0,5 IV.a ≤ 0,5 Non Eselon >1,5 IV.a ≤ 0,5 DIII IV.a Masa kerja Jab. Akhir >2,5 IV.a ≤ 2,5 IV.b - IV.a IV.a ≤1,5 Masa kerja Keseluruhan >11,5 III.b ≤ 11,5 IV.a Diklatpim SLTA IV IV.a - Tot. Jabatan >0,5 IV.a ≤ 0,5 Non Eselon

(6)

Salah satu contoh penentuan eselon III.b adalah sebagai berikut : Jika Total jabatan > 0,5 & Diklatpim = IV & Golongan = IV/a Maka Eselon III.b. Total aturan keputusan berdasarkan

gain ratio adalah 22 aturan keputusan yang terbagi ke dalam 6 kelas data.

Gambar 4 Bagian Pohon Keputusan Pemilihan Atribut Gain Ratio

Hasil Akurasi Berdasarkan Tabel Confusion Matrix

Berdasarkan Tabel 2, Tabel 3 dan Tabel 4 dapat dilihat tingkat akurasi data berdasarkan data testing sebanyak 234 data dari masing-masing pemilihan atribut. Tingkat akurasi dihitung

berdasarkan formula (7) dengan hasil yang berbeda-beda yaitu berdasarkan information gain

sebesar 87,18%, gini indeks 86,75% dan gain ratio 82,48%. Area yang memiliki latar

berwarna abu-abu merupakan nilai dari data yang di klasifikasikan secara benar.

Tabel 2 Confusion Matrix berdasarkan Information Gain Akurasi 87,18%

Prediksi Target Data

Non Eselon III.b IV.a IV.b II.b III.a

Non Eselon 102 0 1 0 0 0 III.b 0 7 1 0 0 1 IV.a 0 9 75 6 0 2 IV.b 0 0 1 8 0 0 II.b 0 1 0 0 4 0 III.a 0 2 3 0 3 8 Total Jabatan Diklatpim III > 0,5 Non Eselon ≤0,5 II.b ≤0,5 IV Golongan II.b IV.c III.b IV.a III/c Pend. Akhir IV.a SLTA S2 Masa Kerja Jab. Akhir III.b ≤ 1,5 > 1,5 IV.a III/d IV.a III.b IV.b S1 IV.a Golongan III.a IV.b III/d III.a IV.a Masa kerja Keseluruhan IV.a ≤ 17 > 17 III.b

(7)

Tabel 3 Confusion Matrix berdasarkan Gini Indeks Akurasi 86,75%

Non Eselon 102 1 1 1 0 0 III.b 0 12 4 0 0 2 IV.a 0 4 70 4 0 2 IV.b 0 0 4 9 0 0 II.b 0 2 0 0 4 1 III.a 0 0 2 0 3 6

Tabel 4 Confusion Matrix berdasarkanGain Ratio Akurasi 82,48 %

Non Eselon 99 0 2 1 0 0 III.b 0 1 0 0 0 0 IV.a 0 8 74 5 0 1 IV.b 3 0 1 8 0 0 II.b 0 0 0 0 1 0 III.a 99 0 2 1 0 0

Sebagai contoh pada Tabel 2 antara prediksi kelas Non Eselon dengan target data dapat dilihat bahwa yang benar/sesuai antara prediksi dan target data adalah sebanyak 102 data, sementara terdapat kesalahan klasifikasi dimana Eselon yang sebenarnya adalah IV.a namun di prediksikan salah dan masuk ke Non Eselon sebanyak 1 data, namun tidak ada kesalahan prediksi untuk target Non Eselon.

Berdasarkan Tabel 5, dapat dilihat bahwa semua pemilihan kriteria atribut menghasilkan akurasi di atas 70% dan sudah melebihi dari target sebelumnya yaitu sebesar 70%, sehingga

dianggap layak untuk dijadikan rekomendasi usulan mutasi jabatan struktural. Information

gain memiliki tingkat akurasi tertinggi dibandingkan yang lainnya, Golongan sebagai faktor yang paling berpengaruh dengan menjadi penentu awal klasifikasi, jumlah aturan keputusan

sebanyak 24. Gini indeks juga menjadikan golongansebagai penentu awal klasifikasi, namun

memiliki akurasi yang lebih rendah serta jumlah aturan keputusan yang terbanyak, dengan

aturan keputusan yang lebih banyak akan membuat pengambilan keputusan lebih rumit. Gain

ratio memiliki jumlah aturan keputusan dan pemakaian atribut paling sedikit namun memiliki tingkat akurasi terendah, menjadikan total jabatan sebagai atribut yang paling berpengaruh,

berdasarkan split yang ada, maka sudah bisa di pastikan bahwa ketika seorang PNS belum

pernah menduduki jabatan maka tidak akan pernah bisa menduduki jabatan tertentu, berbeda dengan pemilihan kriteria atribut lainnya yang memungkinkan terjadi promosi jabatan untuk PNS yang belum pernah menjabat sebelumnya.

(8)

Tabel 5 Perbandingan Algoritme Pemilihan Kriteria Atribut Decision Tree C4.5 No. Algoritme Jumlah Atribut Simpul Akar Jumlah Aturan

Keputusan Akurasi (%) 1 Information gain 9 Golongan 24 87,16

2 Gini Indeks 9 Golongan 54 86,75

3 Gain Ratio 7 Total Jabatan 22 82,48

KESIMPULAN DAN SARAN

Penelitian ini menghasilkan penentuan klasifikasi mutasi jabatan struktural menggunakan metode Decision Tree C4.5, pemilihan kriteria atribut information gain berdasarkan eselon yaitu Non Eselon, II.b, III.a, III.b, IV.a, IV.b. Hasil penelitian ini, mampu menjawab persoalan mutasi jabatan struktural dalam hal waktu yang relatif lama dengan pola mutasi yang sebelumnya tidak ada.

Dalam penentuan klasifikasi mutasi tersebut, atribut yang menjadi faktor utama sebagai penentu awal adalah Golongan PNS. Penentuan atribut tersebut lebih baik dibandingkan dengan pemilihan kriteria atribut lainnya. Hal tersebut juga sesuai dengan aturan, dimana faktor golongan adalah bagian yang sangat penting/utama dalam menentukan eselon PNS.

Dalam penelitian ini diketahui bahwa jumlah aturan keputusan yang ada masih relatif banyak dengan melibatkan semua atribut yang ada, sehingga pemberian rekomendasi usulan mutasi untuk pengambilan keputusan lebih lanjut agak rumit. Diharapkan dalam penelitian selanjutnya supaya aturan keputusan yang dibuat lebih sederhana agar membantu dalam mempercepat proses pemberian rekomendasi tanpa harus meneliti semua atribut yang selama ini dianggap berpengaruh.

DAFTAR PUSTAKA

Bhatt, A. S. (2012). Comparative Analysis of Attribute Selection Measures Used for

Attribute. International Conference on Radar, Communication and Computing

(ICRCC), (pp. 230-234). Tiruvannamalai, TN, India.

Hermawati, F. A. (2013). Data Mining. Yogyakarta: Penerbit Andi.

Prabowo Pudjo Widodo, D. (2013). Penerapan Data Mining Dengan Matlab. Bandung:

Penerbit Rekayasa Sains.

Pramutoko, B. (2012). Pemahaman Elit Politik Terhadap Kebijakan Mutasi Pegawai di

Lingkungan Pemerintah Kota Kediri. Hal. 1-29(2012).

Santosa, B. (2007). Data Mining - Teknik Pemanfaatan Data untuk Keperluan Bisnis.

Surabaya Indonesia: Graha Ilmu.

Sayad, D. S. (2010-2012). An Introduction to Data Mining. Retrieved Juni 07, 2014, from

http://www.saedsayad.com/

Sriyana. (2013). Pelaksanaan Mutasi Pejabat Struktural pada Kantor Badan Kepegawaian