KETEPATAN KLASIFIKASI STATUS KERJA
DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN
FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS
(FK-NNC)
Disusun Oleh :
ATIKA ELSADINING TYAS
24010211120013
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2015
KETEPATAN KLASIFIKASI STATUS KERJA
DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN
FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS
(FK-NNC)
Disusun Oleh:
ATIKA ELSADINING TYAS
24010211120013
Skripsi
Diajukan Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains pada
Jurusan Statistika Fakultas Sains dan Matematika Universitas Diponegoro
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2015
KATA PENGANTAR
Puji syukur penulis panjatkan kepada Allah SWT atas rahmat,
hidayah, dan karunia-Nya sehingga penulis dapat menyelesaikan Tugas
Akhir yang diberi judul
Ketepatan Klasifikasi Status Kerja di Kota
Tegal Menggunakan Algoritma C4.5 dan
Fuzzy K-Nearest Neighbor in
every Class
(FK-NNC) .
Tugas Akhir ini tidak akan terselesaikan dengan
baik tanpa adanya dukungan dan bantuan dari berbagai pihak. Oleh karena
itu, penulis ingin mengucapkan terima kasih kepada:
1. Ibu Dra. Hj. Dwi Ispriyanti, M.Si. selaku Ketua Jurusan Statistika Fakultas
Sains dan Matematika Universitas Diponegoro dan dosen pembimbing I.
2. Bapak Drs. Sudarno, M.Si selaku dosen pembimbing II.
3. Bapak/Ibu dosen jurusan Statistika Fakultas Sains dan Matematika
Universitas Diponegoro.
4. Semua pihak yang telah membantu kelancaran penyusunan Tugas Akhir ini,
yang tidak dapat penulis sebutkan satu per satu.
Penulis menyadari bahwa dalam penyusunan Tugas Akhir ini masih jauh
dari sempurna. Oleh karena itu, penulis mengharapkan kritik dan saran demi
kesempurnaan penulisan selanjutnya.
Semarang, September 2015
Penulis
v
BSTRAK
y
s
t
y
u
t
t
fikasi status kerja pada penduduk
angkatan kerja di Kota Tegal bulan Agustus tahun 2014 yaitu algoritma C4.5 dan
Fuzzy K-Nearest Neighbor in every Class
(FK-NNC). Algoritma C4.5 adalah
salah satu metode klasifikasi dari
data mining
yang digunakan untuk
mengkonstruksikan pohon keputusan (
decision tree
).
Fuzzy K-Nearest Neighbor
in every Class
(FK-NNC) adalah teknik klasifikasi yang melakukan prediksi
menggunakan sejumlah
K
tetangga terdekat pada setiap kelas dari sebuah data uji.
Variabel prediktor yang digunakan adalah status dalam rumah tangga, jenis
kelamin, umur, status perkawinan, pendidikan, dan pelatihan kerja. Untuk
mengevaluasi hasil klasifikasi digunakan perhitungan APER. Berdasarkan analisis
tersebut pengklasifikasian status kerja dengan Algoritma C4.5 diperoleh nilai
APER = 28,3784% dan ketepatan klasifikasi sebesar 71,6216% sedangkan
menggunakan metode FK-NNC diperoleh nilai APER = 21,62% dan ketepatan
klasifikasi sebesar 78,38%. Sehingga dapat disimpulkan bahwa metode FK-NNC
lebih baik dibandingkan dengan Algoritma C4.5.
BSTRACT
y
s
!y
"!# " !$t
%t
w
ys
& & ' "# !y
&ffected a national foundation. It used two methods for classifying a
employment status on productive society in Tegal City on August 2014, the
methods are C4.5 Algorithm and
Fuzzy K-Nearest Neighbor in every Class
(FK-NNC). C4.5 Algorithm is a way of classifying methods from data mining that use
to construct a decision tree. FK-NNC is another classification technique that
predict using the amount of closest neighbor of
K
in every class from a testing
data. The predictor variables that used on classifying an employment status are
neighborhood status, sex, age, marriage status, education, and a work training. To
evaluate the result of classification use APER calculation. Based on this analysis,
classification of employment status using C4.5 Algorithm obtained APER =
28,3784% and 71,6216% of accuracy, while FK-NNC methods obtained APER =
21,62% and 78,38% of accuracy. So, it can be concluded that FK-NNC is better
than C4.5 Algorithm.
() ) *+,-+ ./0/
123242 5 16 76869
J
: ;:7 <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<) 16 76869= > 9?> @ 6169A <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< )) 16 76869= > 9?> @ 6169AA<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< )) ) B6C 6= >9?6 9C6D <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ) ( 6E@ CD 6B <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ( 6E@ CD 6FC <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
() ;6GC 6DA@ A <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ()) ;6GC 6DC 6 E> 7 <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
x
;6GC 6D? 6 8E6D <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<x
) ) ;6GC 6D768=AD 69 <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<x
) )) E6EA = > 9; 61: 7:6 9H <H 72I 2 JEK32 L2 5 M <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< H H <N D O4OP2 582P 23 2Q <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< R H <R E2I2P2 582P 232 Q <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< S H <S C OT O2 5 <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< S E6EAA C A9
J
6:69= : @C 6 B6]^ ^^
2
_`Fuzzy K-Nearest Neighbor in every Class
_______________________________22
2
_a b ct
cdet
efb g eh^i^j eh^ _______________________________________________________________ klmnmooo pqrs tsus vow qx q uoron x
y_z
J
cf^h{ ef| }~ cte e ____________________________________________________________ k y_ k e^ecgw cfcg^^ef __________________________________________________________________ k y_y r cjf^jw cf ge eft ee__________________________________________________________ y y_` r eedefw cfcg^^ef __________________________________________________________________ yz mnmo n|outn xw qp mnn|nx`_z nf eg^h^htch j ^d^it e e| e }hb c e______________________________________ yy `_z_z | e}hb ceb er cegm} g efn }h }hkz`________________ yy `_z_ k | e}hb ceb er cegm} gefn }h }hkz`
mc{ehejef| e }h{ eg e~}~eref e_____________________ y` `_z_y | e}hb ceb er cegm} gefn}h }hkz`
mc{ehejefcf^hbcg e~^f____________________________________________ y `_z_` | e}hb ceb er cegm} gefn}h }hkz`
mc{ehejef~} __________________________________________________________ y l `_z_a | e}hb ceb er cegm} gefn}h }hkz`
mc{ehejef| e}hw cj e ^f ef_____________________________________ y l `_z_ | e}hb ceb er cegm} gefn}h }hkz`
mc{ehejefw cf{^{^j ef_________________________________________________ y `_z_ l | e}hb ceb er cegm} gefn}h }hkz`
x
x
ùúûüýþÿ ùþ ûùü ûûû ùü û û ý ý üý û
ý ûúù ûý ýû
úûüýþÿ û ù ù û û
Testing
úûüýþÿÿ û û
Training
ÿúûüýþÿ û û
Testing
ÿúûüýþÿ ýý ûû þ ûùùûù
K
x
! !*+,+-+ . /+- 0+12 34 .54 674 64 .89:;5;<+ .=
Decision Tree
>??????????????????????????????????????2@ /+- 0+1A 84 .<9 :K
B95+ . CC+B 9 1D 9E+5D+1!F 95!+ :8 9, +<D+, +-G H 8I I3 ???????????????????????????????????????????????????????????????????????????????AA /+- 0+1J K!+ C1+-L,!179 . C4,+ 6+.K+5 +M9 . CC;.+ E+.L ,C4 1!5 -+3@?N
D+ .G H 8I I3 ???????????????????????????????????????????????????????????????????????????????????JA /+- 0+1@ K!+ C1+-F5 +5;<89 1O+ ??????????????????????????????????????????????????????????????????????J@ /+- 0+1N K!+ C1+-F5 +5;<89 1O+P91D+< + 1E+ .
x
Y YYdefege h ieg jYke hl meneo p qrs tpoqun evwxefyzfe hp xz{ n z{ve | zh}~ ll ieg jYke h} de{Yfp fxukYng e w hxxzhe e hmene
Training
} ieg jYke h u| uhqw jzn z{ e hehxy
v wkw hn z w hxxzhe e hmene
Training
ieg jYke h de{Yfp fxukYng e w hxxzhe e hmeneTesting
ieg jYke h de{Yfw hx f e{YY e{Yehw hxxzhe ehp fxukYn ge ieg jYke hOutput
qwnw jene hqf e{YY e{Ywhxxzhe e hqttCD EFGFH I FJ F KL
t
LMFt
FJ KN F OH PH K FOH QFR F OR FR SO KLTU F SJR SK VWRF XLGFN RFYSJ|} ~