• Tidak ada hasil yang ditemukan

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012 - Diponegoro University | Institutional Repository (UNDIP-IR)

N/A
N/A
Protected

Academic year: 2017

Membagikan "PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012 - Diponegoro University | Institutional Repository (UNDIP-IR)"

Copied!
16
0
0

Teks penuh

(1)

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES

DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI

KABUPATEN DEMAK TAHUN 2012

DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI

KABUPATEN DEMAK TAHUN 2012

(2)

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES

DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI

KABUPATEN DEMAK TAHUN 2012

Oleh :

RIYAN EKO PUTRI

24010210120042

Sebagai Salah Satu Syarat untuk Memperoleh Gelar

Sarjana Sains pada Jurusan Statistika

JURUSAN STATISTIKA

FAKULTAS SAINS DAN MATEMATIKA

UNIVERSITAS DIPONEGORO

SEMARANG

2014

(3)
(4)
(5)

KATA PENGANTAR

Puji dan syukur penulis panjatkan kehadirat Allah SWT karena berkat rahmat dan

hidayah-Nya, penulis dapat menyelesaikan Tugas Akhir dengan judul

Perbandingan

Metode Klasifikasi Naïve Bayes dan K-Nearest Neighbor pada Analisis Data Status

Kerja di Kabupaten Demak Tahun 2012 .

Penulis menyadari bahwa dalam penyusunan laporan ini tidak lepas dari bimbingan dan

dukungan yang diberikan beberapa pihak. Oleh karena itu, penulis ingin menyampaikan

terima kasih kepada:

1. Ibu Dra. Dwi Ispriyanti, M.Si. selaku Ketua Jurusan Statistika Fakultas Sains dan

Matematika Universitas Diponegoro.

2. Ibu Dra. Suparti, M.Si. selaku dosen pembimbing I dan Ibu Rita Rahmawati, S.Si, M.Si.

selaku dosen pembimbing II yang telah memberikan bimbingan, arahan, dan motivasi

hingga terselesaikannya tugas akhir ini.

3. Seluruh Dosen Jurusan Statistika FSM Universitas Diponegoro yang telah memberikan

ilmu yang sangat berguna.

4. Semua pihak yang telah membantu, yang tidak dapat penulis sebutkan satu per satu.

Penulis menyadari masih terdapat kekurangan dalam penulisan laporan ini. Oleh karena

itu, penulis mengharapkan kritik dan saran dari pembaca. Semoga Tugas Akhir ini dapat

bermanfaat bagi semua pihak.

Semarang, September 2014

Penulis

(6)

v

t

ïve Bayes dan K -Nearest Neighbor. Naïve Bayes merupakan metode

pengklasifikasian yang didasarkan pada penghitungan probabilitas sederhana,

sedangkan K-Nearest Neighbor merupakan metode pengklasifikasian yang

didasarkan pada perhitungan kedekatan jarak. Variabel yang digunakan dalam

menentukan status kerja seseorang apakah menganggur atau bekerja yaitu jenis

kelamin, status dalam rumah tangga, status perkawinan, pendidikan, dan umur.

Pengklasifikasian status kerja dengan metode Naïve Bayes diperoleh keakurasian

sebesar 94.09% dan dengan metode K-Nearest Neighbor diperoleh keakurasian

sebesar 96.06%. Untuk mengevaluasi hasil klasifikasi digunakan perhitungan

Press s Q dan APER. Berdasarkan hasil analisis, diperoleh nilai

Press s Q

yang

menunjukkan bahwa kedua metode sudah baik dalam pengklasifikasian data

status kerja di Kabupaten Demak. Berdasarkan perhitungan APER,

pengklasifikasian data status kerja di Kabupaten Demak menggunakan metode

K-Nearest Neighbor memiliki tingkat kesalahan yang lebih kecil dibandingkan

dengan metode Naïve Bayes. Dari analisis tersebut dapat disimpulkan bahwa

metode K-Nearest Neighbor bekerja lebih baik dibandingkan dengan Naïve Bayes

untuk kasus data status kerja di Kabupaten Demak tahun 2012.

(7)

vi

ABSTRACT

Large population in Indonesia is closely related to the working status of the

population which is unemployed or employed. It can lead to the high

unemployment when the avaliable jobs arent balance with the population. Used

two methods to perform the classification of employment status on the number of

residents in the labor force in Demak for 2012 which is Naïve Bayes and

K-Nearest Neighbor. Naïve Bayes is a classification method based on a simple

probability calculation, while the K-Nearest Neighbor is a classification method

based on the calculation of proximity. Variables used in determining whether a

person's employment status is idle or not are gender, status in the household,

marital status, education, and age. Employment status of the data processing

methods of Naïve Bayes with the accuracy obtained is equal to 94.09% and the

K-Nearest Neighbor method obtained is equal to 96.06% accuracy. To evaluate the

results of the classification used calculations Press's Q and APER. Based on the

analysis, the Press's Q values obtained indicate that both methods are already well

in the classification of employment status data in Demak. Based on the calculation

of APER, the classification of data in the employment status of Demak using the

K-Nearest Neighbor method has an error rate smaller than the Naïve Bayes

method. From this analysis it can be concluded that the K-Nearest Neighbor

method works better compared with the Naïve Bayes for employment status data

in the case of Demak for 2012.

(8)

)*+

T

*

R

, - ,

Halaman

H

*

L

*

M

*

N

./ )

UL

00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 (

H

*

L

*

M

*

N P

1

NG

1

S

*

H

*

N

000000000000000000000000000000000000000000000000000000000000000000000000000 ( (

K

*

T

*

P

1

NG

*

NT

*

R

00000000000000000000000000000000000000000000000000000000000000000000000000000000000000 (

v

*2

STR

*

K

000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

v

*2

STR

* 3

T

000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 '( )*+

T

*

R

, - , 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

v

( ( )*+

T

*

R G

*

M

2*

R

0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 (

x

)*+

T

*

R T

*21

L

000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

x

)*+

T

*

R L

*

MP

, 4*

N

000000000000000000000000000000000000000000000000000000000000000000000000000000000000

x

( 2*2

,

P

1

N

)*

HULU

*

N

505 67

t

7

r

89:7 ;7 < = 000000000000000000000000000000000000000000000000000000000000000000000000 5 50> ?

u

@

us

7 <A7

s

7: 7B00000000000000000000000000000000000000000000000000000000000000000000 C 50C

>05 G9H(<(

s

(

V

7

r

(7I9:0000000000000000000000000000000000000000000000000000000000000000000000 J >0> KL<M 9NK: 7

s

( H(;7

s

(0000000000000000000000000000000000000000000000000000000000000000000 O >0C

Pr

LI7I(:(

t

7

s

P7<

P

7

rt

(

s

(00000000000000000000000000000000000000000000000000000000000 55 >0D K: 7

s

( H(;7

s

(Q7

ïv

987

y

9

s

000000000000000000000000000000000000000000000000000000000 5C >0J K7

r

7 ;R9

r

(

st

(;Q7

ïv

987

y

9

s

000000000000000000000000000000000000000000000000000000 >5 >0S 67N: 7 T9U MR ( @7

t

LV 0000000000000000000000000000000000000000000000000000000000000000000 >5 >0W K: 7

s

( H(;7

s

(KXQ 97

r

9

st

Q9(=BILV000000000000000000000000000000000000000000000 >> >0Y K7

r

7 ;R9

r

(

st

(;K:7

s

(H(;7

s

(KXQ 97

r

9

st

Q9(=BIL

r

00000000000000000000000 >S >0O

T

9;<(;

V

7:(P7

s

(ALP9:00000000000000000000000000000000000000000000000000000000000 >W >05Z U'7:

u

7

s

(K9

t

9N 7

t

7<[7

s

(:K:7

s

(H(;7

s

(0000000000000000000000000000000000000 >Y 2*2

,,,

M

1

TO

)

OLOG

,

\1

N

1

L

,],*

N

(9)

bcd efgh agifh jklmn mhom

t

m cccccccccccccccccccccccccccccccccccccccccccccccccccccccc bb pq p

r s

P

t

M

pq

H

q

S

q

N

dcu ofvgwax v aom

t

m cccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccc by dcz {

u

|}h jmh~hm

r

m€a

tur

fh jmh‚

t

m

tus

ƒf

r

„mccccccccccccccccccccccccc du dcb

P

fh jg lm

s

a…agm

s

amhfhjmh†f

t

kf‡m

ïv

fˆm

y

f

s

cccccccccccccccccccc dd dcd

P

fh jg lm

s

a…agm

s

amhfhjmh†f

t

kfƒ ‰‡fm

r

f

st

‡ fa jn|kwcccccccc dŠ dcŠ ‹`m l

u

m

s

aƒf

t

fx m

t

mh{m

s

a lƒlm

s

a…agm

s

accccccccccccccccccccccccccccccccccccc dΠdcy

P

f

r

|mhahjmhƒfmg}w m

t

m hcccccccccccccccccccccccccccccccccccccccccccccccccccccc d pq p

V

t

S

r Ž

K

PUL

q

N

cccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccc Š q‘

T

q

R PUST

q

K

q cccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccc Šu

L

(10)

’

x

“” •

T

”

R G

”

M

– ”

R

(11)

x

È É Ê

T

É

R T

ÉËÌ

L

(12)

x

T

R L

MP

N

Halaman

Lampiran

t

t

!

Lampiran

"

Syntax

#

t

$ % &

u

#

t

'(

ïv

)

y

s

Lampiran

*

Syntax

#

t

$ % &

u

# ++ $

Pr

'+

r

,

r

st

+'

r

-Lampiran

.

Syntax

#

t

$ % &

u

#

t

'(,

r

st

+'

r

/

Lampiran

0 1

ut

&

u

&

u

ïv

)

y

s

2

Lampiran 6

1

ut

&

u

&

u

,

r

st

+'

r

( + 3 ! %

Lampiran

4 1

ut

&

u

&

u

,

r

st

+'

r

( + 3

-Lampiran

5 1

ut

&

u

&

u

,

r

st

+'

r

( + 3 /

(13)

-1

:8;8< 7= :8>8

N

?

@A@ BCDCEFG

l

CHCI J

KLMNL OPQ R S O

r

TURV RL LOWR

r

R

y

RLW X TR

s

MOLWRL YO

r

Q Y T UTX R

u

MQ MRX RSLR

y

SOL

y

OY RY VRL LOW R

r

R QLQ S OSQ XQVQ Z TSXR[

p

OLMTMTV

y

RLW Y OP R

r

MOLW RL VR

r

RV\ O

r

Q

st

Q VS R

sy

R

r

RV R

t y

R LWY O

r

S R]RS ^SR ]RS_ `TSX R[UOLMTMTV

y

RLWYOP R

r

QLQ O

r

R

t

VRQ

t

RLLR

y

MOL W RL

st

R

tus

VO

r

Z R UOLMTMTVL

y

R RURVR[ SOLWRLWW

ur

R

t

R

u

t

QMRV SOLW RLWW

ur

aY OV ObZ Rc MQ S RLRVO\QVR \Q MRVMQQ SY RLWQ MOLW RLXRURLW RLVObZ R

y

R LW \Ob P OMQR MRU R\ SOL

y

OY RY VRL \QLWVR\ UOLW RL WWTb RL

y

RLW \QLWWQ _ d OLW R LWWTb RL P ObQLWV RX Q S OLZ RMQ SRPRXR[

y

R LW VbTPQRX MRXRS UOb OVNLNSQRL _ e OLWRL RMRL

y

R UOLW RLWWTb RLfUb NMTV\Q g Q \ RPMRLUOLM RUR\RLSRP

y

RbRVR\RVRLY ObVTb RLWP O[QLWW R MRUR\ S OL

y

OY RY VRL \QSY TXL

y

R VOSQP VQ LRL MRL SRP RX R[ ^SRP RXR[ PNPQRX X RQLL

y

R_ e RbQMR\ RhdiMQ VO\ R[ TQY R[j RURMR\R[ TLklmn\ Ob MRUR\o_npZ T\RUOLMTMTV

y

RLW \QMRVS OSQX Q VQS R\RUOL ]R[ RbQRLM RbQ\N\ RXRL WVR \ RLY OVObZ RP OY RL

y

RVmmq _mpZ T\R ZQ j R_iOXRQLQ \ T rQLWV R\ d OLWRLWWTb RLr ObY TVR a rd rc MQ KLMNLOPQR U RMR sWTP \TP klmn SOL]RURQ

6

_kt UOb P OL_ sLWVR \Ob POY T\ S OLWRXRSQ UOLQ LWVR\ RL MQY RLMQ LW rd r u OYbTRbQ klmn

y

RQ\ T POY OP Rb t_ pk UOb P OL POb \R rd r s WTP \TP klmk P OY OP Rb

6

_mvUObP OL_

(14)

2

yz{ z| z} ~ zy} €| z

y

z y}‚ |‚| { z} €zƒ| z} ƒƒ

ot

z {„ z

r

ƒz}

y

H

z„ | }| ~ } ƒz{|€z†{ z} €z}

y

z{ z} z{ y†‡ ‡ {ˆ „z‰ ‚ z} ~~ z{ ‡ z ~ Š{z } † { ~} ‹ z‚| z} z{ ‹ z„ z} z} z†zy} €{ Š ‹z ‚| €zŒ z‰ ~Š ‚~| ~ ~ } ‰| { €†‰ z} ‰|‚ y… z~yz{‡ˆ ‡|z„{ˆ}ˆ~|

y

z}ƒ{ ‚  zz‚z„z‰ Ž{ y‡|{ˆ „ˆ ƒ| ‡… ‡ 

or

z}ƒ

y

z} ƒ

t

|‚ z{ ~ z~

pu

~~} ‰|{ €†‰ z}~ } ‹ z‚|

t

{ z}

rt

‚ z}

str

‡ ‡‰ z„| }|‚zyz

t

~ } ƒ€z‰

yˆ „z y|{|

r

‡ ‡ 

or

z}ƒ} † { ~„ z{ { z}

t

|}‚ z{ z} {Š| ~| } z„|

t

z

s

z

t

zy}

pr

~z}| ‡~ 

‡ ‰| } ƒƒz

t

|}ƒ{ z

t

{ z~ z} z} ‚| ‘}‚ˆ} ‡| z ~ } ‹z‚| €

r

{ Šz}ƒ…  z~yz{

s

ˆ ‡| z„ {ˆ}ˆ~|

y

z}ƒ

t



r

z{‰|

r y

z|

tu

{ ‡ } ‹z}ƒz} ‡ˆ ‡| z„ ~ z

sy

z

r

z{z

t

‡ ~ z{|}

t

| } ƒƒ|… ’{ z}

€z}

y

z{y

r

~ z‰ z}{ ~‰z}ƒ

y

€

r

z‚ z ‚|‡ {|

t

z

r

ƒ‚ }ƒ y}“ z{ z

r

„ z}ƒ|

t

z

t

zy} {ˆ †z”{ˆ †z ~

tr

ˆ yˆ „|

t

{ z

r

} z y

r

‡ z| }ƒz} ‰| ‚ y

y

z } ƒ ‡ z}ƒz

t

{ 

t

z

t

… • „ ‰ { z

r

} z |

tu

‚ z„z~ { z

sus

|} | y} †|} ƒ ‚| „ z{ { z}

p

}ƒ{ „z

s

|Ž| { z‡| z}

st

z

tus

{ 

r

‹ z zyz{ z‰ ~ } ƒz}ƒƒ

ur

z

t

z

u t

| ‚ z{ {z

r

} z

p

}ƒz}ƒƒ

ur

z}~ 

r

yz{ z}‡z„ z‰

s

z

tu

Žz{ †

or

| }‚|{ z‡| z

p

z{ z‰‡ z

tu

} ƒz

r

z

t



rs

€† ‚| { z

t

z{ z} ‡ ‚ z‰

s

‹z‰ †

r

zz

t

z

u

€„ ~…

–z

ï

— ˜z

y

 ‡ ‚z} ™”– zŠ ‡ † –|ƒ‰ €ˆ Š ~ Š yz{ z} ~†ˆ‚  y }ƒ{ „ z‡|Ž| { z‡|

y

z}ƒ † Š{ } z„ ‚ }ƒz} †|} ƒ{ z† { z{ Š z†z}

y

z}ƒ €z|{… ˜z}

y

z{ y}„|†|z} †„z‰

(15)

3

¥¦

r

§¨©ª©« ¥¦

t

¬­ ¦ ¨ ¦«®ª ¯©° ±²±ª©° ±©«

y

© «® ³

o

³ ¬ª ­±®§«©ª ©« ¨© ­© ­©

t

© ­¦« ®©« ª ¦¯©

s

Y bertipe kategorik dimana untuk data status kerja kelas yang digunakan

yaitu pengangguran dan bukan pengangguran. Selain itu berbeda dengan metode

pengklasifikasian dengan regresi logistik ordinal maupun nominal, pada metode

Naïve Bayes dan K- Nearest Neighbor pengklasifikasian tidak diperlukan adanya

permodelan maupun uji statistik seperti uji signifikansi.

Naïve Bayes merupakan metode pengklasifikasian peluang sederhana

dengan asumsi antar variabel penjelas saling bebas (independen). Naïve Bayes

dapat digunakan untuk berbagai macam keperluan antara lain untuk klasifikasi

dokumen, deteksi spam atau filtering spam, dan masalah klasifikasi lainnya.

K-Nearest Neighbor atau dapat disingkat dengan K-NN adalah salah satu metode

non parametrik yang digunakan dalam pengklasifikasian. Metode K-NN pertama

kali diterapkan pada awal 1950. K-NN merupakan jajaran metode sederhana yang

sering disebut dengan

Lazy Learning

. Pada penulisan tugas akhir kali ini akan

diaplikasikan kedua metode tersebut pada bidang statistika dengan permasalahan

yang diangkat adalah kependudukan serta membandingkan keoptimalan dua

metode tersebut dalam mengklasifikasi data status kerja di Kabupaten Demak

pada tahun 2012.

´µ¶ ·

umu

¸ ¹º

M

¹¸¹» ¹¼

(16)

4

½¾¿ ÀÁÂÁà ÁÄÅÁÃÁÆÁÇ

È É

r

Ê ËÌ ËÍ ËÎ ËÏÐ ËÑËÐ ÉÏÉÍ ÒÒ ËÏ

t

ÒÏÒÑÒ Ó ËË

t

s

ÒÔ ÏÕÔ ÖÑËÉ

r

ËÎ× ËÓÔÐË

t

ÉÏ ØÉÊËÖÙ ÌÉÌ Ô ËÒ ÑÉÏÚËÏ Ð ÉÏÑ Ë

t

ËËÏ

y

ËÏÚ ÑÒ Í ËÖÔ ÖËÏ Û ÍÉÎ ÜÈÝ Ð ËÑË

t

ËÎÔ Ï ÞßàÞá È ÉÏÚÛ Í ËÎ ËÏ

t

É

r

Ì ÉÓÔÕ ÊÉÏÚÚÔ ÏËÖ ËÏ ÑÔ Ë Ê É

t

Û ÑÉÙ

y

ËÒ

tu

Ê É

to

ÑÉ âË

ï

ã É Ü Ë

y

ÉÌ Ñ ËÏ ×ä âÉËå ÉÌ Õ âÉÒ ÚÎÓÛåá

½¾æ çè éè ÁÄ

êÉÍ ËÖÔ ÖËÏ ÖÍËÌÒ ëÒÖËÌÒ Ù ÊÉÏ ÚÉ

t

ËÎÔÒ ËÖÔåËÌÒ ÖÍ ËÌÒ ëÒÖËÌÒ Ù Ì É

rt

Ë Ê ÉÊ Ó ËÏÑÒ ÏÚÖ ËÏ Î ËÌÒÍ Ö Í ËÌÒ ëÒÖËÌÒ Ð ËÑË ÑË

t

Ë

st

Ë

tus

ÖÉ

r

ì Ë ÑÒ × ËÓÔÐË

t

ÉÏ Ø ÉÊËÖ

t

Referensi

Dokumen terkait

Minimal terdapat satu perbandingan tepung ubi jalar yang dimodifikasi secara fermentasi dengan tepung terigu yang digunakan untuk pengolahan pangan yang

Pada Tabel 4, terlihat bahwa apabila menggunakan pembasa kapur tohor (CaO) untuk mendapatkan koagulasi sempurna yakni terjadi endapan dan larutan yang tidak berwarna,

Hasil penelitian menunjukkan bahwa paparan UV-B tidak memberikan pengaruh yang nyata pada kerapatan stomata bagian atas, kerapatan stomata bagian bawah, rasio kerapatan

Dari hasil observasi dan evaluasi bahwa pelaksaaan model pembelajaran kooperatif type jigsaw sudah baik dan membuat siswa aktif namun pada proses

Didalam aplikasi sistem informasi sumber daya manusia yang perlu dilakukan adalah memasukkan data jabatan, memasukkan data jenis cuti, memasukkan data input tes,

P SURABAYA 03-05-1977 III/b DOKTER SPESIALIS JANTUNG DAN PEMBULUH DARAH RSUD Dr.. DEDI SUSILA, Sp.An.KMN L SURABAYA 20-03-1977 III/b ANESTESIOLOGI DAN

Iriatherina wirneri atau ikan pelangi merupakan salah satu jenis ikan pelangi dari genus Iriatherina, genus ini dipisahkan karena memiliki filamen pada sirip punggung ke dua dan sirip

Denah yang baik untuk bangunan rumah di daerah gempa adalah sebagai berikut: (Sumber: (Pedoman Teknis Rumah dan Bangunan Gedung Tahan.. Gempa,