• Tidak ada hasil yang ditemukan

PERBANDINGAN METODE K–MEANS DAN METODE DBSCAN PADA PENGELOMPOKAN RUMAH KOST MAHASISWA DI KELURAHAN TEMBALANG SEMARANG - Diponegoro University | Institutional Repository (UNDIP-IR)

N/A
N/A
Protected

Academic year: 2017

Membagikan "PERBANDINGAN METODE K–MEANS DAN METODE DBSCAN PADA PENGELOMPOKAN RUMAH KOST MAHASISWA DI KELURAHAN TEMBALANG SEMARANG - Diponegoro University | Institutional Repository (UNDIP-IR)"

Copied!
18
0
0

Teks penuh

(1)

PERBANDINGAN METODE

K MEANS

DAN METODE

DBSCAN PADA PENGELOMPOKAN RUMAH KOST

MAHASISWA DI KELURAHAN TEMBALANG SEMARANG

SKRIPSI

Disusun Oleh :

SISCA AGUSTIN DIANI BUDIMAN

NIM. 24010212130032

DEPARTEMEN STATISTIKA

FAKULTAS SAINS DAN MATEMATIKA

UNIVERSITAS DIPONEGORO

SEMARANG

(2)

-MEANS

! !"# $ % ! %& # '!%

()*+*(+(+,**,(

Tugas Akhir sebagai salah satu syarat untuk memperoleh

gelar Sarjana Sains pada Jurusan Statistika

-.!/$-'-% $ !$$ 0!

1!0#2$ ! ! % !% '!$ -'!$0!

#% 3 -/ $! . % -" /

- '!/ !%"

(3)
(4)
(5)

567 689:; 6:7 6<

Puji syukur penulis panjatkan kehadirat Allah SWT yang telah

memberikan rahmat dan karunia Nya, sehingga Tugas Akhir yang berjudul

Perbandingan Metode

K-Means

dan Metode DBSCAN pada Pengelompokan

Rumah Kost Mahasiswa di Kelurahan Tembalang Semarang ini dapat

diselesaikan. Banyak pihak yang telah membantu dalam penyelesaian Tugas

Akhir ini. Oleh karena itu, rasa hormat dan terimakasih penulis ingin sampaikan

kepada :

1. Ibu Dra. Dwi Ispriyanti, M.Si selaku Ketua Departemen Statistika

Universitas Diponegoro Semarang dan selaku dosen pembimbing II.

2. Ibu Diah Safitri, S.Si, M.Si selaku dosen pembimbing I yang telah

memberikan bimbingan dan pengarahan dalam penyusunan Tugas Akhir

ini.

3. Semua Bapak dan Ibu Dosen Departemen Statistika Universitas

Diponegoro yang telah memberikan ilmunya yang sangat berguna.

4. Pihak-pihak lain yang tidak dapat penulis sebutkan satu per satu yang telah

membantu penulisan Tugas Akhir ini.

Penulis menyadari bahwa dalam penulisan Tugas Akhir ini masih banyak

kekurangannya. Untuk itu penulis mengharapkan kritik dan saran demi

kesempurnaan laporan tugas akhir ini.

Semarang, September 2016

(6)

CDED FG F H

a

F

a

I

a

E

a

J KL

a

MNK OD K I

a

FL

a

P

a

Q

a

R

a

R

a

S PSI

a

E R

a

K OO

a,

T S O

a

INJ

a

Q SQDK

a

Q RG UG R

a

F NQ VKVIG F NED PG

-

EDPG R NPI

a

FSQ Q VKF SIFG

.

WN

b

SRSED K I

a

ED FG F H

a

SKRSQ I NIG JGE R NIXD R RG KOO

a

J TSO

a

I NPSXDQDK FDJ

a

E FD RS

b

NKRSQ MD PG Q NOG

a

R

a

K Q VKF SIFG

.

YN PMDXD R

ba

KL

a

Q Z

a

Q R V P L

a

K O INIXNK O

a

PSEG X P NZ NP NKFG I

a

ED FG F H

a

MDJ

a

I XNIGJGED K PSI

a

E Q VFR

,

MG

a

KR

a

P

a

KL

a

ED P OD

,

Z

a

FG JG R

a

F[ J VQD FG

,

XNKMD XDR

a

K[ O

a

L

a

EGMSX[ MD K J

a

GK

-

J

a

G K

.

Harga sewa kost dan fasilitas yang

ditawarkan berpengaruh signifikan positif terhadap preferensi mahasiswa dalam

memilih rumah kost. Dilakukan pengelompokan berdasarkan harga sewa dan

fasilitas yang ditawarkan agar diketahui kondisi rumah kost mahasiswa di

Kelurahan Tembalang. Pengelompokan merupakan salah satu tugas utama dalam

data mining dan telah banyak diaplikasikan di berbagai bidang. Metode yang

digunakan untuk mengelompokkan adalah

K-M\]ns

dan DBSCAN dengan jumlah

kelompok sebanyak tiga. Selanjutnya hasil dari kedua metode dibandingkan

menggunakan nilai Indeks

Silhouette

untuk menentukan metode mana yang lebih

baik dalam mengelompokkan rumah kost mahasiswa. Berdasarkan hasil penelitian

yang telah dilakukan ditemukan bahwa metode

K-Means

bekerja lebih baik

dibanding DBSCAN dalam mengelompokkan rumah kost mahasiswa yang

dibuktikan dengan nilai Indeks

Silhouette

pada

K-Means

sebesar 0,463 lebih

tinggi dari nilai Indeks

Silhouette

pada DBSCAN yaitu sebesar 0,281.

Kata Kunci: rumah kost mahasiswa, data mining, pengelompokan,

K-Means

,

(7)

d efghi ej

a

j khll

a

j

community or household, as well as economic

activities daily, including consumption. The student needs to choose a place to

stay is also one form of consumption activities. There are many factors that affect

student preferences in the selection of boarding houses, including price, amenities,

location, income, lifestyle, and others. The rental price boarding and facilities

offered significant positive effect on student preferences in choosing a boarding

house. Do groupings based on rental rates and facilities offered in order to know

the condition of the student boarding house in the Village Tembalang. Grouping is

one of the main tasks in data mining and have been widely applied in various

fields. The method used to classify is

K-Means

and DBSCAN with a number of

groups of three. Furthermore, the results of both methods were compared using

the

Silhouette

index values to determine which method is better to classify the

student boarding house. Based on the research that has been conducted found that

the

K-Means

method works better than DBSCAN to classify the student boarding

house as evidenced by the value of the

Silhouette

index on

K-Means

of 0.463 is

higher than the value at DBSCAN

Silhouette

index is equal to 0.281.

(8)

mnop nq r sr

tuvuwux ty zy{y|}~ ~z€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€rror! Bookmark not defined.

ty zy{y|‚ƒ|„ ƒ…yty |†€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

ty zy{y|‚ƒ|„ ƒ…yty |††€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

‡yˆy‚ƒ|„y |ˆy‰€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

yŠ… ˆ‰y‡€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. €“€ ‰”w” •ux{u •uvu–€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

€—€ Šu

t

u

s

ux {u •u vu–€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. €˜€ ˆ”™”ux€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

ŠyŠ ††

ˆ†|}y~ y |‚~…ˆy‡y€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

“€€ u

t

u{Žx Žx’ €€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. “€“€ ‚w

r

š••uxu

t

uy

w

u v›

Preprocessing Data

)

€€€€€€

Error! Bookmark not

defined.

“€—€ yxu vŽ •Ž

s

‡všwœ š‘ €€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. “€—€€ ‡šx •

p

‚x’všwœ š‘ux €€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. “€—€“€ ˆ”™ ”ux‚x’všwœ š‘ux€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

“€—€—€ }x Ž

s

‚x’všwœ š‘ux €€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. “€˜€

K-MEANS

€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined.

“€—€ yv’šŽ

t

wu

K-Means

€€€€€€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. “€—€“ ‡u

r

u‘ž 

r

Ž

st

Ž‘

K-Means

€€€€€€€€€€€€€€€€€€€€€Error! Bookmark not defined. “€Ÿ€  Š… ‹y |

(

Density-Based Spatial Clustering Algorithm with Noise

)

Error! Bookmark not defined.

2.5.1. Konsep DBSCAN ...

Error! Bookmark not defined.

(9)

2.6. Sampel Acak Berlapis ...

 rror! Bookmark not defined.

2.6.1. Kerangka Sampel ...

Error! Bookmark not defined.

2.6.2. Penarikan Sampel Acak Stratifikasi Proporsional (

Proportionate

Stratified Random Sampling

)...

Error! Bookmark not defined.

2.7. Rumah Kost...

Error! Bookmark not defined.

2.8. Harga ...

Error! Bookmark not defined.

2.9. Fasilitas...

Error! Bookmark not defined.

2.10.

Validasi Kelompok ...

Error! Bookmark not defined.

BAB III METODOLOGI PENELITIAN ...

Error! Bookmark not defined.

3.1. Jenis dan Sumber Data ...

Error! Bookmark not defined.

3.2. Teknik Pengolahan Data ...

Error! Bookmark not defined.

3.3. Diagram Alir...

Error! Bookmark not defined.

BAB IV HASIL DAN PEMBAHASAN ...

Error! Bookmark not defined.

4.1. Analisis Deskriptif...

Error! Bookmark not defined.

4.2.

Preprocessing

(Pemrosesan Awal Data).

Error! Bookmark not defined.

4.3. Proses Pengelompokan dengan Metode

K-Means

Error! Bookmark not

defined.

4.4. Proses Pengelompokan dengan Metode DBSCAN

Error! Bookmark not

defined.

4.5. Perhitungan nilai Indeks

Silhouette

...

Error! Bookmark not defined.

4.5.1. Perhitungan nilai Indeks

Silhouette

pada

K-Means

...

Error!

Bookmark not defined.

4.5.2. Perhitungan nilai Indeks

Silhouette

pada DBSCAN...

Error!

Bookmark not defined.

4.6. Interpretasi Hasil Pengelompokan yang Paling Optimal ...

Error!

Bookmark not defined.

BAB V PENUTUP...

Error! Bookmark not defined.

5.1

Kesimpulan...

Error! Bookmark not defined.

5.2

Saran...

Error! Bookmark not defined.

DAFTAR PUSTAKA ...

Error! Bookmark not defined.

(10)
(11)

¡¢£¤¢ ¥¦¢§¨ ¢¥

Halaman

Gambar 1. Macam macam pendefinisian kelompok pada titik yang sama.

©rror!

Bookmark not defined.

Gambar 2. Kategori titik pada DBSCAN...

Error! Bookmark not defined.

Gambar 3. Diagram Alir ...

Error! Bookmark not defined.

Gambar 4. Plot data Hasil Normalisasi...

Error! Bookmark not defined.

Gambar 5. Pengelompokan menggunakan

ª« ¬

e

­

ns

sebanyak 3 kelompok .

Error!

Bookmark not defined.

(12)

Halaman

Tabel 1. Populasi dan Sampel Rumah Kost...

¶rror! Bookmark not defined.

Tabel 2. Statistik Deskriptif ...

Error! Bookmark not defined.

Tabel 3. Nilai Sentroid Awal ...

Error! Bookmark not defined.

Tabel 4. Perubahan Posisi Kelompok Pada Setiap Iterasi....

Error! Bookmark not

defined.

Tabel 5. Hasil Perhitungan Iterasi Pertama...

Error! Bookmark not defined.

Tabel 6. Indeks

·¸

lhouette

pada

¹º»

e

¼½¾

dan DBSCAN....

Error! Bookmark not

defined.

Tabel 7. Interpretasi Variabel untuk Masing Masing Kelompok...

Error!

Bookmark not defined.

(13)

Halaman

Lampiran 1. Kuesioner Pengelompokan Rumah Kost Mahasiswa...

Érror!

Bookmark not defined.

Lampiran 2. Data Rumah Kost Mahasiswa...

Error! Bookmark not defined.

Lampiran 3. Data normalisasi dengan metode Mix Max...

Error! Bookmark not

defined.

Lampiran 4. Clustering Kmeans Data Rumah Kost (k=3)...

Error! Bookmark not

defined.

Lampiran 5. Clustering DBSCAN Data Rumah Kost (eps=0.1,minPts=2) ...

Error!

Bookmark not defined.

Lampiran 6. Syntax R Clustering Kmeans...

Error! Bookmark not defined.

(14)

ÎÏÐÑÌÒÓÔ ÓÌÐ

ÕÖÕÖ ×ØÙØÚ ÛÜÝ ØÞ Øß à

áâã äåæ åç è ã â éêë åì åç í åæåî íåïê ðñ æ å òåî óñ ô âãåéåç èõ öñæå òåî ñ çñ

ã âéêë åì åç íåæåî íåïê ì åðåíåç éåãåñ óñ ÷äêìøï å ùéø úñ çíñ û åðå áâçè åî

(

ô âãåéåç è

)

õ ô åæåî íåï ê üåìïø é éåãåñ çòå ðñ æ å òåî ñ çñ óñì åéâçåì åç óñ ì åð åí åç

áâã äåæ åç è ï â éó åë åï ä âä âéåë å êçñ úâéíñ ï åí óñ åçï åéåçòå ýçñ úâéí ñ ï åí þñëøç âèøéøÿ

ù ø æñïâìçñì âèâéñ ô âãåé åçè

,

ó åç ýçñ úâ éíñ ï åí ùåçó åç åéåç õ âçêéêï åãêí âí åé

åîåíå ÷çóøç âí ñå

(

÷

),

ãåîåí ñ í ð å åó åæåî ã âéâì å òåç è í âóåç è äâ æ å åé óñ

ë âéèê éê åçï ñçèèñõåîåí ñ íðåí åãåîåæçòåó âç èåç ãåí òå éåìåï åïåêéêã åîï åçèè å

,

êèå ãâæåìêì åç åìï ñ úñ ï åí âìøçøãñ í âîå éñ îåéñ ïâéãåíêì ìøçí êã íñõ âäêïê îåç

ã åîåí ñíðå êçï êì ãâã ñ æñî ïâã ë åï ïñ çèèåæ ê èå ãâéêë åì åç íåæ åî í åïê äâçïêì ó åéñ

ì âèñåïåç ìøçí êãí ñ õ åèñ íâïñåë ñ çóñ úñ óê ïñ ó åì ïâéì âêåæñ ãåîåíñ í ðå ì â äêïê îåç

òåçèíåç èåïë âçïñ ç èêçïê ìíâè âéåïâéë âçê îñåóåæåîï âã ë åïïñ çèèåæåï åê éêãåîõ

ýíåîåéêã åîìøí ïêãêãç òåä åçòåìóñ ï âãêì åçóñó åâéåîòåç èäâéóâì åï åç

ó âçè åçëêí åï ìâèñåï åç éê ïñ çñïåíÿ íåæåîíåïêç òåóñ âæê éåîåç áâã äåæ åç èõá âéó åë åï

äåç òåìüåìïø é òåç èã âãë âçè åéê îñ ë éâ üâé âçí ñãå îåí ñíð åó åæ åãë âãñæñîåç éêãåî

ìøí ï

,

óñ åçï åéåçòå î åéè å

,

üåí ñ æñïåíÿ æøì åí ñ

,

ë âçó åë åïåçÿ è å òå îñóêëÿ ó åç æåñ ç æåñçõ

âçê éêï åîãåð åïñ

(

)

îåéèå íâðå ìøíï ó åç üåí ñ æñï åí òåç è óñ ïåð åéìåç

äâéë âç èå éê î íñ èçñüñì åç ëøí ñ ïñü ïâéîåó åë ë éâ üâéâçí ñ ãåîåíñ í ð å ó åæ åã ã âãñæñ î

éêã åîìøí ï õ

ç åæñí ñíì âæøã ëøì

(

a

y

)

åó åæ åîãâç è âæøã ëøìì åçó åïå

(

ø ä âì

)

(15)
(16)

3

(17)

4

stut vw xuy z{ Mzy z| z}

~€  ‚ƒ€‚‚ „‚…†‚ƒ ‡ˆ‰‚ €Š‰ „‹‚ˆ‚Œ ‡‚Ž …‰‰ƒ‰‚ˆ‚ „‚ …

‘’ “”ƒ” ƒ• Ž‚ ƒ –‚ ‚ ‹” ƒ ‡”„—€ ‹—Ž‚ ƒ €” ƒ‡‡ƒ‚Ž ‚ ƒ €”• —ˆ” ˜™š

e

›œ ˆ‚ƒ

€” • —ˆ” žŸ  ¡ ¢ ‹ ‚ˆ‚  €‚ … Ž —• €‚ …‚ ‰ £‚ ˆ‰ ¤” „‚…‚ ƒ Œ” €Š‚„‚ ƒ ‡

  ” €‚‚ ƒ ‡’

¥’ “”ƒ” ƒ• Ž‚ ƒ –‚ ‚ ‹”Š‚ƒˆ‰ ƒ‡‚ ƒ ‹” ƒ ‡”„ —€‹—Ž‚ ƒ €” ƒ‡‡ƒ‚Ž‚ƒ €” •—ˆ” ˜ ™

š

e

›œ ˆ‚ ƒ €” •—ˆ ” ž Ÿ  ¡  ¢ ‹‚ˆ‚  €‚ … Ž — • €‚ …‚ ‰ £‚ ˆ‰ ¤” „ ‚…‚ ƒ

Œ” €Š‚ „‚ ƒ ‡ ”€‚‚ ƒ ‡’

¦’ Ÿ‚‡‚‰ €‚ƒ‚‰ƒ•” ‹” •‚ ‰ˆ‚‰Ž” „—€ ‹—Ž†‚ ƒ ‡‹‚ „‰ƒ‡—‹•‰ €‚ „†‚ ƒ ‡ˆ‰ …‚ ‰ „Ž‚ƒ

ˆ‚‰ ‹”Š‚ ƒˆ‰ ƒ‡‚ ƒ €” •— ˆ” ˜™š

e

›œ ˆ‚ ƒ €” •—ˆ ” žŸ  ¡ ¢ ‹‚ˆ‚  €‚…

Ž —•€‚…‚ ‰ £‚ˆ‰¤” „ ‚ …‚ ƒŒ” €Š‚ „ ‚ƒ ‡  ” €‚ ‚ƒ‡’

st§t ¨z©zy z{ Mzyz|z}

Ÿ‚ •‚‚ ƒ€‚ ‚ „‚ …‹‚ˆ‚Œ ‡‚Ž …‰ ‰ƒ‰‚ˆ‚ „‚ …

‘’ ª—Ž‚‰«” ƒ” „‰•‰ ‚ƒŠ” •” €‹‚ •ˆ‰¤” „ ‚ …‚ ƒŒ” €Š‚ „ ‚ ƒ‡  ”€ ‚‚ ƒ ‡’

¥’ ž‚ •‚ †‚ ƒ ‡ ˆ‰‡ƒ‚Ž‚ ƒ ‚ˆ‚ „‚ … ˆ‚ •‚ ‹‰€”  ˆ‚‰ …‚ ‰ „ ‹” ƒ” „‰•‰ ‚ƒ

€” ƒ‡‡ƒ‚Ž‚ ƒ Ž ” ‰ —ƒ” ‹‚ˆ‚ €‚ …‚ ‰ £‚ †‚ƒ ‡ €” ƒ” € ‹‚•‰  €‚ … Ž — • ˆ‰

¤” „ ‚ …‚ ƒŒ” €Š‚ „‚ ƒ ‡  ”€‚‚ ƒ ‡’

¦’ ¬‚Ž •‹” ƒ‡‚ €Š‰„‚ ƒˆ ‚ •‚Š „‚ ƒ“‚” •¥­‘®¯ ‡• ¥­‘®’

st°t ±u²uz{

Œ ³‚ ƒˆ‚‰Œ  ‡‚Ž …‰‰ ƒ‰‚ˆ‚ „‚ …

(18)

5

´µ ¶·¸¹º»º¹¼ ½ ·¾¿¹¼ÀÁ¼Â¹ ¼ »¼ ûº Ä·¼·¼ ûº¹¼ º· ¸ÅÄ ½Åº ƹ ¼Â ½¹ ¸Á ¼ Â

ŽÃÁĹ ¸ À¹¸¹ Ä ½·¼Â· ¸Å Ä ½Åº¹¼ Ä·¼Â»¼¹º ¹¼ Ä·Ã ÅÀ· ÇÈÉ

e

ÊËÌ À ¹ ¼

Ä· à ÅÀ·ÍÎÏ ÐÑÒ½¹À ¹¾» ĹӺ ÅÔ ÃÀÁÕ· ¸» ¾¹Ó¹¼Ö·Ä¿¹ ¸¹¼ÂÏ· Ĺ ¾¹¼Âµ

×µ ¶·¸¹º»º¹¼ Á¼ ÷ ¾½¾· Ã¹Ô Á À¹¾Á º· ¸ÅÄ ½Åº ƹ¼Â ½¹ ¸Á ¼  ŽÃÁĹ ¸ ƹ¼Â

ÀÁÓ¹Ô Á ¸º¹¼À¹ ¾Á½· ¾¿¹¼ÀÁ ¼Â¹¼Ä· ÃÅÀ·ÇÈ É

e

ÊËÌ À ¹ ¼Ä· ÃÅÀ·Í ÎÏ ÐÑÒ½¹À ¹

Referensi

Dokumen terkait

• Indeks saham Nikkei Jepang merosot 4,2 persen ke level terendah dalam 4 bulan pada Selasa kemarin, akibat penguatan yen Jepang (atau melemahnya USDJPY) yang menekan sentimen

Dari hasil tersebut dapat diketahui bahwa secara keseluruhan penelitian penerapan metode pembelajaran Quiz Team pada materi kelarutan dan hasil kali kelarutan siswa

,NODQ WHOHYLVL PHUXSDNDQ VDODK VDWX PHGLD NRPXQLNDVL \DQJ SDOLQJ HIHNWLI GDQ HILVLHQ VHEDJDL PHGLD XQWXN PHPDVDUNDQ SURGXN GDQ FLWUD VXDWX SHUXVDKDDQ 1DPXQ VDDW LQL EDQ\DN

Kulit pohon ek putih biasanya direbus atau dikukus untuk menghasilkan cairan yang dapat dioleskan pada daerah anus yang terdapat ambeien atau dijadikan teh

Pendidikan inklusif di Indonesia mulai diberlakukan sejak diterbitkannya Permendiknas No 70 tahun 2009. Sedangkan di Surabaya pada tahun 2013 sudah terdapat 50 sekolah dasar

penyebab yang berbahaya. Seperti telah disebutkan secara berulang- ulang, memberi beban lebih kapada mesin disel untuk berapa waktu saja adalah praktek yang sangat buruk.

L’existence de l’intrigue est déterminée f o r m e r un thème et l’intrigue fixé qui sont par les trois éléments principaux dans le associés au lieu, au temps, à

Saya dapat mengatakan, bahwa masuknya budhisme ke dalam komunitas kita dengan menggunakan metafora psikologi begitu kuatnya mungkin telah membuat orang berpikir bahwa budhisme