PERBANDINGAN METODE
K MEANS
DAN METODE
DBSCAN PADA PENGELOMPOKAN RUMAH KOST
MAHASISWA DI KELURAHAN TEMBALANG SEMARANG
SKRIPSI
Disusun Oleh :
SISCA AGUSTIN DIANI BUDIMAN
NIM. 24010212130032
DEPARTEMEN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
-MEANS
! !"# $ % ! %& # '!%
()*+*(+(+,**,(
Tugas Akhir sebagai salah satu syarat untuk memperoleh
gelar Sarjana Sains pada Jurusan Statistika
-.!/$-'-% $ !$$ 0!
1!0#2$ ! ! % !% '!$ -'!$0!
#% 3 -/ $! . % -" /
- '!/ !%"
567 689:; 6:7 6<
Puji syukur penulis panjatkan kehadirat Allah SWT yang telah
memberikan rahmat dan karunia Nya, sehingga Tugas Akhir yang berjudul
Perbandingan Metode
K-Means
dan Metode DBSCAN pada Pengelompokan
Rumah Kost Mahasiswa di Kelurahan Tembalang Semarang ini dapat
diselesaikan. Banyak pihak yang telah membantu dalam penyelesaian Tugas
Akhir ini. Oleh karena itu, rasa hormat dan terimakasih penulis ingin sampaikan
kepada :
1. Ibu Dra. Dwi Ispriyanti, M.Si selaku Ketua Departemen Statistika
Universitas Diponegoro Semarang dan selaku dosen pembimbing II.
2. Ibu Diah Safitri, S.Si, M.Si selaku dosen pembimbing I yang telah
memberikan bimbingan dan pengarahan dalam penyusunan Tugas Akhir
ini.
3. Semua Bapak dan Ibu Dosen Departemen Statistika Universitas
Diponegoro yang telah memberikan ilmunya yang sangat berguna.
4. Pihak-pihak lain yang tidak dapat penulis sebutkan satu per satu yang telah
membantu penulisan Tugas Akhir ini.
Penulis menyadari bahwa dalam penulisan Tugas Akhir ini masih banyak
kekurangannya. Untuk itu penulis mengharapkan kritik dan saran demi
kesempurnaan laporan tugas akhir ini.
Semarang, September 2016
CDED FG F H
a
Fa
Ia
Ea
J KLa
MNK OD K Ia
FLa
Pa
Qa
Ra
Ra
S PSIa
E Ra
K OOa,
T S Oa
INJa
Q SQDKa
Q RG UG Ra
F NQ VKVIG F NED PG-
EDPG R NPIa
FSQ Q VKF SIFG.
WNb
SRSED K Ia
ED FG F Ha
SKRSQ I NIG JGE R NIXD R RG KOOa
J TSOa
I NPSXDQDK FDJa
E FD RSb
NKRSQ MD PG Q NOGa
Ra
K Q VKF SIFG.
YN PMDXD Rba
KLa
Q Za
Q R V P La
K O INIXNK Oa
PSEG X P NZ NP NKFG Ia
ED FG F Ha
MDJa
I XNIGJGED K PSIa
E Q VFR,
MGa
KRa
Pa
KLa
ED P OD,
Za
FG JG Ra
F[ J VQD FG,
XNKMD XDRa
K[ Oa
La
EGMSX[ MD K Ja
GK-
Ja
G K.
Harga sewa kost dan fasilitas yang
ditawarkan berpengaruh signifikan positif terhadap preferensi mahasiswa dalam
memilih rumah kost. Dilakukan pengelompokan berdasarkan harga sewa dan
fasilitas yang ditawarkan agar diketahui kondisi rumah kost mahasiswa di
Kelurahan Tembalang. Pengelompokan merupakan salah satu tugas utama dalam
data mining dan telah banyak diaplikasikan di berbagai bidang. Metode yang
digunakan untuk mengelompokkan adalah
K-M\]ns
dan DBSCAN dengan jumlah
kelompok sebanyak tiga. Selanjutnya hasil dari kedua metode dibandingkan
menggunakan nilai Indeks
Silhouette
untuk menentukan metode mana yang lebih
baik dalam mengelompokkan rumah kost mahasiswa. Berdasarkan hasil penelitian
yang telah dilakukan ditemukan bahwa metode
K-Means
bekerja lebih baik
dibanding DBSCAN dalam mengelompokkan rumah kost mahasiswa yang
dibuktikan dengan nilai Indeks
Silhouette
pada
K-Means
sebesar 0,463 lebih
tinggi dari nilai Indeks
Silhouette
pada DBSCAN yaitu sebesar 0,281.
Kata Kunci: rumah kost mahasiswa, data mining, pengelompokan,
K-Means
,
d efghi ej
a
j khlla
jcommunity or household, as well as economic
activities daily, including consumption. The student needs to choose a place to
stay is also one form of consumption activities. There are many factors that affect
student preferences in the selection of boarding houses, including price, amenities,
location, income, lifestyle, and others. The rental price boarding and facilities
offered significant positive effect on student preferences in choosing a boarding
house. Do groupings based on rental rates and facilities offered in order to know
the condition of the student boarding house in the Village Tembalang. Grouping is
one of the main tasks in data mining and have been widely applied in various
fields. The method used to classify is
K-Means
and DBSCAN with a number of
groups of three. Furthermore, the results of both methods were compared using
the
Silhouette
index values to determine which method is better to classify the
student boarding house. Based on the research that has been conducted found that
the
K-Means
method works better than DBSCAN to classify the student boarding
house as evidenced by the value of the
Silhouette
index on
K-Means
of 0.463 is
higher than the value at DBSCAN
Silhouette
index is equal to 0.281.
mnop nq r sr
tuvuwux ty zy{y|}~ ~zrror! Bookmark not defined.
ty zy{y|| yty |Error! Bookmark not defined.
ty zy{y|| yty |Error! Bookmark not defined.
yy|y |yError! Bookmark not defined.
y yError! Bookmark not defined. w ux{u uvuError! Bookmark not defined.
u
t
us
ux {u u vuError! Bookmark not defined. uxError! Bookmark not defined.y
|}y~ y |~ yyError! Bookmark not defined.
u
t
u{x x Error! Bookmark not defined. wr
uxut
uyw
u vPreprocessing Data
)
Error! Bookmark not
defined.
yxu v
s
vw Error! Bookmark not defined. x p
xvw ux Error! Bookmark not defined. uxxvw uxError! Bookmark not defined. }x
s
xvw ux Error! Bookmark not defined. K-MEANS
Error! Bookmark not defined. yv
t
wuK-Means
Error! Bookmark not defined. ur
u r
st
K-Means
Error! Bookmark not defined. y |(
Density-Based Spatial Clustering Algorithm with Noise
)
Error! Bookmark not defined.
2.5.1. Konsep DBSCAN ...
Error! Bookmark not defined.
2.6. Sampel Acak Berlapis ...
rror! Bookmark not defined.2.6.1. Kerangka Sampel ...
Error! Bookmark not defined.
2.6.2. Penarikan Sampel Acak Stratifikasi Proporsional (
Proportionate
Stratified Random Sampling
)...
Error! Bookmark not defined.
2.7. Rumah Kost...
Error! Bookmark not defined.
2.8. Harga ...
Error! Bookmark not defined.
2.9. Fasilitas...
Error! Bookmark not defined.
2.10.
Validasi Kelompok ...
Error! Bookmark not defined.
BAB III METODOLOGI PENELITIAN ...
Error! Bookmark not defined.
3.1. Jenis dan Sumber Data ...
Error! Bookmark not defined.
3.2. Teknik Pengolahan Data ...
Error! Bookmark not defined.
3.3. Diagram Alir...
Error! Bookmark not defined.
BAB IV HASIL DAN PEMBAHASAN ...
Error! Bookmark not defined.
4.1. Analisis Deskriptif...
Error! Bookmark not defined.
4.2.
Preprocessing
(Pemrosesan Awal Data).
Error! Bookmark not defined.
4.3. Proses Pengelompokan dengan Metode
K-Means
Error! Bookmark not
defined.
4.4. Proses Pengelompokan dengan Metode DBSCAN
Error! Bookmark not
defined.
4.5. Perhitungan nilai Indeks
Silhouette
...
Error! Bookmark not defined.
4.5.1. Perhitungan nilai Indeks
Silhouette
pada
K-Means
...
Error!
Bookmark not defined.
4.5.2. Perhitungan nilai Indeks
Silhouette
pada DBSCAN...
Error!
Bookmark not defined.
4.6. Interpretasi Hasil Pengelompokan yang Paling Optimal ...
Error!
Bookmark not defined.
BAB V PENUTUP...
Error! Bookmark not defined.
5.1
Kesimpulan...
Error! Bookmark not defined.
5.2
Saran...
Error! Bookmark not defined.
DAFTAR PUSTAKA ...
Error! Bookmark not defined.
¡¢£¤¢ ¥¦¢§¨ ¢¥
Halaman
Gambar 1. Macam macam pendefinisian kelompok pada titik yang sama.
©rror!Bookmark not defined.
Gambar 2. Kategori titik pada DBSCAN...
Error! Bookmark not defined.
Gambar 3. Diagram Alir ...
Error! Bookmark not defined.
Gambar 4. Plot data Hasil Normalisasi...
Error! Bookmark not defined.
Gambar 5. Pengelompokan menggunakan
ª« ¬e
ns
sebanyak 3 kelompok .
Error!
Bookmark not defined.
Halaman
Tabel 1. Populasi dan Sampel Rumah Kost...
¶rror! Bookmark not defined.Tabel 2. Statistik Deskriptif ...
Error! Bookmark not defined.
Tabel 3. Nilai Sentroid Awal ...
Error! Bookmark not defined.
Tabel 4. Perubahan Posisi Kelompok Pada Setiap Iterasi....
Error! Bookmark not
defined.
Tabel 5. Hasil Perhitungan Iterasi Pertama...
Error! Bookmark not defined.
Tabel 6. Indeks
·¸lhouette
pada
¹º»e
¼½¾dan DBSCAN....
Error! Bookmark not
defined.
Tabel 7. Interpretasi Variabel untuk Masing Masing Kelompok...
Error!
Bookmark not defined.
Halaman
Lampiran 1. Kuesioner Pengelompokan Rumah Kost Mahasiswa...
Érror!Bookmark not defined.
Lampiran 2. Data Rumah Kost Mahasiswa...
Error! Bookmark not defined.
Lampiran 3. Data normalisasi dengan metode Mix Max...
Error! Bookmark not
defined.
Lampiran 4. Clustering Kmeans Data Rumah Kost (k=3)...
Error! Bookmark not
defined.
Lampiran 5. Clustering DBSCAN Data Rumah Kost (eps=0.1,minPts=2) ...
Error!
Bookmark not defined.
Lampiran 6. Syntax R Clustering Kmeans...
Error! Bookmark not defined.
ÎÏÐÑÌÒÓÔ ÓÌÐ
ÕÖÕÖ ×ØÙØÚ ÛÜÝ ØÞ Øß à
áâã äåæ åç è ã â éêë åì åç í åæåî íåïê ðñ æ å òåî óñ ô âãåéåç èõ öñæå òåî ñ çñ
ã âéêë åì åç íåæåî íåïê ì åðåíåç éåãåñ óñ ÷äêìøï å ùéø úñ çíñ û åðå áâçè åî
(
ô âãåéåç è)
õ ô åæåî íåï ê üåìïø é éåãåñ çòå ðñ æ å òåî ñ çñ óñì åéâçåì åç óñ ì åð åí åçáâã äåæ åç è ï â éó åë åï ä âä âéåë å êçñ úâéíñ ï åí óñ åçï åéåçòå ýçñ úâéí ñ ï åí þñëøç âèøéøÿ
ù ø æñïâìçñì âèâéñ ô âãåé åçè
,
ó åç ýçñ úâ éíñ ï åí ùåçó åç åéåç õ âçêéêï åãêí âí åéåîåíå ÷çóøç âí ñå
(
÷),
ãåîåí ñ í ð å åó åæåî ã âéâì å òåç è í âóåç è äâ æ å åé óñë âéèê éê åçï ñçèèñõåîåí ñ íðåí åãåîåæçòåó âç èåç ãåí òå éåìåï åïåêéêã åîï åçèè å
,
êèå ãâæåìêì åç åìï ñ úñ ï åí âìøçøãñ í âîå éñ îåéñ ïâéãåíêì ìøçí êã íñõ âäêïê îåç
ã åîåí ñíðå êçï êì ãâã ñ æñî ïâã ë åï ïñ çèèåæ ê èå ãâéêë åì åç íåæ åî í åïê äâçïêì ó åéñ
ì âèñåïåç ìøçí êãí ñ õ åèñ íâïñåë ñ çóñ úñ óê ïñ ó åì ïâéì âêåæñ ãåîåíñ í ðå ì â äêïê îåç
òåçèíåç èåïë âçïñ ç èêçïê ìíâè âéåïâéë âçê îñåóåæåîï âã ë åïïñ çèèåæåï åê éêãåîõ
ýíåîåéêã åîìøí ïêãêãç òåä åçòåìóñ ï âãêì åçóñó åâéåîòåç èäâéóâì åï åç
ó âçè åçëêí åï ìâèñåï åç éê ïñ çñïåíÿ íåæåîíåïêç òåóñ âæê éåîåç áâã äåæ åç èõá âéó åë åï
äåç òåìüåìïø é òåç èã âãë âçè åéê îñ ë éâ üâé âçí ñãå îåí ñíð åó åæ åãë âãñæñîåç éêãåî
ìøí ï
,
óñ åçï åéåçòå î åéè å,
üåí ñ æñïåíÿ æøì åí ñ,
ë âçó åë åïåçÿ è å òå îñóêëÿ ó åç æåñ ç æåñçõâçê éêï åîãåð åïñ
(
)
îåéèå íâðå ìøíï ó åç üåí ñ æñï åí òåç è óñ ïåð åéìåçäâéë âç èå éê î íñ èçñüñì åç ëøí ñ ïñü ïâéîåó åë ë éâ üâéâçí ñ ãåîåíñ í ð å ó åæ åã ã âãñæñ î
éêã åîìøí ï õ
ç åæñí ñíì âæøã ëøì
(
a
y
)
åó åæ åîãâç è âæøã ëøìì åçó åïå(
ø ä âì)
3
4
stut vw xuy z{ Mzy z| z}
~
e
¡ ¢ £ ¤
¥
e
¡ ¢ £ ¤
¦
e
¡ ¢ £¤
st§t ¨z©zy z{ Mzyz|z}
ª« ¤
¥
£
¤
¦ ¬ ¥®¯ ¥®
st°t ±u²uz{
³
5
´µ ¶·¸¹º»º¹¼ ½ ·¾¿¹¼ÀÁ¼Â¹ ¼ »¼ ûº Ä·¼·¼ ûº¹¼ º· ¸ÅÄ ½Åº ƹ ¼Â ½¹ ¸Á ¼ Â
ŽÃÁĹ ¸ À¹¸¹ Ä ½·¼Â· ¸Å Ä ½Åº¹¼ Ä·¼Â»¼¹º ¹¼ Ä·Ã ÅÀ· ÇÈÉ
e
ÊËÌ À ¹ ¼Ä· à ÅÀ·ÍÎÏ ÐÑÒ½¹À ¹¾» ĹӺ ÅÔ ÃÀÁÕ· ¸» ¾¹Ó¹¼Ö·Ä¿¹ ¸¹¼ÂÏ· Ĺ ¾¹¼Âµ
×µ ¶·¸¹º»º¹¼ Á¼ ÷ ¾½¾· Ã¹Ô Á À¹¾Á º· ¸ÅÄ ½Åº ƹ¼Â ½¹ ¸Á ¼  ŽÃÁĹ ¸ ƹ¼Â
ÀÁÓ¹Ô Á ¸º¹¼À¹ ¾Á½· ¾¿¹¼ÀÁ ¼Â¹¼Ä· ÃÅÀ·ÇÈ É