PENGELOMPOKAN STASIUN WILAYAH DAOP 4 SEMARANG BERDASARKAN NILAI SLA MENGGUNAKAN ANALISIS CLUSTER
DENGAN METODE K-MEANS
Heni Sulistiyowati A1202101721
PROGRAM STUDI DIPLOMA TIGA STATISTIKA FAKULTAS SAINS DAN TEKNOLOGI
INSTITUT TEKNOLOGI STATISTIKA DAN BISNIS MUHAMMADIYAH SEMARANG
2024
BAB 1 PENDAHULUAN 1.1 Latar Belakang
Transportasi merupakan unsur terpenting dalam perkembangan suatu negara, yang dimana transportasi menjadi salah satu dasar pembangunan ekonomi dan perkembangan di masyarakat serta pertumbuhan industrialisasi. Transportasi merupkan sarana yang berperan penting dalam kehidupan dan aktivitas manusia selain sebagai alat untuk mempermudah manusia dalam memindahkan barang transportasi juga sebagai sarana yang mudahkan manusia dalam berpergian dari tempat ketempat lainnya.
Dalam perkembangannya transportasi akan menjadi pendorong kegiatan perekonomian dan pembangunan suatu daerah ataupun negara. Kemajuan tersebut ditandai dengan semakin tingginya aktivitas dan tingkat mobilitas penduduk yang diiringi dengan bertambah banyaknya pilihan sarana transportasi yang tersedia saat ini, pilihan dalam menggunakan jasa transortasi yang sesuai dengan kebutuhan masing-masing Banyak perusahaan transportasi yang menawarkan berbagai macam layanan jasa dengan harga dan fasilitas yang berbeda. Oleh karena itu, masyarakat menjadi semakin Berhati-hati dalam menentukan pilihan mereka.
Masyarakat akan mencari sarana transportasi yang sesuai dengan keinginan atau harapan mereka sehingga bisa memberikan kepuasan tersendiri mulai dari transportasi udara, laut dan darat banyaknya cangkupan transportasi yang ada menjadi hal yang mendukung dalam persaingan perusahan yang beroperasi dibidang transportasi.
Salah satu contoh alat transportasi umum yang banyak diminati oleh Masyarakat adalah kereta api. Kereta api merupakan alat transportasi umum yang lebih efisien jika dibandingkan dengan traspotasi darat umum lainnya. Selain waktu yang ditempuh lebih cepat kereta api juga dapat mengangkut banyak barang dalam jumlah yang besar. Sejak tahun 1864 kereta api pertama pertama di Indonesia yaang menghubungkan Semarang dengan tanggung yang dibangun oleh Nederlandscg-Indische Spoorweg Maatschappij (NIS), kemudian perkembangannya terus berlanjut hingga sekarang. Menjadikan kereta api sebagai salah satu sarana transportasi yang diminati oleh semua kalangan usia. Oleh karena itu PT. kereta api Indonesia perlu meningkatkan kualiatasnya.
Kualitas pelayanan adalah hal penting agar dapat meningkatkan kepuasan konsumen, menyatakan kepuasan konsumen adalah perasaan senang atau kecewa seseorang yang muncul setelah membandingkan kinerja (hasil) produk yang dipikirkan terhadap kinerja yang diharapkan. saat kualiatas pelayanan yang tersedia atau diberikan sesuai dengan harapan pelanggan, maka perusahaan secara tidak langsung telah memberikan kepuasan bagi para
pelanggannya. Hal ini tentu sangat baik bagi perusahaan karena secara tidak langsung keuntungan perusahaan akan meningkat karena konsumen yang merasa puas akan pelayanan yang diberikan oleh perusahaan kemungkinan besar akan kembali menggunakan jasa transportasi kereta api pada perjalanan berikutnya. Salah satu cara meningkatkan kualiatas pelayanan adalah dengan menjaga tau memastikan kebersihan dari stasiun yang merupakan tempat pemberhentian dan keberangkatan kereta api sekaligus sebagai tempat yang digunakan penumpang untuk mengakses transportasi.
Kebersihan stasiun menjadi salah satu dari kualitas pelayanan yang penting dalam meningkatkan minat Masyarakat dalam menilai kualiatas PT. Kereta api Indonesia itu sendiri, penelitian ini akan membahas mengenai pengelompokan stasiun berdasarkan nilai SLA stasiun wilayah Daop 4 Semarang agar dapat mengetahui tingkatan yang ada di setiap stasiun wilayah Daop 4 Semarang. Dengan adanya pengelompokan ini akan memudahkan dalam peningkatan kebersihan yang ada distasiun.
1.1.1 Rumusan masalah
Rumusan masalah yang ada dalam penelitian kali ini diantaranya :
1. Bagaimana pengelompokan stasiun wilayah Daop 4 Semarang berdasarkan nilai SLA kebersihan ?
2. Bagaimana karakteristik masing-masing kelompok masing-masing kelompok stasiun di wilayah daop 4 Semarang?
1.1.2 Batasan masalah
Agar permasalahan tidak meluas maka adanya Batasan masalah diantaranya :
1. Stasiun yang digunakan sebagai sumber data adalah stasiun yang ada di wilayah Daop 4 Semarang
2. Data yang digunakan merupakan data SLA dari stasiun Wilayah Daop 4 Semarang.
1.2 Tujuan penelitian
Adapun tujuan dari penelitian yang ini diantaranya :
1. mengetahui pengelompokan stasiun wilayah Daop 4 Semarang berdasarkan nilai SLA bulanan.
2. mengetahui karakteristik masing-masing kelompok masing-masing kelompok stasiun di wilayah daop 4 Semarang.
1.3 Manfaat penelitian
1.3.1 Bagi PT.Kereta Api Indonesia (persero)
Sebagai bahan tinjauan untuk meningkatkan kualitas pelayanan stasiun yang ada diwilayah daop 4 semarang dan sebagai informasi mana yang membutuhkan penangganan untuk meningkatkan kualitas pelayanan terutama kebersihan stasiun.
1.3.2 Bagi institusi
Dapat memberikan kontribusi pengetahuan dan menambah referensi dalam menggunakan analisis cluster dengan metode K-means
1.3.3 Bagi penulis
Menambah pengetahuan bagi penulis serta menjadi pengembangan kemampuan dalam menerapkan ilmu-ilmu yang telah dipelajari selama perkulihan.
2.1 Tinjauan Non-Statistik 2.1.1 Perkeretapian
BAB 2
TINJAUAN PUSTAKA
Menurut Peraturan Menteri Perhubungan PM. 48 Tahun 2015 perkeretaapian adalah satu kesatuan sistem yang terdiri atas prasarana, sarana, dan sumber daya manusia, serta norma, kriteria, persyaratan, dan prosedur untuk penyelenggaraan transportasi kereta api.
Perkeretaapian diselenggarakan dengan tujuan untuk memperlancar perpindahan barang atau perjalnan orang secara massal dengan selamat, aman, nyaman, cepat, dan lancer.
2.1.2 Stasiun
Stasiun (Peraturan Pemerintah No. 29 Tahun 2011) merupakan prasarana kereta api sebagai tempat pemberangkatan dan pemberhentian kereta api. Selain sebagai tempat naik dan turun penumpang, stasiun juga dapat menjadi “signage” atau penanda bagi penumpang yang akan pergi atau telah tiba di wilayah atau kawasan dimana stasiun itu berada. Sedangkan menurut (Undang-Undang No. 13 Tahun 1992) stasiun merupakan tempat kereta api berangkat dan berhenti untuk melayani naik dan turunnya penumpang dan/atau bongkar muat barang dan/atau untuk keperluan operasi kereta api yang dilengkapi dengan fasilitas keselamatan dan keamanan dan kegiatan penunjang stasiun serta sebagai tempat perpindahan intra dan antarmoda transportasi.
2.1.3 SLA (Service Level Agreement)
SLA (Service Level Agreement) merupakan bagian dari kontrak dimana mendefinisikan layanan apa saja yang disediakan oleh penyedia layanan (ISP) dan standar atau level yang dibutuhkan untuk layanan tersebut. Service Level Agreement umumnya merupakan bagian dari sebuah outsourcing atau managed service agreement, SLA yangakan dibahas kali ini mengenai SLA Kebersihan yang dimana isinya mencangkup tentang standar untuk kebersihan stasiun, termasuk frekuensi pembersihan dan tingkat kebersihan yang ada.
Dalam perhitungan SLA kebersihan biasanya dihitung dalam bulanan diantaranya hal- hal yang diperhatikan dalam perhitungan nilai SLA kebersihan yang ada distasiun adaalah seperti frekuensi pembersihan, standar kebersihan, survei pengguna, inspeksi rutin.
2.1.4 Frekuensi kebersihan
Didalam SLA kebersihan frekuensi kebersihan bisa ditentukan didalam beberapa area yang ada distasiun, dan penyedia layanan kebersihan akan ditugaskan untuk membersihkan area tersebut sesuai dengan dengan jadwal yang telah ditentukan. Setelah itu, dilakukannya pengawasan dan pemeriksaan rutin untuk memastikan pekerjaan pembersihan dilakukan sesuai dengan standar yang ditentukan atau ditetapkan.
Untuk menghitung nilai dari frekuensi kebersihan dalam SLA dilakukan dengan beberapa Langkah-langkah sebagai berikut :
• Menentukan standar frekuensi
• Mencatat waktu dan tanggal setiap data pembersihan
• Memeriksa kepatuhan
• Menghitung kepatuhan
• Memberikan skor atau nilai
• Analisis dan evaluasi.
Didalam frekuensi kebersihan SLA terdapat item yang dinilai diantaranya : A. KETERSEDIAAN BAHAN CONSUMABLE
Kesediaan yang dimaksud disini diantaranya seperti tissue roll, papper towel tissue, handsoap, afs, toilet seat sanitizer, plastic roll. Dengan memastikan semua bahan yang disebutkan tersedia sesuai jumlah yang telah di tentukan.
B. TOILET
Memastikan setiap bilik toilet dan toilet yang ada di stasiun bersih dan kering karena memastikan kenyaman dari pengunjung stasiun.
C. RUANGAN
Memastikan kebersihan yang ada di setiap ruangan yang ada distasiun terjaga kebersihannya, mulai dari ruangan operator, hingga ruangan yang dipakai untuk pegawai lainnya, dan juga ruangan yang digunakan untuk pengunjung.
D. EMPLASEMENT, HALAMAN, TAMAN
Emplasment, halaman, dan taman merupakan tempat yang harus dijaga kebersihannya dengan memastikan apakah tempat tersebut telah dibersihkan dan dirawat dengan baik.
E. PERON, OVERCAPPING, KORIDOR, SELASAR
Peron adalah jalur yang terletak sepanjang rel kereta api biasanya digunakan untuk naik atau turunnya penumpang, overcapping adalah atap yang ada diperon dan selasar adalah Lorong terbuka yang ada disepanjang stasiun.
2.2 Tinjauan Statistika 2.2.1 Analisis Deskriptif
Analisis deskriptif bertujuan untuk memberikan penjelasan secara umum mengenai masalah yang akan dianalisa agar mudah dipahami dan dimengerti dalam bentuk informasi yang lebih ringkas. Hasil analisis deskriptif biasanya disajikan dalam bentuk deskripsi naratif, tabel, grafik, atau diagram. Deskripsi naratif digunakan untuk menjelaskan secara verbal tentang temuan-temuan yang ditemukan dalam analisis data. Tabel, grafik, atau diagram
digunakan untuk menyajikan data secara visual, sehingga memudahkan pembaca untuk memahami dan menginterpretasikan data.
2.2.2 Analisis Cluster
Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya (Awalluddin &
Taufik, 2017). Analisis cluster mengklasifikasi objek sehingga objek-objek yang paling dekat kesamaanya dengan objek lain berada dalam cluster yang sama (Ediyanto et al., 2013). Analisis cluster atau analisis kelompok merupakan teknik analisa data yang bertujuan untuk mengelompokan individu atau objek ke dalam beberapa kelompok yang memiliki sifat berbeda antar kelompok, sehingga individu atau objek yang terletak di dalam satu kelompok akan mempunyai sifat relatif homogen. Tujuan analisis cluster adalah mengelompokan objek-objek tersebut.
Metode pengklasteran terbagi menjadi dua jenis, yaitu metode berhierarki dan non- hierarki, pada metode berhierarki digunakan untuk mengelompokkan objek secara terstuktur berdasarkan kemiripan sifatnya. Sedangkan beberapa ukuran kemiripan atau tidak miripan antar cluster dapat dilihat dengan menggunakan Pautan Tunggal, Pautan Lengkap, Pautan Centroid, Pautan Rataan, Pautan Median dan Ward. Hasil pengklasteran dengan metode berhierarki dapat digambarkan dalam sebuah diagram pohon yang biasa disebut dendogram.
Menurut Mattjik & Sumertajaya (2011), banyaknya cluster yang terbentuk ditentukan dari dendrogram yang terjadi dan tergantung subyektivitas peneliti. Namun demikian pemisahan cluster biasanya ditentukan berdasarkan jarak penggabungan terbesar.
Sedangkan metode non-hierarki adalah pengelompokan dimana cluster yang ingin dibentuk ditentukan terlebih dahulu, sehingga objek-objek akan dikelompokkan ke dalam k kelompok yang telah ditentukan (Hidayat, Wasono, & Darsyah, 2017). Pada metode non hierarki, setiap cluster memiliki titik pusat cluster (centroid) dan secara umum memiliki fungsi tujuan untuk meminimumkan jarak dari seluruh data ke pusat cluster masing-masing sehingga dapat memaksimalkan kesamaan objek-objek dari data. Contohnya adalah dengan algoritma K-means
2.2.3 Asumsi-asumsi analisis cluster
Ada dua asumsi untuk analisis cluster yaitu :
• Sampel mewaili polulasi
Sampel yang digunakan dalam analisis cluster harus dapat mewakili populasi yang ingin dijelaskan, karena analisis ini dikatakan baik jika sampelnya sesuai (representatif).
• Multikolonieritas
Jika terdapat hubungan linier antara sesama variabel bebas dapat dikatakan terkena
multikolinearitas, maka dari itu dapat dipertimbangkan dengan lebih baik apakah sebaiknya dihilangkan atau diganti dengan variabel lain. Untuk mengetahui ada atau tidaknya multikolonieritas dapat menggunkan nilai VIF (Variance Inflation Factor). Nilai VIF dirumuskan sebagai berikut :
𝑽𝑰𝑭𝒊 = 𝟏 𝟏 − 𝑹𝒊𝟐 Keterangan :
𝑹𝒊𝟐= Koefisien determinasi dan indeks 𝑖 = Variabel bebas ke-i
2.2.4 Metode Elbow
Cluster Ensemble diperkenalkan oleh Strehl dan Gosh (2002), yaitu sebuah metode yang digunakan untuk mengombinasikan sekumpulan solusi cluster. Metode ini memiliki keunggulan dibanding metode pengklasteran lainnya, yakni mampu meningkatkan kualitas dan kekekaran solusi cluster. Tantangan untuk mendapatkan solusi cluster dengan kualitas yang baik dan adanya keragaman solusi cluster yang dihasilkan dari metode yang berbeda merupakan motivasi dikembangkannya Cluster Ensemble.
Pengklasteran pada Cluster Ensemble dilakukan dengan mengombinasikan berbagai solusi dari berbagai metode pengklasteran hingga diperoleh satu pengklasteran akhir yang lebih baik. Input yang dibutuhkan adalah solusi pengklasteran yang telah diperoleh dengan menggunakan berbagai hasil pengklasteran tanpa melihat karakteristik data awal. Secara umum, pengklasteran objek dengan metode Cluster Ensemble dilakukan dalam dua tahap menurut Iam-on dan Garret (2010), yaitu:
Membentuk anggota ensemble yang anggotanya adalah solusi dari berbagai metode pengklasteran yang berbeda. Mengombinasikan seluruh anggota ensemble untuk memperoleh satu solusi akhir yang dinamakan fungsi Consensus.
Pada metode Elbow nilai cluster terbaik yang akan diambil dari nilai Sum of Square Error (SSE) yang mengalami penurunan yang signifikan dan berbentuk siku saat digambarkan dalam bentuk grafik dengan rumus :
𝑺𝑬𝑬 = ∑ ∑ |𝑿𝒊− 𝑪𝒌|𝟐
𝑿𝒊 𝑲
𝑲=𝟏
Keterangan :
K = Nilai cluster ke-i 𝑿𝒊= jarak data ke-i 𝑪𝒌= pusat cluster ke-k
2.2.5 Metode K-means
K-means merupakan salah satu metode data clustering nonhierarki yang berusaha mempartisi data yang ada dalam bentuk satu atau lebih cluster, sehingga data dengan karakteristik yang sama dikelompokan dalam satu cluster yang sama pula. Data dengan karakteristik yang berbeda dikelompokan dalam kelompok yang lain. Metode yang termasuk dalam algoritma clustering berbasis jarak yang membagi data kedalam sejumlah cluster dan algoritma ini hanya bekerja pada atribut numerik. K-means merupakan salah satu algoritma dalam data mining yang biasa digunakan untuk melakukan clustering suatu data. Ada banyak pendekatan untuk membuat cluster, diantaranya adalah membuat aturan yang mendikte keanggotaan dalam kelompok yang sama berdasarkan tingkat persamaan di antara anggota- anggotanya. Pendekatan lainnya adalah dengan membuat sekumpulan fungsi yang mengukur beberapa properti dari pengelompokan tersebut sebagai fungsi dari beberapa parameter dari sebuah clustering. Mengelompokan data dengan metode K-means dilakukan dengan algoritma sebagai berikut :
• Tentukan nilai 𝑘 sebagai jumlah cluster yang ingin dibentuk.
𝑍𝑖𝑋𝑖− 𝑥̅
𝑆 Keterangan :
𝑍𝑖 = Nilai Z-Score 𝑥𝑖 = Nilai data ke-i 𝑥̅= Nilai rata-rata 𝑠 = Nilai standar deviasi 𝑖 = 1,2,3, ….. , n
• Menentukan centroid untuk awal iterasi secara acak. Selanjutnya jika
menentukan nilai centroid yang merupakan tahap dari iterasi, maka digunakan rumus sebagai berikut :
V̅𝑖𝑗 = 1
𝑁𝑖∑ 𝑋𝑘𝑗
𝑁𝑖
𝑘=0
Keterangan :
V̅𝑖𝑗= centroid/rata-rata cluster ke-i untuk variabel ke-j 𝑁𝑖= Juamlah data yang menjadi anggota cluster ke-i i,k= Indeks dari cluster
j= Indeks dari variabel
𝑋𝑘𝑗= Nilai data ke-k yang ada didalam cluster tersebut variabel ke-j
• Menghitung jarak antara titik centroid dengan titik objek. Untuk
menghitung jarak tersebut menggunakan Euclidean Distance dengan rumus : 𝐷𝑒 = √(𝑥𝑖 − 𝑠𝑖+ (𝑦𝑖 − 𝑡𝑖)2
Keterangan :
𝐷𝑒 = Euclidean Distance 𝑖 = Banyaknya objek (𝑥, 𝑦) = Koordinat objek (𝑠, 𝑡) = Koordinat centroid
• Mengelompokkan objek dalam menentukan cluster dengan menghitung jarak minimum objek.
• Kembali ke tahap 3, melakukan perulangan hingga didapatkan nilai centroid yang dihasilkan tetap dan anggota masing-masing cluster tidak berubah. Jika kondisi ini terpenuhi maka didapatkan hasil cluster final.
BAB 3
METODOLOGI PENELITIAN 3.1 Jenis dan sumber data
Data yang digunakan untuk penelitian ini merupakan data sekunder yang didapatkan dari PT. Kereta Api Indonesia (Persero) wilayah daop 4 Semarang yang dimana terdiri dari 43 stasiun yaitu data nilai SLA kebersihan pada bulan agustus 2023 selama satu bulan penuh.
3.2 Analisis variabel
Variabel yang digunakan dalam penelitian ini adalah variabel independent atau variabel bebas, yaitu sebagai berikut :
Variabel Keterangan Satuan Skala
X1 Ketersediaan bahan consumable
bulan Rasio
X2 Toilet bulan Rasio
X3 Ruangan bulan Rasio
X4 Emplasment,
halaman, dan taman
bulan Rasio
X5 Peron, Overcapping, Koridor, Selasar
bulan Rasio
3.3 Langkah-langkah analisis
Analisis dalam penelitian ini menggunakan software SPSS 16 dan R Studio. Langkah analisis yang digunakan dalam penelitian ini sebagai berikut :
1. Analisis Deskriptif data berdasarkan variabel nilai SLA
2. Menentukan jumlah awal cluster dengan menggunakan metode elbow berdasarkan variabel Nilai SLA
3. Tentukan nilai 𝑘 sebagai jumlah cluster yang ingin dibentuk.
4. Menentukan centroid untuk awal iterasi secara acak.
5. Menghitung jarak antara titik centroid dengan titik objek dengan menggunakan Euclidean Distance.
6. Mengelompokkan objek dalam menentukan cluster dengan menghitung jarak minimum objek.
7. Melakukan perulangan hingga didapatkan nilai centroid yang dihasilkan tetap dan anggota masing-masing cluster tidak berubah. Jika kondisi ini terpenuhi maka didapatkan hasil cluster final.
3.4 Diagram air