• Tidak ada hasil yang ditemukan

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA KMEANS CLUSTERING PADA PENERIMAAN SISWA BARU

N/A
N/A
Anita Diah Prasetya Wati

Academic year: 2024

Membagikan "PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA KMEANS CLUSTERING PADA PENERIMAAN SISWA BARU "

Copied!
33
0
0

Teks penuh

(1)

1

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA K- MEANS CLUSTERING PADA PENERIMAAN SISWA BARU

(STUDI KASUS : SMA N 1 PABERIWAI)

PROPOSAL

Hendra Defriwanto Ninggeding 2120009

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS KRISTEN WIRA WACANA SUMBA 2024

(2)

2

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA K- MEANS CLUSTERING PADA PENERIMAAN SISWA BARU

(STUDI KASUS : SMA N 1 PABERIWAI)

PROPOSAL

Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan Studi Jenjang Strata Satu (S1) Pada Program Studi Teknik Informatika

HENDRA DEFRIWANTO NINGGEDING 2120009

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS KRISTEN WIRA WACANA SUMBA

2

(3)

PENGESAHAN

PROPOSAL

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PADA PENERIMAAN SISWA BARU

(STUDI KASUS : SMA N 1 PABERIWAI)

yang disusun oleh

Hendra Defriwanto Ninggeding 2120009

telah disetujui oleh Dosen Pembimbing Skripsi pada tanggal ...

Nama Pembimbing Tanda Tangan

1. Nama dan Gelar . NIDN. 0826019004

2. Nama dan Gelar Penguji 2 NIDN. 08XXXXXXXX

Mengetahui,

Ketua Program Studi Teknik Informatika

Arini Aha Pekuwali, S.Kom., M.Kom.

NIDN. 0329059001

3

2024

(4)

4

4

(5)

PERSETUJUAN

PROPOSAL

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PADA PENERIMAAN SISWA BARU

(STUDI KASUS : SMA N 1 PABERIWAI)

yang disusun oleh

Hendra Defriwanto Ninggeding 2120009

telah dipertahankan di depan Dewan Penguji Skripsi pada tanggal

Susunan Dewan Penguji

Nama Penguji Tanda Tangan

1. ...

NIDN. 0826019004

2. Nama dan Gelar Penguji 2 NIDN. 08XXXXXXXX

3. Nama dan Gelar Penguji 3 NIDN. 08XXXXXXXX

Proposal ini telah diterima sebagai salah satu persyaratan untuk memperoleh gelar Sarjana

Komputer Tanggal

Ketua Program Studi Teknik Informatika

Arini Aha Pekuwali, S.Kom., M.Kom.

NIDN. 0329059001

(6)

PERNYATAAN BEBAS PLAGIAT

Saya yang bertanda tangan di bawah ini:

Nama : Hendra Defriwanto Ninggeding

Nomor Induk Mahasiswa : 2120009

Program Studi : Teknik Informatika

Judul Skripsi : Penerapan Data Mining Menggunakan Algoritma K- Means Clustering Pada Penerimaan Siswa Baru (Studi Kasus : Sma N 1 Paberiwai)

Dengan ini menyatakan bahwa karya ilmiah skripsi ini bebas plagiat. Dimana sepanjang pengetahuan saya, tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka.

Apabila di kemudian hari terbukti terdapat plagiat dalam karya ilmiah skripsi ini, maka saya bersedia menerima sanksi sesuai dengan peraturan dan perundang- undangan yang berlaku.

Waingapu, 23 April 2021 (Materai 10.000)

Hendra Defriwanto Ninggeding 2120009

vi

(7)

MOTO DAN PERSEMBAHAN

Motto merupakan semboyan berupa kalimat pendek yang mengetengahkan pandangan hidup penulis. Sedangkan persembahan berisi tujuan kepada siapa skripsi ini dipersembahkan dan merupakan kata hati terutama hasrat pengabdian yang hendak disampaikan penulis.

(8)

KATA PENGANTAR

Puji syukur ke hadirat Tuhan Yang Maha Esa yang telah melimpahkan segala rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan laporan skripsi yang merupakan salah satu persyaratan untuk menyelesaikan program studi strata satu (S1) pada Jurusan Teknik Informatika Universitas Kristen Wira Wacana Sumba.

Penulis menyadari bahwa laporan skripsi ini masih jauh dari sempurna.

Karena itu, kritik dan saran akan senantiasa penulis terima dengan senang hati.

Dengan segala keterbatasan, penulis menyadari pula bahwa laporan skripsi ini tidak akan terwujud tanpa bantuan, bimbingan, dan dorongan dari berbagai pihak. Untuk itu, dengan segala kerendahan hati, penulis menyampaikan ucapan terima kasih kepada:

1. Tuhan Yang Maha Esa yang telah menciptakan dan memberikan kehidupan di dunia

2. Bapak dan Ibu tercinta yang telah mendukung penulis baik spirit maupun materi.

3. ….

Semoga Tuhan Yang Maha Esa membalas kebaikan dan selalu mencurahkan berkat-Nya.

Waingapu, 30 April 2021

Penulis

viii

(9)

DAFTAR ISI

PROPOSAL...i

PROPOSAL...i

PENGESAHAN...ii

PERSETUJUAN...iii

PERNYATAAN BEBAS PLAGIAT...iv

MOTO DAN PERSEMBAHAN...v

KATA PENGANTAR...vi

DAFTAR ISI...vii

DAFTAR GAMBAR...ix

DAFTAR TABEL...x

ABSTRAK...xi

BAB I PENDAHULUAN...1

1.1Latar Belakang...1

1.2Rumusan Masalah...2

1.3Batasan Masalah...2

1.4Tujuan Penelitian...2

1.5Manfaat Penelitian...2

1.6Sistematika Penulisan...3

BAB II LANDASAN TEORI...12

2.1Data Mining...12

2.2Clastering...12

2.3Pengolahan Data Mahasiswa Baru...13

2.4Algoritma K-Means...13

2.5RapidMiner...14

(10)

2.6Penelitian Terlebih Dahulu...15

BAB III METODOLOGI PENELITIAN...19

3.1Profil Objek Penelitian...19

3.2Alur Penelitian...20

3.2.1 Mengumpulkan data...20

3.2.2 Teknik Pengumpulan Data...20

3.2.3 Mempersiapkan Dataset Clustering...21

3.2.4 Mengolah Algoritma K-Means Clustering...21

3.2.5 Interpretasi Hasil Clustering...22

3.2.6 Evaluasi Hasil Cluster...22

x

(11)

DAFTAR GAMBAR

Gambar 3.1 Alur Penelitian ...11

(12)

DAFTAR TABEL

Tabel 2.1 Penelitian terdahulu...8

xii

(13)

ABSTRAK

Penelitian ini mengeksplorasi penerapan teknik data mining, khususnya algoritma K-Means Clustering, dalam proses penerimaan siswa baru di SMA Negeri 1 Paberwai. Dengan fokus pada efisiensi, objektivitas, dan transparansi seleksi, penelitian ini mencoba mengatasi kompleksitas dan ketidakobjektifan metode seleksi manual yang saat ini dominan. Penggunaan K-Means Clustering diharapkan dapat membantu sekolah mengelompokkan pendaftar ke dalam kelompok homogen, memungkinkan penyesuaian pendekatan pendidikan.

Meskipun menghadirkan potensi manfaat, penerapan data mining membutuhkan sumber daya teknologi dan keahlian analisis data yang memadai. Penelitian ini terbatas pada penerimaan siswa baru di SMA Negeri 1 Paberwai pada tahun ajaran 2024/2025, menggunakan data pendaftar tahun sebelumnya. Tujuan penelitian melibatkan implementasi K-Means Clustering, identifikasi faktor berpengaruh, dan analisis dampaknya terhadap proses seleksi. Hasilnya diharapkan memberikan kontribusi pada peningkatan efektivitas seleksi siswa baru dan dapat menjadi acuan bagi penelitian lanjutan di bidang ini.

Kata kunci: Penerapan, Data Mining, K-Means Clustering, Seleksi Siswa, Sma Negeri 1 Paberwai

(14)

BAB I

xiv

(15)

BAB II PENDAHULUAN

I.1 Latar Belakang

Penerimaan siswa baru pada SMA adalah sebuah proses yang melibatkan kompleksitas yang tinggi, memerlukan pertimbangan yang matang, dan menghadirkan tantangan signifikan setiap tahunnya. Lembaga Pendidikan menjadi magnet bagi beragam calon siswa dengan latar belakang dan prestasi yang berbeda-beda. Dengan demikian, proses seleksinya pun semakin sulit dan memakan waktu yang cukup lama. Saat ini, masih banyak sekolah yang sistem seleksi yang diterapkan masih bersifat manual, dimana penilaian dilakukan terutama berdasarkan nilai akademis dan prestasi non-akademis dari para pendaftar. Namun, pendekatan ini memiliki beberapa kekurangan yang patut diperhatikan.

Metode seleksi manual cenderung memakan banyak waktu dan tenaga. Tim seleksi harus meluangkan waktu yang signifikan untuk mengevaluasi setiap pendaftar secara individual, mengumpulkan data, dan memastikan bahwa keputusan yang diambil didasarkan pada pemahaman menyeluruh terhadap setiap kandidat. Proses ini dapat menjadi lebih rumit dengan jumlah pendaftar yang besar, seperti yang sering terjadi di setiap sekolah, yang pada gilirannya memperpanjang waktu yang diperlukan untuk menyelesaikan seluruh proses seleksi.

Pendekatan manual juga cenderung rentan terhadap keputusan yang subjektif. Meskipun tim seleksi mungkin berusaha keras untuk bersikap adil dan obyektif, kenyataannya adalah bahwa penilaian manusia rentan terhadap bias personal, penilaian yang tidak konsisten, dan interpretasi yang berbeda-beda terhadap kriteria seleksi. Hal ini bisa memengaruhi integritas keseluruhan proses seleksi dan dapat merugikan calon siswa yang sebenarnya memiliki potensi yang besar. Sulitnya menemukan calon siswa dengan potensi terbaik juga menjadi masalah serius dalam pendekatan seleksi manual (Jahya, 2022) Dengan beragam aspek yang perlu dievaluasi, terkadang sulit bagi tim seleksi untuk mengidentifikasi siswa-siswa yang memiliki potensi tersembunyi atau kualitas

(16)

yang tidak terlihat secara langsung dari dokumen atau data yang mereka miliki.

Hal ini bisa mengakibatkan kehilangan bakat dan kecerdasan yang mungkin dapat memberikan kontribusi signifikan terhadap lingkungan belajar di Sekolah

Dalam menghadapi tantangan-tantangan ini, perlu dipertimbangkan untuk mengadopsi metode seleksi yang lebih modern dan efisien. Salah satu pendekatan yang mungkin adalah memanfaatkan teknologi dalam proses seleksi, seperti sistem manajemen informasi sekolah yang terintegrasi atau algoritma pengambilan keputusan berbasis data. Dengan demikian, proses seleksi dapat menjadi lebih cepat, lebih obyektif, dan lebih mampu mengidentifikasi potensi siswa secara holistik. Selain itu, pendekatan ini juga dapat membantu dalam meningkatkan transparansi proses seleksi, sehingga mengurangi risiko terjadinya ketidakadilan atau ketidakjelasan dalam penentuan hasil seleksi (Isnanto &

Widodo, 2021).

SMA Negeri 1 Paberiwai merupakan lembaga pendidikan terletak di Desa Kananggar, Kecamatan Paberiwai, Kabupaten Sumba Timur . Secara keseluruhan, sementara proses seleksi siswa baru di SMA Negeri 1 Paberiwai telah memenuhi tujuannya selama ini, ada potensi untuk meningkatkan efisiensi, objektivitas, dan transparansi melalui pengadopsian metode seleksi yang lebih modern dan teknologi. Dengan demikian, sekolah dapat lebih baik memastikan bahwa mereka menerima siswa-siswa yang benar-benar memiliki potensi untuk berkembang dan berkontribusi secara positif dalam lingkungan belajar mereka..

Untuk mengatasi tantangan yang dihadapi dalam proses penerimaan siswa baru, perlu suatu sistem yang lebih efektif dan efisien. Salah satu pendekatan yang dapat diambil adalah penerapan teknik data mining. Teknik ini adalah sebuah metode yang digunakan untuk mengekstrak pengetahuan yang berharga dari kumpulan data yang besar. Dengan memanfaatkan teknik ini, institusi pendidikan dapat memperoleh wawasan yang mendalam mengenai pola-pola dan tren yang terkandung dalam data penerimaan siswa (Wibowo, 2018).

Salah satu algoritma data mining yang dapat diaplikasikan dalam konteks ini adalah K-Means Clustering. Algoritma ini, mampu mengelompokkan data berdasarkan kesamaan karakteristik (Nurhayati & Pratiwi, 2015). Dengan menggunakan pendekatan ini, institusi pendidikan dapat mengidentifikasi pola-

2

(17)

pola yang muncul dalam data penerimaan siswa, seperti profil siswa yang memiliki kesamaan dalam hal prestasi akademik, minat, bakat, atau latar belakang sosio-ekonomi.

Penerapan K-Means Clustering dalam sistem penerimaan siswa baru dapat memberikan beberapa manfaat yang signifikan. Pertama, institusi pendidikan dapat melakukan segmentasi yang lebih tepat terhadap calon siswa berdasarkan karakteristik mereka, sehingga memungkinkan untuk menyesuaikan pendekatan penerimaan dan pendidikan yang sesuai dengan kebutuhan masing-masing kelompok. Kedua, dengan pemahaman yang lebih baik mengenai profil siswa, institusi pendidikan dapat mengoptimalkan sumber daya yang dimiliki, seperti alokasi dana beasiswa atau program pengembangan akademik dan non-akademik.

Namun, perlu diingat bahwa penerapan teknik data mining seperti K-Means Clustering juga menghadirkan beberapa tantangan. Salah satunya adalah kebutuhan akan sumber daya yang memadai, baik dalam hal infrastruktur teknologi informasi maupun keahlian analisis data yang memadai. Selain itu, perlunya memastikan keamanan dan privasi data siswa juga menjadi aspek penting yang harus diperhatikan dalam penggunaan teknik ini.

Secara keseluruhan, penerapan teknik data mining, khususnya K-Means Clustering, dalam sistem penerimaan siswa baru merupakan langkah yang potensial untuk meningkatkan efektivitas dan efisiensi proses tersebut. Dengan memanfaatkan wawasan yang diperoleh dari analisis data, institusi pendidikan dapat mengambil keputusan yang lebih terinformasi dan memaksimalkan pengalaman pendidikan bagi setiap siswa.

Oleh karena itu, penulis berencana untuk melakukan penelitian berjudul Penerapan Data Mining Menggunakan Algoritma K-Means Clustering Pada Penerimaan Siswa Baru (Studi Kasus: Sma N 1 Paberiwai). Dengan menerapkan algoritma K-Means Clustering, diharapkan SMA Negeri 1 Paberiwai dapat mengelompokkan data pendaftar ke dalam beberapa kelompok yang homogen.

Hal ini diharapkan dapat membantu sekolah dalam menyeleksi pendaftar dengan lebih mudah dan efisien, serta meningkatkan objektivitas dan transparansi dalam proses seleksi.

(18)

2

I.2 Rumusan Masalah

Berdasarkan latar belakang di atas, dirumuskan beberapa pertanyaan penelitian sebagai berikut:

1. Bagaimana cara menerapkan algoritma K-Means Clustering pada proses penerimaan siswa baru di SMA Negeri 1 Paberwai?

2. Apa saja faktor-faktor yang paling berpengaruh terhadap pengelompokan pendaftar SMA Negeri 1 Paberiwai?

3. Bagaimana pengaruh penerapan algoritma K-Means Clustering terhadap efisiensi dan efektivitas proses penerimaan siswa baru di SMA Negeri 1 Paberwai?

I.3 Batasan Masalah

Penelitian ini dibatasi pada penerimaan siswa baru di SMA Negeri 1 Paberwai pada tahun ajaran 2024/2025. Data yang digunakan adalah data pendaftar SMA Negeri 1 Paberwai pada tahun ajaran 2023/2024.

I.4 Tujuan Penelitian

Tujuan penelitian ini adalah:

1. Menerapkan algoritma K-Means Clustering pada proses penerimaan siswa baru di SMA Negeri 1 Paberwai.

2. Mengidentifikasi faktor-faktor yang paling berpengaruh terhadap pengelompokan pendaftar SMA Negeri 1 Paberwai.

3. Menganalisis pengaruh penerapan algoritma K-Means Clustering terhadap efisiensi dan efektivitas proses penerimaan siswa baru di SMA Negeri 1 Paberwai.

I.5 Manfaat Penelitian

Hasil penelitian ini diharapkan dapat memberikan manfaat sebagai berikut:

1. Bagi SMA Negeri 1 Paberwai, hasil penelitian ini dapat membantu sekolah untuk meningkatkan efisiensi dan efektivitas proses penerimaan siswa baru.

(19)

3

2. Bagi peneliti lain, hasil penelitian ini dapat menjadi referensi untuk penelitian selanjutnya tentang penerapan data mining pada proses penerimaan siswa baru.

3. Bagi dunia pendidikan, hasil penelitian ini dapat memberikan masukan untuk pengembangan sistem penerimaan siswa baru yang lebih baik.

I.6 Sistematika Penulisan BAB I: Pendahuluan

Dalam bab ini akan diuraikan tentang latar belakang permasalahan, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan.

BAB II: Landasan Teori

Bab ini akan menjelaskan landasan teori, data mining, clustering data, stunting, metode K-Means, Metode Evaluasi Cluster, Rapidminer, dan penelitian terdahulu yang akan di gunakan dalam pengklasteran data.

BAB III: Metodologi Penelitian

Bab ini menjelaskan metode penelitian, metode pengumpulan data, pengklasteran data siswa . Metode penelitian ini berisikan tentang metode yang digunakan yaitu algoritma K-MEANS dan profil SMA Negeri 1 Paberiwai Dalam bab ini juga membahas tentang teknik pengumpulan data mulai dari Observasi, Wawancara, dan Dokumentasi.

(20)

12

BAB III LANDASAN TEORI

I.7 Data Mining

Data mining adalah suatu proses analisis data yang melibatkan perspektif beragam untuk menyimpulkan informasi penting dari dataset besar. Tujuan utamanya adalah untuk meningkatkan keuntungan atau mengurangi biaya pengeluaran dengan mengidentifikasi korelasi atau pola dari ratusan atau ribuan field dalam sebuah relasional database yang besar. Dengan kemampuannya dalam mengeksplorasi informasi bisnis berharga dari dataset yang besar, data mining dapat dibandingkan dengan penambangan logam mulia dari sumbernya.

Teknologi ini digunakan untuk mengotomatisasi pencarian informasi prediktif dan mengungkap pola yang sebelumnya tidak diketahui dalam basis data. Dua fungsi utamanya termasuk prediksi tren dan sifat-sifat bisnis, serta penemuan pola-pola baru yang mungkin tersembunyi dalam dataset dengan melakukan pemindaian menyeluruh (Yunita, 2018).

I.8 Clastering

Clustering adalah suatu mekanisme klasifikasi tanpa pengawasan di mana sekelompok pola (data), umumnya multidimensional, dikategorikan ke dalam kelompok sehingga anggota dalam satu kelompok memiliki kesamaan sesuai dengan kriteria yang telah ditetapkan (Yona dkk., 2018). Dalam proses ini, data diorganisir berdasarkan kesamaan karakteristik tertentu, memungkinkan pengelompokan yang lebih mudah dipahami dan mempermudah identifikasi pola atau tren yang mungkin tersembunyi.

Clustering merupakan suatu pendekatan di mana objek-objek dikelompokkan berdasarkan data yang mencerminkan tingkat kesamaan di antara anggota kelas, dengan tujuan meminimalkan perbedaan di antara kelas-kelas tersebut. Proses pengelompokan ini membantu mengidentifikasi pola distribusi dalam dataset, yang pada gilirannya dapat mempermudah analisis data. Dalam perbandingan dengan klasifikasi, yang membutuhkan pengetahuan sebelumnya tentang kelas-kelas yang ada, clustering melibatkan algoritma yang tidak

(21)

13

mengetahui kelas-kelas pada awalnya. Kesamaan antar anggota kelas menjadi fokus utama dalam membentuk kelompok, memberikan wawasan tambahan terhadap struktur data yang mungkin tidak terdeteksi secara langsung (Oki Oktaviarna Tensao dkk., 2022).

I.9 Pengolahan Data Mahasiswa Baru

Menurut Yunita, ( 2018) Pentingnya melakukan pengolahan data mahasiswa perlu dilakukan untuk mengetahui informasi penting berupa pengetahuan baru (knowledge discovery). Pengolahan data mahasiswa, termasuk langkah-langkah seperti pengumpulan, pemrosesan, dan analisis data, menjadi fondasi dalam upaya mencapai tujuan knowledge discovery. Data mining, sebagai suatu proses, bertujuan untuk menemukan pola atau informasi menarik dalam data mahasiswa yang telah dipilih, menggunakan berbagai teknik atau metode. Ragam teknik, metode, atau algoritma dalam data mining sangat beragam, dan pengolahan data mahasiswa yang baik akan membantu mengoptimalkan hasil dari proses ini . I.10 Algoritma K-Means

Menurut Yunita, (2018) K-Means Clustering adalah metode analisis data atau data mining yang beroperasi dalam mode tanpa supervisi, yang berarti tidak memerlukan bimbingan eksternal. Dalam K-Means Clustering, K mengacu pada jumlah cluster yang diinginkan, dan "Means" merujuk pada nilai rata-rata dari suatu grup data, yang dalam konteks ini disebut sebagai cluster. Metode ini merupakan salah satu cara untuk mengelompokkan data dengan pendekatan partisi, di mana algoritma berusaha memodelkan data ke dalam beberapa kelompok. K-Means berupaya mengorganisir data ke dalam kelompok-kelompok di mana setiap kelompok memiliki karakteristik serupa, sementara karakteristiknya berbeda dari kelompok lainnya. Algoritma K-Means membutuhkan parameter input K, yang menentukan jumlah cluster, dan membagi sekumpulan objek ke dalam k cluster sehingga tingkat kemiripan antar anggota dalam satu cluster tinggi, sedangkan tingkat kemiripan dengan anggota pada cluster lain sangat rendah. Kesamaan diukur melalui kedekatan objek terhadap nilai rata-rata pada cluster, yang juga dapat disebut sebagai centroid atau pusat massa.

(22)

14

Algoritma K-Means sering digunakan dalam proses pengelompokan karena sifatnya yang sederhana dan efisien [9], dan diakui sebagai salah satu dari sepuluh algoritma teratas dalam data mining menurut IEEE (Gustientiedina dkk., 2019).

Adapun Proses Algoritma K-Means Sebagai berikut.

1. Tentukan k sebagai jumlah cluster yang akan dibentuk, menggunakan metode elbow criterion dengan rumus berikut.

2. Pilihlah k titik pusat cluster (centroid) awal secara acak. Penentuan ini dilakukan dengan cara acak dari objek yang tersedia sebanyak k cluster.

Untuk menghitung centroid cluster ke-i selanjutnya, gunakan rumus berikut:

3. Menghitung jarak dari setiap objek ke masing – masingcentroid dari masing – masing cluster menggunakan Euclidean Distance, dengan rumus sebagai berikut:

4. Alokasikan dari masing – masing objek kedalam centroid paling dekat. Untuk pengalokasian objek kedalam masing – masingcluster pada saat iterasi secara umum dilakukan dengan cara hard k-means dimana secara tegas setiap objek dinyatakan sebagai anggota cluster dengan mengukur jarak kedekatan sifatnya terhadap titik pusat cluster tersebut.

5. Lakukan iterasi dan kemudian tentukan posisi centroid baru dengan menggunakan persamaan.

6. Ulangi langkah tiga jika posisi centroid baru tidak sama.

I.11 RapidMiner

RapidMiner merupakan perangkat lunak sumber terbuka (open source) yang menyediakan solusi untuk melakukan analisis data mining, teks mining, dan analisis prediksi. Melalui berbagai teknik deskriptif dan prediksi, RapidMiner memberikan wawasan kepada pengguna untuk mendukung pengambilan keputusan yang optimal (Surapati & Jannah, 2024).

(23)

15

RapidMiner adalah sebuah platform perangkat lunak yang sangat kuat untuk keperluan ilmu data dan pembelajaran mesin. Platform ini menyediakan berbagai alat untuk persiapan data, pemodelan, evaluasi, dan implementasi. Didesain untuk kemudahan penggunaan, RapidMiner memungkinkan pengguna untuk dengan mudah membangun dan menguji berbagai model, bahkan tanpa memerlukan pengalaman pemrograman[1]. Antarmuka drag-and-drop RapidMiner memungkinkan pengguna untuk membangun alur kerja secara intuitif untuk memproses dan menganalisis data. Platform ini mendukung berbagai sumber data, termasuk file datar, basis data, dan platform big data seperti Hadoop dan Spark.

Selain itu, RapidMiner dilengkapi dengan berbagai operator yang telah dibangun, yang merupakan blok bangunan dari alur kerja. Operator ini mencakup semua tahap proses data mining, mulai dari pembersihan data, pemilihan fitur, hingga pemodelan (Rafi Nahjan dkk., 2023). RapidMiner beroperasi melalui serangkaian langkah sebagai berikut:

a. Akuisisi Data: Data dikumpulkan dari berbagai sumber seperti basis data, file Excel, dan data streaming.

b. Prapemrosesan: Data yang dikumpulkan mengalami prapemrosesan untuk membersihkan informasi yang tidak relevan, mengisi nilai yang hilang, dan memformat data.

c. Analisis: RapidMiner menyediakan berbagai teknik analisis, termasuk clustering, klasifikasi, regresi, dan lainnya untuk menganalisis data.

d. Visualisasi: Hasil analisis divisualisasikan dalam bentuk grafik atau tabel untuk memudahkan pemahaman dan interpretasi.

e. Prediksi: RapidMiner digunakan untuk melakukan prediksi berdasarkan data yang telah dikumpulkan dan dianalisis sebelumnya.

f. Evaluasi: Hasil prediksi dievaluasi untuk memastikan kualitas dan akurasi hasil yang dihasilkan.

Dalam keseluruhan prosesnya, RapidMiner membantu pengguna dalam pengambilan keputusan berdasarkan informasi yang diperoleh dari analisis data.

I.12 Penelitian Terlebih Dahulu

Penelitian ini bukan merupakan penelitian pertama yang dilakukan;

(24)

16

merujuk pada studi-studi yang telah dilakukan sebelumnya dan memiliki relevansi dengan penelitian saat ini. Studi-studi sebelumnya menjadi referensi bagi penulis untuk memperluas landasan teori dalam menilai penelitian yang sedang dilaksanakan.

Tabel 2.1 Penelitian terdahulu

No. Judul dan Penulis Metode Hasil

1 Analisa Data Mining dengan Algoritma K- Means Clustering Untuk Menentukan Strategi Promosi Mahasiswa Baru Pada STMIK Primakara,

Nama Nama Penulis:

1. Oki Oktaviarna Tensao, 2. I Nyoman Yudi

Anggara Wijaya,

3. Ketut Queena Fredlina

(2022)

Algoritma K- Means clustering

Hasil dari peneletian cluster bahwa mahasiswa yang paling banyak mendaftar berasal dari wilayah Denpasar timur dan Gianyar, solusi dari strategi promosi yang bisa dilakukan yaitu melakukan promosi langsung, memperbanyak promosi ke sekolah,

2 Penerapan Data Mining Pada Penerimaan

Mahasiswa Baru Dengan Algoritma K-Means Cluster,

Nama Penulis:

1. Septian Isnanto, 2. Suryarini Widodo (2021)

Metode Algoritma K-

Means Clustering

Clustering

yang dilakukan dengan menggunakan K-Means berdasarkan 5 atribut target yaitu Jenis Sekolah, Jurusan Sekolah, Nilai Tes Masuk, Indeks Prestasi Semester 1 dan 2 pada data di Politeknik STMI Jakarta menghasilkan sebuah informasi gambaran karakteristik mahasiswa sesuai prodi.

3 Penerapan Data Mining Menggunakan Algoritma K-Means Clustring Pada Penerimaan Mahasiswa Baru

(Studi Kasus : Universitas Islam Indragiri),

Nama Penulis : 1. Fitri Yunita (2018)

Metode Algoritma K-

Means Clustering

Hasil dari penelitian ini digunakan sebagai salah satu dasar pengambilan keputusan untuk menentukan strategi mempromosikan masing- masing program studi yang ada di universitas islam indragiri. berdasarkan hasil cluster algoritma k-means dapat dilihat

jurusan/program studi yang di minati di masing- masing sekolah

(25)

17

4 Analisis Dan Penerapan Data Mining Untuk Menentukan Gaji Karyawan Tetap Dan Karyawan Kontrak Menggunakan Algoritma K-Means

Clustering (Studi Kasus Di Pt Indomex Dwijaya Lestari)

Nama Penulis:

1. Novi Yona Sidratul Munti 2. Gunadi Widi Nurcahyo 3. Julius Santony

(2018)

Metode Algoritma K-

Means Clustering

Berdasarkan analisa dan pengujian menggunakan Software RapidMiner pada PT Indomex Dwijaya Lestari, maka dapat diambil beberapa

kesimpulan sebagai berikut 1. Metode Clustering K- Means dapat membantu mengelompokkan gaji karyawan berdasarkan faktor- faktor yang mempengaruhi kinerja karyawan dalam bekerja sehingga membantu proses administrasi PT Indomex Dwijaya Lestari.

5 Penerapan Data Mining Menggunakan Metode K- Means Untuk

Mengetahui Minat Customer Dalam

Pembelian Merchandise Kpop

Nama Penulis:

1. Untung Surapati

2. Magfiratul Jannah

(2024)

Metode K- Means.

Hasil dari penelitian ini menunjukkan bahwa teknik data mining dengan menggunakan metode k- means dapat memberikan informasi yang berguna dalam mengidentifikasi minat pelanggan terhadap pembelian merchandise KPOP.

Berdasarkan penelitian-penelitian terdahulu diatas. Sebagai panduan dalam penyusunan penelitian maka peneliti mengadaptasi jurnal dari penelitian sebelumnya dengan judul Penerapan Data Mining Berdasarkan Asal Sekolah, Nilai UAN,Prodi yang dipilih , Dengan Menggunakan Metode Metode Algoritma K-Means Clustering (Studi Kasus : Universitas Islam Indragiri), persamaan dari penelitian sebelumnya yaitu berdasarkan metode yaitu algoritma K-means clustering, nilai UAN, asal sekolah Untuk membedakan penelitian sebelumnya dengan penelitian yang akan dilakukan terletak pada studi kasus, dan analisa data. Penelitian sebelumnya melakukan penelitian pada Universitas Islam Indragiri, sedangkan penelitian ini dilakukan di SMA Negeri 1 Paberiwai, Kabupaten Sumba Timur.

(26)

18

BAB IV

METODOLOGI PENELITIAN

I.13 Profil Objek Penelitian

SMA Negeri 1 Paberiwai merupakan salah satu lembanga pendidikan Sekolah Menengah Atas (SMA) terletak di RT 009/ RW 003, Desa Kananggar, Kecamatan Paberiwai, Kabupaten Sumba Timur.

Fokus dari penelitian ini adalah penerapan teknik data mining, khususnya menggunakan algoritma K-Means Clustering, dalam rangka meningkatkan efektivitas dan efisiensi proses seleksi siswa baru di SMA Negeri 1 Paberwai.

Penelitian akan berfokus pada penggalian pengetahuan dari data pendaftar siswa, dengan harapan bahwa algoritma K-Means Clustering dapat membantu mengelompokkan pendaftar ke dalam kelompok-kelompok yang homogen.

Tujuan utamanya adalah untuk memperbaiki objektivitas, transparansi, dan efisiensi seleksi, serta mengatasi beberapa masalah yang diidentifikasi dalam latar belakang, seperti kompleksitas proses, ketidakobjektifan, dan ketidaktransparanan dalam metode seleksi yang saat ini bersifat manual yang artinya akan memakan waktu yang lebih lama dan rentan terhadap kesalahan manusia.

I.14 Alur Penelitian

Berikut merupakan kerangkan berpikir yang akan mengambarkan tahapan- tahapan yang akan dilakukan.

Mulai

Persiapan Data

Pre-persiapan Data

Penerapan Algoritma K-Means Clustering

(27)

19

Gambar 3.1 Alur Penelitian Berikut adalah tahap-tahap alur penelitian:

I.1.1 Persiapan Data

 Mengumpulkan data pendaftar SMA Negeri 1 Paberwai tahun sebelumnya, minimal 3 tahun terakhir.

 Data yang dikumpulkan meliputi nilai rapor (Matematika, Bahasa Indonesia, Bahasa Inggris, IPA, IPS), prestasi (tingkat nasional, provinsi, kabupaten/kota), dan tes masuk.

 Memastikan data lengkap dan konsisten.

I.1.2 Pre-processing Data

 Melakukan normalisasi data untuk menyamakan skala antar variabel.

 Menangani missing values dengan teknik imputasi yang sesuai.

 Melakukan reduksi dimensi jika diperlukan, seperti Principal Component Analysis (PCA).

I.1.3 Penerapan Algoritma K-Means Clustering Identifikasi Faktor-

Faktor Pengaruh

Pengukuran Efisiensi dan Efektivitas

Kesimpulan dan Rekomendasi

Selesai

(28)

20

1. Inisialisasi Centroid

 Pilih k data secara acak sebagai centroid awal.

 Atau, gunakan metode k-means++ untuk inisialisasi centroid yang lebih optimal.

2. Iterasi

Mulai

1. Inisialisasi Centroid - Pilih k data acak

- Atau, gunakan k-means++

2. Iterasi

- Hitung jarak data ke centroid - Tetapkan data ke cluster terdekat - Hitung ulang centroid

- Cek konvergensi

3. Evaluasi Hasil

- Visualisasi (scatter plot, heatmap) - Pengukuran Kualitas (SSE, Silhouette coefficient)

Selesai

(29)

21

a. Perhitungan Jarak

 Hitung jarak setiap data ke semua centroid menggunakan rumus Euclidean distance.

b. Penugasan Cluster

 Tetapkan setiap data ke cluster dengan centroid yang memiliki jarak paling dekat.

c. Perhitungan Ulang Centroid

 Hitung ulang centroid dari setiap cluster dengan rata-rata dari semua data yang termasuk dalam cluster tersebut.

d. Cek Konvergensi

 Bandingkan centroid baru dengan centroid lama.

 Jika tidak ada perubahan, lanjutkan ke langkah 3.

 Jika ada perubahan, ulangi langkah 2a, 2b, dan 2c.

3. Evaluasi Hasil a. Visualisasi

 Gunakan scatter plot dan heatmap untuk melihat hasil clustering.

b. Pengukuran Kualitas

 Hitung nilai SSE (Sum of Squared Errors) untuk mengukur kualitas clustering.

 Gunakan Silhouette coefficient untuk melihat seberapa baik setiap data ditugaskan ke clusternya..

I.1.4 Identifikasi Faktor-Faktor Pengaruh

 Menganalisis mean dan standar deviasi dari setiap cluster untuk melihat perbedaan karakteristik antar cluster.

 Melakukan uji statistik seperti ANOVA dan t-test untuk mengetahui signifikansi perbedaan antar cluster.

 Menghitung korelasi antar variabel dan cluster untuk melihat hubungannya.

I.1.5 Pengukuran Efisiensi dan Efektivitas

 Menghitung waktu dan biaya yang diperlukan untuk proses penerimaan dengan dan tanpa K-Means Clustering.

 Membandingkan tingkat akurasi dan fairness dalam proses seleksi dengan

(30)

22

dan tanpa K-Means Clustering.

 Melakukan survei kepada panitia dan pendaftar untuk mengetahui tingkat kepuasan terhadap proses penerimaan dengan K-Means Clustering.

I.1.6 Kesimpulan dan Rekomendasi

 Merumuskan kesimpulan penelitian berdasarkan hasil analisis.

 Memberikan rekomendasi untuk penerapan algoritma K-Means Clustering di SMA Negeri 1 Paberwai.

Alur penelitian ini menguraikan langkah-langkah untuk menjawab rumusan masalah penelitian tentang penerimaan siswa baru di SMA Negeri 1 Paberwai dengan menggunakan algoritma K-Means Clustering.

Tahap awal penelitian meliputi persiapan data, pre-processing data, dan penerapan algoritma K-Means Clustering. Data pendaftar SMA Negeri 1 Paberwai tahun sebelumnya dikumpulkan dan diproses untuk menghasilkan cluster-cluster pendaftar. Tahap selanjutnya adalah identifikasi faktor-faktor yang berpengaruh terhadap pengelompokan pendaftar, pengukuran efisiensi dan efektivitas penerapan K-Means Clustering, dan penarikan kesimpulan serta rekomendasi. Faktor-faktor yang berpengaruh dianalisis dengan statistik, efisiensi dan efektivitas diukur dengan waktu, biaya, akurasi, dan fairness, dan kesimpulan dan rekomendasi dirumuskan berdasarkan hasil analisis.

Alur penelitian ini diharapkan dapat membantu SMA Negeri 1 Paberwai dalam menyeleksi siswa baru dengan lebih efisien dan efektif, serta menghasilkan siswa yang berkualitas dan berprestasi.

I.1.7 Interpretasi Hasil Clustering

Menafsirkan hasil pengelompokan yang diperoleh dari algoritma K-Means Clustering. Memahami dan menjelaskan pola-pola atau kesamaan yang ditemukan dalam setiap kelompok.

I.1.8 Evaluasi Hasil Cluster

Mengevaluasi efektivitas pengelompokan, baik dari segi homogenitas kelompok maupun relevansi dengan kriteria seleksi yang diinginkan. Menilai

(31)

23

sejauh mana penggunaan K-Means Clustering dapat memberikan solusi terhadap masalah yang diidentifikasi dalam latar belakang.

(32)

24

DAFTAR PUSTAKA

Gustientiedina, G., Adiya, M. H., & Desnelita, Y. (2019). Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan. Jurnal Nasional Teknologi

dan Sistem Informasi, 5(1), 17–24.

https://doi.org/10.25077/teknosi.v5i1.2019.17-24

Isnanto, S., & Widodo, S. (2021). Penerapan Data Mining Pada Penerimaan Mahasiswa Baru Dengan Algoritma K-Means Clustering. Jurnal Teknik Informasi dan Komputer (Tekinkom), 4(2), 158.

https://doi.org/10.37600/tekinkom.v4i2.367

Jahya, J. T. (2022). PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PADA PENERIMAAN SISWA BARU DISEKOLAH SMA 2 PEMATANGSIANTAR SEBAGAI METODE PROMOSI. 8.5.2017, 2003–2005.

Nurhayati, & Pratiwi, L. A. (2015). Penerapan Algoritma K-Means dalam Data Mining untuk Peminatan Jurusan Bagi Siswa Kelas X ( Studi Kasus : SMA Negeri 29 Jakarta ). 1(Senatkom), 9–13.

Oki Oktaviarna Tensao, I Nyoman Yudi Anggara Wijaya, & Ketut Queena Fredlina. (2022). Analisa Data Mining dengan Algoritma K-Means Clustering Untuk Menentukan Strategi Promosi Mahasiswa Baru Pada STMIK Primakara. INFORMASI (Jurnal Informatika dan Sistem Informasi), 14(1), 1–17. https://doi.org/10.37424/informasi.v14i1.135

Rafi Nahjan, M., Nono Heryana, & Apriade Voutama. (2023). Implementasi Rapidminer Dengan Metode Clustering K-Means Untuk Analisa Penjualan Pada Toko Oj Cell. JATI (Jurnal Mahasiswa Teknik Informatika), 7(1), 101–

104. https://doi.org/10.36040/jati.v7i1.6094

Surapati, U., & Jannah, M. (2024). Penerapan Data Mining Menggunakan Metode K-Means Untuk Mengetahui Minat Customer Dalam Pembelian Merchandise Kpop. 5(3), 791–800.

(33)

25

Wibowo, T. (2018). Penerapan Data Mining Pemilihan Siswa Kelas Unggulan dengan Metode K-Means Clustering di SMP N 02 Tasikmadu. Universitas Muhammadiyah.

Yona, N., Munti, S., Nurcahyo, G. W., & Santony, J. (2018). Analisis Dan Penerapan Data Mining Untuk Menentukan Gaji Karyawan Tetap Dan Karyawan Kontrak Menggunakan Algoritma K-Means Clustering ( Studi Kasus Di Pt Indomex Dwijaya Lestari ). Jiti, 1(1), 2–9.

Yunita, F. (2018). Penerapan Data Mining Menggunkan Algoritma K-Means Clustring Pada Penerimaan Mahasiswa Baru. Sistemasi, 7(3), 238.

https://doi.org/10.32520/stmsi.v7i3.388

Gambar

Tabel 2.1 Penelitian terdahulu
Gambar 3.1 Alur Penelitian Berikut adalah tahap-tahap alur penelitian:

Referensi

Dokumen terkait

Dalam penelitian ini, penulis menggunakan pendekatan data mining dengan penerapan model regresi linear berganda akan dilakukan untuk estimasi nilai siswa untuk

Bagi Penulis Membuka wawasan dan pengetahuan untuk penulis tentang manfaat dari penerapan Data mining dengan menggunakan algoritma K-means Clustering untuk membangun aplikasi

Dalam penelitian ini, penulis menggunakan pendekatan data mining dengan penerapan model regresi linear berganda akan dilakukan untuk estimasi nilai siswa untuk

Puji dan syukur peneliti panjatkan kepada Allah Subhanahu Wa Ta’ala, karena atas berkat, rahmat, dan karunia-Nya peneliti dapat menyelesaikan penyusunan penelitian Tugas

a) Penerapan data mining dalam menentuka klasifikasi penerimaan siswa baru dapat digunakan untuk memprediksi layak atau tidak layak seorang siswa dapat

berdasarkan uraian latar belakang tersebut, maka penulis membuat penelitian yang berjudul “penerapan algoritma eclat dan apriori pada data mining untuk market baset analisis penjualan”

Tujuan Penelitian Tujuan penelitian yang dilakukan ini adalah untuk mengimplementasikan data mining clustering pada data perpustakaan menggunakan algoritma K-Means dalam menganalisis

PENERAPAN DATA MINING MENGGUNAKAN METODE K- MEANS CLUSTERING UNTUK KLASTERISASI PENJUALAN PESTISIDA STUDI KASUS TOKO BINA TANI INUMAN KUANSING SKRIPSI Oleh : FIRMAN HIDAYAT