• Tidak ada hasil yang ditemukan

View of IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI MEMBER BARU MENGGUNAKAN LINEAR REGRESSION PADA PT. GSI

N/A
N/A
Protected

Academic year: 2024

Membagikan "View of IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI MEMBER BARU MENGGUNAKAN LINEAR REGRESSION PADA PT. GSI"

Copied!
9
0
0

Teks penuh

(1)

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI MEMBER BARU MENGGUNAKAN LINEAR REGRESSION PADA PT. GSI

Agus Rizkiawan1), Tri Wahyudi 2)

1,2 Prodi Sistem Informasi, Sekolah Tinggi Ilmu Komputer Cipta Karya Informatika email: [email protected], [email protected]

Abstract

PT.GSI is a company that provides digital marketing learning courses. Companies market their products online to get audience data. However, it turns out that there is a discrepancy between the number of audiences and the number of those who register as new members and this makes it difficult for the company to estimate the number of new members in the future. The purpose of this study is to implement data mining using the Linear Regression algorithm in order to be able to predict new members in the future, and find out what the RMSE value is to find out the error value of the model applied in making predictions. In this study, the variables used consisted of 7 independent variables in the dataset, there were only 5 variables that affected the prediction results, these variables were Outgoing Call, Answer, Call Duration, Gold Package and Silver Package. Meanwhile, the No Answer and Candidate variables had no effect. Based on the test results with RapidMiner, it shows that the performance generated by the Linear Regression algorithm model has good performance with accurate prediction results, showing an RMSE value of 0.098.

Keywords: Data Mining, Prediction, Linear Regression, RMSE.

1. PENDAHULUAN

PT. GSI merupakan perusahaan yang bergerak di bidang pendidikan dengan menyediakan kursus pembelajaran digital marketing. PT. GSI memasarkan produknya melalui media daring seperti memasang iklan melalui website dan media sosial, dari hasil pemasaran tersebut perusahaan akan mendapatkan data audiens setiap harinya dengan jumlah data yang mencapai ratusan data. Namun dari banyaknya data audiens ternyata tidak semunya bisa dihubungi oleh tim telemarketing dan dari data yang bisa dihubungi hanya beberapa saja yang mendaftar sebagai member baru.

Besarnya ketimpangan antara jumlah data audiens dengan jumlah member baru menjadi permasalahan karena perusahaan kesulitan untuk dapat mengestimasi member baru di masa mendatang.

Terdapat empat faktor yang menjadi penyebab besarnya ketimpangan tersebut, faktor pertama adalah kurangnya penguasaan materi mengenai produk oleh telemarketing, faktor yang kedua adalah produk dipasarkan tidak berdasarkan target pasar yang benar, target pasar

PT. GSI adalah mahasiswa semester tingkat akhir dan para pencari kerja yang berminat bekerja di bidang digital marketing, namun dalam praktiknya perusahaan memasarkan produknya secara random dan tidak memasarkannya berdasarkan target pasar yang sesuai. Faktor yang ketiga adalah data audiens yang tidak fresh yaitu data lama yang dimajukan kembali ke data baru di hari selanjutnya. Dan faktor yang keempat adalah harga paket kursus yang ditawarkan kurang menarik.

Untuk mengatasi hal maka digunakan data mining untuk mencari pengetahuan berharga dari sebagian besar data yang tersimpan dalam database, gudang data, atau tempat penyimpanan informasi lainnya [1]. Data mining berguna dalam pencarian pola atau pengetahuan dalam tumpukan data dengan menggunakan cara atau metode tertentu untuk menghasilkan informasi yang bersifat benar, baru dan bermanfaat[2], [3].

Penerapan datamining sangat berguna untuk perusahaan karena berguna untuk menghasilkan informasi yang diperlukan dan merupakan asset yang dapat meningkatkan daya saing suatu organisasi [4].

(2)

Dengan menggunakan data mining maka akan bisa dilakukan prediksi peramalan atau forecasting [5], [6] yang dilakukan untuk memperkirakan apa yang akan terjadi pada masa depan. Prediksi juga diartikan meramalkan apa yang akan terjadi dalam kondisi baru berdasarkan data yang merepresentasikan apa yang terjadi di masa lalu [7], [8]. Salah satu metode yang cukup banyak digunakan untuk memprediksi adalah metode regresi, karena memiliki kelebihan, yakni perhitungannya yang cukup mudah [9].

Analisis regresi merupakan salah satu teknik analisis yang digunakan untuk mencari hubungan antara dua atau lebih variabel penyebab [10], [11], [12]. Linear Regression merupakan model dan analisis data kualitatif yang terdiri dari satu atau lebih variabel independen dan variabel dependen [13]. Linear Regression terbagi menjadi 2 linier regresi sederhana dan Multiple Linear Regression atau linier regresi berganda [14], [15]. linear regression algoritma yang digunakan untuk memprediksi dengan menggambarkan dua hubungan [16]. Linier Regresi dimasukkan dalam model deret waktu dengan menggunakan metode kuantitatif berbasis waktu untuk peramalan [17].

Berdasarkan latar belakang masalah yang telah diuraikan, maka diterapkan data mining dengan metode CRISP-DM menggunakan pemodelan algoritma Linear Regresion untuk memprediksi seberapa banyak yang akan menjadi member baru di masa mendatang dan untuk mengetahui variabel apa saja yang mempengaruhi hasil prediksi serta untuk mengetahui nilai root mean squared error (RMSE) dari pemodelan yang diterapkan.

2. METODE PENELITIAN

Dalam melakukan penelitian, penulis menggunakan metode Cross Industry Standard for Data mining (CRISP-DM), CRISP-DM adalah salah satu dari model proses data mining (data mining framework) hasil dari kesepakatan lima perusahaan besar dan dibangun pada tahun 1996. Framework tersebut kemudian terus mengalami perkembangan oleh banyak perusahaan di benua Eropa dan telah dijadikan

sebagai methodology standard non-proprietary bagi data mining.

CRISP-DM merupakan model yang masih banyak digunakan secara luas dikalangan industri, hal tersebut karena memiliki kelebihan dalam menangani berbagai proyek data mining.

Untuk melakukan pengujian, penulis akan menggunakan RapidMiner Studio sebagai alat bantu dalam melakukan pengolahan data mining, selain mudah digunakan juga dapat mengeksplorasi dan memvisualisasikan data secara statistik [18], selain itu juga dapat membantu aktivitas analisis prediktif dengan proses kerja dan penggunaan yang mudah.

Gambar 1. Proses CRISP-DM menggunakan Algoritma Linear Regression

Metode CRISP-DM terdiri dari 6 tahapan[19], berikut adalah penjelasan dari setiap tahapannya:

1. Tahap Pemahaman Bisnis (Business Understanding)

Merupakan langkah awal CRISP-DM dan merupakan bagian penting. Pada titik ini, pengetahuan tentang objek bisnis, cara menghasilkan atau mengambil data, dan cara mencocokkan tujuan model dengan tujuan bisnis diperlukan agar model terbaik dapat dibangun.

Kegiatan yang dilakukan meliputi:

Mendefinisikan dengan jelas tujuan dan kebutuhan secara keseluruhan, menerjemahkan tujuan tersebut dan menentukan batasan dalam

(3)

perumusan masalah data mining, kemudian menyiapkan strategi awal untuk mencapai tujuan yang dibelanjakan.

2. Tahap Pemahaman Data (Data Understanding)

Fase ini dimulai dengan pengumpulan data, dilanjutkan dengan proses untuk mendapatkan wawasan tentang data, mengidentifikasi masalah kualitas data, atau mengungkap bagian menarik dari data yang dapat digunakan untuk menghipotesiskan informasi tersembunyi.

3. Tahap Persiapan Data (Data Preparation) Langkah ini mencakup semua kegiatan membangun dataset final yaitu data yang akan diproses pada langkah pemodelan, dataset akhir dibangun dari data asli/mentah yang sudah dibersihkan. data clean atau bersih untuk membersihkan nilai-nilai yang kosong, dataset yang tidak konsisten atau kosong (missing value dan noise)[20]. Langkah ini dapat diulang berkali-kali, dan juga mencakup pemilihan tabel, rekaman, dan atribut data.

4. Tahap Modelling

Pada langkah ini, teknik pemodelan yang berbeda diidentifikasi dan diterapkan, dan beberapa parameter disesuaikan untuk mencapai nilai maksimum.

5. Tahap Evaluasi (Evaluation)

Pada titik ini, model telah dilatih dan harus berkualitas baik dari perspektif analisis data.

Pada tahap ini akan dilakukan evaluasi terhadap keefektifan dan kualitas suatu model sebelum digunakan dan akan menentukan apakah model yang digunakan dapat mencapai tujuan yang telah ditetapkan dalam tahap Business Understanding, career atau tidak.

6. Tahap Penyebaran (Deployment)

Sebagai langkah terakhir dari CRISP-DM, pengetahuan atau informasi yang diperoleh disebarluaskan dalam bentuk khusus yang dapat digunakan oleh pengguna. Tahap implementasi dapat berupa pelaporan atau melakukan proses

penambangan data berulang-ulang di dalam perusahaan.

3. HASIL DAN PEMBAHASAN

Pada tahap ini dilakukan pengolahan data berdasarkan tahapan-tahapan yang ada pada metode CRISP-DM yang sudah dijelaskan sebelumnya.

3.1. Pemahaman Data (Data Understanding) Data yang akan diproses dengan data mining merupakan data kualitatif, karena kumpulan data yang akan digunakan semuanya berbentuk numerik dan dapat dihitung. Adapun kumpulan data tersebut berisi jumlah audiens atau “Outgoing Call”, jumlah audiens yang dapat dihubungi “Answer”, jumlah audiens yang tidak bisa dihubungi “No Answer”, durasi panggilan telepon “Call Duration”, jumlah audiens yang berminat menjadi member “Kandidat”, jumlah audiens yang membeli paket gold “Paket Gold”, jumlah audiens yang membeli paket silver “Paket Silver’ dan jumlah audiens yang bergabung sebagai member baru “Member”.Adapun sumber data didapatkan berdasarkan hasil observasi dan wawancara di perusahaan PT. Genius Space Indonesia yang berlokasi di Graha Mampang Lantai 3 Suite 305 Jl. Mampang Prapatan Raya Kav.100, Kel. Duren Tiga, Kec. Pancoran, Kota Jakarta. Data penelitian berasal dari data penjualan selama kurun waktu 2 tahun dari januari 2021 sampai

Desember 2022 yang diberikan oleh tim marketing kepada penulis.

3.2. Persiapan Data (Data Preparation) 1. Dataset

Merupakan kumpulan data yang telah melalui proses data cleansing atau pembersihan data dengan menghilangkan beberapa atribut yang tidak diperlukan serta menghilangkan atribut dengan data kosong untuk menghindari adanya missing value Pada dataset yang akan digunakan sebagai bahan penelitian, Adapun jumlah data pada dataset berjumlah 511 row data dan 9 atribut data.

Tabel 1. Dataset

No Date OutgoingCall Answer No

Answer

Call Duration

Kandidat Paket Gold

Paket Silver

Member

(4)

1. 04.01.2021 996 202 794 934 17 4 5 9

2. 05.01.2021 341 87 254 751 12 5 3 8

3. 06.01.2021 482 80 402 555 21 4 3 7

4. 07.01.2021 498 118 380 915 18 4 4 8

5. 08.01.2021 489 85 404 221 21 4 7 11

6. 11.01.2021 449 96 353 707 7 4 4 8

… …… …… …… …… …… …… …… …… ……

… …… …… …… …… …… …… …… …… ……

510 19.12.2022 549 167 382 762 5 2 1 3

511 20.12.2022 528 120 408 888 4 1 1 2

2. Import Data

Setelah dilakukan cleansing, kemudian dataset diimpor ke dalam Repository atau database aplikasi RapidMiner, pada tahap ini penulis melakukan seleksi data mana saja yang akan dimasukan kedalam Repository aplikasi RapidMiner Studio.

Gambar 2. Import Data 3. Menentukan Tipe Data

Setelah dataset di import, Kemudian setiap atribut ditentukan tipe variabel nya, atribut

Date” menggunakan tipe data date karena data berisi merupakan penanggalan dengan role data id karena atribut tersebut tidak bisa dihitung, atribut “OutgoingCall”, “Answer”, “No Answer”, “Kandidat”, “Call Duration”, “Paket Gold”, dan “Paket Silver” menggunakan tipe data integer karena berisi data numeric yang bisa dihitung, dan atribut “Member” menggunakan tipe data integer dan menjadi label karena atribut tersebut akan menjadi label keluaran prediksi.

Tabel 2. Tipe Data

No Atribut Role Data Tipe Data

1 Date id Date

2 Outgoing Call - Integer

3 Answer - Integer

4 No Answer - Integer

5 Call Duration - Integer

6 Kandidat - Integer

7 Paket Gold - Integer

8 Paket Silver - Integer

9 Member Label Integer

3.3. Modelling

Pada tahap ini dataset tidak dibagi menjadi data training dan data uji, namun pengujian akan menggunakan operator Cross Validation dalam tahap pemodelan, karena karena operator ini dapat digunakan untuk mengevaluasi kinerja model atau algoritma dimana data dipisahkan menjadi dua sub data, yaitu proses pembelajaran data dan validasi/evaluasi data.

Gambar 3. Cross Validation

Didalam Proses Cross Validation, pada kolom testing digunakan algoritma Linear Regression, dan pada kolom training digunakan operator Apply Model untuk menerapkan model yang sebelumnya dilatih dengan menggunakan data pelatihan pada data yang tidak berlabel (data uji), tujuannya adalah untuk mendapatkan prediksi pada data yang tidak berlabel (data uji) yang tidak berlabel. Kemudian operator Apply Model dikoneksikan ke operator Performance

(5)

untuk mengevaluasi performa model secara otomatis memberikan daftar nilai kriteria performa berdasarkan tugas yang diberikan.

Gambar 4. Implementasi Algoritma Linear Regression

3.4. Evaluasi (Evaluation)

Dari banyaknya jumlah variabel bebas yang ada pada dataset, maka digunakan rumus regresi linier berganda atau Multiple Linear Regression berikut adalah rumus yang digunakan:

𝑌 = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2 … . 𝑏𝑛 𝑋𝑛 (1) Y = variabel dependent (terikat)

X = variabel independet (bebas) a = kontanta (intercept)

b = koefisien

untuk mengetahui nilai dari a dan b, digunakan aplikasi RapidMiner, berdasarkan hasil pengolahan didapatkan hasil sebagai berikut:

Tabel 3. Nilai a dan b

Coefficients

Intercept 0,009

X1 Outgoing Call 0,000

X2 Answer - 0,000

X3 Call Duration - 0,000

X4 Paket Gold 1,007

X5 Paket Silver 0,998

Setelah semua nilai berhasil diketahui kemudian dilakukan pengujian menggunakan aplikasi RapidMiner, didapatkanlah hasil sebagai berikut:

Gambar 5. Hasil Prediksi

Hasil keluaran prediksi menunjukkan prediksi yang dikeluarkan sangat mendekati dengan data yang sebenarnya atau bisa bisa juga dikatakan hasil prediksi yang akurat.

Sebagai perbandingan hasil prediksi, penulis juga sertakan hitung manual berdasarkan rumus regresi nlinier berganda sebagai berikut:

1.

𝑌 = 0,009 + (568 x 0,000) + (128 x − 0,000) + (871 x − 0,000) + (0 x 1,009) + (3 x 0,999)

Y = 2,973

2.

𝑌 = 0,009 + (399 x 0,000) + (74 x − 0,000) + (421 x − 0,000) +

(0 x 1,009) + (0 x 0,999)

Y = -0,004

3.

𝑌 = 0,009 + (632 x 0,000) + (109 x − 0,000) + (631 x − 0,000) + (0 x 1,009) + (1 x 0,999)

Y = 0,990

4.

𝑌 = 0,009 + (259 x 0,000) + (41 x − 0,000) + (188 x − 0,000) +

(0 x 1,009) + (1 x 0,999)

Y = 1.002

(6)

5.

𝑌 = 0,009 + (731 x 0,000) + (140 x − 0,000) + (155 x − 0,000) + (1 x 1,009) + (2 x 0,999)

Y = 2.998

6.

𝑌 = 0,009 + (401 x 0,000) + (71 x − 0,000) + (363 x − 0,000) +

(0 x 1,009) + (0 x 0,999)

Y = -0,002

7.

𝑌 = 0,009 + (215 x 0,000) + (40 x − 0,000) + (215 x − 0,000) +

(1 x 1,009) + (0 x 0,999)

Y = 1.009

8.

𝑌 = 0,009 + (342 x 0,000) + (52 x − 0,000) + (472 x − 0,000) +

(0 x 1,009) + (2 x 0,999)

Y = 1,995

9.

𝑌 = 0,009 + (350 x 0,000) + (54 x − 0,000) + (492 x − 0,000) +

(1 x 1,009) + (0 x 0,999)

Y = 1,006

10.

𝑌 = 0,009 + (423 x 0,000) + (85 x − 0,000) + (663 x − 0,000) +

(0 x 1,009) + (3 x 0,999)

Y = 2,984

11.

𝑌 = 0,009 + (419 x 0,000) + (64 x − 0,000) + (517 x − 0,000) +

(1 x 1,009) + (1 x 0,999)

Y = 2,003

12.

𝑌 = 0,009 + (558 x 0,000) + (79 x − 0,000) + (574 x − 0,000) +

(1 x 1,009) + (3 x 0,999)

Y = 3,999

13.

𝑌 = 0,009 + (351 x 0,000) + (95 x − 0,000) + (711 x − 0,000) +

(3 x 1,009) + (0 x 0,999)

Y = 3,003

14.

𝑌 = 0,009 + (353 x 0,000) + (77 x − 0,000) + (668 x − 0,000) +

(0 x 1,009) + (0 x 0,999)

Y = -0,011

15.

𝑌 = 0,009 + (11 x 0,000) + (3 x − 0,000) + (27 x − 0,000) +

(0 x 1,009) + (1 x 0,999)

Y = 1,006

16.

𝑌 = 0,009 + (897 x 0,000) + (209 x − 0,000) + (572 x − 0,000) + (0 x 1,009) + (0 x 0,999)

Y = -0,025

17.

𝑌 = 0,009 + (642 x 0,000) + (141 x − 0,000) + (276 x − 0,000) + (0 x 1,009) + (1 x 0,999)

Y = 0,987

Tabel 4. Perbandingan Hasil Prediksi No Prediksi

RapidMiner

Prediksi Dengan Rumus

1 2,971 2,973

2 -0,004 -0,004

3 0,988 0,990

4 1,003 1,002

5 2,998 2,998

(7)

6 -0,002 -0,002

7 1,011 1,009

8 1,995 1,995

9 1,006 1,006

10 2,982 2,984

11 2,003 2,003

12 3,998 3,999

13 3,003 3,003

14 -0,012 -0,011

15 1,008 1,006

16 -0,028 -0,025

17 0,986 0,987

Prediksi yang dihasilkan oleh aplikasi RapidMiner dengan hasil dari perhitungan dengan rumus menunjukkan hasil prediksi yang mirip.

Setelah mendapatkan hasil prediksi, kemudian mencari nilai RMSE untuk mengetahui berapakah nilai error dari pemodelan yang diterapkan

Rumus yang digunakan untuk mencari nilai RMSE adalah:

𝑅𝑀𝑆𝐸 = √∑(𝑦𝑖− 𝑦̂𝑖)2

𝑛 (2)

Σ = Summation (jumlah keseluruhan nilai) yi = nilai data aktual

y^i = nilai prediksi n = banyaknya data

Berdasarkan hasil pengujian menggunakan operator performance (regression) pada RapidMiner didapatkan hasil sebagai berikut:

Gambar 6. Nilai RMSE

Berdasarkan hasil dari nilai root mean squared error (RMSE) yang dikeluarkan menunjukkan performa yang dihasilkan cukup bagus karena nilai yang dikeluarkan hampir

mendekati angka 0, hal tersebut menunjukkan bahwa nilai error dari prediksi yang dihasilkan cukup kecil yaitu 0,098 dan hal tersebut juga menunjukkan bahwa model yang digunakan untuk melakukan prediksi memiliki performa yang bagus.

3.5. Penyebaran (Deployment)

Kemudian hasil keluaran prediksi di visualisasikan kedalam Diagram Bar Column sebagai berikut:

Gambar 7. Diagram Bar Coloum

Berdasarkan pola yang dihasilkan dengan Diagram Bar Column menunjukkan hasil prediksi yang akurat. Hal tersebut dapat terlihat dari kemiripan antara pola hasil prediksi dengan pola dari data aktual.

4. KESIMPULAN

Berdasarkan hasil pengujian, diketahui bahwa dari 7 variabel bebas yang ada pada dataset hanya ada 5 variabel yang mempengaruhi hasil prediksi, variabel tersebut adalah Outgoing Call, Answer, Call Duration, Paket Gold dan Paket Silver. Sedangkan variabel No Answer dan Kandidat tidak memberikan pengaruh. Performa yang dihasilkan dengan model algoritma Linear Regression menunjukan performa yang bagus dan hasil prediksi yang akurat dengan nilai Root Mean Squared Error (RMSE) sebesar 0,098.

Malalui penelitian ini prediksi member baru di masa mendatang dapat dilakukan dengan mudah dan cepat.

5. REFERENSI

[1] yohana T. Utami, D. A. Shofiana, and Y.

Heningtyas, “Penerapan Algoritma C4.5

(8)

Untuk Prediksi Churn Rate Pengguna Jasa Telekomunikasi,” J. Komputasi, vol. 8, no. 2, pp. 69–76, 2020, doi:

10.23960/komputasi.v8i2.2647.

[2] N. K. Afkarina, A. W. Widodo, and M. T.

Furqon, “Implementasi Regresi Linier Berganda Untuk Prediksi Jumlah Peminat Mata Kuliah Pilihan,” J. Pengemb.

Teknol. Inf. Dan Ilmu Komun., vol. 3, no.

11, pp. 10462–10467, 2019.

[3] M. A. Hasanah, S. Soim, and A. S.

Handayani, “Implementasi CRISP-DM Model Menggunakan Metode Decision Tree dengan Algoritma CART untuk Prediksi Curah Hujan Berpotensi Banjir,”

J. Appl. Informatics Comput., vol. 5, no.

2, pp. 103–108, 2021, doi:

10.30871/jaic.v5i2.3200.

[4] N. R. Lase and F. Riandari, “Perancangan Aplikasi Prediksi Jumlah Pendaftar Siswa Baru Dengan Metode Regresi Linier (Studi Kasus: SMA RK Deli Murni Bandar Baru),” J. Nas. Komputasi dan Teknol. Inf., vol. 3, no. 3, pp. 330–334, 2020, doi: 10.32672/jnkti.v3i3.2520.

[5] J. Adhiva, Mustakim, S. A. Putri, and S.

G. Setyorini, “Prediksi Hasil Produksi Kelapa Sawit Menggunakan Model Regresi Pada PT . Perkebunan Nusantara V,” Semin. Nas. Teknol. Informasi, Komun. dan Ind., pp. 155–162, 2020.

[6] A. D. Alfarizi and A. Andri,

“Pemanfaatan Data Mining Dalam Memprediksi Produksi Pada PT Pupuk Sriwidjaja Palembang Menggunakan Algoritma Regresi Liniear Berganda,” J.

Nas. Ilmu Komput., vol. 2, no. 1, pp. 51–

63, 2021, doi:

10.47747/jurnalnik.v2i1.522.

[7] A. Amrin, “Data Mining Dengan Regresi Linier Berganda Untuk Peramalan Tingkat Inflasi,” J. Techno Nusa Mandiri, vol. XIII, no. 1, pp. 74–79, 2016, [Online].

Available:

http://ejournal.nusamandiri.ac.id/ejurnal/i ndex.php/techno/article/view/268

[8] F. H. Hamdanah and D. Fitrianah,

“Analisis Performansi Algoritma Linear Regression dengan Generalized Linear Model untuk Prediksi Penjualan pada Usaha Mikra, Kecil, dan Menengah,” J.

Nas. Pendidik. Tek. Inform., vol. 10, no. 1,

p. 23, 2021, doi:

10.23887/janapati.v10i1.31035.

[9] E. P. Ariesanto Akhmad, “Data Mining Menggunakan Regresi Linear untuk Prediksi Harga Saham Perusahaan Pelayaran,” J. Apl. Pelayaran dan Kepelabuhanan, vol. 10, no. 2, p. 120, 2020, doi: 10.30649/japk.v10i2.83.

[10] M. Zunaidi, A. H. Nasyuha, and S. M.

Sinaga, “Penerapan Data Mining Untuk Memprediksi Pertumbuhan Jumlah Penderita Human Immunodeficiency Virus (HIV) Menggunakan Metode Multiple Linier Regression (Studi Kasus Dinas Kesehatan Provinsi Sumatera Utara),” J-SISKO TECH (Jurnal Teknol.

Sist. Inf. dan Sist. Komput. TGD), vol. 3, no. 1, p. 137, 2020, doi:

10.53513/jsk.v3i1.205.

[11] R. A. Samosir, M. F. Rozy, and A. P.

Windarto, “Penerapan Algoritma Regresi Linier Berganda dalam Mengestimasi Jumlah Perceraian di Pengadilan Agama Simalungun,” TIN Terap. Inform.

Nusant., vol. 2, no. 1, pp. 16–20, 2021,

[Online]. Available:

https://ejurnal.seminar- id.com/index.php/tin

[12] N. Nazeriandy, Y. Syahra, and M.

Syaifudin, “Penerapan Data Mining Untuk Memprediksi Penggunaan Daya Listrik Pada PT.PLN (Persero) Rayon Medan Selatan Dengan Menggunakan Metode Regresi Linier Berganda,” J.

SAINTIKOM (Jurnal Sains Manaj.

Inform. dan Komputer), vol. 20, no. 1, p.

20, 2021, doi: 10.53513/jis.v20i1.2431.

[13] A. Bode, “Perbandingan Metode Prediksi Support Vector Machine Dan Linear Regression Menggunakan Backward Elimination Pada Produksi Minyak

(9)

Kelapa,” Simtek J. Sist. Inf. dan Tek.

Komput., vol. 4, no. 2, pp. 104–107, 2019, doi: 10.51876/simtek.v4i2.57.

[14] Tahyani, A. S. Sunge, and M.

Wangsadanureja, “Penerapan Data Mining Untuk Mempermudah Produksi Diapers Dengan Menggunakan Algoritma Regresi Linier,” Pros. SAINTEK Sains dan Teknol., vol. 1, no. 1, pp. 176–179, 2022.

[15] M. Fahlepi and A. Widjaja, “Penerapan Metode Multiple Linear Regression Untuk Prediksi Harga Sewa Kamar Kost,”

J. Strateg., vol. 1, no. November, pp. 615–

629, 2019.

[16] Y. Supriyanto, M. Ilhamsyah, and U. Enri,

“Prediksi Harga Minyak Kelapa Sawit Menggunakan Linear Regression Dan Random Forest,” J. Ilm. Wahana Pendidik.

https//jurnal.unibrah.ac.id/index.php/JIW P, vol. 7, no. 1, 2021, doi:

10.5281/zenodo.6559603.

[17] Amiruddin and R. Ishak, “Prediksi Jumlah Mahasiswa Registrasi Per Semester Menggunakan Linier Regresi Pada Universitas Ichsan Gorontalo,” Ilk. J. Ilm., vol. 10, no. 2, pp. 136–143, 2018, doi:

10.33096/ilkom.v10i2.274.136-143.

[18] S. Widaningsih, “Perbandingan Metode Data Mining Untuk Prediksi Nilai Dan Waktu Kelulusan Mahasiswa Prodi Teknik Informatika Dengan Algoritma C4,5, Naïve Bayes, Knn Dan Svm,” J.

Tekno Insentif, vol. 13, no. 1, pp. 16–25, 2019, doi: 10.36787/jti.v13i1.78.

[19] F. Rolansa, Y. Yunita, and S. Suheri,

“Sistem prediksi dan evaluasi prestasi akademik mahasiswa di Program Studi Teknik Informatika menggunakan data mining,” J. Pendidik. Inform. dan Sains, vol. 9, no. 1, p. 75, 2020, doi:

10.31571/saintek.v9i1.1696.

[20] R. Maulana and D. Kumalasari, “Analisis Dan Perbandingan Algoritma Data Mining Dalam Prediksi Harga Saham

Ggrm,” J. Inform. Kaputama, vol. 3, no.

1, pp. 22–28, 2019, [Online]. Available:

https://finance.yahoo.com/quote/GGRM.

J

Referensi

Dokumen terkait

Hal ini disimpulkan bahwa algoritma apriori dapat digunakan untuk perancangan program aplikasi data warehouse dan data mining untuk memprediksi pola pembelian produk dan

Penelitian ini menghasilkan sebuah aplikasi berbasis web untuk memprediksi produksi padi di Kabupaten Bantul dengan Algoritma Regresi Linear Berganda dengan

Dari permasalahan yang telah diuraikan diatas, maka penulis akan mengimplementasikan metode data mining dengan menggunakan algoritma klasifikasi C4.5 kedalam sebuah

Salah satu cara mengatasi masalah ini adalah dengan menggunakan Data Mining (DM) dengan teknik klasifikasi algoritma C4.5. Data mining dapat digunakan untuk

Dalam penelitian ini yang berjudul “Implementasi Data Mining Untuk Memprediksi Masa Studi Mahasiswa Menggunakan Algotitma C4.5 (Studi Kasus: Universitas Dehasen

Maka dapat diberi kesimpulan bahwa dalam mengimplementasikan klasifikasi dataset Diabetes Prediction Using Logistic Regression untuk memprediksi diabetes dengan memakai algoritma

Tujuan dari penelitian ini yaitu keadaan kesehatan seseorang menderita diabetes atau tidak berdasarkan data yang didapatkan serta nilai root mean square error RMSE yang diperoleh dari

Data Mining Algoritma Nearest Neighbor Untuk Memprediksi Tingkat Resiko Pinjaman Dana Di Bank Perkreditan Rakyat Gambar 8 Proses Nearest Neighbor Dengan melakukan analisa dengan