13
BAB III
METODOLOGI PENELITIAN
3.1 Tahapan Penelitian
Menurut (Sugiyono, 2016) Dalam proses melakukan penelitian, tahap penelitian tentu dari suatu penelitian itu sendiri ada 4 tahapan penelitian dalam pelaksanaan penelitian terdiri dari :
Sumber : Hasil Pengolahan Data (2019)
Gambar 3.1 Tahapan Penelitian
Mulai
Studi awal
Pengolahan datadengan Data mining
Pengumpulan Data
Kesimpulan dan Saran Analisa Hasil
Untuk menentukan hasil penelitian yang tepat, peneliti melakukan tahapan penelitian sebagai berikut:
1. Studi Awal
Langkah awal dari penelitian ini adalah dengan mempelajari masalah yang ada pada di CV.ARSA kemudian menentukan ruang lingkup masalah, latar belakang masalah, dan mempelajari yang berkaitan dengan permasalahan dan bagaimana mencari solusi dari masalah yang terjadi.
2. Pengumpulan Data
Melakukan wawancara, observasi di CV.ARSA. Untuk mengetahui informasi yang dibutuhkan penulis melakukan pengumpulan data .
3. Pengolahan Data dengan Data Mining
Pada tahap pengolahan data terlebih dahulu melakukan identifikasi masalah yang ada dan sering dihadapi oleh CV. ARSA. Tahap selanjutnya dilakukan analisis masalah dengan tujuan agar penulis mengetahui dan memperoleh gambaran yang jelas bagaimana bentuk penyelesaian dan algoritma apa yang dapat digunakan untuk penyelesaian. Dan penulis menggunakan teknik data mining dengan algoritma Naïve Bayes untuk mendapatkan hasil, sebagai tujuan yang akan dicapai oleh peneliti yang kemudian dapat dijadikan pihak CV. ARSA sebagai pengetahuan dalam meningkatkan penjualan. 4. Analisis Hasil
Penulis melakukan analisis hasil menggunakan aplikasi rapid miner atau aplikasi data mining serta algoritma naïve bayes.
Tahapan ini merupakan kesimpulan dari penelitian yang dilakukan di CV.ARSA terkait usulan rancangan perbaikan dalam mengklasifikasi data penjualan.
3.2. Instrument Penelitian
Berdasarkan jenis data yang didapat oleh penulis dalam penelitian ini, penulis menggunakan metode kuantitatif dengan menggunakan metode penelitian deskriptif untuk menggambarkan hasil penelitian yang dilakukan. Metodologi penelitian kuantitatif dimana menggunakan data numerik dan menekankan proses penelitian pada pengukuran hasil yang objektif menggunakan analisis statistik.
Menurut (Sugiyono, 2018) metode kuantitatif adalah data penelitian berupa angka-angka dan analisis meggunakan statistik. Menurut (Sugiyono, 2016) Dalam penelitian kuantitatif populasi adalah wilayah generalisasi yang terdiri atas subyek atau obyek dengan kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulan nya. Populasi bisa berupa subyek maupun obyek penelitian. Populasi juga bisa berupa manusia, tumbuhan, hewan, produk, bahkan dokumen. Jadi, populasi bukan hanya orang tetapi juga obyek dan benda alam lain. Populasi pun bukan sekedar jumlah pada subyek atau obyek yang dipelajari tetapi meliputi seluruh karakteristik atau sifat yang dimiliki oleh subyek atau obyek.
Menurut (Sugiyono, 2016) metodologi penelitian kuantitatif yang dilakukan penulis instrumen adalah suatu alat yang digunakan mengukur fenomena alam maupun sosial yang diamati. Adapun alat yang digunakan dalam penelitian ini adalah:
1. Perangkat Keras (Hardware) a.Notebook
2. Perangkat Lunak (Software) a.Sistem Operasi Windows 16 b.Micorosoft Excel 2016 c.Aplikasi Rapid maner 5.2
3.3. Metode Pengumpulan data, Populasi dan Sample Penelitian 3.3.1 Metode Pengumpulan Data
Menurut (Sugiyono, 2018) Metode pengumpulan data adalah teknik ataupun cara yang digunakan penulis untuk mengumpulkan data yang nantinya data tersebut akan digunakan oleh penulis untuk memperoleh bahan, keterangan, dan informasi terkait dengan penelitian ini. Dalam penelitian untuk pengumpulan data berdasarkan dengan sumber. Berikut ini da dua jenis pengumpulan data bersadarkan sumbernya:
1. Sumber Primer
Sumber primer adalah sumber data yang langsung memberikan data kepada pengumpul data. Sumber primer diperoleh oleh penulis dalam penelitian ini yaitu dengan meminta data file yang sudah ada kepada CV. ARSA.
2. Sumber Sekunder
Sumber sekunder merupakan sumber yang tidak langsung memberikan data kepada pengumpul data, contohnya lewat orang lain atau lewat dokumen. Dalam penelitian ini penulis mengumpulkan data-data dan informasi yang diperlukan dengan cara membaca buku, jurnal, artikel, data dari internet, skripsi maupun tesis penelitian yang terkait.
Teknik pengumpulan data dalam penelitian sebagai berikut; 1. Studi Literatur
Studi literatur yang digunakan dalam penulisan Penelitian ini adalah mengumpulkan bahan referensi mengenai metode klasifikasi dari berbagai buku, jurnal, dan beberapa referensi lainnya.
2. Observasi
Peneliti melakukan observasi pada CV. ARSA. Kegiatan yang dilakukan adalah pengumpulan data yang dilakukan dengan pengamatan atau peninjauan langsung terhadap sumber permasalahan serta berkomunikasi langsung dengan pihak perusahaan .
3. Wawancara
Penulis melakukan wawancara langsung dengan Bapak Aris sebagai sebagai komisaris . Teknik pengumpulan data dengan cara mengadakan tanya jawab secara langsung kepada manajemen CV. ARSA.
3.3.2. Populasi dan Sampel
1. Populasi
Menurut (Sugiyono, 2018) mengartikan populasi sebagai wilayah generalisasi yang terdiri atas subyek atau objek yang mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya. Berdasarkan pengertian populasi di atas, maka yang akan dijadikan populasi dalam penelitian ini adalah konsumen yang pernah melakukan pembelian pada CV. ARSA.
2. Sampel
Menurut (Sugiyono, 2018) sampel adalah bagian dari jumlah dan karakteristik yang dimiliki oleh populasi tersebut. Ada dua teknik penarikan sampel dari populasi, yaitu: (1) Probability Sampling dan (2) Nonprobability Sampling.
Menurut (Sugiyono, 2017) beberapa teknik dalam pengambilan sampel untuk melakukan penelitian, teknik sampel merupakan teknik pengambilan sampel untuk menentukan sampel yang akan dipakai dalam penelitian, beberapa teknik sampling yang digunakan. Dibagi menjadi dua kelompok yaitu probability
sampling dan non probability sampling. Pada penelitian ini, peneliti
menggunakan probability sampling.
Probability sampling adalah suatu teknik pengambilan sampel yang sering
meluangkan kesempatan atau peluang bagi anggota populasi dan akan dipilih menjadi sampel, berikut beberapa probability sampling yang terdiri dari simple
random sampling, proponate stratified random sampling, disproportionate stratified random, sampling area (cluster) sampling. Dengan ini peneliti
menggunakan simple random sampling yaitu sesuatu pengambilan anggota sampel dari suatu populasi dan dilakukan dengan cara acak.
3.4. Metode Analisis Data
Pada dasarnya, metode analisisndata dalam metode Naïve bayes meliputi:
1. Analisa permasalahan. Berkaitan dengan mengidentifikasi kebutuhan dalam suatu penelitian. Akan dijelaskan mengenai permasalahan yang terjadi dan bagaimana tahap penyelesaian masalah tersebut.
2. Analisa kebutuhan data Akan di jelaskan mengenai data-data apa saja yang diperlukan dalam penelitian ini.
a. Hitung P(Ci) untuk setiap kelas
b. Hitung P(X|Ci) untuk setiap kriteria dan setiap kelas c. Cari P(X|Ci) yang paling besar menjadi kesimpulan d. Tampilkan hasil Kalsifikasi
e. Selesai
4. Analisa metode naïve bayes Teorema Bayes memiliki bentuk umum sebagai berikut:
( | ) ( | ) ( )
( ) ( )
Keterangan rumus:
X = Data dengan class yang belum diketahui
Ci = Hipotesis data X merupakan suatu class spesifik
P(Ci|X) = Probabilitas hipotesis Ci berdasarkan kondisi x (posteriori prob) P(Ci) = Probabilitas hipotesis Ci (prior prob)
P(X|Ci) = Probabilitas X berdasarkan kondisi tersebut
P(X) = Probabilitas dari X bernilai sama untuk semua kelas (tuple X memiliki probalitas yang sama untuk masuk ke dalam kelas manapun, maka yang di maksimalkan adalah ( | ) ( ).
Untuk menentukan atau memprediksi pilihan kelas, digunakan peluang maksimal dari seluruh kelas dengan fungsi:
Argamax Ci
( | ) ( )
Karena nilai P(X) konstan untuk semua kelas, maka P(X) dapat diabaikan sehingga menghasilkan fungsi:
( ) ( | ) ( ) ( )
Keterangan rumus :
Fc(X) = output hasil klasifikasi naive bayes argmax
Ci = nilai mak dari kelas
P(Ci) = peluang dari kategori yang diberikan
P(X|Ci) = kategori pada suatu class.
3.4.1. Pengukuran Performance
Pada tahap ini melakukan pengukuran performansi sistem classifier yang dibangun untuk mengetahui tingkat akurasi dengan menggunakan parameter performansi. Parameter performansi yang digunakan yaitu diantaranya nilai
Accuracy, Sensitivity, Precision, Ppv, dan Recall.
Kategori
True Value True False
Hasil True TP FP
Klasifikasi False FN TN
Gambar 3.2 Confussion Matrix
Kategori True Value True False Hasil klasifikasi True (TP dan FP) False (FN dan TN) gambar 3.1 menunjukkan bahwa hasil klasifikasi benar sesuai dengan keputusan sistem (TP) dan Klasifikasi salah menurut sistem (FP), sedangkan dokumen yang
tidak termasuk dalam hasil klasifikasi kategori, adakalanya memang bukan anggota dari kategori itu (TN) dan adakalanya ternyata seharusnya menjadi anggota kategori tersebut (FN). Keempat parameter di atas digunakan untuk menghitung 5 metode evaluasi berikut:
1. Recall/Npv
Yaitu perbandingan jumlah dokumen yang relevan terkenali dengan jumlah seluruh dokumen relevan. Recall memiliki rumusan sebagai berikut :
( )
2. Precision / Specificity
Perbandingan jumlah dokumen yang relevan dengan jumlah dokumen yang terkenali. Atau kebenaran memprediksi negatif dibandingkan dengan keseluruhan data negatif, dan hasil prediksi tidak dalam sebuah data. Berikut persamaanya :
( )
3. Accuracy
didefinisikan sebagai tingkat kedekatan antara nilai prediksi dengan nilai aslinya. Akurasi digunakan untuk mengevaluasi banyaknya label prediksi yang sesuai dengan label aktual. Semakin besar nilai akurasinya, maka semakin baik performansi klasifikasi. Berikut persamaannya:
4. Sensitivity
Merupakan pengukuran proporsi true positive yang di definisikan dengan benar. Berikut persamaanya :
( )
5. Positive Predictive Value (PPV)
Merupakan sebuah pengukuran untuk mengetahui probalitas yang bernilai benar. Berikut persamaanya: