23
BAB IV
HASIL DAN PEMBAHASAN
4.1. Hasil Penelitian
Pada penelitian ini digunakan berbagai macam data, diantaranya data Traning, data Testing. Data Traning digunakan untuk membentuk sebuah model klasifikasi.
Model ini merupakan representasi pengetahuan yang akan digunakan untuk prediksi dokumen data baru yang belum pernah ada. Data ini akan digunakan sebagai proses mining berupa 115 data. Dan data Testing dari data training dengan jumlah data 34 data.
4.1.1 Data Penjualan
Data penjualan dapat semakin bertambah setiap harinya dan akan menumpuk, sayang jika tidak di manfaatkan secara maksimal untuk penelitian, oemasaran dan penjualan dapat memperbaiki kukurangan dalam sistem yang saat ini sedang digunakan. Data juga tidak harus di arsip dalam perusahaan, tetapi dapat di olah menjadi informasiyang penting bagi perusahaan. Berikut adalah data penjualan beras pada CV. Arsa yang akan di klasifikasikan menggunakan naïve bayes sesuai dengan kualitas berasnya .
Data ini juga memiliki atribut label Minat pelanggan dengan kategori Ya atau Tidak . dalam data ini hanya mecakup 4 kriteria, diantaranya yaitu:
a. Kriteria 1 = Menjelaskan tentang kriteria “Jenis Beras”
b. Kriteria 2 = Menjelaskan tentang kriteria “Kualitas ”
c. Kriteria 3 = Menjelaskan tentang kriteria “Ukuran Karung “ d. Kriteria 4 = Menjelaskan tentang kriteria “Harga “
Tahap awal cara kerja dari proses perhitungan Naive Bayes adalah dengan cara melakukan pengambilan data training dari penjualan beras sebanyak 115 data.
Adapun variabel penentu yang digunakan dalam mengklasifikasikan data yaitu:
1. Jenis Beras
Merupakan Variabel yang di kelompokan dengan tiga kategori yaitu beras super, premium, dan medium. Beras super terdiri dari beras Rojo lele, ARS, SriJati.
Beras Premium Terdiri dari Beras Cianjur, sedangan medium terdiri dari Beras jampang
Gambar 4.1 Kriteria Jenis Beras
2. Kualitas
Dalam penjualan beras ada variabel yang dikelompokan menjadi dua kategori yaitu kualitas sangat bagus,dan kualitas bagus yang membedakan kualitas sesuai jenis beras dan harga .
3. Ukuran Karung
Merupakan variabel ukuran karung yang terdiri dari tiga kategori yaitu Besar dengan ukuran 25 kg,, Sedang dengan ukuran 10 kg, dan kecil dengan ukurang 5kg.
Jenis Beras
Super (Rojo lele, ARS ,SriJati )
Premium ( Cianjur )
Medium ( Brs. Jampang )
Gambar 4.2 Kriteria Ukuran Karung
4. Harga
Merupakan variabel jenis harga penjualan beras yang di kelompokan dengan tiga kategori yaitu tinggi, sedang, dan rendah.
Adapun kategori tersebut mempunyai nilai batas ambang yaitu:
a. Kategori “Tinggi” mulai dari harga 300.000.00 s/d Rp 250.000.00 b. Kategori “Sedang” mulai dari harga 240.000.00 s/d Rp 110.000.00 c. Ketegori “Rendah” mulai dari harga Rp 105.000.00 s/d Rp 50.000.00
Gambar 4.3 Kriteria Harga
4.2. Perhitungan Manual
Pehitungan data manual sanggat penting dalam penelitian , karena
perhitungan manual butuh ketelitian dalam menghitung data yang ada, perhitungan Ukuran Karung
Besar (25kg)
Sedang (15kg – 10 kg)
kecil (5kg)
Harga
Tinggi (300.000 - 250.000)
Sedang (240.000 - 110.000)
Rendah (105.000 - 50.000)
manual ini dilakukan untuk menentukan nilai hitung yg dibutuhkan dan dapat menyumpulkan sesuai hasil data yang ada. Berikut hitungan dengan menggunakan microsoft excel.
4.2.1. Menghitung Data Penjualan 1. Data Penjualan Beras Super
Data dibawah ini menunjukan beras super berkualitas sangat bagus dengan ukuran karung besar, harga tinggi dengan kategori minat pelanggan (tidak) berjumlah 8 data dari 115 data yang ada . Maka jumlah keseluruhan 8/115 = 0.69 sama dengan 7% minat pelanggan dengan kategori (tidak) dalam penjualan beras super dengan kualitas sangat bagus.
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan 1 Super Sangat Bagus Besar Tinggi Tidak
2 Super Sangat Bagus Besar Tinggi Tidak 3 Super Sangat Bagus Besar Tinggi Tidak 4 Super Sangat Bagus Besar Tinggi Tidak 5 Super Sangat Bagus Besar Tinggi Tidak 6 Super Sangat Bagus Besar Tinggi Tidak 7 Super Sangat Bagus Besar Tinggi Tidak 8 Super Sangat Bagus Besar Tinggi Tidak
Tabel.4.1 Data Beras Super 1
Data dibawah ini menunjukan beras super berkualitas sangat bagus dengan ukuran karung sedang, harga sedang dengan kategori minat pelanggan (tidak) berjumlah 1 data dari 115 data yang ada . Maka jumlah keseluruhan 1/115 = 0,0089 sama dengan 1% minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan 1 Super Sangat Bagus Sedang Sedang Ya
Tabel.4.2 Data Beras Super 2
Data dibawah ini menunjukan beras super berkualitas bagus dengan ukuran karung besar, harga tinggi dengan kategori minat pelanggan (ya) berjumlah 2 data dari 115 data yang ada . Maka jumlah keseluruhan 2/115 = 0,0179 sama dengan 2%
minat pelanggan dengan kategori (ya).
Tabel.4.3 Data Beras Super 3
Data dibawah ini menunjukan beras super berkualitas bagus dengan ukuran karung besar, harga rendah dengan kategori minat pelanggan (ya) berjumlah 2 data dari 115 data yang ada . Maka jumlah keseluruhan 2/115 = 0,0179 sama dengan 2%
minat pelanggan dengan kategori (ya).
Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Super Bagus Besar Rendah Ya
2 Super Bagus Besar Rendah Ya
Tabel.4.4 Data Beras Super 4
Data dibawah ini menunjukan beras super berkualitas bagus dengan ukuran karung sedang, harga sedang dengan kategori minat pelanggan (ya) berjumlah 32 data dari 115 data yang ada . Maka jumlah keseluruhan 32/115 = 0,278 sama dengan 28 % minat pelanggan dengan kategori (ya).
No Jenis Kualitas Ukuran Harga Minat
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Super Bagus Besar Tinggi Ya
2 Super Bagus Besar Tinggi Ya
Beras karung Pelanggan
1 Super Bagus Sedang Sedang Ya
2 Super Bagus Sedang Sedang Ya
3 Super Bagus Sedang Sedang Ya
4 Super Bagus Sedang Sedang Ya
5 Super Bagus Sedang Sedang Ya
6 Super Bagus Sedang Sedang Ya
7 Super Bagus Sedang Sedang Ya
8 Super Bagus Sedang Sedang Ya
9 Super Bagus Sedang Sedang Ya
10 Super Bagus Sedang Sedang Ya
11 Super Bagus Sedang Sedang Ya
12 Super Bagus Sedang Sedang Ya
13 Super Bagus Sedang Sedang Ya
14 Super Bagus Sedang Sedang Ya
15 Super Bagus Sedang Sedang Ya
16 Super Bagus Sedang Sedang Ya
17 Super Bagus Sedang Sedang Ya
18 Super Bagus Sedang Sedang Ya
19 Super Bagus Sedang Sedang Ya
20 Super Bagus Sedang Sedang Ya
21 Super Bagus Sedang Sedang Ya
22 Super Bagus Sedang Sedang Ya
23 Super Bagus Sedang Sedang Ya
24 Super Bagus Sedang Sedang Ya
25 Super Bagus Sedang Sedang Ya
26 Super Bagus Sedang Sedang Ya
27 Super Bagus Sedang Sedang Ya
28 Super Bagus Sedang Sedang Ya
29 Super Bagus Sedang Sedang Ya
30 Super Bagus Sedang Sedang Ya
31 Super Bagus Sedang Sedang Ya
32 Super Bagus Sedang Sedang Ya
Tabel.4.5 Data Beras Super 5
Data dibawah ini menunjukan beras super berkualitas bagus dengan ukuran karung kecil, harga rendah dengan kategori minat pelanggan (ya) berjumlah 2 data dari 115 data yang ada . Maka jumlah keseluruhan 2/115 = 0,00179 sama dengan 2%
minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Super Bagus Kecil Rendah Ya
2 Super Bagus Kecil Rendah Ya
Tabel.4.6 Data Beras Super 6
Data dibawah ini menunjukan beras super berkualitas bagus dengan ukuran karung kecil, harga sedang dengan kategori minat pelanggan (ya) berjumlah 2 data dari 115 data yang ada . Maka jumlah keseluruhan 2/115 = 0,0179 sama dengan 2%
minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Super Bagus Kecil Sedang Ya
2 Super Bagus Kecil Sedang Ya
Tabel.4.7 Data Beras Super 7
2. Data Penjualan Beras Premium
Data dibawah ini menunjukan beras premium berkualitas sangat bagus dengan ukuran karung besar, harga tinggi dengan kategori minat pelanggan (tidak) berjumlah 15 data dari 115 data yang ada . Maka jumlah keseluruhan 15/115 = 0,013 sama dengan 13% minat pelanggan dengan kategori (tidak).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan 1 Premium Sangat Bagus Besar Tinggi Tidak
2 Premium Sangat Bagus Besar Tinggi Tidak 3 Premium Sangat Bagus Besar Tinggi Tidak 4 Premium Sangat Bagus Besar Tinggi Tidak 5 Premium Sangat Bagus Besar Tinggi Tidak 6 Premium Sangat Bagus Besar Tinggi Tidak 7 Premium Sangat Bagus Besar Tinggi Tidak 8 Premium Sangat Bagus Besar Tinggi Tidak 9 Premium Sangat Bagus Besar Tinggi Tidak
10 Premium Sangat Bagus Besar Tinggi Tidak 11 Premium Sangat Bagus Besar Tinggi Tidak 12 Premium Sangat Bagus Besar Tinggi Tidak 13 Premium Sangat Bagus Besar Tinggi Tidak 14 Premium Sangat Bagus Besar Tinggi Tidak 15 Premium Sangat Bagus Besar Tinggi Tidak
Tabel.4.8 Data Beras Premium 1
Data dibawah ini menunjukan beras premium berkualitas sangat bagus dengan ukuran karung sedang, harga sedang dengan kategori minat pelanggan (ya) berjumlah 6 data dari 115 data yang ada . Maka jumlah keseluruhan 6/115 = 0,0521 sama dengan 5% minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan 1 Premium Sangat Bagus Sedang Sedang Ya
2 Premium Sangat Bagus Sedang Sedang Ya 3 Premium Sangat Bagus Sedang Sedang Ya 4 Premium Sangat Bagus Sedang Sedang Ya 5 Premium Sangat Bagus Sedang Sedang Ya 6 Premium Sangat Bagus Sedang Sedang Ya
Tabel.4.9 Data Beras Premium 2
Data dibawah ini menunjukan beras premium ,kualitas sangat bagus dengan ukuran karung sedang, harga rendah dengan kategori minat pelanggan (tidak) berjumlah 3 data dari 115 data yang ada . Maka jumlah keseluruhan 3/115 = 0,0260 sama dengan 3% minat pelanggan dengan kategori (tidak).
No Jenis Beras Kualitas Ukuran
karung Harga Minat
Pelanggan 1 Premium Sangat Bagus Sedang Rendah Tidak 2 Premium Sangat Bagus Sedang Rendah Tidak 3 Premium Sangat Bagus Sedang Rendah Tidak
Tabel.4.10 Data Beras Premium 3
Data dibawah ini menunjukan beras premium berkualitas bagus dengan ukuran karung besar, harga sedang dengan kategori minat pelanggan (ya) berjumlah 2 data dari 115 data yang ada . Maka jumlah keseluruhan 2/115 = 0,0179 sama dengan 2% minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Premium Bagus Besar Sedang Ya
2 Premium Bagus Besar Sedang Ya
Tabel.4.11 Data Beras Premium 4
Data dibawah ini menunjukan beras premium berkualitas bagus dengan ukuran karung sedang, harga sedang dengan kategori minat pelanggan (ya) berjumlah 4 data dari 115 data yang ada . Maka jumlah keseluruhan 4/115 = 0,0347 sama dengan 4% minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Premium Bagus Sedang Sedang Ya
2 Premium Bagus Sedang Sedang Ya
3 Premium Bagus Sedang Sedang Ya
4 Premium Bagus Sedang Sedang Ya
Tabel.4.12 Data Beras Premium 5
Data dibawah ini menunjukan beras premium berkualitas bagus dengan ukuran karung sedang, harga rendah dengan kategori minat pelanggan (tidak) berjumlah 4 data dari 115 data yang ada . Maka jumlah keseluruhan 4/115 = 0,0347 sama dengan 4% minat pelanggan dengan kategori (tidak).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Premium Bagus Sedang Rendah Tidak
2 Premium Bagus Sedang Rendah Tidak
3 Premium Bagus Sedang Rendah Tidak
4 Premium Bagus Sedang Rendah Tidak
Tabel.4.13 Data Beras Premium 6
Data dibawah ini menunjukan beras premium kualitas bagus dengan ukuran karung kecil, harga rendah dengan kategori minat pelanggan (ya) berjumlah data 10 dari 115 data yang ada . Maka jumlah keseluruhan 10/115 = 0,0869 sama dengan 9%
minat pelanggan dengan kategori (ya).
No Jenis Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Premium Bagus Kecil Rendah Ya
2 Premium Bagus Kecil Rendah Ya
3 Premium Bagus Kecil Rendah Ya
4 Premium Bagus Kecil Rendah Ya
5 Premium Bagus Kecil Rendah Ya
6 Premium Bagus Kecil Rendah Ya
7 Premium Bagus Kecil Rendah Ya
8 Premium Bagus Kecil Rendah Ya
9 Premium Bagus Kecil Rendah Ya
10 Premium Bagus Kecil Rendah Ya
Tabel.4.14 Data Beras Premium 7
3. Data Penjualan Beras Medium
Data dibawah ini menunjukan beras medium berkualitas sangat bagus dengan ukuran karung besar, harga tinggi dengan kategori minat pelanggan (tidak) berjumlah 8 data dari 115 data yang ada . Maka jumlah keseluruhan 8/115 = 0,0695 sama dengan 7% minat pelanggan dengan kategori (tidak).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Medium Sangat Bagus Besar Tinggi Tidak
2 Medium Sangat Bagus Besar Tinggi Tidak
3 Medium Sangat Bagus Besar Tinggi Tidak
4 Medium Sangat Bagus Besar Tinggi Tidak
5 Medium Sangat Bagus Besar Tinggi Tidak
6 Medium Sangat Bagus Besar Tinggi Tidak
7 Medium Sangat Bagus Besar Tinggi Tidak
8 Medium Sangat Bagus Besar Tinggi Tidak
Tabel.4.15 Data Beras Medium 1
Data dibawah ini menunjukan beras medium berkualitas sangat bagus dengan ukuran karung sedang, harga tinggi dengan kategori minat pelanggan (tidak) berjumlah 2 data dari 115 data yang ada . Maka jumlah keseluruhan 2/115 = 0,00179 sama dengan 2% minat pelanggan dengan kategori (tidak).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan 1 Medium Sangat Bagus Sedang Tinggi Tidak
2 Medium Sangat Bagus Sedang Tinggi Tidak
Tabel.4.16 Data Beras Medium 2
Data dibawah ini menunjukan beras medium berkualitas bagus dengan ukuran karung besar, harga tinggi dengan kategori minat pelanggan (ya) berjumlah 4 data dari 115 data yang ada . Maka jumlah keseluruhan 4/115 = 0,0347 sama dengan 4% minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Medium Bagus Besar Tinggi Ya
2 Medium Bagus Besar Tinggi Ya
3 Medium Bagus Besar Tinggi Ya
4 Medium Bagus Besar Tinggi Ya
Tabel.4.17 Data Beras Medium 3
Data dibawah ini menunjukan beras medium berkualitas bagus dengan ukuran karung sedang, harga sedang dengan kategori minat pelanggan (ya) berjumlah 6 data dari 115 data yang ada . Maka jumlah keseluruhan 6/115 = 0,0521 sama dengan 5% minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Medium Bagus Sedang Sedang Ya
2 Medium Bagus Sedang Sedang Ya
3 Medium Bagus Sedang Sedang Ya
4 Medium Bagus Sedang Sedang Ya
5 Medium Bagus Sedang Sedang Ya
6 Medium Bagus Sedang Sedang Ya
Tabel.4.18 Data Beras Medium 4
Data dibawah ini menunjukan beras medium berkualitas bagus dengan ukuran karung kecil, harga rendah dengan kategori minat pelanggan (ya) berjumlah 2 data dari 115 data yang ada . Maka jumlah keseluruhan 2/115 = 0,0179 sama dengan 2% minat pelanggan dengan kategori (ya).
No Jenis
Beras Kualitas Ukuran
karung Harga Minat
Pelanggan
1 Medium Bagus Kecil Rendah Ya
2 Medium Bagus Kecil Rendah Ya
Tabel.4.19 Data Beras Medium 5
Hasil Data penjualan di atas menunjukan klasifikasi kualitas beras yang paling banyak di minati adalah beras super dengan kualitas sedang, ukuran karung sedang dan harga sedang mencapai 28 %. Dan klasifikasi kualitas beras yang tidak di minati adalah beras premium kualitas sangat bagis, ukuran karung besar, harga sangat tinggi mencapai 13%
4.2.2. Menghitung Probabilitas Prior
Percobaan yang dilakukan yaitu dengan melakukan perhitungan Probabilitas Prior dan Probabilitas Posterior dengan penggunaan data sebanyak 115 record data.
Terdapat dua class dari hasil Probabilitas Prior yaitu class Minat serta class Tidak seperti pada table 4.1
Atribut Ya Tidak
115 75 40 0.652173913 0.347826087
Super 49 41 8 1.829268293 5
Premium 44 22 22 3.409090909 1.818181818
Medium 22 12 10 6.25 4
Sangat Bagus 43 7 36 10.71428571 1.111111111
Bagus 72 68 4 1.102941176 10
Besar 41 10 31 7.5 1.290322581
Sedang 58 49 9 1.530612245 4.444444444
Kecil 16 16 0 4.6875 0
Tinggi 39 6 33 12.5 1.212121212
Sedang 53 53 0 1.41509434 0
Rendah 23 16 7 4.6875 5.714285714
Jenis Beras
Kualitas Beras
Ukuran Karung
Harga
Jumlah Kasus (J) Ya Tidak P(X)Ci Total
Tabel 4.20 Probabilitas Prior
4.2.3. Menghitung Probabilitas Posterior
Setelah perhitungan Probabilitas Prior selesai, langkah selanjutnya yaitu menghitung Probabilitas Posterior dengan menggunakan Probabilitas Prior terhadap temuan kasus baru.
Atribut Nilai Ya Tidak
Jenis Beras Medium 6.25 1.818181818
Kualitas Beras Bagus 1.102941176 10
Ukuran Karung Sedang 1.530612245 4.444444444
Harga Rendah 4.6875 5.714285714
Data X P(X) Ci
Tabel 4.21 Probabilitas Posterior
Setelah atribut dihitung, maka langkah selanjutnya kalikan semua nilai.
Hasilnya sesuai dengan data X yang dicari class-nya. Berikut ini adalah perhitungannya :
P(X |Minat Pelanggan = Ya) = P(Jenis Beras= Medium | Minat Pelanggan = Ya) * P(Kualitas = Bagus | Minat Pelanggan = Ya) * P(Ukuran Beras = Sedang | Minat Pelanggan = Ya ) * P(Harga= Rendah | Minat Pelanggan = Ya) =6.25 * 1.102941176
* 1.530612245 * 4.66875 = 49.45825987
P(X |Minat Pelanggan = Tidak ) = P(Jenis Beras= Medium | Minat Pelanggan = Tidak) * P(Kualitas = Bagus | Minat Pelanggan = Tidak) * P(Ukuran Beras = Sedang
| Minat Pelanggan = Tidak) * P(Harga= Rendah | Minat Pelanggan = Tidak) = 1.818181818 * 10 * 4.444444444 * 5.714285714 = 461.7604618
Dari hasil tersebut kita masih dapat melakukan perhitungan pemaksimal untuk hasil secara maksimal dengan cara (X1) * (X2). Berikut tabel perhitungannya :
(X1) (X2) Hasil
49.45825987 0.652173913 32.25538687 461.7604618 0.347826087 160.6123345
P(X| Minat Pelanggan = Ya)
P(X| Minat Pelanggan = Tidak)
Tabel 4.22 Hasil Pemaksimalan
Perhitungan data tersebut merupakan nilai probabilitas posterior (X1) dengan nilai probabilitas class Minat Pelanggan = Ya dan Minat Pelanggan = Tidak (X2).
Berdasarkan nilai tersebut dapat diambil kesimpulan bahwa probabilitas posterior tersebut diklasifikasikan sebagai kelas Minat Pelanggan = Ya sebagai Minat pelanggan penjualan beras ini.
4.2.4. Menghitung Nilai Accuracy, Sensitivity, Specificity, PPV dan NPV Accuracy
Sencitivty
Specificity
PPV
NPV/Recall
4.3. Processing RapidMiner
Penulisan blok tentang Tutorial RapidMiner dengan menggunakan metode Naïve Bayes dimana pada tutorial tersebut saya bilang akan lanjutkan dengan tutorial menggunakan metode Naïve bayes. Langkah pertama yang di lakukan adalah membuka lembar kerja menggunakan RapidMiner. Open lembar kerja dan click NEW PROSES pada tools yang telah disediakan oleh RapidMiner. Seperti tampilan berikut ini :
Gambar 4.4 Tampilan Awal
Langkah selanjutnya untuk memunculkan Validation Otomatis, Klik edit dan Klik New Building Blok pilih Nominal X-Validation decision tree lalu OK. Seperti tampilan di bawah ini:
Gambar 4.5 Tampilan Otomatis Validation
Setelah klik OK, tampilan Validastion muncul dengan 2 data ,Data training dan testing, data training blok Decision tree di ubah sesuai metode yang di ambil yaitu metode Naïve Bayes .
Gambar 4.6 Tampilan X-Validation 1
Tampilan blok saat di ubah dari Decision Tree menjadi naïve Bayes .
Gambar 4.7 Tampilan X-Validation 2
langkah berikutnya, terlebih dahulu import data, lanjut dengan melakukan seperti tampilan dibawah ini. Dengan import data ada beberapa tipe atau format file yang digunakan seperti CSV, Excell Sheet, XML, sesuaikan dengan format file data. Data yang di gunakan format Excell, lalu pilih import data menggunakan format Excell Sheet.
Gambar 4.8 Tampilan Read Axcel
Lalu masukan data ke dalam Read Axcel , klik Import Configurations Wizard ,pilih data ,dan ubah tabel attribut menjadi label yang ingin di ketahui untuk di Run .klik Finish.
Gambar 4.9 Improt Wizard
Tampilan hasil Run ,data yang sudah di masukan kedalam RapidMiner.
Gambar 4.10 Tampilan Run
4.4. Perhitungan RapidMiner
Pada tahap ini dilakukan sebuah pengujian metode untuk menentukan hasil akurasi dengan penggunaan metode naïve bayes serta menggunakan software RapidMiner 5.2
4.5. Pemrosesan Data 4.5.1. Data Training
Dalam proses pembuatan model pada tahap awal yang di awali dengan pembacaan file data Read Excel . Untuk data training dan data testing disimpan dalam file excel lalu data tersebut di validasi.
No Je nis Be ras Kualitas Ukuran karung Harga M inat Pe langgan
1 Super Bagus Sedang Sedang Ya
2 Medium Bagus Besar Tinggi Ya
3 Super Bagus Sedang Sedang Ya
4 Super Bagus Sedang Sedang Ya
5 Premium Sangat Bagus Sedang Sedang Ya
6 Premium Sangat Bagus Besar Tinggi Tidak
7 Premium Bagus Kecil Rendah Ya
8 Super Bagus Kecil Rendah Ya
9 Premium Sangat Bagus Sedang Sedang Ya
10 Super Sangat Bagus Besar Tinggi Tidak
11 Super Bagus Sedang Sedang Ya
12 Premium Bagus Kecil Rendah Ya
13 Super Bagus Sedang Sedang Ya
14 Premium Sangat Bagus Besar Tinggi Tidak
15 Medium Sangat Bagus Besar Tinggi Tidak
16 Super Bagus Sedang Sedang Ya
17 Premium Bagus Sedang Rendah Tidak
18 Medium Bagus Kecil Rendah Ya
19 Super Sangat Bagus Besar Tinggi Tidak
20 Super Bagus Besar Rendah Ya
21 Medium Sangat Bagus Sedang Tinggi Tidak
22 Premium Bagus Besar Sedang Ya
23 Premium Bagus Sedang Rendah Tidak
24 Premium Sangat Bagus Sedang Rendah Tidak
25 Super Bagus Sedang Sedang Ya
26 Premium Bagus Sedang Sedang Ya
27 Super Sangat Bagus Besar Tinggi Tidak
28 Premium Sangat Bagus Besar Tinggi Tidak
29 Medium Bagus Besar Tinggi Ya
30 Super Bagus Sedang Sedang Ya
Tabel 4.23 Data Training
4.5.2. Validation
Validation adalah untuk melakukan analisis berbagai model dan memilih model dengan kinerja yang baik. Setelah melakukan cek file data di kotak proses read excel,lalu proses read excel dihubungkan dengan proses cross validation.
Berikut adalah uji validation menggunakan RapidMiner 5.2.
Gambar 4.11 Proses Awal
Lalu setelah itu proses cross validation dengan melakukan klik 2 kali hingga muncul dua bagian yaitu bagian testing dan training. Selanjutnya proses training adalah melakukan proses pelatihan data dengan memasukan model naïve bayes sedangkan proses testing yaitu melakukan pengujian data dengan menghasilkan grafik atau pola dengan memasukann Apply Model dan Performance yang nantinya akan menghasilkan Simple Distribution, Accuracy,Precision,Recall,AUC (Optimistic), AUC, dan AUC (Pessimistic). Berikut ini adalah proses dari cross validation.
Gambar 4.12 Proses X-Validation
4.5.3. Hasil Run Performance
Setelah Proses awal dilakukan, dengan memasukan data set dengan cara Imfort Configurations pada blok Read excel lalu dihubungkan dengan Validation dan proses X-Validation dengan 2 bagian Traning Naïve bayes dan Testing Apply Model, Performance lalu run. Dan Menghasilkan Accuracy,Precision,Recall,AUC (Optimistic), AUC, dan AUC (Pessimistic) sebagai berikut.
1. Hasil Accuracy RapidMiner
Accuracy adalah ukuran berapa dekat suatu hasil pengukuran dengan nilai yang benar dari kuantitas besaran yang diukur .Semakin tinggi akurasinya maka semakin baik. Dengan memasukkan 115 data training untuk nilai accuracy metode algoritma Naïve Bayes.
Gambar 4.13 Accuracy Data Training
Berdasarkan hasil accuracy yang dihasilkan pada klasifikasi kualitas penjualan beras dengan 2 kategori minat atau tidak melalui penilaian sesuai kualitas dengan metode naive bayes sebesar 91,29% dapat dijelaskan bahwa akurasi tersebut tergolong klasifikasi baik.
2. Hasil Precision RapidMiner
Precision merupakan jumlah data yang true positif (jumlah data positif yang dikenali sebagai data yang benar) dibagi dengan jumlah data yang dikenali sebagai positif. Atau bisa disebut dengankecocokan antara permintaan informasi dengan
jawaban terhadappermintaan. Semakin tinggi nilai presisi maka semakin baik sistem informasinya.
Gambar 4.14 Precision
Presisi yang dihasilkan pada klasifikasi penjualan beras dengan 2 kategori minat atau tidak melalui sistem minat pelanggan menggunakan metode naive bayes pada RapidMiner sebesar 88.83% sehingga dapat disimpulkan bahwa penggukuran atara serangkai pengukuran satu dengan yang lainnya tergolong baik.
3. Hasil Recall RapidMiner
Recall adalah jumlah data true positif dibagi dengan jumlah data yang sebenarnya positif (true positif di tambah true negatif). Recall disebut juga proporsi jumlah dokumen yang dapat ditemukan kembali oleh sebuah proses pencarian pada sistem.
Semakin tinggi nilai recall maka semakin baik sistem informasinya. Hasil hitungan nilai recall dalam Rapidminer .
Gambar 4.15 Recall
Recall yang dihasilkan pada klasifikasi penjualan beras dengan 2 kategori minat atau tidak melalui sistem minat pelanggan menggunakan metode naive bayes pada RapidMiner sebesar 90.00% sehingga dapat disimpulkan bahwa sering jumlah dokumen yang ditemukan kembali dalam proses pencarian sistem.
4. AUC (Optimistic)
Untuk AUC (Optimistic) ini menghasilkan niai 0.976 hal ini menunjukan bahwa model naïve bates baik. Hasil dapat dilihat pada gambar dibawah ini :
Gambar 4.16 AUC (optimistic) 5. AUC (Area Under Curve)
Kurva Receiver Operting Characteristic (ROC) digunakan untuk mengekspresikan data confusion matrix. Gambar berikut menerangkan terdapat garis horizontal yang mewakili nilai false positif (FP) dan garis vertikal mewakili nilai true positif (TP). Dari gambar 4.12 dapat diketahui bahwa nilai AUC (Area Under Curve) model algoritma naïve bayes adalah 0.976 class positive = Tidak Hal tersebut menunjukan bahwa algoritma naïve bayes ini mencapai klasifikasi sempurna.
Gambar 4.17 AUC (Area Under Curve) 6. AUC (Pessimistic)
Untuk AUC (Pessimistic) ini menghasilkan niai 0.976 dengan positif class = Tidak. Yang digunakan untuk megekspresikan data cofusion matrix.Hasil dapat dilihat pada gambar dibawah ini :
Gambar 4.18 AUC (Pessimistic)
4.5.4. Data Testing
Dalam Penelitian ini data uji juga dengan perhitunggan accuract menggunakan 30% data testing dari data training. Tampilan Data testing dengan jumlah data 34:
No Jenis Beras Kualitas Ukuran karung Harga Minat Pelanggan
1 Super Bagus Sedang Sedang Ya
2 Premium Bagus Kecil Rendah Ya
3 Super Bagus Sedang Sedang Ya
4 Premium Sangat Bagus Besar Tinggi Tidak
5 Medium Sangat Bagus Besar Tinggi Tidak
6 Super Bagus Sedang Sedang Ya
7 Premium Bagus Sedang Rendah Tidak
8 Medium Bagus Kecil Rendah Ya
9 Super Sangat Bagus Besar Tinggi Tidak
10 Super Bagus Besar Rendah Ya
11 Medium Sangat Bagus Sedang Tinggi Tidak
12 Premium Bagus Besar Sedang Ya
Tabel 4.24 Data Testing
Gambar 4.19 Hasil Accuracy Testing
Dari penghitungan nilai accuracy menggunakan data testing dengan jumlah data 34 dari jumlah data training 115. maka didapat accuracy sebesar 89.17% dapat disimpulkan bahwa nilai data testing dalam Rapidminer tergolong baik.
4.5.5. Hasil Simple Distribution
Hasil klasifikasi dengan menggunakan metode naïve bayes ini menghasilkan 2 class yang ada didalam simple distribution yaitu class minat pelanggan Ya dan Tidak, hasil dari penelitian menunjukan class Ya sebesar 0,652 hal ini sesuai dengan
perhitungan manual yaitu Minat Pelanggan class Ya terdapat 4 distributions dan class Tidak sebesar 0,348 yang terdapat class 4 distributions, dari hasil perhitungan Minat pelanggan kategori Tidak. Hal ini sesuai dengan perhitungan manual yang telah dilakukan pada tabel 4.1.
Gambar 4.20 Sample Distribution