• Tidak ada hasil yang ditemukan

course 8 model validation

N/A
N/A
Protected

Academic year: 2018

Membagikan "course 8 model validation"

Copied!
5
0
0

Teks penuh

(1)
(2)

Model Selection and Validation

Ketika bekerja dengan model-model machine learning, maka terdapat dua problem

yang timbul:

• Memilih model

• Bagaimana memilih parameter model yang optimal?

• Validasi

• Ketika kita sudah memilih suatu model, maka bagaimana menentukan tingkat kesalahan sebenarnya (true error rate)?

• Apabila kita memiliki data yang tidak terbatas, maka pilih model yang memiliki tingkat kesalahan terkecil (yang merupakan tingkat kesalahan sebenarnya)

(3)

The Holdout Method

Membagi data menjadi dua:

• Data training

• Data testing

Problem:

• Bagaimana jika pembagian data training (atau testing) mendapatkan yang data lebih mudah/sulit? (unfortunate split)

• Akibatnya prediksi error menjadi tidak valid

Metode lain yang dapat digunakan:

(4)

Cross Validation (CV): k-fold CV

• Prosedur k-fold CV:

1. Membagi data menjadi � grup secara random 2. Untuk setiap grup: � = , , … , �

• Gunakan grup, selain grup ke-�, untuk membentuk model

• Ujikan model yang terbentuk pada grup ke-� yang berguna sebagai data testing

• Hitung error untuk uji model pada data testing �

• Drop semua model (�) yang terbentuk

• Estimasi error diperoleh: ෠� = 1

�σ�=1� ��

• Umumnya, digunakan � = 5 atau

• The advantage of K-Fold Cross validation is that all the examples in the dataset

are eventually used for both training and testing

Bagian bewarna abu merupakan

(5)

Leave-One-Out CV (LOOCV)

Untuk data dengan

data, maka:

• Data training menggunakan sebanyak

� − data, sementara untuk uji digunakan hanya satu data saja

• Akan terdapat sebanyak � model

• Hitung error untuk setiap percobaan �

Estimasi error:

෠� =

� ෍

�=1 �

Referensi

Dokumen terkait

Cara memilih format gambar adalah dengan menampilkan menu toolbox, lalu pilih salah satu item untuk membuat satu objec gambar, misal gambar lingkaran maka kita pilih perintah

Pada jendela program Microsoft Word, dapat kita pilih menu File | New, maka setelah kita memilih Blank Document, dokumen kosong akan ditampilkan pada layar komputer

Dengan melihat selisih antara nilai data simulasi dan sebenarnya kita dapat menghitung persentase kesalahan dari model.. 1.5.Grafik

Pendekatan yang sama digunakan pada error bases model dimana sistem menyimpan rekaman kesalahan dan perilaku sebenarnya dari user serta membandingkannya... KNOWLEDGE

Tampilan keenam pada gambar 7, apabila kita sorot / highlight salah satu pinpoit, tanpa memilih tabel Pilih Industri untuk sortir dan pilih kota untuk Sortir, maka

Ya, praktis sudah disetujui semua. Artinya begini, ketika kita sudah menyepakati semua, maka otomatis di sini semuanye:t Jadi ketika kita bacakan, berarti kalau

Ketika kita telah menguji model dengan 100 pasien, kita mendapatkan hasil klasifikasi : True positive TP : 20 pasien menderita diabetes dan terdeteksi oleh model False negative FN :

Ketika kita telah menguji model dengan 100 pasien, kita mendapatkan hasil klasifikasi : True positive TP : 20 pasien menderita diabetes dan terdeteksi oleh model False negative FN :