• Tidak ada hasil yang ditemukan

Supervised learning - UNIKOM Kuliah Online

N/A
N/A
Protected

Academic year: 2023

Membagikan "Supervised learning - UNIKOM Kuliah Online"

Copied!
14
0
0

Teks penuh

(1)

Learning –basic concept

Teknik Informatika - UNIKOM

(2)

Learning

Learning adalah hal penting untuk lingkungan yg tidak diketahui

◦ Perancang tidak omniscience

Learning berguna untuk metode konstruksi sistem

◦ Mendekatkan agen dengan realitas daripada mendeskripsikan lingkungan untuk agen

Learning memodifikasi mekanisme keputusan agen untuk meningkatkan

performa

(3)

Learning objectives

Persepsi agen seharusnya digunakan bukan hanya untuk beraksi, tapi juga untuk meningkatkan performa di masa datang.

Tugas-tugas belajar untuk sebuah agen:

– Kondisi yang ingin dicapai untuk sebuah aksi – Perubahan lingkungan yang berpengaruh – Nilai untuk setiap kondisi

– Kondisi yang memiliki nilai tinggi (rendah)  solusi – Informasi mana yang relevan

Learning task – estimations of functions y= f(x) <-> f: x  y

(4)

Types of Learning

Supervised learning:

Diketahui x, f(x) dengan segera dibuktikan oleh a

“supervisor”. f(x) dipelajari dari sejumlah sample : (x1,y1), (x2,y2), …, (xn,yn)

Reinforcement leaning:

Jawaban yang benar tidak dibuktikan oleh tiap x

Sebaliknya, evaluasi umum dibuktikan setelah serangkaian aksi (kadang2)

Unsupervised learning:

Agen mempelajari hubungan diantara persepsinya I.e. it perform clustering.

(5)

Taxonomi of Machine Learning

(6)

Supervised learning

Mencari suatu fungsi yang sesuai dengan contoh dari himpunan sample

◦ Data training

◦ Classification

◦ Backpropagation Neural Network

(7)
(8)

Unsupervised learning

Belajar dari pola yang tidak berkaitan dengan nilai output

◦ Tidak butuh data training

◦ Clustering

◦ Kmeans

(9)
(10)

Clustering

Tidak perlu melatih metoda tersebut atau dengan kata lain, tidak ada fase learning.

Mengelompokkan obyek-obyek data hanya

berdasarkan pada informasi yang terdapat pada data, yang menjelaskan obyek dan relasinya

Inter-cluster distances are

maximized Intra-cluster

distances are minimized

(11)

Reinforcement learning

Output tidak diketahui secara pasti untuk suatu input, tapi menerima feedback

◦ Feedback : entitas luar, lingkungan, atau agent itu sendiri.

◦ Feedback mungkin tertunda, dan tidak mengikuti masing-masing aksi secara

langsung.

(12)

RL Framework

Belajar dari interaksi terdekat Stochastic environment

(13)

Contoh algoritma learning -

Supervised

(14)

Summary

• Learning diperlukan untuk lingkungan yang tidak diketahui.

• Metode Learning tergantung pada ketersediaan feedback, tipe komponen yang akan di improved, dan representasinya.

• Untuk supervised learning, tujuannya adalah untuk menemukan hypothesis yang simple diperkirakan konsisten dengan contoh training.

Referensi

Dokumen terkait

_________________________________ Signature of Faculty Member RLC / CWLC total unit/s requested: • We certify that we have reviewed this application and that the recommended load