• Tidak ada hasil yang ditemukan

3e595 05 game playing

N/A
N/A
Protected

Academic year: 2017

Membagikan "3e595 05 game playing"

Copied!
25
0
0

Teks penuh

(1)
(2)

Kenapa mempelajari games?

Kriteria menang atau kalah jelas

Dapat mempelajari permasalahan

Alasan histori

Menyenangkan

• Biasanya mempunyai

besar (misalnya game

search space yang

catur mempunyai

35

100

nodes dalam search tree dan

10

40

legal

(3)

Seberapa hebat

computer game

player?

- Catur:

• Deep Blue mengalahkan Gary Kasparov pada

tahun 1997

• Gary Kasparav vs. Deep Junior (Feb 2003):

Checkers:

• Chinook adalah juara dunia

Go:

• Computer player adalah sangat tangguh

Bridge:

seri

(4)

Garry Kasparov and Deep Blue. © 1997, GM Gabriel Schwartzman's Chess Camera,

(5)
(6)

~~

OS> 1111 "11'1

0' ':l . -1111 111 11:1 1:11 11'1 1'11 i j"

.

.

i

1

1

!

• i

i

a

'"

,

l

8

i

;

'"

0 I

~J.I.

a

oS!

!

~t

~

I

~

8 ~

.

.

1 3

.

.

s It ~.5 ...

i

> 0

~ ~§ ~ .. .

a

j

i

l

l

~

a

.

:

u

!'>~

... ~ ~ . . -e :; z' " . V.

.i.

-5 i

J

lj

f

i

U

is

i

f

~ ; !'o . :1i ~ . . j,i

f~

j

J. I " QI <: 0 0 '" ' . .

11 "~

. .

~J

~JI

.! <:

~

l

QI E

B ''. "" . f. a ! .c 'll -Il ..

0

0

d

f

j

~

.. .

u

k

...

'-'

." ~

(7)

January/February 2003

://www.chessbase.coalnew

sdetail.

..e.

Yahoo! news ~

, Bookmarks 0 Location:

..e.

Google

..e.

Systems Desk

Gil' Whal's

Columbia Bank

Related

UMBC Phone Directory ~ CSEE Calendar ~ >

ONLIN E

DATAIASE > lEW PRODUCTS

> SUPPORT

>

DOWILDA

D

> GERMAN PAGE

,

> SPANISH PAGE

,

S

HOP

> CATALOG

,

':iJC1D1m .... : TIl. ftnt foUl. Omelll Wort. CIIIsI CbamDlonshlJ

MAN (Kaaparov) VS MACHINE (Deep JunIor)

>

CONTACT JaD'Vottd Sc:ttedl

lfe

> OK"l.D(1DA.TIlIt!'t.SE

> PlAYDtDATJLItJtSE

> eN USB.U"£ WORU > DIS'l'JU8urOllS

>~

Score

ChasBGUN~'J

",!\bac

k

MAfl.u ] l'1I.f'upillioll

(8)

Ciri umum pada game

2 pemain

Kesempatan pemain bergantian

Zero-sum: kerugian seorang pemain adalah

keuntungan pemain lain

Perfect information: pemain mengetahui semua

informasi state dari game

Tidak mengandung probabilistik (seperti dadu)

Contoh: Tic-Tac-Toe, Checkers, Chess, Go,

Nim,

Othello

• Game tidak termasuk Bridge,

Backgammon, dan semisalnya

(9)

Bagaimana bermain game?

• Cara bermain game:

-Pertimbangkan semua kemungkinan jalan Berikan nilai pada semua kemungkinan jalan Jalankan pada kemungkinan yang

mempunyai terbaik

Tunggu giliran pihak lawan jalan Ulangi cara diatas

nilai

-• Key problems:

-Representasikan "board" atau "state" Buatlah next board yang legal

(10)

Evaluation function

• Evaluation function atau static evaluator digunakan

untuk mengevaluasi nilai posisi yang baik

Zero-sum assumption membolehkan untuk

menggunakan single evaluation function untuk

mendeskripsikan nilai posisi

-f(n) f(n) f(n) f(n) f(n)

00 0: posisi n baik untuk saya dan jelek untuk lawan «« 0: posisi n jelek untuk saya dan baik untuk lawan near 0: posisi n adalah posisi netrallseri

(11)

Contoh evaluation function

• Tic-Tac-Toe

fen) = [# of 3-lengths open for me] - [#

you]

of 3-lengths open for

dimana 3-length adalah complete row, column, atau diagonal yang terisi

Alan Turing's function untuk catur

- f(n) = w(n)/b(n) dimana wen) = jumlah point value bidak putih and ben) = jumlah point value dari bidak hitam

Deep Blue eyang mengalahkan Gary Kasparov tahun

1997) mempunyai lebih dari 8000 features untuk

evaluation function

(12)
(13)

Minimax

• John von Neumann pada tahun 1944

menguraikan sebuah algoritma search

pada

game, dikenal dengan nama Minimax,

memaksimalkan posisi pemain dan

meminimalkan posisi lawan

(14)

MAX 1 A

MIN 1 8 ·3 c

MAX 4 D 1 E 2 F ·3 G

4 ·5 ·5 1 ·7 2 ·3 ·8

(15)

2

1

2 2 1

2 7 1 8 2 7 1 8 2 7 1 8

2

Jalan yang dipilih oleh Minimax

Static evaluator value

2 1

MAX

(16)

Contoh: Game Nim

• •

Diawali serangkaian batang

Setiap pemain harus memecah serangkaian batang menjadi

2 kumpulan dimana jumlah batang di kosong

tiap kumpulan tidak boleh sama dan tidak boleh

+

+

(17)

Misalkan jumlah total batang = 7

2-1-1-1-1-1

2-2-1-1-1 3-1-1-1-1

2-2-2-1 3-2-1-1

4-1-1-1

5-1-1 4-2-1 3-2-2 3-3-1

4-3

6-1 5-2

(18)

Asumsi

• MIN bermain dulu

• Evaluation function:

- 0 M

IN menang

(19)

MAX

0

0

MAX 4-1-1-1 3-2-1-1 2-2-2-1

4-3 5-2

6-1

MIN

1

7

1 1 1

0 1 0 1

MIN 5-1-1 4-2-1 3-2-2 3-3-1

1

MIN 3-1-1-1-1

0

2-2-1-1-1

1

MAX

(20)

Alpha-beta pruning

Merupakan improvisasi dari Minimax

Basic idea

HIf you have an idea that is surely bad, don't take

the time to see how truly awful it is." (Pat

Winston)

MAX >=2

• Tidak perlu menghitung nilai pada node ini.

• Nilai pada node tersebut

tidak akan berpengaruh pada root-nya.

MIN =2 «=1

MAX

(21)

A M AX

<=6 B C

MIN

6 D >=8 E

MAX

H I J K

6 5 8

(22)

>=6 A

MAX

6 B <=2 C

MIN

6 D >=8 E 2 F G

MAX

H I J K L M

6 5 8 2 1

(23)

>=6 A

MAX

6 B 2 C

MIN

6 D >=8 E 2 F G

MAX

H I J K L M

6 5 8 2 1

(24)

cutoff

Alpha-beta Pruning

6 A

MAX

6 B

2 C beta

MIN

6 D >=8 E alpha 2 F G

c utoff

MAX

H I J K L M

6 5 8 2 1

= agent

(25)

Referensi

• Notes by Charles R. Dyer, University of

Wisconsin-Madison.

Game Playing, Graham Kendall.

Modul Ajar Kecerdasan Buatan, Entin Martiana,

Tessy Badriyah, Riyanto Sigit, Politeknik

Elektronika Negeri Surabaya, 2005.

Artificial Intelligence (Teori dan Aplikasinya), Sri

Kusumadewi, cetakan pertama, Penerbit Graha Ilmu,

2003.

Referensi

Garis besar

Dokumen terkait

• To collect cells with their chromosomes in this condensed state they are exposed to a mitotic inhibitor which blocks formation of the spindle and arrests cell division at the

Variabel IPR mempunyai pengaruh positif yang signifikan terhadap ROA karena peningkatan surat-surat berharga yang dimiliki oleh bank lebih kecil dari pada peningkatan

alendronate pada IBS yang berfungsi untuk mengatur laju degradasi sehingga ketika terjadi degrdasi total dapat bersamaan dengan selesainya remodeling tulang yang

.enyelenggaraan .osyandu .osyandu dapat dikembangkan dari pos penimbangan, pos imunisasi, pos K= desa, pos kesehatan ataupun pembentukan yang baru !atu posyandu sebaiknya

Dari kajian teori-teori diatas, terlihat bahwa landasan pengembangan pembelajaran konstekstual adalah kontruktivisme, yaitu filosofi belajar yang menekankan bahwa

HA: ROE and EVA level combination could shows association degree the four related cash flows factors synchronous or concurrent in four stock return association cluster

Hal ini berarti jika individu mempunyai intensitas mengikuti pengajian kitab al-Hikam yang tinggi maka individu akan termotivasi untuk mengikuti pengajian tersebut

produktivitas yang lebih baik, namun juga memberikan fungsi positif dalam aspek. lingkungan, ekonomi, maupun