& # #$#
# & &
( (
9
9 <648040/1
&
% 9
"
(
"
(
&
( ! ! (
!
(
!$
" 82113166/
" 828/.330/
9
=
"
"
(
" 828/.3306
/ 0
" # 1. ' 8:3/ # ! 7 %
" # # 1004 # !
8 " & ( # # # "
# " ! # % ! " * ! +
% % % # !8
! " ( # ) # 7
# 7 # * > ' + # 100/?1006 " 100.
# # 7 # " & ( %
" > # > " *> " + # ; 100.
8
& *1002+
# & #
! &
& *1002+
2
3 4
& *1002+
& *1002+ # #
*< 1001+
.
& & 152(
456( 3581 " & ,
& &
:
& &
/
& &
# #
$ ( 29880.A882/( 1002
( & "( < ( < "(
82
X8 1003Y
< 777 ?V ?
11*3+9333A:0/( 1000
; 1003 $
' % $ $ X Y = $ & )
( !$ $ $ (
!$ ) $ $ #
8/
8.
> # 2
9
9
9
> # 4
9 0641 %# 9 3581
*/+9 9;*==<AC?7
9;*>;>A?A7
9;*;BG>AC7
9;*;G>>>B7
9;*;A>;;G7
ABSTRAK
IMAM ABU DAUD. Anotasi Automatis Citra menggunakan Statistical Machine Translation untuk Temu Kembali Citra. Dibimbing oleh YENI HERDIYENI dan SRI NURDIATI.
Penelitian ini melakukan implementasi anotasi automatis citra menggunakan statistical machine translation untuk temu kembali citra. Penerjemahan citra ke kata dianalogikan seperti menerjemahkan satu bahasa ke bahasa lainnya. Objek untuk penerjemahan diperoleh dari koleksi citra yang telah dianotasi secara manual. Pertama, citra disegmentasi menjadi beberapa region berukuran sama menggunakan segmentasi grid. Region tersebut kemudian direpresentasikan oleh ciri citra yang telah didefinisikan sebelumnya. Kedua, region seluruh citra dikelompokkan menjadi kelompok blob yang berukuran lebih kecil menggunakan algoritme k-means. Ketiga, hubungan antara blob dengan kata
dicari menggunakan algoritme expectation maximization. Hubungan yang terbentuk digunakan untuk memprediksi kata yang berhubungan dengan sebuah citra (anotasi automatis).
Evaluasi kualitas anotasi automatis dilakukan menggunakan algoritme normalized score (ENS).
Variasi ukuran grid saat segmentasi diberikan kepada seluruh citra latih dan uji. Hasil percobaan terhadap 750 citra latih dan 250 citra uji berukuran 384 × 256 piksel menunjukkan bahwa nilai ENS
terbaik diperoleh oleh model yang dibentuk oleh data latih dengan ukuran grid pada segmentasi sebesar 2×3, dengan rataan ENS sebesar 0.4608 dan ukuran grid 8×12 untuk citra uji saat evaluasi
dengan rataan ENS sebesar 0.4862.
Temu kembali citra dilakukan menggunakan latent semantic indexing untuk mengeksploitasi makna semantik dari anotasi automatis seluruh citra. Dimensi latent semantic indexing diperoleh dari hasil dekomposisi matriks anotasi automatis seluruh citra. Rataan recall dan precision dihitung untuk dua jenis kueri: klausa dan teks. Hasil penelitian menunjukkan kueri berbentuk klausa memberikan rataan precision yang lebih tinggi dibandingkan kueri teks. Rataan precision kueri klausa untuk setiap tingkat recall yaitu sebesar 0.5442, sedangkan rataan precision untuk kueri teks bernilai 0.2509. Hasil tersebut menunjukkan bahwa metode latent semantic indexing dapat memunculkan makna semantik dari citra sehingga citra hasil temu kembali lebih relevan terhadap kueri yang diberikan.
8
& *1002+
# & #
! &
& *1002+
# ! &
& *1002+
# & #
! &
& *1002+
3 4 & *1002+
& *1002+ # #
*< 1001+
.
& & 152(
456( 3581 " & ,
& &
& 83000 (
& &
81
& &
# #
$ ( 29880.A882/( 1002
( & "( < ( < "(
/
& &
# #
$ ( 29880.A882/( 1002
( & "( < ( < "(
82
X8 1003Y
< 777 ?V ?
11*3+9333A:0/( 1000
; 1003 $
' % $ $ X Y = $ & )
( !$ $ $ (
!$ ) $ $ #
8/
8.
> # 2
9
9
9
> # 4
9 0641 %# 9 3581
*/+9 9;*==<AC?7
9;*>;>A?A7
9;*;BG>AC7
9;*;G>>>B7
9;*;A>;;G7