" !
# $ %&''
! 1 ! ! 3 ! "
" 9 1 ! # #
" 7!'8# 9 " 7!%8# 9
" 7!-8# " " 7!:8# " " 7!+8#
" " ! 7!*8# " " ! " 7!;8#
" 9 7!,8# ! 7!<8# !
! " 7!'&8# " ! 7!''8 2 9
!! " ! ! " ! 3 #
" ! " "" " ! " ! "
" " !
! /9 ! 1 3 = =
" " !''
" = - %*> ' ++> ! " ! '&>
-&># " 9 . # " = & +,> !
" ! %&> ! 1 !
!%# !:# !+# !'' " 9 ! " 9 !
)
" #
( #
. #
" "
!
!
# #
# = # #
# # =
# = #
7 A 8 !
@ #
# #
! 1 '+&
# '&& +&
# @
# ! # )
# = +&
7 8
-&># %&># '&>
/ !
!
/ ! !
" " '&&&
!
9 = ! 9
9 ! 9
#
9 '&&
" )
7B)8 '&># %&># -&>#
B) '&># B) %&># B) -&>
+& 7
8 !
!
" "
? !
6 "
" ! ! !
B) '&> - %*># B)
%&> & +,># B) -&>
' ++> ( # = "
B) '&> B) %&> * %,># B) %&> B) -&> * ';>
6 " -&>
!
! C D
! C D C D
" B)'&>#
B) %&># B) -&> ! C D
!
! # = #
# 7!%# !:# !+# !''8
! . # !
7!%# !:# !+# !''8
!
"
() @ *+'&,&&-'
#
?
5 6 # # ?
?
#
?
?
# # ?
4 @ - %&'& 0 @
) # ? #
"
" (
2 3
" @
' 5 6 # # ?
% ) # ? #
- $ # ?
=
: = F 7 3 3# ) # # ! # 8#
2 0 = " 7 ) " # 5 # $ 9 # " # B 8#
F 7 # ? # # G 8# F
=
0 # C( D
#
!
'<<< ( < %&&%
- ! 4 9 # '
? 4 9 %&&: %&&,
" ?
" #
(
%&&-=%&&+# ) 9 "
%&&* 4 9 0 #
!
" # "
$ % "
& ' $
( ( $
# $
" ( ( # ( $
" )( ( ' *# + $
" )( ' ,-) . *# + /
" " ' ,-) . *#"+ 0
" $ ' % 1' *#$+ 2
" / ' , , % & . ) *#/+ 3
" 0 ' , . *#0+ 4
" 2 ' , . *#2+ 4
" 3 ! ' *#3+ 5
" 4 ') ( 1' *#4+
" ' *# +
$ ) "
$ ( ) "
$ )% ( $
$ ( ( /
$ " ( /
$ $ . 6 0
$ / ( 2
" 8 4
" )( . 4
" % ) ( 4
" 6 % 6 5
" ( ) 9 ... 20
" ( ( ( ... 20
" " ). ) ... 20
" " 6 % !
" 7 "
" " : . % "
$ $
$ ') % ( $
$ ) ) $
$ " ) ) ' /
$ $ ). ( /
$ / ' 0
$ 0 ). ) 3
$ 2 ( F-measure 6 % ! "
$ 2 ( ). ' ) )() ""
$ 3 : ') % ( "2
/ ' "4
/ ' ( % "4
/ "4
' $
Term frequency. inverse sentences frequency 2
7)7) % . 3
" ; ) 3
$ ( % 3
/ <) )6 ). ) )() 7 < "5= "
0 ( ( 7)7) % . ). ) )() < "5= "$
( ( % 1 3
( ( , , % ! . 3
" ( ( ) ( 1
$ ( ) ) 6 ) .7 * 434+ $
/ ( ( % , ( ( 6 . ) /
0 % )( ( % . 6 ( 0
2 . 6 ( ( 2
3 ( 3
4 )( ( . 6 ( ( 3
5 ( ( ( 9 ) ) ( 4
)( ( )
% ( ( ) )() % . % 7)7) ( ( # (
" ) .) % . 6 % % 6 . % ! $
$ % ( ( ) )() 4
/ % )( ( % . 6 ( . . "
0 % )( ( ( "
2 7 . % ! F-measure>( % 6 # (> * + . >( 7 (
# (> * ■+ % . < 5=? < 5=? . < "5= ""
3 ' ! # ( 6 . % ( "2
6 ( .) ( ( .)
- , 7 6 ( . 7 . 7 9 ( 6 ( .) ? ( 6
( ( ! . ( % . ? 7 (
.) - . 7 , , 7 , 7 .) , . (
7 ! 6 7 , . ( .) , % ! 8 6 ? ( (
.) ( 9 ) ) ( . % ( ( 6 - 7 9 .
7 ,
( ( . 6 % )( ( , 6 ( .) , 7 6
9 /5= . .) * . et al. 55 + . ! % ) 6
#) ( . - ( * et. al 55 + * . .() 404@
) , A 442+ % ( (? 7 17
( % ! . 7 7? ( 7 ? . - % 7 , %
? . .() * 404+ # ( ( % B% . ( C? B% .
( % C? B ( ! ( C % # ( , 7
. # ( 7 , % . (
' % ( ( 7 . 7 , % ( (
7 . ( ( ( . 7( ( *& D A 7 553+ ( (
% ( , 1 ( , % %
% #) # . ( ( 7 ! . ( ? ( . 7( (
. 6 7 ( . ( ( 7 . 7 ( .
9 % 1 7 , % ( ( ( ( ( 7
. 7 7 7 . *& D A 7 553+
7 % ). % ( ( ) ) ( , 6 .
% ( ( ( * D , A 6 . . 442+
( 7 ). % ) 6 % ( ( ( et al * 442+ 7
% ( ( . bushy path 6 (
( ( % %6 E 6 et al * 55/+ 7 ( .
( ( ( . % . . )
* et al. 55$@ '6 (( D . 6 et al. 550@ 6 A 553+
) . 9 7)7) )% % . # (
7)7) % 7 % . % ( (
*'6 (( D . 6 et al. 550@ 6 A 553+ 6 7 ( (
. ) ( 7 % 7)7)
'6 (( D . 6 et al. * 550+ ) 7 6 # # . %
7)7) . 7 . .
( % , . ) 6 6 . * 553+ !
7 6- % ( ( , . 6 ( . )
7 6 7 . 7 . ( ( .
) , $$ 4$= . $" 4 = % ( (
(
. % 6 . * 553+ 7 5 # (
7 ( . ) ? . 7 6 7
( ' ( . 6 , 9
6 7 7 . ( ( ' ( . % .
. singular value decomposition * ; + 8 6
? % % . 7 ( ( .
7 ( % 6 # ( * 6 A 553+ . # (
( 7)7) )% % % # (
. )
. ( 7 ( 7 ? % 7 !
)% ( % ( ( . )
. ( % 7 6 ( ( # ( (
# . % . 6 6 ( ( ( ,
)% . % ( ( ( 9 9 % . 6
% ) 6 ( .)
! " #
( . % 7 ( ( % ( ( 7 (
% , 6 ( . ! . 9 % ( 7 7 F
( ( ( , . . 6 7 6 ( .) (
.) , . . 6 7 ( )
$
%
" & &
( ( . 6 % )( ( % % ( ( 7 . (
7 6 % . % % 6 #) ( , .
. . , * D , A 6 . . 442+ . . % ( ( ,
% ( ( 7 . ( ( ( . 7( ( *& D A 7
553+ ( ( % ( , 1 (
, % % % #) # . ( ( 7 ! . ( ?
( . 7( ( . 6 7 ( . ( ( 7 .
7 ( . 9 % 1 7 ,
% ( ( ( ( ( 7 . 7 7 7 . *& D A
7 553+
# . % . . # ( ( 7 #) ( , )%
% )% ( 7 . ( , . . ( ) 6 . % ) )
% # , 7 . 6 % # , % 6 .
7 - % 7 9 6 . 7 ( #) ( , . 7
% ( , . 1 . % ) ) , * - et al 553+
& &" " &
( % 6 # ( 7 . ( % 6
. * 553+ , F %)( ( ? positive keywordG negative keyword?
% ? , , % ! . ? ,
. ? , . . ? % !
? ) ( 1 ? % ! 6 7)7) ) ( 1 ? .
% 7 6 # ( ( . ;
'&"&" % "( ) *
)( ( . 6 . ( 7 6 % # . %
% % 8 6 ? % ( 7
7 . ( %)( ( , 9) )6 # ( %)( ( % . ( 7 6
.)
!" #
. ( 9) )6 .) ( 7 ? % 6 ( ) # (
%)( ( % . 6 ? ( ) . . 6 ? ( )
. 6 ? . ( ) % . 6 8 6 ?
6 ( ) # ( %)( ( . % . 6 % . * +
* +
( ( ( . 6 . . % #? . 6 # ( %)( (
*# ( ( +? . 6 ) ! 6 . ( % # . H
. 6 %)( ( . % % #
'&" "+ % ,-' . ) *
Positive keyword . 6 , % 7 , 9 % . ( 7 6
( ( positive keyword % . .) % 6 .
( F
!" #
!"
. ( ( .) ( 7 ? merokok % ,
( * 6 % % 6 % . ( + . 6 ?
. 6 ? . 6 ? . 6 8 6
? 6 ( ) # (positive keyword . % . 6 % . * +
! " #
"$
% &' (" * +
( ( ( . 6 . ( .) ? . 6 .
.) ? . 6 # (positive keyword*# ( . +? . 6 ! 6
keyword . ? " . 6 7 , , keyword 1 , 9 .
&' (" &' ("&' (
"
&' (" ) * ) () ) ) * ) () )* ) ) () * ) )) (+ &' ("
) * ) () ) ,+ , ) * ) () () ) * ) )
) * ) () ) ,+ , ) * )
&' (" ) * ) () ) ) * ) () ),+ , ) * ) (),+ , ) * )) (+ &' ("
&' (" . 6 % 6 . ) % ( % 6 * ( +?
"? ? . % ! . 6 B(C % . 6 %
% !
"+ % ,-' . ) *
Negative keyword % 7 . # ( positive keyword
Negative keyword . 6 , ( . 9 .
( ( negative keyword% . .) % 6 . ( F
!" #
. ( ( .) ( 7 ? ekstra % , 9
% . . % , . 9 % . (
- ) . 6 ? ) - . 6 ? - . 6 ? )
. 6 8 6 ? 6 ( ) # ( negative keyword . %
. 6 % . * "+
. ! "
#
"$
% - &' (" * "+
( ( ( . 6 . ( .) ? . 6 .
.) ? . 6 # (negative keyword*# ( +? . 6 ! 6
keyword . ? " . 6 7 , , keyword 1 , 9 .
! % (" "# /% "( ) !*
' % 1 % , 9 . (
. , 9 . 9) )6 % %
% 1 , F
· · ·
. ( ( 7 ? % 6 ( ) # (
% 1 . ( ( % . 7 ) %
. 6
/? ( ) . . 6/? . ( ) . 6/ .
% , ( . . .
? , B# "? & , ? ' ' C ' . . ,
( . ( . ? , B# "? & , C '
. , ( . ( . .
, B& , ? ' ' C . ( ( ( % 1 % .
7 ? ( ) # ( % 1 . 6 .
* $+ . ( ( ( . 6 ? . 6 # ( %
1 *# ( % +
0 1
2 &' ( () ) 3 2 &' ( () ) ) ) ) * )
7 ( ( % 1
0 % "( , , # " $ . ' ( ) 0*
' , , % ! . .) . 6 , 9 .
( . , . . ! . .) 9) )6
% % % 1 , F
$ % & '
· ·
· & '
. ( 9) )6 ( 7 ? % 6 ( ) # ( ,
, % ! . . ( ( % . 7 ) % . 6 ?
( ) . . 6 ? . ( ) . 6 .
% ( , ( . ! . .) , B& , C
' . ( , ( . ! . .) ,
B& , C ' . , ( . ! . .) ,
B "+" &?& , C
. ( ( ( 7 ? ( ) # ( , , %
! . .) . % . 6 . * /+ . ( ( ( . 6
? 5 . 6 # ( , , % ! . .) *# (
+
6 1
2 &' ( () ) 3 2 &' ( () ) 7+(+
2 &' ( () ) 4 2 &' ( () ) 7+(+ 1 * /+
1 % "( , . ( " " ) 1*
. 6 ( 7 6 % ,
7 ( 7 6 ( ( ? ) ? % ( , (
) ) % % , ( 7 6 ( (
% ( ( . .) , .
F
& (
) # * ) #
+
, (
) #
-. ( ( .) ( 7 ? , .
. % % . ( . ? ( 6 ( )
( . 6
8? ( ) . 69? . ( ) ,
. 6 7 5 % 6 # ( .
. % * 0+ . ( ( ( . 6 ? : . 6 # (
, . *# ( +
;
) ) * * () )
) 7) ) * ) * 0+
2 % "( , . ( " ) 2*
. % ( ( % 7 . ? .
, 7 ( . . % , % )
( 6 % ( .) ( 7 % 7 # ( .
( ( . .) , . .
F
!" #
. ( ( .) ( 7 ? , . .
. % % . . ? ( 6 ( ) . . 6
9?
( . ( ) 1 . 6 7 5? % 6 # (
. . . % * 2+ . ( . 6
? / . 6 # ( , . . *# (
! 6+
<
() ) + * () )
) 7) ) * ) * 2+
3 % "( ) 3*
! . 6 7 . ( ! 6 . . 7
! 6 . .) ( ( % ! % .
( 7 6 .) F
!" #
. ( 9) )6 .) ( 7 ? . %
7 ! 6 " * . ( stoplist+? ( . .
.) 7 ! 6 / ? ( 6 % ! % 7
5
. ( ( ( ( 7 ? % 6 # ( % ! . %
* 3+ . ( ( ( . 6 ? = . 6 # ( % !
*# ( . % +
>
7+ ) ) ) () )
) ) + * () ) ( + * 3+
4 %' &" /% "( ) 4*
') ( 1 . 6 7 , , , ,
( . . ( .) 9) )6 % %
) ( 1 , F
· Saya pergi belajar
· Saya pergi makan
· Saya nonton
· Dia sedang nonton juga
7 " ( ( ) ( 1
. ( 9) )6 ( 7 ? # ( ) ( 1
. ( ( % . 7 " ' % . , (
. . . , B# "? & , C? ( 6
% . ) ( ' . . ,
( . % . , B# "? & , C?
. . ) ( ' . , (
. . . % , B& , ? ' ' C?
. ) ( ' % 6 ,
, ( . , B ' ' C? ( 6
% 6 , ( ) ( ) ( (
( ) ( 1 . 6 % . * 4+ . ( ( ( . 6 ? 9
. 6 # ( ! 6 ) ( 1 *# ( ( 7 +
? @A+ ) * ) ) B ) * ) * 4+
5 ( 6 '7' %' &" /% "( ) 5*
( # ( . 6 ! 6 7)7) ) ( 1
6 # ( % ! 6 7)7) ) ( 1 . 6 % .
* 5+ . ( ( ( . 6 ? 8 . 6 # ( % ! 6 7)7)
) ( 1 *# ( ( % 6+
C ! * ) ) ) * ) * 5+
% "( ( " ) *
' ( . 6 , 9 6 7
, . . ( ( ( ( . 6 ( 7 6 .) ? D . 6
7 , , . ? . . 6 7 , , .
( . % . 6 % . * +? . E . 6 1! .
.) . " . 6term 1 , 9 . . .) . %
( keyword term , . . .) 9
1 stoplist
' F
G 'GF
H H
D 'DF
G I
' FG I ' F
'GFG I ')GF
H J I
'GF I 'DF
* +
. '"FE. . # ( % . * +? . " . 6 7 , , 9 term
1 % . K" (entences frequencyi % 7 , ,
. term 1 ? ( . L K" MNO PQ
RSTU %
. ( 9 term 1 . .) ? . 6 7 , ,
. ( .)
'"FE " V L K" * +
. % ? ( . .
; *E et al 55/+ ( Singular Value Decomposition * ; +
. 6W X YZ? . X . 6 (D V D ) singular ? . 6
( . ) D V singular value? . Y . 6 ( V )
singular ) ; % ( ( ? ( . )
% ( ( , . % . ( .) ; ) %
% 9 . ) # ( ( . % . %
% . * "+ . ( ( ( . 6 ? . 6 # ( (
*# ( ( 7 (+? % ! ( ( 9 . % . 7 7 % 7 6 (
) * * *,) * "+
! ' " ( "
) .7 * 434+ ) genetic algorithm . 6
) % 9 , . . ( % . ( 6 . ( (
6 . % . % ( , ( % ( 6 )% (
) 7 ( ? , . . % ( () ( )% 6 . % (
% ( 6 , % , 7 , * ) 55"+
. ( . ) %) . ( , F
% ( ( ) )() . 6 % () ( . ( 6
% )% (
( ( ( %)% (
" Fitness function , ( ( % () (
$ )( ( , 6 ( ( 7 6 %)% ( 7 . %)% ( ,
.
/ ( % %)% ( ? % % )( ( ? . ! 6
(
! " & ' " ( "
( . ) % . % ) 6 ) .7
* 434+? . % . 6 % . 7 $ ( . 7 7 % 7 , F
%)% ( - ? ( fitness? ( ( . . ? % . 6 ( *crossover+? (
7 $ ( ) ) 6 ) .7 * 434+
! '# &"
)% ( - . 6 ( % ) )() - , . 7 ( 9
9 . ( ( )% ( 7 % ( % ) )() 7
6 ( . % )( ( ( ( ? % . 6 ( . ( & 6 %)% ( .
) 7 % . ( 6 , . ( ( ' ) )()
. 6 % , 7 ? , . % ( (
( 7 () ( . . 1 . % 7 % 7 ? float? integer?
string Allele % . ( % ( ( ( % )( (
) ( ( ( . . ) 7 / ! (
( ( % ( ( % , ( ( 6 . )
% 7 %)% ( - , F random generator
Random generator . 6 ( % )( ( % 7 7 9
% ( ( . % ( ( ) )() , .
. 7 real float % random generator % .
( $
L [ \ ) ( ] "^_^F `"abcd * $+
. 8 % 7 ( . 7 9 , . 7
( 7 , "^_^ *! 6 %)% ( + . `"ab*! 6 . % ) )() +
% ). . 6 ( 7 ).
7 ( ) )() , % ( ( (
7 % ). 7 % . % 9 6 ( 6 ,
. 6 . % ' ) )() . % . % ( ( ( 7 ( 7 ? array 7
real 9) )6 % ( ( ) )() F
· Array7 real F 2 4? 4 2? 125
7 / ( ( % , ( ( 6 . )
! &" + &"
. . ) )() . ( 7 . ( ( # (
( 7 % #) ( , Fitness function . 6 ( # ( ,
. ( )% ( . .
fitness . 6 ( , , 7 . ( () (
fitness , . ! . # ( . 9 % )% .
)
. ) ( ? . . , ( fitness
7 6 6 . %? ( . . . , 7 ( . 6
* , ) 55/+ . % ( (? fitness . % ( ( ( 7
() ( ( 6 ( ( ( ( . 6 ( ( (
! &"
( . 6 6 % . ) , 7 # ( 6
) )() , 7 % )( ( % . 6 ( . ( *<)I 55/+ .
. % 9 ) . , 7 fitness ( . .
( 7 ( , . % 6 & ) )()
fitness 9 ? ) 6 ) )() 7 , 7 6 7 %
% . )7! # ) )() 6 . % )7! # . ( ) )() .
- . 6 ( ( ( 7
! ! " . 6 "
. 6 ( % ) %) , % . * A <6
442+ . 6 ( . 6 )% ) . ) , 7 .
. 7 ) )() 7 . 6 ( 6 ( 7
. % 9 , ( % . ! 8% ( . ( . % .
( . . , . . . . % 6 ( 9 9 .
% , . e *% ! . % . 6 ( + 5 0 ( % 5 4/ &
% . 6 ( . . ? . . . % .
* +
( % . % . 6 ( . 6 )% ( *% ?
+ % . 1 , 7 ( ( . . . 6 (
. . 7 . 6 ( . % . ( % . . . %
% . 6 ( , 6 . 7 0 ( ( .
% )( ( % . 6 (
7 0 % )( ( % . 6 (
. 6
. 6 ( ( . 7 , 7 ( , .
( * J ? ?K? 1 + . J % ! ) )() . ( ( ( 9 9
; 7 1 7 . ) )() % . ( 7 6 (
. 7 2? ( ( % . 6 ( ( . % % . 6
( 5 0/ . 5 25
7 2 . 6 ( (
! 0 &"
( . 6 )% ) ( . )% ) % . . )
, 7 % 7 6 ( ) )() ( 9 (%) 7 6
(%) , 7 7 7 , ( ? , ( ) )() 7
, ( 9 7 7 . . ) )() ( 7 , ( . %
9 () ( )% ? , + 7 1 , 6 % .
( 7 , ? + 9 1 7 , 7 % 6 9
% . ( ( 7 , * A <6 442+
( % ( *,f . 6 ( ) ! 6
, . 6 % ( % . ( % ( . ! 6 )
. %)% ( ( , . running program7 ( ,
. 6 5 55 ( % 5 & ( . 6 . 6?
, 9 ? 7 , 7 , ( ) )() . , 6
% . ( 7 , ( 6 ) 6
7 ! . % )( ( ( 7 , * A <6 442+ 7 3
( ( . (
7 3 (
7 4 % 9) )6 % % ( % . , 7 (
7 ? . . 6 . ( %)( ( , ( (
7 % ( 6 ( 9 ( . 6 ( 7 7 %
. ) )() . 7 4? 9 . 6
, (
8
'& . " "
. . 6 % , F 6 % % %
.) (? 6 % % 6 . 6 % % ! 7 5 !
6 % % 6 . % !
7 5 ( ( ( 9 ) ) (
(# ' ( &
7 6 ( .) ( 7 7 6 ( .) (
.) 7 ( ) ) ( 7 7 ( . 7 online 6
') % ( , . . % . ) % ( % * .6 55 +
6 # "6
6 % % 6 7 ( 7 , F ( .) ?
# (? . % ). ) % ! ( ( 1
( 7 ( 7 F
" & ' ( 9
. 6 % ? .) . ( ( 9 ) 6 ) ,
7 7 . & 6 .) , . ( 7 , 55 .) 7
7 7 6 ( .) ( ) . ( . % % *compression
rate+ ( 7 ( "5=? 5=? . 5=
& &" " &
( ( # ( % ( % )( ( . % ( ( (
. .) ( . # ( . 6 ( ( ( % %)( ( *# +?
positive keyword *# +? negative keyword *#"+? % 1 *#$+?
, , % ! . .) *#/+? , .
*#0+? , . . *#2+? % ! #
*#3+? ) ( 1 *#4+? % ! 6 7)7) ) ( 1 *# 5+?
. ( *# + ( 7 6 . ! ( % . 7
('. ' " ( "
. 6 % ? ) 7 # ( ( 7 % 9 % 7)7)
, )% % . % ( ( # ( 6 % ( . ( (
# ( . 6 fitness function , 7 # (
( ) )() )( ( ) . ! % . 7
)( ( ) . . 7 - %)% (
% %)% ( 7 ( 555 ) )() . 7 ? ( 7 6 ) )()
. % ( ( ( 7 ) 7 ( ( 6 # 7)7) . 7
7 )( ( )
7 % ( ( ) )() % . % 7)7) ( ( # (
7 % % ( ( ) )() % . % 7)7) ( (
# ( . ' 7)7) % . ( ( # ( *# +?' 7)7) % . ( (
# ( *# +? . ( ( , )7) ' F ' F I F ' 7 5 .
. ) ( ( 7)7) ( 6 ! 6 7)7) ! . 61
6 % )( ( ) F
)% ( - . 7 ( 9 9 ( 7 , 555 ) )() ? .
% ) )() % ( ( 7)7) ( ( # ( )7)
, . % . ) )() . % % . *" + , 7 # (
. % ( ) %
' % g ' % g ' % . g '
% 0 g '5% 6 g ':% ; g '/
% < g '=% > g '9% ? g ' 8
% C g ' %
7 % ) )() . ( ) 6 1 F-measure? . precision
. recall . % ) 6 . ( 6 ( ( , . 7 ) 6 ( .
6 ( ( ( % ) )() ? % )( (F-measure.
( 7 , 55 .) 1 F-measure. % . 6 % . *" +
9 6 . ( . ( ( ) )()
fitness function ( ) )() 7 # ( 6 ) )() 1
) )() ( ! , . % 6 % )( ( % . 6 ( ? (
. . % 9 ) . , 7
. % . 6 ( , . % . % . 6 5 33 . 6
( ! . ! % , . 6 ( ) )() , . ! . .
7 6 9 . % % . 6 ( , 6 . ,
. % . % . 6 ( . 6 % . 6 ( (
( , . . 6 5
# /5 ( . % % . % )( ( ) . %
7)7) ( ( # ( , )%
% 6 F-measure? precision? . recall * D 1
E ( A 7 )1 ) 444+F
Kh$ i gi g jj G jg j k 3 l k j 3 ll *" +
. i . 6 7)7) . precision * + . recall * +?i m % % .
precision . i n % % . recall F-measure . 5 . ?
) 6 i ( ( 7 6- . 6 6 ( ( ( .
( *% )( ( # ( ( ) . .) + . . 6 ( (
( 9
6 # "
6 % % ! /5 .) 7 7 7 6 ( .) (
*.) , . % . 6 % 7 7 . . .) ,
. % . 6 % % 6 + )( ( ( ! , , ( ( # (
)( ( ( . , . . ( ( # ( 6 % % 6
6 % % 6 ). . % ( ( ( 7 7)7) ' F ' F I F ' % .
# ( , ( 7 )% ') 7 ( 7)7) ' F ' F I F ' . %
% . # ( ( ) ( % . . % . 6 % . *" + (
. ( ( # (
6 7 # ( 6 ( ( 7 6 ( 8 6
? ( 6 . 7 . ( , . 6 . *" +?
. ! 6 , . % )%1( ) compression rate
*< + 5=? 5 =? . "5=
" (7
% 7 , . . %
( 7 7 F
- F : .)-( ; ( ( ((? 6 ( )
- (F L <) * + ) < 3 55 M 5 D? 5"2
: . (# " "
. ( . 7) ) (9 ( ! %
') % ( ) ) 7 5 5 ( % . 7
!
! %' # &
) % ( 7 ( 7 17 ( ) 7 7 6 ( .) ( .
55 ( % % 55 ( 7 7 ( . 7 online 6
') % ( , . . % . ) % ( % .6 * 55 + ) ,
. % . 6 % % 6 ( 7 , 55 .) ) 1.)
( 7 . . 7 ( % % *compression rate+ ( 7 ( "5=?
5=? . 5=? ( 7 . 7 ) 6 . ) , 7 7 . (
. ( 6 ( . ( ,
. 7 ) 6 ( ( ) , . % . 6 % % ! ( 7 , /5
.) ) 1.) ( 7 . . 7 ( % %
*compression rate+ ( 7 ( "5=? 5=? . 5=? ( 7 . 7 ) 6
( ) ( . ( 6 ( .
( , . 7 ) 6 ( ( 1 ! 6 % . .) 7
. 6 0 0
! ' ( ' (
.) . 7 #) H ( . 6 ?
. ! ( .) , . 7 % ( 7 " % 9) )6
#) .) , . % . 6 % % 6 . % !
! (' ' % "(
( ( ( 7 ( ?
) 6 . % % ) ) , 7
. 6 ( 7 6 string . 6 . ( . 7 6
( % 6 , ? . , ? . ( 7
% ) ) 7 % , F
( ( ( . 6 . 7 9 ; <
<) )6 F
1 % . (
1 N
1 6 . ( 7 6 9 O
( ( ( . 6 . % ? 7 ( 6 .
<) )6 F
B . 6 7 C? % . &) )
" % ( ( % )# & ? 9 7 !
%
! ! '. + &"
. ,7 , * 444+ . % . (
6 ( ( ( , extrinsic evaluation . instrinsic evaluation Extrinsic
evaluation . 6 % )( ( % 6 ( ( 7 . ( % . # (
? ( . instrinsic evaluation % ). , 7 . (
% 6 ( ( *% ( ( ) 6 ( ( + . 6 ( (
). instrinsic evaluation .
7 ). recall * +? precision * +? . F-Measure * + % . 6 (
( ) 6 ( * ( + . 6 ( ( , . 7
) 6 ( % 6 F-Measure? precision? . recall
* D 1E ( A 7 )1 ) 444+ F
K G jg j k 3 l k j 3 ll */ +
( ( . 6 6 ( ( ( . ( . . 6 6 ( (
! 0 % "( ( "
( ( . 6 ( 7 6 .) ? D . 6 7 , ,
. ? . . 6 7 , , . ( . %
. 6 % . */ +? . E . 6 1! . .) . " . 6
term 1 , 9 . . .) . %
( keyword, . . .) 9 1 stoplist
' F
' F
H H
o 'oF
I Q
' F I ' FQ
' F I ' FQ
H J I
' F I 'oFQ
*/ +
. '"FE. . # ( % . */ "+? . " . 6 7 , , 9 term
1 % . K" (entences frequencyi % 7 , ,
. term 1 ? ( . L K" MNO PQ
RSTU %
. ( 9 term 1 . .) ? . 6 7 , ,
. ( .)
'"FE " V L KE */ "+
Singular Value Decomposition * ; + . % % . (
W . W X YZ? . X . 6 ( D V D ) singular ?
. 6 ( . ) D V singular value? . Y . 6 ( V
) singular ( . ; . 6 ( ,
7 ( ! . ( , 7 6 9 . ( 7 ( 7 . ( . ( '
. . ( . ( . 6 - ) % ( %
6 . ( ( 7 % % 6 .
. ( ( 6 . 6 7 . 9 ,
! (? . ( 6 . )% % ( . ( 7 7
W Xp pYpZ . ( ; ? % 7 ( ) % .
. * , A ( 44/+? . ( . 6 . )
singular Z ; . . 7 (? . 7 ( ( 7
% ( ( ) ? ( 6 ) . % . 6 % .
*/ $+
Y WZXp pq */ $+
). # ( 6 ( ( / $ . % 1 (
P; * 55/+ 9 6 7 % .
( / /
* F r */ /+
6 7 ( % 1 , F
* F
* F
H H
Q * QF
I Q
* F I * F Q
* F I * F Q
H J I
* QF I * QF Q
; ) % ( ( term , . % . ( .) ; )
% % 9 . )( ( % 7)7) .
% . %1 % .) % 6 . .) % ! )( ( ; .
( 6 % 7)7) 6 . 9) )6 % 6
( % )( ( ; F
( F ( ( 7
( F % 7 . ( 7 6 %
(" F ( 7 .
7 Term frequency. inverse sentences frequency
( ("
( 5 5 /3$40"
7 5 5 /3$40"
% " 5
% 5 5 /3$40"
( 5 5 /3$40"
7 5 5 /3$40"
5 5 /3$40"
( . 7 . % " V L K"s . 7
! 6 ( % 7)7) term % . % 6 % ( ! , . 6
% )( ( ; . . ! . % ) ; )
7 7)7) % .
( ( ("
( 5 /3$40" 5 5 /3$40"
7 /3$40" 5 5
% 5 5 5
% 5 " 044 / 5
( /3$40" 5 5
7 5 5 /3$40" 5 /3$40"
5 5 /3$40" 5 /3$40"
7 " ; )
( 5 5 $0 1" 2"2
( " 0/ 5 5 3
(" 5 503/ 15 52$3
. ( ) ? . % 6 %
( / /? ( 6 7 ( % ? . !
% . 7 $ ( 6 . % )( ( ( . 6
( ) . 6 . " ( ) ? ( 6 , . . %
7 6- " 6 7 ( , ? ( .
6 7 ( , . 6
7 $ ( %
( ( (" ) ( )
( 15 55/ 52 5 "5 5 "
( 15 55/ 5 300 5 2 5 3
(" 52 5 300 5 $ 24/4
! 6 50003 0 30 4"3 0 30/2$0
! 1 ('. ' " ( "
). ) . % . 6 % % 6 .
% 9)7 ). ) . 6 . % compression rate
*< + 5=? < 5=? . < "5= ! . % ). )
. 6 7)7) , )% % . %1 % # ( ( .
< 5=? . < "5= ). 1 ). ) )() ( 7 . % . 6 %
% ! ). ) . 7 7 % 7 , F
% ( ( ) )()
6 ( ) %) % % . ) . 6 ) )()
' ) )() % . % ). ) . % ( ( ( 7
, 7 ( 7)7) # ( . 7 ' F ' F I F ' 7)7)
( 7 . 6 ( . % )( ( 9 5 ( % . . % )( (
) ( ( ! 6 7)7) 7 % ( ( ) )()
. ! % . 7 $
7 $ % ( ( ) )()
-- % . % ). ) . ( 555
) )() % %)% ( ? /5 ( ? % % . 6 ( . 6 5 33?
. % ( . 6 5 ( . % % % . 6 ( .
% ( . 7 . ( (%
" ( (
. 6 % % 6 ? % )( ( ( % . ) 7 # (
( 7 ( ( ( ( ) 6 ( ( . ?
. ! % . ( / )( ( # ( ( . 6 ( 7 7 F
1 . ( ( ? ( 7 6 ) )() , 7 ( *' F ' F I F ' +
. % % . ( % % . .) % 6 . % !
% . 6 % % ! 6 , . ). ) )() ,
7 , . . % % . 6 % % 6
1 ) * + J' % g ' % g ' % . g
' % 0 g '5% 6 g ':% ; g
'/% < g '=% > g '9% ? g
' 8% C g ' %
1 ) . % . % .) % 6 . % ! ?
1 ( . ( ( 7 . ( % . % )( ( % %
compression rate *< + ( 7 ( 5=? 5 =? . "5=? , 7
6-7 , , % . % .) . . < 5=? <
5=? . < "5=
1 ( ( . ( ( . ( . ( */ +?
( 6 6 ( ( F-measure. % .)
1 F-measure % . ( 7 6 ) )() . 6 1 F-measure
( . ( 6 .) % 6
1 % ( ( ? . 7 % ) )() 7 . . 7
. %)% (
$ ( ) )()
)( ( ( ( ) )() % . % ). ) . . ( ) 6
F-measure . %1 % ) )() ? 7 F-measure. 7 - 6 7 (
) )() ( 7 . . ( ( .
F-measure ( (? , 7 ( F-measure , . 9 % 7 . (
. 6 F-measure 7 . ( 1 ( ( % (
& 6 F-measure 7 . ( 1 ( ( . 7 . (
! 6 ) )() . 7 . ! 6 (
/ )( ( % . 6 (
)( ( % . 6 ( ! . ! % , . 6 ( 7 6 9
. 7 . % % . 6 ( . % ? ,
% . 6 ( . ) ) ' ( % ) ) ' .
. ( ( ( 9 9 ) )() . % . ,
6 . ( ( ( 9 9 ) )() 7 !
. % ) )() , 7 . 7 . ( 9
. ) ( % ( , % . 6 (
. ) ( ( 7 . ! ! . ) )()
7 ! 6 ( 7 / ! % )( ( % . 6 ( . .
0 )( ( (
)( ( ( ! . ! % , . 6 ( 7 6 9 . 7 .
% ( , . ( . 6 , 7 . . ) )
9 . ) ( % ( . . ( 9 9 ( 6 ,
7 ! 6 ( , ( . ) ( ( 7
. ! ! . ) )() 7 ! 6 ( . 7
0 ! . % )( ( (
7 / % )( ( % . 6 ( . .
7 0 % )( ( (
2 ). ) )() 7
)( ( ) . . % - ? ( fitness?
% )( ( % . 6 ( ? ( % % )( ( ( . % ? % )( ( )
( ( ( . . % ). ) )() , 7 ). ) )()
7 , . ( 7 7)7) , )% % . 6 %
% ! . 7 / ! 6 ( ). ) )() 7 % . <
"5= 5 # . #
7 / <) )6 ). ) )() 7 < "5=
' ' ' ' '5 ': '/ '= '9 ' 8 '
5 # 5 553 5 5"4 5 555 5 530 5 /50 5 5 5 534 5 52 5 5$4 5 55$ 5 555
# 5 505 5 5/0 5 555 5 / 5 $ 3 5 5/5 5 5// 5 55" 5 5 0 5 5/ 5 5/0
! 2 &" " '. ' " ( "
! . ( 7 , % 9)7 ( 1 ( <
5=? < 5=? . < "5= ( F-measure . 6 7 . ( .
( 6 .) % ! . 6 % ? % ! . % . ).
) )() 7 ' F ' F I F ' % . < 5=? < 5=? . < "5=
! 2 &" . 6 # "
7 2 ! 1 F-measure % . 6 % % !
( 1 ( compression rate *< 5=? < 5=? . < "5=+ F-measure
( 7 . . F-measure , ( % 6 # ( .
F-measure , ( 7 ( # ( . ( 7 2?
F-measure . ( 9 ( # . % compression rate
( % 6 # ( . ( 7 ( # ( % . < 5= 6 ,
F-measure ( 7 ( " 0=? % . < 5=
% ( 7 ( 5 /3=? . < "5= % ( 7 ( //=
? 1 F-measure ( 9 . < 5=
< 5= ( 7 ( 0 3=? . < 5= < "5= ( 7 ( 0 2=
. < "5= ! ( % . 7 .
. 6 ( ( . < 5=? . < 5= ! 7
6-( 7 ( compression rate % 6 ( ( ( (
7 2 7 . % ! F-measure>( % 6 # (> * + .
>( 7 ( # (> *t+ % . < 5=? < 5=? . < "5=
! 2 "& '. % '('&'(
. ( 7 2? < "5= F-measure %
. 7 . . 6 ( F-measure . < 5=? . < 5= 8 6
? % ( ). ) )() ).
) )() < "5= ! ( ). ) )() % . % . 6
7)7) # ( , % . . % ( ( ( 6
7)7) 17)7) # ( , . % . % . 7 . . % (
( ). ) )() < "5= * % + . ( ( % . 7 0 .
7 0? 7)7) . 7 5 . 7)7) . 6 . 7 5 ( 6
) ( 7)7) 7 ! 6 /5 ! ( ( ( 7 . 6
% 7)7) # ( . ( # 1# (
. ( 7 0? 7)7) . % % . # ( B ,
, % ! . C , '5 . '5 1 7)7) ,
( % % 9)7 , . % . 6 % % 6 , # ( B
( ( 7 % , %
. .) 8 6 ? # ( B , , % ! . C
% , % . % ( (
7 0 ( ( 7)7) % . ). ) )() < "5=
Bobot
Percobaan Jumlah
total bobot
1 2 3 4 5
' 4 2 4 1 8 19
' 5 5 8 5 7 30
' 0 1 0 0 0 1
' 9 9 3 9 9 39
'5 10 10 9 10 10 49
': 7 6 2 6 3 24
'/ 8 7 1 7 5 28
'= 2 4 7 2 1 16
'9 1 3 10 4 2 20
' 8 3 0 6 8 4 21
' 6 8 5 3 6 28
)7) ' *# ( B % 1 C+ % 7)7)
. ( 6 # ( B , , % ! . C . (
7 0? # ( B % 1 C 1 4 % . %
% 9)7 9 % . % 9)7 ( ) 7)7) ( 7 . 6 #
( B % 1 C % 7 9 .
( . 9 . ( 6 7
# ( B % 1 C . % ( ( . % 7
) 7 ( , % . .) ( 8 6
? # ( B % 1 C % 7 % .
% ( (
( Bpositive keywordC 7)7) *' + .
% 7 9 . ( % . .) ( 6
# ( ( 7 7 ) 7 ( , %
. .) 8 6 ? # ( Bpositive keywordC % . 7
. % ( (
( B ( C . # ( B , . .
C 7)7) , ( , 3 7)7) # (
B , . . C % . % 9)7
7)7) % . 6 , ? , ( 7 ( 7)7) '/ # . 6 ( .
7)7) # B ( C # ( 7 ( . ( ) 7)7)
( 7 . 6 # ( B ( C % 7 6 7
( . .) ( 6 # ( ( 7
% , . % ( ( . %
7)7) ' % ! *% % #
(+
( ( % %)( ( *# +? , .
*#0+? % ! *#3+? ) ( 1 *#4+? % ! 6 7)7) ) (
1 *# 5+ % , % % . % ( (
7)7) . # 1# ( ( 7 ( 6 . 7 - 6 / , . 6
7 7 % # ( ( 7 . % . 7 . % ( ( % (
% . % . % 6 * 6 7 3+
( Bnegative keywordC 7)7) ' . 6 . 1
) % . ( % % 9)7 , . % . 6 % % 6 ( .
( ) 7)7) ( 7 . 6 # ( Bnegative keywordC % 7
. 9 . ( % . .) ( 6 # (
( 7 . 7 ) 7 ( , %
. .) 8 6 ? # ( Bnegative keywordC . % . 7
. % ( (
7 2 ! % 7)7) # ( . 7)7) 7 (
( % 7)7) 9 ! . % 7)7) # ( . 6
( # ( , % . % ( ( . (
% 7)7) ( 7 ? % % ! .
'5F ' F ' F ' ? 7)7) # ( '5F ' F ' F ' F '/F ': ? . % 7)7) # ( '5F ' F ' F ' F '/F ':F ' 8F '9 . ( 7 ( 7)7) # (
'5F ' F ' F ' F '/F ':F ' 8F '9F ' F '=F ' s ! % ! .
7 7 % 9 # ( . 6 ! 6 # (
, - ( 7 ( # ( 7 ( % 6 ( %
7 2 7)7)
Ranking Bobot
Fitur Teks
Jumlah Bobot
1 '5 49
2 ' 39
3 ' 30
4 ' 28
5 '/ 28
6 ': 24
7 ' 8 21
8 '9 20
9 ' 19
10 '= 16
11 ' 1
7 3 ! ! # ( 6 . % ( . (
7 3? % . 7)7) # ( '5F ' % . 6 % % !
6 ( 1 ( ( 7 ( $ 0=? % 7)7) # (
'5F ' F ' F ' 6 ( 1 ( ( 7 ( $0 $$=? 7)7) # ( '5F ' F ' F ' F '/F ': 6 ( 1 ( ( 7 (
$2 =? . % 7)7) # ( '5F ' F ' F ' F '/F ':F ' 8F '9 6 (
1 ( ( 7 ( $2 5=? . ( 7 ( 7)7) # (
'5F ' F ' F ' F '/F ':F ' 8F '9F ' F '=F ' 6 ( 1 (
( 7 ( $2 0"=
% # ( % . 6 % % ! / 3=
. 7 . . . # ( ? % 7 .
( . 6 ( 7 ( = 8 6 ? % % # ( *#/? #$? # ?
# + % . 6 % % ! . % % ( ( 6 ( ( . ( 7 ( #
(
7 3 ' ! # ( 6 . % (
! 3 : %'(# &"
( - ) % ( . - ) % (
6 . % % ! 6 # ( . % !
% 7 . - ) % ( % ). ) ,
compression rate 5=? 5= . "5=
% 9)7 % ). ) * 6 % % 6 +
7 . - running program . % 9)7 * 6 % % 6 +
% . compression rate 5=? 5=? . "5= . ( ! 7
). ) )() . ( 7 ( # ( % . < "5= 7 6
-0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
2 4 6 8 11
(
) % ( 1 / 30 ! ? < 5= 7 6 - ) % ( 1
" $3 ! ? . < 5= 7 6 - ) % ( 1 / $ !
. ( 7 4? . 7)7) # ( '5F ' 6 . % (
- ) % ( 1 /0 . ? % 7)7) # (
'5F ' F ' F ' - ) % ( 1 /45 0 . ? 7)7) # ( '5F ' F ' F ' F '/F ': 7 6 - ) % ( 1 02 3
. ? . % 7)7) # ( '5F ' F ' F ' F '/F ':F ' 8F '9
- ) % ( 1 024 0 . ? . ( 7 ( 7)7) # (
'5F ' F ' F ' F '/F ':F ' 8F '9F ' F '=F ' 7 6 - ) % (
1 03" / . ( 6 - ) % ( . . #
( . % # ( . 6 ""$ 0 . ? , ! . ( 9
( # . % # ( ' - ) % (
( 7 . ( 7 7 % # ( ( 7 # (
7 6 , ( : ) % ( # ( B
( C 7 6 1 "55 .
7 4 & 6 # ( 6 . % - (
-100 200 300 400 500 600 700 800
2 4 6 8 11
:
*.
+
0 %
0 % &"(#
6 ( % , 6 . . % . ( % 7 7 % 6
7 F
) . % . ( 7 % 7)7) , )%
% . # (
)7) % . # ( *#/+ , B , , % ! . C (
% . % ( (? . # ( *#"+ , Bnegative
keywordC . % . 7 . % ( (
" ( Bpositive keyword *# +C? B % 1 *#$+C? B
, , % ! . .) *#/+C? B ( *# +C . %
- ( 7 ( # ( % ( (
$ : ) % ( % # ( *# ? #$? #/? # + 7 6 ( . 7 .
. - ) % ( ( ( ( 7 ( # (
/ 7 ( compression rate ( (
0 7 6 ( # ( . ; %
# ,
0
7 % ( ( 6 . % % ( ( 7 6 (
.) ( ) ? , F
. , % 7 7 6 ! % 7 6 # ( ( 6
(
- ) % ( % ). )
" ( .) ( 7 , . ) 6 % , ( (
. )% .)
$ . , % 7 % ( ( . 7 7 % ).
7 ( 6 ! . % 7 . ( (
%
D , ? 6 . . 442 Using lexical chains for text summarization
Proceedings of Intelligent Scalable Text Summarization Workshop * >42+ <
D 1E ( ? 7 )1 ) 444 Modern information retrieval < ((
- E) .. () 1: ( ,
' 55/ Singular Value Decomposition Tutorial
6 %FQQ- 7 9( % . . QR% 3"Q-%1) Q % ) .(Q 5 5Q 5 S 4 % 5 5T
, :? 44/ Using linear algreba for intelligent information
retrieval
<? :? ( ? ( 55 A semantic approach to selecting fiturs
from text < /4U00
<)I 55/ Fuzzy modeling and genetic algorithm for data mining and
exploration F ) ' # 7 (6
. .() 404 New methods in automatic extracting Journal of ACM
0* +F 0$1 3/
6 ? 553 Automatic text summarization )9 . )# :) .
9 . 9 )# 9 9 ? . 96 ) ) , "521033$
? <6 442 Genetic algorithm and engineering design &)6 : , A
) (? 9 < .
- :? 96 . ? 553 Pedoman penyajian karya ilmiah
) ) F ((
) .7 434 Genetic algorithms in search, optimization, and machine
learning .. () : ( , ) ? 9
) 55" Algoritma genetika dan contoh aplikasinya. 6 %FQQ
. ,6 ) - 76)% ) S 5 5T
) , ? < 442 Automatic text summarization in summarist ACL/EACL-97
Workshop on Intelligent Scalable Text Summarization 31 $
& D '? 7 & 553 Automatic text summarization *The state of the art
'6 (( D . 6 ? V # ? (( ? . 550 Genetic Mining : Using genetic for topic based on Concept Distibution:) . 9 . , )#
9 9 ? . 96 ) ) , " $$1 $2
? 6 ? . 9 , < 442 Automatic text summarization by
paragraph extraction )9 . ( )# 6 < >42Q < >42 :) (6)% )
9 7 I D ) . 39-46.
. ? ) , ? 9' )- ' 55 . Introduction to the special issue on text
summarization. Computer linguist 3*$+
.6 55 Pengindeksan otomatis dengan istilah tunggal untuk dokumen
berbahasa indonesia S( %( T ) ) ') % ? .
6 ? ( ) )
< ? %% ? (? ' ( < 55$ Automatic text summarization
with genetic algorithm-based attribute selection 46 7 )1 9 <) # 9
) ? 9 ) ( <) % 9 9 "5/1" $
, ) 55/ Algoritme genetika dalam matlab 7 E) ,
E 6 &? ' ? E :? 55/ Text summarization using a trainable
summarizer and latent semantic analysis #) ) )9 (( A
% ). ) )() < "5=
Percobaan model kromosom CR 30%
1 2 3 4 5
F-measure 0.427 0.427 0.416 0.429 0.424
' 0.015 0.004 0.046 0.008 0.06
' 0.043 0.045 0.109 0.047 0.056
' 0 0 0 0 0
' 0.195 0.317 0.039 0.181 0.225
'5 0.553 0.324 0.22 0.396 0.428
': 0.062 0.053 0.038 0.061 0.05
'/ 0.063 0.068 0.013 0.071 0.055
'= 0.002 0.042 0.069 0.013 0.003
'9 0.002 0.024 0.347 0.032 0.016
' 8 0.014 0 0.062 0.172 0.051
7" 8# ) 7 8
! 1 ! ! 3 ! "
" 9 1 ! # #
" 7!'8# 9 " 7!%8# 9
" 7!-8# " " 7!:8# " " 7!+8#
" " ! 7!*8# " " ! " 7!;8#
" 9 7!,8# ! 7!<8# !
! " 7!'&8# " ! 7!''8 2 9
!! " ! ! " ! 3 #
" ! " "" " ! " ! "
" " !
! /9 ! 1 3 = =
" " !''
" = - %*> ' ++> ! " ! '&>
-&># " 9 . # " = & +,> !
" ! %&> ! 1 !
!%# !:# !+# !'' " 9 ! " 9 !
6 ( .) ( ( .)
- , 7 6 ( . 7 . 7 9 ( 6 ( .) ? ( 6
( ( ! . ( % . ? 7 (
.) - . 7 , , 7 , 7 .) , . (
7 ! 6 7 , . ( .) , % ! 8 6 ? ( (
.) ( 9 ) ) ( . % ( ( 6 - 7 9 .
7 ,
( ( . 6 % )( ( , 6 ( .) , 7 6
9 /5= . .) * . et al. 55 + . ! % ) 6
#) ( . - ( * et. al 55 + * . .() 404@
) , A 442+ % ( (? 7 17
( % ! . 7 7? ( 7 ? . - % 7 , %
? . .() * 404+ # ( ( % B% . ( C? B% .
( % C? B ( ! ( C % # ( , 7
. # ( 7 , % . (
' % ( ( 7 . 7 , % ( (
7 . ( ( ( . 7( ( *& D A 7 553+ ( (
% ( , 1 ( , % %
% #) # . ( ( 7 ! . ( ? ( . 7( (
. 6 7 ( . ( ( 7 . 7 ( .
9 % 1 7 , % ( ( ( ( ( 7
. 7 7 7 . *& D A 7 553+
7 % ). % ( ( ) ) ( , 6 .
% ( ( ( * D , A 6 . . 442+
( 7 ). % ) 6 % ( ( ( et al * 442+ 7
% ( ( . bushy path 6 (
( ( % %6 E 6 et al * 55/+ 7 ( .
( ( ( . % . . )
* et al. 55$@ '6 (( D . 6 et al. 550@ 6 A 553+
) . 9 7)7) )% % . # (
7)7) % 7 % . % ( (
*'6 (( D . 6 et al. 550@ 6 A 553+ 6 7 ( (
. ) ( 7 % 7)7)
'6 (( D . 6 et al. * 550+ ) 7 6 # # . %
7)7) . 7 . .
( % , . ) 6 6 . * 553+ !
7 6- % ( ( , . 6 ( . )
7 6 7 . 7 . ( ( .
) , $$ 4$= . $" 4 = % ( (
(
. % 6 . * 553+ 7 5 # (
7 ( . ) ? . 7 6 7
( ' ( . 6 , 9
6 7 7 . ( ( ' ( . % .
. singular value decomposition * ; + 8 6
? % % . 7 ( ( .
7 ( % 6 # ( * 6 A 553+ . # (
( 7)7) )% % % # (
. )
. ( 7 ( 7 ? % 7 !
)% ( % ( ( . )
. ( % 7 6 ( ( # ( (
# . % . 6 6 ( ( ( ,
)% . % ( ( ( 9 9 % . 6
% ) 6 ( .)
! " #
( . % 7 ( ( % ( ( 7 (
% , 6 ( . ! . 9 % ( 7 7 F
( ( ( , . . 6 7 6 ( .) (
.) , . . 6 7 ( )
$
%
" & &
( ( . 6 % )( ( % % ( ( 7 . (
7 6 % . % % 6 #) ( , .
. . , * D , A 6 . . 442+ . . % ( ( ,
% ( ( 7 . ( ( ( . 7( ( *& D A 7
553+ ( ( % ( , 1 (
, % % % #) # . ( ( 7 ! . ( ?
( . 7( ( . 6 7 ( . ( ( 7 .
7 ( . 9 % 1 7 ,
% ( ( ( ( ( 7 . 7 7 7 . *& D A
7 553+
# . % . . # ( ( 7 #) ( , )%
% )% ( 7 . ( , . . ( ) 6 . % ) )
% # , 7 . 6 % # , % 6 .
7 - % 7 9 6 . 7 ( #) ( , . 7
% ( , . 1 . % ) ) , * - et al 553+
& &" " &
( % 6 # ( 7 . ( % 6
. * 553+ , F %)( ( ? positive keywordG negative keyword?
% ? , , % ! . ? ,
. ? , . . ? % !
? ) ( 1 ? % ! 6 7)7) ) ( 1 ? .
% 7 6 # ( ( . ;
'&"&" % "( ) *
)( ( . 6 . ( 7 6 % # . %
% % 8 6 ? % ( 7
7 . ( %)( ( , 9) )6 # ( %)( ( % . ( 7 6
.)
!" #
. ( 9) )6 .) ( 7 ? % 6 ( ) # (
%)( ( % . 6 ? ( ) . . 6 ? ( )
. 6 ? . ( ) % . 6 8 6 ?
6 ( ) # ( %)( ( . % . 6 % . * +
* +
( ( ( . 6 . . % #? . 6 # ( %)( (
*# ( ( +? . 6 ) ! 6 . ( % # . H
. 6 %)( ( . % % #
'&" "+ % ,-' . ) *
Positive keyword . 6 , % 7 , 9 % . ( 7 6
( ( positive keyword % . .) % 6 .
( F
!" #
!"
. ( ( .) ( 7 ? merokok % ,
( * 6 % % 6 % . ( + . 6 ?
. 6 ? . 6 ? . 6 8 6
? 6 ( ) # (positive keyword . % . 6 % . * +
! " #
"$
% &' (" * +
( ( ( . 6 . ( .) ? . 6 .
.) ? . 6 # (positive keyword*# ( . +? . 6 ! 6
keyword . ? " . 6 7 , , keyword 1 , 9 .
&' (" &' ("&' (
"
&' (" ) * ) () ) ) * ) () )* ) ) () * ) )) (+ &' ("
) * ) () ) ,+ , ) * ) () () ) * ) )
) * ) () ) ,+ , ) * )
&' (" ) * ) () ) ) * ) () ),+ , ) * ) (),+ , ) * )) (+ &' ("
&' (" . 6 % 6 . ) % ( % 6 * ( +?
"? ? . % ! . 6 B(C % . 6 %
% !
"+ % ,-' . ) *
Negative keyword % 7 . # ( positive keyword
Negative keyword . 6 , ( . 9 .
( ( negative keyword% . .) % 6 . ( F
!" #
. ( ( .) ( 7 ? ekstra % , 9
% . . % , . 9 % . (
- ) . 6 ? ) - . 6 ? - . 6 ? )
. 6 8 6 ? 6 ( ) # ( negative keyword . %
. 6 % . * "+
. ! "
#
"$
% - &' (" * "+
( ( ( . 6 . ( .) ? . 6 .
.) ? . 6 # (negative keyword*# ( +? . 6 ! 6
keyword . ? " . 6 7 , , keyword 1 , 9 .
! % (" "# /% "( ) !*
' % 1 % , 9 . (
. , 9 . 9) )6 % %
% 1 , F
· · ·
. ( ( 7 ? % 6 ( ) # (
% 1 . ( ( % . 7 ) %
. 6
/? ( ) . . 6/? . ( ) . 6/ .
% , ( . . .
? , B# "? & , ? ' ' C ' . . ,
( . ( . ? , B# "? & , C '
. , ( . ( . .
, B& , ? ' ' C . ( ( ( % 1 % .
7 ? ( ) # ( % 1 . 6 .
* $+ . ( ( ( . 6 ? . 6 # ( %
1 *# ( % +
0 1
2 &' ( () ) 3 2 &' ( () ) ) ) ) * )
7 ( ( % 1
0 % "( , , # " $ . ' ( ) 0*
' , , % ! . .) . 6 , 9 .
( . , . . ! . .) 9) )6
% % % 1 , F
$ % & '
· ·
· & '
. ( 9) )6 ( 7 ? % 6 ( ) # ( ,
, % ! . . ( ( % . 7 ) % . 6 ?
( ) . . 6 ? . ( ) . 6 .
% ( , ( . ! . .) , B& , C
' . ( , ( . ! . .) ,
B& , C ' . , ( . ! . .) ,
B "+" &?& , C
. ( ( ( 7 ? ( ) # ( , , %
! . .) . % . 6 . * /+ . ( ( ( . 6
? 5 . 6 # ( , , % ! . .) *# (
+
6 1
2 &' ( () ) 3 2 &' ( () ) 7+(+
2 &' ( () ) 4 2 &' ( () ) 7+(+ 1 * /+
1 % "( , . ( " " ) 1*
. 6 ( 7 6 % ,
7 ( 7 6 ( ( ? ) ? % ( , (
) ) % % , ( 7 6 ( (
% ( ( . .) , .
F
& (
) # * ) #
+
, (
) #
-. ( ( .) ( 7 ? , .
. % % . ( . ? ( 6 ( )
( . 6
8? ( ) . 69? . ( ) ,
. 6 7 5 % 6 # ( .
. % * 0+ . ( ( ( . 6 ? : . 6 # (
, . *# ( +
;
) ) * * () )
) 7) ) * ) * 0+
2 % "( , . ( " ) 2*
. % ( ( % 7 . ? .
, 7 ( . . % , % )
( 6 % ( .) ( 7 % 7 # ( .
( ( . .) , . .
F
!" #
. ( ( .) ( 7 ? , . .
. % % . . ? ( 6 ( ) . . 6
9?
( . ( ) 1 . 6 7 5? % 6 # (
. . . % * 2+ . ( . 6
? / . 6 # ( , . . *# (
! 6+
<
() ) + * () )
) 7) ) * ) * 2+
3 % "( ) 3*
! . 6 7 . ( ! 6 . . 7
! 6 . .) ( ( % ! % .
( 7 6 .) F
!" #
. ( 9) )6 .) ( 7 ? . %
7 ! 6 " * . ( stoplist+? ( . .
.) 7 ! 6 / ? ( 6 % ! % 7
5
. ( ( ( ( 7 ? % 6 # ( % ! . %
* 3+ . ( ( ( . 6 ? = . 6 # ( % !
*# ( . % +
>
7+ ) ) ) () )
) ) + * () ) ( + * 3+
4 %' &" /% "( ) 4*
') ( 1 . 6 7 , , , ,
( . . ( .) 9) )6 % %
) ( 1 , F
· Saya pergi belajar
· Saya pergi makan
· Saya nonton
· Dia sedang nonton juga
7 " ( ( ) ( 1
. ( 9) )6 ( 7 ? # ( ) ( 1
. ( ( % . 7 " ' % . , (
. . . , B# "? & , C? ( 6
% . ) ( ' . . ,
( . % . , B# "? & , C?
. . ) ( ' . , (
. . . % , B& , ? ' ' C?
. ) ( ' % 6 ,
, ( . , B ' ' C? ( 6
% 6 , ( ) ( ) ( (
( ) ( 1 . 6 % . * 4+ . ( ( ( . 6 ? 9
. 6 # ( ! 6 ) ( 1 *# ( ( 7 +
? @A+ ) * ) ) B ) * ) * 4+
5 ( 6 '7' %' &" /% "( ) 5*
( # ( . 6 ! 6 7)7) ) ( 1
6 # ( % ! 6 7)7) ) ( 1 . 6 % .
* 5+ . ( ( ( . 6 ? 8 . 6 # ( % ! 6 7)7)
) ( 1 *# ( ( % 6+
C ! * ) ) ) * ) * 5+
% "( ( " ) *
' ( . 6 , 9 6 7
, . . ( ( ( ( . 6 ( 7 6 .) ? D . 6
7 , , . ? . . 6 7 , , .
( . % . 6 % . * +? . E . 6 1! .
.) . " . 6term 1 , 9 . . .) . %
( keyword term , . . .) 9
1 stoplist
' F
G 'GF
H H
D 'DF
G I
' FG I ' F
'GFG I ')GF
H J I
'GF I 'DF
* +
. '"FE. . # ( % . * +? . " . 6 7 , , 9 term
1 % . K" (entences frequencyi % 7 , ,
. term 1 ? ( . L K" MNO PQ
RSTU %
. ( 9 term 1 . .) ? . 6 7 , ,
. ( .)
'"FE " V L K" * +
. % ? ( . .
; *E et al 55/+ ( Singular Value Decomposition * ; +
. 6W X YZ? . X . 6 (D V D ) singular ? . 6
( . ) D V singular value? . Y . 6 ( V )
singular ) ; % ( ( ? ( . )
% ( ( , . % . ( .) ; ) %
% 9 . ) # ( ( . % . %
% . * "+ . ( ( ( . 6 ? . 6 # ( (
*# ( ( 7 (+? % ! ( ( 9 . % . 7 7 % 7 6 (
) * * *,) * "+
! ' " ( "
) .7 * 434+ ) genetic algorithm . 6
) % 9 , . . ( % . ( 6 . ( (
6 . % . % ( , ( % ( 6 )% (
) 7 ( ? , . . % ( () ( )% 6 . % (
% ( 6 , % , 7 , * ) 55"+
. ( . ) %) . ( , F
% ( ( ) )() . 6 % () ( . ( 6
% )% (
( ( ( %)% (
" Fitness function , ( ( % () (
$ )( ( , 6 ( ( 7 6 %)% ( 7 . %)% ( ,
.
/ ( % %)% ( ? % % )( ( ? . ! 6
(
! " & ' " ( "
( . ) % . % ) 6 ) .7
* 434+? . % . 6 % . 7 $ ( . 7 7 % 7 , F
%)% ( - ? ( fitness? ( ( . . ? % . 6 ( *crossover+? (
7 $ ( ) ) 6 ) .7 * 434+
! '# &"
)% ( - . 6 ( % ) )() - , . 7 ( 9
9 . ( ( )% ( 7 % ( % ) )() 7
6 ( . % )( ( ( ( ? % . 6 ( . ( & 6 %)% ( .
) 7 % . ( 6 , . ( ( ' ) )()
. 6 % , 7 ? , . % ( (
( 7 () ( . . 1 . % 7 % 7 ? float? integer?
string Allele % . ( % ( ( ( % )( (
) ( ( ( . . ) 7 / ! (
( ( % ( ( % , ( ( 6 . )
% 7 %)% ( - , F random generator
Random generator . 6 ( % )( ( % 7 7 9
% ( ( . % ( ( ) )() , .
. 7 real float % random generator % .
( $
L [ \ ) ( ] "^_^F `"abcd * $+
. 8 % 7 ( . 7 9 , . 7
( 7 , "^_^ *! 6 %)% ( + . `"ab*! 6 . % ) )() +
% ). . 6 ( 7 ).
7 ( ) )() , % ( ( (
7 % ). 7 % . % 9 6 ( 6 ,
. 6 . % ' ) )() . % . % ( ( ( 7 ( 7 ? array 7
real 9) )6 % ( ( ) )() F
· Array7 real F 2 4? 4 2? 125
7 / ( ( % , ( ( 6 . )
! &" + &"
. . ) )() . ( 7 . ( ( # (
( 7 % #) ( , Fitness function . 6 ( # ( ,
. ( )% ( . .
fitness . 6 ( , , 7 . ( () (
fitness , . ! . # ( . 9 % )% .
)
. ) ( ? . . , ( fitness
7 6 6 . %? ( . . . , 7 ( . 6
* , ) 55/+ . % ( (? fitness . % ( ( ( 7
() ( ( 6 ( ( ( ( . 6 ( ( (
! &"
( . 6 6 % . ) , 7 # ( 6
) )() , 7 % )( ( % . 6 ( . ( *<)I 55/+ .
. % 9 ) . , 7 fitness ( . .
( 7 ( , . % 6 & ) )()
fitness 9 ? ) 6 ) )() 7 , 7 6 7 %
% . )7! # ) )() 6 . % )7! # . ( ) )() .
- . 6 ( ( ( 7
! ! " . 6 "
. 6 ( % ) %) , % . * A <6
442+ . 6 ( . 6 )% ) . ) , 7 .
. 7 ) )() 7 . 6 ( 6 ( 7
. % 9 , ( % . ! 8% ( . ( . % .
( . . , . . . . % 6 ( 9 9 .
% , . e *% ! . % . 6 ( + 5 0 ( % 5 4/ &
% . 6 ( . . ? . . . % .
* +
( % . % . 6 ( . 6 )% ( *% ?
+ % . 1 , 7 ( ( . . . 6 (
. . 7 . 6 ( . % . ( % . . . %
% . 6 ( , 6 . 7 0 ( ( .
% )( ( % . 6 (
7 0 % )( ( % . 6 (
. 6
. 6 ( ( . 7 , 7 ( , .
( * J ? ?K? 1 + . J % ! ) )() . ( ( ( 9 9
; 7 1 7 . ) )() % . ( 7 6 (
. 7 2? ( ( % . 6 ( ( . % % . 6
( 5 0/ . 5 25
7 2 . 6 ( (
! 0 &"
( . 6 )% ) ( . )% ) % . . )
, 7 % 7 6 ( ) )() ( 9 (%) 7 6
(%) , 7 7 7 , ( ? , ( ) )() 7
, ( 9 7 7 . . ) )() ( 7 , ( . %
9 () ( )% ? , + 7 1 , 6 % .
( 7 , ? + 9 1 7 , 7 % 6 9
% . ( ( 7 , * A <6 442+
( % ( *,f . 6 ( ) ! 6
, . 6 % ( % . ( % ( . ! 6 )
. %)% ( ( , . running program7 ( ,
. 6 5 55 ( % 5 & ( . 6 . 6?
, 9 ? 7 , 7 , ( ) )() . , 6
% . ( 7 , ( 6 ) 6
7 ! . % )( ( ( 7 , * A <6 442+ 7 3
( ( . (
7 3 (
7 4 % 9) )6 % % ( % . , 7 (
7 ? . . 6 . ( %)( ( , ( (
7 % ( 6 ( 9 ( . 6 ( 7 7 %
. ) )() . 7 4? 9 . 6
, (
8
'& . " "
. . 6 % , F 6 % % %
.) (? 6 % % 6 . 6 % % ! 7 5 !
6 % % 6 . % !
7 5 ( ( ( 9 ) ) (
(# ' ( &
7 6 ( .) ( 7 7 6 ( .) (
.) 7 ( ) ) ( 7 7 ( . 7 online 6
') % ( , . . % . ) % ( % * .6 55 +
6 # "6
6 % % 6 7 ( 7 , F ( .) ?
# (? . % ). ) % ! ( ( 1
( 7 ( 7 F
" & ' ( 9
. 6 % ? .) . ( ( 9 ) 6 ) ,
7 7 . & 6 .) , . ( 7 , 55 .) 7
7 7 6 ( .) ( ) . ( . % % *compression
rate+ ( 7 ( "5=? 5=? . 5=
& &" " &
( ( # ( % ( % )( ( . % ( ( (
. .) ( . # ( . 6 ( ( ( % %)( ( *# +?
positive keyword *# +? negative keyword *#"+? % 1 *#$+?
, , % ! . .) *#/+? , .
*#0+? , . . *#2+? % ! #
*#3+? ) ( 1 *#4+? % ! 6 7)7) ) ( 1 *# 5+?
. ( *# + ( 7 6 . ! ( % . 7
('. ' " ( "
. 6 % ? ) 7 # ( ( 7 % 9 % 7)7)
, )% % . % ( ( # ( 6 % ( . ( (
# ( . 6 fitness function , 7 # (
( ) )() )( ( ) . ! % . 7
)( ( ) . . 7 - %)% (
% %)% ( 7 ( 555 ) )() . 7 ? ( 7 6 ) )()
. % ( ( ( 7 ) 7 ( ( 6 # 7)7) . 7
7 )( ( )
7 % ( ( ) )() % . % 7)7) ( ( # (
7 % % ( ( ) )() % . % 7)7) ( (
# ( . ' 7)7) % . ( ( # ( *# +?' 7)7) % . ( (
# ( *# +? . ( ( , )7) ' F ' F I F ' 7 5 .
. ) ( ( 7)7) ( 6 ! 6 7)7) ! . 61
6 % )( ( ) F
)% ( - . 7 ( 9 9 ( 7 , 555 ) )() ? .
% ) )() % ( ( 7)7) ( ( # ( )7)
, . % . ) )() . % % . *" + , 7 # (
. % ( ) %
' % g ' % g ' % . g '
% 0 g '5% 6 g ':% ; g '/
% < g '=% > g '9% ? g ' 8
% C g ' %
7 % ) )() . ( ) 6 1 F-measure? . precision
. recall . % ) 6 . ( 6 ( ( , . 7 ) 6 ( .
6 ( ( ( % ) )() ? % )( (F-measure.
( 7 , 55 .) 1 F-measure. % . 6 % . *" +
9 6 . ( . ( ( ) )()
fitness function ( ) )() 7 # ( 6 ) )() 1
) )() ( ! , . % 6 % )( ( % . 6 ( ? (
. . % 9 ) . , 7
. % . 6 ( , . % . % . 6 5 33 . 6
( ! . ! % , . 6 ( ) )() , . ! . .
7 6 9 . % % . 6 ( , 6 . ,
. % . % . 6 ( . 6 % . 6 ( (
( , . . 6 5
# /5 ( . % % . % )( ( ) . %
7)7) ( ( # ( , )%
% 6 F-measure? precision? . recall * D 1
E ( A 7 )1 ) 444+F
Kh$ i gi g jj G jg j k 3 l k j 3 ll *" +
. i . 6 7)7) . precision * + . recall * +?i m % % .
precision . i n % % . recall F-measure . 5 . ?
) 6 i ( ( 7 6- . 6 6 ( ( ( .
( *% )( ( # ( ( ) . .) + . . 6 ( (
( 9
6 # "
6 % % ! /5 .) 7 7 7 6 ( .) (
*.) , . % . 6 % 7 7 . . .) ,
. % . 6 % % 6 + )( ( ( ! , , ( ( # (
)( ( ( . , . . ( ( # ( 6 % % 6
6 % % 6 ). . % ( ( ( 7 7)7) ' F ' F I F ' % .
# ( , ( 7 )% ') 7 ( 7)7) ' F ' F I F ' . %
% . # ( ( ) ( % . . % . 6 % . *" + (
. ( ( # (
6 7 # ( 6 ( ( 7 6 ( 8 6
? ( 6 . 7 . ( , . 6 . *" +?
. ! 6 , . % )%1( ) compression rate
*< + 5=? 5 =? . "5=
" (7
% 7 , . . %
( 7 7 F
- F : .)-( ; ( ( ((? 6 ( )
- (F L <) * + ) < 3 55 M 5 D? 5"2
: . (# " "
. ( . 7) ) (9 ( ! %
') % ( ) ) 7 5 5 ( % . 7
!
! %' # &
) % ( 7 ( 7 17 ( ) 7 7 6 ( .) ( .
55 ( % % 55 ( 7 7 ( . 7 online 6
') % ( , . . % . ) % ( % .6 * 55 + ) ,
. % . 6 % % 6 ( 7 , 55 .) ) 1.)
( 7 . . 7 ( % % *compression rate+ ( 7 ( "5=?
5=? . 5=? ( 7 . 7 ) 6 . ) , 7 7 . (
. ( 6 ( . ( ,
. 7 ) 6 ( ( ) , . % . 6 % % ! ( 7 , /5
.) ) 1.) ( 7 . . 7 ( % %
*compression rate+ ( 7 ( "5=? 5=? . 5=? ( 7 . 7 ) 6
( ) ( . ( 6 ( .
( , . 7 ) 6 ( ( 1 ! 6 % . .) 7
. 6 0 0
! ' ( ' (
.) . 7 #) H ( . 6 ?
. ! ( .) , . 7 % ( 7 " % 9) )6
#) .) , . % . 6 % % 6 . % !
! (' ' % "(
( ( ( 7 ( ?
) 6 . % % ) ) , 7
. 6 ( 7 6 string . 6 . ( . 7 6
( % 6 , ? . , ? . ( 7
% ) ) 7 % , F
( ( ( . 6 . 7 9 ; <
<) )6 F
1 % . (
1 N
1 6 . ( 7 6 9 O
( ( ( . 6 . % ? 7 ( 6 .
<) )6 F
B . 6 7 C? % . &) )
" % ( ( % )# & ? 9 7 !
%
! ! '. + &"
. ,7 , * 444+ . % . (
6 ( ( ( , extrinsic evaluation . instrinsic evaluation Extrinsic
evaluation . 6 % )( ( % 6 ( ( 7 . ( % . # (
? ( . instrinsic evaluation % ). , 7 . (
% 6 ( ( *% ( ( ) 6 ( ( + . 6 ( (
). instrinsic evaluation .
7 ). recall * +? precision * +? . F-Measure * + % . 6 (
( ) 6 ( * ( + . 6 ( ( , . 7
) 6 ( % 6 F-Measure? precision? . recall
* D 1E ( A 7 )1 ) 444+ F
K G jg j k 3 l k j 3 ll */ +
( ( . 6 6 ( ( ( . ( . . 6 6 ( (
! 0 % "( ( "
( ( . 6 ( 7 6 .) ? D . 6 7 , ,
. ? . . 6 7 , , . ( . %
. 6 % . */ +? . E . 6 1! . .) . " . 6
term 1 , 9 . . .) . %
( keyword, . . .) 9 1 stoplist
' F
' F
H H
o 'oF
I Q
' F I ' FQ
' F I ' FQ
H J I
' F I 'oFQ
*/ +
. '"FE. . # ( % . */ "+? . " . 6 7 , , 9 term
1 % . K" (entences frequencyi % 7 , ,
. term 1 ? ( . L K" MNO PQ
RSTU %
. ( 9 term 1 . .) ? . 6 7 , ,
. ( .)
'"FE " V L KE */ "+
Singular Value Decomposition * ; + . % % . (
W . W X YZ? . X . 6 ( D V D ) singular ?
. 6 ( . ) D V singular value? . Y . 6 ( V
) singular ( . ; . 6 ( ,
7 ( ! . ( , 7 6 9 . ( 7 ( 7 . ( . ( '
. . ( . ( . 6 - ) % ( %
6 . ( ( 7 % % 6 .
. ( ( 6 . 6 7 . 9 ,
! (? . ( 6 . )% % ( . ( 7 7
W Xp pYpZ . ( ; ? % 7 ( ) % .
. * , A ( 44/+? . ( . 6 . )
singular Z ; . . 7 (? . 7 ( ( 7
% ( ( ) ? ( 6 ) . % . 6 % .
*/ $+
Y WZXp pq */ $+
). # ( 6 ( ( / $ . % 1 (
P; * 55/+ 9 6 7 % .
( / /
* F r */ /+
6 7 ( % 1 , F
* F
* F
H H
Q * QF
I Q
* F I * F Q
* F I * F Q
H J I
* QF I * QF Q
; ) % ( ( term , . % . ( .) ; )
% % 9 . )( ( % 7)7) .
% . %1 % .) % 6 . .) % ! )( ( ; .
( 6 % 7)7) 6 . 9) )6 % 6
( % )( ( ; F
( F ( ( 7
( F % 7 . ( 7 6 %
(" F ( 7 .
7 Term frequency. inverse sentences frequency
( ("
( 5 5 /3$40"
7 5 5 /3$40"
% " 5
% 5 5 /3$40"
( 5 5 /3$40"
7 5 5 /3$40"
5 5 /3$40"
( . 7 . % " V L K"s . 7
! 6 ( % 7)7) term % . % 6 % ( ! , . 6
% )( ( ; . . ! . % ) ; )
7 7)7) % .
( ( ("
( 5 /3$40" 5 5 /3$40"
7 /3$40" 5 5
% 5 5 5
% 5 " 044 / 5
( /3$40" 5 5
7 5 5 /3$40" 5 /3$40"
5 5 /3$40" 5 /3$40"
7 " ; )
( 5 5 $0 1" 2"2
( " 0/ 5 5 3
(" 5 503/ 15 52$3
. ( ) ? . % 6 %
( / /? ( 6 7 ( % ? . !
% . 7 $ ( 6 . % )( ( ( . 6
( ) . 6 . " ( ) ? ( 6 , . . %
7 6- " 6 7 ( , ? ( .
6 7 ( , . 6
7 $ ( %
( ( (" ) ( )
( 15 55/ 52 5 "5 5 "
( 15 55/ 5 300 5 2 5 3
(" 52 5 300 5 $ 24/4
! 6 50003 0 30 4"3 0 30/2$0
! 1 ('. ' " ( "
). ) . % . 6 % % 6 .
% 9)7 ). ) . 6 . % compression rate
*< + 5=? < 5=? . < "5= ! . % ). )
. 6 7)7) , )% % . %1 % # ( ( .
< 5=? . < "5= ). 1 ). ) )() ( 7 . % . 6 %
% ! ). ) . 7 7 % 7 , F
% ( ( ) )()
6 ( ) %) % % . ) . 6 ) )()
' ) )() % . % ). ) . % ( ( ( 7
, 7 ( 7)7) # ( . 7 ' F ' F I F ' 7)7)
( 7 . 6 ( . % )( ( 9 5 ( % . . % )( (
) ( ( ! 6 7)7) 7 % ( ( ) )()
. ! % . 7 $
7 $ % ( ( ) )()
-- % . % ). ) . ( 555
) )() % %)% ( ? /5 ( ? % % . 6 ( . 6 5 33?
. % ( . 6 5 ( . % % % . 6 ( .
% ( . 7 . ( (%
" ( (
. 6 % % 6 ? % )( ( ( % . ) 7 # (
( 7 ( ( ( ( ) 6 ( ( . ?
. ! % . ( / )( ( # ( ( . 6 ( 7 7 F
1 . ( ( ? ( 7 6 ) )() , 7 ( *' F ' F I F ' +
. % % . ( % % . .) % 6 . % !
% . 6 % % ! 6 , . ). ) )() ,
7 , . . % % . 6 % % 6
1 ) * + J' % g ' % g ' % . g
' % 0 g '5% 6 g ':% ; g
'/% < g '=% > g '9% ? g
' 8% C g ' %
1 ) . % . % .) % 6 . % ! ?