Internetworking
Indonesia
Journal
lnternetwo rking
ャョ、ッ
ョ ・セ ゥ。@
Journal
The Indonesian Journal of lCT and Internet dセᄋカ」 ャ ッーュ・ョエ@ISS QYTセMYWPG@
/nM11t>m'Ol'lctn.!: Oョ、オョセセQQQ@ ゥセ@ a セ・ュゥMZュョオ。ャ@ eleccronic 1ourn:tl 、・カッ」セ、@ co th1:. nmdy
scudy
oi the Information nnd Communication Tc.-din\•lni,') (ICT) :rn,f lntC"rnt't d .. wl1.1pmenc in lndont>sia. The journal 'cch high-quality ュ。ョオセ」イゥーッN@ on the 」ィZゥャャ」ョセセ@ andop-rMrun1th"• rrt''\'ntC'd !>y 1nk•rmation tt'<:hnology and the' lntt:rnc·t in ln,hml',i:l
Jm1rnal m:11ling 。、、イLᄋセLZ@ ャョエ」イョ」イカNnォゥョセ@ lndone,1a Journal. PO Boic '97110 >.I IT St.ltion. C.1mhridg\'. MA 02139, USA
Thomas HarJiuno, PhD (MIT kエイセュセ@ Con,onium, MlT, USA)
l'rof.
Edy T
n lh.,koro,PhD
(IT!\, I ョjオョ・セゥ。I@ セヲッイォ@ B.1ui:ht'r, MA (('1,rn Sy,ce1m, l.JSA)lGセィュュ。エィ@ DonJct1, PhD (Qu:ilcomm, USA)
Prof. S\'c:ln kョZゥーセォッァN@ PhD ('JTNU, Norway)
Co-Editors
Budi RaharJjo, PhD (ITB, I ndom•,ia)
Editorial a、カゥNセッイケ@ Board
Kunwro Wascuw1buwo, MSc {PT. Telkom, lndoneMa)
Prof. wQセィョオ@ Pr.l)ecya, PhD (Um.:d1c L'n1versicy, The Netherland,) Prc.,f. Jennifer Srhtrry, PhD (Cn1wr-ity of Wollongong, Aumaha) Prof. Willy Su" lo, Ph[) Hl Qョャ|オセQイL@ of Wollongong, Aumal1a) Prof. Da\'1d Tan1ar. PhD (Mona<.h Un1\'ers1ty, Ausrralia) Pr.11 Malyn:i I 1m, PhD (Anmna Sc:ict> cョキ・イセQエケL@ USA)
Prnl. l'amb:lnl! Parmant1.1, PhD (Un1\'1:rs1ty of Pim.tourJ?h. t;SA)
ヲ|セuNNL@ &. cope: The lntcrno:morkmi: ャョjッョ|NセQ。@ _lournal a11m w l":come tht tiirlm1\'\t puhlicarion for praccmoner:.. teacher,.,
rc-'card1n, .1n,J polil\" 111.1kcro co ,h,m: their knowlcdg.: :ind i:xpa1ence in dll dc.,ii:n, dcwlopmcnt, implem.:mauon, and the manage-ment ol ll-:T anJ the lntl·rnet m lndonc.,1:i.
TopiC3 of ャ ョエ」イ」セエ ᄋ@ Tilc il'llrn:il wdcomes :ind srrongly ・ョ」\NIオイ。ァ・セ@ ウオィュQセセQッョセ@ b:\.wJ on mccrd1sciplinary approaches focu>ing un
IC'T
& Internet dt-vclnpment anJ 1u rcLui:J a!.pecci. in the ャ ョjッョ・セイョョ@ contl!"'<t.Thc\e
include (hut not limited co) information technolel)!\', 」ッュュオョゥャᄋ。ョッョセ@ technology. computer ウ」ゥャABョ」・セN@ dectnc:il engineering, and tht• hro:tdcr i.oc1al scuJie:. regardmg !CT .rnd lnctrncc Jcvelupmc:nr in lntkmc::-1:1. A lisc of topics can be tuun<l on the JOUrnal wch,1tc :it オG|TキNャョエセュ・エキッイォュセャョ、ッョ・ウQ。NッイクN@Open Acee."-' Publication Policy: The lntcrnccworking lndonc"1a Journal ーイッカゥ、・セ@ upcn acce.:.' to all of it, concenr on rhe pnnciple that making イャNGセ」ョイ」ィ@ fn.•d)1 nv:ulahlc to the puhlic supports a greater glohal t•xchangc uf knowledge. This lollows the philo.,ophy of rhc Orm Journal Sy:.rem' (-'ec the Public Knowlrdge Project at pkp.sfu.ca). The JOurnal will be ruhlishcd elcmonically and dlere arc no セオ「L」イエーエQQゥョ@ t«.-e.-. Suc:h Zゥ」」イ\Nセ@ 1s SNBMセP」ゥ。 」」、@ wich incrcasrd readership and ゥョ」イ」。セ」、@ c1rnt1un of an author's work.
Manmuipl sオィュセゥッョᄋ@ セヲ。ョオLオQイqN@ :.huulJ toe suhmmcJ :tccurJ11111 cu rill IEEE gオゥjセᄋ@ lvr .1uthor:., and will he rdereed in th._. ,r;m,br,I w:w Manmrnrr p.li;c' -.hould not cxc.:cd
7
pa!!e' oi the IEEE 1-rnlumn format in a M11:rcn.olc-Word file format. Link.' corlw
IEEE ,!\-fl·fik,
can he IPund ac u\ltdn1cmet1L'OrkmdndorunttorJ!. セヲ。 ョオL」イQイ 」LN@ 'ubmircc:,I co lncernecworking lndon(!!;ia mu't nor h.iw h:..:n rrc\'lllUsly puhh,hcJ or committed to another puhli,hcr unJcr a cup)Tight エイ。ョセォイ@ agr1.:1.:mcnc, anJ mu.st not 1'c unda wns1,krariun h>,· .1nothn j\>Urnill. :\uthur.-. of acceptt'J paper' art• r.:>pon .. 11'>lc tor thl· Car icra RcaJy Copy (CRC) in the IEEE!-..·olumn ャセQイョョ」@ (Jdi\'er.:d tn chc fahtor 111 a M1(rO><.)tr·WorJ Hid. aオエィッイセ@ are adv1ocd that no セカQウQッョウ@ ot the manu,cr1pt can l'C m.1de .Jlter 。NZセ」ーエ。ョNZ」@ 1:-y chc Editor fM puhlication. The heneitts of エィQセ@ rrocC'Jurc an: many, \\'1th セー・・、@ :ind accura()' being the nlllM olwmus. \Ve look forward to working \a,.ith }'l)Ur elecrronic ,uhm1"1on which will allow オセ@ to 'cn'C you more efficiently. Ple:he email ュNQュャ|QZイゥイセ@ ur inquine' co rhe cditora ac che iollowmg 。、、ョZセZ@ (d11or@/n1tmctv.'l,rl<1nJ?fndone11a.orx.
SuhmiSi.ion Guideline•, lntt'rnecworkmg Indonesia :icct'pcs a variety of m:inur.tripr, m e1chcr Engl1i-h or Baha':i Indonesia. pャ・。セ・@ revit'W rht 、」セ」イゥー」Qッョウ@ btlow and klentify che ウオ「ュゥセQッョ@ cype best suiccJ to your mt1:nded ウオィュQセQッョZ@
Rt1(t1r<h P.1p,·rs: Rc:'L'arch ー。ー・イセ@ report on resulrs <'man:itmg from イ」 Nセ」Zゥイ」ィ@ ーイッゥ・」」セN@ hoch cht.>oret1cal and practical m nanire. Shorr pt1/»n: Shure イ」セ」。ョZィ@ papers provide an mrrodurnon to new dcwlopmcnci. or 。、|。ョ」」セ@ regarding on-going work. Policy Vt<'v.f•oin11: Policy Vicwpoinu. explore competing イ」イセー」」エゥカ」ウ@ in the ャョjャ^ョcセゥ。ョ@ riollcy debate that nre informed hy ac:i-Jcmk イエ Gセ」。イ」ィN@
Tta.:hmR lnnolatton: Tt.>achmg lnnovat1on papers explore crc:1tive use:. of mformation tc.'chnolob'Y tc'Ols and rhe Internet ro 1m· 1'rm·e learnmJl' and cduc;mon m Indonesia.
Vol I !No. 2 (2009) INTERNETWORKING INDONESIA JOURNAL
45
Fuzzy Decision Tree
dengan Algoritme ID3 pada
Data Diabetes
F. Romansyah, I. S.
Sitanggang,S. Nurdiati
Abstroc:I- Decisio n tree is one of \loidely used ュ・イィッセ@ In
developing dasslf1cation mode ls. In order to handle un ce rtainty, run) approach Is used. This \loOrk 11 ppllcd 11 duslne11tlon technique using fuzzy decision 1rcr mcchod on d 11bcres d:ltucc to obtain cluslfication rules for predicting new data. Fuuy IDJ (fuzzy r1er11th'C Dlchotomiser 3) \\as used to de\'elop fu zzy decision tree "1th high accuracy. The result is a fuzzy ll!clslon tree with the highest accuracy 94,15"/o for fuulneu con trol threshold (6,) •
1s•1.
and leaf derision threshold (9.) • 8 •;.orroe; ..
v
Index TO?t1,_ Fuz::,,• 、セ」ゥウゥッQQ@ tru, Fuzzy IDJ
I. PENDAHULUAN
D
ata mining rn:rupakan proses cksrraksi informasi ataupola pcnting dalam basis data bcrukuran bcsnr (3). Pada peneliuan mi aJmn d1tcrapkan salah satu tcknilc dalam data ュュュセN@ y:11ru klas1fikasi tcrhadap data diabetes. Data diabetes yang digunakan adalah data has1I ー」イョZョォNセ。。ョ@ lab pas1cn dari scbuah nmuh sakit yang mchpu11 pcrrcrikbaan GLlJN (Glukosa Darah Puasa). GPOST (Glukosa D:irah 2 Jam PP), Tg (Trigliscrida), HDL (Kolcsterol HDL), serta diagnosu pasien berdasarbn nilai
G..UN, GPOST, I
rot ..
danTG.
Klas1fikasi trcrupakan salah satu metode dalam data m111i11g
unruk me111>rediksi label kclas dari suacu record dalam data Mctodc yang d1gunakan dalam pcnclitian ini yaitu metode klasifiknsi dcngnn /ilzzy decision tree. Pcnggunaan tcknikji1:y rrermnglcinkan melakukan prediksi suatu objek yang dimiliki oleh lebm dari satu kelas. Dengan menerapkan teknilc data
mining pada dala diabetes diharupkan dapat ditcn-..ikan aturun
klasifikas1 yang dapat digunakan untuk men,.>rediksi polcnsi scseorang tcrserang penyakit diabetes.
Naskah ditcrim.i padJ. 2 Dcscmber 2009
F. Romansyuh ad.llah Associate 811srness Consultant (IT Consultu111)
dJ PT AGIT Haセャイ[ゥ@ Gr4phia lnform.iuon Tcchnolol:)') 22/F A'lZ Tower
JI . Jcnd 9.adam1an kavling 33A Jakarta I 0220 (e-mail
fyro_ man,'u)·ahoo com)
I S sゥエ。ョAjセュァ@ 11d.d.ih staf ー」ョセjNゥイ@ d1 Dcpa.rtcmcn llmu h.omputcr
fセヲャpa@ lnstitUI Pcrtantan Bogor, JI Mcran11. Wing 20 Level V, Kamplb
11'8 Darma1111. Bo¥Or 16680 Indonesia (c-muil:
im11S.situn&i"ngi!:!)ipb.uc.1d).
S. Nt .. d!Jti adalah staf pcn8'1jar dt Dep.mcmen llmu Kompu1cr
FMIPA lnstllUI Pcrta111an Bogor, JI Mcrantt, Wing 20 Le'cl V, K11mpw.
IPB D.umap. bッセッPイ@ 16680 Indonesia (e-mail 111.rdiat1fit 1pb ac 1dl
Penclitian mi bcrtujuan untuk: I) Menernpkan salah satu teknik klasilikasi yaitu Fttz:y 103 (ll1trutive Dichotomiser 3)
Deds1011 Tr1te pada data ha.sit pemeriksaan lab pas1cn; 2)
Menermkan a1uran klasifikas1 pada data diabetes yang menjelaskan dan ment>edakan kelas-kelas atau konscp schingga dapal digunakan untuk イイ」ャQQ^イ」、QセQ@ pcnyakit diabetes bcrdasarkan nilai dan atnbut lam yang d1ketahu1 Model yang dihasilkan pada penehtian ini diharnpkan dapat digunakan oleh pihak yang berkcpcntingnn untuk me"l"red1ks1 potensi scscornng atau pasicn terscrang pcnyalat diabetes. sehingga tcrjadmya penyakit ini pada scseorang dapat diprcdiks1 scdm1 rrungkin dan dapat dilakukan tindakan antisipast.
II. FUZZY DECISION TREE
A.
Peubah Linguistik dan l1ng111st1cTerm
Pcubah hngui.stik merupakan pcubah vernal yang dapat digunakan untuk mcmodclkan pcmikiran manusia yang dickspresiknn dalam bentuk hi"l>unnn ji1.::y. Peubah lingu1Shk dikarnkterisas1 oleh q11intapl1t (x, T(x), X, G. M) dengan x adalah nama peubah, T(x) adalah ォオセオャ。ョ@ dari Ji11g11islic
term. G adalah aturan sintaks. M adalah aturan semant1k yang bersesuaian dengan setiap nilai peubah lingulStik. Scbaga1 contoh, jilca urrur diinteYpretasilcan scbagai pcubah hngu1:1tik. maka hi111>unan dari ling111stic tem1 T(urmr) rrcnjadi :
T(urrur) - 1sangat rruda, rmda, tual
Setiap tmn dalam T(urrur) dikarnkterisasi oleh hi"l'unan
fuzzy,
X
menunjukkan nilai intervalx.
Aturan semantikrrenunjukkan fungsi keanggotaan dari setiap nilai pada h°'1>unan /111guis/lc term [I).
Li11g111s1ic term didefinisilcan scbagai kurqlUlan hi111>unan
fiu::y yang dldasarkan pada fungsi keanggotaan yang
bersesuaian dengan peubah hnguishk. Misalkan <D adalah ォオセオャ。ョ@ dan record ynng tcrdin dan hiJl1)unan atnbut /={11, ... ,/,.}, dcngan J,,v 1, .. . 11 • Atribui I dapat berupa atribut nu1rcrik atau kategorikal. Untuk setiap record d elcrnen
<D,
d!t.I
rrcnotasikan nilai 1 dalam record d untuk atnbut /,.Kurrpulan ling11islic tenn dapat d1defmisikan pada :>eluruh domain dari atribut kuantitattf.
c..,
• , •
1. ,s, mcnotru.ikanling11ist1c term yang berasos1as1 dcngan atribut /, . sehinggn
hi"l'unan fuzzy dapat d1deft111sikan untuk se11ap L, , .
Hilll>unan/11::..')>. L .... r• I ... 1• didefinisikan sebaga1
46 INTERNETWORKJNG INDONESIA JOURNAL ROMANSYAH ET
AL
l
'[dom(l,,,/'Lvp!Yl jika Iv diskrct'11
L..,= J.I •
Jdomllvl L\''. (l v) jika/vkon1i11u ' v
uncuk semua ;, e domf/ J. dengan dom(J,)
=
{;., ..
,i, .• }· Derajat keanggotann dari niln1 '•· e dom(I. ) dengan beberapa li11g11is1it·term
L.t
dinotasikan oleh ᄉャ セ@ .B. F'uz..--y Decision Tree (FDT)
Decision tree m:rupakan sualu pendekatan yang sangat populer dan praktis dalam maclri11e learning untuk rrcnyelesaikan pennasalahan klasifikasi. Metode ini digunakan untuk イイ」ョセ・イォゥイ。ォ。ョ@ nilai diskret dari fungsi [arget, yang rrona fungsi penilelajaran direpresentasikan oleh scbuah decision
tree
(5).
Decision tree merupakan hifl1)unan a tu ranIF ... THFN.
Setiap path dalam tree dihubungkan dengan sebuah aniran, di mana premis terdiri atas sekt1111>ulan node-node yang di1em1i, dan ォ・ウセオャ。ョ@ dari aturan terdiri atas kelas yang tcrhubung dengan /eafdaripath [6).Dalam po hon keputusan. leaf node diberikan sebuah label kelas. Non-terminal node. yang terdiri atas root dan internal
11ode lainnya, mcngandung kondisi-kondisi uji atribut untuk
rnemisahkan record yang rrcmiliki karaktcrist.ik yang bcrbeda. Edge-edge dapal dilabelkan dcngan nilai-nilai 1111111eric-symbolic. Scbuah atribut 1111meric-symbolic adalah sebuah atribut yang dapal bemilai numeric ataupun symbolic yang dihubungkan dengan sebuah variabel kuantitatif. Sebagai contoh. ukur.in seseorang dapat dituliskan scbagai atribut 1111meric-symbolic: dengan nilai kuantitatif, dituliskan dengan "1.72 rreter". ataupun sebagai nilai 11111neric-symbolic seperti "tinggi" yang berkaitan dengan suatu ukuran (size). Nilai-nilai scperti inilah yang rrenyebabkan pcrtuasan dari decision tree menjadi fi1zzy decision tree [8]. Penggunaan tcknik faz:y mcrrungkinkan melakukan prediksi suatu objck yang dimiliki oleh lebih dari satu kelas .
Fu::zy decision free mem.mgkinkan untuk menggunakan
nala1-n1lai n11meric-symbolic sclama konsmiksi atau saat mengklasifikasikan kasus-.kasus baru. Manfoat dari teori hilll>unau faz=J• datum decision rree ialah n-.:ningkatkan kem11llJUan dalam meimhami decision tree kctika menggunakan auibut-atribuL i..'Uanlilatif. Bahkan, dengan m::nggunakan tekoikfa.:=)' dapat meningkatkan ketahanan saat melak\1kan klasifikasi kasus-kasus baru (6).
C. Fu;zy JD3 Decision Tree
103 (lrerative Dicl1otomiser 3) merupakan salah satu algoritme yang banyak digunakan untuk rnembuat suatu decision tree . Algoritme ini pert.rum kali diperkenalkan oleh Quinlan, menggunakan ceori infonnasi untuk menentukan atribut irona yang paling mformatif. nanlJn LDJ sangat tidak stabil dalam irelakukan penggolongan berkenaan dengan gangguan kecil pada data pelatihan . Logika fuzzy dapal rncmbcrikan suatu peningkatan unn1k dalam rnelakukan penggolongan pada saat pelatihan [5].
Algoritme faz.7 [DJ rrcrupnkan algoritmc yang cfis1en untuk membuat suatu fi1z..-y decision tree. Algoritrre fimy 103 adalah sebagai berikut
[5]:
1 . create a Root node that ha.5 a set of fuizy data with セ・ュ「・イウィゥー@ va lue 1 .
2. If a node t with a fu zzy set of data D
satisfiPs the follow i ng conditions, then ic is a leaf nooe and ass1gned by the class name .
• The proportion of class
c,
is grea t er than or equal toe,,
IDC'
I
--"l:.8
IDI
'
• the number of a data set is less than
e.
• there are no attributes for more
classifications
3. If a node D does no satisfy the above conditions, then it is not a leaf-node. And an new sub-node is generated as follow: • Fo r Ai's (ial , ... , L) calculate the
information gain , and select the test at t r ibute AN• that maximizes them.
• Devide D into fuzzy subset D1, ... ,
o.
according to A,..,, where the ュ・セ「・イウィゥー@
value ッセ@ the data in D, is the product of
the :nembersh1p value in D and the value of • •. .-., of ::he value of A,,.,. i n D.
• Generate new node t,, ... , t . for f uzzy subsets 01 , ... , D. and label the fuzzy sets F,.. •. , to
edges that connect between the nodes t, and t.
• Replace D by D1 (j-1,2, ... , m) and repeat: from 2 recursively .
D. F11zzy Entropy dan Information Gain
Information gain adalah suatu nilai statistik yang
digunakan untuk rnemilih atribut yang akan mengekspansi tree dan menghasilkan node baru pada algoritme fD3. Suatu entropy dipergunakan untuk irendefinisikan nilai irifom1ation
gain . Entropy dirumuskan sebagai bctikut [5]:
hLHsI ] l セMpL Gャッァ
R
H pLI@ (I)dcngan P1 adalah rasio dari kelas C, pada ィセオョ。ョ@ contoh S
=
(x 1.ri,. ..• i:t}.
l セ@
x1 EC1 P, J•Is
(2)l11formatio11 gain digunakan sebagai ukuran selcksi atribut, yang rrerupakan hasil pengurangan entropy dari hi11'4:>unan contoh setelah meni>agi ukuran hifl1)unan contoh dengan jumlah atributnya. Information gain didefinisikan sebagai bcriku t [ S]:
G(S, . .f); H(S) -
L
!iJ H(S,) (3) .. v.i..•!-'> I SIdengan bobot
w;
=I
Sv
I
adalah rasio dari data dengan atributISi
v pada ィセオョ。ョ@ contoh.Vol I /No 2 (2009) INTERNETWORKING INDONESIA JOUR:-.IAL 47
gai11 karcna adanya ekspresi data
fin ...
-y. Benkut adalahpersorman untuk mcncan nilai fir:zy entropy dan kcseluruhan data [5]:
H 1(S) • ll,(S) s
r.:'
P, • log2(P,) (4)Un1uk m:nenrukan
tu::,.·
entropy dan inji>rmation gam <Sari suatu atnbut pada algoriure fu=-.7 103 (FID3) digunakan persarroan scbagai berikut [S):セ H@
r.;
µ,I.;µ.,
(5)Hi lS,A) • -L.,., -S-logz -
S-G ,(S) • 111 (S) -
L."
セ
ャヲ イHsLNaI@
(6)1;A SI
dcngan µ1 adalah nilai kcanggotaan dari pola ke:i untuk kelas ke-1
Hl..S>
menunJUkkan entropy dari hll'.\l)unanS
dari data pcla1ihan pada node.ts.I
adalah ukuran d:ui subset S, セs@ dari data pelatihan x1 dengan atnbut v. セsGi@ mcnunjukkan ukumn dari hin1)unan S.E. Threshold dalam
Fu=;•
Decision TreeJika pada proses learnmg dari FDT dihentikan sa111>ai sclllla data contoh pada rrosing-masmg leafnode menjadi :mggota sebuah kclas,
akan
dihasilkan akurasi yang rendah. Oleh karena 1tu untuk mcningkatkun akurasinya, proseslearning harus dihentikan k:bth awal atau m:lalrukao
pemotongan tree secara u01.1m Untuk itu dibcrikan 2 (dua)
threshold yang hams tc11>enuh1j1ka tree akan diekspansi, yaitu
[5]
• F11zz111ess control threshold (FCT) I 0,
Jika proporsi dari hit11>unan data dari kclas Ct lebih besar atau sarro dcngan nilai threshold 0,, rmka hentikan ekspans1 tree. Sebagai con1oh: Jika pada sebuah
s11b-dataset rasio dan kelas I adalah 00°/o, kelas 2 adalah 100/o dan 0,adulah &5%, mak41 hentikan ckspansi tree.
• f.eafde,isron threshold (LDT) I O.
Jika banyaknya anggota hffil>unan data pada suatu node
lebih kec1l dari threshold
o.,
hcntikan ckspansi tree Sebaga1 conloh: scbuah h11111unan daLa merriliki600
contoh dcngano.
adalah 2% Jika jumlllh dala contoh pada sebuah node lebih kec1I d::in 12 (lo/. dari 600). 11nlru henuknn ckspansi tree.Ill. TAHAPAN PENFLITIAN
Proses dasar sistcm mcngacu pada proses dnlam Knowledge Discovery "' Database (KDD). Proses terscbut dapat diura1kan scbagai berikut :
a. Perrbersihan data, merrbuang da1a dengan nilai yang hilang dan data yang duplikn1
b. Transfonmsi data ke dalam bcntuk dataji1:.:y.
c Data dibagi menjadi training set dan test set dcngan menggunakan metodc k-fold cross validation [2).
d Aplikasi 1elm1k data mming, merupakan tahap yang pcnting karen:i pada tahap mi tcknik data n1111ing
d1aphkas1kan tertrnd:ip data Untuk mencn'tlkun aturan klas 1fikas i digunakan metodc fi1::y decision tree. Langkah-langkah pada metode tersebu1 yaitu:
I Mencntukan atribu1 yang ::ikan digunakan.
2. Mcncntukan banyaknyafuZ.."Y set uncuk masing-masing atribut.
3. Menentukan banyaknya tra111ir1g set yang akan d1gunakan.
4. Mcngh1tunc membenhip vnlue
S.
Mcmilih bcsamya threshold yang akan d1gunakan. 6. Mcrrbangun fa:zy dec1ston tree dcngan algontmeFuzzy ID3.
Spcsiftkasi pernngkat keras dan perangkat lunak yang digunak:.rn untuk penelitian ini adalah sebagai benlrut .
Perangknt kcras berupa ko111>uter personal dcngan spesifikas1: Prosesor AMO Athlon 64 2800+, Mcrmri DOR 512
MB, dan Harddisk 80 GB Perangkat lunak yang digunakan
ad::ilah sistem operasi Windows XP Profes1onal. MATLAB 7.0 sebagai bahas::i pelTl'Ogranun, dan Mlcrosofi Excel 2001
A Transformasr Data
Dari
5
atribut yang digunakan, 4 di antaranya m:rupakan atribu t yang kontinu. ya1tu GLUN, GPOST, HDI.. dan TG scdangknn acribut Diagnosa adalah atnbut kategonl<. Berdasarkan refcrcnsi hasil labomtorium. range nonnal untuk atnbutGU.JN.
GPOST, HDL, dan TG diperlihatkan p:ida TabetI.
TABLE 1
Nil.Al REFERENSI llASIL LABO RA TOIUUM
Kode Pemertkuan Saluan Nilal Normal
GUN MW'OL 70- 100
GPOSf MWDL 100 - 140
HDL Mg!DL 40 - 60
TG MglOL SO - ISO
Atribut yang telah ditransfommi kc dalam bcntuk [u:..-y
antarn lain: • Arn'but
GUJN
Atribut GLUN dibagi rrcn_pd1 4 keloflllok atau lingu1s11c
tcn11, yaitu rcndah (GLUN < 70 mgfDL), sedang (70 ョセOdl@ <= G.UN < 110 q/DL). tinggi (110 flli/DL c- 0 UN< 140 mg/OL). dan sangat tinggi (GLUN >= 140 セdlI@ [4) Dari perrbagian itu dapat ditentukan membership fi111ctio11 dan hilll>unan fa::..-y rcndah. sedang, tinggi, dan sangat tmgg1 uncuk atnbut
GWN
secara tc11>isah yaitu·0 x<65 x-65
10
65 <a .t < 75' µ..., (T)., I
t <65 65<=z<1S
15 <>= .T< IOS
I
t;r-75 µ,..-(:r)= - 100
x »1S T-ll 5 105.:sx < ll5
0
•-105
- 10
-10 0
•<IOS
I
0 :IM<-x<llS, r - llS
llS <•x<l3S µ••t-1n..c..(XI " - ,0- ;
I .
llS<-.1<145 '
µ , ... trl •
1
•,oエMャセs@
0 i>-l4S
x:-115
x<l.IS
IJS<• r< 145
llinlJunan ji1:zy un1uk schap linguistic: tenn menggunaknn 1..-urva dengan bentuk trapcsium sepert1 pada G:i.rrbar I.
48 lNTl::RNETWORKING INDONESIA JOURNAL ROMANSYAH ET AL
MP'OLUN
- 11_•-·
.
BMGセ@t-··-
- .... セャョYYG@ ..I II U $2 II M IOl IN UT
セ@
Gunbo.r I 1 limpunun fitlZJ' atr ibu1 GLUN
• Atn"but GPOST
Atn"but (]>OST d1bagi menjadi 4 kclo111>ok atau /111g11istic
term, yaitu rendah (GPOST < 100 mg/DL), sedang (100
mg/DL ¢"' GPOST < 140 rre/DL), tmggi (140 mg/DL <=
Q>OST < 200 rrg/DL), dan s:mgat tmgg1 (GPOST
>=
200 mg/DL) (41-Dari perri>agian itu dapat ditentukan membershipfi1nc11011 dari ィセオョ。ョ@ fi1zry rcndah, sedang, tinggi. dan sangat tinggi untuk atnl>ut GPOST secara terpisah yaicu:
0 t<95
l-105 •
x-95
10 I
95 <= t<l05
j
I ; r <95
µ.-Ix)•
-=!() .
95<=1<IOS P...,(.1)=0 l >,.105 .t-l45 QSU\セ@ t<l45
-10
0 t >" 145
I
o
'<135f
' -
us
JO
11,....,(t)• I
i
セ@- 10
13S<.•t<l45
.
l
I 0•-195 ャセs\ク\ャYs@ 11 • ...,.,,...,<•>• (o""
195 <•x< 205 I
195 ,_ '< 205
, ,..20s
0 t>-20$
1 linlJunan fuzzy untuk setiap ling111st1c term menggunakan kurva dengan bcntuk trapesiumsepcni pada Gmt>ar 2.
'
ltf OPOIT
DI
r-r
...
..--...•. r
o.•-1 21 '-> .. 116 1m U7 t . . ta l lO 11t
--·--
-
..
_...
·--M] B ᄋ セ@
Gtmbar 2 H1mpunan/11%Z}' atnbut GPOSf
• Atnbut HDL
Atnbut HDL dibag1 menjadi 3 kclorrpok atau ling11istic term. ya1ru rcndah (HDL < 4-0 mg rDL). scdang (4-0 mg/OL < HDL < 60 mg/DL), dan tinggi (HDL
=
60 mg/DL) (4). Dari pennagian itu dapat ditentukan membership fi111ctio11 dari hi"1'unan .fu==y rendah. scdang, tmgg1. dan sangat tingg1 untuk atn"butHDL
secara terpisah ya1tu:0 x<35
l
I ' x < 35 r-35 35 <• 1 < 45x-45 , 10
P.-(x)• -:-jQ · 35<• r<45 ーセHNイI@ I 45< x<55
0 ; o,, 455 .r-65 55 <• l<65
- 10
0 イセVU@
Hi111>unan foz..7 untuk scllap ling11istic term mc:nggunakan kurva dcngan bcntuk trapcsium scpeni pada Girri>ar 3.
セ@
-
...
--
...
-1 • n 11 f l M )1 ... 4 1 . . A1 le 61 . . 1 1
-.
v _ _
Gamtm 3 Himpunanfu=y atnbll HDL
• Atnout TG
Atnbut TG dibagi mcnjadi 3 kelo111>ok a1au /111g111stic term. yaitu rcndah (TG <
SO
セ O dlIL@ sedang (50 セOol@ <= TG < 150 セOdlスN@ dan tinggi (TG >= 150 セidlI@ [4). Dari perri>agian itu dnpat ditentukan membership fi111ctiu11 dari hirrpunan fiiz::y rendah. sedang. tinggi, dan sangat 1ingg1 untuk atnbut TG secara terptSah yaitu:l
t-55 Iµ-(.r)• - - ;
- 10 0 ;
l
0 • r-145µ,-(l) • -10- . I
r < 4S
45<; rdS' µ...._(t)=
x >=SS
.r<l4S
145 <= r<ISS
• >• ISS
0 .r<45
x 45
10 45 ¢".l' < 55
I 55(a.r<145
.r-155
145<. .. .r<l5S - 10
0 r ,...155
Hi"1'unan fuzzy untuk sctiap lmguis11c; term mcngguaalcan lrurva dengan bcntuk trapesium scpcni pada Garri>ar 4.
Mf'TC
1 •• lt • 11 , . tt , . tJ1 • • ,,, • •
•o
Gombur 4 Himpunan
fa=>•
atnbll TGData dari atnbut <1.UN, GPOST, HDI.., dan TG kerrudian akan ditransfonmsi ke dalam bcntuk fi1zzy dengan mcnghirung derajat kcanggotaan fi1zzy pada ciap-ciap hir?lJunan dan dollllm sctiap atribut linguistik.
• Atribut D1gnosa
Atribut Diagnosa sclanjutnya akan discbut scbagai CLASS, direpresentasilc:an oleh dua buah peubah ャゥョァオセエゥォ@ yanu "ncgattf diabetes" dan "pos1uf diabetes" Kcdua linguistic
ternmya terscbut d1dcfinisikan sebagai bcrikut:
"negatif diabetes"= I "positif dtabctcs" = 2
Nilai atn"but CLASS yang akan dikategorikan sebagai positif diabetes adalah diagnosa dcngan label
EIO
(lnsuli11-depe11dent dtabetes mel/it11s), El I (Non-insu/111-dependetdiabetes melllfus). El 2 (Malnutritton-re/ated diabetes
mel/1tr1s). dan E13 (Unspecified diabetes melli111s).
I ·
Vol I /No. 2 (2009) fNTERNETWORKING INDONES!A JOURNAL 49
8. Data Mm111g
Pada 1ahap ini dilakulcln tekmk data mining menggunaknn algontmc HD3 untuk mcrrbangun fiu::zy decision tree (FDT) Data yang tclah ditransfomui.i akan dibagi menjadi train111g set dan um set. Pcrrbag13n data in1 mcnggunakan mctodc J(). fold cross validation. 03ta akan d1bagi rrenjadi JO subset
(S, . ....
S10) yang berbeda dengan jumlah yang sama bcsar. Setiapkali
sebuah s11bset digunakan scbag:U test set maka 9 buah partis1 lnmnya akan dijadikan sebagai training set.Fasc training d1lakukan untuk merrbangun FDT dengan mcnggunakan algoritmc FID3. Proses 11·a1111ng harus m:lalui bcrbagai tahapan, scbagai contoh akan dijclasknn perrbcntulr-Jn FDT dengan menggunakan contoh training set yang tcrdiri dan 15 data alau record.
Pada contoh trammg set terscbut akan diterapkan algontmc fuzz> ID3 untuk m:ncrrukan rrodel atau aturan klas1fikas1 Langkah-langkah perrbcntukan aturan ldasifikasi dengan algontmc FlD3, yniru:
I Mcrrbuat root node dari scrrua dnta training yang ada dengan mermen nila1 derajat kcanggotaan untuk serrua record sarm dengan I
2 l\lcnghitung /i1::) entropy dan traming set yang ada. Dan
hai.11
pcrhi1ungan diperoleh nllai fu==J• entropy scbcsar 0.9968. '111•11 mi akan d1gunakan unluk rrenghitung nilai i11forma1ion ga111 dan rn:1smg-rrosmg atnbut.3 Mengh1tung 111formution ga111 dari atribut GLUN. GPOST, llOL dan TG. mbmg-rmsmg d1peroleh nil:U 0.2064, 0.3330, 0.0304. dan 0.0050. Dari hasil tersebut dipilih atnbut dcngan nila1 111/ormu11011 gam tcrbesar yairu GPOST.
Atribut GPOST sclanjutnya digunakan untuk
m: ngekspansi tree ntau mcnjadi root-node, tapi pada sub-node sclanjutnya atnbut GPOST tidak dapat digunakan untuk rrcngckspansi tree.
4. Data tra1111ng dickspansi berdasarkan atribut GPOST schingga dipcrolch has ii sepeni pada Garmar 5.
セ@
/llMllll
Mセ@
QQQNイセ@
'-"-.1iW
.,_I • r1iii
セM
.,_ W """' llQ. • . . , _lll111 lf t l Jtl l t .. 11
'2•1 I ' I I II I I 4 I 1
'l ' I 1 " 1 1 1 .. 1 1
• · i < 4 1 1 1 セii@
SI I 1
I U I 1
Gunbwr 5 Hil.\al ・ォウーN。ョセQ@ trolflrng ut bcrdas::irlcan atnbul GPOSf N1la1 dcrajat keanggotaan yang baru masing-masing record pad a sub-node diperoleh dari has ii perkalian antara dcraJat kcanggotaan pada root node dan derajat keanggotaan atribut yang d1gunakan untuk mengekspansi tree. Misalkan. untuk sub-node dengan nilai atribut rcndah, nilai dcrajat keanggotaan dari data no.38 1,, = O. I dan dcmja1 kcanggotaan dari data no.38 pada root node /'IJ/;/ • I, maka nilai dcrajat keanggotnan nya pada sub-node 11.,,.adalah:
µ - µ1®µ,x,1 l®O I 0.1
5. m・ョセィQエオョR@ propon1 dari tiap kclas yang ada pada 1iap-ti.tp node Mi!.alkan, unmk sub-node dcngan nrla1 keanggotaan atnbut rcndah. proporsi kclasnya adalah . C1 • 0.1 I t I • 2. I
C: = I
Proporsi kclas I (negatif diabetes) _ ⦅Nウ⦅N
Q
セN@ _ 67 74"-C, + C: ,. - ' •
Propon.1 kclas 2 (pos1tif diabetes) -__fl_ • t 00'1• 9 32.26%
C, +C2
6. Pada contoh ini digunakanfa.:ziness control threshold (8,) sebcsar 80% don leaf decision threshold (B.) sebesar 2001o• 15 = 3. Kcdua threshold tersebut akan menenrukan apakah s11b-11ode akan terus diekspansi atau tidak. Misalkan sub-node dengan nilai atnbut rendah yang rremiliki data scbanyak 4, berdnsarkan nilai proporsi kelas I (67 74%) d:m kclas 2 (32.26%) yang lebih kecil dari 0,
(800/o) dan banyaknya data atau record pada sub-node tersebut lebth besnr dan
o
•.
maka sub-node tcrscbut akan tcrus dickspans1. Lain halnya Jika (), yang digunakan adalah 65%. rroka sub-node tersebut udak akan dickspans1.7. l.akukan tcrus ckspans1 dan sub-node yang ada SW1Jai lldak ada l3g1 data yang dapat diekspansi atau tidak ada lagt atribut yang dapat digunakan untuk mengekspansi tree ya1tu kctika tree yang tcrbcnruk sudah mencapai kedala1ron rmhin'llm atau sub-node tidalc mem:nuhi syarat dari thre.fhold yang dibcnlcan. Jika sub-node sudah tidak dapat dickspansi rmka nilai proporsi kelas terbcsar mcrupakan kcsir11>u lan dari scku1J1>ulan atumn yang diperolch dengan menghubungkan se1iap node yang dilewati dan root node hingga leaf node. Garrbar 6 menunjukkan fazzy decision tree yang diperoleh dari training set.
Gun!Mr 6 F11::.• df!cmon tru wtuk training st!I
IV. llASIL DAN PEMBAHASA>J
Berdasarkan langkah-langkah algoritme FIDJ dalam Bab
m
diperoleh scbuah model yang terdiri atas 9 aturan、・ョァ。セ@
セョァァオョオォ。ョ@ training set. Model atau aturan klasifikasi yang
d1perolch:
I. IF GPOST' rendah AND HDL rendah THEN Negatif
dゥ。「」エ」セ@
2. IFGPOST' rcncbh AND HDLscdangTHEN Ne11o1tifD1Abc1es 3. IF Gl' OST' rend.th AND HDL tinggi THEN Pos.it1fD1abctcs 4. IF GPOSf sedan11 THEN THEN Ncgatif Diabetes
50 L\ITERNETWORKING INDONESlA JOURNAL ROMANSYAH ET AL.
5. IF GPOST tmgiii AND GLUN rembh THEii/ Nci;;attf
Diabetes
6. IF GPOSl' tin&&i AND Gl U:-1 sedang TllliN nセセエゥヲ@ Diabctc.t
7. IF GJ>OST tinggi AND GLUN tml!&i THcN Ncgauf Diabetes
8. II· GPOST tmw AND GLU 'sang;u tmggi THE!\ Pos11tf
Diabetes
9 IF GPOSf $ang;it エゥョセ@ T HE'I Posit if Diabetes
Bcrdasar m:1odc ujt 10-fold cross validation. proses /ruining dilakukan sebanyak
240
kali. Untuk sc1iap trainingset, proses training d1lakukan scbanyak 24 kali, dengan
m:ngubah ntlai 0, sebanyak 6 kali yaitu 75%. 800/o, 85%, 90%, 95%. dan Yセ@ •. dan untuk rmsmg-masing nilai 0, yang sarro 1.hhcnlran nilai
o.
yang bcrbeda-bcda yattu 3%. 5%, 8%, dan 10010. Rata-rata jumlah aluran yang dihasilkan pada proses training dan waktu eksck-usi yang dibutuhkan dapat dilihat pada Tabel 2 dan Tabcl 3.TABLE2
IV.TA-RA TA JUMLAll aャャjraセ@
8,
o.
3•1. S"/a 8% 10•;.
1s•1. 4 4 4 4
so•;.
7 7 7 6ss•1. II 10 10 8
90•1. 12 II 10 8
YUセQN@ 20 18 15 11
YXセセ@ 27 24 20 16
Ndai-mla1 0, dan 0, yang digunakan dipilih berdasarkan has ii percobaan. karcna dengan n ilai-nilai 1crscbu1 jumlah m:idel atau a1uran yang dihasilkan n-.:ngalami perubahan yang cukup signifikan. Dengan nilai 8, 70"/o, aturan yang dipcrolch
tidak berbeda dcngan ntlat {), 75% sehingga nilai 8, hanya
d1pilth SUfl1>UI 75%.
TABLE3
RATA-RATA WAkT\J EKSEl.:U<;I DALAM DETIK
(},
o.
3% s•1. 8'!/e 10%
75•;. 0,125 0,128 0,120 0,127
80'!1. 0,239 0,227 0.214 0,183
85% 0,344 0,334 0,308 0,24•
90% 0,404 0,361 0.328 0,264
95% 0,7 I 7 0,594 0,492 0,356
98% 0,955 0,842 0,712 0,544
Bcrdasarkan hasil percobaan. semakin tinggi nilai 0,
scrmkin banyak pula aturan yang dihasilkan, hal ini le1Jad1 karena scbelum suatu node didommasi olch sebuah kelas dun proporsi untuk kelas tersebut di atas atau sann dcngan nila1 0,
rmka tree akan 1erus d1ekspans1. Pnda Tabcl 2 1crliha1 bahwa,
peningkatan yang pahng s1gmfikan IC1Jad1 pada snat nil:u 0,
dino1kkan dari 90% in:njadi 95% dan dan 95% menjac.li 98% Kondisi serrocnm m1 discbabkan karena pada 5331 ekspans1
traming set yang pertama kali dilakukan banyak sub-node
yang pmporsi i.al:ah satu kelasnya sudah mcncapat nili!.i di 。ャ。セ@ 9()0/e, sehingg11 sub-node tcrscbut tidak pcrlu dickbpanst lag1. Kctika nilai (}, ditingkatkan san'\)ni 95%, b:nu 1erjadi ckspansi pada beberapa sub-node yang lain dan hasil proporsi kclas pada node dt bawahnya pun 1cmyata banyak yang leb1h rendnh dnri niJai fl, yang rrengakibatkan training set akan terus dickspansi sa111>ai scluruh atnbut 1erpaka1.
J1ka diamati dengan scksama pada Tabcl 2, walaupun nilai
O. ditingkatkan. jumlah aturan yang dihas ilkan tidak mcngalami penurunan sccara sigmfikan . Bcrdasarkan pengarrotan yang dilakukan, temyatu karaktcnstik data pada training set yang digunakan tidak terlalu bcrbeda. pada saal tel)lldi ckspanst tree data tidak akan terlalu mcnyebar, karenanya jumlnh hi111>unan data yang ada pada sub ·node tidak berbeda jauh dengan JUmlah h1111>unan data yang adn pada root-node. Dengan adanya s1cuas1 yang demilcian, syarat untuk menghcnliknn ekspansi tree yaitu jumlah data atau record pada s11b-node
harus leb1h kecil dari nilai
8. SU
lit untuk Cercapat.Nilai 0, yang ter1alu rcndah dan atau
o.
yang terlalu tinggi akan menghasilkan tree dcngan ukuran yang kccil sehingga JUmlah aturan yang dihas ilkan juga sangat :.cdik:it, hal in1 lcl)adi karena tree yang scdang dibangun mcngalami pcrrotongan (pnming) pada saat rrodcl 1msih mc111>elaJari struktur dari training セ・エN@ Sebahknya, nilai (I, yang tcrlalu tinggi dan 111auo.
yang tcrlalu rcndah kadang kala akan menycbabkan
/11:..-y
decision tree bcrpcrilaku scperti dec1S1011 tree biasa yang tidak memerlukan adanya threshold behingga menghasilk.an tree dengan ukuran sangat besar dan jumlah aturan yang juga sangat banyak, karcna tree akan terus diekspansi sa""a1 leaf node terdalam
JO
2S エMBBセイゥZGBBGBGャBGエセNNQBャGjセセセ@ セセNキセ@
AZィG[セセゥAヲNャ@
ャGッセセセ@
セィゥゥゥャMッャセ@
761" - ILSlt.
..
Gimbar 7 Pcrbu.nchngan rata-ra111 JWnlah at wan
Garrbar 7 menunjUkkan perbandingnn rata-rata jumlah aiuran yang dihasilknn pada proses training . Dapat ter1ih111 bahwa sc1mkin 1inggi nil111 0, akan menyebabkan jumlah amran yang dihasilkan Jugu meningkat, hal scbahknya tcrjadijika nilai
Vol I 'No 2 (2009) intャセnイZtworking@ INDONl:.SIA JOURNAL 51
1,20!)
I 000
セ@ GlllO
i
0600I
0."'4G.2llll
O.OllO
1511.
-Gamoor 8 Pcroondingan rat11-rat11 waktu cksckusi proses trommg
Dengan melihat Qumar 7 dan Garrbar 8, dapat disi"l'ulkan bahwa, セ・ョオォゥョ@ tinggi ntlai
0,
yang d1gunakan akan n-cnghas1lkan jumlah aturan yang serrokin banyak セ」ィゥョァァ。@waktu yang dibutuhkan untuk ュ・ョァィ。セゥャォ。ョ@ aturan-aturan tersebut jUga m:ningkat. hal ini terjad1 karcna proses yang harus d1lakukan untuk merman gun tree セ・イイッォゥョ@ banyak.
Untuk mengukur akurasi dari model y:mg dihasilkan pada fase 1ru111ing, proses testing dllak"Ukan scbanyak 24-0 k.ali. Proses tes1111g dilakukan dengan cara merrosukkan aturan yang diperoleh dari proses training ke dalam sebuah FIS Mamdani [7] untuk menentukan kelas dari rmsing-rrosing record pada
test set Untuk satu kali proses train111g dilakukan satu kali proses testing.
Dengan mellhat has ii testi11g, mengubah nilai O,dan
o.
tidak menyebabkan adanya perubahan pada 01la1 akuras1 dari 100del yang ada, walaupun jumah aturan yang dihasilkan prosestraining mcngala1111 peningkatnn. Hal ini terjadi karcna secara
kebetulan selllla aturan pada kcdua model terscbut mcmiliki kelas target yang sarro yaitu ncgatif diabetes dan test set yang digunakan JUga bcrasal dari kclas target yang sarro schingga has ii test111g dari kcdua buah model dengan test set yang sarm tidak n-.;ngalarn pcrubahan Na1T110 roodcl dcngan aturan yang seragam scpert1 1111 tidak dapat dipaka1 untuk m:lak'Ukan prediksi k:arcna beropapun nilai atribut ynng dibcrikan hasilnya akan sclalu negatif diabetes. Hasil Jesting akan bcrbcda jika aturan-aturan pada model yansi dihru:ilkan mcmiliki kel3s trug.:t yang bcrbcda. Model untuk training set pcrtama dcngan 0,
(75%) Jan O. (3%)·
II· Ci'OSf rcndah THEN Ncg:111f Diabetes
lfGPOST ocdangTHEN Ncg;it1fDiabctcs IF GPOSf tini!jp THE:.N Nclliltif Diabetes
IF GPOSf sangat tmeai THEN Ncgatif Diabetes
Pada test set kelUJUh dan kcdelapan, nilai ak'Urasi mcngalami pcnurunan saat 0, ditmgk:atkan m:njadi 80"/Q. Berdasarkan pcngarmtan yang dilakukan , kcadaan scpcrti ini dinrumkan
overjitling karcna terlalu tmgginya 0, untuk trai11rng set
tcrscbut, sehingga tree akan terns diekspansi sa"l'ai betul-bctul ウ」セオ。ゥ@ dcngan training set. Akibatnya tree memililci node-node yang rrengandung data yang mengalairi kesalahan klasifikas1.
V. EvALUASI KINERJA FI03
Evaluasi
k:inerja
algoritl'm 1'103dapat
dtketahm dengan cara rrcngh1tung rata-rata 。ォオイ。セゥ@ dari seluruh proses エ・セエイョァ@ pada10 lt!sl .Td yang bcrbcda. Evaluasi kinerj:i dari algontm:: FID3
pada nilai
0,
dan (;).yang bcrbcda dapat dilihat pada Tabel 4.TABU:.4
At..t;RASI FUllYDECtS/O.VTREF.
93,45 93,45
92.07 93,45 93.45 91,73 93,10 93,45 91.73 93,10 YSLTセ@
Dan Tabet 4 dapat dilihat bahwa lanel)a algontm: FID3 mengalami penurunan jika 01la1 (J, sc1rokm besar dan atau nilai
o.
semakin kecil. walaupun penurunan yang icrjadi tidaklah signifikan schingga rmsih dapat ditoleransi. Sepem tcbh dijelaskan scbclurmya kondis1 mi disebabkan karcna tel)admya fcnomcna over.fitting. Nila1 nkurasi terbaik yailu 94,15% dipcroleh pada 0, "" 75% dano.
=
8 % atau 10"/o.VI. Kl:.SIMPULAN
Dari beri>agai pcrcobaan yang dilakukan tcrhadap data Diabetes didapat kcsr"l'ulan bahwa algoritme FID3 me1Tlhlc1 kinerja yang bailc dalam mcrrbentukji1.uy decision tree untuk data Oiabeics yang ada. Nllai akurasi terbaik dari roodcl yailu 94, I 5% diperolch pada .fi1=1ness control threshold (0.) = 75°4 dan leaf decision threshold (0.)
=
8 "• atau 10"/o. セゥャSゥ@ 8.dan tJ.sangat bc,,,engaruh tcrhadap jumlah aturan yang dihasilkan. nilai 0, yang tcrlalu tinggi akan menyebabkan turunnya nilai akuras1
Di
lain pihalc, oilai O. yang tcrlalu rendah JUga dapat menycbabkan akurast irenurun .REfl.RENCES
[I] E cッセ@ Fu:g• Modt!ling and Algon1hm1 for Dat11 mining and £xplorallo11 . USA Academic Press. 2005.
(2) L. Fu. Neur11/ Net1mrk In Compult!r lnttllt!gtnct:. Singapura
McGn1wHill. 1994
(3) J Han and \f. Kamber V..ta Mlfttng Concepl.1 and Techniques
Simon Fraser University. USA· Morgan Kaufman, 2006
[4) Hcl'\\:11110. PC'ngt:mbangan S1stem Datu Mming unlllk Diagnosis
Penyakll Diabttlt!S Mttnggunukan At1onlmt! Oassijicutiott Busrd
Assoc1atron {Tcsis). Bogor Dep:utcmcn llmu Kompllcr Faltultu
M1tcma1ib dan llmu p」ョセエ。ィオ。ョ@ Alam lnst11ut Pcnania.n Boi:or,
2006.
[SJ G Liang. .,. Compura1i1-e S111d1• of nrf't!t Dl'ds1on Tru ulgurilhm)
/DJ. Fuzzy /DJ and Prohab1/istic Fu:, !DJ . lnformi>lic.> & Economics Erasmus Unr\'crsity Rottcrd;am Ro11crdam, the Netherlands, 2005.
(6) C. Marsala Applica1io11 of Fu;;:y R11/t Induction lo D.itu Mini11g.
U111vcrS1ty Pierre ct Marie Cune. 1998
[7) Ormos L. Soft Compurmg Mcthod On n.om 's Catustropht 11rwry
For OJ111ro//i11J: Of lurge-Scalc· Systems UnivEJsty of Mi9<olc, Df.1)wtmMt of Aliomaioo. 2004
[8) Y Yuan din Slaw M J lnd11c11on ofjw:::)' dt,ision fr.-t."S, Fu:=) St'/.S
and Systl'mS Vol 69 1995
52 rNTERNETWORKING fNDONESIA JOURNAL
flrat Roman sya h dilah1rk.i11 di l111lc:111c'l:1 p:1d:1 1ahu11 I Yセs N@ Dia mcmpcrolch i;clur S.uju11d llmu Kornputcr dad Dtpar1cmen llmu Kompticr, l11st1IU1 Pcrtanian Boi;or. ャョ、ッョ」セゥ。@ pada 1ah1U1 2007. S.Sa1 i111
dla bckerJ3 scblp1 aウNキ」[ゥ。エセ@ Businl'.U Consultunt {IT Consulton1) di PT AGIT (Mira Gr1ph11 Information Tcchnolo&Y)
Im•• S ukaulh Sltangcang dllah1rkan dJ Indonesia pada エセィオョ@
1975. Dia mcmpcrolch gcl11r Swjana Matcmatika dari Dcpancmen Ma1cmu11ku, lnst1tu1 Pcrtaniao Boiior. Indonesia pa<b tnhun 1997 d:m mcndapat gclar Maslcr llmu Komputcr dan Univcrsitas GidJah Mada. Indonesia pad.1 1ahun 2002 Saal 1n1 di11 bckcrja sc!Xlg;ii do.en di Dcpartcmcn llmu KompUtcr, lnstlllll Pcrtaman Bogor, Indonesia Topilc ut:ima pcncltt1annya adalnh d.tl.sm sr1arlal data mining
Sri Nu rdlatl dilahirkan d1 lndoncs1:a pada t ahim 1960. Dia mcmpcroleh gclu SarJana 9at1st1ka dart lnolitut PcrtaniJn Boi,'Or, lodoncs1a pada tahun 1984 dan mcndaput gclar Master llmu Kompu1 er dari 1711: uQQゥセQュゥエケ@ of IJestern Ontario di Canada pada lahun I 99 t. l'uda tahun 2005 dia mcmpcroleh gclar Dok1or Matcm:itilca TcrJpun dart
TH.t'nte uョュセュセQ ᄋ@ c.b Bclancb. Saat 1111 d1a bckcrJa sc:bug;u 、ッセョ@ Ji
Depancmcn llmu Kompiacr. ln:st1tU1 Pcn.mian Bogor. lndonc>ia Toptk Ulama pcncht1annya adalah scientific- rnmputmg
..
lnternetworking
Indonesia
Journal
n,e ャョ 、ッ ョ 」NNセQ。 ョ@ Journal ot ICT :iml lncernet Development
ISSN: 194!-9703
About the ャョ エ・ イョ 」 エキ ッ イォゥョセ@ ャョj ッ ョ 」 セゥ。@ Journal
The lnterncrwork mg lndonrsin lnurnal (llj) w:'h escablishcJ our of the need ro aJdrt'" che l:iclc of an l ndoncs1a-w1de mdepenJcnc acaJcnuc and ーイッヲ」セセゥッョ。ャ@ 1ournal covering the broad aren of Information and Communication Technoloi.•y (l(T) and lncemct Jcwlorment m 1 ョN ャ ッョ」セQZQ@
TI1e
broaJ aims of rhe lnrernecworkmg Indonesia Journal (llJ) are therefore as ヲッ ャャ ッキセZ@Provide an lndonesia·widc independent joumal on lCT: The llJ seeks to be an ャョjオョ」セゥ。 ᄋ キゥ、・@ 1ournal independent from any specific ゥョセュオイゥッョG@ in ャ ョ、ッョ」セゥQ@ (such :i.s universities and S:<M:rnmcnr 「ッ、ゥ」セIN@ Currcndy m lndonesm there arc ョオュ・イッオセ@ univerMty·issucJ ェッオイョ。ャセ@ chat publish parers only frool the イ」セ ー」 」」ゥカ・@ オョ ゥ カャNG イ セゥ」ゥ・セN@ O ften che.se university JOUrnals experience Jlfficulcy in maintai ning ウオセ」。ゥョ。「QャQエケ@ due co the limited number of internally authored paper:.. Add1t1onally. moM of d1\.-,,e
オョQカ・イセゥイケᄋゥウオ・、@ 1ournals do noc have an independent review and ad\•1sory hoard, and mosc do noc h:we referees anJ イ・カゥ・キ・イセ@
from tlw international community.
Provide a publi.shini: venue for gr<1 Juarc ウ イオ、 」ョQ セᄋ@ The llJ seeks al,o to N: a イオィャゥLィゥョセ@ venue for graJuace >cudcnc• (such as m 。セ」」イG@ 'S! and Ph[)/ $) i.cuJcnt,) :ti. well 。セ@ working academic' in the hroaJ field of ICT.
TI'b
ゥョ」ャオ、・Mセ@ graduate HUdcnt.i> fromャ ョ、ッョ・セ Q Nュ@ unl\·ersak;, anJ 1hoi.c ,ruJ ying .1broaJ. The llJ prm•ides an awnue tor these セエオj・ョエウ@ co publish their paper.. ro a
juurnal which t) mtcrnacional m m n ... ·icwcr 'cope anJ in 1u NQjアセッイケ@ board
lmpro\e the quaJicy llf relicarch & publicacionlt on lCT in ャュャ ッ ョ 」セゥ。Z@ One of the long term goals of th.:: llJ is co promote
イ」^セ・。イ」ィ@ on ICT :md Internet ,kvdopment in Indonesia, anJ over time ro impnwe the qua lity of academic and cechnical rub-lic.lnon' lrom the Indonesian ICT community. Addmonally, che llJ 'eeb to be 1hc mam publicanon \t:nue for v:mous authors Wllrldw1dc キィッセ」@ inte rest include lnJonesm and l f lt grnwing area o( information anJ communication technology.
Pro .. idc acces.o. co academics nnd professionals ovcm:as: The Ed1cor1:1I Advisory Board (EAB) of lhe llJ Is intentionally com· J)li,ed of mternacional academics and ー イ ッヲ・ウウ ゥ ッョ。ャウLセ@ キ・ャャセ@ those from Indonesia. The aim here Qセ@ to pl'0\'1Je ャョ、ッョセ Q 。ョ@ au thor, with access to mrernarional academic:. :1nd profoss1onals who are aware of and sensirive co che issues faci ng a dewlop-ing nauon. Similarly, the llJ セ・」 「@ to provide readers worldwide witl' easy acces:. to informacion regarding
1<.I
and Internee Jc:vdormenc m ャョ 、 ッョ・セゥ。N@Promote cbe culture of WTiting an<l authorship: The II.I seeh to promote che culture of wrinng and of cxccllenc auchor,h1 p m Indonesia wirhin the brn:id area of ICT. It ゥセ@ for chis re3$on chat rhe llJ Q セ@ bili neual in char 1r accepc10 :ind puhl .. h.-.
rarv•
in