I PENDAHULUAN
1.1 Latar Belakang
Kata-kata manusia pada data mempunyai perbedaan batas pengertian. Beberapa kata mungkin mempunyai arti yang lebih umum dibandingkan dengan yang lainnya. Derajat kemiripan dari dua kata tidak perlu simetris atau transitif. Sebagai contoh, warna “merah” mempunyai pengertian yang lebih umum dan lebih luas dibandingkan dengan warna “merah tua” yang mempunyai arti lebih spesifik. Kata “merah” mempunyai interval yang lebih luas daripada kata “merah tua” sehingga interval dari pengertian warna adalah berbeda untuk dua kata. Biasanya kalimat “merah tua seperti merah” lebih benar dan biasa digunakan daripada kalimat “merah seperti merah tua”. Selain itu, dapat dikatakan bahwa derajat kemiripan dari “merah dengan diberikan merah tua” adalah berbeda dengan “merah tua dengan diberikan merah”.
Dalam kehidupan sehari-hari seringkali ditemui suatu fenomena yaitu data mengandung sesuatu yang tidak akurat dengan derajat keakuratan data yang berbeda. Data yang tidak akurat tersebut dapat berupa kata-kata manusia yang bersifat relatif. Himpunan fuzzy dapat merepresentasikan data yang tidak akurat tersebut.
Pada tulisan ini, relasi peluang bersyarat fuzzy atau fuzzy conditional probability relations (FCPR) digunakan untuk merepresentasikan relasi kemiripan antara dua himpunan fuzzy yang tidak perlu simetris atau transitif. Konsep dari FCPR akan difokuskan pada relasi kemiripan yang lemah yaitu relasi fuzzy biner dengan perumuman relasi kemiripan (Zadeh 1970 dalam Intan dan Mukaidono 2004).
Sistem informasi fuzzy yang digunakan pada tulisan ini adalah tabel data fuzzy
sederhana yang merupakan aplikasi dari knowledge discovery and data mining (KDD). Pertama, akan diperkenalkan FCPR dari dua himpunan fuzzy pada sistem informasi fuzzy yang diberikan. Kemudian, dengan memanfaatkan derajat kemiripan dari FCPR, maka tulisan ini akan memperkenalkan aplikasi FCPR pada sistem informasi fuzzy yang diberikan. Aplikasi tersebut adalah konsep α-objek redundan, ketergantungan atribut, pendekatan data reduksi dengan operator proyeksi, dan aplikasi yang terakhir adalah pendekatan data query yang berdasarkan pada input bergantung dan input bebas.
1.2 Tujuan
Tujuan penulisan ini adalah :
1. Merekonstruksi FCPR dari dua himpunan fuzzy pada sistem informasi fuzzy.
2. Merekonstruksi α-objek redundan
berdasarkan pada FCPR pada sistem informasi fuzzy.
3. Merekonstruksi ketergantungan atribut berdasarkan pada FCPR pada sistem informasi fuzzy.
4. Merekonstruksi pendekatan data reduksi dengan operator proyeksi, dan pendekatan data query pada sistem informasi fuzzy. 1.3 Ruang Lingkup
Ruang lingkup penulisan ini adalah :
1. Tulisan ini dibatasi pada rujukan utama jurnal Fuzzy Conditional Probability Relations and Their Applications in Fuzzy Information Systems (Intan dan Mukaidono 2004).
2. Sistem informasi fuzzy yang digunakan dibatasi pada tabel data fuzzy yang sederhana (ukuran tabel tidak besar).
3. Konsep FCPR hanya difokuskan pada relasi kemiripan yang lemah yaitu relasi fuzzy biner dengan perumuman relasi kemiripan.
II TINJAUAN PUSTAKA
2.1 Himpunan Crisp dan Himpunan Fuzzy Definisi 1 Himpunan Crisp
Himpunan crisp A didefinisikan oleh elemen-elemen yang ada pada himpunan itu. Jika a∈ A , maka nilai yang berhubungan dengan a adalah 1. Namun jika
,
a∉ A maka nilai yang berhubungan dengan a adalah 0. Keanggotaan himpunan crisp selalu dapat dikategorikan secara penuh tanpa ada ambiguitas.
Definisi 2 Himpunan Fuzzy Misalkan ˆ {ˆ1, ˆ2, ..., ˆn}
j j j j
D = d d d adalah
himpunan dengan domain crisp dan Dj
adalah himpunan dengan domain tidak akurat. ˆi
j
d adalah nilai data crisp ke-i dari domain ˆDj dan ˆ
j j
D ⊆D
.
Data tidak akurat, x∈
Dj, menganggap himpunan fuzzy x padaˆ j
D adalah definisi yang sederhana dari ˆDj ke selang tertutup [0,1] dengan fungsi keanggotaan : ˆ [0,1]
x Dj
μ → .
Himpunan fuzzy x didefinisikan oleh :
{
(ˆi) ˆ ˆi i ˆ}
, x j j j j x= μ d d d ∈D (1) dengan (ˆi) x djμ adalah nilai derajat
keanggotaan dari ˆi j
d pada x.
(Intan dan Mukaidono 2004) Himpunan fuzzy didasarkan pada gagasan untuk memperluas jangkauan fungsi karakteristik sedemikian sehingga fungsi tersebut akan mencakup bilangan real pada interval [0,1]. Nilai keanggotaannya menunjukkan bahwa suatu elemen dalam semesta pembicaraannya tidak hanya berada pada 0 atau 1, namun juga nilai yang terletak di antaranya. Dengan kata lain, nilai kebenaran suatu elemen tidak hanya bernilai benar atau salah, dan masih ada nilai-nilai yang terletak antara benar dan salah. Himpunan fuzzy memiliki 2 atribut, yaitu: a. Linguistik, yaitu penamaan suatu grup
yang mewakili suatu keadaan atau kondisi tertentu dengan menggunakan bahasa alami, seperti : muda, probaya, tua.
b. Numeris, yaitu suatu nilai (angka) yang menunjukkan ukuran dari suatu variabel seperti : 40, 25, 50, dan lainnya.
(Kusumadewi 2002) Definisi 3 Fungsi Keanggotaan
Fungsi keanggotaan μ dari himpunan fuzzy x adalah pemetaan dari himpunan dengan domain crisp ˆDj ke selang tertutup [0,1], dinotasikan dengan :
{
(ˆi) ˆ ˆi i ˆ}
,x j j j j
x= μ d d d ∈D
(2) (Intan dan Mukaidono 2004) Definisi 4 Sistem Informasi Fuzzy
Sistem informasi fuzzy didefinisikan sebagai pasangan I = (U, A), dengan U
adalah himpunan semesta dari objek dan A adalah himpunan semesta dari atribut sedemikian sehingga a Uj: →Dj, ∀ ∈aj A . Dj
adalah himpunan nilai dari atribut aj dengan
data Djadalah data tidak akurat (bernilai fuzzy).
(Intan dan Mukaidono 2004) Definisi 5 Total Ketidaktahuan
Misalkan ˆ {ˆ1, ˆ2, ..., ˆn}
j j j j
D = d d d adalah
himpunan dengan domain crisp dan Dj adalah
himpunan dengan domain tidak akurat. ˆi j
d adalah nilai data crisp ke-i dari domain ˆDj dan
ˆj j
D ⊆D . Total ketidaktahuan atau total ignorance (TI) atas ˆDj dengan ˆi ˆ
j j
d ∈D merupakan representasi sederhana yang didefinisikan oleh :
{
ˆ1 ˆ2 ˆ}
T I 1 ,1 , ...,1 n , j j j d d d = (3){
1 1 1}
ˆi 0 ˆ,...,0 ˆi ,1 ˆi,0 ˆi ,...,0 ˆn , j j j j j j d = d d− d d+ d (4) dengan 1 T I(dˆj) 1μ = yang diwakili oleh 1 ˆ1
j
d . TI dianggap seperti himpunan fuzzy yang merepresentasikan himpunan semesta dengan diberikan domain crisp.
(Intan dan Mukaidono 2000a) Definisi 6 Relasi Kemiripan
Relasi kemiripan adalah pemetaan : x [0,1] j j j s D D → , dengan x y z, , ∈Dj, a) Refleksif ( , ) 1, j s x x = (5) b) Simetris ( , ) ( , ), j j s x y =s y x (6) c) Max-min transitif
{
}
( , ) max min[ ( , ), ( , )] . j j j s x z ≥ s x y s y z(7)
(Zadeh 1970 dalam Intan dan Mukaidono 2004) Definisi 7 Relasi Kemiripan yang Lemah
Relasi kemiripan yang lemah adalah pemetaan Sj:DjxDj→[0,1]
,
dengan , , j x y z∈D.
a.) Refleksif ( , ) 1, j S x x = (8) b.)Simetris Jika S x yj( , ) 0,> maka S y xj( , ) 0,> (9)c.) Transitif
Jika ( , )S x y S y xj ≥ j( , ) 0> dan ( , )S y z S z yj ≥ j( , ) 0> maka ( , )S x z S z xj ≥ j( , ). (10) (Intan dan Mukaidono 2004) Definisi 8 Kardinalitas Himpunan Fuzzy
Misalkan y adalah himpunan dengan domain tidak akuratik Dj dan dˆij adalah
nilai data crisp ke-i dari domain crisp ˆ j D, maka kardinalitas himpunan fuzzy y didefinisikan sebagai berikut :
ˆ ( i).
y j
i
y =
∑
μ d(11)
(Klir dan Yuan 1995) Definisi 9 Relasi Peluang Bersyarat Fuzzy
(FCPR)
Misalkan µx dan µy adalah dua fungsi
keanggotaan dengan diberikannya domain ˆj
D untuk dua himpunan fuzzy dan misalkan
, j
x y D∈ maka FCPR adalah pemetaan : x [0,1]
j j j
R D D → yang didefinisikan oleh :
{
ˆ ˆ}
min ( ), ( ) ( , ) ˆ , ( ) i i x j y j i j i y j i d d x y R x y y d μ μ μ ∩ = =∑
∑
(12) Rj(x, y) merupakan derajat y yang serupadengan x.
(Intan dan Mukaidono 2004) 2.2
α
-Objek RedundanDefinisi 10
α
- Objek RedundanObjek ui∈U dianggap sebagai α‐objek redundan pada sistem informasi fuzzy I(U, A) jika terdapat objek uj∈U yang mencakup semua karakteristik dari ui
sedikitnya dengan derajat dari 1 2 ( , , ..., m) α = α α α yaitu apabila memenuhi :
(
( ), ( ))
, , k k j k i k m R a u a u ≥α ∀ ∈k ` (13) dengan Rk adalah FCPR antara dua elemendata pada domain Dk, dan αk∈[0,1].
( ), ( ) k j k i k
a u a u ∈D melambangkan pemetaan dari atribut ak ke objek uj dan ui.
(Intan dan Mukaidono 2004) Definisi 11 Relasi Identitas
Relasi identitas adalah pemetaan : x {0,1} j j j I D D → , untuk x y, ∈Dj, 1, ( , ) 0, lainnya. j x y I x y = ⎨⎧ = ⎩ (14)
(Intan dan Mukaidono 2004) 2.3 Ketergantungan Atribut
Definisi 12 Derajat Ketergantungan Atribut Misalkan I = (U, A) adalah sistem informasi fuzzy, dengan U ={u1, ...,un} adalah himpunan semesta dari objek dan A adalah himpunan semesta dari atribut. ,C B ⊆ A.
( , ) i C B
δ didefinisikan sebagai derajat
ketergantungan C menentukan B pada objek ui
dengan : min ( ( ), ( )) ( , ) . min ( ( ), ( )) j j a C B j j i j u U i a C j j i j u U R a u a u C B R a u a u δ ∈ ∈ ∪ ∈ ∈ =
∑
∑
(15)(Intan dan Mukaidono 2004) Definisi 13 Ketergantungan Fungsi Fuzzy
(FFD)
Ketergantungan fungsi fuzzy atau fuzzy functional dependency (FFD) C menentukan B (C→B) pada sistem informasi I (U, A) yaitu jika memenuhi :
( , ) ( , )
i C B i B C
δ ≥δ
,
∀ ∈i `n.(16) (Intan dan Mukaidono 2004) 2.4 Pendekatan Data Reduksi dengan
Operator Proyeksi Definisi 14 Tabel Keputusan
Misalkan I(U, A) adalah sistem informasi dan misalkan Con Dec, ⊂ A dengan Con adalah atribut kondisi dan Dec adalah atribut keputusan. Sistem informasi yang membedakan antara Con dan Dec disebut dengan tabel keputusan dan dilambangkan dengan :
( , ) ( ,U Con Dec, ,αCon Dec),
℘= (17)
dengan
α
(Con Dec, )∈[0,1] menentukan derajat ketergantungan keputusan (Dec) dengan diberikan kondisi (Con).(Pawlak 1991) Definisi 15 Relasi ℜ
ℜadalah relasi R(D) yang ada pada I(U, A), dengan setiap tuple pada relasi ℜ berhubungan ke objek pada himpunan objek U dan himpunan domain D = {D1, D2,…, D3} berhubungan ke
himpunan atribut A={ , ,...,a a1 2 am}.
Definisi 16 Proyeksi Relasi ℜ
Proyeksi relasi ℜ pada dom Con Dec( ∪ ) (domain atribut pada Con∪Dec) didapatkan dengan mengambil pembatasan dari tuple ℜ ke dom Con Dec( ∪ ).
Proyeksi dari ℜ di atas dom Con Dec( ∪ ) adalah relasi 'ℜ yang didefinisikan dengan :
( ) '{ ( ( )) | }.
Con Dec t dom Con Dec t
π ∪ ℜ =ℜ ∪ ∈ℜ (18)
(Intan dan Mukaidono 2004) Definisi 17 Fuzzy c-Partition
Misalkan ˆ {ˆ1, ˆ2, ..., ˆn}
j j j j
D = d d d adalah
himpunan dengan domain crisp dan Dj
adalah himpunan dengan domain tidak akurat. ˆ
j j
D ⊆D dan ˆi j
d adalah nilai data crisp ke-i dari domain ˆDj. Fuzzy c-partition dari ˆ
j
D adalah keluarga dari anak himpunan fuzzy atau kelas fuzzy dari P, dengan P ={p p1, 2, ...,pc}, yang memenuhi : 1 ˆ ( ) 1 c k p i j i d μ = =
∑
, ∀ ∈k `n, (19) dan 1 ˆ 0 n ( k) pi j k d n μ = <∑
< , ∀ ∈i `c, (20)dengan c adalah bilangan bulat positif dan ˆ
( k) pi dj
μ ∈[0, 1].
(Intan dan Mukaidono 2004) Definisi 18 Derajat Ketergantungan pada
Relasi ℜ
Misalkan X = {x1, x2, …, xn} adalah
himpunan fuzzy (hasil dari fuzzy partition) yang akan menjadi himpunan atribut Con = {a1, a2, …, ar} dan misalkan Y = {xr+1, .…,
xw} adalah himpunan fuzzy (hasil dari fuzzy
partition) yang akan menjadi himpunan atribut Dec={ar+1,…,aw}. Jika ada n tuple di
,
ℜ maka derajat ketergantungan Y diberikan X pada relasi ℜ diberikan oleh :
1 1 1 1 m in ( , ( )) ( , ) . m in ( , ( )) n w j j j j i i n r j j j j i i R x a t Y X R x a t ϕ = = ℜ = = =
∑
∑
(21)(Intan dan Mukaidono 2004) Definisi 19 Ketergantungan Fungsi Fuzzy
pada Relasi ℜ
Misalkan himpunan fuzzy X dan Y merepresentasikan dom(Con) dan dom(Dec), maka ketergantungan fungsi fuzzy pada relasi
ℜdilambangkan dengan X →p Y yaitu jika memenuhi :
( , )Y X ( , ).X Y
ϕℜ ≥ϕℜ (22) Persamaan tersebut adalah bagian dari FFD.
(Intan dan Mukaidono 2004) Definisi 20 (α(X,Y))
( , )X Y
α
adalah definisi sepertiα
–cut yaitu derajat ketergantungan X dalam menentukan Y yang memenuhi persamaan berikut :( , )X Y 0 ( , )Y X ,
α = ⇔ϕℜ <α (23)
( , )X Y ( , )Y X ( , )Y X ,
ϕℜ =ϕℜ ⇔ϕℜ ≥α (24) dengan α∈ [0, 1].
(Intan dan Mukaidono 2004) 2.5 Pendekatan Data Query
Definisi 21 Peluang Query untuk Input Bergantung
Misalkan {A1, A2, …, An} adalah himpunan
input domain, B adalah himpunan output domain dari data query, D adalah himpunan semesta dari domain (A1, A2, …, An, B ∈ D),
dan ℜ adalah relasi pada R(D). Peluang query untuk b* diberikan input yang bergantung
* 1, ..., *n
a a dilambangkan dengan
* *1 *
ˆ ( | ,..., )n [0,1]
Q b aℜ a α ∈ , dengan α∈[0,1]
dan b a*, *1,...,a*n adalah himpunan fuzzy pada
1
, ,..., n.
B A A t melambangkan tuple pada relasi
ℜ, dan R( , )− − adalah FCPR. Jika ada m tuple, maka untuk tr
(
ar1, ...,arn,br)
∈ ℜ:min ( *1, 1),..., ( * , ), ( *, ) 1 1 , min ( *1, 1),..., ( * , ) 1 1 m R a a R a a R b b A r A n rn B r r n m R a a R a a A r A n rn r n σ ⎛ ⎞ ∑ = ⎜ ⎟ ⎝ ⎠ = ⎛ ⎞ ∑ = ⎜ ⎟ ⎝ ⎠ (25) Untuk
σ α
< , maka Qˆ ( |b* a* 1, ...,a*n) 0 , α ℜ = (26) Untukσ α
≥
, maka Qˆ ( |b* a* 1, ...,a*n) . α σ ℜ = (27)Definisi 22 Relasi Fuzzy Query
Misalkan D adalah himpunan semesta dari domain. R A A( ,1 2,...,An→B)α adalah
definisi relasi fuzzy query untuk membuat query untuk B diberikan input
1, 2, ..., n
A A A dengan α ∈[0,1], dengan 1, ,..., ,2 n
A A A B D∈ .
(Intan dan Mukaidono 2004)
Definisi 23 Peluang Query untuk Input Bebas Misalkan { ,A A1 2,...,An} adalah himpunan
input domain, B adalah himpunan output domain dari data query, D adalah himpunan semesta dari domain (A1, ...,An, B∈D ), dan
ℜ adalah relasi pada R(D). Peluang query untuk b* diberikan input yang bebas
*1,..., *n a a dilambangkan dengan * *1 * ˆ ( | ,..., )n [0,1] Q b a a α ℜ ∈ , dengan α∈[0,1]
dan b a*, *1,...,a*n adalah himpunan fuzzy pada
1
, ,..., n.
B A A t melambangkan tuple pada relasi
ℜ, dan R( , )− − adalah FCPR. Jika ada m tuple, maka untuk t ar
(
r1, ...,arn,br)
∈ ℜ,max min ( *1, 1), ( ,* ) ,...,min (* , ), ( ,* )
1 1 , max ( *1, 1),..., (* , ) 1 1 m R a a R b b R a a R b b A r B r A n rn B r r n m R a a R a a A r A n rn r n λ ⎛ ⎛ ⎞ ⎛ ⎞⎞ ∑ = ⎜ ⎜ ⎟ ⎜ ⎟⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ = ⎛⎛ ⎞⎞ ∑ = ⎜⎜ ⎟⎟ ⎝ ⎠ ⎝ ⎠ (28) Untuk λ α< , maka Qˆ ( |ℜ b* a* 1, ...,a*n)α = 0 , (29) Untuk
λ α
≥
, makaQˆ ( |b* a* 1, ...,a*n) . α λ ℜ = (30)(Intan dan Mukaidono 2004)
2.6 Fungsi Keanggotaan Pada Toolbox MATLAB
Fungsi keanggotaan fuzzy biasanya digambarkan dalam bentuk kurva yang menunjukkan titik-titik input data ke dalam nilai keanggotaannya yang memiliki interval antara 0 sampai 1.
Software MATLAB 7.0.1 menyediakan beberapa tipe fungsi keanggotaan yang dapat digunakan. Tipe-tipe tersebut antara lain : a. Trimf
Fungsi ini berguna untuk membuat fungsi keanggotaan dengan kurva segitiga Fungsi keangotaannya : 0, , f ( ; , , ) , 0, x a x a a x b b a x a b c c x b x c c b c x < ⎧ ⎪ − ⎪ ≤ ≤ ⎪ − = ⎨ − ⎪ ≤ ≤ ⎪ − ⎪ ≤ ⎩
Gambar 1 Kurva Segitiga b. Trapmf
Fungsi ini berguna untuk membuat fungsi keanggotaan dengan kurva trapesium. Fungsi keanggotaannya : 0 , , ( ; , , , ) 1, , 0 , x a x a a x b b a f x a b c d b x c d x c x d d c d x ≤ ⎧ ⎪ − ⎪ ≤ ≤ − ⎪ ⎪ =⎨ ≤ ≤ ⎪ − ⎪ ≤ ≤ − ⎪ ⎪ ≤ ⎩ 0 1 a b µ[x] c x
Gambar 2 Kurva Trapesium (Kusumadewi 2002)
III METODOLOGI PENELITIAN
Dalam melakukan penelitian ini, langkah-langkah yang ditempuh adalah sebagai berikut :
Penggalian Informasi atau Studi Pustaka Pengumpulan bahan pustaka yang berkaitan dengan himpunan crisp, himpunan fuzzy, relasi peluang bersyarat fuzzy, fungsi ketergantungan fuzzy (FFD), fuzzy integrity constraints (FIC), knowledge discovery and data mining (KDD), dan data query.
Pengumpulan Data
Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari rujukan utama jurnal Fuzzy Conditional Probability Relations and their Applications in Fuzzy Information Systems (Intan dan Mukaidono 2004).
Rekonstruksi FCPR dari Dua Himpunan
Fuzzy
Pada sistem informasi fuzzy yang diberikan, akan ditentukan himpunan fuzzy dan fungsi keanggotaan kemudian akan ditentukan derajat dari relasi kemiripan antara dua himpunan fuzzy tersebut. Selain itu, akan dibuat grafik fungsi keanggotaan dari himpunan fuzzy dengan menggunakan software MATLAB 7.0.1.
Rekonstruksi Konsep α‐Objek Redundan berdasarkan FCPR
Pada sistem informasi fuzzy yang diberikan, akan dibuktikan bahwa salah satu
objek mengandung α-objek redundan. Konsep α-objek redundan ditentukan dalam kaitannya dengan sistem informasi fuzzy dengan memanfaatkan derajat dari dasar kemiripan FCPR.
Rekonstruksi Ketergantungan Atribut berdasarkan FCPR
Pada sistem informasi fuzzy yang diberikan, akan ditentukan ketergantungan dari dua atribut menggunakan definisi ketergantungan fungsi fuzzy (FFD).
Rekonstruksi Pendekatan Data Reduksi dengan Operator Proyeksi.
Untuk menghasilkan relasi di antara himpunan fuzzy, akan dibentuk tabel keputusan dengan pendekatan data reduksi dengan operator proyeksi dari sistem informasi fuzzy yang diberikan. Pertama, akan dibuat fuzzy partition yang menghasilkan anak himpunan fuzzy. Kemudian, akan ditentukan ketergantungan atribut dari dua anak himpunan fuzzy. Selanjutnya akan ditetapkan α(Con,Dec) ≥
0.2 untuk mendapatkan relasi dari dua anak himpunan fuzzy tersebut. Terakhir, akan didapatkan dua tabel keputusan.
Rekonstruksi Pendekatan Data Query Pendekatan data query berdasarkan pada dua kerangka, yaitu input yang bergantung dan input yang bebas. Relasi fuzzy query mengenalkan hasil dari proses pendekatan data query. 0 1 a b µ[x] c d x