• Tidak ada hasil yang ditemukan

43600 UKM BANGI, Selangor Malaysia

2

Fakulti Sains Dan Teknologi

Universiti Kebangsaan Malaysia

43600 UKM BANGI, Selangor Malaysia

Abstrak

Untuk memenuhi keperluan penyedia maklumat, konsep objek digital (DO) menyediakan satu penyelesaian untuk menguruskan kompleksiti kepelbagaian jenis bahan dalam perpustakaan digital. Namun demikian, banyak kerja terdahulu mempunyai kelemahan sebagai berikut: sistem perpustakaan digital tidak mempunyai sistem pengecaman pengetahuan yang mencukupi yang boleh dicapai berikutan kekurangan perwakilan komponen DO; sebahagian pengetahuan diasing dan diabaikan yang pada hakikatnya boleh dihasilkan daripada dokumen perpustakaan digital; pelaksanaan DO yang lazim hanya menyediakan perwakilan statik dengan menakrifkan komponennya sebagai dataset. Dalam kertas ini, konsep DO dikembangkan menjadi kontena teknikal untuk kepelbagaian pengetahuan yang boleh dirujuk sebagai objek digital informatif (iDO). Konsep iDO ini akan memudahkan mekanisma pengorganisasian dan perwakilan tradisonal pengarkiban sistem maklumat kepada pangkalan pengetahuan. Dengan itu, pertanyaan berkaitan dengan pengetahuan iDO boleh dibuat secara lebih dinamik dan pintar. iDO juga boleh digabungkan dalam repositori utama Sistem Pengarkiban Pengetahuan Biodiversiti (BioKAS) untuk memudahkan manipulasi maklumat dan pengetahuan objek digital.

1. Pendahuluan

Pada hari ini, maklumat boleh wujud dalam pelbagai bentuk dan yang paling terkini adalah perwakilan digital. Untuk memenuhi keperluan masa kini, kewujudan perwakilan digital menjadi usaha menubuhkan perpustakaan digital sebagai satu halatuju yang kita telah nantikan begitu lama. Untuk memudahkan pengurusan perpustakaan digital, konsep objek digital telah diperkenalkan sebagai kaedah perwakilan maklumat yang mampu mengurangkan kompleksiti pengurusan. Namun demikian, banyak kerja terdahulu mempunyai kelemahan sebagai berikut: sistem perpustakaan digital tidak mempunyai sistem pengecaman pengetahuan yang mencukupi yang boleh dicapai berikutan kekurangan

perwakilan komponen DO; sebahagian pengetahuan diasing dan diabaikan yang pada hakikatnya boleh dihasilkan daripada dokumen perpustakaan digital; pelaksanaan DO yang lazim hanya menyediakan perwakilan statik dengan menakrifkan komponennya sebagai dataset. Sistem maklumat hari ini harus menunjukkan maklumat sebagai gabungan imej, teks, video, suara dan berbagai bentuk jenis data bermultimedia yang lain. Perolehan maklumat ini dengan kaedah dan perwakilan yang berbagai boleh didapati daripada berbagai sumber yang boleh menjadi satu kantung pengetahuan yang mampu berkembang.

Kaedah perwakilan pengetahuan menggunakan Objek Digital (DO) telah digunakan dalam

Departem en t of Chem istry ITB, J l. Gan esha 10 , Ban dun g 40 132, Phon e : +62 (22) 250 210 3 ext 10 1, Fax : +62 (22) 250 4154, H om epage : http:/ / www.chem .itb.ac.id/ jschem , E-m ail : jschem@chem .itb.ac.id

th

berbagai projek seperti Kahn & Wilensky dan Warwick Framework (Lagoze et al., 1996; Daniel and Lagoze, 1997; Daniel et.al.). Model yang lebih terperinci seperti model FEDORA (Daniel et al. ; Payette and Lagoze, 1998), model CNRI (Bianchi dan J. Petrone, 2001) dan model DUSHAY [8] menjadi asas kepada pembentukkan perpustakaan digital. Pada asasnya konsep DO mewakili entity logical yang komponen utamanya adalah berbentuk digital dan menjadi kandungan kepada perwakilan perpustakaan digital.

Namun demikian, dengan DO sebagai satu konsep baru yang masih terbuka dari segi pelaksanaannya, penjenisan kandungan yang diwakilkannya menyebabkan penggabungan maklumat masih sukar sukar untuk disusun dan diwakilkan untuk menjadikannya sebagi satu petunjuk pengetahuan yang bermakna dan berguna. Oleh yang demikian, kertas ini cuba membincangkan pengembangan konsep DO menjadi lebih dinamik. Konsep objek digital informative (iDO)diperkenalkan dengan kantung pengetahuan yang lebih jelas semantiknya untuk sesuatu perwakilan DO. Secara khususnya iDO ini difokuskan kepada biodiversiti flora dan fauna yang mempunyai potensi untuk diwakilkan pengetahuannya secara lebih berkesan. Konsep iDO ini akan memudahkan mekanisma pengorganisasian dan perwakilan tradisonal pengarkiban sistem maklumat kepada pangkalan pengetahuan. Dengan itu, pertanyaan berkaitan dengan pengetahuan iDO boleh dibuat secara lebih dinamik dan pintar. iDO juga boleh digabungkan dalam repositori utama Sistem Pengarkiban Pengetahuan Biodiversiti (BioKAS) untuk memudahkan manipulasi maklumat dan pengetahuan objek digital. Seksyen berikut akan membincangkan rangkakerja DO dan diikuti dengan perbincangan berkaitan dengan model DO. Selepas itu satu cadangan rangkakerja objek digital informatif akan dibincangkan dengan terperinci.

2. Rangkakerja Objek Digital

Pendekatan objek digital merupakan kaedah yang selesa untuk menggambarkan item maklumat. DO menyediakan perantaraan untuk menyusun dan mengenalpasti kandunagn atau maklumat bagi penyimpanan, capaian dan penagihan. Dalam skop yang dibincangkan di sini, terdapat dua rangkakerja yang dikira

menjadi asas kepada pembentukkan model Do yang lebih maju, iaitu rangkakerja Kahn & Wilensky dan Warwick. Kedua-dua rangkakerja ini menjadi asas kepada pembentukan pakej bebas-kandungan (Kahn and Wilensky, 1995) atau sebagai kantung pakej metadata (Lagoze et al., 1996). Kedua- dua rangkakerja ini dibina dengan matlamat untuk mewakilkan data dan metadata dalam objek perpustakaan digital di persekitaran terangkai.

Rangkakerja Kahn & Wilensky boleh dianggap sebagai asas kepada pembentukan konsep DO. Ia menakrifkan entiti asas suatu infrastruktur yang menyokong kelas maklumat digital teragih seperti perpustakaan digital. Rangkakerja ini secara tak rasmi menakrifkan DO sebagai “struktur data dengan komponen utamanya adalah bahan digital atau data termasuk suatu pencam yang unik yang dipanggil pengendali. Seterusnya penakrifan yang lebih formal dibuat dengan DO sebagai suatu kewujudan jenis data abstrak yang mempunyai dua komponen iaitu data dan metadata-kunci. Berasaskan data dan metadata- kunci, penakrifan DO boleh dikembangkan untuk menjadikan pengedalian repositori dalam pelbagai bidang aplikasi lebih mudah.

Rangkakerja Warwick pula dibina sebagai cara untuk untuk menguruskan pakej metadata ke dalam kantung dengan menyediakan hubungan eksplisit antara pakej-pakej dalam kantung dengan menakrifkan abstraksi baru yang dipanggil Katalog Rangkakerja Warwick (WFC). WFC menyediakan senarai pakej individu dan hubungan antara mereka. WF menakrifkan DO sebagai kantung yang mempunyai tiga pakej metadata yang berbeza iaitu Mudah: pakej set metadata yang mengandungi metadata sebenar; Pakej Tak Langsung: pakej yang tak perlu dimasukkan dalam kantung (ianya boleh dicapai menggunakan rujukan seperti URL); Pakej Kantung: kantung itu sendiri. Kantung boleh wujud dalam dua bentuk sama ada “transient” atau “persistent”. Dalam “transient”, kantung wujud sebagai objek pengangkutan antara repositori, pelanggan dan agen. Dalam “persistent”, ianya wujud sebagai objek kelas- pertama dalam infrstruktur maklumat yang boleh dinamakan dan distor dalam satu atau lebih pelayan, direplikasikan, dan dicapai

Ashraf Jaradat, Aziz Deraman, Sufian Idris, Laily Din & Nizam Said

Proceeding of The 6th ITB-UKM Joint Seminar on Chemistry

160

daraipada pelayan-pelayan ini menggunakan pencam capaian global (URI).

Bagaimanapun, WF dan katalog hanya menyediakan model yang berhubungan dengan metadata sahaja. Oleh itu rangkakerja Hubungan Aktif Teragih (DAR) telah dibangunkan yang mengembangkan WF dengan mengitlakkan rangkakerja yang membenarkan kantung mememgang atau merujuk semua sumber dan bukan sahaja metadata. Tahap perbezaan hubungan antara data dan metadata tidak penting bagi DAR, namun terdapat kepelbagaian perbezaan antara sumber data yang perlu dipertimbangkan (Daniel and Lagoze, 1997). Kaedah URL (Uniform Resource Locator) atau URN (Uniform Resource Names) boleh menjadi contoh penggunaan hubungan dalam WFC. Penamaan hubungan antara dataset dan menggunakan pencam seperti demikian amat memudahkan penjanaan pencam unik untuk hubungan seperti ini. Pengitlakkan ini menyediakan satu model yang baik untuk mewakili data dan metadata dalam perpustakaan objek digital denagn persekitaran terangkai. Sumber boleh dikaitkan tanpa menghiraukan di mana lokasinya, dan hubungan antara sumber-sumber ini boleh diperolehi dan dilaksanakan di mana-mana sahaja dalam rangkaian. Tahap perkaitan seperti ini membolehkan data berada dalam satu repositori dengan pemerihalannya berada dalam repositori yang lain.

3. Model Objek Digital

Kajian dan penggunaan DO masih baru dan memerlukan lebih banyak penyelidikan dibuat dalam bidang aplikasi ayang berbeza. Penyelidikan oleh Kahn & Wilensky membolehkan pemhaman rangkakerja yang lebih baik untuk dikaitkan dengan pemodelan DO. Namun demikian, rangkakerja ini hanya membolehkan pemahaman konsep dibuat tanpa dijelaskan keupayaan sebenar pelaksanaan DO dalam bidang aplikasi yang dipilih. Oleh itu, berikut ini dibincangkan tiga model DO yang lebih terperinci iaitu FEDORA, CNRI dan Dushay.

FEDORA (Flexible and Extensible Digital Object and Repository Architecture) adalah model DO yang merupakan senibina DO dan repositori terbuka yang dibina untuk menyediakan kaedah terbaik untuk menimpan, mencapaian dan mengagihkan kandungan

digital (Payette and Lagoze, 1998; Payette et al., 2002). FEDORA menggunakan konsep rangkakerja Warwick yang telah dikembangkan dengan memenuhi keperluan rangkakerja Kahn & Wilensky berkaitan dengan syarat kebenaran, DO sebagai bebas-kandungan, dan pengagihan. Dengan membina di atas rangkakerja Warwick, ia membenarkan aggregasi kandungan tempatan dan teragih. Dengan pembangunan menggunakan abstraksi DAR, FEDORA membenarkan pengagihan daripada aggregasi kandungan (Daniel et al. ). Senibina FEDORA adalah struktur perkhidmatan multi-lapis yang termasuk perkhidmatan:

repositori yang menyediakan mekanisma untuk menginput, menyimpan dan mencapai objek digital;

indeks yang menyediakan mekanisma bagi penemuan objek digital;

pungutan yang menyediakan kaedah aggregasi objek digital dan perkhidmatan untuk menjadi koleksi yang bermakna;

penamaan yang mendaftar dan mendapatkan nama yang unik secara global untuk objek digital;

antaramuka pengguna yang menyediakan pintu laluan untuk mendapatkan perkhidmatan lain.

DO mempunyai pencam kekal unik (PID), satu atau lebih penyebar, satu atau lebih “datastream” dan metadata sistem. Salah satu cirri penting DO FEDORA adalah kepupayaannya mengaggregasikan kedua-dua kandungan (data dan metadata) dan kelakuan. (perkhidmatan). Kedua-dua unsur ini boleh diagihkan dan dirujuk melalui URI (Payette and Staples, 2002) yang distorkan dalam repositori.

Senibina CNRI pula memudahkan pengurusan kandungan dan perkhidmatan perpustakaan digital dalam konteks persekitaran teragih melaui pengunaan mekanisma penjenisan objek digital teragih. CNRI membenarkan DO dianggap sebagai “gist key” yang diperihalkan melalui penggu aan penjenisan abstrak “jenis kandungan” dengan matlamat pencipta DO memperihalkan objek dengan menakrifkan set pandangan yang boleh diperolehi daripadanya (Bianchi dan Petrone, 2001). CNRI juga

th

memperkenalkan set perkhidmatan teras untuk pengenalan, capaian dan pengurusan DO yang mewakili fungsian minimum yang perlu untuk interoperabiliti. Repositori DO pula bertindak sebagai antaramuka luaran untuk penciptaan, modfikasi, penyimpanan dan capaian DO. Senibina boleh mempunyai bilangan repositori yang tidak terhad yang boleh dicapai oleh DO masing-masing dengan menggunakan RAP (Repositories Access Protocol).

Model Dushay memperkenalkan mekanisma “Broker Context” (CB) yang membenarkan pemisahan mekanisma kelakuan daripada kandungan digital yang mampu mengekang mekanisma kelakuan berlebihan kepada DO dengan format kandungan yang bersesuaian secara dinamik dan tempatan. Dushay juga mengatakan yang metadata struktural memainkan peranan utama untuk memisahkan kandungan digital daripada “pengalaman” kandungan berkenaan. Petaan hubungan antara komnen dalam DO dibuat dengan mengumpukkan label atau secara hirarki atau kedua-duanya.

CB bertindak sebagai komponen utama senibina Ia menguruskan interaksi mekanisma kelakuan dengan kandungan objek dengan mendapatkan metadata structural tentang kandungan berkenaan dan memadankan metadata struktural berkenaan kepada mekanisma kelakuan yang bersesuaian yang menghasilkan “pengalaman” kandungan. Di sini, senibina Dushay memisahkan penyimpanan DO, mekanisma kelakuan dan persembahan kandungan digital. Senibina Dushay mewakilkan DO dalam format XML. Kandungan DO pula sepadan dengan data XML dan mekanisma kelakuan pula beranalogi dengan gaya helaian XSLT untuk memastikan fleksibiliti, interpoerabiliti dan pelbagai pilihan persembahan. Perincian persembahan DO Dushay boleh dilihat dalam (Dushay, 2002). Kebanyakan definisi mempersembahkan DO sebagai data dan metadata. Namun demikian keperluan dalam pemodelan pengetahuan untuk flora dan fauna umpamanya jauh lebih kompleks yang perlu menyokong dua keperluan. Ianya mesti menyediakan kaedah untuk mengumpulkan DO dan mesti ada kaedah capaiannya. Oleh itu, boleh dikatakan definisi konsep DO semasa mempunyai beberapa kekurangan sebagai berikut:

Rangkakerja terdahulu tidak menyediakan peluang untuk menjelaskan DO dalam bentuk yang lebih dinamik terutama berkaitan dengan hubungkait pengetahuan sesuatu DO

Kebanyakan DO hanya meliputi pelaksanaannya sebagai sistem maklumat tanpa meliputi penakrifan pengetahuan tentang DO yang lebih terkamir

Penakrifan DO sebagai dataset hanya menjadikannya lebih statik

Penakrifan data dan metadata masih terhad kepada pengumpulan data yang banyak dan sukar untuk memisahkannya kepada data, maklumat dan pengetahuan

Oleh yang demikian, satu penakrifan yang lebih jelas diperlukan supaya konsep DO boleh diperluaskan lagi. Kita tidak hanya tertarik kepada kepelbagaian bentuk dan jenis DO seperti teks, imej, suara, video dans ebagainya malah hendaknya memahamimnya dalam konteks pengetahuan yang ada bersamanya.

4. Pemodelan Objek Digital Informatif

Untuk memenuhi kekurangan dalam definisi Do sedia ada, dicadangkan supaya definisi DO dapat memenuhi keperluan DO masa kini. DO masa kini lebih berbentuk multimedia, dan setiapnya mempunyai banyak maklumat dan pengetahuan (sekeping gambar membawa seribu makna). Oleh demikian, definisi DO harus dikembangkan kepada Objek Digital Informatif atau iDO yang boleh dijelaskan sebagai:

Suatu kantung (objek kompleks) yang boleh dikenalpasti secara unik yang mengumpul dan mempersembahkan komponen multi-entiti yang berkaitan dalam bentuk atau aspek kandungan sebenar. iDO ini dalam wujud dalam bentuk campuran melalui perkaitan antaranya dengan penjelasan tentang had dan pengetahuan bagi objek dunia nyata.

Konsep iDO di atas memenuhi prinsip-prinsip berikut:

Kandungan DO dibahagikan kepada tiga paras iaitu data, maklumat dan pengetahuan. Ini memaksa perwakilan DO menjadi lebih informatif dan bertindak sebagai stor pengetahuan.

Ashraf Jaradat, Aziz Deraman, Sufian Idris, Laily Din & Nizam Said

Proceeding of The 6th ITB-UKM Joint Seminar on Chemistry

162

iDO terbentuk oleh kepelbagaian komponen yang direalisasikan oleh hubungan. Oleh itu penakrifan hubungan berasaskan kandungan sebenar komponen amat penting.

Komponen boleh dating dengan berbagai jenis data seperti teks, audio, imej dan sebagainya.

Kepelbagaian hubungan membolehkan pengetahuan sesuatu DO dibina dan diperbanyakkan dengan sistematik.

Oleh itu, boleh difahamkan yang kantung iDO adalah satu blok pengetahuan yang besar mengenai sesuatu objek melalui pembolehubah, peristiwa, lokasi, perkhidmatan atau unsur lain seperti yang ditunjukkan oleh Rajah 1.

Seperti yang dibincangkan, iDO mewakili objek dunia nyata sebagai campuran maklumat digital atau multimedia melalui kandungan kompnen masing-masing. Oleh yang demikian, komponen iDO boleh dibahagikan kepada tiga bahagian yang penting iaitu: