• Tidak ada hasil yang ditemukan

Sistem Preservasi

Presevasi bahan pustaka merupakan kegiatan pelestarian yang mencakup pada semua aspek usaha melestarikan semua bahan pustaka dan arsip, termasuk di dalamnya kebijakan pengolahan, sumber daya manusia, metode dan teknik penyimpanannya agar semua koleksi yang terdapat pada perpustakaan tersebut dapat dilestarikan dengan baik. Pada hakekatnya preservasi mencakup berbagai aspek, yaitu merupakan kegiatan melestarikan bahan pustaka atau arsip, termasuk di dalamnya yaitu kebijakan antara lain dalam kebijakaan pengelolaan, keuangan, sumber daya manusia, metode serta teknik penyimpanan (Basuki 1993). Sesuai dengan pendapat Dureau dan Clement (1986) bahwa preservasi mempunyai arti yang lebih luas, yaitu mencakup unsur-unsur pengelolaan, keuangan, cara penyimpanan, tenaga, teknik dan metoda untuk melestarikan informasi dan bentuk fisik bahan pustaka.

Sejarah Website

(WWW/W3) adalah istilah yang dikenal dengan website, sebuah kata yang tidak asing lagi di dunia teknologi. Awal sejarah web bermula di kota bernama Geneva dekat perbatasan Perancis dan Swiss, dengan pembentukan suatu organisasi yang didirikan oleh 18 negara di Eropa yang dikenal European Laboratory for Particle Physics (CERN). Pada tahun 1989 yang dipelopori oleh Sir Tim Berners-Lee dan peneliti lainnya dari CERN mengusulkan membuat sistem prototipe bernama Enquire, yang merupakan ide dasar untuk menciptakan WWW yang dikembangkan di John Poole's Image Computer Systems Ltd., merupakan web server pertama yang bernama httpd. Berlanjut di tahun 1994, Berners-Lee mendirikan World Wide Web Consortium (W3C) di Massachusetts Institute of Technology yang merupakan komunitas internasional yang bekerjasama untuk mengembangkan standar untuk teknologi web.

Interconnected network yang biasanya sering disebut dengan Internet adalah sebuah sistem komunikasi yang global menghubungkan jaringan komputer di seluruh dunia tanpa mengenal batas teritorial, hukum dan budaya. Jaringan dalam setiap komputer harus dapat berkomunikasi melalui sebuah bahasa standar (protokol), yaitu seperangkat aturan atau kesepakatan cara berkomunikasi lewat Internet berupa Transmission Control Protocol/Internet Protocol (TCP/IP).

Salah satu tanda perkembangan teknologi Internet yang begitu pesat dengan bertambahnya alamat web setiap waktu, sehingga Internet menjadi sumber daya muktahir yang dilengkapi aplikasi lainnya seperti Email, Chat, Intranet dan sebagainya. Web sebagai jaringan komunikasi-informasi yang menyatukan dan mengkonversikan beberapa media teks, gambar, suara, animasi dan telekomunikasi. Website dalam jaringan Internet mendeskripsikan stuktuktur data yang sangat sempurna, bila dibanding penggunaan sistem operasi Disk Operating System (DOS) dengan susunan data yang masih logic berbentuk pohon, web jauh lebih fleksibel dalam pengelolaan file yang diakses.

5 Website di Indonesia

Pertumbuhan jaringan Internet di Indonesia menunjukkan kecenderungan yang sangat positif, potensi pengguna berkembang sedemikian pesat menunjukkan peningkatan jumlah jaringan Internet yang bertambah setiap tahun. Data yang dikeluarkan oleh Pengelola Nama Domain Internet Indonesia (PANDI) merupakan organisasi nirlaba yang dibentuk oleh komunitas Internet Indonesia bersama pemerintah pada 29 Desember 2006 untuk menjadi registri domain .id. Saat ini PANDI mengelola secara penuh domain co.id, biz.id, my.id, web.id, or.id, sch.id, ac.id, dan net.id, serta membantu pemerintah Republik Indonesia mengelola domain go.id dan mil.id.

Tabel 1 Daftar nama domain tahun 2014 (sumber: PANDI 2014)

Untuk mengetahui dengan pasti jumlah website yang berada di Indonesia hingga kini masih sulit, namun dari data yang diperoleh dari Indonesia Network Information Center (ID-NIC) sebagai institusi yang menangani pendaftaran dan pengelolaan domain TLD-ID Country (Top Level Domain yang menandakan negara Indonesia) memberikan arahan tersedianya pengelolaan informasi jaringan nasional yang mandiri dan berkelanjutan.

Gambar 1 Persentase penggunaan layanan alokasi IP Adress (sumber: Riyadi 2013)

6

Definisi Arsip Web dan Ruang Lingkup

Internet telah memungkinkan setiap orang untuk berbagi pengetahuan, kreativitas, inovasi, dan koneksi. Sistem pelayanan informasi pada jaringan Internet yang dapat diakses melalui website seperti publikasi ilmiah, berita politik, karya seni, dokumen pemerintah, korespondensi serta beragam koleksi lain dapat didokumentasikan dan dilestarikan sebagai koleksi kontemporer.

Website atau Web merupakan repositori hypertext terbesar dan sudah banyak dikenal. Web terdiri dari miliaran dokumen yang didistribusikan jutaan komputer selama terhubung dengan perangkat komunikasi baik dengan saluran telepon, serat optik, Wireless Fidelty (WiFi), maupun General Pocket Radio Service (GPRS). Web telah menjadi gudang pengetahuan yang luas, dibangun dalam desentralisasi dengan cara kolaboratif. Web hidup, tumbuh, populer dan menjadi media partisipasi ekspresi tanpa pusat redaktur.

Dalam sejarah perjalanan arsip web dimulai pada tahun 1996, Brewster Kahle mendirikan Internet archive dengan misi menciptakan perpustakaan digital secara universal yang dapat diakses. Internet archive adalah suatu organisasi baru yang mengumpulkan bahan-bahan umum di Internet untuk membangun sebuah perpustakaan digital (Kahle 1997). Sebagai situs yang bekerja untuk melindungi hilangnya web yang memiliki nilai sejarah karena bersifat non permanen, pada tahun yang sama Perpustakaan Nasional Australia meresmikan program pengarsipan web yang pertama guna menangkap domain sejarah dan budaya nasional Australia. Kemudian pada tahun 2000, Perpustakaan Kongres memulai dengan proyek Minerva sekarang menjadi The Library of Congress Web Archives (LCWA), upaya pengarsipan web untuk menciptakan bahan koleksi topikal yang relevan dengan sejarah dan budaya Amerika. Diikuti oleh perpustakaan nasional yang lain, seperti British Library dengan UK Web Archive pada tahun 2005, Perpustakaan Nasional Perancis pada tahun 2006 dengan memperkenalkan BnF web archive, dan menyusul Perpustakaan Nasional RI pada tahun 2009 dengan sistem yang bernama Arsip Web. Proyek pengarsipan web juga telah dilakukan oleh beberapa universitas dengan tujuan untuk melengkapi koleksi digital dan bahan penelitian. Universitas yang telah melakukan pengarsipan web di antaranya Stanford WebBase Archive (Stanford, CA), Socio-Sense System di Universitas Tokyo (Tokyo, Jepang), dan Infomall Web di Peking University (Beijing, China).

Pada bulan Juli 2003, sebuah organisasi pengarsipan web didirikan dengan nama International Internet Preservation Consortium (IIPC) dengan dedikasi untuk mengembangkan standar dan alat open source terbaik, termasuk memfasilitasi kerjasama internasional secara luas serta penggunaan arsip web untuk penelitian warisan budaya. Jumlah anggota IIPC meningkat secara signifikan sejak tahun 2003 dan tercatat sampai dengan tahun 2011, lebih dari 40 lembaga yang telah ikut berpartisipasi.

Pengertian

Terinspirasi dari pengertian website yang dikemukakan oleh Noruzi (2004) dari Hukum S.R. Ranganathan Versi Five Laws of Library pada Web yang mengatakan bahwa :

1. Web resources are for use.

2. Every user has his or her web resource. 3. Every web resource its user.

7 4. Save the time of the user.

5. The Web is a growing organism.

Hal ini menyiratkan bahwa web digunakan untuk belajar karena di dalamnya terdapat informasi yang dapat digunakan. Peran dari web adalah untuk melayani individu, masyarakat dan memaksimalkan manfaat komunikasi dalam proses sosial. Dalam sebuah situs resmi milik IIPC “Mengapa Web diarsip? Informasi yang diterbitkan pada WWW hari ini akan menjadi sumber daya utama untuk para peneliti mendatang”. Arsip web adalah proses mengumpulkan bagian dari WWW, pelestarian koleksi dalam format arsip dan melayankan arsip tersebut agar biasa diakses dan digunakan. Arsip web adalah sistem yang dirancang untuk mendukung alur kerja proses pengarsipan web secara selektif untuk melestarikan data dan dokumen.

Dikatakan oleh Masanes (2006) “saat ini arsip web menggunakan tiga pendekatan untuk mengatur dan menyimpan konten arsip web: sistem file lokal, arsip berbasis web dan arsip berbasis non-web. Semua tiga pendekatan menjaga intelektual isi dari halaman web, tetapi bervariasi dalam tingkat pelestarian konteks dan struktur”. Dalam buku tentang Web Archiving Bibliography menurut Ayala (2013) “pelestarian web adalah bagian dari pelestarian digital, yaitu proses mempertahankan sumber daya Internet dalam kondisi yang cocok untuk digunakan”. Jelas kiranya bahwa arsip web adalah suatu sistem jaringan pengarsipan yang merupakan tindakan menyimpan sumber informasi Internet untuk menjaga sejarah, informasi, hukum, dan merekam bukti.

Konsep Dasar

Pengarsipan web memerlukan beberapa proses teknis dan biasanya terjadi dalam urutan sebagai berikut:

1. Fase Seleksi (selection): Dalam fase ini, arsiparis web memilih sumber daya Internet untuk dilestarikan dengan melakukan browsing yaitu pencarian informasi dengan batasan sesuai subjek yang telah ditentukan. Perangkat yang digunakan dalam fase ini berupa peramban (web browser) yaitu aplikasi untuk membuka informasi yang ada di Internet seperti Microsoft Internet Explorer, Mozilla Firefox, Google Chrome, dan sebagainya.

2. Fase Akuisisi (acquisition) / Cuplik (capture) / Panen (harvest): Fase yang dikerjakan oleh sebuah mesin yang dikenal sebagai 'crawler' yang mempunyai fungsi utama yaitu mengumpulkan Uniform Resource Locator (URL) / link dengan cara memindai halaman hyperlink untuk dikumpulkan menjadi satu. Dengan prinsip dasar crawling yaitu: mengunjungi setiap sumber informasi untuk ditangkap, membuat salinan, dan menyimpannya dalam database. Dalam fase ini juga dilengkapi dengan perangkat lain di antaranya HERITRIX, Web Curator Tool dan Nutchwax.

3. Fase Akses (access) : Fase ini menyediakan akses dari konten yang diambil. Wayback machine memegang peranan penting sebagai perangkat untuk navigasi dan menampilkan kembali web yang telah diarsip.

Model Pendekatan

Di banyak negara, perpustakaan nasional telah mengambil peran utama dalam meneliti dan bereksperimen dengan proses pengarsipan web, yang didukung oleh mandat hukum deposit untuk mengumpulkan sumber informasi

8

elektronik. Selain itu, sejumlah kemitraan internasional juga telah berhasil dalam mengeksplorasi dan menguji teori dan praktek pengarsipan digital. Ada lima model pendekatan yang telah dikembangkan untuk koleksi konten yang dapat dikategorikan sebagai berikut (PADI 2014):

1. Global Domain

Pendekatan komprehensif yang melibatkan kumpulan web dari sumber informasi online, menggunakan sistem pemanen dengan secara otomatis mengambil seluruh materi web nasional, seperti yang dilakukan oleh Swedish kulturarw3 (Cultural Heritage Cubed) dan Finlandia dalam proyek EVA. 2. Selektif

Pendekatan selektif ditujukan untuk pengarsipan yang sudah didefinisikan dari bagian web yang merupakan sumber informasi, sesuai dengan kriteria yang ditetapkan. Seleksi didasarkan pada tema, subjek, dan kualitas sumber informasi dari suatu rangkaian web yang dianggap penting dan relevan. Model pemanenan selektif, awalnya diadopsi oleh Australia PANDORA arsip web, dengan memerlukan 'snapshot' dari koleksi web tertentu pada interval yang sudah dijadwalkan.

3. Tematik

Bentuk lain dari pengarsipan web dengan model pendekatan selektif yang melibatkan proses pengumpulan dan pelestarian konten web yang berkaitan dengan topik atau peristiwa tertentu. Perpustakaan Kongres dengan proyek Minerva telah menggunakan pendekatan ini untuk memilih publikasi elektronik yang akan diarsip.

4. Deposit

Di beberapa negara penerbit sumber informasi online memberikan hak akses secara sukarela sesuai dengan hukum deposit. Sebuah kesuksesan dari skema perjanjian dengan penerbit melalui hukum deposit yaitu pengarsipan jurnal dalam bentuk elektronik telah berjalan di negara Belanda, sementara di Swedia sumber informasi statis dan dinamis Internet merupakan persyaratan legislatif dari hukum deposit.

5. Gabungan

Semakin banyak program pengarsipan web yang menyimpulkan bahwa tidak ada satu model pengarsipan sepenuhnya memuaskan untuk melestarikan warisan nasional secara online. Sebaliknya, negara-negara seperti Perancis dan Denmark telah menemukan bahwa dengan menggunakan teknik kombinasi dari pendekatan komprehensif, selektif, dan tematik, cakupan bahan sumber informasi dapat dicapai secara optimum.

Dari kelima model pendekatan di atas, Perpustakaan Nasional RI menekankan kuat pemilihan model pengarsipan web sebagai berikut:

a. Domain spesifik, yaitu pengarsipan web berdasarkan pada alamatnya web yang berakhiran dengan ektensi “.id”;

b. Selektif, yaitu dengan mengumpulkan dan menyediakan akses jangka panjang ke beberapa publikasi dan web terpilih tentang subjek yang dianggap penting serta relevan bagi Indonesia;

c. Tematik, untuk menghimpun web sesuai topik atau tema tertentu, seperti pemilihan umum, objek wisata dan sebagainya;

9 d. Deposit, sesuai dengan UU No.4 Tahun 1990 tentang serah simpan karya cetak dan karya rekam maka menghimpun situs web berdasarkan legalitas formal.

Alur Kerja

Semakin banyak warisan dokumenter yang tersedia secara online, dengan sifat masif dan dinamis dari konten web merupakan tantangan untuk membangun alat pengelola web dalam proses pengarsipan. Sekaligus mendukung model alur kerja arsip web dari serangkaian tugas dan proses yang terdiri dari:

1. Mencari, mengidentifikasi, dan memilih web

2. Mendaftarkan dan merekam izin web yang akan diarsip 3. Mengatur sistem pengelola clawer

4. Melakukan panen

5. Pemeriksaan jaminan kualitas 6. Memulai proses pengarsipan, dan

7. Mengorganisir akses, tampilan, dan rute penemuan metadata untuk sumber informasi yang diarsipkan.

Web Curator Tool sebagai alat kurator yang dirancang untuk mengelola proses pengarsipan web selektif. Digunakan oleh banyak Perpustakaan Nasional dan lembaga dalam mengumpulkan konten web untuk melestarikan dokumen online yang mempunyai kemampuan adalah sebagai berikut:

Gambar 2 Bagan alur kerja alat kurator web (Web Curator Tool) (Sumber: Web Curator 2011)

10

a. Harvest Authorization, yang berfungsi untuk meminta izin melakukan web harvesting kepada pemilik web yang akan diarsipkan oleh Perpustakaan Nasional RI.

b. Selection, Scoping, and Scheduling, yang berfungsi untuk mengatur apa saja yang akan masuk dalam proses harversing, kapan proses harvesting dilakukan dan seberapa sering proses harvesting dijalankan.

c. Harvesting, yang berfungsi untuk mendownload materi web yang dipasang pada beberapa mesin.

d. Quality Review, yang berfungsi untuk memastikan bahwa proses harvesting berjalan sesuai dengan yang direncanakan dan fitur koreksi jika ada kesalahan pada proses harvesting.

e. Submitting, yang berfungsi menyimpan hasil proses harvesting kedalam sebuah arsip digital.

Standarisasi

Mengumpulkan dokumen online adalah proses otomatis yang dilakukan oleh perangkat lunak pemanen yaitu melakukan pengindeksan dan penyimpanan data dalam arsip sesuai dengan parameter. Saat ini, sebagian besar perangkat lunak yang digunakan adalah produk open source yang dikembangkan oleh IIPC secara lokal. File panen termasuk metadata yang relevan akan disimpan dalam format arsip standar yang didukung oleh konsorsium IIPC.

Metadata

Metadata dapat dikatakan sebagai data tentang data. Metadata adalah informasi terstruktur yang menggambarkan, menjelaskan, menempatkan atau mempermudah dalam proses pengambilan, penggunaan dan pengelolaan sumber informasi (NISO 2004). Metadata merupakan kunci untuk memastikan bahwa sumber informasi akan bertahan dan terus dapat diakses. Dalam lingkungan perpustakaan, metadata biasanya digunakan untuk deskripsi skema formal (bibliografi) sumber informasi yang diterapkan untuk semua jenis objek baik digital atau non-digital. Metadata menggambarkan isi, deskripsi fisik, lokasi, jenis, format file, dan bentuk informasi termasuk sejarah migrasi yang diperlukan untuk manajemen pengelolaan informasi digital. Terdapat tiga jenis metadata yaitu (NISO 2004) :

1. Metadata deskriptif

Data yang mengambarkan sumber informasi yang digunakan untuk tujuan penemuan dan identifikasi suatu objek yang mencangkup unsur-unsur seperti judul, abstrak, penulis dan kata kunci.

2. Metadata struktural

Data yang digunakan untuk menampilkan dan menavigasi sumber informasi seperti link (hubungan) antara daftar isi sumber informasi dengan halaman yang dipilih dalam suatu file digital.

3. Metadata administratif

Data yang menyediakan informasi untuk membantu mengelola sumber informasi, seperti tanggal pembuatan, jenis dokumen dan informasi teknis lainnya.

Sistem web crawler yang berkerja secara aktif sudah seharusnya menyimpan metadata diskriptif, struktural dan administratif tentang situs web

11 yang diarsipkan, seperti:

a. Informasi deskriptif (judul, URL, identifier, penerbit);

b. Status izin (apakah izin untuk arsip diberikan atau ditolak oleh sistem); c. Jenis sumber informasi;

d. Status (dipilih, ditolak, masih dipantau); e. Subyek (dipilih dari daftar kategori);

f. Nama koleksi (jika judul yang berkaitan dengan subjek);

g. Pembatasan Informasi (akses in-house hanya untuk jangka waktu tertentu). Sebagian besar kegiatan pengarsipan makro menggunakan salah satu rancangan dari dua format terkait untuk skala pengarsipan web yaitu: ARC dan WARC. Format file Archive (ARC) pertama kali dikembangkan oleh Brewster Kahle dan Mike Burner dari Internet Archive pada tahun 1996 untuk mengelola miliaran obyek dan digunakan saat ini oleh beberapa perpustakaan nasional. Motivasi untuk memperpanjang format ARC muncul dari diskusi dan pengalaman dari IIPC yang misinya adalah untuk memperoleh, menyimpan dan membuat akses pengetahuan dan informasi dari Internet untuk generasi mendatang. Standar Kelompok Kerja IIPC mengajukan ke ISO TC46/SC4/WG12 sebagai draft menyajikan format file Web ARChive (WARC). Draft diterima sebagai pos pekerjaan baru oleh ISO pada Mei 2005 dan diresmikan sebagai standar internasional pada bulan Mei 2009.

Terkait dengan sistem temu kembali dalam kategorisasi subjek pada pengarsipan web dapat dilihat dalam keterhubungan dengan Resource Description Framework (RDF) adalah suatu standar kerangka kerja untuk mewakili informasi di web guna memungkinkan interoperabilitas metadata. Dokumen ini mendefinisikan sintaks abstrak (model data) yang berfungsi untuk menghubungkan semua spesifikasi yang berbasis bahasa RDF. Kerangka kerja ini telah ditinjau dan menjadi rekomendasi dari W3C. Bentuk kerangka kerja yang mempresentasikan berbagai format sintaks dan memanfaatkan standar formal untuk deskripsi elemen metadata dapat digunakan Dublin Core Metadata Element Set versi 1.1 (DCMES) yang tujuan utamanya adalah membantu meningkatkan konsistensi metadata dan meningkatkan kejelasan, ruang lingkup internal dari elemen metadata dublin core (Beckett et al. 2002). Berikut unsur-unsur dari DCMES versi 1.1. yang terintergrasi dalam elemen metadata dublin core, dapat dilihat pada (lampiran 1).

International Organization for Standardization (ISO) 1. ISO 28500:2009

WARC merupakan format file yang menawarkan konvensi untuk menggabungkan beberapa catatan sumber informasi (data objek), masing-masing terdiri dari serangkaian header teks sederhana dan blok data acak ke dalam satu file yang panjang. Format WARC adalah perpanjangan dari Format file ARC yang secara tradisional telah digunakan untuk menyimpan web clawer sebagai urutan konten blok yang dipanen dari WWW. Secara umum, isi rekaman merupakan salah satu akibat langsung dari upaya pengambilan - halaman web, gambar online, informasi URL, hasil pencarian DNS hostname, yang menyediakan informasi tambahan tentang konten yang diarsipkan. Sudut pandangan pada level atas file WARC dapat dinyatakan dalam tata bahasa Backus Naur Form-augmented (BNF), menggunakan konstruksi yang didefinisikan dalam

12

bagian 2.1 dari HTTP/1.1 (Fielding et al. 1999)

Format WARC diharapkan menjadi penerapan standar untuk struktur, pengelolaan dan penyimpan miliaran sumber informasi yang dikumpulkan dari web dan sebagai pedoman untuk membangun aplikasi web crawler (seperti software open source Heritrix) untuk mengumpulkan, mengelola, mengakses, dan bertukar konten. ISO 28500:2009 menetapkan format file WARC :

a. Untuk menyimpan baik isi payload dan kontrol informasi dari aplikasi lapisan utama protokol Internet, seperti HTTP, Domain Name System (DNS), dan File Transfer Protocol (FTP);

b. untuk menyimpan metadata yang terkait dengan data yang tersimpan lainnya (misalnya klasifikasi subjek, bahasa, encoding);

c. untuk mendukung kompresi data dan menjaga integritas data rekam;

d. untuk menyimpan semua kontrol informasi dari protokol panen, bukan hanya respon informasi;

e. untuk menyimpan hasil transformasi data yang terkait dengan data yang tersimpan lain;

f. untuk menyimpan saat deteksi duplikat terkait dengan data yang lain yang tersimpan;

g. untuk diperpanjang tanpa gangguan terhadap fungsi yang ada;

h. untuk mendukung penanganan catatan terlalu panjang dengan pemotongan atau segmentasi, mana yang diinginkan.

2. ISO TR 14873: 2013

Standar untuk statistik informasi dan masalah kualitas dokumentasi untuk pengarsipan web. Standar yang mendefinisikan statistik, syarat dan kriteria kualitas untuk pengarsipan web dengan mempertimbangkan kebutuhan dan praktek di berbagai organisasi seperti perpustakaan, arsip, museum, pusat penelitian dan yayasan pelestarian. ISO TR 14873: 2013 ditujukan untuk para profesional yang terlibat langsung dalam pengarsipan web. Hal ini juga berguna bagi otoritas pendanaan lembaga pengarsipan web dan pemangku kepentingan eksternal yang berfokus pada dasar prinsip-prinsip dan metode pengarsipan web yang digunakan dalam upaya untuk mencerminkan berbagai kepentingan dan keahlian pengguna dalam keseimbangan antara ilmu komputer, manajemen dan kepustakawanan.

Gambar 3 Model alur penyimpanan file WARC oleh crawler (Sumber: Masanés 2006)

13 Infrastruktur

Dalam pengelolaan sumber informasi, yang termasuk penilaian dalam rantai pengarsipan web menurut IIPC di antaranya akuisisi, seleksi dan verifikasi, penyimpanan koleksi dan pemeliharaan, akses dan alat temu kembali. Dalam sebuah sistem arsip web terdapat 5 komponen utama dimana masing-masing komponen mempunyai fungsi terkait alur kerja yang terintegrasi dari arsip web, di antaranya sebagai berikut (Santoso 2010):

1. Indexer. Berfungsi melakukan pengindeksan web yang dipilih untuk diarsip oleh Perpustakaan Nasional RI.

2. Clawler. Berfungsi melakukan penelusuran terhadap web yang ada dalam indexer, seolah-olah sebagai user yang sedang menelusuri web-web tersebut. 3. Ingest. Berfungsi melakukan penjadwalan dari web yang akan diarsip.

4. Storage. Berfungsi sebagai penyimpanan hasil crawling, termasuk pengklasifikasian berdasarkan topik web.

5. Web Archive. Berfungsi sebagai arsip yang bisa diakses oleh user, sesuai dengan aturan-aturan yang telah ditetapkan dalam content management.

Sistem pengarsipan web yang berjalan hingga saat ini dengan memanfaatkan sistem yang telah dikembangkan oleh praktisi-praktisi internasional. Sistem ini dirancang untuk mendukung alur kerja pengarsipan web yang meliputi:

a. Web Curator Tool sebagai alat kurator yang dirancang untuk mengelola proses pengarsipan web.

b. HERITRIX sebagai perangkat untuk melakukan unduh bahan web. c. Nutchwax sebagai perangkat untuk pengindeksan.

d. Wayback Mechine sebagai alat untuk menavigasi terhadap web yang telah diarsip dan sebagai sarana menampilkan kembali web yang telah diharvest.

Perkembangan Arsip Web di Indonesia

Web adalah halaman informasi di Internet. Dengan sifat dinamis dan masif dari web, hal ini menciptakan tantangan baru bagi lembaga institusi untuk dapat menyimpan, mengatur, mengakses dan menyebarkan informasi yang tersedia di web. Dalam rangka melestarikan warisan budaya, menjaga kontinuitas akses konten yang telah hilang dari web dan memastikan konten web ini bertahan untuk generasi mendatang maka telah banyak perpustakaan melakukan pengarsipan web

Dokumen terkait