• Tidak ada hasil yang ditemukan

BAB I PENDAHULUAN 1.1 Latar Belakang

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB I PENDAHULUAN 1.1 Latar Belakang"

Copied!
11
0
0

Teks penuh

(1)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Teknologi Informasi dan Komunikasi (TIK) memiliki peran yang penting di dalam pemerintahan. Beberapa peran TIK adalah untuk meningkatkan efisiensi dan transparansi dalam penyelenggaraan pemerintahan [1]. Melalui pemanfaatan secara tepat, TIK dapat digunakan sebagai sarana untuk membangun infrastruktur E-Government yang lebih baik. Bentuk penyelenggaraan pemerintahan ada berbagai macam, salah satunya adalah pengelolaan administrasi pemerintahan dan pelayanan terhadap masyarakat (public services). Pemanfaatan website oleh pemerintah untuk memberikan berbagai layanan secara elektronis adalah salah satu bentuk pemanfaatan TIK dalam melayani masyarakat.

Sebagai salah satu instansi pemerintah, Monumen Pers Nasional yang berada di bawah Direktorat Jenderal Informasi dan Komunikasi Publik Kementerian Komunikasi dan Informatika Republik Indonesia memiliki tugas dan fungsi dalam menyelenggarakan kegiatan pemerintahan dan memberikan pelayanan publik kepada masyarakat seperti yang tertuang dalam Peraturan Menteri Komunikasi dan Informatika (Kominfo) Nomor 6 tahun 2011. Berdasarkan pasal 2 dan pasal 3 yang menerangkan bahwa Monumen Pers Nasional memiliki tugas untuk melakukan pelestarian dan pelayanan terhadap masyarakat mengenai produk pers nasional yang bernilai sejarah. Salah satu perwujudannya adalah dengan melakukan pelayanan informasi, penyiapan sarana penyebaran informasi, pemeliharaan, penatalaksanaan koleksi, pengawetan dan perlindungan terhadap benda-benda pers bersejarah [2].

Untuk mendukung salah satu tugasnya sebagai penyedia layanan informasi kepada masyarakat, Monumen Pers Nasional melakukan kegiatan penambahan koleksi media cetak pers dari seluruh nusantara secara rutin sepanjang tahun. Hasil penambahan koleksi tersebut disimpan, dikelola dan dibuka aksesnya untuk masyarakat yang memerlukan informasi. Kegiatan tersebut merupakan salah satu

(2)

2 bentuk diseminasi informasi kepada masyarakat [3].

Berdasarkan data resmi yang diperoleh dari Monumen Pers Nasional, jumlah koleksi data media cetak pers yang dimiliki saat ini mencapai 296 judul koran dan 335 judul majalah, baik dalam bentuk format digital maupun cetak yang terbit dari tahun sebelum kemerdekaan Indonesia hingga sekarang di tahun berjalan. Jumlah koleksi tersebut diperkirakan akan terus bertambah karena adanya kegiatan penambahan koleksi media cetak pers nasional yang rutin dilakukan setiap hari serta penambahan judul baru media cetak pers tiap tahun. Berdasarkan Undang-Undang Nomor 43 tahun 2009 tentang Kearsipan [4], koleksi media cetak pers yang dimiliki Monumen Pers Nasional harus dikelola dengan baik, karena setiap koleksi media cetak pers dapat dikategorikan sebagai arsip milik negara yang berisi berbagai rekaman dan informasi kegiatan atau suatu peristiwa sejarah.

Terdapat dua macam tata cara pengelolaan koleksi media cetak pers yang dilakukan di Monumen Pers Nasional berdasarkan format media cetak yang dikelola. Untuk media dengan format fisik disimpan dan ditata di dalam ruangan khusus. Sedangkan media cetak dengan format digital disimpan di dalam server penyimpanan. Media cetak berformat digital milik Monumen Pers Nasional saat ini terdiri dari 2 tipe data yaitu media cetak berformat citra (jpeg) dan media cetak berformat dokumen PDF (Portable Document Format). Format citra (jpeg) tersebut dihasilkan dari kegiatan digitalisasi sedangkan format dokumen (pdf) sisanya diperoleh dari berbagai sumber.

Kegiatan digitalisasi bertujuan untuk melakukan duplikasi sekaligus penyelamatan informasi yang terkandung di dalam media cetak fisik [5]. Hasil dari alih media tersebut diharapkan mampu memberikan fleksibilitas akses yang sebelumnya tidak dimiliki oleh format fisik. Keunggulan penggunaan format digital salah satunya adalah dapat digunakan oleh banyak pengguna sekaligus dalam satu waktu. Melalui perubahan pola akses informasi dari fisik ke digital, setidaknya dapat mengurangi kebutuhan akses langsung ke media cetak fisik yang lebih rapuh sehingga bentuk aslinya dapat terjaga.

(3)

3 Data alih media yang telah dibuat selanjutnya akan disimpan dan tidak akan diubah lagi. Data tersebut disediakan bagi pengguna yang membutuhkan informasi. Karakteristik perlakuan data dengan metode write once read many (WORM) merupakan perlakuan yang sering ditemui di dalam data warehouse [6]. Perlakuan semacam itu mirip dengan perlakuan pada data alih media yang dimiliki oleh Monumen Pers Nasional. Server media penyimpanan yang digunakan di Monumen Pers Nasional saat ini berada di dalam demilitarized zone (DMZ) yang terpisah baik secara logika atau fisik dengan komputer klien seperti yang ditunjukkan pada Gambar 1.1.

Gambar 1.1 Ilustrasi jaringan antara klien dan server media penyimpanan di Monumen Pers Nasional

DMZ menurut [7] adalah sebuah konsep desain jaringan yang memisahkan serta mengisolasi jaringan server dari jaringan lainnya terutama dengan jaringan klien. Hal ini bertujuan untuk meningkatkan keamanan serta untuk mengelola akses dari klien ke seluruh server yang berada di dalam DMZ. Topologi jaringan dan server di dalam DMZ ditunjukkan pada Gambar 1.2.

(4)

4 Gambar 1.2 Topologi jaringan DMZ server data media cetak di Monumen

Pers Nasional

Saat ini Monumen Pers Nasional memiliki 2 buah server penyimpanan (Server Data1 dan Server Data2) yang berada di dalam DMZ. Kedua server penyimpanan tersebut terhubung ke dalam satu server (Server Sentral) yang berfungsi sebagai pintu gerbang akses. Ketiga server tersebut (Server Sentral, Server Data1 dan Server Data2) akan digunakan sebagai infrastruktur awal untuk membangun data warehouse media cetak berformat digital. Topologi jaringan yang digunakan saat ini untuk menghubungkan ketiga server tersebut adalah topologi bintang. Topologi bintang tersebut dipilih karena akan memberi kemudahan dalam pengelolaannya, apabila terjadi kerusakan pada salah satu kabel atau komputer tidak akan mempengaruhi seluruh komunikasi di jaringan, tetapi topologi tipe ini memiliki satu kelemahan pada switch sentralnya [8].

Data media cetak pers nasional berformat digital yang disimpan di dalam server penyimpanan memang disediakan untuk publik. Sehingga banyak pengunjung Monumen Pers Nasional terutama mahasiswa dan peneliti yang memanfaatkan data tersebut untuk dianalisa sebagai bahan referensi. Saat ini Monumen Pers Nasional belum memiliki data warehouse media cetak pers nasional yang berfungsi untuk menyimpan dan memudahkan proses pencarian data sampai analisis data. Peneliti yang ingin melakukan pencarian data di Monumen Pers Nasional saat ini harus melakukan pencarian datanya secara satu

(5)

5 persatu di dalam server penyimpanan sehingga dirasa kurang efektif dan kurang efisien [9]. Berdasarkan keterbatasan tersebut, Monumen Pers Nasional kemudian berencana untuk mengembangkan infrastruktur yang telah digunakan sekarang sebagai data warehouse untuk menyimpan dan mengelola seluruh koleksi digital yang dimiliki.

Untuk mempermudah akses data antara pengguna dengan server media penyimpanan saat ini, server sentral difungsikan sebagai pintu gerbang yang menghubungkan seluruh server penyimpanan. Dengan begitu pengguna cukup mengakses data melalui server sentral yang didalamnya tersambung data dari seluruh server penyimpanan. Berdasarkan pemanfaatan dan fungsinya data warehouse tersebut diharapkan selalu tersedia 24 jam sehari, 7 hari seminggu serta memiliki tingkat ketersediaan yang tinggi (high availability).

Ketersediaan yang tinggi berarti memiliki fase down time minimal, dimana fase down time didefinisikan sebagai sebuah fase dimana sebuah layanan sistem atau data menjadi tidak bisa diakses [10]. Beberapa penyebabnya adalah terputusnya pasokan listrik, kegagalan sistem, hilangnya data, kerusakan data, penurunan performa jaringan, terputusnya komunikasi jaringan serta ketidakmampuan sistem dalam pemulihan ke kondisi normal. Berdasarkan survei yang telah dilakukan oleh perusahaan Computer Network Technology (CNT) dan Data Quest [10]. Penyebab sebuah sistem mengalami fase down time bisa dikarenakan berbagai macam hal seperti bencana alam, kegagalan fungsi dan komunikasi jaringan, kerusakan perangkat keras, kerusakan sistem operasi, kerusakan aplikasi, virus, kesalahan manusia, dan beberapa hal yang penyebabnya tidak diketahui.

Salah satu langkah yang telah ditempuh Monumen Pers Nasional untuk meminimalisir fase down time karena terputusnya sumber daya listrik adalah dengan memasang genset dan perangkat uninterruptible power supply (UPS). Untuk melindungi data yang disimpan di server dari ancaman kerusakan perangkat keras hard disk maka implementasi teknologi Redundant Array Independent Disk (RAID) telah dilakukan. Teknologi RAID selain RAID versi 0 menurut [11] memiliki mekanisme perlindungan data dengan melakukan replikasi

(6)

6 data di setiap anggota hard disk yang tergabung di dalamnya. Data yang disimpan menggunakan teknologi RAID akan dipecah kemudian direplikasi dan disebar merata lintas hard disk yang tersusun sebagai anggota RAID array.

Kemampuan perangkat keras controller yang digunakan pada server di Monumen Pers Nasional saat ini hanya mendukung RAID versi 0 (RAID 0), RAID versi 1 (RAID 1) dan RAID versi 5 (RAID 5). Teknologi RAID 5 yang digunakan di server Monumen Pers Nasional dipilih karena mampu menyediakan tingkat toleransi kegagalan yang sama jika dibandingkan dengan RAID 1 tetapi menyediakan kapasitas penyimpanan yang lebih besar [12]. RAID 5 juga mampu memberikan mekanisme perlindungan data yang tidak dimiliki oleh RAID 0 dengan mengesampingkan performa dalam melakukan penulisan data pada RAID 5 yang lebih rendah dibandingkan dengan RAID 1 dan RAID 0. Untuk menggunakan teknologi RAID 5 setidaknya membutuhkan minimal 3 buah hard disk dan maksimal tersusun dari 16 hard disk yang dapat dikonfigurasi dalam satu array.

RAID 5 mampu melindungi hilangnya data yang disimpan ketika terjadi kerusakan pada salah satu hard disk dalam satu kesatuan array [13]. Dari situ dapat disimpulkan bahwa kelemahan pada RAID 5 adalah ketika kerusakan terjadi bersamaan pada beberapa hard disk sekaligus (lebih dari satu hard disk) maka kehilangan data dapat menjadi suatu hal yang tidak dapat dihindari. Kondisi tersebut pernah terjadi di Monumen Pers Nasional pada tahun 2013 sehingga menyebabkan banyak data yang hilang karena kerusakan hard disk secara bersamaan di salam satu array tersebut tidak dapat diantisipasi oleh RAID 5. Akibatnya hampir sebagian data hilang dan tidak dapat diakses. Proses pemulihan dilakukan menggunakan data cadangan. Hanya saja waktu yang dibutuhkan agar kondisi kembali seperti semula membutuhkan waktu beberapa minggu.

Melalui kejadian tersebut, maka prioritas pertama Monumen Pers Nasional saat ini adalah membangun infrastruktur media penyimpanan yang mampu menyediakan ketersediaan data yang lebih tinggi dibanding sebelumnya yang akan digunakan sebagai data warehouse ke depannya. Berdasarkan kebutuhan tersebut aplikasi Hadoop dapat menjadi sebuah solusi [14]. Hadoop adalah

(7)

7 sebuah aplikasi yang berasal dari proyek open source dari Apache Foundation yang menyediakan teknologi penyimpanan bernama Hadoop Distributed File System (HDFS) dan pemrosesan data skala besar secara paralel dengan paradigma MapReduce [15]. Berbagai perusahaan juga sudah banyak yang membuktikan kemampuan Hadoop yang digunakan untuk menyimpan dan memproses data dengan skala besar, berikut diantaranya [16]:

a) Facebook menggunakan Hadoop untuk menyimpan salinan log dan berbagai data untuk analisis dan pelaporan.

b) Adobe menggunakan Hadoop untuk menyimpan dan memproses data yang berasal dari layanan publik yang digunakan untuk kebutuhan internal.

c) Ebay menggunakan Hadoop untuk mengoptimasi sistem pencarian di dalam website-nya.

d) Yahoo! menggunakan Hadoop untuk riset di sistem periklanan dan pencarian web.

e) Twitter menggunakan Hadoop untuk menyimpan dan memproses data sosial media yang dihasilkan.

f) Rakuten, perusahaan toko online yang berasal dari Jepang menggunakan Hadoop untuk membangun sistem rekomendasi bagi pelanggannya dan lain-lain.

HDFS memiliki kemampuan untuk dapat mendeteksi dan mengatasi kegagalan yang terjadi pada sistem penyimpanan dari lapisan perangkat lunak sehingga mampu melapisi kemampuan perangkat keras dalam mengatasi kegagalan [15].

(8)

8 Kemampuan yang dimiliki HDFS diharapkan mampu menjadi solusi akan potensi masalah yang dapat timbul karena keterbatasan teknologi perangkat keras yang digunakan. Selain menyediakan teknologi media penyimpanan, fitur MapReduce yang dimiliki Hadoop juga dapat dimanfaatkan untuk melakukan pemrosesan komputasi dan analisis data seperti yang data warehouse dapat lakukan [15]. Aplikasi Hadoop juga dapat dijalankan menggunakan perangkat keras komoditas yang mudah didapatkan di pasaran [17]. Untuk mendapatkan dan menggunakan berbagai kelebihan Hadoop tersebut, pengguna juga tidak perlu mengeluarkan biaya apapun (free) untuk membayar lisensi. Berbagai kelebihan yang dimiliki oleh Hadoop tersebut menjadi dasar pemilihan aplikasi Hadoop untuk dijadikan sebagai infrastruktur awal sebelum data warehouse media cetak dibangun di Monumen Pers Nasional.

1.2 Perumusan Masalah

Dari uraian latar belakang di atas dapat ditarik rumusan masalah yaitu:

1. Infrastruktur media penyimpanan di Monumen Pers Nasional saat ini dalam menjamin ketersediaan data yang disimpan memilki tingkat toleransi kegagalan yang rendah karena hanya menggunakan metode RAID.

2. Aplikasi Hadoop dengan fitur HDFS dapat memberikan solusi yang tepat dalam mengatasi permasalahan yang ada sebelumnya, hanya saja seberapa jauh tingkat toleransi kegagalan yang dimiliki dalam memberikan jaminan tingkat ketersediaan data yang disimpan belum diketahui.

(9)

9 1.3 Keaslian Penelitian

Penelitian tentang high availability system, aplikasi Hadoop dan HDFS telah banyak dilakukan sebelumnya. Berikut beberapa penelitian sebelumnya yang dapat dijadikan acuan.

Salah satu penelitian tentang perlindungan data pada media penyimpanan menjelaskan bahwa ada beberapa solusi untuk melakukan perlindungan pada data yang disimpan di media penyimpanan [18]. Salah satu solusinya adalah menggunakan metode redundancy. Metode ini dapat meningkatkan tingkat ketersediaan data yang disimpan di dalam media penyimpanan. Walaupun begitu, konsekuensi dengan metode tersebut adalah kebutuhan kapasitas penyimpanan menjadi lebih besar dari ukuran data yang seharusnya disimpan. Metode ini akan memberikan jaminan ketersediaan yang diakibatkan oleh kegagalan perangkat keras, tetapi tidak memberikan jaminan kerusakan atau kehilangan data yang diakibatkan oleh virus atau ulah manusia.

Implementasi dari metode redundancy pernah diterapkan pada penelitian tentang menggunakan Object-based Storage Devices (OSD) [19]. Melalui metode tersebut, setiap data yang disimpan di dalam OSD akan diduplikasi dan disebar ke beberapa tempat sekaligus dalam satu array saat proses penyimpanan dilakukan. Penyebaran duplikasi data ini bertujuan untuk meningkatkan ketersediaannya. Apabila terjadi kegagalan pada salah satu media penyimpanan yang digunakan, maka duplikasi data dari media penyimpanan yang masih berfungsi normal akan digunakan untuk menggantikannya.

Banyak penelitian tentang pemanfaatan Hadoop dilakukan, salah satunya adalah penelitian Hadoop yang digunakan untuk data warehouse [20]. Pada penelitian tersebut, aplikasi Hadoop yang dikolaborasikan dengan aplikasi Hive mampu melakukan proses analisis data dengan skala petabyte. Melalui penelitian tersebut didapatkan hasil bahwa dibandingkan menggunakan basis data relasional, pemrosesan data dengan skala besar melalui pemanfaatan fitur map reduce pada aplikasi Hadoop terasa lebih efektif.

Penggunaan aplikasi open source dapat digunakan untuk membangun suatu sistem sehingga memiliki ketersediaan tinggi dan dapat menekan biaya produksi

(10)

10 dan investasi [21]. Ada banyak aplikasi atau sistem operasi open source yang dapat dijadikan alternatif pengganti dari aplikasi atau sistem operasi berbayar yang tersedia di pasaran. Apabila dilakukan secara tepat kemampuan aplikasi open source juga dapat memiliki kemampuan yang setara bahkan bisa melebihi kemampuan aplikasi yang berbayar. Walaupun begitu, melalui penelitian tersebut diketahui bahwa implementasinya bukanlah perkara yang mudah tetapi tidak mustahil untuk dilakukan.

Penelitian tentang high availability dan reliable server juga pernah dilakukan [22]. Tujuan penelitian tersebut adalah membangun purwarupa server basis data relasional yang memiliki kemampuan redundancy dan failover sehingga mampu menjaga ketersediaan layanan selama operasional walaupun terjadi masalah. Purwarupa tersebut dibangun hanya melibatkan tidak lebih dari 2 perangkat server dimana salah satu server berperan sebagai server aktif dan satunya berperan sebagai server pasif (cadangan). Server cadangan tersebut akan berperan aktif seketika menggantikan peran server utama ketika terjadi masalah. Akan tetapi, metode ini belum teruji ketika digunakan dengan di lebih dari 2 server.

1.4 Tujuan Penelitian

Tujuan penelitian ini adalah untuk mengetahui tingkat ketersediaan data media penyimpanan HDFS terutama pada Datanode di aplikasi Hadoop sehingga dapat digunakan untuk merancang dan membangun purwarupa infrastruktur data warehouse agar memiliki tingkat ketersediaan data yang disimpan menjadi lebih tinggi dari infrastruktur saat ini di Monumen Pers Nasional.

1.5 Manfaat Penelitian

Dari penelitian ini dapat diambil manfaat bagi Monumen Pers Nasional yaitu mampu menghasilkan informasi dan pengetahuan tentang tingkat ketersediaan yang dijamin oleh aplikasi Hadoop yang dapat digunakan untuk membangun infrastruktur media penyimpanan untuk data warehouse agar memiliki tingkat

(11)

11 ketersediaan data yang lebih tinggi dari media penyimpanan yang digunakan saat ini.

1.6. Batasan Penelitian

Penelitian ini memiliki batasan sebagai berikut:

a) Penelitian ini hanya membahas sebatas ketersediaan data yang disediakan Datanode pada fitur HDFS di aplikasi Hadoop.

b) Pada penelitian ini tidak membahas tentang tingkat ketersediaan aplikasi YARN (Map Reduce) yang merupakan salah satu fitur lainnya pada aplikasi Hadoop.

Gambar

Gambar 1.1 Ilustrasi jaringan antara klien dan server media penyimpanan di  Monumen Pers Nasional

Referensi

Dokumen terkait

Dari area bisnis yang ada, ditemukan beberapa hal menyangkut permasalahan yang ada, yaitu: (1) Pihak manajemen dalam melakukan perencanaan penjualan dan produksi memperoleh data dari

Hasil uji reliabilitas instrumen variabel motivasi belajar (Y) akan diukur tingkat reliabilitasnya berdasarkan interpretasi reliabilitas yang telah ditentukan pada

tidak dapat mengukur non-perform dari suatu kredit padahal terdapat variabel total loans dalam perhitungan efisiensi; investor di Indonesia masih berorientasi short term

Penyerapan tenaga kerja merupakan jumlah tertentu dari tenaga kerja yang digunakan dalam suatu unit usaha tertentu atau dengan kata lain penyerapan tenaga kerja

Oleh karena itu, peristiwa turunnya Al Qur’an selalu terkait dengan kehidupan para sahabat baik peristiwa yang bersifat khusus atau untuk pertanyaan yang muncul.Pengetahuan

Adapun data kosa kata dialek-dialek tersebut diambil dari peneliti-peneliti lain yang sebelumnya telah meneliti bahasa tersebut, diantaranya dialek Luwu dari Wahyu (2014),

Dari hasil perhitungan back testing pada tabel tersebut tampak bahwa nilai LR lebih kecil dari critical value sehingga dapat disimpulkan bahwa model perhitungan OpVaR

Menutup kegiatan pembelajaran dengan berdo’a bersama V Alat/Bahan/Sumber Belajar:.. A Kerja logam,