• Tidak ada hasil yang ditemukan

Manajemen Ketersediaan

N/A
N/A
Protected

Academic year: 2021

Membagikan "Manajemen Ketersediaan"

Copied!
42
0
0

Teks penuh

(1)

Manajemen Ketersediaan

(Availability Management)

(2)

Pertanyaan

Apakah itu ketersediaan layanan TI?

Komponen infrastruktur apa yang menentukan ketersediaan layanan TI?

Faktor apakah yang mempengaruhi ketersediaan infrastruktur TI?

Bagaimana strategi pencapaian tingkat ketersediaan infrastruktur TI?

(3)

Kebutuhan Bisnis

Ketergantungan bisnis modern pada TI menuntut ketersediaan layanan TI yang tinggi.

◦ Terhentinya layanan dapat berakibat kerugian yang sebanding dengan lamanya gangguan.

Fleksibilitas bisnis berkat teknologi internet (transaksi kapan saja dimana saja) menuntut ketersediaan layanan TI setiap saat (24jam x 7hari).

(4)

Ketersediaan

Availability adalah kemampuan fasilitas TI untuk menjalankan fungsi pada saat dibutuhkan atau untuk menjalankan

fungsi selama suatu periode waktu tertentu.

Ketersediaan umumnya diikat dengan service level agreement (SLA)

◦ Dalam bentuk target prosentase waktu dimana layanan tersedia.

◦ Contoh: 99,9% (dalam waktu satu tahun, total waktu mati tidak boleh melebihi 0.1% ≈ 8.75 jam).

(5)
(6)

Tujuan Manajemen Ketersediaan

Tujuan dari proses manajemen ketersediaan adalah untuk memastikan bahwa tingkat ketersediaan layanan yang diberikan sesuai dengan atau melebihi kebutuhan bisnis yang telah disepakati saat ini dan masa depan, dengan biaya yang efektif

(7)

Pengukuran Ketersediaan

Ketersediaan layanan TI dapat diukur dari:

Log transaksi client: (total_requests – total_requests_gagal) /

total_requests

Log aktivitas server: (total_jam_layanan –

total_jam_tak_beroperasi) / total_jam_layanan

Ukuran menurut client dan server dapat berbeda, cara pengukuran harus disepakati.

Tingkatan Ketersediaan

◦ Service availability

(8)

Prinsip Manajemen Ketersediaan (1)

(9)

Prinsip Manajemen Ketersediaan (2)

Prinsip 2: Kecepatan menanggulangi gangguan

ketersediaan berdampak besar pada kepuasan bisnis dan pengguna.

◦ Menuntut adanya proses, prosedur, dan mekanisme penanggulangan gangguan.

Prinsip 3: Manajemen Ketersediaan yang efektif

menuntut pemahaman tentang peran layanan TI dalam proses-proses bisnis.

(10)
(11)

Aktifitas Proses Manajemen Ketersediaan

Aktifitas Reaktif: aspek reaktif Ketersediaan Manajemen

melibatkan pemantauan, pengukuran, analisis dan

pengelolaan semua kejadian, insiden, dan masalah yang melibatkan unavailability. Aktifitas ini merupakan aktifitas dalam peran operasional

Aktifitas Proaktif: kegiatan proaktif Ketersediaan Manajemen

melibatkan perencanaan, desain proaktif dan peningkatan ketersediaan. Aktifitas ini merupakan aktifitas dalam peran desain dan perencanaan

(12)

Identifikasi Komponen Kritis

Pengelolaan ketersediaan layanan TI melibatkan pengelolaan ketersediaan infrastruktur pendukungnya.

Membutuhkan analisa keterkaitan antar komponen infrastruktur

Fault Tree Analysis, Component Failure Impact Analysis, dsb.

Arsitektur TI modern sifatnya terpartisi (multi-tier) dengan

shared-use komponen infrastruktur oleh beberapa sistem

(13)

Fault Tree Analysis

Pemetaan struktur rantai penyebab ketidak-tersediaan layanan TI:

basic events

resulting events OR gate

conditional event

(14)

Component Failure Impact Analysis

Analisa komponen “rawan” dengan CFIA:

◦ Tabulasi layanan dan komponen-komponen infrastruktur atau CI (configuration item).

◦ Tandai ketergantungan layanan terhadap tiap CI:

Kosong jika tidak tergantung pada CI tsb.

X jika tergantung sepenuhnya pada CI tsb.

A jika tergantung tapi dapat dialihkan ke CI lain.

M jika dapat dialihkan ke CI lain tapi melalui intervensi

(15)
(16)

CFIA (3)

CI dengan banyak X adalah komponen kritis.

Layanan dengan banyak X adalah layanan kompleks: potensi keandalannya rendah.

CI yang kritis harus:

◦ Memiliki cadangan atau alternatif.

(17)

CFIA (4)

Dapat juga ditambahkan kolom-kolom:

 Probabilitas kerusakan atau dengan label

kualitatif: rendah/sedang/tinggi.

Berdasarkan statistik MTBF (mean time between

failures).

 Berdasarkan data MTBF dari vendor atau pembuatnya.

 Perkiraan waktu perbaikan:

Dari data perbaikan masa lalu: MTRS (mean time

(18)

CFIA (5)

1 / MTBF MTRS 0.01 0.01 0.01 0.01 0.10 0.01 0.80 0.30 0.30 0.10 0.2 1.0 0.2 1.0 2.0 1.0 3.0 12.0 12.0 2.0

(19)

CFIA (6)

Teknik lain: orientasi pada jumlah user yang terkena dampak.

CI VBF Total Users

Power Semua 1000

Application Server Semua 1000

Aplikasi ERP Semua 1000

Disk 1 Pembayaran 50 Disk 2 Pemesanan 100 Utility X Pelaporan 25 VBF: vital business function (proses bisnis vital)

 Komponen yang kritis adalah yang memiliki total

(20)

Faktor Penentu

Faktor-faktor ketersediaan infrastruktur TI:  Keandalan (reliability)

◦ Keandalan komponen terhadap gangguan.

Kemudahan pemeliharaan (maintainability)

◦ Pemeliharaan untuk mencegah terjadinya gangguan. Termasuk deteksi tanda-tanda kerusakan.

Kemudahan perbaikan (serviceability)

◦ Adanya perjanjian/kontrak dukungan perbaikan dengan vendor atau pihak ketiga.

(21)

Dimensi Gangguan Ketersediaan

Servicability

(22)
(23)

Perhitungan Availability, Reliability, dan Mantainability

MTBSI (Mean Time Between Service Incidents)

MTBF (Mean Time Between Failures)

MTRS (Mean Time to Restore Service)

(Agreed Service Time (AST) – downtime) Agreed Service Time (AST)

X 100 % Availability (%) =

Available time in hours

Number of breaks Reliability (MTBSI in hours) =

Available time in hours – Total downtime in hours Number of breaks

Reliability (MTBF in hours) =

Total downtime in hours

Number of breaks Maintainability (MTRS in hours) =

(24)

Perhitungan Availability, Reliability, dan

Mantainability

Contoh: Sebuah situasi dimana layanan 24 x 7 telah

beroperasi selama 5,020 jam dengan dua kali terhenti (yang masing-masingnya 6 jam dan 14 jam)

Availability = (5,020–(6+14)) / 5,020 x 100 = 99.60% Reliability (MTBSI) = 5,020 / 2 = 2,510 hours

Reliability (MTBF) = 5,020–(6+14) / 2 = 2,500 hours Maintainability (MTRS) = (6+14) / 2 = 10 hours

(25)
(26)
(27)

Daur Hidup Insiden

Incident detection

Waktu di mana penyedia layanan TI organisasi dibuat sadar akan adanya insiden

Incident diagnosis

Waktu dimana diagnosis untuk menentukan penyebab diselesaikan Incident repair

Waktu dimana kegagalan telah diperbaiki Incident recovery

Waktu dimana pemulihan komponen telah selesai Incident restoration

(28)

Pengelolaan Ketersediaan

Tingkat ketersediaan dinegosiasikan dengan user berdasarkan anggaran dan potensi kerugian yang berimbang.

Perhitungan biaya untuk memenuhi kebutuhan ketersediaan berdasarkan:

Identifikasi persyaratan keandalan (reliability) dan

kemudahan pemeliharaan (maintainability)

komponen-komponen yang terlibat.

Identifikasi kemudahan perbaikan (serviceability) komponen-komponen dari vendor eksternal.

(29)

Biaya Ketidak-tersediaan (1)

Mengetahui biaya kerugian akibat ketidak-tersediaan penting dalam memutuskan tingkat investasi TI untuk memenuhi persyaratan ketersediaan.

Perkiraan dampak ketidak-tersediaan:

1. Jumlah layanan bisnis yang terkena dampak. ◦ Mudah dihitung tapi kurang akurat.

2. Perkiraan nilai kerugian moneter akibat terhentinya layanan bisnis.

(30)

Biaya Ketidak-tersediaan (2)

Permasalahan:

◦ Banyaknya faktor yang harus masuk dalam perhitungan.

Sulit mengkuantifikasi biaya intangible.

◦ Data sulit diperoleh.

Biaya Tangible Biaya Intangible

Penurunan produktivitas pengguna Kehilangan kepercayaan konsumen Penurunan produktivitas staf TI Kehilangan konsumen

Kehilangan pendapatan Kehilangan peluang bisnis Biaya lembur dukungan teknis Jatuhnya reputasi perusahaan

Pasokan yang tidak terpakai Kehilangan kepercayaan pengguna Denda atau penalti Kerusakan moril staf TI

(31)

Tingkat Ketersediaan Optimal

Cara lebih mudah: tingkat optimal berdasarkan total biaya untuk pemeliharaan preventif dan korektif

minimum.

Kebutuhan akan

ketersediaan yang melebihi

tingkat ketersediaan

optimal infrastruktur dapat

melambungkan biaya.

Biaya redesign infrastruktur (termasuk dukungan teknis).

(32)

Tingkatan Investasi Ketersediaan

Paling mendasar: komponen-komponen Mekanisme monitoring, deteksi, dan pemulihan gangguan otomatis

(preventive measures)

Terselenggaranya Manajemen Insiden/Problem, dan Manajemen Perbaikan (corrective measures)

Fasilitas dual/mirror site Eliminasi SPOF (titik rawan),

penyediaan komponen

alternatif/cadangan, dan mekanisme untuk mempersingkat downtime akibat kerusakan

(33)

Rancangan Korektif (1)

Elemen kunci:

Manajemen Insiden yang mapan

◦ Definisi peran dan tanggung-jawab dari tim penanggulangan gangguan yang jelas.

◦ Prosedur eskalasi yang ketat.

(34)

Pengelolaan Infrastruktur

Kerangka kerja IT Infrastructure Library:

Service Strategy

Menetapkan service yang perlu dibuka/dilayankanService Design

Mengumpulkan requirement dan membuat design service baru maupun modifikasi service yang lama

Service Transition

◦ Pengembangan/pembuatan service ◦ Service Operation

(35)
(36)

Rancangan Korektif (2)

Elemen kunci:

Fasilitas diagnosa sistem

Tersedianya tools untuk mendiagnosa penyebab gangguan sistem.

Tersedianya rekaman data aktivitas (log) untuk melakukan diagnosa.

Penerapan backup & recovery

Untuk data, software, maupun hardware (spare).

Melibatkan pengembangan dan testing prosedur backup &

recovery.

(37)

Rancangan Preventif

Availability Management melakukan:

Analisis dan spesifikasi reliability dan serviceability

komponen infrastruktur (hardware & software).

Evaluasi tingkat keandalan komponen infrastruktur TI

dalam memenuhi persyaratan ketersediaan.

Menyusun prosedur dan jadwal pemeliharaan sistem

yang sesuai.

(38)

Perencanaan Ketersediaan (1)

Secara periodik perlu ada review untuk merencanakan ketersediaan infrastruktur TI, berdasarkan:

◦ Seringnya pelanggaran SLA ketersediaan.

Seringnya downtime untuk perbaikan atau lamanya downtime melebihi batas toleransi.

◦ Hasil pengukuran ketersediaan menunjukkan trend penurunan.

◦ Permintaan pengguna/bisnis untuk meningkatkan ketersediaan akibat pertumbuhan bisnis.

(39)

System Outage Analysis

SOA: kegiatan analisa dengan melibatkan berbagai data dari log-log proses (termasuk aktifitas dukungan teknis) untuk mencari penyebab gangguan ketersediaan.

Pelaksanaanya melibatkan administrator sistem & jaringan, staf dukungan teknis, user/ operator, analis sistem, vendor, manajemen bisnis.

Hasilnya dilaporkan beserta rekomendasi langkah-langkah perbaikan.

(40)

Rencana Ketersediaan (1)

Garis besar isi rencana:

Tingkat ketersediaan aktual saat ini (dalam bahasa

pengguna/bisnis) dan tingkat ketersediaan ideal menurut SLA.

◦ Rangkuman hasil analisa pencarian penyebab gangguan-gangguan ketersediaan atau SOA (system outage analysis).

Aktivitas-aktivitas perbaikan yang sedang dilaksanakan dengan pertimbangan biaya/manfaat masing-masing.

(41)

Rencana Ketersediaan (2)

Sosialisasi tentang potensi teknologi baru atau versi baru (upgrade) dalam memperbaiki tingkat ketersediaan layanan TI.

Perubahan tingkat ketersediaan beserta alasannya, dan opsi-opsi untuk memenuhinya beserta biayanya.

(42)

Referensi

Dokumen terkait

Kajian ini lebih difokuskan pada kegiatan eksperimen dan pengujian material dry leaf board sebagai panel akustik ruang hunian untuk menemukan kemampuan fungsi

Dokumen yang digunakan dalam sistem penerimaan kas dari sektor Pajak Hotel pada DPPKA Kota Surakarta adalah SP/SM DPD II 09 untuk Wajib Pajak yang menghitung

Berbeda dengan buruh perempuan, buruh laki-laki tidak melakukan pekerjaan reproduktif melainkan beristirahat atau melanjutkan pekerjaan produktif sebagai tambahan

Pencapaian kinerja kegiatan diukur dengan membandingkan nilai indikator kinerja masukan (input), keluaran (output) dan hasil (outcome) antara realisasi dengan target, yang

20 (86,96,17 %) indikator mengalami penurunan, yaitu: 1) Minat terhadap perkuliahan statistika dasar; 2) Kehadiran tepat waktu dalam perkuliahan; 3) Keinginan untuk mengerjakan

Izin Penyelenggaraan Pelelangan Ikan yang selanjutnya disebut Izin adalah surat izin menyelenggarakan pelelangan ikan di TPI yang diberikan kepada organisasi

Karena sistem dinamika reaktor nuklir merupakan persamaan non linier, maka untuk menentukan persamaan Liapunov dapat dilakukan dengan cara sebagai berikut... Fungsi Liapunov

Pendekatan, Strategi dan Metode Pembelajaran: Bahan Ajar Diklat Mata Pelajaran Pendidikan Kewarganegaraan SMA Jenjang Dasar.. Jakarta: Direktorat Jenderal Peningkatan