Analisis Perbandingan Kualitas Layanan Video Streaming Dengan Codec H.265 dan Codec H.264 Pada Jaringan WLAN

(1)

BAB II

DASAR TEORI

2.1 Video streaming

Video streaming adalah sekumpulan dari gambar yang dikirimkan dalam bentuk yang telah dikompresi melalui suatu jaringan dan ditampilkan oleh player

ketika video tersebut telah diterima oleh user yang membutuhkan. Player merupakan aplikasi khusus yang melakukan dekompresi data berupa video. Sebuah

player dapat berupa sebuah perangkat lunak atau bagian dari browser.

Media streaming telah ada selama 70 tahun. Media streaming dapat berupa video ataupun audio. Pertama kali video diolah dan ditransmisikan dalam bentuk

analog. Munculnya digital IC (Integrated Circuit) dan berkembangnya komputer

telah membantu terbentuknya video digital, salah satu penerapan video digital yang

digunakan dalam transmisi pada jaringan komputer adalah video streaming . Streaming dapat dianggap sebagai bagian dari webcasting, namun streaming tidak harus menggunakan web. Aliran data dapat disampaikan melalui wireless jaringan

atau intranet pribadi [6].

2.2 Coder dan Decoder

CODEC (Coder-Decoder) adalah suatu metode yang digunakan untuk

melakukan sampling terhadap sinyal analog kemudian sebelum ditransmisikan sinyal analog tersebut dikonversi ke dalam bit-bit digital, lalu mengubahnya

kembali agar dapat digunakan. CODEC mempunyai fungsi untuk mengecilkan

(2)

kemudian mengembalikannya keukuran semula (decompress). Prosedur

pengiriman video terkompresi ditunjukkan pada Gambar 2.1 [6].

Gambar 2.1 Prosedur Pengiriman Data Video Terkompresi [6]

CODEC digunakan untuk menghemat bandwidth. Namun, resikonya suara

dan gambar yang dihasilkan menjadi kurang jernih. Terdapat 2 jenis CODEC, yaitu

lossy CODEC dan lossless CODEC. Berikut ini akan dibahas jenis CODEC tersebut.

2.2.1 Lossy CODEC

Lossy CODEC merupakan jenis kompresi dengan melakukan pengurangan ukuran data dari data yang sebenarnya. Banyak CODEC yang popular termasuk

dalam katagori ini. CODEC ini akan mengurangi kualitas data. Biasanya CODEC

ini digunakan untuk menyimpan data pada media penyimpanan yang berukuran

terbatas seperti CD-ROM dan DVD.

2.2.2 Lossless CODEC

Berbeda halnya dengan kompresi Losy CODEC, Lossless CODEC

merupakan jenis kompresi tanpa terjadi pengurangan data. Akibatnya, ukuran data

(3)

sering digunakan pada video yang masih memerlukan editing atau penggunaan dalam aplikasi kedokteran yang harus menampilkasn citra asli.

2.3 Kompresi Video

Ada banyak redudansi dalam sinyal video digital. Secara rinci, terdapat

korelasi yang besar antara piksel tetangga (spasial) dan frame berikutnya (temporal). Redundansi berarti informasi yang umum ditemukan pada lebih dari

satu gambar atau video. Gambar 2.2 menunjukkan data video berdasarkan spatial

dan temporal [7].

Gambar 2.2 Spatial dan Temporal Dari Urutan Suatu Gambar [7]

Banyak teknik pengkodean kompresi video telah dikembangkan untuk

mengurangi redudansi diantaranya adalah transform coding, entropi coding, loop

filter, dll.. Gambar 2.3 mengilustrasikan garis waktu untuk teknik kompresi [8].

(4)

2.4 Standar Kompresi Video

ITU-T (International Telecommunication Union – Telecommunication

Sector) membuat beberapa standar yang direkomendasikan untuk kompresi video. Beberapa standar tersebut diantaranya adalah H.261,H.263,H.264, dan H.265.

Berikut akan dibahas jenis standar tersebut:

2.4.1 Kompresi H.261

Standar H.261 adalah standar yang diterbitkan oleh ITU-T pada tahun 1990. Standar H.261 didesain untuk kompresi video yang akan ditansmisikan melalui jaringan ISDN (Integrated Services Digital Network) dengan bandwidth sebesar px64 Kbit/s, dimana p berkisar antara 1 sampai 30. Gambar 2.4

menunjukkan komponen utama yang digunakan untuk code dan decode bitstreams

H.261 berdasarkan dokumentasi ITU [9].

Gambar 2.4 Blok Diagram H.261 Menurut Rekomendasi ITU [9]

(5)

H.261 di rancang untuk pengiriman video melalui jaringan ISDN (Integrated Services Digital Network) yang merupakan standar video coding yang dibuat oleh CCITT (Consultative Commitee for International Telephone and Telegraph).

H.261 merekomendasikan sebuah standar coding untuk pengiriman data dengan kelipatan m x 384Kbps (m=1,2,..5) dan dirancang untuk video conference.

Kecepatan bitrate antara p x 64 Kbps. Dimana p adalah frame rate (antara 1 sampai

30). Susunan frame H.261 berurutan dimana tiap - tiap 3 buah frame (I) dibatasi

dengan 1 buah interframe (P) [9].

2.4.2 Kompresi H.263

Pada Februari 1995 ITU-T SG15 mengeluarkan standar H.263 yang dirancang untuk penggunaan komunikasi bitrate namun tidak pernah berjalan dengan baik ketika melalui jaringan POTS (Plain Old Telephone Service). Standar

H.263 telah menggantikan standar H.261 untuk video conference dibeberapa aplikasi yang mendominasi standarisasi untuk beberapa aplikasi internet video streaming sekarang ini.

Prinsip kerja H.263 yaitu video frame akan ditangkap di sumber / pengirim

dan di encode (dikompresi) dengan video encoder. File video yang terkompres kemudian dikirimkan melalui jaringan atau saluran telekomunikasi dan di decode

(dekompresi) menggunakan video decoder. Frame yang di decode ini yang kemudian akan di tampilkan.

Pada saat ini, cukup banyak standar yang ada, masing-masing di desain

untuk keperluan tertentu. Masing-masing standar pun memiliki prinsip kerja yang

(6)

Gambar 2.5 Blok Diagram H.263 [9]

2.4.3 Kompresi H.264

CODEC H.264 dapat melakukan proses decoding secara lengkap, inverse

transform untuk menghasilkan sebuah urutan video yang telah di-encode. Encoder pada H.264 menggunakan prediksi intra-frame atau estimasi gerak untuk memprediksi piksel dari setiap blok gambar.

Prediksi intra-frame menggunakan piksel blok tetangga untuk memprediksi

piksel dari blok saat ini. Perbedaan antara piksel diprediksi dan piksel yang

sebenarnya berubah menjadi domain frekuensi, menghasilkan blok koefisien

frekuensi. koefisien ini terkuantisasi, dan bitstream output dikompresi menggunakan pengkodean entropy.

(7)

Gambar 2.6 Blok Diagram H.264 [10]

2.4.4 Kompresi H.265

H.265 atau High Efficiency Video Coding (HEVC) merupakan CODEC yang mimilii kualitas video yang setara dengan CODEC yang ada saat ini yaitu

H.264 namun hanya membutuhkan setengah bandwidth dari CODEC lama tersebut.

Cara Kerja H.265 ini sama seperti H.264 dan Mpeg-2, H.265 menggunakan

3 jenis frame yaitu : I-,B-,dan P-frame dalam sekumpulan gambar, menggabungkan

ke dua elemen kompresi intra dan inter frame. Efesiensi yang diterapkan pada H.265 diantaranya mengunakan coding tree block (CTB) dan intra prediction direction [1]. Untuk lebih jelasnya, dapat dilihat sebagai berikut.

1. Coding Tree Blocks, sebelumnya H.264 menggunakan macro block dengan ukuran maksimalnya yaitu 16x 16 pixel. Dengan CTB, ukuran maksimal standar H.265 ialah 64 x 64 piksel. Gambar 2.7 memperlihatkan perbedaan

(8)

Gambar 2.7 Perbandingan Macro Block (a) dan Tree Block (b) [1]

2. Lebih banyak intra prediction direction, H.264 menggunakan 9 intra prediction

direction sedangkan H.265 menggunakan lebih dari 35 intra prediction direction. Gambar 2.8 memperlihatkan perbedaan antara intra prediction direction pada CODEC H.264 dengan H.265 [1].

(a) (b)

Gambar 2.8 Intra Prediction Direction H.265 (a) dan H.264 (b) [1]

Pembahasan secara singkat di atas dapat diilustrasikan menggunakan

(9)

Gambar 2.9 Blok Diagram CODEC H.265 [1]

2.5 Konsep Kompresi Interframe

Kompresi interframe merupakan kompresi yang terpenting saat proses

kompresi video. Konsep dasar kompresi interframe menggunakan redudansi

temporal yang terdapat dalam sekelompok frame. Metode yang digunakan adalah

sebagai berikut:

2.5.1 Prediksi Dari Frame Video Sebelumnya (Difference Coding)

Metode paling sederhana dari prediksi temporal adalah dengan

menggunakan frame sebelumnya sebagai prediktor untuk frame sekarang. Dua frame berturut-turut dari urutan video yang ditampilkan pada Gambar 2.10 dan Gambar 2.11. Frame 1 digunakan sebagai prediktor untuk residu frame 2 yang dibentuk dengan mengurangkan prediktor (frame 1) dengan frame sekarang (frame

(10)

Gambar 2.10 Frame ke-1 [7]

Gambar 2.11 Frame ke-2 [7]

Gambar 2.12 Selisih Besar Piksel Pada Gambar 2.10 dan Gambar 2.11 [7]

2.5.2 Estimasi Dan Kompensasi Gerak

Perubahan antara frame video dapat disebabkan oleh gerakan objek misalnya sepeda yang bergerak, lengan bergerak, kamera motion (panning, tilt, zoom, rotasi), dan perubahan pencahayaan. Perubahan pergerakan tersebut memungkinkan untuk memperkirakan lintasan setiap pixel video, medan lintasan

(11)

Gambar 2.13 menunjukkan medan aliran optik untuk frame dari Gambar 2.10 dan Gambar 2.11 [7].

Gambar 2.13 Medan Aliran Optik [7]

Jika medan aliran optik secara akurat dikenal, dimungkinkan membentuk

prediksi yang akurat dari sebagian besar piksel frame dengan memindahkan setiap

pixel dari kerangka acuan di sepanjang vektor aliran optik. Untuk membentuk kompensasi gerak yang akurat dibutuhkan komputasi secara intensif .

Estimasi gerak ( motion estimation ) merupakan teknik kompresi interframe yang memprediksi sebuah frame dari frame sebelumnya ( reference frame ), dengan mengestimasi gerakan blok – blok antar frame tersebut. Frame dibagi menjadi blok – blok yang tidak overlap. Tiap blok dibandingkan dengan blok – blok berukuran sama, pada frame sebelumnya dengan melakukan pencocokan blok ( block matching ). Dalam melakukan pencocokan tersebut, lokasi

dari blok yang paling mirip pada frame referensi (reference frame) berbeda dari lokasi blok target (target block). Perbedaan relatif posisi ini disebut vektor gerak

(12)

Gambar 2.14 Vektor gerak [7]

Vektor geraknya bernilai nol jika posisi blok target dan blok yang match sama. Ketika mengkodekan tiap blok dari frame yang diprediksi, vektor gerak yang

menunjukkan posisi blok yang match pada frame referensi, dikodekan pada posisi

blok yang match pada frame referensi, dikodekan pada posisi target blok itu sendiri,

maka terjadi kompresi, karena jumlah bit yang diperlukan untuk mengkodekan vektor gerak lebih sedikit daripada untuk mengkodekan suatu blok secara utuh.

Pada dekompresi, dekoder menggunakan vektor gerak untuk menemukan

matching block pada frame referensi dan menyalin matching block tersebut ke posisi yang sesuai pada frame yang sedang diprediksi. Dengan demikian, suatu frame prediksi tersusun atas blok – blok dari frame sebelumnya.

2.6 Konsep Kompresi Intraframe

Selain kompresi interframe dibutuhkan kompresi intraframe untuk melakukan kompresi pada bidang spatial. Konsep dasar kompresi intraframe menggunakan redudansi spatial yang terdapat dalam sekelompok block di dalam satu frame. Beberapa teknik intraframe di antaranya discrete cosine transform dan

(13)

2.6.1 Discrete Cosine Transform ( DCT )

Prinsip dasar yang dilakukan dengan Discrete Cosine Transform ( DCT ) adalah mentransformasikan data dari domain ruang ke domain frekuensi. Discrete

Cosine Transform (DCT) beroperasi pada X (blok N × N sampel) dan menghasilkan

matrik Y. DCT dapat dirumuskan sebagai berikut [7]:

Y = AXAT _(2.1)

Untuk mencari elemen dari matrik A dapat menggunakan persamaan berikut [7]:

Aij = Ci ( ) (2.3)

dimana:

Ci = ( = 0) (2.4)

Ci= ( > 0) (2.5)

Persamaan 2.1 dan 2.2 dapat ditulis dalam bentuk penjumlahan yaitu [7]:

=

∑

cos

( )

cos

( )

(2.6)

=

∑

cos

( )

cos

( ) (2.7)

2.6.2 Kuantisasi

(14)

diterapkan pada keluaran proses DCT. Kuantisasi dilakukan dengan membagi

keluaran proses DCT dengan suatu nilai yang ditetapkan dalam matriks kuantisasi

atau disebut quantum. Kuantisasi uniform secara umum dapat dirumuskan dengan

[7]:

Entropy encoder mengkonversi serangkaian simbol yang mewakili unsur urutan video menjadi bitstream terkompresi yang cocok untuk transmisi atau penyimpanan. Beberapa teknik entropy coder antara lain Huffman coding dan context adaptive binary arithmetic coding:

2.7.1 Huffman Coding

Kode Huffman pada dasarnya merupakan kode prefiks (prefix code). Kode

prefiks adalah himpunan yang berisi sekumpulan kode biner, dimana pada kode

prefik ini tidak ada kode biner yang menjadi awal bagi kode biner yang lain. Kode

prefiks biasanya direpresentasikan sebagai pohon biner yang diberikan nilai atau

label. Untuk cabang kiri pada pohon biner diberi label 0, sedangkan pada cabang

(15)

Rangkaian bit yang terbentuk pada setiap lintasan dari akar ke daun

merupakan kode prefiks untuk karakter yang berpadanan. Pohon biner ini biasa

disebut pohon Huffman. Langkah-langkah pembentukan pohon Huffman adalah

sebagai berikut [11] :

1. Baca semua karakter di dalam teks untuk menghitung frekuensi kemunculan

setiap karakter. Setiap karakter penyusun teks dinyatakan sebagai pohon

bersimpul tunggal. Setiap simpul di-assign dengan frekuensi kemunculan

karakter tersebut.

2. Terapkan strategi algoritma greedy sebagai berikut : Gabungkan dua buah

pohon yang mempunyai frekuensi terkecil pada sebuah akar. Setelah

digabungkan akar tersebut akan mempunyai frekuensi yang merupakan

jumlah dari frekuensi dua buah pohon-pohon penyusunnya.

3. Ulangi langkah 2 sampai hanya tersisa satu buah pohon Huffman. Agar

pemilihan dua pohon yang akan digabungkan berlangsung cepat, maka

semua yang ada selalu terurut menaik berdasarkan frekuensi.

2.7.2 Context Adaptive Binary Arithmetic Coding (CABAC)

CODEC H.261 dan CODEC H.263 menggunakan Huffman Coding untuk

pembentukan bitstream. Sedangkan context-based adaptive binary aritmethic coding (CABAC) digunakan pada CODEC H.265 dan CODEC H.264.

(16)

Gambar 2.15 Blok Diagram CABAC [1]

CABAC terdiri atas 3 bagian coding yaitu binarization, context modeling, binary

aritmethic [1].

1. Binarization Pengurangan alphabet dilakukan oleh binarization untuk tiap non binary element menghasilkan suatu intemediate unik codeword biner untuk unsur sintaksis yang ditentukan yang disebut bin string.

2. Context modeling digunakan untuk membersihkan interface antara modeling dan model. Setiap distribusi model akan diberi simbol yang kemudian didalam langkah coding selanjutnya, memandu coding engine to

generate suatu urutan bit sebagai code pada simbol menurut distribusi model.

3. Binary Arimethic Coding adalah berdasarkan pada prinsip pengulangan interval [lower, upper) yang melibatkan operasi perkalian dasar dan juga

(17)

2.8 Bitrate Video

Bitrate video adalah jumlah jumlah bit yang diproses per satu satuan waktu. Bitrate video dapat dikatakan dengan transfer speed, kecepatan koneksi, bandwidth, throughput maksimum. Bitrate juga bisa diartikan sebagai jumlah bit yang diproses dalam satu satuan waktu untuk mewakili media seperti video dan

audio setelah dilakukan kompresi. Satuannya adalah bit per second (bps). Kualitas

video diatur dalam proses encoding videonya. Semakin tinggi bitrate maka akan semakin banyak informasi data videonya. Oleh karena itu, gambar akan menjadi

semakin baik kedalaman warnanya [12].

2.9 Konsep TCP/IP

Protokol streaming adalah sebuah aturan untuk membimbing sebuah aktifitas pertukaran data informasi. Adapun tujuannya adalah sebagai standarisasi

komunikasi antara streaming sever dan streaming client .

Transmision control protokol/internet protokol (TCP/IP) pertama kali diperkenalkan olah Departement of Defence (DoD.TCP/IP) menjadi protokol komunikasi data yang fleksibel dan dapat diterapkan dengan mudah dari setiap jenis

komputer dan interface jaringan, karena perubahan pada protokol yang sehubungan

dengan interface jaringan saja. TCP/IP memiliki 4 layer yang terdiri dari [6] :

1. Application Layer

Layer ini mengintegrasikan berbagai macam aktivitas dan tugas-tugas yang melibatkan fokus dari layer OSI yaitu Application, Presentation dan Session.

(18)

2. Transport Layer

Layer ini sejalan dengan layer transport di model OSI. Layer ini mendefinisikan protokol untuk mengatur tingkat layanan transmisi untuk

aplikasi. Layer ini juga menangani masalah seperti menciptakan komunikasi end to end yang handal dan memastikan data bebas dari kesalahan saat pengiriman, serta menangani urutan paket dan menjaga integritas data.

3. Internet Layer

Layer ini setara dengan layer network dalam OSI, yaitu mengalokasikan protokol yang berhubungan dengan transmisi logika sejauh paket keseluruh

network. Layer ini menjaga pengalamatan host dengan memberikan alamat IP dan menangani routing dari paket yang melalui beberapa jaringan.

4. Network Access Layer

Layer ini merupakan gabungan dari layer physical dan data link di OSI. Layer ini memantau pertukaran data antara host dan jaringan, dan bertugas dalam pengalamatan dan mendefinisikan protokol untuk transmisi fisik data .

Gambar 2.16 adalah gambar susunan struktur protokol pada TCP/IP [6].

(19)

2.9.1 Internet Protocol (IP)

Internet Protocol didesain untuk interkoneksi sistem komunikasi komputer pada jaringan paket switched. Pada jaringan TCP/IP, sebuah komputer diidentifikasi dengan alamat IP yang unik karena setiap IP memiliki perbedaan. Hal

ini dilakukan untuk pengalamatan dan mencegah kesalahan pada transfer data.

Terakhir, protokol data akses berhubungan langsung dengan media fisik. Secara

umum protokol ini bertugas untuk menangani pendeteksian kesalahan pada saat

transfer data. Untuk komunikasi datanya, Internet Protokol mengimplementasikan

dua fungsi dasar yaitu addressing dan fragmentasi.

Salah satu hal penting IP dalam pengiriman informasi adalah metode

pengalamatan pengirim dan penerima. Saat ini terdapat standar pengalamatan yang

sudah digunakan yaitu IPv4 dengan alamat terdiri dari 32 bit. Jumlah alamat yang

diciptakan dengan IPv4 diperkirakan tidak dapat mencukupi kebutuhan

pengalamatan IP sehingga sekarang tersedia sistim pengalamatan baru yaitu IPv6

yang menggunakan sistim pengalamatan 128 bit [13].

2.9.2 User Datagram Protocol (UDP)

UDP yang merupakan salah satu protocol utama diatas IP dan merupakan

transport protocol yang lebih sederhana dibandingkan dengan TCP. UDP digunakan untuk situasi yang tidak mementingkan mekanisme reliabilitas dan

(20)

UDP pada video streaming digunakan untuk mengirimkan audio dan video

stream yang dikrimkan secara terus menerus. UDP digunakan pada video streaming karena pada pengiriman audio and video streaming yang berlangsung terus menerus

lebih mementingkan kecepatan pengiriman data agar tiba di tujuan. Gambar 2.17

memperlihatkan struktur pengiriman video menggunakan protokol UDP [14].

Gambar 2.17 Struktur Pengiriman Video Menggunakan Protokol UDP [14]

2.9.3 Real Time Protocol (RTP)

Protokol RTP menyediakan transfer media secara real-time pada saat pengiriman paket data. Protokol RTP mengunakan Protokol UDP dan header RTP

mengandung informasi kode bit yang spesifik pada tiap paket yang dikirimkan,

tujuannya adalah membantu penerima untuk melakukan antisipasi jika terjadi paket

yang hilang.

RTP dapat digunakan untuk beberapa macam data stream yang realtime

seperti data suara dan data video. RTP berisi informasi tipe data yang di kirim,

timestamps yang digunakan untuk pengaturan waktu suara percakapan terdengar seperti sebagaimana diucapkan, dan sequence numbers berfungsi untuk pengurutan

paket data dan mendeteksi adanya paket yang hilang. Gambar 2.18 Memperlihatkan

(21)

Gambar 2.18 Struktur Header Protokol RTP [15]

RTP didesain untuk digunakan pada tansport layer. RTP lebih baik digunakan diatas UDP bukan pada TCP. Hal ini karena TCP tidak dapat beradaptasi

pada pengerimiman data yang real-time dengan keterlambatan yang relatif kecil seperti pada pengiriman data komunikasi suara.

2.10 Parameter Kualitas Video

Dalam rangka untuk menentukan, mengevaluasi dan membandingkan

sistem komunikasi video perlu menentukan kualitas gambar video yang

ditampilkan bagi pemirsa. Saat ini sudah banyak metode yang dikembangkan untuk

melakukan pengukuran kualitas video. Pengukuran kualitas video terbagi atas

pengukuran subjektif dan objektif. Beberapa metode pengukuran video tersebut

adalah:

2.10.1 Peak Signal to Noise Ratio (PSNR)

Peak Signal-to-Noise Ratio (PSNR) adalah salah satu metode yang cukup popular digunakan dalam pengukuran kualitas video secara objektif. Metode ini

menggunakan sinyal video sebagai parameter objektif. Metode ini membandingkan

(22)

frame video pada video original (O-video) dan mengukur perbedaan keduanya. PSNR dirumuskan sebagai [16]:

= ( − ) ( . )

Dimana, 2M-1 adalah maksimum nilai piksel untuk M-bit frame video. MSE merupakan kepanjangan dari Mean Square Error. Sebagai contoh, untuk video dengan resolusi (x,y) piksel, maka MSE dihitung sebagai

= 1 _! [ ( , , ) − ′( , , )]

p(x, y, t) merepresentasikan frame video di O-video (O-frame) sedangkan p’(x, y,

t) merepresentasikan frame video di S-video (S-frame). Kualitas video yang baik ditandai dengan tingginya nilai PSNR.

Interpretasi nilai PSNR terhadap kualitas video ditampilkan pada Tabel 2.1.

Tabel ini berdasarkan rekomendasi International Telecommunication Union (ITU)

Tabel 2.1 Interpretasi Nilai PSNR terhadap Kualitas Video

Nilai PSNR Kualitas

PSNR>37dB Sangat Baik

31>PSNR>33dB Baik

25dB>PSNR>31dB Cukup

20dB>PSNR>25dB Buruk

(23)

Semakin besar nilai PSNR maka kualitas video akan semakin baik. Hal ini

dikarenakan nilai error yang diukur menggunakan MSE adalah bernilai kecil. Untuk

nilai PSNR terburuk menurut standar ITU adalah lebih kecil dari 20 dB.

2.10.2 Structural Similarity (SSIM)

Mean Square Error (MSE) atau Peak Signal-to-Noise Ratio (PSNR) yang popular digunakan, telah lama dikritik karena memiliki sedikit korelasi dengan

persepsi pengalaman human visual system (Girod 1991). Oleh karena itu, metrik yang lebih akurat yang mempertimbangkan karakteristik human visual system telah

dipelajari, termasuk SSIM (Wang et al. 2004a), Visual Informasi Fidelity (VIF) (Sheikh dan Bovik 2006), Visual Signal-to-Noise Ratio (VSNR) (Chandler dan Hemami 2007), Fitur kesamaan (FSIM) (Zhang et al. 2011), dan Gradient Magnitude Similarity Deviasi (GMSD) Dalam bagian ini (Xue et al. 2014) dll [9].

Structural similarity (SSIM) index adalah metode untuk memprediksi kualitas yang dirasakan dari video digital. SSIM pertama kali dikembangkan di

Laboratory for Image and Video Engineering (LIVE) di The University of Texas di Austin dan bekerja sama dengan New York University.

SSIM digunakan untuk mengukur kesamaan antara dua gambar. SSIM

adalah model berbasis persepsi-yang menganggap degradasi gambar sebagai

perubahan yang dirasakan dalam informasi struktural. Indeks SSIM dihitung

menggunakan rumus [8]:

( , ) =

₍ ( ₎₍)( ) ₎ (2.11)

(24)

µx = rata-rata dari x

L= rentang dinamis dari nilai pixel biasanya dihitunng dengan 2bits per pixel_-1

Indeks SSIM memenuhi kondisi simetri yaitu jika [9]:

SSIM (x,y) = SSIM (y,x) (2.12)

2.11 Parameter Kualitas Jaringan

Terdapat beberapa faktor yang mempengaruhi kualitas video streaming, yaitu waktu tunda (delay), throughput, packet loss. Ukuran dan pengalokasian kapasitas jaringan juga mempengaruhi kualitas real time video streaming secara keseluruhan. Berikut penjelasan dari beberapa faktor tersebut [17].

2.11.1 Waktu Tunda (Delay)

Waktu tunda (delay) adalah waktu tunda saat paket yang diakibatkan oleh

proses transmisi dari satu titik lain yang menjadi tujuannya. Waktu tunda

mempengaruhi kualitas layanan (QoS) karena waktu tunda menyebabkan suatu

paket lebih lama mencapai tujuan. ITU-T G.114 merekomendasikan waktu tunda

tidak lebih besar dari 150 ms untuk berbagai aplikasi, dengan batas 300 ms untuk

komunikasi suara yang masih dapat diterima. Rata - rata delay diperoleh dari jumlah

(25)

Rata − rata =_{Banyak paket (2.13)}Jumlah

keterangan :

Jumlah delay = total delay pengiriman paket

Banyak paket = banyaknya paket yang diterima

ITU G.1010 membagi karakteristik waktu tunda berdasarkan tingkat

kenyamanan user, dapat ditunjukkan pada Tabel 2.2 [17] :

Tabel 2.2 Pengelompokan Waktu Tunda berdasarkan ITU-T G.114

Ada beberapa komponen waktu tunda yang terjadi dijaringan. Komponen

waktu tunda tersebut yaitu waktu tunda pemprosesan, waktu tunda paketisasi,

waktu tunda propagasi dan waktu tunda akibat adanya jitter buffer diterminal penerima. Berikut ini penjelasan mengenai beberapa jenis waktu tunda yang dapat

mempengaruhi kualitas layanan [17] :

1. Waktu tunda pemrosesan.

2. Waktu tunda yang terjadi akibat proses pengumpulan dan pengkodean

sampel analog menjadi digital.

3. Waktu tunda paketisasi, waktu tunda ini terjadi akibat proses paketisasi

sinyal suara menjadi paket-paket yang siap ditransmisikan ke dalam

jaringan.

4. Waktu tunda antrian, waktu tunda yang disebabkan oleh antrian paket

data terjadinya kongesti jaringan.

Waktu Tunda Kualitas

0-150 ms Baik

150-300 ms Cukup, masih dapat diterima

(26)

5. Waktu tunda propagasi, waktu tunda ini disebabkan oleh medium fisik

jaringan dan jarak yang harus dilalui olah sinyal suara pada media

transmisi data antara pengirim dan penerima.

6. Waktu tunda akibat jitter buffer, waktu tunda ini terjadi akibat jitter buffer

yang digunakan untuk meminimalisasi nilai jitter yang terjadi.

2.11.2 Throughput

Throughput adalah bandwidth aktual yang terukur pada suatu ukuran waktu tertentu. Throughput lebih menggambarkan bandwidth yang sebenarnya (actual) pada suatu waktu tertentu yang digunakan untuk men-download suatu file dengan ukuran tertentu. Adapun Rumus yang digunakan untuk menghitung

throughput adalah [17]:

ℎ ℎ = total _{durasi n (2.14)}

Keterangan:

Bytes = jumlah bit yang dikirim Duration = total waktu pengiriman paket

2.11.3 Packet Loss

Packet loss adalah jumlah paket data yang hilang per detik. Packet loss dapat disebabkan oleh sejumlah faktor, mencakup penurunan signal dalam media

jaringan, melebihi batas saturasi jaringan, paket yang corrupt yang menolak untuk

transit, dan kesalahan keras jaringan. Paket hilang dapat disebabkan oleh

pembuangan paket di jaringan (network loss) atau pembuangan paket di gateway

(27)

disebabkan kemacetan (router buffer overflow), perubahan rute secara seketika, kegagalan link, dan lossy link seperti saluran nirkabel [17].

Kemacetan atau kongesti pada jaringan merupakan penyebab utama dari

paket hilang. Pada Tabel 2.3 menyatakan tingkat paket hilang terhadap kualitas

Video.

Tabel 2.3 Standar Tingkat Paket Hilang berdasarkan ITU-T G.114

Rumus yang digunakan untuk menghitung packet loss adalah [17] :

= Paket Terkirim − Paket Diterima_{Paket Terkirim} 100% (2.15)

Tingkat paket hilang Kualitas