BAB II
DASAR TEORI
2.1 Video streaming
Video streaming adalah sekumpulan dari gambar yang dikirimkan dalam bentuk yang telah dikompresi melalui suatu jaringan dan ditampilkan oleh player
ketika video tersebut telah diterima oleh user yang membutuhkan. Player merupakan aplikasi khusus yang melakukan dekompresi data berupa video. Sebuah
player dapat berupa sebuah perangkat lunak atau bagian dari browser.
Media streaming telah ada selama 70 tahun. Media streaming dapat berupa video ataupun audio. Pertama kali video diolah dan ditransmisikan dalam bentuk
analog. Munculnya digital IC (Integrated Circuit) dan berkembangnya komputer
telah membantu terbentuknya video digital, salah satu penerapan video digital yang
digunakan dalam transmisi pada jaringan komputer adalah video streaming . Streaming dapat dianggap sebagai bagian dari webcasting, namun streaming tidak harus menggunakan web. Aliran data dapat disampaikan melalui wireless jaringan
atau intranet pribadi [6].
2.2 Coder dan Decoder
CODEC (Coder-Decoder) adalah suatu metode yang digunakan untuk
melakukan sampling terhadap sinyal analog kemudian sebelum ditransmisikan sinyal analog tersebut dikonversi ke dalam bit-bit digital, lalu mengubahnya
kembali agar dapat digunakan. CODEC mempunyai fungsi untuk mengecilkan
kemudian mengembalikannya keukuran semula (decompress). Prosedur
pengiriman video terkompresi ditunjukkan pada Gambar 2.1 [6].
Gambar 2.1 Prosedur Pengiriman Data Video Terkompresi [6]
CODEC digunakan untuk menghemat bandwidth. Namun, resikonya suara
dan gambar yang dihasilkan menjadi kurang jernih. Terdapat 2 jenis CODEC, yaitu
lossy CODEC dan lossless CODEC. Berikut ini akan dibahas jenis CODEC tersebut.
2.2.1 Lossy CODEC
Lossy CODEC merupakan jenis kompresi dengan melakukan pengurangan ukuran data dari data yang sebenarnya. Banyak CODEC yang popular termasuk
dalam katagori ini. CODEC ini akan mengurangi kualitas data. Biasanya CODEC
ini digunakan untuk menyimpan data pada media penyimpanan yang berukuran
terbatas seperti CD-ROM dan DVD.
2.2.2 Lossless CODEC
Berbeda halnya dengan kompresi Losy CODEC, Lossless CODEC
merupakan jenis kompresi tanpa terjadi pengurangan data. Akibatnya, ukuran data
sering digunakan pada video yang masih memerlukan editing atau penggunaan dalam aplikasi kedokteran yang harus menampilkasn citra asli.
2.3 Kompresi Video
Ada banyak redudansi dalam sinyal video digital. Secara rinci, terdapat
korelasi yang besar antara piksel tetangga (spasial) dan frame berikutnya (temporal). Redundansi berarti informasi yang umum ditemukan pada lebih dari
satu gambar atau video. Gambar 2.2 menunjukkan data video berdasarkan spatial
dan temporal [7].
Gambar 2.2 Spatial dan Temporal Dari Urutan Suatu Gambar [7]
Banyak teknik pengkodean kompresi video telah dikembangkan untuk
mengurangi redudansi diantaranya adalah transform coding, entropi coding, loop
filter, dll.. Gambar 2.3 mengilustrasikan garis waktu untuk teknik kompresi [8].
2.4 Standar Kompresi Video
ITU-T (International Telecommunication Union – Telecommunication
Sector) membuat beberapa standar yang direkomendasikan untuk kompresi video. Beberapa standar tersebut diantaranya adalah H.261,H.263,H.264, dan H.265.
Berikut akan dibahas jenis standar tersebut:
2.4.1 Kompresi H.261
Standar H.261 adalah standar yang diterbitkan oleh ITU-T pada tahun 1990. Standar H.261 didesain untuk kompresi video yang akan ditansmisikan melalui jaringan ISDN (Integrated Services Digital Network) dengan bandwidth sebesar px64 Kbit/s, dimana p berkisar antara 1 sampai 30. Gambar 2.4
menunjukkan komponen utama yang digunakan untuk code dan decode bitstreams
H.261 berdasarkan dokumentasi ITU [9].
Gambar 2.4 Blok Diagram H.261 Menurut Rekomendasi ITU [9]
H.261 di rancang untuk pengiriman video melalui jaringan ISDN (Integrated Services Digital Network) yang merupakan standar video coding yang dibuat oleh CCITT (Consultative Commitee for International Telephone and Telegraph).
H.261 merekomendasikan sebuah standar coding untuk pengiriman data dengan kelipatan m x 384Kbps (m=1,2,..5) dan dirancang untuk video conference.
Kecepatan bitrate antara p x 64 Kbps. Dimana p adalah frame rate (antara 1 sampai
30). Susunan frame H.261 berurutan dimana tiap - tiap 3 buah frame (I) dibatasi
dengan 1 buah interframe (P) [9].
2.4.2 Kompresi H.263
Pada Februari 1995 ITU-T SG15 mengeluarkan standar H.263 yang dirancang untuk penggunaan komunikasi bitrate namun tidak pernah berjalan dengan baik ketika melalui jaringan POTS (Plain Old Telephone Service). Standar
H.263 telah menggantikan standar H.261 untuk video conference dibeberapa aplikasi yang mendominasi standarisasi untuk beberapa aplikasi internet video streaming sekarang ini.
Prinsip kerja H.263 yaitu video frame akan ditangkap di sumber / pengirim
dan di encode (dikompresi) dengan video encoder. File video yang terkompres kemudian dikirimkan melalui jaringan atau saluran telekomunikasi dan di decode
(dekompresi) menggunakan video decoder. Frame yang di decode ini yang kemudian akan di tampilkan.
Pada saat ini, cukup banyak standar yang ada, masing-masing di desain
untuk keperluan tertentu. Masing-masing standar pun memiliki prinsip kerja yang
Gambar 2.5 Blok Diagram H.263 [9]
2.4.3 Kompresi H.264
CODEC H.264 dapat melakukan proses decoding secara lengkap, inverse
transform untuk menghasilkan sebuah urutan video yang telah di-encode. Encoder pada H.264 menggunakan prediksi intra-frame atau estimasi gerak untuk memprediksi piksel dari setiap blok gambar.
Prediksi intra-frame menggunakan piksel blok tetangga untuk memprediksi
piksel dari blok saat ini. Perbedaan antara piksel diprediksi dan piksel yang
sebenarnya berubah menjadi domain frekuensi, menghasilkan blok koefisien
frekuensi. koefisien ini terkuantisasi, dan bitstream output dikompresi menggunakan pengkodean entropy.
Gambar 2.6 Blok Diagram H.264 [10]
2.4.4 Kompresi H.265
H.265 atau High Efficiency Video Coding (HEVC) merupakan CODEC yang mimilii kualitas video yang setara dengan CODEC yang ada saat ini yaitu
H.264 namun hanya membutuhkan setengah bandwidth dari CODEC lama tersebut.
Cara Kerja H.265 ini sama seperti H.264 dan Mpeg-2, H.265 menggunakan
3 jenis frame yaitu : I-,B-,dan P-frame dalam sekumpulan gambar, menggabungkan
ke dua elemen kompresi intra dan inter frame. Efesiensi yang diterapkan pada H.265 diantaranya mengunakan coding tree block (CTB) dan intra prediction direction [1]. Untuk lebih jelasnya, dapat dilihat sebagai berikut.
1. Coding Tree Blocks, sebelumnya H.264 menggunakan macro block dengan ukuran maksimalnya yaitu 16x 16 pixel. Dengan CTB, ukuran maksimal standar H.265 ialah 64 x 64 piksel. Gambar 2.7 memperlihatkan perbedaan
Gambar 2.7 Perbandingan Macro Block (a) dan Tree Block (b) [1]
2. Lebih banyak intra prediction direction, H.264 menggunakan 9 intra prediction
direction sedangkan H.265 menggunakan lebih dari 35 intra prediction direction. Gambar 2.8 memperlihatkan perbedaan antara intra prediction direction pada CODEC H.264 dengan H.265 [1].
(a) (b)
Gambar 2.8 Intra Prediction Direction H.265 (a) dan H.264 (b) [1]
Pembahasan secara singkat di atas dapat diilustrasikan menggunakan
Gambar 2.9 Blok Diagram CODEC H.265 [1]
2.5 Konsep Kompresi Interframe
Kompresi interframe merupakan kompresi yang terpenting saat proses
kompresi video. Konsep dasar kompresi interframe menggunakan redudansi
temporal yang terdapat dalam sekelompok frame. Metode yang digunakan adalah
sebagai berikut:
2.5.1 Prediksi Dari Frame Video Sebelumnya (Difference Coding)
Metode paling sederhana dari prediksi temporal adalah dengan
menggunakan frame sebelumnya sebagai prediktor untuk frame sekarang. Dua frame berturut-turut dari urutan video yang ditampilkan pada Gambar 2.10 dan Gambar 2.11. Frame 1 digunakan sebagai prediktor untuk residu frame 2 yang dibentuk dengan mengurangkan prediktor (frame 1) dengan frame sekarang (frame
Gambar 2.10 Frame ke-1 [7]
Gambar 2.11 Frame ke-2 [7]
Gambar 2.12 Selisih Besar Piksel Pada Gambar 2.10 dan Gambar 2.11 [7]
2.5.2 Estimasi Dan Kompensasi Gerak
Perubahan antara frame video dapat disebabkan oleh gerakan objek misalnya sepeda yang bergerak, lengan bergerak, kamera motion (panning, tilt, zoom, rotasi), dan perubahan pencahayaan. Perubahan pergerakan tersebut memungkinkan untuk memperkirakan lintasan setiap pixel video, medan lintasan
Gambar 2.13 menunjukkan medan aliran optik untuk frame dari Gambar 2.10 dan Gambar 2.11 [7].
Gambar 2.13 Medan Aliran Optik [7]
Jika medan aliran optik secara akurat dikenal, dimungkinkan membentuk
prediksi yang akurat dari sebagian besar piksel frame dengan memindahkan setiap
pixel dari kerangka acuan di sepanjang vektor aliran optik. Untuk membentuk kompensasi gerak yang akurat dibutuhkan komputasi secara intensif .
Estimasi gerak ( motion estimation ) merupakan teknik kompresi interframe yang memprediksi sebuah frame dari frame sebelumnya ( reference frame ), dengan mengestimasi gerakan blok – blok antar frame tersebut. Frame dibagi menjadi blok – blok yang tidak overlap. Tiap blok dibandingkan dengan blok – blok berukuran sama, pada frame sebelumnya dengan melakukan pencocokan blok ( block matching ). Dalam melakukan pencocokan tersebut, lokasi
dari blok yang paling mirip pada frame referensi (reference frame) berbeda dari lokasi blok target (target block). Perbedaan relatif posisi ini disebut vektor gerak
Gambar 2.14 Vektor gerak [7]
Vektor geraknya bernilai nol jika posisi blok target dan blok yang match sama. Ketika mengkodekan tiap blok dari frame yang diprediksi, vektor gerak yang
menunjukkan posisi blok yang match pada frame referensi, dikodekan pada posisi
blok yang match pada frame referensi, dikodekan pada posisi target blok itu sendiri,
maka terjadi kompresi, karena jumlah bit yang diperlukan untuk mengkodekan vektor gerak lebih sedikit daripada untuk mengkodekan suatu blok secara utuh.
Pada dekompresi, dekoder menggunakan vektor gerak untuk menemukan
matching block pada frame referensi dan menyalin matching block tersebut ke posisi yang sesuai pada frame yang sedang diprediksi. Dengan demikian, suatu frame prediksi tersusun atas blok – blok dari frame sebelumnya.
2.6 Konsep Kompresi Intraframe
Selain kompresi interframe dibutuhkan kompresi intraframe untuk melakukan kompresi pada bidang spatial. Konsep dasar kompresi intraframe menggunakan redudansi spatial yang terdapat dalam sekelompok block di dalam satu frame. Beberapa teknik intraframe di antaranya discrete cosine transform dan
2.6.1 Discrete Cosine Transform ( DCT )
Prinsip dasar yang dilakukan dengan Discrete Cosine Transform ( DCT ) adalah mentransformasikan data dari domain ruang ke domain frekuensi. Discrete
Cosine Transform (DCT) beroperasi pada X (blok N × N sampel) dan menghasilkan
matrik Y. DCT dapat dirumuskan sebagai berikut [7]:
Y = AXAT (2.1)
Untuk mencari elemen dari matrik A dapat menggunakan persamaan berikut [7]:
Aij = Ci ( ) (2.3)
dimana:
Ci = ( = 0) (2.4)
Ci= ( > 0) (2.5)
Persamaan 2.1 dan 2.2 dapat ditulis dalam bentuk penjumlahan yaitu [7]:
=
∑
∑
cos
( )cos
( )(2.6)
=
∑
∑
cos
( )cos
( ) (2.7)2.6.2 Kuantisasi
diterapkan pada keluaran proses DCT. Kuantisasi dilakukan dengan membagi
keluaran proses DCT dengan suatu nilai yang ditetapkan dalam matriks kuantisasi
atau disebut quantum. Kuantisasi uniform secara umum dapat dirumuskan dengan
[7]:
Entropy encoder mengkonversi serangkaian simbol yang mewakili unsur urutan video menjadi bitstream terkompresi yang cocok untuk transmisi atau penyimpanan. Beberapa teknik entropy coder antara lain Huffman coding dan context adaptive binary arithmetic coding:
2.7.1 Huffman Coding
Kode Huffman pada dasarnya merupakan kode prefiks (prefix code). Kode
prefiks adalah himpunan yang berisi sekumpulan kode biner, dimana pada kode
prefik ini tidak ada kode biner yang menjadi awal bagi kode biner yang lain. Kode
prefiks biasanya direpresentasikan sebagai pohon biner yang diberikan nilai atau
label. Untuk cabang kiri pada pohon biner diberi label 0, sedangkan pada cabang
Rangkaian bit yang terbentuk pada setiap lintasan dari akar ke daun
merupakan kode prefiks untuk karakter yang berpadanan. Pohon biner ini biasa
disebut pohon Huffman. Langkah-langkah pembentukan pohon Huffman adalah
sebagai berikut [11] :
1. Baca semua karakter di dalam teks untuk menghitung frekuensi kemunculan
setiap karakter. Setiap karakter penyusun teks dinyatakan sebagai pohon
bersimpul tunggal. Setiap simpul di-assign dengan frekuensi kemunculan
karakter tersebut.
2. Terapkan strategi algoritma greedy sebagai berikut : Gabungkan dua buah
pohon yang mempunyai frekuensi terkecil pada sebuah akar. Setelah
digabungkan akar tersebut akan mempunyai frekuensi yang merupakan
jumlah dari frekuensi dua buah pohon-pohon penyusunnya.
3. Ulangi langkah 2 sampai hanya tersisa satu buah pohon Huffman. Agar
pemilihan dua pohon yang akan digabungkan berlangsung cepat, maka
semua yang ada selalu terurut menaik berdasarkan frekuensi.
2.7.2 Context Adaptive Binary Arithmetic Coding (CABAC)
CODEC H.261 dan CODEC H.263 menggunakan Huffman Coding untuk
pembentukan bitstream. Sedangkan context-based adaptive binary aritmethic coding (CABAC) digunakan pada CODEC H.265 dan CODEC H.264.
Gambar 2.15 Blok Diagram CABAC [1]
CABAC terdiri atas 3 bagian coding yaitu binarization, context modeling, binary
aritmethic [1].
1. Binarization Pengurangan alphabet dilakukan oleh binarization untuk tiap non binary element menghasilkan suatu intemediate unik codeword biner untuk unsur sintaksis yang ditentukan yang disebut bin string.
2. Context modeling digunakan untuk membersihkan interface antara modeling dan model. Setiap distribusi model akan diberi simbol yang kemudian didalam langkah coding selanjutnya, memandu coding engine to
generate suatu urutan bit sebagai code pada simbol menurut distribusi model.
3. Binary Arimethic Coding adalah berdasarkan pada prinsip pengulangan interval [lower, upper) yang melibatkan operasi perkalian dasar dan juga
2.8 Bitrate Video
Bitrate video adalah jumlah jumlah bit yang diproses per satu satuan waktu. Bitrate video dapat dikatakan dengan transfer speed, kecepatan koneksi, bandwidth, throughput maksimum. Bitrate juga bisa diartikan sebagai jumlah bit yang diproses dalam satu satuan waktu untuk mewakili media seperti video dan
audio setelah dilakukan kompresi. Satuannya adalah bit per second (bps). Kualitas
video diatur dalam proses encoding videonya. Semakin tinggi bitrate maka akan semakin banyak informasi data videonya. Oleh karena itu, gambar akan menjadi
semakin baik kedalaman warnanya [12].
2.9 Konsep TCP/IP
Protokol streaming adalah sebuah aturan untuk membimbing sebuah aktifitas pertukaran data informasi. Adapun tujuannya adalah sebagai standarisasi
komunikasi antara streaming sever dan streaming client .
Transmision control protokol/internet protokol (TCP/IP) pertama kali diperkenalkan olah Departement of Defence (DoD.TCP/IP) menjadi protokol komunikasi data yang fleksibel dan dapat diterapkan dengan mudah dari setiap jenis
komputer dan interface jaringan, karena perubahan pada protokol yang sehubungan
dengan interface jaringan saja. TCP/IP memiliki 4 layer yang terdiri dari [6] :
1. Application Layer
Layer ini mengintegrasikan berbagai macam aktivitas dan tugas-tugas yang melibatkan fokus dari layer OSI yaitu Application, Presentation dan Session.
2. Transport Layer
Layer ini sejalan dengan layer transport di model OSI. Layer ini mendefinisikan protokol untuk mengatur tingkat layanan transmisi untuk
aplikasi. Layer ini juga menangani masalah seperti menciptakan komunikasi end to end yang handal dan memastikan data bebas dari kesalahan saat pengiriman, serta menangani urutan paket dan menjaga integritas data.
3. Internet Layer
Layer ini setara dengan layer network dalam OSI, yaitu mengalokasikan protokol yang berhubungan dengan transmisi logika sejauh paket keseluruh
network. Layer ini menjaga pengalamatan host dengan memberikan alamat IP dan menangani routing dari paket yang melalui beberapa jaringan.
4. Network Access Layer
Layer ini merupakan gabungan dari layer physical dan data link di OSI. Layer ini memantau pertukaran data antara host dan jaringan, dan bertugas dalam pengalamatan dan mendefinisikan protokol untuk transmisi fisik data .
Gambar 2.16 adalah gambar susunan struktur protokol pada TCP/IP [6].
2.9.1 Internet Protocol (IP)
Internet Protocol didesain untuk interkoneksi sistem komunikasi komputer pada jaringan paket switched. Pada jaringan TCP/IP, sebuah komputer diidentifikasi dengan alamat IP yang unik karena setiap IP memiliki perbedaan. Hal
ini dilakukan untuk pengalamatan dan mencegah kesalahan pada transfer data.
Terakhir, protokol data akses berhubungan langsung dengan media fisik. Secara
umum protokol ini bertugas untuk menangani pendeteksian kesalahan pada saat
transfer data. Untuk komunikasi datanya, Internet Protokol mengimplementasikan
dua fungsi dasar yaitu addressing dan fragmentasi.
Salah satu hal penting IP dalam pengiriman informasi adalah metode
pengalamatan pengirim dan penerima. Saat ini terdapat standar pengalamatan yang
sudah digunakan yaitu IPv4 dengan alamat terdiri dari 32 bit. Jumlah alamat yang
diciptakan dengan IPv4 diperkirakan tidak dapat mencukupi kebutuhan
pengalamatan IP sehingga sekarang tersedia sistim pengalamatan baru yaitu IPv6
yang menggunakan sistim pengalamatan 128 bit [13].
2.9.2 User Datagram Protocol (UDP)
UDP yang merupakan salah satu protocol utama diatas IP dan merupakan
transport protocol yang lebih sederhana dibandingkan dengan TCP. UDP digunakan untuk situasi yang tidak mementingkan mekanisme reliabilitas dan
UDP pada video streaming digunakan untuk mengirimkan audio dan video
stream yang dikrimkan secara terus menerus. UDP digunakan pada video streaming karena pada pengiriman audio and video streaming yang berlangsung terus menerus
lebih mementingkan kecepatan pengiriman data agar tiba di tujuan. Gambar 2.17
memperlihatkan struktur pengiriman video menggunakan protokol UDP [14].
Gambar 2.17 Struktur Pengiriman Video Menggunakan Protokol UDP [14]
2.9.3 Real Time Protocol (RTP)
Protokol RTP menyediakan transfer media secara real-time pada saat pengiriman paket data. Protokol RTP mengunakan Protokol UDP dan header RTP
mengandung informasi kode bit yang spesifik pada tiap paket yang dikirimkan,
tujuannya adalah membantu penerima untuk melakukan antisipasi jika terjadi paket
yang hilang.
RTP dapat digunakan untuk beberapa macam data stream yang realtime
seperti data suara dan data video. RTP berisi informasi tipe data yang di kirim,
timestamps yang digunakan untuk pengaturan waktu suara percakapan terdengar seperti sebagaimana diucapkan, dan sequence numbers berfungsi untuk pengurutan
paket data dan mendeteksi adanya paket yang hilang. Gambar 2.18 Memperlihatkan
Gambar 2.18 Struktur Header Protokol RTP [15]
RTP didesain untuk digunakan pada tansport layer. RTP lebih baik digunakan diatas UDP bukan pada TCP. Hal ini karena TCP tidak dapat beradaptasi
pada pengerimiman data yang real-time dengan keterlambatan yang relatif kecil seperti pada pengiriman data komunikasi suara.
2.10 Parameter Kualitas Video
Dalam rangka untuk menentukan, mengevaluasi dan membandingkan
sistem komunikasi video perlu menentukan kualitas gambar video yang
ditampilkan bagi pemirsa. Saat ini sudah banyak metode yang dikembangkan untuk
melakukan pengukuran kualitas video. Pengukuran kualitas video terbagi atas
pengukuran subjektif dan objektif. Beberapa metode pengukuran video tersebut
adalah:
2.10.1 Peak Signal to Noise Ratio (PSNR)
Peak Signal-to-Noise Ratio (PSNR) adalah salah satu metode yang cukup popular digunakan dalam pengukuran kualitas video secara objektif. Metode ini
menggunakan sinyal video sebagai parameter objektif. Metode ini membandingkan
frame video pada video original (O-video) dan mengukur perbedaan keduanya. PSNR dirumuskan sebagai [16]:
= ( − ) ( . )
Dimana, 2M-1 adalah maksimum nilai piksel untuk M-bit frame video. MSE merupakan kepanjangan dari Mean Square Error. Sebagai contoh, untuk video dengan resolusi (x,y) piksel, maka MSE dihitung sebagai
= 1 ! [ ( , , ) − ′( , , )]
p(x, y, t) merepresentasikan frame video di O-video (O-frame) sedangkan p’(x, y,
t) merepresentasikan frame video di S-video (S-frame). Kualitas video yang baik ditandai dengan tingginya nilai PSNR.
Interpretasi nilai PSNR terhadap kualitas video ditampilkan pada Tabel 2.1.
Tabel ini berdasarkan rekomendasi International Telecommunication Union (ITU)
Tabel 2.1 Interpretasi Nilai PSNR terhadap Kualitas Video
Nilai PSNR Kualitas
PSNR>37dB Sangat Baik
31>PSNR>33dB Baik
25dB>PSNR>31dB Cukup
20dB>PSNR>25dB Buruk
Semakin besar nilai PSNR maka kualitas video akan semakin baik. Hal ini
dikarenakan nilai error yang diukur menggunakan MSE adalah bernilai kecil. Untuk
nilai PSNR terburuk menurut standar ITU adalah lebih kecil dari 20 dB.
2.10.2 Structural Similarity (SSIM)
Mean Square Error (MSE) atau Peak Signal-to-Noise Ratio (PSNR) yang popular digunakan, telah lama dikritik karena memiliki sedikit korelasi dengan
persepsi pengalaman human visual system (Girod 1991). Oleh karena itu, metrik yang lebih akurat yang mempertimbangkan karakteristik human visual system telah
dipelajari, termasuk SSIM (Wang et al. 2004a), Visual Informasi Fidelity (VIF) (Sheikh dan Bovik 2006), Visual Signal-to-Noise Ratio (VSNR) (Chandler dan Hemami 2007), Fitur kesamaan (FSIM) (Zhang et al. 2011), dan Gradient Magnitude Similarity Deviasi (GMSD) Dalam bagian ini (Xue et al. 2014) dll [9].
Structural similarity (SSIM) index adalah metode untuk memprediksi kualitas yang dirasakan dari video digital. SSIM pertama kali dikembangkan di
Laboratory for Image and Video Engineering (LIVE) di The University of Texas di Austin dan bekerja sama dengan New York University.
SSIM digunakan untuk mengukur kesamaan antara dua gambar. SSIM
adalah model berbasis persepsi-yang menganggap degradasi gambar sebagai
perubahan yang dirasakan dalam informasi struktural. Indeks SSIM dihitung
menggunakan rumus [8]:
( , ) =
( ( )()( ) ) (2.11)µx = rata-rata dari x
L= rentang dinamis dari nilai pixel biasanya dihitunng dengan 2bits per pixel-1
Indeks SSIM memenuhi kondisi simetri yaitu jika [9]:
SSIM (x,y) = SSIM (y,x) (2.12)
2.11 Parameter Kualitas Jaringan
Terdapat beberapa faktor yang mempengaruhi kualitas video streaming, yaitu waktu tunda (delay), throughput, packet loss. Ukuran dan pengalokasian kapasitas jaringan juga mempengaruhi kualitas real time video streaming secara keseluruhan. Berikut penjelasan dari beberapa faktor tersebut [17].
2.11.1 Waktu Tunda (Delay)
Waktu tunda (delay) adalah waktu tunda saat paket yang diakibatkan oleh
proses transmisi dari satu titik lain yang menjadi tujuannya. Waktu tunda
mempengaruhi kualitas layanan (QoS) karena waktu tunda menyebabkan suatu
paket lebih lama mencapai tujuan. ITU-T G.114 merekomendasikan waktu tunda
tidak lebih besar dari 150 ms untuk berbagai aplikasi, dengan batas 300 ms untuk
komunikasi suara yang masih dapat diterima. Rata - rata delay diperoleh dari jumlah
Rata − rata =Banyak paket (2.13)Jumlah
keterangan :
Jumlah delay = total delay pengiriman paket
Banyak paket = banyaknya paket yang diterima
ITU G.1010 membagi karakteristik waktu tunda berdasarkan tingkat
kenyamanan user, dapat ditunjukkan pada Tabel 2.2 [17] :
Tabel 2.2 Pengelompokan Waktu Tunda berdasarkan ITU-T G.114
Ada beberapa komponen waktu tunda yang terjadi dijaringan. Komponen
waktu tunda tersebut yaitu waktu tunda pemprosesan, waktu tunda paketisasi,
waktu tunda propagasi dan waktu tunda akibat adanya jitter buffer diterminal penerima. Berikut ini penjelasan mengenai beberapa jenis waktu tunda yang dapat
mempengaruhi kualitas layanan [17] :
1. Waktu tunda pemrosesan.
2. Waktu tunda yang terjadi akibat proses pengumpulan dan pengkodean
sampel analog menjadi digital.
3. Waktu tunda paketisasi, waktu tunda ini terjadi akibat proses paketisasi
sinyal suara menjadi paket-paket yang siap ditransmisikan ke dalam
jaringan.
4. Waktu tunda antrian, waktu tunda yang disebabkan oleh antrian paket
data terjadinya kongesti jaringan.
Waktu Tunda Kualitas
0-150 ms Baik
150-300 ms Cukup, masih dapat diterima
5. Waktu tunda propagasi, waktu tunda ini disebabkan oleh medium fisik
jaringan dan jarak yang harus dilalui olah sinyal suara pada media
transmisi data antara pengirim dan penerima.
6. Waktu tunda akibat jitter buffer, waktu tunda ini terjadi akibat jitter buffer
yang digunakan untuk meminimalisasi nilai jitter yang terjadi.
2.11.2 Throughput
Throughput adalah bandwidth aktual yang terukur pada suatu ukuran waktu tertentu. Throughput lebih menggambarkan bandwidth yang sebenarnya (actual) pada suatu waktu tertentu yang digunakan untuk men-download suatu file dengan ukuran tertentu. Adapun Rumus yang digunakan untuk menghitung
throughput adalah [17]:
ℎ ℎ = total durasi n (2.14)
Keterangan:
Bytes = jumlah bit yang dikirim Duration = total waktu pengiriman paket
2.11.3 Packet Loss
Packet loss adalah jumlah paket data yang hilang per detik. Packet loss dapat disebabkan oleh sejumlah faktor, mencakup penurunan signal dalam media
jaringan, melebihi batas saturasi jaringan, paket yang corrupt yang menolak untuk
transit, dan kesalahan keras jaringan. Paket hilang dapat disebabkan oleh
pembuangan paket di jaringan (network loss) atau pembuangan paket di gateway
disebabkan kemacetan (router buffer overflow), perubahan rute secara seketika, kegagalan link, dan lossy link seperti saluran nirkabel [17].
Kemacetan atau kongesti pada jaringan merupakan penyebab utama dari
paket hilang. Pada Tabel 2.3 menyatakan tingkat paket hilang terhadap kualitas
Video.
Tabel 2.3 Standar Tingkat Paket Hilang berdasarkan ITU-T G.114
Rumus yang digunakan untuk menghitung packet loss adalah [17] :
= Paket Terkirim − Paket DiterimaPaket Terkirim 100% (2.15)
Tingkat paket hilang Kualitas
0-1% Baik
1-2% Cukup
>2% Buruk
keterangan:
Paket terkirim = total paket yang terkirim