• Tidak ada hasil yang ditemukan

II TINJAUAN PUSTAKA. Gambar 1. Proses pembentukan protein

N/A
N/A
Protected

Academic year: 2021

Membagikan "II TINJAUAN PUSTAKA. Gambar 1. Proses pembentukan protein"

Copied!
12
0
0

Teks penuh

(1)

II TINJAUAN PUSTAKA

2.1 Struktur Protein

Protein merupakan bagian yang sangat penting pada setiap makhluk hidup. Proses untuk mendapatkan protein dinamakan dengan translasi. Setiap makhluk hidup memiliki kode genetik yaitu DNA (deoxyribonucleic acid) yang tersusun dari basa nitrogen adenin (A), guanin (G), thymine (T) dan cytosine (C). Melalui proses transkripsi, DNA tersebut ditranskripsikan menjadi RNA (ribonucleic acid). RNA mengalami proses translasi untuk kemudian menghasilkan protein (Jones dan Pevzner 2004). Secara ringkas proses terbentuknya protein dapat dilihat pada Gambar 1.

Gambar 1. Proses pembentukan protein

Protein merupakan elemen dasar dari suatu organisme yang dibentuk dari asam amino. Terdapat 20 asam amino dengan struktur kimia yang berbeda (Polanski dan Kimmel 2007). Susunan asam amino pembentuk protein dapat dilihat pada Tabel 1.

Asam amino tersebut terbentuk dari tiga huruf (triplet) dari kombinasi Asam Deoksirobosa (DNA) yang disebut dengan codon. Codon triplet pembentuk protein dapat dilihat pada Tabel 2. Satu protein protein terdiri atas sejumlah sekuens asam amino. Ilustrasi dari pembentukan satu protein berdasarkan sekuensnya dapat dilihat pada Gambar 2.

translasi transkripsi

(2)

DNA : TAC CGC GGC TAT TAC TGC CAG GAA GGA ACT RNA : AUG GCG CCG AUA AUG ACG GUC CUU CCU UGA Protein : Met Ala Pro Ile Met Thr Val Leu Pro Stop

Gambar 2. Contoh urutan asam amino pembentuk suatu protein

Gambar 2 merupakan ilustrasi proses pembentukan protein mulai dari urutan sekuens DNA sampai dengan proses translasi yang dapat menghasilkan suatu protein.

Tabel 1. Asam amino, singkatan, simbol dan karakteristik Asam Amino Singkatan Simbol Karakteristik Alanine Ala A Nonpolar, hydrophobic Arginine Arg R Polar, hydrophilic Asparagine Asn N Polar, hydrophilic Aspartic acid Asp D Polar, hydrophilic Cystein Cys C Polar, hydrophilic Glutamine Gln Q Polar, hydrophilic Glutamic acid Glu E Polar, hydrophilic Glycine Gly G Polar, hydrophilic Histidine His H Polar, hydrophilic Isoleucine Ile I Nonpolar, hydrophobic Leucine Leu L Nonpolar, hydrophobic

Lysine Lys K Polar, hydrophilic

Methionine Met M Nonpolar, hydrophobic Phenylalanine Phe F Nonpolar, hydrophobic Proline Pro P Nonpolar, hydrophobic

Serine Ser S Polar, hydrophilic

Threonine Thr T Polar, hydrophilic Tryptophan Trp W Nonpolar, hydrophobic Tyrosine Tyr Y Polar, hydrophilic

(3)

Tabel 2. Codon pembentuk protein U C A G U UUU Phe UUC Phe UUA Leu UUG Leu UCU Ser UCC Ser UCA Ser UCG Ser UAU Tyr UAC Tyr UAA Stop UAG Stop UGU Cys UGC Cys UGA Stop UGG Trp C CUU Leu CUC Leu CUA Leu CUG Leu CCU Pro CCC Pro CCA Pro CCG Pro CAU His CAC His CAA Gln CAG Gln CGU Arg CGC Arg CGA Arg CGG Arg A AUU Ile AUC Ile AUA Ile AUG Met ACU Thr ACC Thr ACA Thr ACG Thr AAU Asn AAC Asn AAA Lys AAG Lys AGU Ser AGC Ser AGA Arg AGG Arg G GUU Val GUC Val GUA Val GUG Val GCU Ala GCC Ala GCA Ala GCG Ala GAU Asp GAC Asp GAA Glu GAG Glu GGU Gly GGC Gly GGA Gly GGG Gly

Struktur protein terdiri atas struktur primer, struktur sekunder dan struktur tersier ( Polanski dan Kimmel 2007). Struktur primer dari suatu protein adalah rangkaian asam amino pembentuknya di sekitar rantai polipeptida. Database Bioinformatics memiliki 3 x 106 atau 3.000.000 sekuens asam amino dari protein. Struktur primer ini yang dibentuk dari hasil translasi DNA sampai menjadi codon. Hormon merupakan contoh protein yang dapat dilihat dari susunan asam aminonya. Sebagai contoh, prolaktin adalah salah satu hormon pertumbuhan yang dimiliki setiap makhluk hidup. Gambar 3 adalah contoh asam amino dari hormon prolaktin pada manusia.

(4)

(b)

(a) (c) 

Gambar 3. Contoh susunan asam amino hormon prolaktin pada manusia

Struktur sekunder adalah struktur protein yang ditentukan oleh bentuk alpha-helix (H), betha-sheet (B) dan coil (C) penyusunnya. Struktur sekunder diperoleh dari sekuens asam amino, yang terikat dengan ikatan péptida. Dari sekuens asam amino tersebut, akan membentuk tiga kemungkinan segmen yaitu alpha-helix (H) yang bentuknya berpilin, betha-sheet (B) yang bentuknya lurus atau coil (C). Contoh bentuk ketiganya dapat dilihat pada Gambar 4. Gambar struktur sekunder protein tersebut didapatkan dengan menggunakan perangkat lunak RasMol Versi 2.7.4.2 sebagai perangkat lunak untuk memodelkan struktur protein yang bersifat free software.

Gambar 4. Gambar struktur sekunder protein : (a). alpha-helix (H), (b). betha-sheet (b) dan (c). coil (c)

Struktur tersier protein adalah struktur sekunder protein yang mengalami pelipatan atau dikenal dengan istilah melakukan folding protein. Struktur tersier protein terjadi dengan adanya interaksi untaian rantai alpha-helix, betha-sheet dan coil yang kemudian melakukan proses pelipatan (Lesk 2002). Bentuk struktur

(5)

tersier protein seperti dilihat pada Gambar 5 dengan menggunakan perangkat lunak RasMol Versi 2.7.4.2 .

Gambar 5. Struktur tersier protein

Data struktur tersier protein dapat diperoleh dari suatu database yang bernama Protein Data Bank (PDB). Dari data ini protein dapat divisualisasikan dalam bentuk tiga dimensi. Fungsi protein akan terlihat apabila sudah melakukan pelipatan atau protein folding. Protein merupakan molekul kompleks dengan struktur tiga dimensi (3D) yang dikenal dengan struktur tersier. Namun, demikian struktur kompleks tersebut dibangun dari struktur primer yang terdiri atas sekuens asam amino pembentuknya ( Polanski dan Kimmel 2007).

2.2 Prediksi Struktur sekunder protein

Struktur sekunder protein merupakan tahap awal dari proses prediksi struktur tiga dimensi (3D) suatu protein. Prediksi struktur sekunder protein bertujuan untuk mendapatkan informasi segmen alpha-helix (H), betha-sheet (B) atau coil (C) dari untaian asam amino primer yang membentuknya.

Struktur Protein dapat diprediksi dengan beberapa cara. Cara pertama adalah dengan melakukan eksperimen secara kimiawi menggunakan X-Ray

(6)

Crystallography dan Nuclear Magnetic Resonance (NMR) spectroscopy. (Albert

et al. 2007). Cara ini akan menghasilkan struktur protein secara tepat dan sangat

memungkinkan menghasilkan struktur baru. Cara kedua adalah dengan pendekatan heuristic yaitu dengan comparative modelling yang hasilnya berupa prediksi. Prediksi struktur protein dengan menggunakan pendekatan heuristik ini, tidak akan menghasilkan penemuan struktur protein baru karena pendekatan ini hanya melakukan perbandingan antara data yang kita miliki dengan model yang sudah ada.

2.3 Hidden Markov Model (HMM)

Hidden Markov Model (HMM) merupakan model probabilistik yang dapat diaplikasikan untuk menganalisis model deret waktu atau sekuens linear (Eddy 1998). Pada sekitar tahun 1990, untuk membandingkan dua buah sekuens data biologi baik DNA atau RNA digunakan perbandingan pasangan antara dua sekuens yang akan disamakan. Namun, terdapat kendala yang ada apabila dua sekuens tersebut tidak sama di samping kesulitan apabila adanya sekuens baru (Baldi dan Brunak 2001). HMMs adalah salah satu pendekatan yang digunakan untuk memodelkan kumpulan sekuens tersebut. HMMs telah banyak dikembangkan pada banyak permasalahan seperti speech recognition (Rabiner 1989).

Menurut Rabiner (1989), aplikasi pada HMMs pada akhirnya akan direduksi untuk menyelesaikan tiga jenis permasalahan, yaitu :

1. Jika diberikan suatu model λ=(A,B,π), bagaimana menghitung peluang dari sukuens observasi O = O1,O2,...OT yang dinotasikan dengan P(O|λ)

2. Jika diberikan suatu model λ=(A,B,π), bagaimana memilih state sekuens I = I1,I2,...IT sehingga P(O,I|λ) sebagai peluang bersama dari sekuens observasi O = O1,O2,...OT dan state sekuens tersebut memiliki nilai maksimum

3. Mendapatkan parameter model HMM yang optimal sehingga peluang suatu observasi memiliki nilai maksimum,

(7)

dengan

λ

adalah model HMM

A adalah Matriks peluang transisi, B adalah Matriks peluang emisi dan

π

adalah Matriks peluang awal / Matriks priority

O = O1,O2,...OT adalah variabel observasi

λ) |

P(O adalah peluang variabel observasi jika diberikan model

Hidden Markov Model (HMMs) menggambarkan distribusi peluang dari sejumlah sekuens yang tidak terbatas (Eddy 1998). Nama "Hidden Markov Model" berawal dari fakta bahwasannya state dari sekuens merupakan orde pertama dari rantai Markov sebagai variabel yang tidak teramati. Adapun sekuens dari simbol (seperti A,C,G,T/U) merupakan variabel yang secara langsung dapat diobservasi. Pada kasus analisis sekuens dari data biologi, state sekuens akan berasosiasi dengan label biologis yang bermakna (seperti: struktur pada posisi lokus 42) (Eddy 1998).

2.4 Algoritme Baum-Welch

Algoritme Baum-Welch merupakan salah satu algoritme yang digunakan untuk melakukan pelatihan dalam melakukan estimasi parameter model dari HMMs yang dinotasikan sebagai . Algoritme ini mampu melakukan perbaruan nilai Matrikss peluang transisi A, Matriks peluang emisi B dan Matriks prioritas

π . Algoritme ini disebut juga dengan nama forward-backward algorithm.

Berikut adalah prosedur Algoritme Baum-Welch (Dugad dan Desai 1996)

Inisialisasi : set nilai λ=(A,B,π). Algoritme ini akan memperbaiki

nilai λ secara iteratif sampai konvergen.

prosedur forward : definisikan αt(i)= p(O1=O1,O2,...Ot i,t=i|,λ)sebagai

peluang observasi parsial dari sekuens O1,O2,...Ot sampai dengan state ke-i pada saat t. Secara rekursif,

t(i) dapat dihitung sebagai berikut :

(8)

) (o b π = (i) αt i i 1 ………...……….………...……….………..(1)      

N = i ij t + t j + t (j)=b (o ) α(i)a α 1 1 1 . ………...….…....……(2)

prosedur backward :definisikan βt(i)= P(Ot+1,Ot+2,...,OT |it = i,λ)adalah

peluang observasi parsial sekuens dari t + 1 sampai T dengan state i pada saat t dan model λ . Secara efisien dapat dihitung :

1 = (i) βT , 1iN ………...………...…...(3)

N = j + t + t j ij t(i) = a b (o (j) β 1 1 1 ...(4)

Dengan menggunakan α dan β , akan ditentukan dua variabel, yaitu γt(i) dan

j) (i,

ξt dengan persamaan sebagai berikut:

           

N = i t t t t t (i) (i) β α (i) (i) β α = (i) γ 1 ...(5)

 

N = i N = j + t j + t ij t + t j + t ij t t ) (o (j)b β (i)a α ) (o (j)b β (i)a α = j) (i, ξ 1 1 1 1 1 1 ...(6)

Dengan mengasumsikan model saat inisialisasi adalah λ=(A,B,π), maka, update nilai baru untuk mereestimasi parameter adalah:

(i) γ = πi 1 , 1 i N …...(7)

  1 1 1 1 T = t t T = t t ij

(i)

γ

j)

(i,

ξ

=

a

, 1 iN , 1 jN …...(8)

(9)

   T = t t T vk O t t j (i) γ (i) γ k b t 1 1 ) ( 1 jN , 1kM …...(9) dengan

λ

adalah model HMM

A adalah matriks peluang transisi, B adalah matriks peluang emisi dan

π

adalah matriks peluang awal / matrik priority

O = O1,O2,...OT adalah variabel observasi

λ) |

P(O adalah peluang variabel observasi jika diberikan model

λ

) (i

t

adalah peluang parsial dari sekuens observasi O1, O2,… Ot sampai dengan

state ke-i pada saat ke-t (i)

βT adalah peluang parsial dari sekuen dari t + 1 sampai dengan T (dimana T

= t-1) pada state ke-i pada saat t

2.5 Algoritme Viterbi

Algoritme Viterbi digunakan untuk mendapatkan state yang optimal sehingga peluang suatu observasi adalah yang paling maksimal. Berikut adalah langkah-langkah algoritme Viterbi.

Inisialisasi

……… ………...………..(10) Proses rekusif

untuk dan

(10)

Terminasi

………(12)

Proses menemukan kemungkinan nilai peluang paling besar dari suatu observasi yang berakhir pada saat t = T

Backtracking

sehingga , …….(13)

Membaca (decoding) path sekuens terbaik dari vektor

2.6 Hidden Semi Markov Model

Hidden Semi Markov Model (HSMM) adalah bentuk perluasan dari Hidden Markov Model (HMM) yang mempertimbangkan durasi suatu observas terhadap state yang dimiliki. Pada HSMM, panjang durasi D pada suatu state secara eksplisit dinyatakan sehingga dinamakan juga dengan HMM dengan durasi variabel (Yu 2009). State durasi atau D merupakan varibel acak yang memiliki nilai integer D = {1, 2, 3… D}. Peluang panjang durasi P(d) adalah peluang panjang durasi suatu state dengan panjang tertentu. Bentuk umum dari Hidden Semi Markov Model seperti yang dilihat pada Gambar 6 (Yu 2009)

(11)

Gambar 6. Bentuk umum HSMM (Yu 2009)

Pada HSMM terlihat bahwa suatu state dapat membangitkan lebih dari satu observasi atau bahkan sejumlah sekuens observasi. Sepanjang observasi T, setiap state pada HSMM akan memiliki panjang durasi state dengan nilai tertentu. Pada prediksi struktu protein sekunder observasi ini merupakan sekuens dari asam amino yang membentuk protein sedangkan state adalah struktur protein yang akan diidentifikasi atau diprediksi. Berikut ini adalah tahap algoritme pada HSMM (Yu dan Kobayashi 2006)

Proses Forward

(12)

Proses Backward

Penentuan State Optimal

Gambar

Gambar 2. Contoh urutan asam amino pembentuk suatu protein
Tabel  2.  Codon pembentuk protein   U  C A G  U  UUU  Phe UUC  Phe  UUA  Leu  UUG  Leu  UCU  Ser UCC  Ser UCA  Ser UCG  Ser  UAU  Tyr UAC  Tyr  UAA  Stop UAG  Stop  UGU  Cys UGC  Cys  UGA  Stop UGG  Trp  C  CUU  Leu CUC  Leu  CUA  Leu  CUG  Leu  CCU  Pro
Gambar 3. Contoh susunan asam amino hormon prolaktin pada manusia
Gambar 5. Struktur tersier protein
+2

Referensi

Dokumen terkait

Protein dibuat dari satu atau lebih rantai polipeptida yang terdiri dari banyak asam.. amino yang dihubungkan oleh

Daging merupakan sumber protein yang tinggi, protein ini disebut sebagai asam amino esensial, asam amino ini sangat penting dan merupakan protein yang.. dibutuhkan

lebih sumber protein yang berbeda jenis asam amino pembatasnya akan saling. melengkapi

Asam amino non-esensial adalah asam amino yang dapat disintesis tubuh yang sehat dalam jumlah yang cukup, sedangkan asam amino esensial adalah asam amino yang tidak dapat

Albumin dari Putih Telur Ayam dengan Proses Dialisis dan Pengeringan Struktur sekunder protein adalah struktur tiga dimensi lokal dari berbagai rangkaian asam amino pada

Amonia dapat dikombinasikan dengan asam organik alfa-keto membentuk asam amino baru yang dapat dipakai untuk mensintesis protein mikrobia dan amonia dapat diabsorbsi melalui

Protein yang mempunyai distribusi asam amino esensial serupa dengan protein dalam tubuh manusia, akan lebih bermanfaat, atau berkualitas lebih baik dari pada protein lain yang

Tidak semua asam amino yang terdapat dalam molekul protein dapat dibuat dalam tubuh kita, bila ditinjau dari segi pembentukannya asam amino dibagi ke dalam dua