• Tidak ada hasil yang ditemukan

PREDIKSI, REKAYASA, DAN RANCANGAN STRUKTUR PROTEIN

Dalam dokumen Biokimia Struktur Dan Fungsi Biomolekul (Halaman 147-167)

ASAM AMINO DAN PEPTIDA

7. PREDIKSI, REKAYASA, DAN RANCANGAN STRUKTUR PROTEIN

Dalam waktu lebih dari 3 milyar tahun, berbagai macam molekul protein telah berevolusi menjadi mesin kompleks dari sel dan organisme. Molekul-molekul ini telah berkembang dengan perubahan acak pada gen oleh mutasi titik, exon shuffling, rekombinasi dan transfer gen antar spesies, dalam kombinasi dengan seleksi alam untuk produk gen yang telah memiliki keuntungan fungsional yang membantu dalam keselamatan organisme individu.

Jauh sebelum Darwin dan Wallace mengajukan teori evolusi dan Mendel menemukan hukum genetika, petani dan peternak telah mulai mencampuri proses evolusi dalam spesies yang menghasilkan hewan ternak dan tanaman pangan. Dengan kurangnya pengetahuan mengenai teori evolusi dan genetika, pencapaian mereka, dengan mendorong kecepatan dan menggulingkan seleksi alam, adalah hasil mengesankan. Dengan munculnya genetika molekul dan dalam teknik-teknik tertentu untuk manipulasi gen, kini kita telah memasuki era eksploitasi genetik pada organisme yang tidak pernah dibayangkan 50 tahun yang lalu. Kini kita dapat merancang gen-gen untuk memproduksi, dalam organisme peliharaan, produk gen baru untuk keuntungan manusia; kita tidak lagi terbatas untuk menyeleksi gen-gen yang berguna dari mutasi. Akan tetapi, kita hanya pada awal era baru ini, dan sejauh ini kita baru menggores permukaan pengetahuan yang diperlukan untuk

Bab  Protein 1 rekayasa protein, yang diartikan memutasikan gen suatu protein yang ada sebagai usaha untuk mengubah fungsinya dengan cara yang bisa diperkirakan, dari rancangan protein, yang mempunyai tujuan lebih ambisius untuk merancang de novo suatu protein untuk memenuhi fungsi yang diinginkan.

Proyek genom kini telah menyediakan penjelasan urutan lengkap semua gen dalam lebih dari selusin organisme, dan akan menyediakan lebih banyak lagi urutan genom lengkap dalam dekade berikutnya, termasuk genom manusia. Database ini memberian kesempatan besar untuk analisis dan eksploitasi gen serta proteinnya. Inti dari keuntungan komersil dan intelektual dari informasi genetika ini adalah kemampuan untuk menentukan fungsi produk gen individu. Hampir semua peranan fungsional kini didasarkan atas persamaan urutan dengan protein yang fungsinya telah diketahui.

Pengetahuan akan struktur tertier protein adalah penting untuk mengerti dan merekayasa fungsinya. Sayangnya, selain dari keuntungan teknologi tinggi masa kini, penentuan secara eksperimen suatu struktur tertier masih berlangsung lambat dibanding dengan laju akumulasi data urutan asam amino. Hal ini membuat masalah pelipatan, prediksi tepat struktur tertier protein dari urutan asam aminonya, menjadi inti bagi kecepatan progres dalam post-genomic biologi. Karena itu, dalam pembahasan ini kita pertama-tama akan menjelaskan implikasi homologi protein dan metode untuk prediksi struktur sekunder dan tertier sebelum memberikan contoh-contoh rekayasa protein dan rancangan protein.

Protein homolog memiliki struktur dan fungsi serupa

Istilah homologi seperti digunakan dalam konteks biologi didefinisikan sebagai kesamaan struktur, fisiologi, perkembangan, dan evolusi organisme berdasarkan atas faktor-faktor genetika yang sama. Pernyataan bahwa dua protein merupakan homolog menandakan bahwa gen keduanya telah berevolusi dari satu gen leluhur yang sama.

Protein-protein homolog sebagian besar dikenali oleh kesamaan yang begitu banyak dalam urutan asam aminonya. Biasanya, mereka

juga memiliki fungsi yang serupa meskipun terdapat beberapa penge-cualian, yang mana gen untuk enzim-enzim leluhur telah diambil pada tahap akhir dalam evolusi untuk menghasilkan protein dengan fungsi yang berbeda. Suatu contoh diberikan oleh salah satu komponen struk-tur dalam lensa mata yang homolog dengan enzim glikolisis leluhur laktat dehidrogenase. Sekali gen baru telah dikloning dan diurutkan, pencarian kesamaan urutan asam amino di antara protein yang sesuai dan urutan protein lain harus dilakukan. Biasanya, hal ini dilakukan dengan membandingkan dengan database urutan protein yang dike-tahui menggunakan salah satu program komputer pengurutan standar. Dua protein dianggap homolog jika memiliki residu asam amino identik dalam sejumlah besar posisi berurutan sepanjang rantai polipeptida. Menggunakan metode statistik berdasar atas perbandingan urutan acak yang dihasilkan komputer, relatif langsung bisa mengetahui berapa posisi yang harus identik untuk identitas statistik antara dua urutan. Akan tetapi, sering ditemukan dua protein dengan identitas urutan di bawah level statistik memiliki fungsi serupa dan struktur tiga dimensi juga serupa. Dalam hal ini, residu-residu yang penting secara fungsional adalah identik dan biasanya residu-residu seperti ini membentuk pola urutan atau motif yang bisa digunakan untuk mengidentifikasi protein lain yang termasuk dalam famili fungsional yang sama. Seringkali, anggota famili seperti ini juga dianggap homolog, meskipun identitasnya tidak statistik, hanya fungsional. Database untuk famili seperti ini, berdasarkan pada motif urutan identik atau serupa, tersedia dalam World Wide Web dan sangat berguna untuk menentukan fungsi protein baru.

Jika urutan asam amino identitas ditemukan dalam protein yang struktur kristalnya diketahui, model tiga dimensi untuk protein baru bisa disusun, menggunakan pemodelan komputer, atas dasar urutan dan struktur tiga dimensi yang diketahui. Model ini lalu dapat berperan sebagai dasar yang bagus untuk identifikasi residu asam amino yang terlibat dalam sisi aktif atau dalam epitop antigen, dan model ini bisa digunakan untuk rekayasa protein, rancangan obat, atau penelitian

Bab  Protein 1 Karena database urutan berukuran besar dan tumbuh secara eksponensial, saat ini memiliki lebih dari 500.000 urutan protein, maka program pengurutan standar telah dirancang untuk memberikan pilihan antara kecepatan dan ketepatan pencarian. Hasilnya, hanya bekerja dengan baik ketika terdapat identitas urutan derajat tinggi, biasanya 30% atau lebih. Program yang jauh lebih sensitif yang telah dibuat dapat mencari identitas maupun sifat struktur serta untuk keterkaitan dalam sifat fisik berbeda, namun membutuhkan jauh lebih banyak waktu di depan komputer. Penggunaan hati-hati, program seperti ini dapat mengidentifikasi kesamaan struktur dan fungsi yang gagal dilakukan oleh program standar.

Pengetahuan mengenai struktur sekunder diperlukan untuk prediksi struktur tertier

Apa yang bisa dilakukan oleh metode prediktif jika pencarian urutan gagal untuk mengungkapkan homologi apapun dalam suatu protein dengan struktur tertier yang sudah diketahui? Mungkinkah untuk memodelkan struktur tertier dari urutan asam amino saja? Tidak ada metode masa kini untuk melakukan hal ini dan memperoleh model yang cukup detil untuk bisa digunakan, sebagai contoh, dalam rancangan obat dan rekayasa protein. Akan tetapi, hal ini merupakan area yang sangat aktif dalam penelitian dan hasil yang cukup menjanjikan sedang diperoleh; dalam beberapa kasus dimungkinkan untuk memprediksi tepat tipe protein, a, b, atau a/b, dan bahkan untuk menurunkan perkiraan lipatan yang tepat.

Metode prediktif saat ini bergantung pada prediksi struktur sekunder: dengan kata lain, yang mana residu asam amino a-heliks dan mana yang merupakan untai b. Struktur sekunder secara umum tidak bisa diprediksi dengan derajat keyakinan tinggi dengan pengecualian yang mungkin pada heliks transmembran dan kumparan a-heliks. Hal ini menimbulkan keterbatasan dasar dalam prediksi struktur tertier. Sekali struktur sekunder tepat diketahui, kita cukup mengetahui tentang aturan untuk mengemas elemen-elemen struktur sekunder

satu sama lain untuk menurunkan dengan jumlah yang sangat terbatas kemungkinan lipatan globular stabil. Akibatnya, prediksi struktur sekunder terdapat pada jantung prediksi struktur tertier dari urutan asam amino. Sayangnya untuk metode prediktif, struktur sekunder dan tertier berkaitan erat dalam hal bahwa struktur tertier global mempengaruhi struktur sekunder lokal setidaknya di sebagian daerah rantai polipeptida. Kemampuan urutan pendek tertentu asam amino untuk membentuk α heliks, untai b, atau daerah loop tergantung bukan hanya pada urutan daerah tersebut tetapi juga pada lingkungannya dalam struktur tiga dimensi. Sebagai contoh, dengan menganalisis semua struktur tertier yang telah diketahui, terlihat bahwa daerah peptida sampai sepanjang lima residu dengan urutan asam amino identik merupakan a-heliks dalam satu struktur dan untai b atau loop dalam struktur yang lain. Meskipun saling ketergantungan antara struktur sekunder dan tertier ini menyulitkan prediksi struktur sekunder, namun kadangkala bisa digunakan untuk mengembangkan prediksi seperti itu, dengan suatu skema di mana penentuan awal struktur sekunder digunakan untuk memprediksi tipe struktur domain, sebagai contoh, kumpulan empat heliks atau lapisan a/b. Tipe struktur domain menyebabkan tambahan kecocokan pada kemungkinan struktur sekunder, yang bisa digunakan untuk memperbaiki prediksi struktur sekunder.

Metode prediksi untuk keuntungan struktur sekunder dari jajaran protein homolog

Lebih dari 20 macam metode telah diajukan untuk prediksi struktur sekunder; yang bisa dikategorikan dalam dua kelompok besar. Metode statistik empiris menggunakan parameter yang diperoleh dari analisis struktur tertier dan urutan yang diketahui. Semua metode seperti ini berdasarkan atas asumsi bahwa urutan lokal dalam daerah pendek pada rantai polipeptida menentukan struktur lokal; seperti yang telah kita lihat, ini bukanlah asumsi yang bisa diterapkan secara universal.

Bab  Protein 11 kekompakan bentuk dengan inti hidrofob yang dikemas rapat dan permukaan polar.

Meskipun ketiga metode ini menggunakan pendekatan yang cukup berbeda pada masalah tersebut, namun keakuratan prediksi struktur sekundernya kurang lebih sama. Ketiga metode bisa digunakan untuk menentukan salah satu dari tiga keadaan pada tiap residu: a heliks, untai b, atau loop. Penentuan acak ketiga keadaan ini pada residu dalam rantai polipeptida akan menghasilkan nilai rata-rata 33% keadaan yang diprediksi tepat. Metode-metode ini telah digunakan dalam analisis urutan tunggal dari sejumlah besar struktur sinar-x yang diketahui yang terdiri atas lebih dari 10.000 residu. Untuk definisi tiga keadaan struktur sekunder, keakuratan keseluruhan prediksi adalah sekitar 55%. Penentuan objektif lain juga memberikan hasil yang sama.

Akan tetapi, ketika metode prediktif ini digunakan pada serangkaian protein homolog, kekuatan prediktifnya jadi lebih tinggi. Asumsi yang mendasari yakni bahwa struktur sekunder dan tertier lebih dipertahankan selama evolusi daripada urutan asam amino; dengan kata lain, hanya perubahan seperti itu yang tersisa selama evolusi yang mempertahankan struktur tersebut. Akibatnya, pola perubahan residu di dalam protein homolog mengandung informasi spesifik mengenai struktur tersebut. Residu hidrofob yang dipertahankan biasanya berada dalam interior protein dengan probabilitas tinggi sebagai heliks atau untai sheet. Insersi dan delesi hampir selalu terjadi dalam daerah loop dan bukan dalam lipatan yang dibangun dari heliks dan untai.

Beberapa program kini tersedia menggunakan jajaran protein homolog untuk prediksi struktur sekunder. Salah satu program, yang disebut PHD, yang dikembangkan oleh Chris Sander dan kawan-kawan, EMBL, Heidelberg, telah mencapai rata-rata akurasi prediksi sebesar 72% untuk struktur baru.

Bagian besar kesalahan (error) yang tersisa berada pada ujung a-heliks untai b dan sebagai tambahan, sebagian error muncul karena kesulitan dalam membedakan antara a-heliks dan untai b. Error seperti ini bisa dikoreksi jika kelompok struktur, a, b, atau a/b, bisa didapat dari kombinasi penelitian fisik, sebagai contoh, spektra

dikroisme sirkular, dan fitur umum prediksi struktur sekunder. Sebagai contoh, jika skema prediksi menetapkan satu atau dua a- heliks pendek di antara banyak untai α dalam suatu protein dari kelompok b, maka terdapat probabilitas tinggi bahwa daerah struktur sekunder tersebut intinya diprediksi dengan tepat namun seharusnya semuanya merupakan untai b.

Metode-metode prediktif ini sangat berguna dalam banyak konteks; sebagai contoh, dalam perancangan polipeptida baru untuk identifikasi kemungkinan epitop antigen, dalam analisis motif yang sama dalam urutan yang mengarahkan protein menjadi organel tertentu (misalnya, mitokondria), dan untuk menyediakan model awal untuk prediksi struktur tertier.

Banyak urutan asam amino berbeda membentuk struktur tiga dimensi yang serupa

Berapa banyak urutan asam amino yang sama sekali berbeda yang dapat membentuk struktur tiga dimensi serupa untuk domain berukuran rata-rata dari 150 residu asam amino? Perhitungan kombinasi sederhana menunjukkan bahwa terdapat total 20150 atau kasarnya 10200 kemungkinan urutan asam amino untuk domain seperti itu, dari 20 macam asam amino dalam protein alami. Jumlah ini jauh lebih besar daripada jumlah atom dalam alam semesta yang diketahui. Perhitungan lebih luas menunjukkan bahwa dari 10200 kemungkinan kombinasi ini kita bisa mengambil sekitar 1038 anggotanya yang memiliki kurang dari 20% identitas urutan asam amino satu sama lain sehingga bisa dianggap memiliki urutan yang berbeda. Dengan kata lain, terdapat 1038 macam cara untuk membangun suatu domain dari 150 asam amino menggunakan 20 asam amino standar sebagai penyusunnya (building blocks). Kita tidak tahu berapa banyak dari jumlah ini yang bisa membentuk struktur tiga dimensi stabil, namun dengan asumsi bahwa satu dari semilyar (109) itu bisa, maka tinggal 1029 kemungkinan lipatan protein. Pada bagian sebelumnya kita telah

Bab  Protein 1 sejumlah terbatas struktur domain yang berbeda secara topologi. Telah diperkirakan dengan alasan yang masuk akal bahwa terdapat sekitar 1000 struktur domain yang berbeda secara topologi. Karena terdapat 1029 kemungkinan urutan berbeda yang dapat melipat menjadi 103 macam struktur, maka terdapat 1026 macam penataan rantai samping dengan kurang dari 20% identitas urutan asam amino yang bisa membentuk lipatan polipeptida serupa. Hanya bagian kecil dari kemungkinan protein ini yang akan ditemukan di alam.

Untuk setiap 500 atau lebih macam struktur domain yang sejauh ini telah diamati, kita bisa mengetahui sekitar selusin dari kemungkinan urutan berbeda ini. Bukanlah trivial untuk mengenali pola urutan umum yang sama untuk struktur domain tertentu dari dasar pengetahuan yang terbatas seperti ini.

Prediksi struktur protein dari urutan adalah masalah tak terpecahkan

Bagaimana memprediksi struktur tiga dimensi suatu protein dari urutan asam aminonya adalah masalah utama yang tak terpecahkan dalam struktur biologi molekul. Kita akan menggunakan program komputer yang bisa memberikan simulasi proses yang berjalan dalam tabung reaksi atau sel hidup ketika suatu rantai polipeptida dengan urutan asam amino tertentu melipat menjadi struktur tiga dimensi yang tepat. Mengapa prediksi pelipatan protein ini begitu sulit? Jawabannya biasanya diformulasikan dalam istilah kompleksitas pencarian melalui semua kemungkinan konformasi rantai polipeptida untuk menemukan yang berenergi rendah. Membutuhkan begitu banyak waktu di depan komputer, selain dari kesulitan yang dibahas dalam perbedaan energi antara molekul terlipat yang stabil dan keadaan tak terlipatnya adalah angka yang kecil tetapi mengandung error yang besar.

Dengan realisasi bahwa hanya terdapat jumlah terbatas lipatan stabil dan banyak urutan tak berkaitan yang memiliki lipatan yang sama, para ilmuwan komputasi yang berorientasi biologi mulai melirik apa yang disebut masalah pelipatan kebalikan; pola urutan mana yang cocok dengan lipatan tertentu? Jika pertanyaan ini bisa dijawab, pola

seperti ini bisa digunakan untuk mencari melalui database urutan genom dan mengambil urutan-urutan yang memiliki lipatan tertentu, seperti lapisan a/b atau lipatan imunoglobulin. Akan tetapi, dengan sejumlah besar kemungkinan urutan yang tak berkaitan untuk tiap lipatan dan jumlah terbatas urutan yang diketahui, variasi dari masalah ini kini dialami oleh banyak kelompok; misalnya, yang mana dari lipatan yang telah diketahui, jika ada, yang paling cocok dengan urutan tertentu? Metodologi yang digunakan disebut sebagai threading karena melibatkan pengaluran urutan tertentu melalui semua lipatan yang diketahui dan untuk tiap lipatan memperkirakan probabilitas bahwa urutan tersebut mempunyai lipatan itu. Progres besar kini telah diraih dalam threading, dan dalam blind test beberapa struktur telah diprediksikan dengan tepat oleh kelompok-kelompok yang berbeda.

Metode threading bisa menentukan urutan asam amino kepada lipatan tiga dimensi yang diketahui

Metode threading, yang juga disebut sebagai penentuan lipatan protein atau pengenalan lipatan, merupakan area yang menjanjikan dan berkembang dengan cepat dalam komputasi struktur biologi. Tujuannya yakni untuk menentukan bagi tiap urutan protein yang diturunkan dari genom untuk melipat menjadi lipatan yang paling cocok, atau untuk menentukan ada tidaknya lipatan yang diketahui yang cocok dengan urutan tersebut. Tujuan selanjutnya yakni untuk menjajarkan urutan baru dengan tepat pada struktur tiga dimensi lipatan yang cocok untuk menghasilkan model resolusi rendah. Untuk menguji berbagai metode threading, blind test disiapkan, yang disebut sebagai Critical Assessment of Structure Prediction (CASP), di mana partisipan diberikan urutan dan diundang untuk memprediksi lipatan dan membuat penjajaran sebelum struktur tersebut ditentukan secara eksperimen. Di sini kita akan menjelaskan metode yang digunakan oleh salah satu partisipan yang berhasil dalam uji ini, kelompok David

Bab  Protein 1 Kebutuhan yang pertama untuk threading adalah memiliki database semua macam lipatan protein yang telah diketahui. Eisenberg telah menggunakan pustakanya sendiri yang berisi sekitar 800 lipatan, yang merepresentasikan setidaknya lebih dari 6000 simpanan struktur di Protein Data Bank. Kelompok lain menggunakan database yang tersedia di World Wide Web, di mana lipatan disusun secara hierarki menurut kesamaan struktur dan fungsi, seperti SCOP, yang dirancang oleh Alexey Murzin dan Cyrus Chothia di Cambridge, Inggris. Untuk tiap lipatan dicari penjajaran terbaik dari urutan target yang cocok dengan lipatan tersebut; inti harus memiliki residu hidrofob dan residu polar harus berada di luar, daerah heliks dan untai yang diprediksi harus dijajarkan sesuai dengan elemen-elemen struktur sekunder dalam lipatan, dan seterusnya. Untuk mencocokkan penjajaran urutan dengan lipatan, Eisenberg mengembangkan metode cepat yang disebut sebagai metode 3D profil. Lingkungan tiap posisi residu dalam struktur 3D yang diketahui dikarakterisasi atas dasar tiga sifat:

(1) Area rantai samping yang ditutupi oleh atom-atom protein lain, (2) Bagian dari area rantai samping yang ditutupi oleh atom-atom

polar, dan

(3) Struktur sekunder, yang dikelompokkan dalam tiga keadaan: heliks, sheet, dan coil.

Posisi residu kemudian dapat dibagi menjadi enam kelompok oleh sifat 1 dan 2, yang berkombinasi dengan sifat 3 menghasilkan 18 kelompok lingkungan. Klasifikasi lingkungan ini memungkinkan struktur protein untuk dikode oleh urutan dalam 18 huruf alfabet, yang tiap hurufnya melambangkan kelompok lingkungan dari suatu posisi residu.

Masing-masing dari 20 macam asam amino memiliki pemilihan yang berbeda untuk masing-masing dari 18 kelompok lingkungan; misalnya Leu lebih memilih berada dalam kelompok heliks dengan bagian besar area rantai samping terkubur, sedangkan Asp sangat tidak memilih posisi tersebut. Nilai numerik untuk pemilihan ini, disebut nilai 3D-1D, diturunkan dari serangkaian struktur protein

resolusi tinggi, bersama dengan rangkaian urutan yang serupa dengan urutan struktur 3D. Ini menghasilkan tabel penilaian yang untuk tiap kelompok lingkungan suatu nilai numerik pemilihan dikaitkan dengan masing-masing dari 20 asam amino. Tabel ini digunakan untuk membuat tabel 3D profil dari struktur protein, di mana tiap posisi residu berada dalam kelompok lingkungan dengan nilai numeriknya untuk pemilihan untuk tiap tipe asam amino. Inti dari metode ini yakni struktur tiga dimensi direduksi menjadi susunan satu dimensi, yang memfasilitasi pencocokan pada urutan satu dimensi.

Urutan asam amino target dijajarkan terhadap profil struktur ini sedemikian rupa sehingga pasangan yang paling mungkin – nilai total tertinggi – diperoleh, memungkinkan gaps dan insersi. Penjajaran seperti ini secara konseptual serupa dengan penjajaran dua urutan dan metode serupa telah digunakan. Pencocokan urutan dengan profil struktur 3D untuk lipatan tertentu diekspresikan secara kuantitatif oleh suatu nilai yang disebut sebagai Z-score, yang merupakan angka standar deviasi di atas rata-rata nilai penjajaran untuk urutan lain yang panjangnya sama. Nilai Z-score tinggi berarti terdapat probabilitas tinggi bahwa urutan tersebut memiliki lipatan itu.

Metode-metode yang dijelaskan di sini selanjutnya telah dikem-bangkan dan diperluas oleh Eisenberg, namun pada prinsipnya tetap sama. Kelompok lain menggunakan metode berbeda untuk screening penjajaran urutan-urutan dan kriteria berbeda untuk menilai kecoco- kan. Manfred Sippl dari University of Salzburg, Austria, telah mengem-bangkan serangkaian potensial untuk screening dan penilaian penja-jaran, intinya yakni untuk memaksimalkan jumlah interaksi hidrofob dan untuk meminimalkan jumlah atom polar terkubur yang tidak ber- partisipasi dalam ikatan hidrogen. Potensial ini dan potensial yang se-rupa kini digunakan oleh banyak kelompok dalam program threading mereka. Lipatan yang tepat dapat diprediksi dengan probabilitas cukup tinggi untuk protein berukuran kecil dan sedang. Namun penjajaran

Bab  Protein 1

Protein bisa dibuat lebih stabil melalui rekayasa

Rekayasa protein, melalui site-directed mutagenesis DNA, bisa digunakan untuk menjawab pertanyaan yang sangat spesifik tentang stabilitas protein, dan hasil dari penelitian ini kini sedang digunakan untuk meningkatkan stabilitas enzim yang penting dalam industri. Untuk mengilustrasikan sebagian faktor yang penting untuk stabilitas protein yang telah diungkapkan dalam penelitian rekayasa protein.

Lisozim dari bakteriofag T4 merupakan rantai polipeptida sepanjang 164 asam amino yang melipat menjadi dua domain. Tidak ada jembatan disulfida; dua residu sistein dalam urutan asam amino, Cys 54 dan Cys 97, jauh terpisah dalam struktur terlipat. Stabilitas protein wild-type maupun protein mutan diekspresikan sebagai titik

Dalam dokumen Biokimia Struktur Dan Fungsi Biomolekul (Halaman 147-167)