• Tidak ada hasil yang ditemukan

Pangkalan Data untuk Rangkaian DNA

N/A
N/A
Protected

Academic year: 2018

Membagikan "Pangkalan Data untuk Rangkaian DNA"

Copied!
3
0
0

Teks penuh

(1)

Pangkalan Data untuk Rangkaian DNA

Mahyuddin K. M. Nasution

Departemen Matematika FMIPA USU dan Program Studi Ilmu Komputer USU, mahyuddin@usu.ac.id

Al-Khawarizmi: Journal of Computer Science Volume 1, Issue 2: 7-12, June 2005.

Tulisan asal, penulis hanya menggunakan nama: ”Mahyuddin”.

Abstract—Pangkalan data diperlukan untuk merekamkan infor-masi dari suatu lingkungan tertentu, sedangkan rangkaian DNA adalah suatu bentuk susunan yang juga merekamkan informasi ten-tang status dan sejarah suatu kehidupan. Tentunya diperlukan suatu pengetahuan dasar untuk menghubungkan kedua informasi tersebut agar informasi kedua menjadi lebih berdayaguna.

Kata kunci – leluhur; RNA; spektroskopi; NMR; de novo; ab initio.

I. PENDAHULUAN

Bioinformatika (bioinformatic, dalam bahasa Inggris) meru-pakan penerapan teknik berkomputasi untuk mengelola dan menganalisis informasi biologis. Bidang ilmu ini berkem-banga sejak teknik biologi molekuler dalam mengungkapkan rangkaian biologis dari protein dimulai tahun 1950-an dan asam nukleat pada tahun 1960-an, yang memerlukan adanya pangkalan data rangkaian protein [1].

Pada suatu sisi, penerapan komputer ke dalam biologi tidak saja sebagai akibat kebutuhan dalam teknik analisis rangkaian biologis, tetapi juga disebabkan oleh perkemban-gan dan kemampuan penerapan beberapa bidang matematika seperti aljabar dan topologi ke dalam biologi, seperti analisis struktur gen melalui teori grup yang dikembangkan dengan penambahan beberapa aksioma dalam penerapannya terhadap anyaman atau simpul yang terdapat dalam budaya manusia [2], [3]. Pada sisi lain, kemajuan teknologi informasi, terutama internet juga turut menyumbangkan percepatan pertumbuhan bidang ini, yang memudahkan ilmuan mengumpulkan hasil rangkaian ke pangkalan data atau mendapatkan rangkaian biologis sebagai bahan analisis. Selain itu, juga membantu penyebaran program-program bantu sebagai aplikasi dalam bidang bioinformatika, untuk maksud yang sama [4]. Oleh karena itu, pada bagian ini akan diungkapkan beberapa in-formasi yang mungkin direkamkan ke dalam dan digali dari pangkalan data.

II. PANGKALANDATA

Pangkalan data rangkaian biologis dapat berupa pangkalan data utama untuk menyimpan rangkaian asam nukleat maupun

protein, pangkalan data sekunder untuk menyimpan motif rangkaian protein dan pada struktur untuk menyimpan data struktur protein maupun asam nukleat. Jadi pangkalan data rangkaian biologis disesuaikan dengan jenis informasi biologis yang akan disimpannya, sehingga penggunanya dapat menaf-sirkan, merancang, mengolah dan menyelenggarakannya [4].

Suatu pangkalan data dikembangkan dari lingkungan yang memerlukan suatu sistem informasi, di mana pangkalan data tercakup. Suatu pangkalan data untuk keperluan tertentu dikembangkan berdasarkan suatu arsitektur, dengan alasan bahwa perbedaan tingkat mengakibatkan setiap pengguna da-pat menggapai data yang sama tetapi mempunyai pandangan berbeda terhadap data yang diinginkan [5]. Pengguna tidak seharusnya terlibat dengan struktur fisik tempat penyimpanan data, interaksi pengguna dengan pangkalan data tidak bergan-tung kepada struktur tempat penyim-panan. Perubahan yang dilakukan terhadap pangkalan data tidak akan memberikan sebarang akibat terhadap pandangan pengguna, dan perubahan aspek tempat penyimpanan secara fisik juga tidak memberikan pengaruh pada struktur dalaman pangkalan data. Pergantian sebarang struktur konseptual tidak akan memberikan sebarang pengaruh terhadap pengguna [6].

1) Tingkat luaran

Pandangan pengguna tentang pangkalan data, yang men-erangkan bagian pangkalan data yang berhubungan den-gan individu pengguna atau sekumpulan pengguna. Pan-dangan luaran hanya melibatkan entitas, atribut dan hubungan di dalam lingkungan sebenarnya yang menjadi perhatian/keperluan pengguna.

2) Tingkat berkonsep

Mengandungi struktur berlogika tentang suatu pangkalan data sebagaimana yang digambarkan oleh administra-tor pangkalan data. Tingkat ini melibatkan pandangan lengkap keperluan data sesuatu organisasi dan tidak bergantung kepada segi tempat penyimpanan. Tingkat ini digunakan untuk menerangkan sesuatu pangkalan data melalui entitas, hubungan antara entitas, atribut, kendala data, keamanan dan keterpaduan data. Tingkat ini mendukung tingkat luaran yang berkaitan dengan bagian mana saja yang berguna bagi pengguna, semua itu harus dapat diolah atau terdapat di dalam bagian berkonsep ini.

3) Tingkat dalaman

(2)

Gambar 1. Pengertian besarnya jumlah data DNA yang dihasilkan

data untuk menggapai kinerja larian (run) yang opti-mum dan penggunaan tempat penyimpanan yang baik. Tingkatan ini melibatkan alokasi tempat penyimpanan untuk data dan indeks, penjelasan (deskripsi) rekord, penggantian rekord dan teknik dalam pemadatan rekord. Pertukaran dan larian baik yang berasal dari sistem manual ataupun sistem berkas biasa ke sistem pangkalan data memerlukan biaya yang tinggi.

Jadi pangkalan data rangkaian protein akan disesuaikan den-gan keperluan komponen pangkalan data pada umumnya, yaitu data pengguna (dalam bentuk hubungan atau tabel), metadata atau kamus data (uraian tentang struktur pangkalan data), indeks (untuk tujuan pengurutan dan capaian yang lebih cepat), dan aplikasi metadata (menyimpan struktur dan bentuk tentang laporan, pertanyaan, borang dan aplikasi lain). Keperluan atas informasi yang akan berkaitan dengan komponen ini akan disajikan pada dua pasal berikut.

III. PENGUMPULANINFORMASI

Metode dasar untuk mendapatkan informasi tentang DNA adalah melalui analisis rangkaian, yaitu penyejajaran sekuens (sequance alignment ). Penyejajaran sekuens adalah proses penyusunan/pengaturan dua atau lebih rangkaian sehingga per-samaan rangkaian-rangkaian tersebut tampak nyata. Metode ini digunakan untuk mempelajari evolusi rangkaian dari leluhur yang sama (common ancestor). Hasil dari proses tersebut juga disebut sebagai sequence alignment atau penyejajaran (alignment) saja.

Ketidakcocokan (mismatch) dalam penyejajaran diasosi-asikan dengan proses mutasi, sedangkan kesenjangan (gap) diberi tanda dengan ”-” diasosiasikan dengan proses penyisi-pan dan penghapusan. Baris rangkaian dalam suatu penyeja-jaran diberi sisipan, secara umum dengan tanda ”-” sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di antara rangkaian-rangkaian tersebut. Misalnya penyejajaran DNA dari dua rangkaian pendek DNA yang berbeda caatacca dan ccatgggacca sehingga

caat---acca | || |||| ccatgggacca

dengan mana tanda ”—” menunjukkan kecocokan (match) di antara kedua-dua rangkaian.

Sumber utama data rangkaian asam nukleat adalah submisi langsung dari peneliti pribadi, projek perangkaian genom, dan pendaftaran paten. Selain berisi rangkaian asam nukleat, asupan dalam pangkalan data rangkaian asam nukleat umum-nya mengandung informasi tentang jenis asal nukleat, DNA atau RNA, nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan rangkaian asam nukleat tersebut. Suatu pangkalan data diharapkan dapat mengandung informasi tentang rangkaian protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya berisi penjelasan mengenai fungsi protein tersebut.

Secara kimia/fisika, bentuk struktur protein diungkap den-gan kristalografi sinar-X ataupun spektroskopi NMR [4], na-mun kedua perangkaian protein relatif lebih mudah men-gungkapkan rangkaian asam amino protein. Dengan demikian, pangkalan data dapat menyimpan model berstruktur berdi-mensi tiga dari protein dan asam nukleat menurut hasil penentuan bereksperimen. Penyimpanan data berstruktur ini menggambarkan posisi atom-atom dalam protein ataupun asam nukleat.

IV. INFORMASITURUNAN

Penyejajaran sekuens memberikan hipotesis atas proses evolusi yang terjadi dalam rangkaian-rangkaian yang diband-ingkan. Misalnya, rangkaian ”caatacca” dan ”ccatgg gacca” di atas, dapat saja berevolusi dari rangkaian yang sama ”caatgggacca”. Berkaitan dengan hal itu, penyejajaran juga dapat menunjukkan posisi-posisi yang dipertahankan selama evolusi dalam rangkaian-rangkaian protein, yang menunjukkan bahwa posisi-posisi tersebut merupakan bagian penting baik menurut struktur maupun fungsi dari protein tersebut.

Beberapa metode telah diturunkan, seperti metode Needleman-Wunsch, metode Smith-Waterman, atau metode model markov tersembunyi, yang masing-masing menggunakan prinsip berbeda dalam menurunkan informasi baru. Ada yang digunakan untuk menyusun penyejajaran global di antara dua atau lebih rangkaian, yangberlaku atas keseluruhan panjang rangkaian tersebut. Penyejajaran lokal, digunakan oleh metode lain atas bagian-bagian dalam rangkaian. Kedua prinsip ini sebenarnya menerapkan metode program dinamik dan hanya efektif untuk rangkaian berpasangan.

Selain itu, digunakan juga prinsip statistika untuk men-genali dan menganalisis rangkaian. Prediksi struktur protein berusaha meramalkan protein berdimensi tiga ber-dasarkan sekuens asam amino, yaitu struktur tersier dan struktur sekun-der berdasarkan struktur primer protein. Secara umum, metode prediksi struktur protein yang ada sampai saat dapat dikate-gorikan menjadi dua: metode pemodelan protein komparatif dan metode pemodelan de novo.

(3)

lain. Salah satu penerapan ini adalah pemodelan homologi, sebagai penerapan beberapa aksiomatis teori himpunan dan aljabar, dengan prediksi struktur tersier protein berdasarkan ke-samaan struktur primer protein. Pemodelan ini didasarkan pada teori bahwa dua protein yang memiliki sifat yang sama san-gatlah mirip satu sama lain. Struktur protein sebagai sasaran ditentukan berdasarkan struktur protein lain yang dipandang sebagai acuan (template) yang sudah diketahui dan memiliki kemiripan rangkaian de-ngan protein sasaran tersebut.

Pemodelan lain perbandingan rangkaian didasarkan pada kemiripan struktur tanpa kemiripan rangkaian primer, atau disebut protein threading, dilatarbelakangi oleh struktur pro-tein dikonservasi dari rangkaian propro-tein selama evolusi, yang melibatkan bagian-bagian penting dari fungsi protein yang harus dipertahankan.

Struktur protein juga ditentukan dari rangkaian primernya tanpa membandingkan dengan struktur protein lain, proses mendapatkan informasi ini dinyatakan sebagai pendekatan de

novo atau ab initio. Kemungkinan yang digunakan dalam

pendekatan ini dengan cara menirukan proses pelipatan protein dari rangkaian primernya menjadi struktur tersiernya, melalui simulasi dinamika molekuler, atau kemungkinan dengan opti-misasi global fungsi energi protein.

Dengan demikian, dapat dikatakan bahwa secara umum beberapa metode di-gunakan untuk mendapat informasi ke-seragaman sifat dari suatu protein. Informasi ini berguna dalam memprediksi evolusi suatu protein dan melihat latar-belakangnya.

V. PENUTUP

Pangkalan data memiliki arsitektur tersendiri sesuai dengan keperluan lingkungan penerapan pangkalan data. Beberapa persiapan pangkalan data untuk rangkaian biologi diungkap-kan melalui informasi dasar dan turunan. Informasi dasar yang akan direkamkan ke dalam pangkalan data didasarkan atas bidang keilmuan biologi yang berkaitan dengan genetika, sedangkan informasi lain sebagai turunan, didasarkan atas beberapa metode yang dikembangkan, baik secara matematika ataupun statistika, yang secara diskrit telah dapat diaplikasikan di dalam bidang komputer.

REFERENCES

[1] T. K. Attwood & D. J. Parry-Smith, ”Introduction to bioinformatics”, Harlow: Pearson Education, 1999.

[2] M. K. M. Nasution, ”Mutasi pada anyaman”, EPSILON: Journal Matem-atika dan Terapannya 2(2): 29-32, 2001.

[3] M. K. M. Nasution, S. Suwilo & S. Nasution, ”Mutasi simpul dengan quan-tisasi unting aljabar loop pada suatu permukaan”, Komunikasi Penelitian 13(2): 417-347, 2001.

[4] D. E. Krane & M. L. Raymer, ”Fundamental concepts of bioinformat-ics”, San Francisco: Benjamin Cummings, 2003.

[5] M. K. M. Nasution, ”Pengantar DBMS”, Medan: USU Press, 1995. [6] T. M. Connolly, & C. E. Begg, Database systems, a practical approach to

Gambar

Gambar 1. Pengertian besarnya jumlah data DNA yangdihasilkan

Referensi

Dokumen terkait

Pada saat proses titrasi asam salisilat menggunakan larutan NaOH, maka. ditambahkan dua tetes indikator

Semua dipanggil untuk menghayati keseluruhan ajaran dan nilai-nilai luhur perkawinan tanpa kecuali; semua pasangan suami-istri dipanggil kepada kesempurnaan hidup melalui

Bahasa sebagai sarana berekspresi dan komunikasi berkembang menjadi suatu pemikiran yang logis dimungkinkan untuk mengembangkan segala potensinya. Perkembangan itu sejalan

Tulisan ini akan dimulai dengan menggambarkan secara umum daerah Halmahera Barat tempat suku Sahu berdiam, dilanjutkan dengan latar sejarah Sasadu sebagai rumah adat

Sistem monitoring reservoir air yang dirancang dengan sensor HCSR04, Arduino UNO R3, dan Xbee Series 2, dapat melakukan pengukuran besarnya volume air yang ada pada beberapa

Untuk menentukan jenis nilai ekstrim ( maksimum atau minimum ) dari fungsi f(x) dapat dilakukan dengan Uji turunan kedua sebagai berikut

Land Use Type 1x Irrigation Paddy 1x Tidal Swamp Rice Field 2x Tidal Swamp Rice Field Big Building Big Plantation Bushes Destroyed Land Dry Agriculture Land Fres h Water Pond