MODUL 6
ANALISIS GEN DAN PROMOTER
Instruksi umum:
1. Selama praktikum, ikuti petunjuk pengerjaan yang tertera pada modul dan yang disampaikan oleh asisten.
2. Silakan gunakan modul ini sebagai panduan membuat laporan. Laporan dibuat dalam format .pdf dan diberi nama file “BIOINFORMATIKA_BI6112_6_NAMA_NIM_2021”
3. Buatlah jawaban pada lembar modul dengan warna berbeda
4. Laporan diunggah ke edunex paling lambat hari Senin, 11 Oktober 2021 pukul 15.00.
Anda diminta untuk mencari sekuen pengode subunit beta ATP sintase pada tiga spesies untuk dianalisis gen serta promoternya, yaitu:
a) Gene ID: 57879025 b) Gene ID: 829034 c) Gene ID: 3098
PERTANYAAN
1. Berasal dari organisme apa saja sekuen-sekuen tersebut? (2 poin) a. Treponema palidum subsp.pertenue str. SamoaD
b. Arabidopsis thaliana (thale cress) c. Homo sapiens (human)
2. Apa nama dan fungsi dari gen yang Anda temukan? (4 poin)
Heksokinase memfosforilasi glukosa untuk menghasilkan glukosa-6-fosfat, langkah pertama dalam sebagian besar jalur metabolisme glukosa. Gen ini mengkodekan bentuk heksokinase di mana-mana yang terlokalisasi ke membran luar mitokondria. Mutasi pada gen ini telah dikaitkan dengan anemia hemolitik karena defisiensi heksokinase. Penyambungan alternatif gen ini menghasilkan beberapa varian transkrip yang mengkodekan isoform yang berbeda, beberapa di antaranya spesifik jaringan.
MODUL A - ANALISIS GEN DAN PROMOTER PADA PROKARIOT
A. Analisis Gen pada Prokariot
a. Buka http://www.softberry.com, pada menu Run Program Online pilih Operon and Gene Finding In Bacteria pilih FGENESB.
b. Jalankan program dengan menggunakan file FASTA yang sudah didownload, set Closest Organisms mengikuti organisme asal dari sekuens GENE ID dan klik PROCESS.
c. Sertakan screenshoot hasilnya!
Pertanyaan:
1. Ada berapa gen yang dihasilkan? (2 poin)
Ada 1 gen yang diprediksi.
2. Ada berapa Transcription Unit (TU) pada sekuen tersebut? (2 poin) Ada 1 transcription units
3. Ada berapa operon? (2 poin) Operons 0
4. Berapa produk gen (aa) terpanjang yang dihasilkan? Pada urutan nukleotida ke berapa? (4 poin)
444 aa
B. Analisis Promoter pada Prokariot
a. Buka halaman http://www.softberry.com
b. Pada Link Operon and Gene Finding in Bacteria, klik BPROM.
c. Submit menggunakan format FASTA dari sekuen di atas.
d. Klik PROCESS.
Pertanyaan:
5. Ada berapa promoter yang Anda temukan? Sebutkan berapa promoter yang anda temukan beserta sekuen dan sertakan screenshoot hasilnya. (4 poin)
ada 4 promotor dengan Panjang sekuen 969, 1286, 123 dan 442
6. Sebutkan urutan nukleotida apa saja yang dijadikan tempat TF binding site (tempat berikatannya faktor transkripsi)? (sertakan screenshoot hasilnya) (2 poin)
purR, argR, argR2, ihf, soxS, nagC, rpoD15.
MODUL B - ANALISIS GEN DAN PROMOTER PADA EUKARIOT
A. Analisis Gen pada Eukariot
➢ AB-INITIO-BASED GENE PREDICTION PROGRAM
a. Pada halaman http://www.softberry.com, klik link GENE FINDING in Eukaryota. lalu pilih FGENESH.
b. Masukan sekuens eukariot yang diperoleh
c. Sesuaikan pilihan organism dengan sekuen yang didapat.
d. Pilih organisme sesuai dengan identitas sekuen yang dimasukkan, lalu Klik SEARCH Pertanyaan:
7. Ada berapa gen yang dihasilkan? (2 poin)
Prediksi gen yang dihasilkan yaitu 1
8. Berapa ekson yang dihasilkan oleh gen tersebut? Bagaimana dengan intron? (2 poin) Exon 7
9. Pada nukleotida ke berapa transkripsi dimulai dan berakhir? (2 poin) Mulai 337 dan berakhit 2864
10. Berapa panjang produk gen (aa) yang dihasilkan? (2 poin) 496 aa
11. Jelaskan FGENESH output dibawah ini: (12 poin)
✓ G : jumlah gen yang diprediksi mulai dari urutan awal
✓ Str : untai DNA (+ langsung, - komplemen)
✓ Feature : jenis urutan pengkodean: CDSf - Pertama (Dimulai dengan kodon Start), CDSi - internal (ekson internal), CDSl - segmen pengkodean terakhir, diakhiri dengan kodon stop)
✓ TSS : posisi awal transkripsi (posisi dan skor TATA box)
✓ Start dan End : posisi fitur
✓ ORF : posisi awal/akhir di mana kodon lengkap pertama dimulai dan kodon terakhir berakhir.
e. Klik Show picture of predicted genes in PDF file.
12. Apa kesimpulan Anda? (sertakan screenshoot) (6 poin)
Kesimpulan :
Gen HXK1 pada Arabidopsis thaliana memiliki Panjang sekuens 3165 bp dengan prediksi gen yaitu 1 dan prediksi ekson 7.
f. Buka halaman http://hollywood.mit.edu/GENSCAN.html
g. Masukkan optionArabidopsis dan Vertebrate pada menu Organism dan Predicted CDS and peptides pada link Print options.
h. Masukkan sekuen yang sama seperti di atas tetapi copy and paste pada bagian nukleiotida saja.
i. Klik Run GENSCAN.
j. Lihat hasilnya (sertakan screenshoot).
13. Apa perbedaan hasil analisis menggunakan http://www.softberry.com dengan hasil http://hollywood.mit.edu/GENSCAN.html ? (4 poin)
Pada FGENESH Prediksi struktur gen berbasis HMM (banyak gen, kedua rantai), sehingga number of prediction exon juga muncul sedangkan pada GENSCAN menemukan gen menggunakan transformasi Fourier sehingga hasilnya menunjukkan hanya ada 1 exon yang ditemukan dan tidak ada exon yang memberikan probalititas cutoff. Dengan nilai yang
dihasilkan juga berbeda dibandingkan dengan FGENESH. Hal ini dikarenakan perbedaan basis program. Akan tetapi hasilnya sama yaitu gen yang diprediksi satu.
➢ HOMOLOGY-BASED GENE PREDICTION PROGRAM a. Buka halaman http://blast.ncbi.nlm.nih.gov/
b. Pilih blastx program (genomic query versus protein database)
c. Masukkan sekuen sekuen pertama (Gene ID: 57879025) dan kedua (Gene ID: 829034), kemudian run blast!
d. Pilih protein yang teratas dari hasil blast.
e. Tampilkan urutan asam amino protein tersebut dalam format fasta.
f. Buka alamat http://www.ebi.ac.uk/Tools/Wise2/ (Program GENEWISE)
g. Copy paste sekuens protein yang telah didapat pada bagian sekuens 1 kemudian copy sekuens DNA awal (format fasta) pada bagian sekuens 2. Klik SUBMIT!
h. Jika hasilnya tidak dapat langsung ditampilkan, klik pada tautan link yang diberikan.
Pertanyaan
14. Protein apa yang dihasilkan Blastx? (sertakan dengan hasil screenshoot) (2 poin)
Protein yang dihasilkan setelah di blast pada NCBI dari gen treponema palidum yaitu hexokinase Protein yang dihasilkan setelah di blast pada NCBI dari gen Arabidopsis thaliana yaitu hexokinase 15. Berapakah jumlah gen yang muncul? Pada urutan nukletida ke berapa gen tersebut? (2
poin) Sertakan screenshoot hasilnya!
jumlah gen yang muncul yaitu 1 pada ke-434
jumlahh gen yang muncul 6 pada ke-409
16. Apa perbedaan cara dari prediksi gen dengan menggunakan FGENESH dan genewise? (2 poin)
Perbedaannya dimana FGENESH menggunakan HMM-base prediksi struktur gen (multiple gen, dan kedua ikatan) sedangkan pada GeneWise, yang memprediksi struktur gen menggunakan urutan protein serupa, dan Genomewise, yang menyediakan penguraian
akhir struktur gen di seluruh struktur spliced yang ditentukan cDNA dan EST. Kedua algoritma tersebut banyak digunakan oleh sistem anotasi Ensembl. Algoritma GeneWise dikembangkan dari kombinasi prinsip dari model Markov tersembunyi (HMM). Kedua algoritma sangat akurat dan dapat memberikan struktur gen yang akurat dan lengkap bila digunakan dengan bukti yang benar.
B. Analisis Promoter pada Eukariot
a. Pada halaman http://www.softberry.com, klik link SEARCH FOR PROMOTERS AND FUNCTIONAL MOTIFS, lalu pilih TSSP
b. Masukkan sekuen gen (Gene ID: 829034) dan (Gene ID: 3098) di atas, lalu klik PROCESS.
Pertanyaan
17. Ada berapa promoter yang didapatkan? Bagaimana Anda mengetahuinya? (2 poin) Untuk gen Arabidopsis thaliana 0 promotor yang diprediski dari hasil TSSP.
Sedangkan untuk gen manusia
Terdapat 36 promotor yang diprediksi.
18. Pada posisi berapa promoter tersebut berada? (2 poin)
Untuk Arabidopsis pada posisi 0,02 sedangkan untuk manusia ada 36 pos promotor diantaranya yaitu 48740, 48375, 93311, 67756, 37412, dan seterusnya yang ada pada gambar diatas.
19. Pada posisi berapa TATA box berada? (2 poin)
Untuk manusia TATA box berada pada posisi 93281, 67730, 37383, 75005, 58911, 52346, 24433, dan lainnya terdapat pada gambar diatas.
20. Apa yang dimaksud dengan TATA BOX? (2 poin)
Kotak TATA adalah urutan DNA yang menunjukkan di mana urutan genetik dapat dibaca dan diterjemahkan. Ini adalah jenis urutan promotor, yang menentukan molekul lain di mana transkripsi dimulai. Transkripsi adalah proses yang menghasilkan molekul RNA dari urutan DNA. Kotak TATA diberi nama untuk urutan DNA yang dilestarikan, yang paling umum adalah TATAAA. Banyak gen eukariotik memiliki kotak TATA yang terletak 25- 35 pasangan basa sebelum tempat awal transkripsi gen. Kotak TATA mampu menentukan arah transkripsi dan juga menunjukkan untai DNA yang akan dibaca. Protein yang disebut faktor transkripsi dapat mengikat kotak TATA dan merekrut enzim yang disebut RNA polimerase, yang mensintesis RNA dari DNA.
21. Mengapa ada huruf kecil pada sekuen “Transcription factor binding sites/RegSite DB”? Apa maksudnya? Mengapa ada huruf selain A, T, G, C? Jelaskan maksud huruf r, y, d, s, N pada sekuen “Transcription factor binding sites/RegSite DB” tersebut! (4 poin)
Faktor transkripsi (TF) adalah protein dengan aktivitas pengikatan DNA yang terlibat dalam regulasi transkripsi. Umumnya, TF memodulasi ekspresi gen dengan mengikat ke daerah promotor gen atau ke daerah distal yang disebut enhancer. algoritma memprediksi posisi awal transkripsi potensial dengan fungsi diskriminan linier yang menggabungkan karakteristik yang menggambarkan motif fungsional dan komposisi oligonukleotida dari situs-situs ini. TSSP menggunakan file dengan situs pengikatan faktor terpilih dari RegSite DB (Plants) yang dikembangkan oleh Softberry Inc.
Huruf kecuali (A,T,G,C) menggambarkan situs ambigu dalam motif urutan DNA tertentu, di mana satu karakter dapat mewakili lebih dari satu nukleotida menggunakan kode Nukleotida IUPAC Standar.
22. Beri kesimpulan terhadap metode pencarian TSSP? (6 poin)
TSSP merupakan algoritma yang memprediksi posisi awal transkripsi potensial dengan fungsi diskriminan linier yang menggabungkan karakteristik yang menggambarkan motif fungsional dan komposisi oligonukleotida dari situs-situs ini. TSSP menggunakan file dengan situs pengikatan faktor yang dipilih dari RegSite DB (Plants).
~Selamat Mengerjakan~