MODUL 6 ANALISIS GEN DAN PROMOTER
Bebas
22
0
0
Teks penuh
(2) 2. Modul_6_BIOINFORMATIKA_BI6112_2020. MODUL A - ANALISIS GEN DAN PROMOTER PADA PROKARIOT A. Analisis Gen pada Prokariot a. Buka http://www.softberry.com, pada menu Run Program Online pilih Operon and Gene Finding In Bacteria pilih FGENESB. b. Jalankan program dengan menggunakan file FASTA yang sudah didownload, set Closest Organisms mengikuti organisme asal dari sekuens GENE ID dan klik PROCESS. c. Sertakan screenshoot hasilnya! Pertanyaan: 1. Ada berapa gen yang dihasilkan? (2 poin). Ada 1 gen yang dihasilkan 2. Ada berapa Transcription Unit (TU) pada sekuen tersebut? (2 poin) Ada 1 Transcription units (TU) 3. Ada berapa operon? (2 poin) 0 operon 4. Berapa produk gen (aa) terpanjang yang dihasilkan? Pada urutan nukleotida ke berapa? (4 poin) 1333 aa, pada urutan nukleotida 1-1333. B. Analisis Promoter pada Prokariot a. b. c. d.. Buka halaman http://www.softberry.com Pada Link Operon and Gene Finding in Bacteria, klik BPROM. Submit menggunakan format FASTA dari sekuen di atas. Klik PROCESS..
(3) 3. Modul_6_BIOINFORMATIKA_BI6112_2020. Pertanyaan: 5. Ada berapa promoter yang Anda temukan? Sebutkan berapa promoter yang anda temukan beserta sekuen dan sertakan screenshoot hasilnya. (4 poin). Ada 4 promoter : 1. 10 box posisi 954 CTTTACACT 35 box posisi 936 TGCACT 2. 10 box posisi 1272 CGATATCAT 35 box posisi 1246 TTGACT 3. 10 box posisi 108 AGATATGGT 35 box posisi 89 TTGTCG 4. 10 box posisi 427 TCTTACCCT 35 box posisi 408 CTGCAT. 6. Sebutkan urutan nukleotida apa saja yang dijadikan tempat TF binding site (tempat berikatannya faktor transkripsi)? (sertakan screenshoot hasilnya) (2 poin). purR. : CGTTTTTT argR : TTTTTTAT argR2 : TTTTTATT ihf : TTTTATTT. soxS : TATCATTT nagC : CATTTCAC ihf : GCTTAGAG rpoD15: TTTTGTTT.
(4) 4. Modul_6_BIOINFORMATIKA_BI6112_2020. MODUL B - ANALISIS GEN DAN PROMOTER PADA EUKARIOT A. Analisis Gen pada Eukariot Ø AB-INITIO-BASED GENE PREDICTION PROGRAM a. Pada halaman http://www.softberry.com, klik link GENE FINDING in Eukaryota. lalu pilih FGENESH. b. Masukan sekuens eukariot yang diperoleh c. Sesuaikan pilihan organism dengan sekuen yang didapat. d. Pilih organisme sesuai dengan identitas sekuen yang dimasukkan, lalu Klik SEARCH e. Klik Show picture of predicted genes in PDF file. Pertanyaan: 7. Ada berapa gen yang dihasilkan? (2 poin). Arabidopsis thaliana (ecotype: Columbia) => Ada 1 gen yang ditemukan.
(5) 5. Modul_6_BIOINFORMATIKA_BI6112_2020. Homo sapiens (Human) => Ada 2 gen yang ditemukan. 8. Berapa ekson yang dihasilkan oleh gen tersebut? Bagaimana dengan intron? (2 poin) Arabidopsis thaliana. => Exon ada 7 Intron ada 2 Homo sapiens (Human) => Exon ada 27 Intron ada 4.
(6) 6. Modul_6_BIOINFORMATIKA_BI6112_2020 9. Pada nukleotida ke berapa transkripsi dimulai dan berakhir? (2 poin) Arabidopsis thaliana. => Start kodon 337 Stop kodon 2864 Homo sapiens (Human) => Start kodon 17304, 88318 Stop kodon 80510, 131145. 10. Berapa panjang produk gen (aa) yang dihasilkan? (2 poin) Arabidopsis thaliana => mRNA 496 aa Homo sapiens (Human)=> mRNA1 351 aa, mRNA2 890 aa. 11. Jelaskan FGENESH output dibawah ini: (12 poin) • G => Nomor Gen • Str => Strand, + (langsung atau positif) atau - (negatif - pada untai komplementer untuk urutan yang diunggah) • Feature => angka yang menunjukkan nomor ekson untuk gen yang diprediksi • TSS => situs awal proses transkripsi • Start dan End => nomor dasar di mana fitur yang ditunjukkan dimulai dan diakhiri, menggunakan basis pertama yang dikirimkan sebagai '1' • ORF => lokasi kerangka baca terbuka untuk analisis, angka-angka ini akan identik dengan angka CDS 12. Apa kesimpulan Anda? (sertakan screenshoot) (6 poin). Arabidopsis thaliana Memiliki jumlah gen sebanyak 1, ekson 7 (CDSf,CDSi,CDSi,CDSi,CDSi,CDSi,CDSl), sedangkan lokasi sekuen TATA Box 161, lokasi PolA 3047. Start kodon=> 337-608 Stop Kodon=> 2441-2864.
(7) Modul_6_BIOINFORMATIKA_BI6112_2020. 7. Homo sapiens (Human). Memiliki jumlah gen sebanyak 2, ekson 27, sedangkan lokasi sekuen TATA Box 17304 dan 87197, lokasi PolA 80698 dan 131796 . Start kodon=> 88318-88414 Stop Kodon=> 131001-131145 f. g. h. i. j.. Buka halaman http://hollywood.mit.edu/GENSCAN.html Masukkan option Arabidopsis dan Vertebrate pada menu Organism dan Predicted CDS and peptides pada link Print options. Masukkan sekuen yang sama seperti di atas tetapi copy and paste pada bagian nukleiotida saja. Klik Run GENSCAN. Lihat hasilnya (sertakan screenshoot)..
(8) 8. Modul_6_BIOINFORMATIKA_BI6112_2020.
(9) 9. Modul_6_BIOINFORMATIKA_BI6112_2020.
(10) 10. Modul_6_BIOINFORMATIKA_BI6112_2020. 13. Apa perbedaan hasil analisis menggunakan http://www.softberry.com dengan hasil http://hollywood.mit.edu/GENSCAN.html ? (4 poin) WEBSITE PERBEDAAN http://www.softberry.com Memberikan informasi tentang jumlah gen, lokasi sekuen ekson, tata box, dan PolA, serta lokasi start kodon dan stop kodon dari suatu sekuen http://hollywood.mit.edu/GENSCAN.html Hanya berupa informasi seputar prediksi gen, ekson, dan intron.
(11) 11. Modul_6_BIOINFORMATIKA_BI6112_2020 Ø HOMOLOGY-BASED GENE PREDICTION PROGRAM a. Buka halaman http://blast.ncbi.nlm.nih.gov/ b. Pilih blastx program (genomic query versus protein database) c. Masukkan sekuen sekuen pertama (Gene ID: 57879025) dan kedua (Gene ID: 829034), kemudian run blast! d. Pilih protein yang teratas dari hasil blast. e. Tampilkan urutan asam amino protein tersebut dalam format fasta. f. Buka alamat http://www.ebi.ac.uk/Tools/Wise2/ (Program GENEWISE) g. Copy paste sekuens protein yang telah didapat pada bagian sekuens 1 kemudian copy sekuens DNA awal (format fasta) pada bagian sekuens 2. Klik SUBMIT! h. Jika hasilnya tidak dapat langsung ditampilkan, klik pada tautan link yang diberikan. Pertanyaan 14. Protein apa yang dihasilkan Blastx? (sertakan dengan hasil screenshoot) (2 poin).
(12) 12. Modul_6_BIOINFORMATIKA_BI6112_2020. Gene ID: 57879025 => Protein yang dihasilkan adalah Hexokinase.
(13) 13. Modul_6_BIOINFORMATIKA_BI6112_2020.
(14) 14. Modul_6_BIOINFORMATIKA_BI6112_2020. Gene ID: 829034 => Protein yang dihasilkan adalah Hexokinase-1. 15. Berapakah jumlah gen yang muncul? Pada urutan nukleutida ke berapa gen tersebut? (2 poin) Sertakan screenshoot hasilnya!. Gene ID: 57879025.
(15) 15. Modul_6_BIOINFORMATIKA_BI6112_2020. Gene ID: 829034 16. Apa perbedaan cara dari prediksi gen dengan menggunakan FGENESH dan genewise? (2 poin) METODE PREDIKSI GEN. PERBEDAAN. FGENESH. Output: G - jumlah gen yang diprediksi, mulai dari awal urutan; Str - untai DNA (+ untuk langsung atau - untuk pelengkap); Fitur - jenis urutan pengkodean: CDSf - Pertama (Dimulai dengan kodon Start), CDSi - internal (ekson internal), CDSl - segmen pengkodean terakhir, diakhiri dengan kodon stop); TSS - Posisi awal transkripsi (posisi dan skor TATA BOX); Mulai dan Akhir - Posisi Fitur; Bobot - Log kemungkinan*10 skor untuk fitur tersebut; ORF - posisi awal/akhir di mana kodon lengkap pertama dimulai dan kodon terakhir berakhir. Algoritma GeneWise dikembangkan dari kombinasi prinsip dari model Markov Model (HMM). GeneWise memecahkan masalah pengambilan sekuens protein tunggal atau HMM dan membandingkannya langsung dengan DNA genom, dengan mempertimbangkan sifat statistik yang diketahui dari struktur gen dan adanya kesalahan sekuensing.. GENEWISE.
(16) 16. Modul_6_BIOINFORMATIKA_BI6112_2020. B. Analisis Promoter pada Eukariot a. Pada halaman http://www.softberry.com, klik link SEARCH FOR PROMOTERS AND FUNCTIONAL MOTIFS, lalu pilih TSSP b. Masukkan sekuen gen (Gene ID: 829034) dan (Gene ID: 3098) di atas, lalu klik PROCESS. Pertanyaan 17. Ada berapa promoter yang didapatkan? Bagaimana Anda mengetahuinya? (2 poin). Gene ID: 829034 => 0 Promoter. Gene ID: 3098 => terdapat 13 Promoter dan 11 Enhancer.
(17) 17. Modul_6_BIOINFORMATIKA_BI6112_2020.
(18) 18. Modul_6_BIOINFORMATIKA_BI6112_2020.
(19) 19. Modul_6_BIOINFORMATIKA_BI6112_2020.
(20) 20. Modul_6_BIOINFORMATIKA_BI6112_2020.
(21) 21. Modul_6_BIOINFORMATIKA_BI6112_2020. 18. Pada posisi berapa promoter tersebut berada? (2 poin) Gene ID: 829034 => tidak terdapat promoter (0) Gene ID: 3098 => terdapat 24 Promoter, Pada Posisi (promoter): 44655 13809 6867 108990 126527 11467 110954 126619 74141 87398 17080 34374 30322 121895 32236 47132 25017 108366 71186 109438 4073 82983 91730 31455.
(22) 22. Modul_6_BIOINFORMATIKA_BI6112_2020 19. Pada posisi berapa TATA box berada? (2 poin) Gene ID: 829034 => tidak memiliki TATA BOX (0) Gene ID: 3098 => terdapat 13 TATA BOX Pada Posisi (TATA BOX): 6840 109405 110925 82949 17044 31417 30289 71151 126581 87383 121857 47096 108330. 20. Apa yang dimaksud dengan TATA BOX? (2 poin) TATA BOX adalah deret DNA yang ditemukan pada area promoter inti dari gen eukariota yang merupakan elemen cis yang mengarahkan RNA polimerase II menuju ke area transkripsi dengan akurat. Hanya sekitar 10% dari gen manusia memiliki TATA BOX, dan lebih dari 80% protein pada mamalia dihasilkan dari transkripsi gen yang tidak memiliki TATA BOX.. 21. Mengapa ada huruf kecil pada sekuen “Transcription factor binding sites/RegSite DB”? Apa maksudnya? Mengapa ada huruf selain A, T, G, C? Jelaskan maksud huruf r, y, d, s, N pada sekuen “Transcription factor binding sites/RegSite DB” tersebut! (4 poin) Huruf kecil berarti nukleotida non-konservasi dalam konsensus situsd isimbolkan sebagai gabungan antara basa nitrogen untuk membedakan antara basa purin dan pirimidin, atau bahkan kombinasi dari keduanya. r => G / A y=> T / C d=> G / A/ T s=> G / C N=> G / A/ T/ C *G=guanin, A=Adenin. C=sitosin, T=Timin. 22. Beri kesimpulan terhadap metode pencarian TSSP? (6 poin) TSSP merupakan Algoritma untuk memprediksi posisi awal transkripsi potensial dengan fungsi diskriminan linier yang menggabungkan karakteristik yang menggambarkan motif fungsional dan komposisi oligonukleotida. TSSP menggunakan file dengan situs pengikatan faktor terpilih dari RegSite DB (Plants) yang dikembangkan oleh Softberry Inc. Baris pertama -urutan sequence; Baris kedua dan ketiga - Ambang batas LDF dan panjang urutan yang disajikan , Baris ke-4 - Jumlah daerah promotor yang diprediksi , Baris berikutnya - posisi situs yang diprediksi, 'bobotnya' dan posisi kotak TATA (jika ditemukan), Posisi menunjukkan nukleotida pertama dari transkrip (posisi TSS). Setelah itu diberikan motif fungsional untuk setiap daerah prediksi; (+) atau (-) mencerminkan rantai langsung atau komplementer; Bidang seperti "RSP00004 tagaCACGTaga" berarti pengidentifikasi motif tertentu dengan urutan serupa yang ditemukan dari basis data Softberry Regsite-Plant..
(23)
Dokumen terkait