Memahami Urutan
Kuliah Umum 22 Janu 22 Janu Habib R Laboratorium GenomGenom
m BB Biogen ari 2013 ari 2013 RijzaaniManual Kehidupan
"Life DOES come
read
VisiGen on DNn
with
instructions
,
them."
NA SequencingGen vs. Genom
Gen:
Genetika (genetics)
1 atau beberapa gen
zoom-in
Genom:
Genomika (genomics)
Banyak atau seluruh ge
zoom-out
-om & -omika
Genom (gen+kromoso 1920), genomika (1980 -om: obyek kajian, -om Arti: total atau keseluru genom+bioinformatika Genomika, metagenom epigenomika, proteomik nutrigenomika, farmako toksikogenomika, glikom http://omics.org
m, Prof. Hans Winkler, 0-an), -omika (1990-an)
ika: bidang kajian uhan (2000-an): mika, transkriptomika, ka, metabolomika, ogenomika, mika, ekspresomika ... g
-omika
“Omika adalah istilah u bidang ilmu sains dan t interaksi obyek informa 'om' [ ] Fokus utamanom . [...] Fokus utaman obyek informasi sepert 2) menemukan jalinan merekayasa jaringan d memahami dan meman pengaturan; dan 4) me dan sub-bidang -omika
omics.org
mum untuk sebuah
teknik yang mempelajari asi hayati dalam berbagai
nya adalah: 1) pemetaan nya adalah: 1) pemetaan
i gen, protein dan ligan; interaksi antar obyek; 3) an obyek untuk
nipulasi mekanisme
nggabungkan aneka -om a.”
Pengurutan Genom
Sanger, 1975 Berbasis kloning, PCR (gel/kapiler) 500-1000 pbm Gen. 1
R dan elektroforesisSanger utk. Genom
Shotgun sequencing Genom bakteri Haemophilus influenzae 1,830,137 pb 25.000 potongan (50K reads) Program bionformatika utk.merakit urutan genom utuh
Shotgun Sequenci
Gen Bacaa Berjenjang Bacaa Pera Ran Urutaning
nom an acak Seluruh Genom an acak akitan ngka GenomPengurutan Genom
2005 (30 tahun setelah
m: Gen. 2
Pengurutan Genom
Next-generation seque Tanpa kloning! Pemain (kimia)( ) 454/Roche (pyrosequen Solexa/Illumina (reversi Solid/ABI (sequencing-bm: Gen. 2
ncing (NGS) ncing) ible terminator) by-ligation)Illumina/Solexa seq
P P P Pquencing
Pemotongan genom Penambahan adapter Pustaka DNA genom
Pembentukan gugus
Perbanyakan potongan
genom pada flow cell lewat PCR
Solid-state cloning
Penyiapan Pustaka
Pemotongan Genom
Nebulizer (gas)
Sonicator (suara)
g-Tube (gaya sentrifuga
g Tube (gaya sentrifuga
Transposon (enzim)
a Genom
al) al)
Penyortiran ukuran
Proses pembentukan g DNA oleh mesin sekue panjang potongan DNA
n potongan
gugus dan pembacaan enser hanya efektif pada
Penempelan adaptter
Adapter untuk
manipulasi dalam proses lanjutan
Barcode, indeks
Pemilihan ukuran & kuantifikasi
cBOT
Pembentukan Gug
Penempelan potongan DNA dari pustaka genom ke flow
cell & perbanyakan molekul
DNA membentuk gugus 1000-an molekul melalui PCR
Pembacaan urutan
Illumina: pengurutan m (sequencing-by-synthen DNA
elalui sintesis sis, SBS)Pembacaan urutan
Siklus 1 Siklus 2 Siklus 3 Siklus 4 Siklus 5, ... 1 2n DNA
Bacaan 1: GCTGA Bacaan 2: AGCCG 1 lajur flow cell =>
100-200 juta gugus/bacaan 200 juta gugus/bacaan
Pembacaan urutan
Single-end & Paired-e
Bacaan ujung tunggal
n DNA
nd reads
Pengurutan Genom
Tanpa perbanyakan po
Langsung dari 1 molek
Nanoteknologi, semikon H li Helicos Ion Torrent Mendeteksi pelepasan dNTP oleh polimerase Pacific Biosciences
Single molecule real tim
m: Gen. 3
otongan DNA!
kul DNA
nduktor, sensor plasma
proton saat penyisipan
Perbandingan
Sanger 8 Roche / 454 4 AB / SOLiD 2x Illumina / Solexa 2x 800 nt ~80 kb 450 nt 0.5 Gb 50 nt 60 Gb 100 nt 300 Gbbases 1 Gb 10 Gb AB sho ( 100 Gb
Perbandingan
rea per machine run 10 bp 10 1 Gb 100 Mb 10 Mb 1 Mb B/SOLiDv3, Illumina/GAII ort-read sequencers 454 GS FLX 10+Gb in 50-100 bp reads, >100M reads, 4-8 days)From John McPherson, OICR
ad length
1,000 bp 00 bp
ABI capillary sequencer
454 GS FLX pyrosequencer
(100-500 Mb in 100-400 bp reads, 0.5-1M reads, 5-10 hours)
(0.04-0.08 Mb in 450-800 bp reads, 96 reads, 1-3 hours)
Perakitan urutan g
Selayang pandang proses pembacaan selur
Reads PotonganDNA genom Contigs Scaffolds Pemetaan scaffolds Peta genom
enom
Gambaran menyeluruh dari semua
reads yang saling bersambung dan
membentuk sebuah contig.
Perakitan urutan g
Tampilan dekat: urutan basa dari tiap read
(bacaan) dan posisinya dalam contig
(sambungan).
Tampilan dekat: urutan basa dari contig yang
terbentuk.
Istilah
Read (bacaan) Contig (sambungan) Scaffold (rangka) Scaffold (rangka) Gap (celah) Celah fisik dan celah ur
Coverage (liputan) Depth (kedalaman)
Quality score (skor kua
rutan
Coverage depth (d
Coverage is the term u to which a large assem instances of smaller ob in which coverage is m read coverage of a gen read coverage of a gen contig
Ukuran genom 1 Mb
Sekuensing: 1 juta bac Liputan: panjang total b
(1 juta X 100 pb) / 1 juta
alamnya liputan)
sed to quantify the extent mbly object is covered by
bjects. The three contexts ost often discussed are nome read coverage of a nome, read coverage of a
aan, 100 pb
bacaan/ukuran genom
Panjang potongan genom:
n
L
Panjang potongan genom: jumlah bacaan: n
panjang tiap bacaan: l
Definisi: Coverage C = n
Berapa liputan yang cukup? Model Lander-Waterman
Dengan asumsi sebaran C=10 akan menghasilkan nukelotida. L C L L n l / L n:
bacaan yang seragam, n 1 celah per 1 juta
Q30
Skor kualitas basa Skala phred QV = - 10 * log10(Pe) P g ( ) Pe= kemungkinan salah. Q30: kemungkinan salah 1/1000 99.9% benar
Phred Quality Perror(obs. base)
3 50.12% 5 31.62% 10 10.00% 15 3.16% 20 1.00% 25 0.32% 30 0.10% 35 0.03% 40 0.01%
Hasil pembacaan
@HWI_0023:1:1:16103 TTATGTGTTTATTACGTTN TTTACGGGTTATTTA + + hhhhhhghhhhhhghdeeB hhghfffaehghhcX Berkas format Fastq
Setiap basa memiliki ko
3:1200 N:0:1
NTTTG...AATGTTTA
Bee__...hfhhghhg
Penerapan
Pengurutan DNA, anali analisa ekspresi RNA, variasi DNA struktural, protein-DNA (Chip-Seq analisa small RNA de analisa small RNA, de metatranskriptomika, se Mesin sama, pendekata
Penyiapan sampel/pust
Analisa data/bioinforma
isa pengaturan gen, penemuan SNP dan
GWAS, analisa interaksi q), analisa DNA metilasi,
novo metagenomika novo metagenomika, ekuensing amplikon,... aan berbeda dalam:
taka genom atika
Genomika Fungsio
Sekuen genom + Koleksi mutan Penyisipan T-D t ki i mutagen kimia Profil ekspresi gen men
Microarray, ES
Sekuen genom lain
Plasma nutfah
Anotasi
Prediksi struktu
ontology), seku
onal
DNA, penandaan transposon, i
awi
nyeluruh
ST, pustaka cDNA, transkriptom
terkait, spesies lain
ur dan fungsi gen (gene uen pengatur
Anotasi
>contig-1 GAAAGATCGCTGGTTA CTCTAATCACTTTTTT TCGCGGTTTCTGCGG ATCCGAGTTAAACGC AAGAACCACAGAAAA CGTCGTTTCTCGTTCTAPA
CAACCGAATATACAGC TTCTGCTCTGTAATCGT GCCATAAAATAAAGTAA CTGATAGTCGCGCCTG AAACAGAAAATATCTCC TCGTTTCCGA INI?
Anotasi
>gi|359806297Glycine ma DATE 3A-like (LOC100 ATGGACCCTCTTGTCAT AGATGTTTTGGAGCC TCTCTTA FEATURES Location/Q source 1..522 /organism="Glycin /chromosome="18 gene 9..122 /note="protein HE ax protein HEADING 815541) TTGGACGTGTAGTAGG CTTTCACTAGTTGCGTC Qualifiers ne max" 8"
Anotasi
Memahami urutan geno Urutan genom (sambun
Tingkat DNA:g Dimana exon, translasi, prom Tingkat protein: Motif, domain, Tingkat proses: Seluler, lokasi biokimia om ngan/rangka)
intron, situs awal transkripsi, moter, homologi
situs aktif, enzim
Penerapan
De novo Sequencing
Perakitan genom tanpa
Draft vs. Finished Contig (sambungan) da Contig (sambungan) da panjang Chromosome Targeted Resequencin
Fokus pada daerah tert
Multiplex (sekali perunu
rujukan
an scaffold (rangka) yang an scaffold (rangka) yang
g
tentu: exon, motif, family utan, banyak sampel)
Penerapan
Epigenetika
Metilasi DNA (ChipSeq)
Modifikasi histon
Kemudahan akses krom
Metagenomika De novo sequencing sa Keragaman 16S DNA metatranskriptom ) matin ampel lingkungan
Contoh
A complete reference g indeed a valuable reso improvement is finding variation.
Urutan genom rujukan i
pemuliaan tanaman ada memanfaatkan variasi g
genome sequence is
urce, but the key to crop and exploiting genetic
itu berharga, tetapi kunci alah menemukan dan
Contoh
A map of rice genome va of cultivated rice Nature. 20 S i Sequencing: 1529 genom padi: 446 Oryza rufip 1083 Oryza sa 15 genom pembanding coverage) 1 O. Rufipogon (100X c outgroug (50X coverage
ariation reveals the origin
012 Oct 25;490(7421):497-501.
pogon (paired-end, 2X coverage) ativa (paired-end, 1X coverage)
(outgroup, wild oryza 3X
coverage, de novo), 1 e)
Metode
Pemetaan thd. genom
Identifikasi SNP
Genetika populasi
GWAS
Populasi pemetaan, BIL
Asosiasi fenotipe
Anotasi
BLAST, prediksi model
rujukan
L & CSSL
Contoh
Resequencing 50 acce wild rice yields markers agronomically importan
Xun Xu, Susan McCouc
nature biotechnology V JANUARY 2012 Cultivar: 40 Japonica: 24 Indica: 12 Wild type: 10 Rufipogon: 5 Nivara: 5
essions of cultivated and s for identifying
nt genes
ch et al
Hasil
Jutaan SNP teridentifik Menguak proses dome
Japonica dan indica sec
didomestikasi
Japonica bernenek moy
China
Penemuan gen
Ribuan gen terseleksi s
mungkin penting secara
Penemuan marka
SNP untuk pemuliaan p
kasi
estikasi padi:
cara independen
yang O. Rufipogon dari
selama proses domestikasi, a agronomis