• Tidak ada hasil yang ditemukan

Analisis Populasi Jumlah Varian Besar dan Titik Panas Penyakit Genetika Manusia

N/A
N/A
Protected

Academic year: 2019

Membagikan "Analisis Populasi Jumlah Varian Besar dan Titik Panas Penyakit Genetika Manusia"

Copied!
4
0
0

Teks penuh

(1)

Analisis Populasi Jumlah Varian Besar dan Titik Panas Penyakit Genetika Manusia

Andy Itsara, 1,7 Gregory M. Cooper, 1,7 Carl Baker, 1 Santhosh Girirajan, 1 Jun Li, 2 Devin Absher, 3 Ronald M. Krauss, 4 Richard M. Myers, 3 Paul M. Ridker, 5 Daniel I. Chasman, 5 Heather Mefford, 1 Phyllis Ying, 1 Deborah A. Nickerson, 1 dan Evan E. Eichler1,6, *

Copy number variants (CNVs) berkontribusi terhadap keragaman genetik dan fenotipik manusia. Namun, distribusi CNV yang lebih besar pada populasi umum sebagian besar masih belum dijelajahi. Kami mengidentifikasi varian besar di ~ 2500 individu dengan menggunakan data Illumina SNP, dengan penekanan pada '' hotspot '' yang rentan terhadap mutasi berulang. Kami menemukan varian lebih besar dari 500 kb pada 5% -10% individu dan varian lebih besar dari 1 Mb dalam 1% -2%. Berbeda dengan penelitian sebelumnya, kami menemukan bukti terbatas untuk stratifikasi CNV dalam populasi manusia yang berbeda secara geografis. Yang penting, ukuran sampel kami memungkinkan perbedaan yang kuat antara variasi jumlah salinan yang benar-benar langka dan polimorfik tapi frekuensi rendah. Kami menemukan bahwa fraksi signifikan CNV individu yang berukuran lebih besar dari 100 kb jarang terjadi dan bahwa kedua kerapatan dan ukuran gen sangat anticorrelated dengan frekuensi alel. Jadi, walaupun CNVs besar biasanya ada pada individu normal, yang menunjukkan bahwa ukuran saja tidak dapat digunakan sebagai prediktor patogenisitas, variasi tersebut pada umumnya bersifat merusak. Mengingat pengamatan ini, kami menggabungkan data kami dengan CNV yang dipublikasikan dari lebih dari 12.000 individu kontrol kontras dan koleksi penyakit neurologis. Analisis ini mengidentifikasi lokus penyakit yang diketahui dan menyoroti CNV tambahan (misalnya, 3q29, 16p12, dan 15q25.2) untuk penyelidikan lebih lanjut. Studi ini memberikan salah satu analisis pertama terhadap CNV besar, langka (0,1% -1%) pada populasi umum, dengan wawasan yang relevan dengan masa depan.

analisis penyakit genetik. pengantar

Copy number variants (CNVs) adalah insertions, deletions, dan duplikasi urutan genom yang berkisar dari satu kilo base sampai beberapa megabasepairs dan merupakan kontributor utama keragaman genetik manusia.1-5 CNV diketahui mempengaruhi variasi normal dan penyakit, 6 dan setidaknya ada dua model asosiasi fenotip CNV yang berbeda namun tidak eksklusif. Satu model melibatkan polimorfisme jumlah salinan yang umum (CNPs) sering dengan beberapa status allelic yang didefinisikan oleh variasi dalam jumlah salinan dan / atau struktur genomik. Gen CNP diperkuat untuk fungsi biologis yang terkait dengan respons obat, kekebalan, dan persepsi sensorik, antara lain.7-9 Di bawah model ini, varian umum yang mengubah dosis gen atau unsur fungsional lainnya memengaruhi fenotipe seperti HIV-1 / Kerentanan AIDS (MIM

609423), 10 penyakit Crohn (MIM 266600), 11 dan

glomeru-lonfritis pada lupus eritematosus sistemik (MIM 152700) .12

Model kedua melibatkan CNV langka yang

menghapus atau menduplikam segmen genomik yang biasanya lebih besar dan ada di negara-negara alel yang lebih sedikit (yaitu hemizygous atau trisomic). CNV ini sangat penetran dan berumur pendek dalam populasi, baik yang terjadi di novo atau bertahan hanya untuk beberapa generasi dalam silsilah. Sebagian besar varian ini muncul oleh rekombinasi

homogen non-linear (NAHR) antara duplikasi segmental atau pengulangan dengan salinan rendah. yang secara formal didefinisikan sebagai gangguan genomik, sekarang ada puluhan sindrom yang diakui secara klinis, yang terkait dengan defisiensi kognitif, diabetes, epilepsi, dan sifat-sifat lainnya, yang berawal dari kejadian-kejadian yang dimediasi oleh NAHR. Dalam beberapa kasus, varian yang tumpang tindih namun berbeda mengarah pada sindrom yang sama, 13-17 sedangkan pada kasus lain fenotip lebih bervariasi.18-21 Selain itu, penelitian terbaru tentang autisme (MIM 209850) dan skizofrenia (MIM 181500) menemukan kelebihan bulk CNV langka pada individu yang terkena dampak dibandingkan dengan yang tidak terpengaruh, menunjukkan bahwa beberapa spesies langka yang ada pada individu yang terkena patogen.22-25

Jadi, walaupun hanya sejumlah varian langka yang telah dikaitkan secara de fi nitif dengan penyakit, kemungkinan sebagian besar asosiasi sifat CNV sesuai dengan hipotesis 'common disease-rare variant' ', berbeda dengan' 'umum varians penyakit-varian umum 'yang mendasari kebanyakan asosiasi asosiasi genom.

(2)

salinan pada populasi manusia sebagian besar telah dibatasi pada ratusan individu dan oleh karena itu tidak dapat membedakan varian yang benar-benar langka (<1%) dari varian yang bersifat polimorfik namun pada frekuensi rendah.2, 26 Studi terbaru

mulai berkembang pada koleksi sampel yang jauh lebih besar, namun berfokus pada analisis spesi fi k penyakit daripada efek genomik yang lebih luas dari CNV besar dan langka.1-4,23,25 Di sini, kita menganalisis variasi jumlah salinan

1 Departemen Ilmu Genom, Fakultas Kedokteran, Universitas Washington, Seattle, WA 98195, AS; 2Departemen Genetika Manusia, Universitas Michigan, Ann Arbor, MI 48109, AS; 3HudsonAlpha Institute for Biotechnology, Huntsville, AL 35806, USA; 4 Rumah Sakit Anak-anak Oakland Research Insti- tute, Oakland, CA 94609, USA; 5Center untuk Pencegahan Penyakit Kardiovaskular, Donald W. Reynolds Center for Cardiovascular Research, Brigham and Women's Hospital, Harvard Medical School, Boston, MA 02115, USA; 6Howard Hughes Medical Institute

7 Penulis ini berkontribusi sama terhadap pekerjaan ini * Korespondensi: eee@gs.washington.edu

DOI 10.1016 / j.ajhg.2008.12.014. ª2009 oleh The American Society of Human Genetics. Seluruh hak cipta.

di sekitar 2.500 individu dewasa yang tampaknya normal dengan menggunakan data genotipe SNP Illumina. Kami menemukan bahwa varian yang besar jarang ditemukan (masing-masing ditemukan pada satu atau beberapa individu) namun secara kolektif sering terjadi (kebanyakan individu membawa satu atau lebih besar CNV) pada populasi manusia dan bahwa NAHR adalah kontributor mekanistik yang besar untuk CNV langka dan umum. Analisis ukuran dan kandungan gen dalam kaitannya dengan frekuensi alel menunjukkan bahwa CNV adalah sebagai kelas di bawah seleksi pemurnian yang kuat dan dengan demikian cenderung secara fenotipik berpengaruh. Akhirnya, menggabungkan data kami dengan meta-analisis varian publisitas, kami menunjukkan kegunaan sumber daya kami dengan menyarankan lokus penyakit neurologis kandidat. Kami menggambarkan salah satu analisis pertama dari CNV besar yang dipisahkan pada frekuensi yang jarang (0,1% -1%) pada populasi umum, kerangka kerja untuk memanfaatkan informasi ini dalam studi penyakit, dan implikasi hasil kami untuk analisis genetika di masa depan.

Bahan dan metode

Koleksi Sampel dan Genotip SNP

Data diperoleh dari tiga penelitian (Tabel 1): Farmakogenetik dan Risiko Penyakit Kardiovaskular (PARC), individu normal neurologis yang

diidentifikasi di Institut Nasional untuk Gangguan Neuro- logis dan Stroke (NINDS), dan Panel Genom Genom Manusia (HGDP) ). Sampel PARC adalah subset dari kohort yang digunakan dalam dua percobaan statin, CAP dan PRINCE, 27,28 dan terdiri dari 960 orang usia menengah (40-70 tahun) individu keturunan Eropa yang tinggal di Amerika Serikat dengan tingkat yang cukup tinggi kolesterol. NINDS sampel diperoleh dari Pusat Sumber Daya Genetika Manusia NINDS DNA dan Cell Line Repository. Data genotipe dari NINDS berasal dari dua set kontrol penyakit neurologis yang berjumlah 790 orang dan terdiri dari individu keturunan Eropa tanpa riwayat keluarga atau kerabat tingkat pertama dengan sklerosis lateral amyotrophic, ataksia, autisme, aneurisma otak, distonia, penyakit

Parkinson. , atau skizofrenia. HGDP terdiri dari 1.064 individu yang diambil dari 51 populasi dunia yang berbeda.29,30 Meskipun subset dari HGDP (n ¼ 485) telah dianalisis sebelumnya untuk CNV, 31

(3)

Dari sampel ini tersedia secara online (lihat Sumber Web). Karya ini disetujui oleh Komite Penelaahan Subjek Manusia di University of Washington, National Institute on Aging, dan Stanford University untuk sampel PARC, NINDS, dan HGDP.

CNV Discovery

Semua koordinat probe dipetakan ke majelis genom manusia membangun 35 (hg17) dengan

menggunakan liftOver. Kami menggunakan metode yang dikembangkan sebelumnya, berdasarkan Model Markov Tersembunyi (HMM), untuk

mengidentifikasi penghapusan homozigot, penghapusan heterozigot, dan kejadian duplikasi (Gambar S1) .33,34 Metode ini mempertimbangkan rasio logon transek dan frekuensi b-alel ( BAF) untuk masing-masing probe berdasarkan basis per sampel (Gambar 1). Secara khusus, kami menentukan HMM 4-negara yang mengambil sebagai masukan intensitas LogR, berubah menjadi ukuran normal standar (Z-score) di atas kromosom, dan akar kuadrat dari kuantitas yang kami sebut b-deviasi. Penyimpangan dari probe didefinisikan sebagai penyimpangan dari BAF yang diharapkan dengan diberi genotipe. Untuk homozigot, ini didefinisikan sebagai minimum BAF dan 1-BAF, sedangkan untuk heterozigot, ini didefinisikan sebagai nilai mutlak BAF 0,5. Untuk genotipe gagal atau probe CNV, b-deviasi adalah nilai minimalnya.

HMM menganalisis setiap kromosom setiap sampel secara terpisah. Penugasan negara HMM

digabungkan menjadi beberapa segmen sesuai kriteria berikut: probe berturut-turut dari keadaan yang sama yang kurang dari 50 kb terpisah

digabungkan, dan jika dua segmen dari keadaan yang sama dipisahkan oleh urutan intervensi% 5 probe dan % 10 kb, kedua segmen dan urutan intervensi disebut sebagai varian tunggal. Ini menghasilkan 460.395 panggilan HMM (Gambar S1). Sebelum analisis lebih lanjut, sampel dieliminasi jika hibridisasi tidak memiliki standar deviasi standar genom sebesar% 0,25, nilai absolut dari rata logR% 0,1, dan rata-rata deviasi b

<0,05.

Kami kemudian membagi CNV sementara menjadi dua kategori:

'' Kecil '' CNV <100 probe dan panjang <1 Mb dan '' besar '' dengan probe R100 atau R1 Mb. Semua CNV besar biasanya dikuratori. CNV kecil dikenai pemfilteran otomatis. Penghapusan homozigot diwajibkan untuk memiliki probe R3, nilai rata-rata logR Z-score% 4, dan rujukan rata-rata runtime R0.1 atau R3 dan median nilaiRRR Z-score% 8;

Penghapusan heterozigot diperlukan untuk membentang probe R10, memiliki

skorRRRRRRRRR + 1,5, dan kurang dari

10% probe disebut heterozigot; Untuk duplikasi, kita memerlukan probe R10, LogR Z-score R1.5, dan b-deviasi di antara probe heterozigot R0.075.

Titik api penataan ulang sebelumnya telah ditetapkan sebanyak4,35 sebagai

daerah genom dari 50 kb sampai 10 Mb yang dilipat oleh duplikasi segmental besar1,3,13 dari kesamaan urutan tinggi (R10 kb, identitas R95%). Duplikasi ini bisa menghasilkan NAHR selama meiosis dan oleh karena itu mempengaruhi daerah ini dengan generasi peristiwa penghapusan / duplikasi baru. Banyak CNV yang secara signifikan terkait dengan peta penyakit manusia di dalam atau diberi tanda kurung dengan duplikasi segmental.14,17-20,23,25,36 Karena pengaruh mereka dalam studi penyakit, penataan ulang titik api yang tidak diidentifikasi sebagai varian oleh HMM diputar melalui statistik intensitas yang dijelaskan di atas dan secara khusus diperiksa untuk positif palsu. Serangkaian panggilan kecil ini dikecualikan dalam analisis yang menilai duplikasi segmental dan pengayaan hotspot untuk menghindari bias pemastian dalam hasil.

(4)

Referensi

Dokumen terkait

inas Koperasi dan UMKM merupakan salah satu dinas teknis pengemban amanah masyarakat Kabupaten Kulon Progo melaksanakan kewajiban berakuntabilitas melalui penyajian

bahwa dalam rangka memperkuat upaya pembudayaan hidup bersih dan sehat, mencegah penyakit berbasis lingkungan, meningkatkan kemampuan masyarakat, serta

Seseorang yang mengalami gejala demam/riwayat demam tanpa pneumonia yang memiliki riwayat perjalanan ke China atau wilayah/negara yang terjangkit, dalam waktu 14 hari DAN

1) Pelanggaran keempat dikenakan sanksi atas alasan sebagaimana dikenakan sanksi 6 (enam) bulan. 2) Pelanggaran kedua dikenakan sanksi atas alasan sebagaimana

Jatuhan debu radioaktif yang dilepaskan sebagian akan jatuh ke laut dan kemudian melalui rantai makanan akan terakumulasi dalam biota laut. Jika biota laut itu dimakan oleh manusia

Dengan menyikat gigi secara benar setelah makan pagi dan sebelum tidur malam, kebersihan gigi dan mulut terjaga dengan aktivitas fisik dan Diabetes Mellitus dengan

Dari segi industrial, Lactobacillus casei mempunyai peran dalam probiotik manusia, kultur starter pemroduksi asam untuk fermentasi susu, dan kultur khas

tadi diukur pada skala lintang terdekat yang berada di kiri/kanan peta dan hitunglah berapa menit busur derajat lintangnya; 1 menit busur = 1 mil laut) haruslah sama dengan jauh