METODE PASANGAN KEMBAR
A. Setiawan
Program Studi Matematika, Fakultas Sains dan Matematika Universitas Kristen Satya Wacana Salatiga, Indonesia
Abstract. Twins that have a particular trait can be used to determine the genetic contribution to the trait. In this paper it is described a simulation study to determine the genetic factor. If the data of particular trait in MZ twin and DZ twin are available then by using the moment method and the maximum likelihood method, the genetic contribution can be determined.
Key-words: twin, genetic contribution, maximum likelihood method, moment method.
1
Pendahuluan
Kumpulan pasangan kembar dapat digunakan untuk mengetahui besarnya pengaruh faktor genetik terhadap sifat fenotip (trait) tertentu yang menjadi perhatian dengan membandingkan similaritas pada pasangan kembar MZ (monozygotic) dan DZ (dizygotic). Dalam makalah ini akan dijelaskan tentang penentuan besarnya pengaruh faktor genetik terhadap sifat fenotip dengan metode pasangan kembar. Simulasi digunakan untuk memberikan gambaran bagaimana estimasi dilakukan jika dimiliki data kategori tentang suatu trait pada sejumlah pasangan kembar MZ dan pasangan kembar DZ.
2
Dasar teori
Misalkan suatu trait kuantitatif X dari suatu individu yang dipilih secara random dari suatu populasi. Kita menganggap bahwa trait kuantitatif X mengikuti model aditif
X=f(G) +F,
dengan f(G) dan F faktor genetik dan faktor lingkungan (van der Vaart, 2006). Dalam hal ini dianggap bahwa G dan F saling bebas. Misalkan dianggap 2 individu masing-masing dengan trait X1 dan X2. Model yang biasa digunakan adalah
X1=f(G1) +C+E1,
X2=f(G2) +C+E2,
dengan (G1, G2) , C, E1, E2saling bebas dan E1, E2 berdistribusi identik. Dalam hal iniCadalah faktor lingkungan bersama danEadalah faktor lingkungan bukan bersama. Faktor genetik dapat didekomposisi lebih lanjut sebagai
f(Gi) = Ai+ Di,
dengan model ADCE sedangkan bila dianggap faktor dominansi tidak muncul dinamakanmodel ACE.
Misalkan suatu trait dengan dekomposisi X = f(G) + F, heritabilitas didefinisikan sebagai proporsi dari variansi yang ditentukan secara genetik dan dapat dinyatakan sebagai
)
(
))
(
(
))
(
(
)
(
))
(
(
F
V
G
f
V
G
f
V
X
V
G
f
V
,yang dapat diestimasi berdasarkan dari pengamatan di bawah beberapa anggapan. Heritabilitas dapat dipandang sebagai besarnya pengaruh faktor genetik terhadap sifat fenotip. Dalam model ADCE dan di bawah anggapan kesetimbangan perkawinan random, variansi dan kovariansi dari trait X1 dan X2 antara dua saudara dapat didekomposisi menjadi
E C D A
X
V
X
V
(
1)
(
2)
2
2
2
2
2 ,C D A
X
X
Cov
(
1,
2)
2
2
2
2 .Dalam hal ini
2A,
2D,
2C,
2E masing-masing adalah variansi aditif,variansi dominansi, variansi lingkungan bersama dan variansi lingkungan bukan bersama sedangkan dan masing-masing dinamakan koefisien kinship dan koefisien fraternityyang tergantung pada hubungan antara dua saudara tersebut (lihat Lange, 2002). Misalkan dimiliki sampel random dari trait antara saudara maka ruas kanan dapat diestimasi berdasarkan data pengamatan sehingga parameter yang tidak diketahui dapat diperoleh dengan menyelesaikan sistem persamaan linear tersebut. Untuk itu diperlukan paling sedikit 4 persamaan supaya dapat diidentifikasi. Hal ini dapat dicapai dengan melakukan sampling dari berbagai macam individu yang mempunyai hubungan saudara sehingga memiliki pasangan (,Δ) yang berbeda. Di samping itu dapat juga dilakukan pengurangan banyaknya parameter misalkan dengan menganggap variansi dominansi bernilai nol.
Pasangan kembar MZ dan pasangan kembar DZ dapat dibandingkan dalam semua hal kecuali hubungan genetik. Khususnya variansi lingkungan untuk pasangan kembar MZ dan pasangan kembar DZ dapat dimodelkan dengan parameter yang sama. Pasangan kembar MZ merupakan pasangan kembar yang identik secara genetik dan mempunyai = ½ dan Δ = 1 sedangkan pasangan kembar DZ mempunyai = 1/4 dan Δ = 1/4 . Misalkan dimiliki sampel random untuk pasangan kembar MZ dan pasangan kembar DZ, koefisien korelasi ρMZ dan
ρDZ antara trait mereka dapat diestimasi dengan koefisien korelasi sampel. Koefisien korelasi ρMZ danρDZ memenuhi persamaan
2 2 2 2
A D EMZ
,2
2 2 2
25
,
0
5
,
0
A D EDZ
.)
(
2
2 2
DZ MZ A
(1)yang dapat diestimasi dengan mengganti koefisien korelasi ρMZ dan ρDZ dengan koefisien korelasi sampel. Akibatnya pengaruh faktor lingkungan bersama dan pengaruh faktor lingkungan bukan bersama masing-masing dapat diestimasi dengan
MZ DZ C
2
2 2
dan
2 2
2 2
2 2
1
C A C
.Metode ini dapat digunakan asalkan 1 < ρMZ/ρDZ < 2 dan dikenal dengan nama metode momen. Untuk informasi lebih lanjut lihat Sham (1998).
Di samping metode momen dapat juga digunakan metode maximum likelihood. Misalkan faktor lingkungan bersama C dan faktor lingkungan bukan bersama E1, E2mempunyai distribusi normal. Akibatnya X1 dan X2 mempunyai distribusi bivariat normal dengan vektor mean dan matriks kovariansi berbentuk
dan
1
1
2
.Koefisien korelasi untuk pasangan kembar MZ dan pasangan kembar DZ masing-masing adalah dan dengan anggapan2D = 0 akan memenuhi
2 2 2
A EMZ
,2 2 2
5
,
0
A EDZ
.Hal itu berarti bahwa ruang parameter yang dimiliki adalah
= { ( ,2,2A,2C) | R ,2A,2C0,2-2A-2C0 }.
Parameter-parameter tersebut dapat diestimasi dengan menggunakan metode maximum likelihood.
Dekomposisi variansi yang telah dijelaskan di atas dapat diterapkan untuk trait kuantitatif dan trait kualitatif/trait kategori (categorical trait). Trait kategori dianggap sebagai suatu trait yang dipengaruhi oleh trait yang tidak teramati (unobservable trait) yang dinamakan liabilitas (liability). Trait yang teramati (observable trait) seperti berpenyakit tertentu atau tidak, akan berkaitan dengan suatu liabilitas yang melampaui ambang batas (threshold).
Y= 0 jikaXb, = 1 jikaX>b,
dengan b merupakan parameter ambang batas. Hal itu berarti bahwa individu yang berpenyakit jika liabilitas X melampaui b. Karena variabel random X tidak teramati maka tidak mungkin untuk mengidentifikasi mean dan variansinya sehingga tanpa meninggalkan sifat keumuman masing-masing dapat dibuat 0 dan 1. Untuk mengestimasi heribilitas dari suatu trait biner (binary trait) dari data trait (Y1, Y2) pada pasangan kembar, kita mengkaitkan Y1 dan Y2 dengan liabilitas X1 dan X2 melalui model ambang batas tersebut di atas dan model pasangan liabilitas (X1, X2) melalui model ACE. Heritabilitas dari trait biner kemudian dapat didefinisikan sebagai proporsi variansi genetik dalam liabilitas.
Distribusi dari data pengamatan diberikan oleh probabilitas P(Y1=y1,Y2=y2)
untuk y1, y2 { 0, 1} dan dihubungkan dengan distribusi liabilitas melalui persamaan
P(Y1= 0,Y2= 0) = P(X1b, X2 b ) =
b b
dx
dx
x
x
f
(
1,
2)
1 2,P(Y1= 0,Y2= 1) = P(X1b, X2 > b ) =
b
b
f
(
x
1,
x
2)
dx
1dx
2,P(Y1= 1,Y2= 0) = P(X1> b, X2 b ) =
b b
dx
dx
x
x
f
(
1,
2)
1 2,P(Y1= 1,Y2= 1) = P(X1> b, X2 > b ) =
b b
f
(
x
1,
x
2)
dx
1dx
2,dengan f adalah fungsi densitas (density function) normal bivariat yang diparametrisasi dengan (2A, 2C ) dan memberikan parameter = (b, 2A, 2C ) sebagai model untuk pengamatan (Y1, Y2). Parameter-parameter tersebut dapat diestimasi dengan menggunakan metode maximum likelihood. Metode ini diimplementasikan pada paket program Mx yang akan digunakan dalam makalah ini (Neale & Cardon, 1992).
3
Metode
Simulasi dilakukan untuk dengan cara membangkitkan sampel random dari distribusi normal bivariat berdasarkan model ACE dengan rumus :
2 1 2 1 2 1E
E
C
C
A
A
X
X
dengan
A A A AN
A
A
2 2 2 2 2 2 1,
0
0
~
pada pasangan kembar MZ dan
pada pasangan kembar DZ, sedangkan
C C C CN
C
C
2 2 2 2 2,
0
0
~
,
E EN
E
E
2 2 2 2 10
0
,
0
0
~
.Apabila terbentuk sampel random X1 dan X2 maka trait kategori yang terbentuk adalah Yi= 0 jikaXibdanYi= 1 jikaXi>buntuk i =1,2 danbyang dipilih. Dalam hal ini, misalkan dalam simulasi dipilih b= 1,2A= 0,8, 2C = 0,1 dan 2E= 0,1 sehingga
2A+2C+2E= 2= 1. Korelasi antaraX1danX2pada pasangan kembar MZ yaitu
2 2 2 2 2 1 2 1
)
(
)
(
)
,
(
A C EMZ
X
V
X
V
X
X
Cov
dapat dipandang sebagai korelasi polikorik (polychoric correlation) antara trait kategori untuk pasangan kembar MZ (Setiawan, 2007).
4
Hasil dan Pembahasan
[image:5.595.226.382.141.219.2]Implementasi dari metode yang dijelaskan pada pasal 3 digunakan paket program R. Dalam simulasi ini digunakan 400 pasangan kembar untuk memberikan gambaran bagaimana metode ini digunakan. Contoh dari hasil simulasi tersebut dapat dilihat pada Tabel 1 dan Tabel 2. Dari tabel tersebut, terlihat bahwa terdapat 400 pasangan kembar. Dari 400 pasang tersebut, terdapat 313 pasang yang keduanya tidak berpenyakit tertentu yang menjadi perhatian (trait), 17 pasang kembar yang orang kembar 1 tidak berpenyakit sedangkan orang kembar 2 berpenyakit, 21 pasang kembar yang orang kembar 1 berpenyakit sedangkan orang kembar 2 tidak berpenyakit, dan 49 pasang yang keduanya berpenyakit. Berdasarkan Tabel 1 dapat diestimasi besarnya korelasi polikorik dari sifat fenotip (trait) yang menjadi perhatian pada pasangan kembar MZ yaitu ρMZ dengan menggunakan paket program polychor dalam bahasa R (CRAN-R). Dengan cara yang sama dapat juga ditentukan ρDZ. Pengaruh faktor genetik dapat diestimasi kembali dengan menggunakan rumus (1). Demikian juga bila diberikan data Tabel 1 dan Tabel 2, dengan menggunakan Mx juga dapat diestimasi ulang pengaruh faktor genetik 2A/2= 2A/1 =2A, lingkungan bersama2Cdan lingkungan tidak bersama 2E. Bila simulasi dilakukan n= 40 kali maka akan diperoleh hasil lengkap seperti dinyatakan pada Tabel 3. Hal itu berarti bahwa kedua metode memberikan hasil yang relatif sama dan hasil yang diperoleh memberikan hasil yang tidak berbeda jauh dengan parameter input yang digunakan dalam simulasi.
Tabel 1. Tabel kontingensi dari status berpenyakit tertentu (kategori 1) atau tidak (kategori 0) pada pasangan kembar MZ
Kembar 2
Kembar 1 Kategori 0 Kategori 1
Kategori 0 313 17
Tabel 2. Tabel kontingensi dari status berpenyakit tertentu (kategori 1) atau tidak (kategori 0) pada pasangan kembar DZ
Kembar 2
Kembar 1 Kategori 0 Kategori 1
Kategori 0 285 46
Kategori 1 40 29
Tabel 3. Data hasil simulasi trait kategori pada pasangan kembar MZ dan DZ serta estimasi kembali pengaruh factor genetik 2A, lingkungan bersama 2C dan lingkungan tidak bersama 2E dengan menggunakan metode momen maupun metode maximum likelihood.
MZ DZ Metode Momen Metode ML
No (0,0) (0,1) (1,0) (1,1) (0,0) (0,1) (1,0) (1,1) 2A 2C 2E 2A 2C 2E
[image:6.595.113.513.265.660.2]5 Kesimpulan
Pasangan kembar MZ dan DZ yang mempunyai sifat fenotip tertentu dapat digunakan untuk menentukan besarnya pengaruh genetik terhadap sifat fenotip yang menjadi perhatian tersebut. Penelitian ini dapat diperluas untuk penentuan besarnya pengaruh genetik terhadap sifat fenotip kontinu seperti pada tinggi badan, BMI (body mass index) maupun beberapa sifat fenotip dalam satu kesatuan (model multivariat).
References
[1]
Lange, K. [2002], Mathematics and Statistical Methods for Genetic Analysis, Springer, New York[2]
Neale, M. C. & Cardon, L. [1992], Methodology for Genetic Studies of Twins and Families, Kluwer Academic Publishers, Dordrecht.[3]
Setiawan, A. [2007] , Statistical Data Analysis of Genetic Data in Twin Studies and Association Studies, Vrije Universiteit, Amsterdam, Ph.D Thesis, ISBN 978-90-9021728.[4]
Sham, P. [1998], Statistics in Human Genetics, A Hodder Arnold Publication, London.