• Tidak ada hasil yang ditemukan

IV HASIL DAN PEMBAHASAN

4.4 Analisis Error Identifikasi Struktur Sekunder Protein

Analisis error dilakukan untuk mengetahui bagaimana akurasi dari setiap segmen kelas/struktur yang dihasilkan dan mengetahui distribusi kelas yang salah diprediksi. Akurasi setiap segmen kelas/struktur yang dihasilkan pada proses identifikasi struktur sekunder protein dibuat dalam bentuk matriks konfusi. Matriks konfusi memperlihatkan persentasi struktur alpha-helix (H) , betha-sheet (B) dan coil (C) yang dikenali sesuai dengan kelasnya.

4.4.1 Matriks Konfusi Skenario 1

Matriks konfusi hasil pengujian skenario 1 memperlihatkan persentasi akurasi setiap kelas baik (H), (B) maupun (C) dengan Hidden Semi Markov Model (HSMM). Pada skenario ini durasi state yang digunakan adalah distribusi empiris dengan menggunakan 100% panjang maksimum durasi setiap state. Hasil Matriks konfusi dapat dilihat pada Tabel 5.

Tabel 5. Matriks konfusi pengujian skenario 1

kelas hasil prediksi akurasi prediksi (%) H B C k el as as al H 4401 295 1357 72, 7 B 978 1040 816 36,7 C 1495 417 3241 62,9

Berdasar hasil prediksi dari Matriks konfusi, terlihat bahwa dari 6053 residu asam amino yang memiliki struktur alpha-helix, ternyata 4401 residu yang terprediksi dengan benar, sedangkan sisanya terprediksi di kelas betha-sheet (B) sebanyak 295 residu dan coil sebanyak 1357 residu. Adapun struktur betha-sheet (B) dan coil (C) masing-masing diprediksi sesuai dengan kelasnya sebanyak 1040 residu dan 3241 residu. Akurasi prediksi setiap segmen struktur dapat dilihat pada grafik Gambar 21.

Hasil akurasi prediksi pada Gambar 21 memperlihatkan bahwa akurasi struktur alpha-helix (H) relatif lebih tinggi dibandingkan dengan akurasi struktur betha-sheet (B) dan coil dengan nilai 72, 7%. Adapun akurasi betha-sheet (B) dan coil (C) masing-masing sebesar 36,6% dan 62,9%.

Gambar 21. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 1

4.4.2 Matriks Konfusi Skenario 2

Prediksi tiap segmen struktur alpha-helix (H), betha-sheet (B) dan coil (C) pada skenario 2 ini menggunakan 90% panjang durasi state. Matriks konfusi pada pengujian skenario 2 dapat dilihat pada Tabel 6 untuk menggambarkan sebaran hasil identifikasi struktur sekunder protein baik alpha-helix (H), betha-sheet (B) maupun coil (C).

Tabel 6. Matriks konfusi pengujian skenario 2

kelas hasil prediksi akurasi prediksi (%) H B C kela s asal H 4396 295 1362 72,6 B 973 1043 818 36,6 C 1491 420 3242 62,9

Pada pengujian dengan 90% durasi state, terlihat bahwa dari sebanyak 4396 residu asam amino yang memiliki struktur alpha-helix (H), mampu diprediksi sesuai dengan strukturnya. Adapun struktur betha-sheet (B) dan coil masing-masing diprediksi dengan benar sebanyak 1043 residu dan 3242 residu.

Hasil akurasi prediksi (Gambar 22) memperlihatkan bahwa akurasi struktur alpha-helix (H) relatif lebih tinggi dibandingkan dengan akurasi struktur

betha-sheet (B) dan coil dengan nilai 72, 6%. Adapun akurasi betha-sheet (B) dan coil (C) masing-masing sebesar 36,8% dan 62,9%.

Gambar 22. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 2

4.4.3 Matriks Konfusi Skenario 3

Matriks konfusi skenario 3 menunjukkan hasil identifikasi struktur protein dengan model HSMM yang menggunakan panjang durasi state 75 % dari panjang total tiap struktur kelasnya. Hasil prediksi berupa Matriks konfusi dapat dilihat pada Tabel 7.

Tabel 7. Matriks konfusi pengujian skenario 3

kelas hasil prediksi akurasi prediksi (%) H B C kela s asal H 4394 295 1364 72,6 B 972 1019 843 36 C 1498 412 3243 62,9

Persentase akurasi prediksi pada pengujian skenario 3 masih memperlihatkan hasil masing-masing 72,6%, 36% dan 62,9% untuk prediksi struktur alpha-helix(H), betha-sheet(B) dan coil. Secara grafik, akurasi prediksi pada pengujian skenario 3 ini dapat dilihat pada Gambar 23.

Gambar 23. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 3

4.4.4 Matriks Konfusi Skenario 4

Matriks konfusi skenario 4 menunjukkan hasil identifikasi struktur protein dengan model HSMM yang menggunakan panjang durasi state 50 % dari panjang total tiap struktur kelasnya. Apabila dibandingkan dengan hasil identifikasi pada Matriks konfusi sebelumnya ternyata penggunaan 50 % panjang durasi state tidak memberikan kenaikan akurasi yang siginifikan. Matriks konfusi hasil prediksi pengujian skenario 4 dapat dilihat pada Tabel 8.

Tabel 8. Matriks konfusi pengujian skenario 4

kelas hasil prediksi akurasi prediksi (%) H B C kela s a sal H 4391 254 1408 72,5 B 1003 966 865 34, 1 C 1525 360 3268 63, 4

Berdasar Tabel 8 terlihat bahwa nilai akurasi prediksi struktur alpa-helix (H) dan betha-sheet (B) masing-masing adalah 72,5% dan 34,1%. Sementara pada prediksi coil (C) menghasilkan akurasi pada angka 63,4%. Akurasi prediksi struktur sekunder protein tiap segmen pada skenario 4 dapat dilihat pada grafik Gambar 24.

Gambar 24. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 4

4.4.5 Matrik Konfusi Skenario 5

Matriks konfusi skenario 5 menunjukkan hasil identifikasi struktur protein dengan model HSMM yang menggunakan panjang durasi tertentu. Dalam hal ini panjang durasi state yang ditentukan adalah 21. Matriks konfusi pada skenario 5 dapat dilihat pada Tabel 9.

Tabel 9. Matriks Konfusi Skenario 5

kelas hasil prediksi akurasi prediksi (%) H B C kela s asal H 4274 317 1462 70,6 B 950 1062 822 37,4 C 1421 429 3303 64,1

Penentuan panjang durasi state sebesar 21 memberikan hasil prediksi yang dapat dilihat pada Tabel 9. Sebanyak 4274 residu yang diprediksi sebagai alpha-helix (H), sedangkan sisanya diprediksi sebagai betha-sheet (B) sebanyak 317 residu dan coil (C) sebanyak 1462 residu. Adapun betha-sheet (B) diprediksi dengan benar sebanyak 1062 residu dan coil (C) diprediksi dengan benar sebanyak 3303 residu. Akurasi prediksi pengujian skenario 5 dapat dilihat pada Gambar 25.

Gambar 25. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 5

Penggunaan durasi state tertentu ini, memberikan akurasi prediksi yang berbeda bila dibandingkan dengan penggunaan presentasi panjang duras state. Dapat dilihat bahwa akurasi struktur alpha-helix (H) menurun dari sekitar 72% pada penggunaan presentase durasi state menjadi kurang lebih 70%. Sementara akurasi beta-sheet dan coil justru sedikit menaik masing-masing 37,4% dan 64,1%. Menurunnya akurasi alpha diduga disebabkan oleh hilangnya informasi durasi state dengan pemotongan panjang durasi yang hanya 21 ini. Padahal segmen alpha-helix memiliki distribusi dengan panjang maksimum terbesar.

4.4.6 Matriks Konfusi Skenario 6

Matriks konfusi skenario 6 menunjukkan hasil identifikasi struktur protein dengan model HSMM yang menggunakan panjang durasi tertentu, yaitu 15. Hasil identifikasi dalam Matriks konfusi diperlihatkan pada Tabel 10.

Tabel 10. Matriks Konfusi Skenario 6

kelas hasil prediksi akurasi prediksi (%) H B C ke la s asa l H 4007 359 1687 66,2 B 792 1177 865 41,5 C 1228 443 3482 67,6

skenario 6. Dibandingkan dengan skenario durasi empiris lainnya, penggunaan panjang durasi state sebesar 15 ini berdampak pada turunnya akurasi untuk prediksi struktur alpha-helix (H). Ini terlihat dari jumlah residu yang hanya 4007 diprediksi dengan benar atau 66,2% saja. Adapun akurasi betha-sheet (B) dan coil (C) justru mengalami kenaikan mencapai 41,5% dan 67,6%. Grafik akurasi prediksi struktur sekunder protein dapat dilihat pada Gambar 26.

Gambar 26. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 6

4.4.7 Matriks Konfusi Skenario 7

Matriks konfusi skenario 7 memperlihatkan hasil identifikasi struktur protein untuk model HSMM dengan peluang durasi state yang digunakan adalah distribusi dengan fungsi kepekatan peluang eksponensial negatif. Hasil Matriks konfusi dapat dilihat pada Tabel 11.

Tabel 11. Matriks Konfusi Skenario 7

kelas hasil prediksi akurasi prediksi (%) H B C k el as as al H 4717 218 1118 77,9 B 1209 834 791 29,4 C 1800 357 2996 58,1

Hasil akurasi prediksi dengan distribusi teoritis (Tabel 11) menunjukkan bahwa akurasi prediksi struktur alpha-helix (H) mencapai 77,9%. Akan tetapi akurasi

betha-sheet (B) dan coil justru menurun masing-masing 29,4 % dan 58,1%. Secara visual akurasi prediksi skenario 7 dapat dilihat pada grafik Gambar 27.

Gambar 27. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 7

4.4.8 Matriks Konfusi Skenario 8

Matriks konfusi skenario 8 memperlihatkan hasil identifikasi struktur protein untuk model HSMM dengan peluang durasi state yang digunakan adalah distribusi peluang normal. Akan tetapi rataan yang digunakan untuk menghitung fungsi kepekatan peluang adalah rataan geometrik. Ini dilakukan karena panjang segmen tiap struktur protein memiliki sebaran yang tidak normal. Hasil Matriks konfusi dapat dilihat pada Tabel 12.

Tabel 12. Matriks Konfusi Skenario 8

kelas hasil prediksi akurasi prediksi (%) H B C kela s asal H 4362 183 1508 72,1 B 1032 878 924 31,0 C 1577 331 3245 63,0

Pembangkitan distribusi durasi state dengan fungsi kepekatan peluang fungsi normal memberikan akurasi seperti yang terlihat pada Tabel 12. Akurasi prediksi struktur alpha-helix (H) sebesar 72,1% sedangkan prediksi struktur betha-sheet

(B) dan coil (C) menghasilkan akurasi masing-masing sebesar 31% dan 63%. Gambar 28 memperlihatkan grafik akurasi untuk pengujian skenario 8.

Gambar 28. Akurasi prediksi struktur sekunder protein tiap segmen kelas alpha-helix, betha-sheet dan coil model HSMM skenario 8

4.5 Perbandingan Akurasi Prediksi HSMM Distribusi Empiris dan

Dokumen terkait