UNIVERSITAS INDONESIA

(1)

UNIVERSITAS INDONESIA

Evaluasi Kinerja Autodock 4.2 dan Autodock Vina 1.1 dalam Proses Molecular Docking dan Virtual Screening

di Lingkungan Cluster Hastinapura

SKRIPSI

Muhammad H. Hilman 0606101755

Fakultas Ilmu Komputer Universitas Indonesia

Juni 2010

(2)

i

UNIVERSITAS INDONESIA

Evaluasi Kinerja Autodock 4.2 dan Autodock Vina 1.1 dalam Proses Molecular Docking dan Virtual Screening

di Lingkungan Cluster Hastinapura

SKRIPSI

Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer

Muhammad H. Hilman 0606101755

Fakultas Ilmu Komputer Universitas Indonesia

Juni 2010

(3)

ii

Judul : Evaluasi Kinerja Autodock 4.2 dan Autodock Vina 1.1 dalam Proses Molecular Docking dan Virtual Screening di Lingkungan Cluster Hastinapura

Nama : Muhammad H. Hilman NPM : 0606101755

Laporan Tugas Akhir ini telah diperiksa dan disetujui.

Depok, 23 Juni 2010 Pembimbing Tugas Akhir

Prof. Drs. Heru Suhartanto, M.Sc, Ph.D

(4)

iii

HALAMAN PERNYATAAN ORISINALITAS

Tugas Akhir ini adalah hasil karya saya sendiri, dan semua sumber baik yang dikutip maupun dirujuk

telah saya nyatakan dengan benar

Nama : Muhammad H. Hilman NPM : 0606101755

Tanda Tangan :

Tanggal : 23 Juni 2010

(5)

iv Tugas Akhir ini diajukan oleh :

Program Studi : Ilmu Komputer

Judul : Evaluasi Kinerja Autodock 4.2 dan Autodock Vina 1.1 dalam Proses Molecular Docking dan Virtual Screening di Lingkungan Cluster Hastinapura

Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian persyaratan yang diperlukan untuk memperoleh gelar Sarjana Ilmu Komputer pada Program Studi Ilmu Komputer, Fakultas Ilmu Komputer, Universitas Indonesia.

Dewan Penguji

Pembimbing : Prof. Drs. Heru Suhartanto, M.Sc, Ph.D ( )

Penguji : Prof. Dra. Belawati H. Widjaja, M.Sc, Ph.D ( )

Penguji : Dr. Arry Yanuar ( )

Penguji : Rizal Fathoni Aji, S.Kom, M.Kom ( )

Ditetapkan di : Depok Tanggal : 6 Juli 2010

(6)

v

KATA PENGANTAR

Puji serta syukur penulis panjatkan kepada Allah SWT karena berkat rahmat dan karunia-Nya penulis berhasil menyelesaikan tugas akhir yang berjudul

“Evaluasi Kinerja Autodock 4.2 dan Autodock Vina 1.1 dalam Proses Molecular Docking dan Virtual Screening di Lingkungan Cluster Hastinapura”. Laporan yang penulis susun ini merupakan tahapan akhir dari proses penelitian yang penulis jalani selama lima bulan terakhir.

Ucapan terima kasih penulis sampaikan kepada pihak-pihak yang telah membantu pelaksanaan penelitian dan penulisan laporan ini. Doa, bimbingan, arahan, bantuan teknis dan sokongan semangat mereka membuat proses ini menjadi lebih hidup. Secara khusus penulis ingin menyampaikan ucapan terima kasih kepada:

1. Bapak Prof. Drs. Heru Suhartanto, M.Sc, Ph.D, pembimbing tugas akhir yang telah memberikan penulis kesempatan untuk belajar dan mengaplikasikan ilmu yang telah didapat di perkuliahan dalam penelitian yang beliau supervisi.

2. Bapak Dr. Arry Yanuar, peneliti dari jurusan Farmasi, FMIPA UI yang telah memperkenalkan topik drug discovery yang menjadi objek penelitian utama penulis.

3. Bapak Muhammad Rifki Shihab, B.BA, M.Sc, selaku pembimbing akademik yang telah memberikan arahan, bimbingan dan masukan selama 4 tahun terakhir sampai akhirnya penulis sampai pada tahap akhir pendidikan sarjana.

4. Bapak Ir. Wisnu Jatmiko, M.Kom, Dr. Eng, manajer riset Fasilkom UI, tempat penulis belajar banyak hal mengenai penelitian sebagai salah satu asisten beliau.

5. Bapak Drs. Mulyadi, M.T dan Ibu Yati Sribudiarti Karya, S.Pd, selaku orangtua di Tasikmalaya beserta keluarga yang telah sepenuh hati mendidik dan mendukung segala aktivitas kuliah yang penulis jalani.

6. Rekan-rekan staf dan pengajar di Bimbingan dan Konsultasi Belajar Nurul Fikri Wilayah Jakarta III yang senantiasa memberikan dorongan untuk terus

(7)

vi

menyemangati dan Fara Anisa, pejuang ronin yang tetap gigih mengejar cita-citanya menjadi mahasiswa kedokteran.

7. Teman-teman Fasilkom angkatan 2006 yang selalu menjadi inspirasi dan sumber kreativitas penulis dalam menyelesaikan laporan tugas akhir, khususnya Ari Wibisono dan Toni Dermawan yang sama-sama berjuang di topik High Performance Computing, serta M. Arief Furqon teman yang selalu menyuplai kebutuhan yang cukup penting bagi penulis.

8. Teman-teman alumni SMA Negeri I Tasikmalaya, khususnya Chintia Dewi, Farizy Yunas dan Assafa Sufiani, selaku sesama alumni SMA Negeri I Tasikmalaya angkatan 2006 yang berjuang di Universitas Indonesia serta Dhananjaya Yama Huda Kumarajati, teman sekelas yang sedang berjuang di Kota Yogyakarta.

9. Sahabat-sahabat baru di Komunitas Outdoor Adventure & Nature Club (OANC) Kaskus yang telah memberikan inspirasi lewat perjalanan hati di tanah tertinggi Pulau Jawa, Puncak Mahameru sesaat sebelum deadline Tugas Akhir ini bergulir.

Penulis menyadari bahwa laporan ini masih belum sempurna dan memiliki banyak kekurangan. Oleh karena itu, penulis memohon kritik dan saran yang konstruktif demi kemajuan dan perkembangan penulis.

Depok, 23 Juni 2010

Penulis

(8)

vii

HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS

Sebagai sivitas akademika Universitas Indonesia, saya yang bertanda tangan di bawah ini:

Program Studi : Ilmu Komputer Fakultas : Ilmu Komputer Jenis karya : Tugas Akhir

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Indonesia Hak Bebas Royalti Noneksklusif (Non-exclusive Royalty Free Right) atas karya ilmiah saya yang berjudul:

Evaluasi Kinerja Autodock 4.2 dan Autodock Vina 1.1 dalam Proses Molecular Docking dan Virtual Screening

di Lingkungan Cluster Hastinapura

beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Nonekslusif ini Universitas Indonesia berhak menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta

Demikian pernyataan ini saya buat dengan sebenarnya.

Ditetapkan di : Depok Tanggal : 23 Juni 2010

Yang menyatakan

Muhammad H. Hilman

(9)

viii ABSTRAK

Nama : Muhammad H. Hilman Program Studi : Ilmu Komputer

Judul : Evaluasi Kinerja Autodock 4.2 dan Autodock Vina 1.1 dalam Proses Molecular Docking dan Virtual Screening di Lingkungan Cluster Hastinapura

Riset-riset ilmu pengetahuan berbasis Teknologi Informasi (TI) membutuhkan sumber daya komputasi yang tinggi. Kendala fasilitas dan dana memunculkan teknologi sumber daya komputasi kinerja tinggi alternatif berbasis cluster dan grid computing. Salah satu riset yang membutuhkan sumber daya komputasi yang tinggi adalah penemuan obat (drug discovery) dengan proses molecular docking dan virtual screening. Proses pencocokan antara ligand dan receptor (molecular docking) berbasis TI dalam skala besar (virtual screening) memakan waktu yang cukup lama jika dikerjakan secara serial. Dalam penelitian ini dibahas mengenai pemanfaatan teknologi cluster yang dimiliki Universitas Indonesia untuk menguji kinerja aplikasi Autodock 4.2 dan Autodock Vina 1.1 dalam menjalankan proses docking dan virtual screening secara paralel. Hasil dari penelitian ini adalah analisis running time dan speed up dari kedua aplikasi untuk beberapa sampel data.

Kata kunci: sumber daya komputasi kinerja tinggi, penemuan obat, molecular docking, virtual screening.

(10)

ix ABSTRACT

Name : Muhammad H. Hilman Study Program : Computer Science

Title : Performace Evaluation of Autodock 4.2 and Autodock Vina 1.1 in Molecular Docking and Virtual Screening Process on Hastinapura Cluster Environment

IT-based scientific research requires high computational resources. Facilities and funding constraints led to alternative technology of high performance computing based on cluster and grid computing. One of scientific research that requires high computational resources is a drug discovery by molecular docking and virtual screening process. Matching process between the ligand and the receptor (molecular docking) based IT on large scale (virtual screening) takes a long time if done in serial. In this study discusses the use of cluster technology, which is owned by Universitas Indonesia to test the performance of Autodock 4.2 and Autodock Vina 1.1 in carrying out the process of molecular docking and virtual screening in parallel. Results from this study is analysis of running time and speed-up of the two applications for some sample data.

Keywords: high performance computing, drug discovery, molecular docking, virtual screening.

(11)

i

Halaman

HALAMAN JUDUL ... i

LEMBAR PERSETUJUAN ... ii

LEMBAR PERNYATAAN ORISINALITAS ... iii

LEMBAR PENGESAHAN ... iv

KATA PENGANTAR ... v

LEMBAR PERSETUJUAN PUBLIKASI ILMIAH ... vii

ABSTRAK ... viii

DAFTAR ISI ... x

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

DAFTAR KODE SUMBER ... xiii

DAFTAR LAMPIRAN ... xiv

BAB 1 PENDAHULUAN 1 1.1 Latar Belakang ... 1

1.2 Perumusan Masalah ... 2

1.3 Tujuan Penelitian ... 2

1.4 Manfaat Penelitian ... 3

1.5 Ruang Lingkup Penelitian ... 3

1.6 Sistematika Penulisan ... 3

BAB 2 LANDASAN TEORI 5 2.1 Bioinformatika ... 5

2.1.1 Penemuan Obat Berbasis TI ... 6

2.1.2 Molecular Docking ... 7

2.1.3 Aplikasi Molecular Docking ... 9

2.2 Sumber Daya Komputasi Kinerja Tinggi ... 12

2.2.1 Mesin Cluster Hastinapura ... 13

BAB 3 METODOLOGI PENELITIAN 15 3.1 Tahapan Penelitian ...…... 15

3.1.1 Workflow penelitian ... 16

3.2 Sistem Pendukung Penelitian ... 18

3.3 Data Penelitian ... 19

3.3.1 Pemilihan Data ... 19

3.3.2 Pemrosesan Data ... 19

3.4 Pengukuran Kinerja ... 21

BAB 4 HASIL PENELITIAN DAN ANALISIS 22 4.1 Hasil Penelitian ...…... 22

4.2 Analisis ... 25

BAB 5 PENUTUP 28 5.1 Kesimpulan ...…... 28

5.2 Kendala ... 29

5.3 Saran ... 28

DAFTAR PUSTAKA ... xv

(12)

ii

DAFTAR TABEL

Halaman Tabel 3.1 Spesifikasi cluster hastinapura ... 18 Tabel 3.2 Spesifikasi PC Desktop ... 18 Tabel 3.3 Perbandingan tahapan pre-docking Autodock 4.2 dan

Autodock Vina 1.1 ... 21 Tabel 4.1 Perbandingan running time pada Autodock 4.2 ....……….. 23 Tabel 4.2 Perbandingan running time pada Autodock Vina 1.1 …... 24

(13)

iii

Halaman

Gambar 1.1 Rancangan arsitektur RI-Grid ... 1

Gambar 2.1 Ilustrasi keterkaitan TI dan biologi dalam bioinformatika.. 5

Gambar 2.2 Molecular docking antara dua molekul ... 8

Gambar 2.3 Diagram arsitektur Collaborative Molecular Environment 9 Gambar 2.4 Arsitektur inGRID ... 13

Gambar 3.1 Tahapan penelitian ... 15

Gambar 3.2 Workflow penelitian ... 17

Gambar 4.1 Kondisi cluster hastinapura ………. 22

Gambar 4.2 Perbandingan running time pada Autodock 4.2 ………... 23

Gambar 4.3 Perbandingan running time pada Autodock Vina 1.1 …... 24

Gambar 4.4 Tren penambahan data pada serial job ……… 24

Gambar 4.5 Tren penambahan data pada parallel job ……… 25

Gambar 4.6 Hasil percobaan The Scripps Research Institute …………. 25

Gambar b.1 Tampilan situs resmi ZINC ………. xx

Gambar b.2 Menu “Subsets” pada situs ZINC ……… xx

Gambar b.3 Menu “By Property” pada situs ZINC ... xxi

Gambar b.4 Menu “lead-like” pada situs ZINC ... xxi

Gambar b.5 Tampilan aplikasi Autodock Tools 1.5.2 ……… xxiii

Gambar b.6 Tampilan molekul protein target (receptor) ……… xxiv

Gambar b.7 Notifikasi dalam pembentukan receptor.pdbqt ……… xxiv

Gambar b.8 Tampilan menu Map Types ………. xxv

Gambar c.1 Tampilan situs resmi ZINC ………. xxviii

Gambar c.2 Menu “Subsets” pada situs ZINC ……… xxviii

Gambar c.3 Menu “By Property” pada situs ZINC ………. xxix

Gambar c.4 Menu “lead-like” pada situs ZINC ……….. xxix

Gambar c.5 Tampilan aplikasi Autodock Tools 1.5.2 ………. xxxi

Gambar c.6 Tampilan molekul protein target (receptor) ……… xxxii

Gambar c.7 Notifikasi dalam pembentukan receptor.pdbqt …………... xxxii

(14)

iv

DAFTAR KODE SUMBER

Halaman Kode sumber b.1 Skrip untuk mengekstrak berkas multiple ligand …… xxii Kode sumber b.2 Skrip untuk mengubah ligand *.mol2 menjadi

*.pdbqt ……… xxiii

Kode sumber b.3 Skrip untuk menghitung atomic affinity maps ……… xxv Kode sumber b.4 Skrip yang digunakan untuk menyiapkan berkas

*.dpf ……….. xxvi

Kode sumber b.5 Skrip pada Autodock 4.2 untuk pemrosesan serial

job ……… xxvi

Kode sumber b.6 Skrip pada Autodock 4.2 untuk pemrosesan parallel

job ……… xxvii

Kode sumber c.1 Skrip untuk mengekstrak berkas multiple ligand …… xxx Kode sumber c.2 Skrip untuk mengubah ligand *.mol2 menjadi

*.pdbqt ……… xxxi

Kode sumber c.3 Berkas konfigurasi ……….. xxxiv Kode sumber c.4 Skrip pada Autodock Vina 1.1 untuk pemrosesan

serial job ………. xxxiv

Kode sumber c.5 Skrip pada Autodock Vina 1.1 untuk pemrosesan

parallel job ……….. xxxv

(15)

v

DAFTAR LAMPIRAN

Halaman Lampiran A. Tutorial Instalasi Autodock 4.2 & Autodock Vina 1.1 ... xviii Lampiran B. Tutorial Molecular Docking pada Autodock 4.2 ... xx Lampiran C. Tutorial Molecular Docking pada Autodock Vina 1.1 ... xxviii

(16)

1 BAB 1 PENDAHULUAN

Bab ini menjelaskan latar belakang, perumusan masalah, tujuan dan ruang lingkup penelitian. Selain itu dibahas pula sistematika penulisan laporan tugas akhir secara keseluruhan.

1.1 Latar Belakang Penelitian

Perkembangan teknologi informasi (TI) membuat dunia riset ilmu pengetahuan berevolusi. Riset-riset ilmu pengetahuan berbasis TI dilazimkan dengan nama e-Science [1]. Pemanfaatan TI dalam eksperimen virtual membutuhkan sumber daya komputasi kinerja tinggi. Kendala dana dalam pembangunan infrastruktur sumber daya komputasi kinerja tinggi dalam bentuk supercomputer merupakan permasalahan yang senantiasa dihadapi para peneliti di negara berkembang. Oleh karena itu, implementasi teknologi sumber daya komputasi kinerja tinggi dalam bentuk cluster dan grid computing merupakan teknologi alternatif yang cukup murah bagi kemajuan ilmu pengetahuan di negara dunia ketiga [2]. Rancangan teknologi grid computing yang dimiliki Indonesia (RI-GRID) dapat dilihat pada Gambar 1.1

Gambar 1.1 Rancangan arsitektur RI-GRID [2]

UI-GRID

RI-GRID

ITB-GRID

. . . . .

.

MPI Cluster SGE

Cluster

User

xxx-GRID

(17)

Universitas Indonesia

Salah satu bidang ilmu yang membutuhkan dukungan teknologi sumber daya komputasi kinerja tinggi adalah penemuan obat (drug discovery) [3]. Proses penemuan obat dengan metode molecular docking, pencocokan antara molekul zat/senyawa calon obat (ligand) dengan protein target (receptor), dalam skala besar berbasis TI (virtual screening) membutuhkan waktu yang lama apabila dilakukan serial [4]. Pemanfaatan teknologi cluster dalam membagi dan mengeksekusi job secara paralel diharapkan dapat mempercepat pemrosesan data dan membuka cakrawala riset penemuan obat yang belum banyak dilakukan oleh instansi-instansi farmakologi di Indonesia.

1.2 Perumusan Masalah

Pemrosesan data dalam penemuan obat membutuhkan sumber daya komputasi kinerja tinggi. Pemrosesan secara serial menghabiskan waktu yang lama sehingga dibutuhkan alternatif pembagian job untuk mempercepat proses yang dijalankan. Aplikasi Autodock 4.2 dan Autodock Vina 1.1 yang digunakan dalam penelitian dapat memanfaatkan teknologi cluster untuk mengeksekusi job secara paralel [4]. Penelitian ini akan membandingkan kinerja Autodock 4.2 dan Autodock Vina 1.1 yang dijalankan secara paralel pada cluster hastinapura yang dimiliki oleh Universitas Indonesia dengan pemrosesan secara serial pada PC Desktop biasa.

1.3 Tujuan Penelitian

Penelitian ini secara umum bertujuan untuk membuka cakrawala riset berbasis TI di Indonesia dalam bidang farmakologi dengan topik penemuan obat.

Secara khusus penelitian ini bertujuan untuk mengukur kinerja dan efisiensi aplikasi untuk molecular docking dan virtual screening yaitu Autodock 4.2 dan Autodock Vina 1.1 yang memanfaatkan cluster hastinapura dalam mengeksekusi job secara paralel.

(18)

3

1.4 Manfaat Penelitian

Manfaat dari penelitian ini adalah didapatnya informasi mengenai penggunaan aplikasi Autodock 4.2 dan Autodock Vina 1.1 dalam proses molecular docking dan virtual screening dalam bentuk review dan tutorial. Selain itu, dengan penelitian ini penulis dapat mencoba dan mengukur efektifitas kinerja kedua aplikasi dalam melakukan eksekusi job dalam virtual screening secara paralel pada cluster hastinapura. Dengan penelitian ini diharapkan pada masa yang akan datang, penggunaan teknologi cluster dan grid computing akan dijadikan sebagai metode alternatif yang murah dalam melakukan penelitian di bidang penemuan obat di Indonesia.

1.5 Ruang Lingkup Penelitian

Ruang lingkup penelitian ini dibatasi pada pengukuran kinerja aplikasi dan teknologi cluster yang digunakan. Penelitian ini bukan penelitian dalam penemuan obat secara utuh, yang penulis lakukan adalah melakukan pengukuran kinerja dan komparasi atas aplikasi yang akan digunakan untuk penemuan obat termasuk di dalamnya cara pemasangan, konfigurasi dan cara penggunaan. Oleh karena itu data yang digunakan dalam penelitian ini merupakan data dummy yang digunakan semata-mata untuk menguji aplikasi dan bukan untuk menghasilkan kesimpulan dalam penemuan obat.

1.6 Sistematika Penulisan

Laporan tugas akhir ini disusun dengan sistematika penulisan sebagai berikut:

a. BAB 1 PENDAHULUAN

Bagian ini berisi latar belakang, perumusan masalah, tujuan, manfaat, ruang lingkup, dan sistematika penulisan laporan.

(19)

b. BAB 2 LANDASAN TEORI

Bagian ini berisi pembahasan mengenai teori bioinformatika termasuk metode penemuan obat berbasis TI dengan molecular docking dan virtual screening. Selain itu dibahas pula teori mengenai topik sumber daya komputasi kinerja tinggi yang mengangkat teknologi cluster yang digunakan dan aplikasi yang dipasang pada sistem cluster tersebut.

c. BAB 3 METODOLOGI PENELITIAN

Bagian ini berisi tahapan dalam penelitian yang dijalankan. Dalam bagian ini dibahas pula mengenai data yang digunakan dalam penelitian dan juga metode dalam pengukuran kinerja.

d. BAB 4 HASIL PENELITIAN DAN ANALISIS

Bagian ini menjelaskan hasil penelitian yang berhasil didapatkan. Di samping itu, dikupas pula analisis dari hasil penelitian yang diperoleh.

e. BAB 5 PENUTUP

Bagian ini merupakan bagian akhir dari laporan tugas akhir yang berisi kesimpulan dari penelitian yang telah dijalankan, kendala-kendala yang dihadapi dan saran-saran terkait penelitian yang bisa penulis sampaikan.

(20)

5 BAB 2

LANDASAN TEORI

Bab ini menjelaskan teori dasar terkait bioinformatika dan juga topik mengenai penemuan obat berbasis TI yang didasarkan atas proses molecular docking dan virtual screening. Selain itu dibahas pula teori mengenai sumber daya komputasi berkinerja tinggi, mesin cluster hastinapura dan aplikasi Autodock 4.2 serta Autodock Vina 1.1 yang digunakan dalam penelitian.

2.1 Bioinformatika

Bioinformatika adalah salah satu cabang ilmu baru yang muncul pasca perkembangan biologi molekul yang memungkinkan manusia untuk memahami cetak biru informasi genetik dalam bentuk DNA (asam deoksiribonukleat) [5]. Bioinformatika didefinisikan sebagai metode matematika, statistik dan komputasi yang bertujuan untuk menyelesaikan masalah-masalah biologi dengan menggunakan sekuen DNA dan asam amino serta informasi lain yang terkait dengannya [5]. Ilustrasi tentang bioinformatika dapat dilihat pada Gambar 2.1

Gambar 2.1 Ilustrasi keterkaitan TI dan biologi dalam bioinformatika [6]

(21)

Konsep bioinformatika dan komputasi biokimia memiliki kedekatan makna tapi berbeda secara prinsip [7]. Secara mudah, garis demarkasi yang membedakan antara keduanya adalah dari latar belakang kelimuan para pelakunya. Seorang ahli biokimia yang memfokuskan diri dalam penggunaan alat dan sistem komputasi untuk menjawab berbagai permasalahan dalam ilmu biokimia adalah seorang bioinformatikawan. Sementara ahli TI, matematikawan, statistikawan dan insinyur yang mengembangkan teori, algoritma dan teknik untuk alat dan sistem komputasi yang digunakan para bioinformatikawan adalah seorang ahli komputasi biokimia

[7].

Laporan tugas akhir ini bisa dipandang sebagai sebuah karya ilmiah dalam bidang bioinformatika dan komputasi biokimia sekaligus. Pembahasan tentang penemuan obat yang cukup banyak dan perangkat lunaknya mendekatkan laporan ini kepada bioinformatika. Akan tetapi, latar belakang penulis di bidang TI membuat penulis merasa bahwa laporan ini harus menyentuh aspek-aspek komputasi biokimia sehingga laporan ini pun menyertakan pembahasan mengenai sumber daya komputasi kinerja tinggi yang terkait dengan aplikasi yang digunakan.

2.1.1 Penemuan Obat Berbasis TI

Salah satu topik dalam bioinformatika adalah penemuan obat (drug discovery). Pada awal abad ke 19, ketika komputer dan biologi baru berkembang, Louis Pasteur dan Charles Babbage sibuk dalam penelitian masing-masing.

Penelitian Pasteur terkait mikroorganisme yang berperan dalam fermentasi alkohol sementara Babbage mengembangkan sebuah mesin yang dapat menghitung sejumlah bilangan. Tidak ada yang menyangka bahwa puluhan tahun setelahnya, kedua bidang ilmu itu menjadi dasar revolusi dunia farmasi [7].

Proses penemuan obat bermula dari pencarian zat/senyawa yang dapat menekan perkembangbiakan agent penyebab penyakit. Perkembangbiakan agent tersebut dipengaruhi oleh banyak hal, diantaranya adalah enzim-enzim yang diproduksi oleh sel-sel dalam tubuh. Zat/senyawa yang dapat mengurangi laju keluarnya enzim yang membantu perkembangbiakan agent penyebab penyakit dapat dikategorikan sebagai calon obat [5].

(22)

7

Sebelum TI digunakan dalam proses penemuan obat, pencarian zat/senyawa yang cocok (screening) untuk menjadi calon obat harus dilakukan secara manual satu-persatu di laboratorium. Hal ini menjadi mahal dan tidak efisien karena jumlah zat/senyawa yang akan menjadi calon obat mencapai ratusan bahkan ribuan. Dengan adanya TI yang membantu proses screening pangkalan data zat/senyawa, telah berhasil mengurangi biaya riset dalam penemuan obat.

Walaupun eksperimen laboratorium tetap harus dilakukan untuk verifikasi, jumlah zat/senyawa yang diuji tidak terlalu banyak karena komputer sudah menghitung beberapa zat/senyawa yang memiliki kriteria paling baik [8]. Dalam beberapa kasus, hasil yang didapat dari komputasi model matematika menghasilkan produk yang lebih akurat karena meminimalisir tingkat kesalahan pada level eksperimen laboratorium [9].

Ada beberapa metode pemodelan komputer yang digunakan dalam proses penemuan obat diantaranya molecular mechanic, molecular dynamic, quantum mechanic dan molecular docking [9]. Molecular mechanic merupakan metode dalam menganalisa energi pada sebuah atom yang diasumsikan diam sehingga mengurangi waktu komputasi dan lebih mudah digunakan. Molecular dynamic menggunakan pendekatan sebaliknya, metode ini memungkinkan penghitungan energi dengan asumsi atom dalam keadaan bergerak secara dinamis. Quantum mechanic menggunakan pendekatan fisika kuantum dalam menghitung energi.

Sementara molecular docking merupakan metode yang menerapkan simulasi grafis tiga dimensi yang mengamati interaksi antara ligand dan receptor [9].

2.1.2 Molecular Docking

Metode penemuan obat berbasis TI yang menjadi landasan teori dalam laporan ini adalah molecular docking. Molecular docking dapat didefinisikan sebagai proses komputasi dalam melakukan pencarian model geometri dan energi yang cocok dari sebuah molekul zat/senyawa (ligand) calon obat untuk wilayah tertentu (binding site) yang ada pada molekul protein target (receptor) [10]. Mayoritas pemodelan pada molecular docking mengambil asumsi bahwa protein targetnya adalah sebuah receptor yang rigid dan ligand yang fleksibel. Namun, kedua aplikasi yang digunakan dalam penelitian ini memungkinkan pemodelan

(23)

dalam bentuk receptor dan ligand yang fleksibel. Proses molecular docking pada ligand A dan receptor B dapat dilihat pada Gambar 2.2

Gambar 2.2 Molecular docking antara dua molekul [11]

Faktor utama dalam molecular docking adalah pencarian konformitas posisi ligand dan receptor yang menggunakan algoritma pencarian tertentu dan penghitungan energi bebas dari ligand pada ikatannya yang disebut scoring function. Proses ini dapat dilakukan berdasarkan informasi standar yang selalu ada pada setiap atom dan ikatan antar atom pada sebuah makromolekul. Tiga jenis informasi yang memiliki keterkaitan erat adalah panjang ikatan kimia (jarak antara dua atom), sudut ikatan kimia (sudut orbit antara dua ikatan kimia yang berdekatan), dan jumlah torsi aktif [12]. Salah satu metode penghitungan energi yang digunakan AMBER (Assisted Model Building with Energy Refinement) force fields, adalah sebagai berikut,

fungsi energi yang dinyatakan oleh V(r^N), dimana Σbonds menyatakan hubungan energi antar atom yang dipengaruhi jarak (l), Σangles menyatakan energi antar atom yang dipengaruhi sudut geometri (), Σtorsions menyatakan energi yang

(24)

9

dipengaruhi torsi aktif dan Σij menyatakan energi dari setiap atom tidak berikatan yang merupakan persamaan van der waals [13].

Proses screening pangkalan data ligand oleh receptor dalam molecular docking dengan bantuan TI dinamakan virtual screening. Virtual screening yang sering juga disebut high troughput screening dilakukan untuk mencari zat/senyawa yang memiliki kriteria yang paling tepat untuk dijadikan calon obat dari ratusan bahkan ribuan zat/senyawa yang tersedia dalam pangkalan data [3].

2.1.3 Aplikasi Molecular Docking

Aplikasi yang digunakan dalam penelitian ini yaitu Autodock 4.2 dan Autodock Vina 1.1 dikembangkan oleh The Scripps Research Institute, sebuah lembaga riset biomedik nonprofit dari California, San Diego, Amerika Serikat

[14]. Autodock Vina 1.1 merupakan aplikasi yang dikembangkan dari Autodock 4.2 yang sudah dirilis sebelumnya oleh TSRI. TSRI bekerja sama dengan Interknowlogy telah mengembangkan sistem riset bioinformatika berbasis TI yang dinamakan Collaborative Molecular Environment (C-ME). Diagram arsitektur C- ME dapat dilihat pada Gambar 2.3

Gambar 2.3 Diagram arsitektur Collaborative Molecular Environment [15]

(25)

Berikut ini adalah penjelasan terkait kedua aplikasi yang digunakan dalam penelitian yaitu Autodock 4.2 dan Autodock Vina 1.1. Kedua aplikasi ini memiliki keuntungan tersendiri apabila dijalankan pada mesin berbasis cluster karena program scheduler qsub yang tersedia dapat membagi molecular docking job untuk setiap ligand pada mesin-mesin yang tersedia. Proses paralelisasi pada kedua aplikasi ini bersumber pada skrip penjadwalan qsub yang membagi setiap job pada Autodock 4.2 dan Autodock Vina 1.1 kepada setiap mesin yang memiliki resource pada saat tersebut. Detail skrip penjadwalan yang membagi job secara paralel dapat dilihat pada Lampiran B dan C yang membahas penjelasan teknis molecular docking.

1. Autodock 4.2

Autodock 4.2 merupakan versi terbaru yang dirilis oleh TSRI. Secara umum Autodock 4.2 didesain untuk memprediksi bagaimana sebuah ligand berinteraksi dengan receptor dalam format 3D [10]. Autodock 4.2 memiliki fungsi untuk menghitung energi yang berbasis linier regression analysis

[10]. Untuk metode pencarian koordinat yang paling tepat antara ligand dan receptor, Autodock 4.2 memanfaatkan Monte Carlo Simulated Annaeling (SA) [12] dan The Lamarckian Genetic Algorithm (LGA) [12].

Paket Autodock 4.2 terdiri dari aplikasi autodock4 sebagai aplikasi utama untuk melakukan molecular docking antara ligand dengan grid/koordinat atom pada receptor dan autogrid4 sebagai aplikasi untuk menghitung grid/koordinat atom pada receptor pada tahapan pre-docking.

Proses molecular docking pada aplikasi Autodock 4.2 membutuhkan masukan berkas dalam format *.dpf (docking parameter file) yang merupakan hasil pemrosesan berkas ligand dan berkas receptor, berkas dalam format *maps* dari receptor yang dihasilkan oleh autogrid4 dan berkas dalam format *pdbqt baik receptor maupun ligand. Autodock 4.2 menghasilkan berkas dalam format *dlg yang berisi informasi mengenai konformasi posisi dan energi pada setiap ligand. Untuk menentukan konformasi posisi terbaik dan energi minimum, dibutuhkan aplikasi Autodock Tools 1.5.2, sebuah aplikasi grafis berbasis phyton yang dirilis oleh lembaga yang sama [16].

(26)

11

2. Autodock Vina 1.1

Autodock Vina 1.1 merupakan aplikasi molecular docking yang dikembangkan oleh pengembang Autodock 4.2. Aplikasi ini bukan merupakan substitusi dari Autodock 4.2, tetapi merupakan improvisasi paralel dan transparansi penggunaan pada level user [17]. Proses pre- docking pada Autodock 4.2 yang harus dijalani oleh user, dibuat transparan pada Autodock Vina 1.1 sehingga user tidak perlu direpotkan dengan tahapan pre-docking. Perbandingan transparansi pre-docking ini dibahas lebih lanjut pada bab 3.

Autodock Vina 1.1 menggunakan mesin yang sama dengan Autodock 4.2, begitupun dengan algoritma pencarian dan fungsi untuk menentukan energi minimum dengan tambahan algoritma Particle Swarm Optimization (PSO), Monte Carlo Parallel dan Broyden-Fletcher-Goldfarb-Shanno (BFGS) [18]. Faktor yang membuat Autodock Vina 1.1 diklaim lebih cepat dari Autodock 4.2 adalah karena aplikasi ini memanfaatkan prinsip paralel yaitu multithreading dan multicore dalam proses docking [18]. Tidak seperti Autodock 4.2 yang hanya mampu berjalan pada satu prosesor, Autodock Vina 1.1 dapat mengoptimalkan kinerjanya pada mesin berbasis multicore.

Proses paralelisasi pada Autodock Vina 1.1 terletak pada algoritma tambahan yang digunakan untuk fungsi pencarian konformitas posisi yaitu BFGS. Algoritma ini tidak hanya menghitung nilai dari fungsinya saja namun juga memasukan faktor gradien dalam proses penghitungan. Gradien dari fungsi yang digunakan merupakan turunan dari fungsi terhadap argumen-argumen pencarian yaitu jarak, sudut dan jenis ikatan kimia.

Walaupun sekilas terlihat lebih lama, algoritma ini mempercepat proses molecular docking karena dapat dijalankan secara bersamaan menggunakan multithreading pada mesin. Konsep ini pula yang memungkinkan molecular docking pada Autodock Vina 1.1 dijalankan pada mesin multicore [18].

Proses molecular docking pada aplikasi Autodock Vina 1.1 membutuhkan masukan berkas ligand dalam format *.pdbqt dan berkas receptor dalam format *.pdbqt. Keluaran dari aplikasi ini pun berkas dalam

(27)

format *pdbqt yang harus dianalisis dengan aplikasi Autodock Tools 1.5.2 untuk mengetahui konformitas posisi terbaik dan energi minimum [19].

2.2 Sumber Daya Komputasi Kinerja Tinggi

Poin utama dalam penelitian ini adalah penggunaan sumber daya komputasi kinerja tinggi dalam menyelesaikan masalah bioinformatika. Kebutuhan sumber daya komputasi tinggi mulai dirasa penting ketika laboratorium-laboratorium yang ada menghabiskan biaya yang tidak sedikit dalam satu proses penelitian. TI memungkinkan para peneliti membangun laboratorium virtual untuk menyelesaikan permasalahan yang dihadapi dalam bentuk simulasi komputer dan pemodelan matematika.

Pada awal perkembangan TI, sumber daya komputasi kinerja tinggi ini hanya dipenuhi oleh mesin supercomputer. Teknologi supercomputer memang mampu memenuhi kebutuhan komputasi para peneliti, namun biaya pembangunan infrastrukturnya yang mahal mengakibatkan tidak banyak laboratorium yang memiliki mesin ini untuk menunjang penelitiannya. Perkembangan teknologi jaringan dan internet yang melampaui perkembangan teknologi prosesor membuat para peneliti di bidang TI berpikir ulang mengenai konsep sumber daya komputasi kinerja tinggi. Dari sini pula muncul teknologi baru berkenaan dengan sumber daya komputasi kinerja tinggi yang diberi nama grid computing.

Teknologi grid computing memungkinkan para peneliti memanfaatkan sumber daya komputasi yang ada semaksimal mungkin. Teknologi ini memungkinkan pemanfaatan beberapa komputer biasa seolah-olah menjadi sumber daya komputasi kinerja tinggi layaknya supercomputer. Konsep ini sebetulnya sudah dipikirkan sejak pertama kali sumber daya komputasi kinerja tinggi dikembangkan. Para peneliti menggagas konsep ini dengan dua pendekatan yaitu pendekatan supercomputer dan multicomputer [2]. Rentannya keamanan informasi di awal perkembangan TI membuat pendekatan multicomputer tertinggal dari konsep supercomputer. Saat ini, dengan kemajuan teknologi protokol data dan jaringan, komunitas peneliti di bidang sumber daya komputasi kinerja tinggi mulai beralih dari teknologi supercomputer yang memanfaatkan

(28)

13

prosesor paralel secara massif menjadi penggunaan komputer berbasis cluster dan grid computing [20].

2.2.1 Mesin Cluster Hastinapura

Mesin cluster hastinapura yang dimiliki oleh Universitas Indonesia merupakan tahap awal dari pengembangan RI-GRID yang dimulai dengan pembangunan inGRID [21]. Mesin cluster hastinapura terdiri dari satu head node, yang memiliki spesifikasi mesin Sun Fire X2100 dengan prosesor AMD Opteron 2.2 GHz (dual core), memori 2 GB dan didukung dengan sistem operasi Debian GNU/Linux 3.1 “Sarge”, dan enam belas worker nodes dengan spesifikasi yang sama tetapi hanya dipasang memori 1 GB. Sementara itu storage node pada cluster ini dibangun dengan server berspesifikasi Dual Intel Xeon 2.8 GHz (HT), memori 2 GB, Harddisk 3x320 GB dengan sistem operasi Debian GNU/Linux 4.2-testing “Etch” [22].

Pada cluster ini dipasang Globus Toolkit yang menjadi middleware penghubung antara cluster dengan aplikasi pada portal dan cluster lainnya.

Middleware ini ditunjang dengan Sun Grid Engine (SGE) yang berfungsi mengatur penempatan, eksekusi dan pemantauan setiap job yang dikirim ke dalam cluster. Untuk aplikasi berbasis paralel, pada hastinapura terpasang MPICH yang memungkinkan eksekusi aplikasi paralel berbasis MPI [22]. Arsitektur inGRID dapat dilihat pada Gambar 2.4

Gambar 2.4 Arsitektur inGRID [23]

(29)

Hastinapura sudah digunakan untuk riset beberapa topik bioinformatika.

Aplikasi yang sudah terpasang disana diantaranya adalah mpiBlast yang digunakan untuk menghitung kemiripan antara input rantai protein dengan pangkalan data rantai protein, GROMACS yang digunakan untuk melakukan simulasi molecular dynamic, dan MPI-POV-Ray yang digunakan untuk pemodelan optik terhadap jejak sinar sumber cahaya ketika bersentuhan dengan objek [24].

(30)

15 BAB 3

METODOLOGI PENELITIAN

Bab ini membahas metodologi penelitian yang dijalankan. Pada bagian ini dijelaskan tahapan penelitian yang dilakukan, sistem pendukung penelitian, data penelitian, pengukuran kinerja dan pelaksanaan penelitian.

3.1 Tahapan Penelitian

Tahapan dari penelitian yang dilakukan terdiri dari pendalaman materi, persiapan sistem, pemrosesan data, pelaksanaan penelitian dan analisis hasil penelitian. Tahapan tersebut dapat dilihat pada Gambar 3.1 berikut ini

Gambar 3.1 Tahapan Penelitian

Pada tahap pendalaman materi dilakukan eksplorasi mengenai konsep penemuan obat dan juga penemuan obat berbasis TI yang merupakan salah satu cabang bioinformatika. Selain itu eksplorasi juga dilakukan terhadap konsep dan

Pendalaman Materi

Persiapan Sistem

Pemrosesan Data

Pelaksanaan Penelitian

Analisis Hasil Penelitian

(31)

teori dalam bidang sumber daya komputasi kinerja tinggi yang diaplikasikan dalam penemuan obat berbasis TI.

Pada tahap persiapan sistem dilakukan konfigurasi dan instalasi aplikasi- aplikasi yang dibutuhkan dalam penelitian ini. Aplikasi yang terlibat dalam penelitian ini diantaranya Autodock 4.2, Autodock Vina 1.1, dan Autodock Tools 1.5.2. Keterangan teknis mengenai instalasi dan konfigurasi sistem dapat dilihat pada Lampiran A.

Pada tahap pemrosesan data dilakukan pre-docking atas data mentah penelitian. Proses pre-docking atas data-data tersebut dilakukan pada PC desktop yang ada pada Laboratorium Jaringan Komputer lantai 5 gedung B Fasilkom UI.

Pelaksanaan penelitian dilaksanakan pada mesin cluster hastinapura dan PC Desktop yang ada pada Laboratorium Jaringan Komputer Fasilkom UI. Eksekusi aplikasi secara paralel dilakukan pada work node mesin cluster hastinapura dan eksekusi serial dilakukan pada PC Desktop. Penggunaan mesin yang berbeda dilakukan karena keterbatasan waktu yang dimiliki penulis untuk melakukan simulasi. Perbedaan spesifikasi kedua mesin akan dinormalisasi pada tahap analisis hasil penelitian.

Tahap akhir dari penelitian ini adalah analisis hasil penelitian. Analisis hasil penelitian dilakukan atas data keluaran proses virtual screening. Data yang dianalisis adalah data keluaran berupa running time yang diperoleh dengan program time dan date yang tersedia pada sistem operasi berbasis GNU/Linux.

3.1.1 Workflow Penelitian

Workflow penelitian dapat dibagi menjadi tiga bagian utama yaitu pre- docking, docking dan log analysis. Proses ini dimulai dari mengunduh receptor dan ligand sampai dengan memperoleh hasil molecular docking yang berupa log.

Workflow dari proses tersebut dapat dilihat dalam Gambar 3.2. berikut ini

(32)

17

Gambar 3.2 Workflow penelitian

•receptor in *.pdb

•ligand in *.mol2 subset

data retrieval

•receptor *.pdb into

*.pdbqt

•ligand *.mol2 into

*.pdbqt

data

processing •Autodock 4.2

•*.dpf

•Autodock Vina 1.1

•*.pdbqt

docking input ready

• simple script (serial)

• qsub script (parallel)

execution

• time (serial)

• date (parallel) measuring

performance • time script (serial)

• qsub output (parallel)

output

•download from hastinapura

•download from PC Desktop

retrieveing log

•user, real and system time (serial)

•begin and finish date (parallel)

extracting

information • convert into minutes

• make diagram

resume

Pre-Docking

Docking

Log Analysis

(33)

3.2 Sistem Pendukung Penelitian

Penelitian ini menggunakan teknologi cluster yang dimiliki oleh Universitas indonesia dan PC Desktop yang ada pada Laboratorium Jaringan Komputer Gedung B Lantai 5 Fasilkom UI. Cluster yang digunakan adalah cluster hastinapura yang berada di Ruang Server Gedung A Fasilkom UI. Spesifikasi perangkat keras sistem yang digunakan dalam penelitian dapat dilihat pada Tabel 3.1 dan 3.2 berikut ini

Tabel 3.1 Spesifikasi cluster hastinapura Cluster Hastinapura

Jenis Node Head Node Work Nodes Storage Node Prosesor AMD Opteron 2.2

GHz (Dual Core)

AMD Opteron 2.2 GHz (Dual Core)

Dual Intel Xeon 2.8 GHz (HT)

RAM 2 GB 1 GB 2 GB

Hard Disk 80 GB 80 GB 3 x 320 GB

Sistem Operasi Debian 3.1 “Sarge” Debian 3.1 “Sarge” Debian 4.2 “Etch”

Instruction Set x86-64 x86-64 x86-64

Tabel 3.2 Spesifikasi PC Desktop PC Desktop

Prosesor Intel Pentium 4 2.8 GHz

RAM 1 GB

Hard Disk 80 GB

Sistem Operasi GNU/Linux Ubuntu 8.0

Instruction Set 32-bit

(34)

19

3.3 Data Penelitian

Data yang digunakan dalam penelitian ini seluruhnya merupakan data dummy yang diunduh di Internet. Sebagaimana ruang lingkup penelitian yang berfokus pada pengukuran kinerja, data yang digunakan pada penelitian ini bukan merupakan hasil penelitian tersendiri dalam topik penemuan obat.

3.3.1 Pemilihan Data

Data yang digunakan dalam penelitian ini diambil dari pangkalan data ZINC (ZINC Is Not Commercial) [25]. ZINC merupakan situs yang menyediakan ribuan data yang bisa diunduh secara gratis untuk proses virtual screening. Data yang diambil adalah data multiple ligand dalam format *.mol2.

3.3.2 Pemrosesan Data

Data yang sudah dipilih harus menjalani proses pre-docking sebelum dapat dieksekusi. Proses pre-docking yang dilakukan untuk kedua aplikasi memiliki tahapan yang hampir sama. Panduan detail proses pre-docking terlampir pada Lampiran B dan C.

Berikut ini adalah tahapan pre-docking pada Autodock 4.2 [16]: 1. Memproses berkas ligand dari *.mol2 menjadi *.pdbqt

Dalam molecular docking biasa, proses ini dilakukan dengan menggunakan aplikasi Autodock Tools 1.5.2 berbasis GUI. Puluhan ribu berkas ligand tidak mungkin diproses satu persatu dengan aplikasi berbasis GUI. Oleh karena itu, dalam penelitian ini digunakan modul phyton dari aplikasi Autodock Tools 1.5.2 yaitu modul prepare_ligand4.py yang mengubah berkas ligand dalam format *.pdb/*.mol2 menjadi berkas ligand dalam format *.pdbqt yang sudah siap diproses

2. Memproses receptor dari *.pdb menjadi *.pdbqt

Pemrosesan receptor cukup dilakukan dengan Autodock Tools 1.5.2 berbasis GUI karena jumlah receptor yang digunakan hanya satu. Dalam proses ini, ditentukan wilayah (search space) dari receptor yang akan digunakan sebagai acuan proses molecular docking. Dalam penelitian ini

(35)

penulis melakukan blind-docking atau menggunakan seluruh bagian dari receptor sebagai search space. Hal ini dilakukan karena penulis tidak memiliki dasar ilmu dalam ikatan kimia untuk menentukan atom dan ikatan kimia mana yang perlu dijadikan search space.

3. Mempersiapkan AutoGrid Parameter Files untuk receptor

AutoGrid Parameter Files pada receptor disiapkan dengan aplikasi Autodock Tools 1.5.2. AutoGrid Parameter Files berisi berkas yang siap dipetakan atas ligand menggunakan autogrid4. Hasil dari tahapan ini adalah berkas receptor dalam format *.gpf

4. Menghitung atomic affinity maps

Pemetaan yang sudah dilakukan pada receptor dan menghasilkan berkas receptor dalam format *.gpf harus dipetakan untuk setiap berkas ligand. Proses pemetaan ini dilakukan dengan cara menghitung atomic affinity maps pada berkas receptor dengan menggunakan aplikasi autogrid4.

Tahapan ini akan menghasilkan berkas pemetaan dalam format *.glg,

*.map, *maps.xyz dan *.maps.fld.

5. Mempersiapkan docking parameter files untuk setiap ligand

Tahapan terakhir adalah menyiapkan docking parameter files untuk setiap ligand dibantu modul phyton dari Autodock Tools 1.5.2 yang bernama prepare_dpf4.py. Docking parameter files ini berisi informasi terkait ligand seperti jumlah atom, koordinat atom dan jumlah torsi aktif yang dimiliki yang sudah dipetakan ke dalam informasi pada receptor. Hasil dari tahapan ini adalah berkas docking parameter files dalam format *.dpf.

Berikut ini tahapan pre-docking pada aplikasi Autodock Vina 1.1 [19]: 1. Memproses berkas ligand dari *.mol2 menjadi *.pdbqt

Sama seperti Autodock 4.2

2. Memproses receptor dari *.pdb menjadi *.pdbqt Sama seperti Autodock 4.2

(36)

21

Perbandingan dari tahapan pre-docking antara Autodock 4.2 dan Autodock Vina 1.1 dapat dilihat pada tabel 3.3.

Tabel 3.3 Perbandingan tahapan pre-docking

Autodock 4.2 Autodock Vina 1.1 1. Memproses berkas ligand dari *mol2

menjadi *.pdbqt

1. Memproses berkas ligand dari

*mol2 menjadi *.pdbqt 2. Memproses receptor dari *.pdb menjadi

*.pdbqt

2. Memproses receptor dari *.pdb menjadi *.pdbqt

3. Mempersiapkan AutoGrid parameter files untuk receptor

3. Tahap pre-docking selesai

4. Menghitung atomic affinity maps

Transparansi proses pre-docking Autodock Vina 1.1 5. Mempersiapkan docking parameter files

untuk setiap ligand

6. Tahap pre-docking selesai

3.4 Pengukuran Kinerja

Dalam mengukur kinerja aplikasi molecular docking, ada tiga hal yang dijadikan parameter yaitu running time, speed up dan efisiensi. Untuk mengukur running time digunakan program time dan date yang tersedia dalam sistem operasi GNU/Linux. Sementara itu, persamaan untuk speed up dan efisiensi dihitung dengan menggunakan persamaan berikut

dimana:

S_n = Speed up untuk n prosesor t_n = Waktu untuk n prosesor (menit) t₁ = Waktu untuk 1 prosesor (menit)

dimana:

E = Efisiensi

Sn = Speed up untuk n prosesor n = Jumlah prosesor yang digunakan

(37)

22 BAB 4

HASIL PENELITIAN DAN ANALISIS

Bab ini membahas hasil dari penelitian yang dilakukan dan analisis terhadap hasil penelitian tersebut. Hasil dari penelitian ditampilkan dalam tabel dan grafik untuk mempermudah penafsiran.

4.1 Hasil Penelitian

Setelah melakukan percobaan pada PC Desktop dan cluster hastinapura diperoleh hasil mengenai kinerja Autodock 4.2 dan Autodock Vina 1.1. PC Desktop (Intel Pentium 4) penulis asumsikan sebagai mesin dengan 1 cpu.

Sementara setiap work node pada cluster hastinapura (AMD Opteron dual core), penulis asumsikan setiap work node sebagai mesin dengan 2 cpu.

Kondisi terakhir cluster hastinapura dapat dilihat melalui Gambar 4.1. Dari enam belas work node pada cluster hastinapura, hanya sebelas work node saja yang dapat digunakan. Satu node mati yaitu node03 (tidak muncul pada Gambar 4.1), satu node tidak bisa diakses karena perbedaan konfigurasi rsh yaitu node16 (tidak muncul pada Gambar 4.1), dan tiga nodes mengalami error pada konfigurasi SGE yaitu node08, node09 serta node10 (berwarna putih).

Gambar 4.1 Kondisi cluster hastinapura

(38)

23

Untuk membandingkan running time antara eksekusi secara serial dan paralel pada Autodock 4.2, penulis hanya menggunakan data sebanyak 1000 ligand karena Autodock 4.2 sangat memakan waktu. Sementara itu, penulis mencoba melihat tren dari perubahan jumlah sampel data yang digunakan pada Autodock Vina 1.1 dengan membandingkan waktu eksekusi secara serial dan paralel dengan data 1000, 2000, 3000, 4000, dan 5000 ligand. Keterbatasan waktu dan resource yang harus digunakan bersama-sama dengan dua orang rekan yang mengambil tugas akhir dengan topik yang sama membuat penulis terpaksa tidak menambah jumlah sampel data. Sementara itu, untuk menghitung speed up, penulis mengasumsikan bahwa cluster hastinapura memiliki total 22 cpu. Hasil percobaan dapat dilihat pada Tabel 4.1, 4.2 dan Gambar 4.2, 4.3 serta 4.4

Tabel 4.1 Perbandingan waktu eksekusi pada Autodock 4.2 Jumlah Data Waktu Eksekusi (menit)

Serial [1 cpu] Paralel [22 cpu]

1000 11783.3 456.72

Gambar 4.2 Perbandingan running time pada Autodock 4.2

11783,3

456,72

Serial Paralel

Autodock 4.2

1000

(39)

Tabel 4.2 Perbandingan running time pada Autodock Vina 1.1 Jumlah Data Waktu Eksekusi (menit)

Serial [1 cpu] Paralel [22 cpu]

1000 2277.42 77.43

2000 4629.72 159.5

3000 8117.6 292.27

4000 12370.5 406.8

5000 15294.2 509.8

Gambar 4.3 Perbandingan running time pada Autodock Vina 1.1

Gambar 4.4 Tren penambahan data pada serial job

2277,42

4629,72

8117,6

12370,5

15294,2

77,43 159,5 292,27 406,8 509,8

1000 2000 3000 4000 5000

Autodock Vina 1.1

Serial Paralel

2277,42

4629,72

8117,6

12370,5

15294,2

1000 2000 3000 4000 5000

Autodock Vina 1.1

Serial

(40)

25

Gambar 4.5 Tren penambahan data pada parallel job

4.2 Analisis

Sebelum menganalisis hasil dari percobaan yang dilakukan, hasil percobaan yang dilakukan oleh The Scripps Research Institute (TSRI) dapat dilihat pada Gambar 4.6 berikut ini [18]

Gambar 4.6 Hasil percobaan The Scripps Research Institute [18]

1 77,43

159,5

292,27

406,8

509,8

1000 2000 3000 4000 5000

Autodock Vina 1.1

Paralel

521,85

8,41 1,16

Autodock 4.2 Vina 1.1 (1 cpu) Vina 1.1 (8 cpu)

The Scripps Research Institute

running time (menit)

(41)

Dengan menggunakan 190 data, TSRI menyatakan bahwa Autodock Vina 1.1 62 kali lebih cepat dibanding Autodock 4.2 pada pemrosesan 1 cpu, dan pemrosesan Autodock Vina 1.1 pada 8 cpu lebih cepat 7.25 kali dari 1 cpu.

Percobaan ini dilakukan pada mesin dengan prosesor Intel Xeon Quad2Core 2.66 GHz (mesin dengan 8 cpu) [18].

Dari Tabel 4.1 dan Gambar 4.2 bisa dilihat bahwa eksekusi job dalam molecular docking pada Autodock 4.2 secara paralel dalam cluster hastinapura mempercepat running time 25.79 kali. Hal ini dikarenakan eksekusi pada cluster hastinapura membuat job dibagi secara merata dan dijalankan secara paralel pada 11 mesin (22 cpu). Sementara itu, speed up dari parallel job pada cluster hastinapura untuk Autodock 4.2 adalah S₂₂ = 25.79.

Dari Tabel 4.2 dan Gambar 4.3 bisa dilihat bahwa eksekusi job dalam molecular docking pada Autodock Vina 1.1 secara paralel dalam cluster hastinapura mempercepat running time 29.16 kali. Sementara itu, speed up dari parallel job pada cluster hastinapura untuk Autodock Vina 1.1 adalah S₂₂= 29.16.

Dari perhitungan speed up, dapat dilihat pula seberapa efisien kinerja kedua aplikasi. Efisiensi Autodock 4.2 pada cluster hastinapura adalah 117% dan Autodock Vina 1.1 adalah 133%. Dengan efisiensi 100%, sebuah aplikasi dapat dikatakan memiliki speed up yang linier dan dapat dikategorikan sebagai aplikasi yang cukup baik dalam konteks aplikasi paralel. Angka efisiensi lebih dari 100%

yang diperoleh diakibatkan perbedaan spesifikasi mesin yang digunakan dalam penelitian dimana mesin server tempat pemrosesan paralel memiliki kinerja yang lebih baik ketimbang mesin desktop tempat pemrosesan serial walaupun PC Desktop memiliki clock speed sedikit lebih tinggi. Akan tetapi, walaupun angka efisiensi diturunkan, penulis dapat menganggap efisiensi kedua aplikasi adalah mendekati 100%.

Sementara itu dengan membandingkan eksekusi Autodock 4.2 dan Autodock Vina 1.1 pada PC Desktop, terlihat bahwa Autodock Vina 1.1 dapat mengeksekusi molecular docking job 5.17 kali lebih cepat dari Autodock 4.2.

Sementara itu, hasil eksekusi molecular docking pada cluster hastinapura memperlihatkan bahwa Autodock Vina 1.1 dapat mengeksekusi 10.28 kali lebih cepat dibanding Autodock 4.2.

(42)

27

Hal selanjutnya yang dapat dianalisa adalah kecenderungan liniernya grafik ketika jumlah sampel data ditambah. Grafik tersebut memberikan informasi bahwa pertambahan jumlah sampel data berbanding lurus dengan running time dan tidak ada faktor seperti communication time yang mempengaruhi kinerja. Hal ini dikarenakan paralelisasi disini bukanlah membagi proses pada aplikasi melainkan membagi antrian job sehingga dapat dijalankan secara bersamaan.

Dengan tidak adanya faktor lain yang mempengaruhi, maka speed up dalam kondisi ideal karena speed up akan bertambah secara linier seiring pertambahan jumlah prosesor yang digunakan.

Hasil percobaan yang penulis lakukan menghasilkan angka yang berbeda dengan yang diperoleh TSRI pada bagian running time. Sementara pada speed up, cluster hastinapura memberikan speed up yang lebih baik dari mesin multicore yang digunakan TSRI. Hanya saja, kesimpulan mengenai speed up Autodock Vina 1.1 antara cluster hastinapura dengan mesin multicore TSRI tidak mutlak karena percobaan yang penulis lakukan tidak mampu mengukur kinerja Autodock Vina 1.1 pada lebih dari 2 cpu. Walaupun penulis menjalankan Autodock Vina 1.1 pada cluster, pada dasarnya Autodock Vina 1.1 tetap hanya berjalan pada 2 cpu tetapi dijalankan bersama pada 11 mesin. Hal ini juga yang menjadi future work TSRI, mereka ingin mengetahui bagaimana speed up dan efisiensi Autodock Vina 1.1 apabila dijalankan pada lebih dari 8 cpu pada satu mesin [18].

(43)

28 PENUTUP

Bab ini membahas bagian penutup dari laporan tugas akhir. Pada bagian ini disampaikan kesimpulan dari penelitian, kendala yang dihadapi dan juga saran- saran terhadap penelitian lanjutan di masa yang akan datang.

5.1 Kesimpulan

Setelah mendalami teori, proses dan melakukan percobaan penulis dapat mengambil beberapa kesimpulan, diantaranya

1. Teknologi cluster dan grid computing dapat membantu proses riset yang membutuhkan komputasi sumber daya kinerja tinggi dengan biaya yang relatif murah.

2. Aplikasi Autodock 4.2 dan Autodock Vina 1.1 cocok digunakan untuk riset akademis karena memiliki jaringan user yang cukup luas.

3. Aplikasi Autodock Vina 1.1 memberikan kemudahan bagi user dalam proses pre-docking.

4. Cluster hastinapura mempercepat proses molecular docking dibandingkan proses yang sama pada PC Desktop biasa.

5. Aplikasi Autodock Vina 1.1 lebih cepat dari Autodock 4.2 dalam melakukan molecular docking.

6. Cluster hastinapura dapat digunakan untuk riset-riset yang membutuhkan sumber daya komputasi kinerja tinggi.

(44)

29

5.2 Kendala

Kendala-kendala yang penulis hadapi selama melakukan proses penelitian dari tahap pendalaman materi sampai analisis hasil penelitian diantaranya

1. Pendalaman teori non-TI merupakan bagian paling sulit dan memakan waktu cukup banyak.

2. Cluster hastinapura tidak mendapat pasokan listrik yang stabil sehingga beberapa kali mati dan harus me-restart server.

3. Penggunaan resource hastinapura harus dibagi secara manual antara tiga orang karena keterbatasan waktu.

5.3 Saran

Ada beberapa saran yang dapat penulis sampaikan terkait riset molecular docking dan cluster hastinapura, diantaranya

1. Perlu adanya administrator khusus yang menangani cluster hastinapura.

2. Untuk user yang tidak begitu familiar dengan komputer, aplikasi Autodock Vina 1.1 memberikan banyak kemudahan. Oleh karenanya, penulis sangat menyarankan untuk penggunaan aplikasi ini dalam riset- riset ke depan.

3. Pengembangan aplikasi pendukung seperti aplikasi GUI yang membantu proses pre-docking, virtual screening maupun job submission sangat mungkin dilakukan oleh rekan-rekan mahasiswa di Fasilkom UI.

(45)

xv

[1] Foster, Ian, “Service-Oriented Science,” Science, 308 (5723), Mei 2005.

[2] Nazief, Bobby, “RI-Grid: Usulan Pengembangan Infrastruktur Komputasi Grid Nasional”, Prosiding e-Indonesia Initiative 2006, Bandung, Mei 2006.

[3] Namasivayam dan Gunther, “PSO@Autodock: A Novel Bio-Algorithm- Based Fast Flexible Docking Tool for Virtual Screening”, From Computational Biophysics to System Biology (CBSB07), Proceeding of the NIC Workshop 2007, Ulrich H. E. Hansmann, Jan Meinke, Sandipan Mohanty, Olav Zimmermann (Editor), John von Neumann Institute for Computing, Julich, NIC Series, Vol. 36, ISBN 978-3-9810843-2-0, pp, 239- 241, 2007.

[4] Suhartanto, Heru. “Proposal Riset High Performance Computing”, http://telaga.cs.ui.ac.id/~heru/research/docking09/BagianProposal.pdf diakses pada 17 Juni 2010 pukul 14.06 WIB.

[5] Dwi Astuti A. dan M. Abdushshomad Elfaizi, “Bioinformatika:

Perkembangan, Disiplin Ilmu dan Penerapannya di Indonesia”, http://bebas.vlsm.org/v06/Kuliah/SistemOperasi/2003/50/Bioinformatika.pd f diakses pada 18 Mei 2010 pukul 20.07 WIB.

[6] Ilustrasi keterkaitan biologi dengan TI dalam bioinformatika, http://www.stat.purdue.edu/images/bioinformatics/Bioinformatics_doerge_0 80304%20%281%29-sm.jpg diakses 17 Juni 2010 pukul 11.32 WIB.

[7] Nair, Achuthsankar S., “Computational Biology & Bioinformatics: A Gentle Overview”, Communications of The Computer Society of India, Januari 2007.

[8] Thomas, Gareth, Fundamentals of Medical Chemistry, Chapter 3 An Introduction to Drug Discovery, Inggris: Wiley, 2003.

[9] Thomas, Gareth, Fundamentals of Medical Chemistry, Chapter 5 Computer Aided Drug Design, Inggris: Wiley, 2003.

[10] Website resmi Autodock 4.2, The Scripps Research Institute, http://autodock.scripps.edu/ diakses 7 Mei 2010 pukul 20.49 WIB.

(46)

xvi

[11] Molecular Docking antara dua molekul, http://fred.bioinf.uni- sb.de:4711/DFG-protein-protein-docking/DATA/dockingbeispiel.jpg diakses 17 Juni 2010 pukul 11.25 WIB.

[12] Miguel L. Teodoro, George N. Phillips Jr, dan Lydia E. Kavraki,

“Molecular Docking: A Problem With Thousands of Degrees of Freedom”, Proceeding of the 2001 IEEE International Conference on Robotics &

Automation, Seoul, Korea Selatan 21-25 Mei, 2001.

[13] Cornell WD, Cieplak P, Bayly CI, Gould IR, Merz KM Jr, Ferguson DM, Spellmeyer DC, Fox T, Caldwell JW, Kollman PA. "A Second Generation Force Field for the Simulation of Proteins, Nucleic Acids, and Organic Molecules". J. Am. Chem. Soc. 117: 5179–5197. 1995.

[14] Website resmi The Scripps Research Institute, http://www.scripps.edu/e_index.html diakses 17 Juni 2010 pukul 14.39 WIB [15] Diagram arsitektur Collaborative Molecular Environment, http://blogs.interknowlogy.com/downloads/rodneyguzman/tsri_20arch_20di agram.jpg diakses 17 Juni 2010 pukul 11.56 WIB.

[16] The Scripps Research Institute, “Tutorial Autodock 4.2”, http://autodock.scripps.edu/faqs-help/tutorial diakses 19 Juni 2010 pukul 10.29 WIB.

[17] Website resmi Autodock Vina 1.1, The Scripps Research Institute, http://vina.scripps.edu/manual.html diakses 7 Mei 2010 pukul 20.38 WIB.

[18] O. Trott, A. J. Olson, “Autodock Vina: Improving The Speed and Accuracy of Docking With A New Scoring Function, Efficient Optimization and Multithreading”, Journal of Computational Chemistry 31 (2010) 455-461.

[19] The Scripps Research Institute, “Tutorial Autodock Vina 1.1”, http://vina.scripps.edu/tutorial.html diakses 19 Juni 2010 pukul 10.29 WIB.

[20] J. Santoso, G.D Van Albada, Bobby A.A Nazief dan P.M.A. Sloot,

“Hierarchical Job Scheduling for Cluster of Workstation”, Proceeding of the 6^th Annual Conference on the Advanced School for Computing and Imaging, pp. 99-105. ASCI, Delft, Belanda, Juni 2000.

[21] Fakultas Ilmu Komputer Universitas Indonesia, “Rancangan Infrastruktur inGRID”, Grid Computing Research Group, 19 Januari 2007.

(47)

xvii

Computing Research Group, http://grid.ui.ac.id/ingrid/clusters/hastinapura diakses 11 Mei 2010 pukul 19.50 WIB.

[23] Fakultas Ilmu Komputer Universitas Indonesia, “Arsitektur inGRID”, Grid Computing Research Group, http://grid.ui.ac.id/files/ingrid.png diakses 17 Juni 2010 pukul 19.45 WIB.

[24] Fakultas Ilmu Komputer Universitas Indonesia, “Manual penggunaan aplikasi dalam inGRID”, Grid Computing Research Group, http://grid.ui.ac.id/files/contoh-aplikasi.pdf diakses 17 Juni 2010 pukul 20.11 WIB.

[25] Website resmi ZINC Databases, ZINC Is Not Commercial, http://vina.scripps.edu/manual.html diakses 7 Mei 2010 pukul 20.38 WIB.