PENERAPAN ANALISIS KOMPONEN UTAMA KEKAR
DENGAN PENDEKATAN ALGORITMA GRID PADA DATA
SPEKTRUM FRONTIER TRANSFORM INFRARED
AULIA RIZKI FIRDAWANTI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2016
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Penerapan Analisis Komponen Utama Kekar dengan Pendekatan Algoritma Grid Pada Data Spektrum
Frontier Transform Infrared adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Juni 2016
Aulia Rizki Firdawanti
ABSTRAK
AULIA RIZKI FIRDAWANTI. Penerapan Analisis Komponen Utama Kekar Dengan Pendekatan Algoritma Grid Pada Data Spektrum Frontier Transform
Infrared. Dibimbing oleh FARIT MOCHAMAD AFENDI dan LA ODE ABDUL
RAHMAN.
Analisis komponen utama (AKU) merupakan analisis peubah ganda yang digunakan dalam pereduksian data berdimensi tinggi yang dalam penelitian ini merupakan data hasil pengolahan alat frontier transform infrared (FTIR) yang memiliki jumlah peubah yang jauh lebih besar daripada jumlah amatannya. Keberadaan pencilan akan membuat analisis komponen utama (AKU) yang digunakan menjadi kurang terandalkan karena AKU klasik dibentuk berdasarkan pada matriks penduga ragam peragam yang sensitif terhadap keberadaan data pencilan. Analisis komponen utama kekar (AKU-K) dengan menggunakan algoritma grid yang merupakan pengembangan dari metode projection pursuit (PP) dapat menangani pencilan dengan lebih baik. Hasil penelitian menunjukan bahwa akar ciri dan proporsi keragaman pada komponen utama pertama ke komponen utama kedua AKU mengalami penurunan yang lebih besar dibandingkan AKU-K. Akar ciri dan proporsi keragaman yang dihasilkan AKU-K relatif lebih stabil dibandingkan dengan hasil AKU. Plot tebaran menggunakan metode AKU-K mampu menarik skor amatan pencilan pada metode AKU menjadi lebih dekat dengan skor lainnya. Analisis ragam yang dilakukan menunjukan bahwa terdapat perbedaan perlakuan pada komponen utama kedua untuk AKU. Kemudian penelusuran senyawa kimia dilakukan pada dua komponen utama pertama AKU dan AKU-K dan diperoleh kesimpulan yakni terdapat satu senyawa yang tidak teridentifikasi oleh komponen utama kedua AKU sehingga pencilan mempengaruhi struktur komponen utama kedua.
Kata kunci: algoritma grid, analisis komponen utama, analisis komponen utama kekar, FTIR, pencilan.
ABSTRACT
AULIA RIZKI FIRDAWANTI. Robust Principal Component Analysis with Grid Algorithm Approach in Spectrum of Frontier Transform Infrared Data. Supervised by FARIT MOCHAMAD AFENDI and LA ODE ABDUL RAHMAN.
Principal Component Analysis (PCA) is the techniques of multivariate analysis to reduce the dimensionality of a data set in which there are a large number of interrelated variables, while retaining as much as possible of the variation present in the data set. The existence of outliers will make principal component analysis (PCA) does no longer work because PCA was formed based on the covariance matrix which is sensitive to outliers. Robust principal component analysis (RPCA) by using a grid algorithm which is the development of projection pursuit (PP) methods can handle the outliers better. The results showed that the eigen value and proportion cumulative from RPCA are relatively stable than the PCA. Scatter plot of RPCA is able to attract scores of the outliers observation on the PCA and hence it became closer with a score of others. Analysis of variance showed that there are differences in treatment on the second principal component of PCA. After that, search for chemical compounds carried on the first two principal components PCA and RPCA and conclude that there is a compound which is not identified by the second principal components of PCA. Therefore, the outliers affect the structure of the second principal components.
Keywords: FTIR, grid algorithm, outliers, principal component analysis, robust principal component analysis.
PENERAPAN ANALISIS KOMPONEN UTAMA KEKAR
DENGAN PENDEKATAN ALGORITMA GRID PADA DATA
SPEKTRUM FRONTIER TRANSFORM INFRARED
AULIA RIZKI FIRDAWANTI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika
pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2016
PRAKATA
Puji syukur penulis panjatkan kehadirat Allah SWT karena berkah dan rahmat-Nya lah penulis dapat menyelesaikan karya ilmiah yang berjudul “Penerapan Analisis Komponen Utama Kekar dengan Pendekatan Algoritma Grid Pada Data Spektrum Frontier Transform Infrared”. Karya ilmiah ini merupakan salah satu syarat untuk mendapatkan gelar Sarjana Statistika pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Penulisan karya ilmiah ini tidak lepas dari bimbingan dan bantuan pihak- pihak tekait. Penulis menyampaikan terimakasih kepada :
1. Bapak Dr Farit Mochamad Afendi,MSi dan Bapak La Ode Abdul Rahman, MSi selaku dosen pembimbing yang telah memberikan saran dan kritik yang membangun selama penulisan karya ilmiah ini.
2. Bapak Rudi Heryanto, MSi dari Pusat Studi Biofarmaka LPPM IPB yang telah membantu penulis dalam mendapatkan data.
3. Keluarga penulis yang senantiasa mendukung dan mendoakan kelancaran studi penulis.
4. Seluruh Dosen pengajar Departemen Statistika atas ilmu yang telah diberikan.
5. Seluruh Staf Tata Usaha Departemen Statistika IPB yang membantu segala proses administrasi.
6. Adam Dwi Rahmanto yang selalu memberi semangat dan dukungan kepada penulis.
7. Herul Hidayatullah dan Mulianto Raharjo sebagai teman satu perjuangan yang selalu memberikan dukungan dan masukan.
8. Keluarga besar Statistika 49 IPB atas kebersamaan dan dukungannya selama ini.
Semoga karya ilmiah ini dapat bermanfaat bagi semua pihak. Penulis mohon maaf atas segala kekurangan dan kesalahan yang terdapat dalam karya ilmiah ini.
Bogor, Juni 2016
Aulia Rizki Firdawanti
DAFTAR ISI
DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 1 TINJAUAN PUSTAKA 2Fourier Transform Infrared (FTIR) 2
Analisis Komponen Utama 3
Pencilan Peubah Ganda 3
Analisis Komponen Utama Kekar 4
METODOLOGI 5
Sumber Data 5
Prosedur Analisis Data 6
HASIL DAN PEMBAHASAN 7
Tahapan Prapemrosesan Data 7
Pendeteksian Pencilan 7
Perbandingan AKU dan AKU-K 8
Hasil Analisis Ragam untuk Uji Beda Perlakuan 9
Penelusuran Gugus Fungsi Senyawa Kimia 10
SIMPULAN 11
DAFTAR PUSTAKA 12
LAMPIRAN 13
DAFTAR TABEL
1 Area bilangan gelombang dan gugus fungsi 2
2 Perbandingan analisis ragam skor komponen 10
3 Penelusuran gugus fungsi senyawa kimia 11
DAFTAR GAMBAR
1 Plot garis hasil spektrum FTIR 2
2 Tahapan prapemrosesan data 7
3 Proporsi keragaman AKU dan AKU-K 8
4 Akar ciri AKU dan AKU-K 8
5 Plot tebaran KU 1 dan 2 menggunakan AKU (a) dan AKU-K (b) 9
DAFTAR LAMPIRAN
1 Identifikasi pencilan 13
2 Plot garis komponen utama pertama AKU 13
3 Plot garis komponen utama kedua AKU 14
4 Plot garis komponen utama pertama AKU-K 14
5 Plot garis komponen utama kedua AKU-K 14
1
PENDAHULUAN
Latar Belakang
Analisis komponen utama (AKU) merupakan salah satu analisis peubah ganda yang digunakan dalam pereduksian dimensi dari segugus data sehingga diperoleh peubah baru yang tidak saling berkorelasi namun tetap mampu mempertahankan sebagian besar informasi yang terkandung pada data asal. Peubah baru ini merupakan kombinasi linier yang dipilih dari peubah asal dengan ragam paling besar dan memuat informasi paling banyak. AKU klasik akan sangat dipengaruhi oleh kehadiran pencilan karena AKU dibentuk berdasarkan pada matriks penduga ragam peragam yang juga sangat sensitif terhadap keberadaan data pencilan (Hubert et al. 2005).
Barnett dan Lewis (1994) mengindikasikan bahwa sebuah pengamatan yang terpencil atau pencilan adalah pengamatan yang terlihat menyimpang dari anggota lain dimana contoh tersebut diambil. Analisis komponen utama kekar (AKU-K) dengan menggunakan projection pursuit dengan pendekatan algoritma grid yang diperkenalkan Croux C et al. pada tahun 2007 dapat menangani data yang mengandung pencilan dengan lebih baik.
Algoritma grid merupakan pengembangan dari metode projection pursuit (PP) yang bertujuan untuk memaksimumkan nilai indeks proyeksi dengan mengoptimalkan nilai vektor ciri pada setiap matriks X. Algoritma grid digunakan dalam pencarian vektor ciri secara lebih cepat dan teliti sehingga solusi yang diperoleh mendekati solusi sebenarnya (Croux C et al. 2007).
Data yang digunakan merupakan data hasil penelitian kimia yang dilakukan pada Bulan September 2015 di Pusat Studi Biofarmaka dengan tujuan untuk melihat ketahanan ekstrak temulawak yang baik dalam berbagai kondisi (dalam penelitian
ini adalah suhu normal atau suhu awal jamu, suhu ruang, suhu 30 0C, dan suhu 40
0C) menggunakan alat frontier transform infrared (FTIR). Penelitian menghasilkan
data berdimensi tinggi yang mengandung 26 amatan dan 1866 peubah serta 2 data pencilan. Data berdimensi tinggi adalah data dengan banyaknya variabel lebih besar daripada banyaknya observasi.
FTIR merupakan salah satu teknik spektroskopi infra merah yang salah satu
hasilnya berupa plot hubungan antara bilangan gelombang (cm-1) dengan persentase
transmitan infra merah. Penyerapan infra merah pada daerah bilangan gelombang tertentu dapat digunakan untuk mengetahui gugus fungsi dari senyawa kimia yang terbentuk. Gugus fungsi mampu diidentifikasi berdasarkan sidik jari yang terdapat pada puncak atau palung pada serapan atau transmitan infra merah.
Tujuan Penelitian
Tujuan penelitian ini adalah membandingkan hasil analisis komponen utama klasik dan analisis komponen utama kekar menggunakan algoritma grid berdasarkan akar ciri, proporsi keragaman, plot tebaran dan vektor ciri pada data spektrum FTIR.
2
TINJAUAN PUSTAKA
Fourier Transform Infrared (FTIR)
Suatu senyawa kimia memiliki beberapa gugus fungsi, setiap gugus fungsi mampu menyerap gelombang elektromagnetik pada spektrum atau panjang gelombang tertentu. Prinsip inilah yang digunakan untuk identifikasi jenis atau karakter suatu senyawa kimia. Salah satu instrumen analisis (spektrofotometer) yang digunakan adalah fourier transform infrared (FTIR) yang prinsip kerjanya menggunakan spektrum inframerah. FTIR dapat digunakan untuk menganalisa senyawa organik dan anorganik. Selain itu, FTIR juga dapat digunakan untuk analisa kualitatif meliputi analisa gugus fungsi (adanya peak dari gugus fungsi spesifik) beserta polanya dan analisa kuantitatif dengan melihat kekuatan absorbsi senyawa pada panjang gelombang tertentu (Baciu et al. 2013). Penelitian ini hanya berfokus pada analisis kualitatif yakni dalam analisa gugus fungsi.
Gambar 1 Plot garis hasil spektrum FTIR Tabel 1 Area bilangan gelombang dan gugus fungsi
Panjang gelombang (cm-1) Area Keterangan gugus fungsi
<1000 1 Gugus C-H kelompok isoprenoid
1000-1100 2 Ikatan C-O kelompok glukosida
1170-1230 3 Gugus karbonil dan ikatan O-H
1300-1440 4 Gugus karbonil amida dan ikatan C-C
gugus fenil
1500-1520 5 Gugus aromatik dan ikatan N-H
1600-1750 6 Ikatan N-H dari asam amino
2800-3000 7 Ikatan C-H yakni CH3 dan CH2 dari
lemak dan ikatan metoksi
3300-3350 8
Ikatan kimia kelompok OH yang berasal dari air, alkohol, fenol, karbohidrat dan peroksida
Pengidentifikasian gugus fungsi senyawa menggunakan FTIR hanya dapat dilakukan pada peak atau pada puncak dan lembah dalam plot garis yang dihasilkan. Berdasarkan Baciu et al. pada tahun 2013, Gambar 1 menunjukkan area yang dapat
3
diidentifikasi gugus fungsi senyawa kimianya. Terdapat 8 area yang dapat di identifikasi oleh spektrum FTIR dengan panjang gelombang yang berbeda-beda dan mengindikasikan gugus fungsi yang berbeda pula. Tabel 2 menunjukkan nilai dari intensitas penyerapan puncak sesuai dengan 8 area bilangan gelombang dari
spektrum FTIR (4000-650 cm-1) yang dihasilkan pada Gambar 1.
Analisis Komponen Utama
Jollife (2002) mendefinisikan bahwa ide sentral dari analisis komponen utama adalah untuk mereduksi dimensi dari peubah asal sehingga diperoleh peubah baru yang disebut komponen utama. Komponen tersebut tidak saling berkorelasi dan tetap mempertahankan sebagian besar informasi yang terkandung pada peubah asalnya. Hal ini dicapai dengan melakukan transformasi dari segugus data besar menjadi segugus data baru yaitu komponen utama (KU) yang tidak saling berkorelasi dan disusun sedemikian sehingga untuk k KU pertama mewakili keragaman terbesar dari keseluruhan peubah aslinya.
Misalkan 𝑿1, 𝑿2, … 𝑿𝑝 adalah peubah acak yang menyebar menurut sebaran
tertentu dengan vektor nilai tengah 𝝁 dan matriks ragam peragam 𝜮. Komponen
utama merupakan kombinasi linier terboboti dari peubah-peubah asal yang mampu menerangkan data secara maksimum. Komponen utama ke-j dari p peubah dapat dinyatakan sebagai
𝑌𝑗 = 𝑎1𝑗𝑥1+ 𝑎2𝑗𝑥2+ ⋯ + 𝑎𝑝𝑗𝑥𝑝 = 𝒂𝒕𝒙
dan keragaman komponen utama ke-j adalah 𝑉𝑎𝑟(𝑌𝑗) = λ𝑗 ; 𝑗 = 1, 2, … , 𝑝 dengan
𝜆1, 𝜆2, … , 𝜆𝑝 adalah akar ciri yang diperoleh dari persamaan |𝜮 − 𝜆𝑰| = 0 dimana
𝜆1 ≥ 𝜆2 ≥ … ≥ 𝜆𝑝 ≥ 0. Vektor ciri 𝒂 sebagai pembobot dari transformasi linear
peubah asal diperoleh dari persamaan (𝜮 − 𝜆𝑗𝑰)𝒂𝒋 = 0 ; 𝑗 = 1, 2, … , 𝑝 dan 𝜮
didefinisikan sebagai matriks ragam peragam 𝑿𝒕𝑿, 𝜆 sebagai akar ciri dari 𝜮 dan I
sebagai matriks identitas yang berukuran 𝑝x𝑝 dimana p adalah banyaknya peubah
bebas dalam data. Total keragaman komponen utama adalah 𝜆1+ 𝜆2+ … + 𝜆𝑝 =
𝑡𝑟(𝜮) dan persentase total keragaman data yang mampu dijelaskan oleh KU ke-j
adalah 𝜆𝑗
𝑡𝑟(𝜮)x 100%.
Pencilan Peubah Ganda
Pencilan adalah pengamatan ekstrem dan merupakan titik data yang tidak khas dari seluruh pengamatan data (Montgomery dan Peck 1992). Barnett dan Lewis (1994) mengindikasikan bahwa sebuah pengamatan yang terpencil atau pencilan adalah pengamatan yang terlihat menyimpang dari anggota lain dimana contoh tersebut diambil. Pencilan merupakan pengamatan yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data.
Jarak mahalanobis umumnya digunakan dalam pendeteksian pencilan pada peubah ganda (Johnson dan Winchern 2007) seperti berikut:
𝑑 𝑀𝐷2 = (𝒙𝒊− 𝒙̅)𝑡𝜮−𝟏(𝒙
4
dengan 𝒙̅ dan 𝜮 adalah vektor nilai tengah dan matriks ragam peragam. Namun
jarak mahalanobis ini tidak dapat diterapkan pada data berdimensi tinggi (Filzmoser
et al. 2007). Jarak mahalanobis klasik dimodifikasi menjadi jarak mahanobis kekar
yang didefinisikan sebagai berikut:
𝑅𝐷𝑖 = √(𝒙𝒊− 𝑻)𝑡𝑪−𝟏(𝒙𝒊− 𝑻)
dengan 𝑻 adalah nilai tengah kekar dan 𝑪 adalah matriks penduga ragam peragam kekar. Jarak lokasi dan jarak tebaran dapat dihitung dengan memberikan yang bobot berbeda. Sehingga persamaan jarak menjadi sebagai berikut:
𝑑𝑖 = 𝑅𝐷𝑖 √𝜒𝑝∗,0.5
2
med (𝑅𝐷1,…,𝑅𝐷𝑛) untuk 𝑖 = 1, … , 𝑛
dengan med (𝑅𝐷1, … , 𝑅𝐷𝑛) merupakan nilai median dari jarak mahalanobis kekar
dan 𝜒𝑝2∗,0.5 merupakan nilai khi kuadrat berderajat p atau sebagai nilai pembobot.
Identifikasi pencilan dilakukan dengan membandingkan jarak lokasi dan jarak tebaran dengan nilai batas ambang bawah pencilan. Suatu amatan dikatakan pencilan jika jarak lokasi dan jarak tebarannya melebihi batas ambang bawah pencilan. Batas ambang bawah pencilan dirumuskan sebagai berikut:
𝑐 = med(𝑑1, … , 𝑑𝑛) + 2.5 MAD (𝑑1, … , 𝑑𝑛)
dengan med(𝑑1, … , 𝑑𝑛) merupakan nilai median dari jarak yang diperoleh
sebelumnya dan MAD (median absolute deviation) yang didefinisikan oleh Maronna dan Zamar (2002) sebagai berikut:
MAD(𝑥1, … , 𝑥𝑛) = 1.4826 med|𝑥𝑗− med 𝑥𝑖|
dengan med (𝑥𝑖) adalah nilai median dari suatu data x.
Analisis Komponen Utama Kekar
Projection Pursuit (PP) digunakan dalam pencarian sub ruang dimensi rendah
hasil dari proyeksi data berdimensi tinggi dengan cara memaksimumkan indeks proyeksi tertentu. Indeks proyeksi ini mencirikan struktur proyeksi yang akan dimaksimumkan melalui optimasi numerik terhadap parameternya. Pada AKU kekar, indeks proyeksi tersebut menjadi penduga matriks ragam peragam yang kekar. Rousseeuw dan Croux (1993) mengasumsikan bahwa terdapat n pengamatan
pada p peubah 𝑥1, … , 𝑥𝑛 ∈ ℝ𝑝 yang disimpan didalam matriks X, maka vektor ciri
KU ke-k didefinisikan sebagai
𝑎𝑘 = 𝑎𝑟𝑔𝑚𝑎𝑥 𝑉(𝑎𝑡𝒙
𝟏, … , 𝑎𝑡𝒙𝒏)
dengan kendala ‖𝑎‖ = 1 dan V sebagai penduga matriks ragam peragam yang kekar atau indeks proyeksi (Rousseeuw dan Croux 1993). Penduga matriks ragam peragam kekar V adalah sebagai berikut:
𝐶𝑉 = ∑ 𝜆𝑘
𝑝
𝑘=1
𝑎1𝑎𝑘𝑡
dengan 𝜆𝑘 sebagai akar ciri ke-k yang didefinisikan sebagai:
𝜆𝑘 = 𝑉2(𝑎𝑘𝑡𝒙𝟏, … , 𝑎𝑘𝑡𝒙𝒏)
Croux C et al. (2007) menjelaskan bahwa algoritma grid bertujuan untuk mencari dimensi yang memiliki kemungkinan arah maksimal dari vektor ciri dengan lebih teliti. Ide dasar dalam mencari arah maksimal dari vektor ciri adalah
5
iterasi berulang untuk optimasi di dalam ruang dua dimensi. Matriks 𝑿 dalam
keadaan telah terurut sehingga 𝑆𝑗 = 𝑆(𝒙𝟏𝒋, … , 𝒙𝒏𝒋) untuk 𝑗 = 1, … , 𝑝, sehingga
𝑆(𝒆𝟏) ≥ 𝑆(𝒆𝟐) … ≥ 𝑆(𝒆𝒑) dengan 𝒆𝟏, … , 𝒆𝒑 merupakan vektor basis kanonik.
1. Dimulai dengan 𝒂̂ = 𝒆𝟏
2. Untuk 𝑖 = 1, … , 𝑁𝑔
Selanjutnya untuk 𝑗 = 1, … , 𝑝
a. Maksimumkan fungsi tujuan pada dimensi yang mencakup 𝒆𝒋 dan 𝒂̂
menggunakan pencarian grid dari fungsi 𝜃 → 𝑆(𝑐𝑜𝑠 𝜃 𝒂̂ + 𝑠𝑖𝑛 𝜃𝒆𝒋)
dengan sudut 𝜃 berada dalam interval [−𝜋/(2𝑖), 𝜋/(2𝑖)]. Sudut 𝜃
0
merupakan sudut maksimum yang dicapai untuk seluruh titik-titik grid.
b. Perbarui 𝒂̂ → 𝑐𝑜𝑠 𝜃0 𝒂̂ + 𝑠𝑖𝑛 𝜃0𝒆𝒋
Arah pertama 𝒂̂ merupakan salah satu variabel yang memiliki dispersi
terbesar. Selama satu iterasi, dilakukan urutan pencarian grid lebih dari 𝑝 − 1
dimensi, koordinat 𝑗 akan memperbarui koordinat 𝑗 sebelumnya dari 𝒂̂. Ketika
iterasi kedua dimulai, titik 𝒂̂ sudah berada pada arah yang benar, tapi masih perlu
penyempurnaan dalam solusi lokal. Oleh karena itu, pencarian grid tidak akan mencari di seluruh dimensi, tetapi hanya selama dimensi berada pada interval [−𝜋/4, 𝜋/4]. Setelah setiap iterasi dilakukan, pencarian terbatas pada interval yang
lebih sempit dari sudutnya, namun nilai grid untuk setiap interval 𝑁𝑔 akan tetap
konstan pada setiap iterasi. Sehingga beberapa iterasi pertama memungkinkan untuk menemukan wilayah dengan dimensi yang terdapat nilai maksimum, dan siklus berikutnya bertujuan untuk meningkatkan presisi dari solusi yang dihasilkan.
METODOLOGI
Sumber Data
Data yang digunakan dalam penelitian ini adalah data hasil pengukuran alat
fourier transform infrared (FTIR) terhadap sampel jamu berupa ekstrak temulawak
dalam bentuk kapsul yang dilakukan di Laboratorium Pusat Studi Biofarmaka LPPM IPB pada bulan September 2015. Ekstrak sampel diambil sebanyak ±10 mg dan dicampur dengan KBr kemudian dijadikan kapsul. Sampel jamu disimpan
dalam suhu normal atau suhu awal jamu, suhu ruang, suhu 30 0C, dan 40 0C dengan
masing-masing suhu tujuh kali ulangan, kecuali suhu normal hanya lima kali ulangan. Setiap sampel dalam suhu berbeda diberikan penyinaran spektrum IR sebanyak 1866 kali, sehingga data yang diperoleh terdiri dari 26 amatan dan 1866 peubah. Perlakuan berupa panjang gelombang FTIR sedangkan respon berupa nilai inframerah yang diserap oleh jamu.
Data yang akan dianalisis merupakan data yang telah melewati tahapan prapemrosesan data. Tahapan prapemrosesan pada penting dilakukan karena data berbentuk digital seperti hasil analisis FTIR memiliki banyak noise atau gangguan. Adapun tahapan prapemrosesan data meliputi 3 proses yakni smoothing
Savitzky-6
Golay, baseline, dan standar normal variate (SNV). Smoothing S-Golay yakni
pemulusan untuk menangani noise pada data digitalnamun tetap mempertahankan
bentuk dan tinggi puncak gelombang. Baseline yaitu pendekatan titik data terhadap suatu garis pangkal sebagai acuan yakni suhu awal. Standar normal variate (SNV) adalah transformasi yang bertujuan untuk menghilangkan variasi kemiringan dari spektrum disebabkan oleh pencar dan variasi ukuran partikel.
Prosedur Analisis Data
Analisis dalam penelitian ini dibantu dengan R i386 3.1.2 software dengan menggunakan paket rrcov dan mvoutlier dalam analisis AKU dan AKU-K.
Tahapan analisis yang dilakukan dalam penelitian ini adalah sebagaiberikut:
1. Melakukan ketiga tahapan prapemrosesan data yakni smoothing
Savitzky-Golay, baseline, dan standar normal variate (SNV).
2. Melakukan pendeteksian pencilan peubah ganda berdasarkan jarak mahalanobis pada lokasi dan tebarannya serta penentuan batas ambang bawah pencilan.
3. Melakukan analisis komponen utama klasik dan analisis komponen utama kekar menggunakan algoritma grid selanjutnya membandingkan kedua metode analisis berdasarkan akar ciri, vektor ciri, proporsi keragaman komponen utama pertama dan komponen utama kedua serta skor komponen dalam bentuk plot tebaran.
4. Melakukan uji beda perlakuan menggunakan analisis ragam pada komponen utama pertama dan komponen utama kedua untuk kedua metode analisis dengan model sebagai berikut (Mattjik dan Sumertajaya 2013):
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖+ 𝜀𝑖𝑗
dengan 𝑖 = 1,2, … , 𝑡 dan 𝑗 = 1,2, … , 𝑟
𝑌𝑖𝑗 : Pengamatan pada suhu ke-i dan ulangan ke-j
𝜇 : Rataan umum
𝜏𝑖 : Pengaruh suhu ke-i
𝜀𝑖𝑗 : Pengaruh acak pada suhu ke-i ulangan ke-j
dengan hipotesis sebagai berikut:
𝐻0 ∶ 𝜏1 = ⋯ = 𝜏4 = 0 (Tidak terdapat perbedaan pengaruh antar taraf
suhu)
𝐻1 ∶ Paling sedikit ada satu i dengan 𝜏𝑖 ≠ 0 (paling sedikit terdapat satu
perbedaan pengaruh antar taraf suhu)
Tolak 𝐻0 ketika nilai P yang diperoleh lebih kecil dibandingkan taraf nyata
yang digunakan yakni 0.05.
5. Melakukan penyekatan pada plot garis komponen utama pertama dan komponen utama kedua untuk kedua metode analisis. Penyekatan ini berdasarkan pada nilai korelasi dari vektor ciri setiap variabel dengan komponen utama pertama dan kedua untuk kedua metode.
6. Menelusuri gugus senyawa kimia yang terkandung di dalam komponen pertama dan komponen kedua untuk kedua metode berdasarkan sekatan vektor ciri dan identifikasi gugus senyawa secara kemometrik.
7
HASIL DAN PEMBAHASAN
Tahapan Prapemrosesan Data
Gambar 2a memperlihatkan plot garis data awal hasil pengukuran alat FTIR terhadap sampel jamu berupa ekstrak temulawak dalam bentuk kapsul. Terlihat banyak noise dari hasil pengukuran ini. Oleh karena itu, dilakukan tahapan prapemrosesan data yakni Smoothing S-Golay, baseline dan standar normal variate (SNV).
a. Data Awal b. Smoothing S-Golay
c. Baseline d. Standar Normal Variate (SNV)
Gambar 2 Tahapan prapemrosesan data
Gambar 2b merupakan plot garis data setelah dilakukan Smoothing S-Golay. Plot garis pada Gambar 2b tampak lebih mulus dibandingkan pada Gambar 2a dan
noise telah teratasi tanpa adanya perubahan bentuk dan tinggi puncak gelombang.
Tahapan prapemrosesan selanjutnya adalah baseline. Gambar 2c memperlihatkan plot garis data yang telah dilakukan baseline. Plot garis tampak turun karena titik-titik data telah didekatkan pada suatu garis pangkal sebagai acuan yakni suhu normal jamu. Tahapan prapemrosesan terakhir yaitu standar normal variate (SNV). Gambar 2d memperlihatkan plot garis yang telah dilakukan pembakuan berdasarkan sebaran normal baku. Variasi kemiringan dari spektrum disebabkan oleh pencar dan variasi ukuran partikel tampak menghilang sehingga plot garis tampak berdekatan.
Pendeteksian Pencilan
Proses pendeteksian pencilan menggunakan jarak mahalanobis dihitung berdasarkan jarak lokasi dan jarak tebarannya. Suatu amatan dikatakan sebuah pencilan jika jarak lokasi dan jarak tebaran bernilai lebih dari batas ambang bawah pencilan. Batas ambang bawah untuk jarak lokasi sebesar 4.990 dan batas ambang
8
bawah pencilan untuk jarak tebaran adalah sebesar 3.368. Lampiran 1 menunjukkan bahwa terdapat 4 amatan yang memiliki jarak lokasi yang lebih dari 4.990 yakni
suhu 40 0C ulangan 1 dan ulangan 2 serta suhu 30 0C ulangan 4 dan ulangan 7.
Sedangkan terdapat 2 amatan yang memiliki jarak tebaran lebih besar dari 3.368
yakni suhu 30 0C ulangan 4 dan ulangan 7. Sehingga terdapat 2 amatan sebagai
pencilan yakni suhu 30 0C ulangan 4 dan suhu 30 0C ulangan 7 yang memiliki jarak
lokasi dan jarak tebaran yang bernilai lebih dari batas ambang bawah pencilan. Proporsi pencilan pada penelitian ini sebesar 7.7%.
Perbandingan AKU dan AKU-K
AKU dan AKU-K menghasilkan struktur komponen utama yang relatif berbeda pada penelitian ini. Gambar 3 memperlihatkan bahwa proporsi keragaman AKU pada komponen pertama sebesar 94.8% mengalami penurunan yang lebih besar pada komponen kedua sebesar 2.9% dibandingkan komponen utama pertama AKU-K yakni 88.3% dengan komponen utama kedua AKU-K yakni 5.2%, begitupun pada proporsi keragaman komponen utama lainnya. Proporsi keragaman yang dihasilkan AKU-K relatif lebih stabil dibandingkan pada proporsi keragaman yang dihasilkan AKU. Keberadaan pencilan membuat keragaman komponen utama membesar.
Gambar 3 Proporsi keragaman AKU dan AKU-K
Gambar 4 Akar ciri AKU dan AKU-K
94.8 2.9 1 0.6 0.3 0.1 0.1 0 0 0 88.3 5.2 2 1.8 0.7 0.6 0.5 0.1 0.1 0.1 0 10 20 30 40 50 60 70 80 90 100 1 2 3 4 5 6 7 8 9 10 P ropor si Ke ra ga man (% ) Komponen Utama AKU AKU-K 97.7 3.0 1.1 0.6 0.3 0.2 0.1 0.0 0.0 0.0 72.0 4.2 1.6 1.4 0.6 0.5 0.4 0.1 0.1 0.1 0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0 80.0 90.0 100.0 1 2 3 4 5 6 7 8 9 10 Aka r C iri Komponen Utama AKU AKU-K
9
Akar ciri antar kedua metode relatif berbeda pada penelitian ini. Gambar 4 memperlihatkan plot garis akar ciri AKU dan AKU-K. Akar ciri pada komponen utama pertama AKU sebesar 97.71 mengalami penurunan yang lebih besar pada komponen utama kedua sebesar 3.01 dibandingkan dengan komponen utama pertama AKU-K yakni 72.00 dan komponen utama kedua pada AKU-K sebesar 4.22, begitupun pada akar ciri komponen utama lainnya. Akar ciri yang dihasilkan AKU-K relatif lebih stabil jika dibandingkan pada akar ciri yang dihasilkan AKU. Pencilan akan mempengaruhi keragaman akar ciri yang dihasilkan.
Gambar 5 menunjukkan perbandingan plot tebaran antara komponen utama pertama dan komponen utama kedua untuk AKU dan AKU-K. Plot tebaran AKU yang ditunjukkan pada Gambar 5a memperlihatkan bahwa skor amatan pada suhu
30 0C ulangan keempat dan suhu 30 0C ulangan ketujuh memiliki skor yang berbeda
atau menyimpang cukup jauh dari skor amatan yang lain. Plot tebaran dengan menggunakan metode AKU-K pyang ditunjukkan pada Gambar 5b
memperlihatkan bahwa hanya skor amatan pada suhu 30 0C ulangan keempat yang
memiliki skor yang menyimpang cukup jauh. Hal ini menunjukan bahwa metode AKU-K mampu menarik skor amatan pada metode AKU menjadi lebih dekat dengan skor lainnya.
10 0 -10 -20 -30 5 4 3 2 1 0 -1 -2 KU1 AKU K U 2 A K U Suhu_Normal5 Suhu_Normal4 Suhu_Normal3 Suhu_Normal2 Suhu_Normal1 Suhu_Ruang7 Suhu_Ruang6 Suhu_Ruang5 Suhu_Ruang4 Suhu_Ruang3 Suhu_Ruang2 Suhu_Ruang1 Suhu 30_7 Suhu 30_6 Suhu 30_5 Suhu 30_4 Suhu 30_3 Suhu 30_2 Suhu 30_1 Suhu 40_7 Suhu 40_6 Suhu 40_5Suhu 40_4 Suhu 40_3 Suhu 40_2 Suhu 40_1 10 0 -10 -20 -30 4 3 2 1 0 -1 KU1 AKU-K K U 2 A K U -K Suhu_Normal5 Suhu_Normal4 Suhu_Normal3 Suhu_Normal2 Suhu_Normal1 Suhu_Ruang7 Suhu_Ruang6 Suhu_Ruang5 Suhu_Ruang4 Suhu_Ruang3 Suhu_Ruang2 Suhu_Ruang1 Suhu 30_7 Suhu 30_6 Suhu 30_5 Suhu 30_4 Suhu 30_3 Suhu 30_2 Suhu 30_1 Suhu 40_7 Suhu 40_6 Suhu 40_5Suhu 40_4 Suhu 40_3 Suhu 40_2 Suhu 40_1 (a) (b)
Gambar 5 Plot tebaran KU 1 dan 2 menggunakan AKU (a) dan AKU-K (b)
Hasil Analisis Ragam untuk Uji Beda Perlakuan
Perbandingan AKU dan AKU-K dilakukan dengan uji beda perlakuan menggunakan analisis ragam untuk mengetahui kesamaan skor pada komponen utama pertama dan komponen utama kedua pada setiap perlakuan untuk kedua metode. Menurut Mattjik dan Sumertajaya tahun 2013, penggunaan analisis ragam dilakukan setelah memenuhi beberapa asumsi diantaranya asumsi kenormalan, sisaan saling bebas, dan kehomogenan ragam sisaan.
Hasil pengujian kenormalan menggunakan uji Kolmogorov-Smirnov memperoleh nilai P lebih besar dari 0.150 untuk komponen utama pertama AKU dan komponen utama pertama dan kedua AKU-K, sedangkan nilai P untuk komponen utama kedua AKU lebih kecil dari 0.010 sehingga komponen utama kedua AKU dilakukan transformasi. Transformasi dilakukan dengan pengoperasian logaritma natural dari penjumlahan komponen utama kedua dengan suatu konstanta. Hasil uji Kolmogorov-Smirnov menunjukan nilai P untuk komponen
10
utama kedua AKU lebih besar dari 0.150. Hasil pengujian kehomogenan ragam menggunakan Levene’s menghasilkan nilai P sebesar 0.314 dan 0.879 untuk komponen utama pertama dan kedua AKU, serta 0.330 dan 0.145 untuk komponen utama pertama dan kedua AKU-K. Hasil pengujian autokorelasi memperoleh nilai P sebesar 0.230 untuk komponen utama kedua metode dan nilai P sebesar 0.101 dan 0.439 untuk komponen utama kedua AKU dan AKU-K. Nilai P yang diperoleh seluruh pengujian bernilai lebih dari taraf nyata sebesar 0.05 sehingga data telah memenuhi seluruh asumsi yang diperlukan.
Hasil yang diharapkan adalah menerima 𝐻0 yakni tidak terdapat perbedaan
antar taraf suhu. Hal ini berarti kualitas temulawak tetap sama dalam berbagai keadaan suhu. Analisis ragam pada Tabel 2 memperlihatkan bahwa pada skor komponen utama pertama untuk kedua metode (AKU dan AKU-K) tidak ada perbedaan perlakuan. Analisis ragam untuk skor komponen utama kedua pada AKU menunjukan bahwa pada skor komponen utama kedua terdapat perbedaan perlakuan sedangkan pada skor komponen utama kedua pada AKU-K menunjukan tidak ada perbedaan perlakuan. Hal ini memperlihatkan bahwa keberadaan pencilan akan mempengaruhi kesimpulan yang dihasilkan. Adanya perbedaan kesimpulan yang dihasilkan akan ditelusuri berdasarkan nilai vektor ciri komponen pertama dan kedua setiap metode yang akan dikaitkan dengan perbedaan jenis senyawa kimia pembentuknya.
Tabel 2 Perbandingan analisis ragam skor komponen
Metode Komponen utama Fhitung Nilai P
AKU Pertama 2.910 0.057
Kedua 5.050 0.008
AKU-K Pertama 3.020 0.052
Kedua 1.680 0.201
Penelusuran Gugus Fungsi Senyawa Kimia
Plot garis komponen utama pertama dan komponen utama kedua untuk setiap metode memiliki daerah sekatan yang berbeda yang ditunjukkan pada Lampiran 2 hingga Lampiran 5. Penyekatan ini berdasarkan pada nilai korelasi dari vektor ciri setiap variabel dengan komponen utama pertama dan kedua untuk kedua metode. Suatu variabel dapat dikatakan menerangkan suatu komponen jika memiliki korelasi yang paling tinggi dengan komponen tersebut dibandingkan
dengan komponen lainnya (Mattjik dan Sumertajaya 2011).Tidak semua sekatan
mampu mengidentifikasi suatu gugus fungsi senyawa. Tabel 3 menunjukkan hasil penulusuran terhadap gugus fungsi dari senyawa kimia serta kegunaannya. Komponen utama pertama pada AKU dan AKU-K memiliki area dan gugus senyawa yang sama yakni gugus C-H kelompok isoprenoid (area a), gugus karbonil dan ikatan O-H (area c) serta gugus karbonil amida dan ikatan C-C gugus fenil (area
d). Penelusuran senyawa kimia ini mengacu pada Baciu et al. pada tahun 2013.
Berdasarkan hasil analisis ragam pada Tabel 2, tidak ada perbedaan senyawa pada komponen pertama untuk kedua metode serta kedua metode memberikan keragaman skor yang sama, sehingga dapat dikatakan bahwa pencilan tidak mempengaruhi struktur dari komponen pertama.
11
Komponen utama kedua pada AKU dan AKU-K hanya memiliki 1 senyawa yang sama yakni gugus aromatik dengan ikatan N-H (area e). Ikatan N-H asam amino (area f) hanya mampu dijelaskan oleh AKU-K. Berdasarkan hasil analisis ragam pada Tabel 2, perbedaan 1 senyawa pada kelompok pertama dan kedua metode memberikan keragaman skor yang berbeda, sehingga dapat dikatakan bahwa pencilan mempengaruhi struktur komponen kedua serta keragaman skor dari kedua metode tersebut.
Tabel 3 Penelusuran gugus fungsi senyawa kimia
Metode Komponen utama Panjang gelombang Area Keterangan area senyawa Kegunaan senyawa AKU Pertama 555-950 a Gugus C-H, Kelompok Isoprenoid Bahan karet sintetik 1166-1294 c Gugus Karbonil, Ikatan O-H Belum spesifik 1361-1479 d Gugus Karbonil amida, Ikatan C-C, Gugus Fenil Belum spesifik
Kedua 1481-1566 e Gugus Aromatik,
Ikatan N-H Belum spesifik AKU-K Pertama 572-948 a Gugus C-H, Kelompok Isoprenoid Bahan karet sintetik 1182-1299 c Gugus Karbonil, Ikatan O-H Belum spesifik 1379-1402 d Gugus Karbonil amida, Ikatan C-C, Gugus Fenil Belum spesifik Kedua 1494-1560 e Gugus Aromatik, Ikatan N-H Belum spesifik 1604-1647 f Ikatan N-H Asam Amino Asam Amino
SIMPULAN
Analisis komponen utama dengan menggunakan metode AKU-K menunjukkan hasil yang lebih baik dibandingkan AKU klasik. AKU klasik dipengaruhi oleh kehadiran pencilan sehingga keberadaan pencilan akan memberikan hasil yang berbeda. Akar ciri dan proporsi keragaman AKU pada komponen pertama mengalami penurunan yang lebih besar pada komponen kedua dibandingkan AKU-K, begitupun pada akar ciri dan proporsi keragaman komponen lainnya. Akar ciri dan proporsi keragaman yang dihasilkan AKU-K relatif lebih stabil jika dibandingkan pada akar ciri yang dihasilkan AKU. Vektor ciri komponen utama dari kedua metode tersebut secara umum memberikan interpretasi yang sama Plot tebaran menggunakan metode AKU-K mampu menarik skor amatan pencilan pada metode AKU menjadi lebih dekat dengan skor lainnya. Hasil analisis ragam menunjukan bahwa keberadaan pencilan akan mempengaruhi kesimpulan yang dihasilkan. Berdasarkan penelusuran senyawa kimia, tidak ada perbedaan senyawa
12
pada komponen pertama untuk kedua metode dan kedua metode memberikan keragaman skor yang sama sehingga pencilan tidak mempengaruhi struktur dari komponen pertama. Sedangkan pada komponen utama kedua pada AKU memiliki satu senyawa berbeda dan memberikan keragaman skor yang berbeda, sehingga dapat dikatakan bahwa pencilan mampu mempengaruhi struktur komponen kedua serta keragaman skor dari kedua metode tersebut.
DAFTAR PUSTAKA
Baciu A, Ranga F, Fetea F. 2013. Fingerprinting Food Supplements and Their Botanical Ingredients by CoupledUV/Vis/FTIR Spectrometry. Bulletin of
UASVM Food Science and Technology. 70(1): 8-15
Barnett V, Lewis T. 1994. Outliers in Statistical Data. Chichester (UK): John Wiley & Sons, Ltd.
Chen H. 2002. Principal Component Analysis with Missing Data and Outliers [technical report]. Piscataway (US) : Rutgers University.
Croux C, Filzmoser P, Oliveira M. 2007. Algorithms for projection-pursuit robust principal component analysis. Journal of Chemometrics and Intelligent
Laboratory Systems.87:218-225.
Filzmoser P, Maronna R, Werner M. 2007. Outlier Identification in High Dimension. Computational Statistics and Data Analysis. 52: 1694–1711. Friedman JH, Stuetzle W. 1981. Projection Pursuit Regression. J Amer Statistics
Association. 376:817-823.
Hubert M, Rousseeuw PJ, Vanden-Branden K. 2005. ROBPCA: A New Approach to Robust Principal Component Analysis. Technometrics. 47: 64-79. Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis. 6th ed,
New Jersey (US): Prentice Hall, Inc.
Jolliffe IT. 2002. Principal Component Analysis. 2nd ed. New York (US): Springer-Verlag. Inc.
Mattjik AA, Sumertajaya I Made. 2013. Perancangan Percobaan dengan Aplikasi
SAS dan Minitab jilid 1. Ed ke-4. Bogor: IPB Press.
Mattjik AA, Sumertajaya I Made. 2011. Sidik Peubah Ganda dengan Menggunakan
SAS jilid 1. Bogor: IPB Press.
Maronna, R., Zamar, R., 2002. Robust estimates of location and dispersion for high-dimensional data sets. Technometrics. 44(4): 307–317.
Montgomery DC, Peck EA. 1992. Introduction to Linear Regression Analysis. 2nd ed. New York (US): John Wiley & Sons. Inc.
Rousseeuw P., Croux C. 1993. Alternatives to the median absolute deviation.
13
LAMPIRAN
Lampiran 1 Identifikasi pencilan
Suhu (0C) Ulangan Jarak lokasi Jarak tebaran
Suhu 40 0C 1 5.087 3.108 2 5.777 2.816 3 0.532 1.019 4 2.435 1.414 5 3.023 1.754 6 0.316 0.890 7 3.578 2.127 Suhu 30 0C 1 1.576 0.892 2 0.537 0.706 3 0.224 0.466 4 18.467 8.876 5 0.667 1.663 6 0.224 0.897 7 14.324 6.703 Suhu Ruang 1 3.668 2.743 2 0.841 1.084 3 0.953 1.163 4 2.255 1.728 5 0.842 1.284 6 2.450 1.984 7 0.588 0.739 Suhu Normal 1 1.254 1.111 2 1.890 2.540 3 1.287 0.635 4 2.409 2.401 5 1.501 1.744
Lampiran 2 Plot garis komponen utama pertama AKU
14
Lampiran 3 Plot garis komponen utama kedua AKU
Lampiran 4 Plot garis komponen utama pertama AKU-K
Lampiran 5 Plot garis komponen utama kedua AKU-K
Lampiran 6 Hasil analisis ragam
Peubah respon Sumber
keragaman Derajat bebas Jumlah kuadrat Kuadrat
tengah Fhitung Nilai P
KU 1 AKU Suhu 3 694.370 231.460 2.910 0.057 Galat 22 1748.440 79.470 Total 25 2442.810 KU 2 AKU Suhu 3 11.256 3.752 5.050 0.008 Galat 22 16.346 0.743 Total 25 27.602 KU 1 AKU-K Suhu 3 679.720 226.570 3.020 0.052 Galat 22 1651.480 75.070 Total 25 2331.200 KU 2 AKU-K Suhu 3 8.432 2.811 1.680 0.201 Galat 22 36.851 1.675 Total 25 45.282
15
RIWAYAT HIDUP
Penulis dilahirkan di Bandung pada tanggal 26 Juni 1994, sebagai anak pertama dari dua bersaudara pasangan Irwan Suhenrawan dan Eti Nurhayati. Tahun 2006 penulis lulus dari SD Muhammadiyah 14 Palembang, kemudian melanjutkan pendidikan di SMP Negeri 19 Palembang selama dua tahun lalu pindah ke SMP Negeri 2 Cibinong dan lulus tahun 2009. Selanjutnya, pada tahun 2012 penulis menyelesaikan pendidikannya di SMA Negeri 2 Cibinong dan pada tahun yang sama diterima di Institut Pertanian Bogor melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Undangan. Penulis diterima sebagai mahasiswa Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor dengan minor Matematika Keuangan dan Aktuaria.
Selama menempuh pendidikan di Institut Pertanian Bogor, penulis menjadi asisten dosen untuk mata kuliah Metode Statistika pada tahun 2014 dan tahun 2015. Pada periode masa bakti Himpunan Profesi Mahasiswa Statistika Gamma Sigma Beta (GSB) tahun 2014-2015, penulis aktif sebagai anggota dalam Departemen
SAINS. Penulis juga aktif dalam berbagai kegiatan kepanitiaan, diantaranya Pekan
Olahraga Statistika 2013, Pesta Sains Nasional 2013, The 10th Statistika Ria, Pesta
Sains Nasional 2014, Kompetisi Statistika Junior.
Penulis juga aktif dalam berbagai kompetisi statistika tingkat nasional dan ASEAN, diantaranya yaitu semifinalis Data Analysis Competition Institut Teknologi Surabaya, semifinalis National Statistics Competition Universitas
Brawijaya, semifinalis 1st Indonesia Statistics Conference and Olympiad, peserta
Olimpiade Statistika Nasional Universitas Gajah Mada serta peserta Data Analysis
Competition Institut Teknologi Surabaya tingkat ASEAN.
Penulis juga mendapatkan beasiswa Pemerintah Provinsi Jawa Barat selama masa kuliah. Pada semester 6, penulis berkesempatan melaksanakan kegiatan praktik lapang di Pusat Studi Biofarmaka LPPM IPB, Bogor.