TUGAS 5 BIOSTATISTIKA
Kelompok 2 Nama Anggota:
1. NurHalizah (H0323023) 2. Khairul Amri (H0323519) 3. Sitti Najmah (H0323322) 4. Alpilin (H0323327)
A. Tahap Pengujian Data
Dalam percobaan ini kita menggunakan aplikasi R, kita akan mencoba menguji memggunakan pemahaman PCA yang digunakan untuk pemahaman konsumsi multikolibiritas.
Data yang akan di Uji Mulkitolibiritas
B. Tahap Reduksi
Tahap reduksi adalah proses dalam analisis data, di mana data yang telah dikumpulkan disederhanakan, diorganisasi, dan ditransformasi menjadi
informasi yang lebih bermakna dan mudah untuk dianalisis. Proses ini melibatkan seleksi, penyederhanaan, abstraksi, dan penggolongan data untuk memudahkan penarikan kesimpulan dan verifikasi.
Dari hasil yang telah telah kami dikerjakan diatas, tahap mereduksi data atau proses pemilihan, pemustan perhatian pada penyederhanaan, pengabstrakan dan transformasi data kasar yang muncul dari catatan-catatan tertulis di lapangan.
Setelah melakukan tahap Reduksi
C. Tahap Standarisasi Data
Standarisasi data adalah proses pembuatan dan penegakan standar atau norma yang digunakan untuk membandingkan atau mengontrol suatu kinerja dengan mengubah nilai format data yang salah menjadi format dengan nilai yang benar.
Setelah kami melakukan standarisasi maka didapatkan hasil sebagai berikut.
Tampilan_Buku_Mapel Pelayanan_Guru Administrasi_Pendidikan [1,] -1.360029 -0.904490 -0.165539
[2,] 0.509925 0.568049 1.165539 [3,] 1.360029 0.904490 1.165539 [4,] -0.509925 -1.568049 -1.165539 [5,] -0.509925 0.231609 0.165539
[6,] -1.360029 -1.231609 -1.496077 [7,] 0.509925 -0.231609 0.496077
[8,] -0.509925 0.000000 -0.496077 [9,] 1.360029 1.231609 1.496077 [10,] 0.509925 1.568049 0.165539
Media_Pembelajaran_oleh_Guru Informasi_Perlombaan_Beasiswa Informasi_Lokasi_ke_Sekolah
[1,] -0.520189 -1.269425 -0.699357 [2,] 1.269425 0.699357 0.699357 [3,] 1.269425 0.699357 0.699357 [4,] -1.269425 -0.699357 -0.699357 [5,] 0.520189 1.269425 1.233849 [6,] -1.269425 -1.269425 -1.233849 [7,] 0.520189 0.699357 0.610934 [8,] -0.520189 -0.699357 -0.610934 [9,] 1.269425 1.269425 1.233849 [10,] 0.520189 0.699357 0.610934
Kemudahan_Akses_Lokasi_ke_Sekolah [1,] -0.997379
[2,] 0.768189 [3,] 1.514391 [4,] -0.850804 [5,] 0.848139 [6,] -1.450431 [7,] -1.170605 [8,] -0.171227 [9,] 0.621613 [10,] 0.888114
1. Bentuk hasil dari semua variabel yang telah distandarisasi Tampilan_Buku_Mapel
5.791
Pelayanan_Guru 3.256
Administrasi_Pendidikan 5.647
Media_Pembelajaran_oleh_Guru 4.198
Informasi_Perlombaan_Beasiswa 3.776
Informasi_Lokasi_ke_Sekolah 2.987
Kemudahan_Akses_Lokasi_ke_Sekolah 1.357
2. Setelah melakukan tahap standarisasi, lalu kita akan membentuk matriks dari data variabel diatas sehingga didapatkan.
D. Percobaan Mencari Komponen Nilai Utama
Berdasarkan Standardized Data Matrix diatas, selanjutnya kita dapat melakukan Principal Component Analysis (PCA).
1. Nilai Eigen
Berikut adalah nilai eigen dari analisis tersebut:
Eigenvalues:
[5.4639,1.0585,0.7870,0.2747,0.1159,0.0444,0.0332]
Nilai eigen ini menunjukkan varians yang dijelaskan oleh masing-masing komponen utama. Komponen pertama menjelaskan varians terbesar, dan seterusnya.
Kumulatif persentase varians yang dijelaskan oleh komponen-komponen ini adalah sebagai berikut:
Cumulative Explained Variance:
[0.7025,0.8386,0.9398,0.9751,0.9900,0.9957,1.0000]
Ini menunjukkan bahwa, misalnya, dua komponen utama pertama menjelaskan sekitar 83.86% dari total varians dalam data.
2. Priplot
Berikut adalah visualisasi dari Scree Plot dan Cumulative Explained Variance berdasarkan Standardized Data Matrix:
Scree Plot menunjukkan nilai eigen untuk setiap komponen utama, yang mengindikasikan seberapa banyak varians yang dijelaskan oleh setiap komponen. Sedangkan Cumulative Explained Variance menunjukkan akumulasi persentase varians yang dijelaskan saat kita menambah jumlah komponen.
3. Kumulatif Eigen
Berikut adalah nilai kumulatif dari eigenvalues berdasarkan Standardized Data Matrix:
Cumulative Eigenvalues:
[5.4639,6.5224,7.3095,7.5842,7.7002,7.7446,7.7778]
Nilai-nilai ini menunjukkan jumlah kumulatif dari varians yang dijelaskan oleh komponen utama dalam analisis PCA Anda, dimulai dari komponen pertama hingga terakhir.
E. Kesimpulan
Berdasarkan analisis percobaaan yang kami dapat dapatkan melalui Principal Component Analysis (PCA) dari Standardized Data Matrix, berikut adalah kesimpulan yang dapat diambil:
1. Data di atas menunjukkan nilai-nilai yang telah distandarisasi untuk setiap kriteria penilaian pada setiap kelas. Nilai-nilai ini memiliki rata-rata 0 dan simpangan baku 1, yang merupakan karakteristik dari data yang telah distandarisasi.
2. Setiap nilai dalam tabel di atas telah distandarisasi sehingga memiliki rata- rata 0 dan simpangan baku 1 untuk setiap variabel, kecuali untuk kolom
‘Kelas’ yang merupakan identifikasi kelas dan tidak distandarisasi.
3. Reduksi Dimensi: PCA berhasil mengurangi dimensi data dengan mempertahankan komponen-komponen yang paling signifikan dalam menjelaskan varians dalam data.
4. Varians yang Dijelaskan: Komponen utama pertama memiliki kontribusi terbesar dalam menjelaskan varians, diikuti oleh komponen-komponen berikutnya yang memiliki kontribusi lebih kecil.
5. Pemilihan Komponen: Scree Plot dapat digunakan untuk menentukan jumlah komponen utama yang akan digunakan. Biasanya, komponen dipilih hingga titik ‘elbow’ pada plot, di mana penambahan komponen baru tidak lagi memberikan penjelasan varians yang signifikan.
6. Interpretasi Komponen: Setiap komponen utama mewakili kombinasi variabel asli. Interpretasi dari komponen-komponen ini dapat memberikan wawasan tentang pola atau hubungan yang ada dalam data.
7. Aplikasi Lebih Lanjut: Hasil PCA dapat digunakan untuk analisis lebih lanjut, seperti clustering atau klasifikasi, dan juga dapat membantu dalam visualisasi data multidimensi.
8. Efisiensi Analisis: Dengan mengurangi jumlah variabel tanpa kehilangan informasi yang signifikan, PCA meningkatkan efisiensi analisis data berikutnya.
Secara keseluruhan, PCA adalah teknik yang berguna dan efektif untuk analisis data eksploratif, yang membantu dalam mengidentifikasi struktur tersembunyi dan memudahkan interpretasi data yang kompleks.