Tugas Individu 3
Komputasi Statistika
Dosen Pembimbing:
Muhammad Kasim Aidid, S.Si., M.Si.
Ansari Saleh Ahmar, S.Si., M.Sc., Ph.D.
Agung Tri Utomo, S.Stat., M.Si.
Muh. Afdal Jaenuddin 230112500023
PROGRAM STUDI STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MAKASSAR
2024/2025
03-06
Pendahuluan
A. Kata Pengantar
Segala puji bagi Allah SWT atas limpahan rahmat-Nya.
Shalawat dan salam semoga senantiasa tercurahkan kepada Nabiullah Muhammad SAW beserta keluarga, para sahabat, dan pengikut sunnahnya.
Terima kasih kepada kedua orang tua saya sendiri.
Terima kasih kepada para dosen pembimbing atas ilmu yang diajarkan.
Terima kasih kepada pihak lain yang tidak disebutkan atas segala dukungannya, baik secara langsung maupun tidak langsung.
Makassar, 17 September 2024
Muh. Afdal Jaenuddin
B. Data
Data yang akan digunakan sebagai bahan analisis adalah data Angka Harapan Hidup, Harapan Lama Sekolah, Rata-rata Lama Sekolah, Pengeluaran Per Kapita Riil, dan Indeks Pembangunan Manusia Tahun 2023 untuk setiap kabupaten yang ada di Provinsi Sulawesi Barat, sebagaimana dalam tabel berikut.
KAB AHH HLS RLS PPKR IPM
Majene 70.06 13.63 9.28 10462 72.44
Polewali Mandar 70.82 13.39 7.71 9096 69.24
Mamasa 72.16 12.53 8.11 8108 68.14
Mamuju 71.79 13.25 8.16 10075 71.07
Pasangkayu 70.09 12.06 8.12 11649 70.42
Mamuju Tengah 69.76 12.65 7.73 8821 67.63
C. Definisi Variabel
• KAB = Kabupaten
• AHH = Angka Harapan Hidup 2023 (Tahun)
• HLS = Harapan lama sekolah 2023 (Tahun)
• RLS = Rata-rata Lama Sekolah 2023 (Tahun)
• PPKR = Pengeluaran Per Kapita Rill 2023 (Ribu Rupiah)
• IPM = Indeks Pembangunan Manusia 2023
D. Link Sumber Data
Semua data merupakan data sekunder yang bersumber dari laman resmi Badan Pusat Statistika Provinsi Sulawesi Barat.
• AHH: https://sulbar.bps.go.id/id/statistics-table/2/NjQzIzI=/angka-harapan-hidup-- 2023.html
• HLS: https://sulbar.bps.go.id/id/statistics-table/2/MzIjMg==/harapan-lama-sekolah-- 2023.html
• RLS: https://sulbar.bps.go.id/id/statistics-table/2/MzUjMg==/rata-rata-lama-sekolah-- 2023.html
• PPKR: https://sulbar.bps.go.id/id/statistics-table/2/MTIxIzI=/pengeluaran-per-kapita-riil- disesuaikan--2023.html
• IPM: https://sulbar.bps.go.id/id/statistics-table/2/NjQyIzI=/indeks-pembangunan- manusia--2023.html
Analisis
A. Tujuan Analisis
Analisis ini dilakukan untuk meringkas variabel penelitian dari lima menjadi dua
komponen utama yang diharapkan mampu mewakili sebagian besar informasi dalam data dalam dimensi yang lebih sedikit serta mengetahui seberapa cukup komponen utama terpilih mampu menjelaskan data keseluruhan. Selain itu, analisis juga dilakukan untuk mengetahui
pengelompokan di antara enam kabupaten yang ada di Provinsi Sulawesi Barat .
B. Metode Analisis
Analisis menggunakan metode analisis komponen utama serta penggunaaan scatterplot.
Seluruh rangkaian analisis dilakukan dengan menggunakan software R Studio. Adapun pengelompokan titik-titik pada scatterplot dilakukan berdasarkan K-Means Clustering.
C. Langkah-Langkah Analisis
1. Analisis Komponen Utama
a. Input dan Output
# 0. Penginstalan Paket install.packages("openxlsx")
# 1. Impor dataset library(openxlsx)
data <- read.xlsx("C:/Users/LENOVO/Downloads/komput3.xlsx", sheet = 1)
# 2. Statistik Deskriptif Data summary(data)
# 3. Melakukan PCA
# 3.1 Simpan variabel KAB secara terpisah kab <- data$KAB
# 3.2 Skalakan data numerik data_scaled <- scale(data[, -1])
# 3.3 PCA
pca_result <- prcomp(data_scaled, center = TRUE, scale. = TRUE)
# 4. Meninjau hasil PCA summary(pca_result)
# 5. Memeriksa koefesien variabel asli pada PC
loadings <- pca_result$rotation[, 1:2] # Loadings untuk PC1 dan PC2 print(loadings)
b. Interpretasi
Berdasarkan output dari algoritma summary(pca_result), dan dengan memperhatikan proporsi varians (proportion of variace) diperoleh bahwa:
• PC1 menjelaskan 51.32% varians total.
• PC2 menjelaskan 27.22% varians total.
• PC3 menjelaskan 14.39% varians total.
• PC4 menjelaskan 7.07% varians total.
• PC5 menjelaskan sangat sedikit (0.001%) varians.
Dengan kata lain, PC1 dan PC2 bersama-sama menjelaskan 78.53% dari varians total. Ini dapat dilihat pada poporsi kumulatif (Cumulative Proportion) PC2.
Berdasarkan perolehan ini, maka disimpulkan bahwa komponen utama 1 dan 2 secara bersama-sama sudah cukup untuk menjelaskan data secara keseluruhan. Dengan demikian, hanya komponen utama 1 dan 2 yang terpilih untuk menjelaskan data secara keseluruhan.
Di samping itu, berdasarkan output dari algoritma print(loadings), diperoleh bahwa:
• Nilai loadings terbesar (secara absolut) untuk PC1 adalah pada variabel IPM dengan nilai - 0.6023, diikuti oleh RLS dengan -0.5340. Ini berarti bahwa variabel IPM dan RLS
memberikan kontribusi terbesar dalam membentuk PC1. Karena keduanya negatif, ini
mengindikasikan bahwa peningkatan dalam variabel ini berkorelasi negatif dengan arah PC1.
• Nilai loadings terbesar (secara absolut) untuk PC2 adalah pada variabel HLS dengan 0.6204, diikuti oleh AHH dengan 0.5785. Ini berarti bahwa variabel HLS dan AHH memberikan kontribusi terbesar dalam membentuk PC2. Karena nilainya positif, ini menunjukkan bahwa peningkatan dalam variabel ini berkorelasi positif dengan arah PC2.
2. Visualisasi Data
a. Input dan Output
#Pembuatan plot
scores <- pca_result$x[, 1:2] # Skor dari PC1 dan PC2
plot(scores[,1], scores[,2], xlab = "PC1", ylab = "PC2", main = "PCA Plot")
#Pemberian nama pada label
text(scores[, 1], scores[, 2], labels = data$KAB, pos = 4, cex = 0.8)
#Pengelompokan berdasarkan k-means clustering plot(scores[,1], scores[,2],xlab = "PC1", ylab = "PC2", main = "PCA Plot", col = kmeans_result$cluster, pch = 19) text(scores[, 1], scores[, 2], labels = data$KAB, pos = 4, cex = 0.8)
b. Interpretasi Plot
Berdasarkan plot yang menggunakan K-means clustering, diperoleh:
• Mamuju, Polewali Mandar, Mamuju Tengah, dan Mamasa memiliki warna yang sama, yakni merah.
• Majene memiliki warna tersendiri, yakni hijau
• Pasangkayu juga memiliki warna tersendiri, yakni hitam
Ini berarti, algoritma K-means telah mengelompokkan kabupaten-kabupaten tersebut ke dalam tiga cluster berbeda. Dengan kata lain, terdapat tiga kelompok kabupaten yang masing-masing anggotanya memiliki kemiripan pola berdasarkan variabel-variabel sosial ekonomi yang kamu gunakan (AHH, HLS, RLS, PPKR, dan IPM). Akan tetapi, dua kelompok hanya terdiri atas satu anggota.