230112500023 Muh. Afdal Jaenuddin Komputasi Statistika 03 Tugas 3

(1)

Tugas Individu 3

Komputasi Statistika

Dosen Pembimbing:

Muhammad Kasim Aidid, S.Si., M.Si.

Ansari Saleh Ahmar, S.Si., M.Sc., Ph.D.

Agung Tri Utomo, S.Stat., M.Si.

Muh. Afdal Jaenuddin 230112500023

PROGRAM STUDI STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MAKASSAR

2024/2025

03-06

(2)

Pendahuluan

A. Kata Pengantar

Segala puji bagi Allah SWT atas limpahan rahmat-Nya.

Shalawat dan salam semoga senantiasa tercurahkan kepada Nabiullah Muhammad SAW beserta keluarga, para sahabat, dan pengikut sunnahnya.

Terima kasih kepada kedua orang tua saya sendiri.

Terima kasih kepada para dosen pembimbing atas ilmu yang diajarkan.

Terima kasih kepada pihak lain yang tidak disebutkan atas segala dukungannya, baik secara langsung maupun tidak langsung.

Makassar, 17 September 2024

Muh. Afdal Jaenuddin

B. Data

Data yang akan digunakan sebagai bahan analisis adalah data Angka Harapan Hidup, Harapan Lama Sekolah, Rata-rata Lama Sekolah, Pengeluaran Per Kapita Riil, dan Indeks Pembangunan Manusia Tahun 2023 untuk setiap kabupaten yang ada di Provinsi Sulawesi Barat, sebagaimana dalam tabel berikut.

KAB AHH HLS RLS PPKR IPM

Majene 70.06 13.63 9.28 10462 72.44

Polewali Mandar 70.82 13.39 7.71 9096 69.24

Mamasa 72.16 12.53 8.11 8108 68.14

Mamuju 71.79 13.25 8.16 10075 71.07

Pasangkayu 70.09 12.06 8.12 11649 70.42

Mamuju Tengah 69.76 12.65 7.73 8821 67.63

(3)

C. Definisi Variabel

• KAB = Kabupaten

• AHH = Angka Harapan Hidup 2023 (Tahun)

• HLS = Harapan lama sekolah 2023 (Tahun)

• RLS = Rata-rata Lama Sekolah 2023 (Tahun)

• PPKR = Pengeluaran Per Kapita Rill 2023 (Ribu Rupiah)

• IPM = Indeks Pembangunan Manusia 2023

D. Link Sumber Data

Semua data merupakan data sekunder yang bersumber dari laman resmi Badan Pusat Statistika Provinsi Sulawesi Barat.

• AHH: https://sulbar.bps.go.id/id/statistics-table/2/NjQzIzI=/angka-harapan-hidup-- 2023.html

• HLS: https://sulbar.bps.go.id/id/statistics-table/2/MzIjMg==/harapan-lama-sekolah-- 2023.html

• RLS: https://sulbar.bps.go.id/id/statistics-table/2/MzUjMg==/rata-rata-lama-sekolah-- 2023.html

• PPKR: https://sulbar.bps.go.id/id/statistics-table/2/MTIxIzI=/pengeluaran-per-kapita-riil- disesuaikan--2023.html

• IPM: https://sulbar.bps.go.id/id/statistics-table/2/NjQyIzI=/indeks-pembangunan- manusia--2023.html

(4)

Analisis

A. Tujuan Analisis

Analisis ini dilakukan untuk meringkas variabel penelitian dari lima menjadi dua

komponen utama yang diharapkan mampu mewakili sebagian besar informasi dalam data dalam dimensi yang lebih sedikit serta mengetahui seberapa cukup komponen utama terpilih mampu menjelaskan data keseluruhan. Selain itu, analisis juga dilakukan untuk mengetahui

pengelompokan di antara enam kabupaten yang ada di Provinsi Sulawesi Barat .

B. Metode Analisis

Analisis menggunakan metode analisis komponen utama serta penggunaaan scatterplot.

Seluruh rangkaian analisis dilakukan dengan menggunakan software R Studio. Adapun pengelompokan titik-titik pada scatterplot dilakukan berdasarkan K-Means Clustering.

C. Langkah-Langkah Analisis

1. Analisis Komponen Utama

a. Input dan Output

# 0. Penginstalan Paket install.packages("openxlsx")

# 1. Impor dataset library(openxlsx)

data <- read.xlsx("C:/Users/LENOVO/Downloads/komput3.xlsx", sheet = 1)

# 2. Statistik Deskriptif Data summary(data)

(5)

# 3. Melakukan PCA

# 3.1 Simpan variabel KAB secara terpisah kab <- data$KAB

# 3.2 Skalakan data numerik data_scaled <- scale(data[, -1])

# 3.3 PCA

pca_result <- prcomp(data_scaled, center = TRUE, scale. = TRUE)

# 4. Meninjau hasil PCA summary(pca_result)

(6)

# 5. Memeriksa koefesien variabel asli pada PC

loadings <- pca_result$rotation[, 1:2] # Loadings untuk PC1 dan PC2 print(loadings)

b. Interpretasi

Berdasarkan output dari algoritma summary(pca_result), dan dengan memperhatikan proporsi varians (proportion of variace) diperoleh bahwa:

• PC1 menjelaskan 51.32% varians total.

• PC5 menjelaskan sangat sedikit (0.001%) varians.

Dengan kata lain, PC1 dan PC2 bersama-sama menjelaskan 78.53% dari varians total. Ini dapat dilihat pada poporsi kumulatif (Cumulative Proportion) PC2.

Berdasarkan perolehan ini, maka disimpulkan bahwa komponen utama 1 dan 2 secara bersama-sama sudah cukup untuk menjelaskan data secara keseluruhan. Dengan demikian, hanya komponen utama 1 dan 2 yang terpilih untuk menjelaskan data secara keseluruhan.

Di samping itu, berdasarkan output dari algoritma print(loadings), diperoleh bahwa:

(7)

• Nilai loadings terbesar (secara absolut) untuk PC1 adalah pada variabel IPM dengan nilai - 0.6023, diikuti oleh RLS dengan -0.5340. Ini berarti bahwa variabel IPM dan RLS

memberikan kontribusi terbesar dalam membentuk PC1. Karena keduanya negatif, ini

mengindikasikan bahwa peningkatan dalam variabel ini berkorelasi negatif dengan arah PC1.

• Nilai loadings terbesar (secara absolut) untuk PC2 adalah pada variabel HLS dengan 0.6204, diikuti oleh AHH dengan 0.5785. Ini berarti bahwa variabel HLS dan AHH memberikan kontribusi terbesar dalam membentuk PC2. Karena nilainya positif, ini menunjukkan bahwa peningkatan dalam variabel ini berkorelasi positif dengan arah PC2.

2. Visualisasi Data

a. Input dan Output

#Pembuatan plot

scores <- pca_result$x[, 1:2] # Skor dari PC1 dan PC2

plot(scores[,1], scores[,2], xlab = "PC1", ylab = "PC2", main = "PCA Plot")

#Pemberian nama pada label

text(scores[, 1], scores[, 2], labels = data$KAB, pos = 4, cex = 0.8)

(8)

#Pengelompokan berdasarkan k-means clustering plot(scores[,1], scores[,2],xlab = "PC1", ylab = "PC2", main = "PCA Plot", col = kmeans_result$cluster, pch = 19) text(scores[, 1], scores[, 2], labels = data$KAB, pos = 4, cex = 0.8)

b. Interpretasi Plot

Berdasarkan plot yang menggunakan K-means clustering, diperoleh:

• Mamuju, Polewali Mandar, Mamuju Tengah, dan Mamasa memiliki warna yang sama, yakni merah.

• Majene memiliki warna tersendiri, yakni hijau

• Pasangkayu juga memiliki warna tersendiri, yakni hitam

(9)

Ini berarti, algoritma K-means telah mengelompokkan kabupaten-kabupaten tersebut ke dalam tiga cluster berbeda. Dengan kata lain, terdapat tiga kelompok kabupaten yang masing-masing anggotanya memiliki kemiripan pola berdasarkan variabel-variabel sosial ekonomi yang kamu gunakan (AHH, HLS, RLS, PPKR, dan IPM). Akan tetapi, dua kelompok hanya terdiri atas satu anggota.