MAKALAH STATISTIKA
“Ukuran Penyebaran Data”
Disusun Oleh:
R Galih Gumilar WK (202433500156) Fatan Abwabi Fadllika (202433500238)
KElOMPOK: 8
PROGAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS INDRAPRASTA PGRI 2025
I. Ukuran Penyebaran Data
A. Konsep Dasar Ukuran Penyebaran Data
Ukuran penyebaran data merupakan komponen krusial dalam statistika deskriptif yang memberikan informasi mengenai seberapa jauh nilai-nilai data menyebar atau bervariasi dari nilai pusatnya. Pemahaman mengenai penyebaran data melengkapi gambaran yang diberikan oleh ukuran pemusatan data (seperti mean, median, dan modus), sehingga analisis terhadap suatu kumpulan data menjadi lebih komprehensif dan akurat. Tanpa mengetahui sebaran data, interpretasi terhadap nilai pusat saja dapat menyesatkan. Dua kumpulan data bisa saja memiliki rata-rata yang identik, namun menunjukkan pola variabilitas yang sangat berbeda, yang tentunya akan mengarah pada kesimpulan dan pengambilan keputusan yang berbeda pula. Sebagai contoh, dalam dunia investasi, dua portofolio mungkin menawarkan rerata imbal hasil (return) yang sama, tetapi salah satunya bisa jadi memiliki risiko yang jauh lebih tinggi karena variabilitas imbal hasil yang lebih besar. Ukuran penyebaran data, yang juga dikenal dengan istilah ukuran dispersi, variasi, atau penyimpangan, mengkuantifikasi tingkat heterogenitas atau homogenitas data tersebut (Ramadhani, Mauli, Sabadillah, & Salsabila, 2024).
B. Jenis-jenis Ukuran Penyebaran Data Tunggal dan Contoh Soal
Data tunggal adalah data yang belum dikelompokkan ke dalam kelas-kelas interval. Berikut adalah beberapa ukuran penyebaran yang umum digunakan untuk data tunggal:
1. Jangkauan (Range)
Definisi: Jangkauan adalah selisih antara nilai maksimum (data terbesar) dan nilai minimum (data terkecil) dalam suatu kumpulan data. Ini merupakan ukuran penyebaran yang paling sederhana untuk dihitung dan dipahami (Rahayu, n.d).
Rumus: R=Xmaks−Xmin dimana R=¿ Jangkauan, Xmaks=¿ Nilai data terbesar, Xmin=¿
Nilai data terkecil
Kelebihan: Sangat mudah dihitung dan cepat memberikan gambaran kasar tentang sebaran data.
Kekurangan: Jangkauan sangat dipengaruhi oleh nilai-nilai ekstrem (outlier). Jika terdapat satu saja nilai yang sangat tinggi atau sangat rendah dibandingkan nilai lainnya, jangkauan akan menjadi sangat besar dan mungkin tidak mencerminkan variabilitas data secara keseluruhan. Selain itu, jangkauan tidak memberikan informasi mengenai bagaimana data terdistribusi di antara nilai minimum dan maksimum tersebut.
Contoh Soal: Diketahui data nilai ujian statistika dari 10 mahasiswa adalah sebagai berikut:
70, 85, 60, 90, 75, 80, 65, 95, 70, 78. Tentukan jangkauan dari data tersebut!
Pembahasan:
1. Langkah pertama adalah mengurutkan data dari nilai terkecil hingga terbesar: 60, 65, 70, 70, 75, 78, 80, 85, 90, 95.
2. Identifikasi nilai maksimum (Xmaks) dan nilai minimum (Xmin). Dari data yang telah diurutkan, Xmaks=95 dan Xmin=60
3. Hitung jangkauan: R=Xmaks−Xmin ¿95−60=35. Jadi, jangkauan nilai ujian statistika mahasiswa tersebut adalah 35.
Meskipun jangkauan adalah ukuran yang sederhana, ia dapat berfungsi sebagai indikator awal yang cepat terkait potensi masalah kualitas data. Jika nilai jangkauan yang diperoleh sangat lebar dan tidak sesuai dengan ekspektasi atau pengetahuan domain mengenai data tersebut, hal ini dapat menjadi sinyal untuk melakukan pemeriksaan lebih lanjut terhadap kemungkinan adanya kesalahan input data atau keberadaan outlier yang signifikan. Karena jangkauan hanya bergantung pada dua nilai ekstrem (maksimum dan minimum) (Ramadhani, Mauli, Sabadillah, & Salsabila, 2024).
2. Jangkauan Antarkuartil (Interquartile Range - IQR) dan Simpangan Kuartil (Quartile Deviation)
Definisi Kuartil: Kuartil adalah nilai-nilai yang membagi sekumpulan data yang telah diurutkan menjadi empat bagian yang sama besar, dimana setiap bagian memiliki 25%
dari total observasi.
o Kuartil Pertama (Q1): Nilai yang membatasi 25% data terbawah dari keseluruhan data. Artinya, 25% data memiliki nilai lebih kecil atau sama dengan Q1, dan 75%
data memiliki nilai lebih besar atau sama dengan Q1 (Rahayu, n.d).
o Kuartil Kedua (Q2): Nilai ini sama dengan median data, yang membagi data menjadi dua bagian sama besar (50% data di bawah Q2 dan 50% data di atas Q2) (Noviandy, 2024).
o Kuartil Ketiga (Q3): Nilai yang membatasi 75% data terbawah dari keseluruhan data. Artinya, 75% data memiliki nilai lebih kecil atau sama dengan Q3, dan 25%
data memiliki nilai lebih besar atau sama dengan Q3 (Rahayu, n.d).
Definisi Jangkauan Antarkuartil (IQR): IQR adalah selisih antara kuartil ketiga (Q3) dan kuartil pertama (Q1). IQR mengukur penyebaran dari 50% data yang berada di tengah distribusi. Keunggulan utama IQR adalah sifatnya yang lebih robust (tahan) terhadap pengaruh nilai-nilai ekstrem atau outlier dibandingkan dengan jangkauan, karena IQR tidak menggunakan nilai minimum dan maksimum dalam perhitungannya (Ramadhani, Mauli, Sabadillah, & Salsabila, 2024).
Rumus IQR: IQR=Q3−Q1
Definisi Simpangan Kuartil (Quartile Deviation/Semi-Interquartile Range): Simpangan kuartil, sering dilambangkan dengan SK atau Qd, adalah setengah dari jangkauan antarkuartil (Noviandy, 2024). Ini memberikan ukuran rata-rata penyebaran dari median ke kuartil pertama dan dari median ke kuartil ketiga.
Rumus Simpangan Kuartil (SK atau Qd): SK=Q3−Q1
2
Langkah-langkah Menentukan Kuartil untuk Data Tunggal:
1. Urutkan data dari nilai terkecil hingga terbesar.
2. Tentukan posisi Q1:Letak Q1=(n+1) 4
3. Tentukan posisi Q2(Median):Letak Q2=2(n+1)
4 =(n+1) 2
4. Tentukan posisi Q3:Letak Q3=3(n+1)
4 Dimana n adalah jumlah data. Jika posisi kuartil yang diperoleh bukan merupakan bilangan bulat (misalnya, 3.25), maka nilai kuartil tersebut dihitung menggunakan interpolasi linear antara dua nilai data yang mengapit posisi tersebut.
Contoh Soal: Diketahui data nilai yang sudah diurutkan sebagai berikut: 3, 3, 4, 6, 6, 7, 7, 8, 10, 15, 20. Terdapat n=11 data. Tentukan IQR dan Simpangan Kuartilnya!
Pembahasan:
1. Tentukan Q1:Letak Q1=(n+1)
4 =(11+1) 4 =12
4 =3. Nilai data ke-3 adalah 4. Jadi, Q1=4.
2. Tentukan Q3:Letak Q3=3(n+1)
4 =3(11+1)
4 =3×12 4 =36
4 =9 Nilai data ke-9 adalah 10. Jadi, Q3=10.
3. Hitung IQR:IQR=Q3−Q1=10−4=6.
4. Hitung Simpangan Kuartil (SK):SK=Q3−Q1
2 =10−4 2 =6
2=3. Jadi, jangkauan antarkuartil dari data tersebut adalah 6, dan simpangan kuartilnya adalah 3.
Jangkauan Antarkuartil (IQR) memiliki peran penting dalam pembuatan Box Plot (diagram kotak garis). Dalam analisis data eksploratif (EDA), penggunaan IQR seringkali lebih diutamakan daripada jangkauan atau bahkan simpangan baku ketika distribusi data diketahui tidak simetris (miring) atau ketika terdapat dugaan adanya pencilan. Hal ini disebabkan karena IQR fokus pada 50% data yang berada di tengah, sehingga mengabaikan 25% data terendah dan 25% data tertinggi dimana outlier biasanya berada.
Dengan mengabaikan ujung-ujung distribusi ini, IQR mampu memberikan ukuran penyebaran yang tidak terdistorsi oleh nilai-nilai ekstrem tersebut (Ramadhani, Mauli, Sabadillah, & Salsabila, 2024). Dalam Box Plot, Q1 dan Q3 membentuk "kotak", median ( Q2) digambarkan sebagai garis di dalam kotak, dan "kumis" (whiskers) membentang dari kotak hingga batas tertentu (biasanya 1.5× IQR dari Q1 dan Q3). Nilai-nilai data yang berada di luar batas kumis ini kemudian ditandai sebagai outlier potensial. Kombinasi IQR dan Box Plot menjadi perangkat yang sangat berguna untuk menganalisis data yang mungkin "kotor" atau tidak mengikuti distribusi normal.
3. Varians (Variance)
Definisi: Varians adalah ukuran penyebaran yang mengukur rata-rata dari kuadrat selisih (deviasi) antara setiap nilai data dengan rata-rata hitungnya. Secara konseptual, varians menggambarkan seberapa jauh, rata-rata, kuadrat jarak setiap observasi dari pusat data (mean) (Ramadhani, Mauli, Sabadillah, & Salsabila, 2024).
Rumus Varians: Terdapat dua rumus varians tergantung apakah data yang dimiliki merupakan data populasi atau data sampel.
o Varians Populasi (σ2): Digunakan ketika data yang dianalisis mencakup seluruh anggota populasi. σ2=
∑ (
xi−μ)
2N Dimana: σ2=¿ Varians populasi, xi=¿ Nilai data ke-I, μ=¿ Rata-rata populasi, N = Jumlah total data dalam populasi (Rahayu, n.d)
o Varians Sampel (s2): Digunakan ketika data yang dianalisis merupakan sampel yang diambil dari suatu populasi, dan bertujuan untuk mengestimasi varians
populasi. s2=
∑ (
xi−x)
2n−1 Dimana: s2=¿ Varians sampel xi=¿Nilai data ke-i x=¿
Rata-rata sampel n = Jumlah total data dalam sampel (Noviandy, 2024)
o Dalam konteks tugas akademik mahasiswa, data yang diberikan umumnya dianggap sebagai sampel kecuali jika secara eksplisit dinyatakan sebagai populasi.
Oleh karena itu, penggunaan rumus varians sampel dengan pembagi (n−1) lebih sering diterapkan. Pembagi (n−1) ini disebut sebagai derajat kebebasan (degrees of freedom) dan digunakan untuk menghasilkan estimasi varians populasi yang tidak bias.
Kekurangan: Salah satu keterbatasan varians adalah satuannya merupakan kuadrat dari satuan data asli (misalnya, jika data dalam cm, varians dalam cm2. Hal ini membuat interpretasi langsung nilai varians menjadi kurang intuitif dalam konteks praktis (Rahayu, n.d).
Contoh Soal: Diketahui data nilai sebagai berikut: 4, 6, 8, 5, 7. Terdapat n=5 data.
Hitunglah varians sampel dari data tersebut!
Pembahasan:
1. Hitung rata-rata sampel (x):x=4+6+8+5+7
5 =30
5 =6.
2. Hitung kuadrat selisih setiap nilai data dari rata-rata sampel (
(
xi−x)
2): (4−6)2=(−2)2=4
(6−6)2=(0)2=0
(8−6)2=(2)2=4
(5−6)2=(−1)2=1
(7−6)2=(1)2=1
3. Jumlahkan semua kuadrat selisih: ∑
(
xi−x)
2=4+0+4+1+1=10.4. Hitung varians sampel
(
s2)
:s2=∑ (
xi−x)
2n−1 = 10 5−1=10
4 =2.5 Jadi, varians sampel dari data tersebut adalah 2.5.
Penggunaan pembagi (n−1) untuk varians sampel, yang dikenal sebagai "derajat kebebasan", merupakan konsep fundamental dalam statistika inferensial. Alasan penggunaan (n−1) adalah untuk mengoreksi bias yang timbul ketika varians populasi
diestimasi dari data sampel. Jika kita menggunakan sampel untuk mengestimasi parameter populasi, selalu ada unsur ketidakpastian. Rata-rata sampel (x) dihitung dari data sampel itu sendiri. Sifat matematis menunjukkan bahwa jumlah deviasi dari rata-rata sampel, yaitu
∑ (
xi−x)
2, selalu sama dengan nol. Ini berarti bahwa jika (n−1) deviasi diketahui, maka deviasi yang terakhir (ke−n) sudah dapat ditentukan (tidak bebas bervariasi). Dengan kata lain, hanya ada (n−1) buah deviasi yang "bebas" untuk bervariasi. Jika kita menggunakan n sebagai pembagi dalam rumus varians sampel, hasilnya akan cenderung meremehkan (underestimate) nilai varians populasi yang sebenarnya. Penggunaan (n−1) sebagai pembagi mengkompensasi hal ini, sehingga menghasilkan estimasi varians populasi yang tidak bias. Artinya, jika kita mengambil banyak sampel dari populasi yang sama dan menghitung varians sampel untuk masing- masing sampel tersebut, rata-rata dari varians-varians sampel tersebut akan mendekati nilai varians populasi yang sebenarnya.4. Simpangan Baku (Standard Deviation)
Definisi: Simpangan baku adalah akar kuadrat positif dari varians. Ini merupakan ukuran penyebaran yang paling umum digunakan dalam analisis statistik. Simpangan baku memberikan ukuran mengenai seberapa jauh, rata-rata, nilai-nilai data cenderung menyimpang atau tersebar dari nilai rata-ratanya. Keunggulan utama simpangan baku dibandingkan varians adalah satuannya sama dengan satuan data asli, sehingga lebih mudah untuk diinterpretasikan secara langsung (Ramadhani, Mauli, Sabadillah, &
Salsabila, 2024).
Rumus Simpangan Baku:
o Simpangan Baku Populasi (σ):σ=
√ ∑ (
xNi−μ)
2o Simpangan Baku Sampel (s):s=
√ ∑
n(
x−i−1x)
2 Semakin besar nilai simpangan baku, semakin besar pula variasi atau penyebaran data dari rata-ratanya. Sebaliknya, semakin kecil nilai simpangan baku, data cenderung lebih homogen dan mengelompok di sekitar rata-ratanya (Ramadhani, Mauli, Sabadillah, &
Salsabila, 2024).
Contoh Soal: Menggunakan data dan hasil perhitungan varians sampel dari contoh sebelumnya, dimana s2=2.5. Hitunglah simpangan baku sampelnya!
Pembahasan:
1. Simpangan baku sampel (s) adalah akar kuadrat dari varians sampel
(
s2)
. s=√
s2=√
25≈1.581.Jadi, simpangan baku sampel dari data tersebut adalah sekitar 1.581.Simpangan baku memiliki peran yang sangat penting, tidak hanya sebagai ukuran penyebaran, tetapi juga dalam konteks teori probabilitas dan distribusi data. Salah satu aplikasinya adalah melalui Teorema Chebyshev, yang berlaku untuk semua jenis distribusi data, dan Aturan Empiris (Empirical Rule), yang berlaku spesifik untuk data yang berdistribusi normal (berbentuk lonceng). Teorema Chebyshev menyatakan bahwa untuk setiap kumpulan data, proporsi nilai yang terletak dalam k simpangan baku dari rata-rata adalah setidaknya 1−1
k2, untuk k>1. Sebagai contoh, setidaknya 1−1 22=3
4 atau 75% data akan berada dalam rentang ±2 simpangan baku dari rata-rata. Untuk data yang berdistribusi normal, Aturan Empiris memberikan estimasi yang lebih spesifik: sekitar 68%
data berada dalam rentang ±1 simpangan baku dari rata-rata, sekitar 95% data berada dalam rentang ±2 simpangan baku, dan sekitar 99.7% data berada dalam rentang ±3 simpangan baku dari rata-rata (SPADA UNS, n.d.). Hal ini menunjukkan bahwa simpangan baku bukan hanya sekadar angka yang mengukur penyebaran, tetapi juga menjadi kunci untuk memahami struktur probabilistik dari data, terutama jika bentuk distribusinya diketahui atau dapat diasumsikan.
Tabel 1: Ringkasan Rumus Ukuran Penyebaran Data Tunggal
Tabel berikut menyajikan ringkasan rumus-rumus kunci untuk ukuran penyebaran data tunggal, yang dapat berfungsi sebagai referensi cepat.
Ukuran Penyebaran Simbol (Sampel) Rumus
Jangkauan R Xmaks−Xmin
Jangkauan Antarkuartil IQR Q3−Q1
Simpangan Kuartil SK(Qd) Q3−Q1
2
Varians Sampel s2
∑ (
xi−x)
2n−1
Simpangan Baku Sampel s
√ ∑
n−1(
xi−x)
2Varians Populasi σ2
∑ (
xi−μ)
2N
Simpangan Baku Populasi σ
√ ∑ (
xNi−μ)
2C. Jenis-jenis Ukuran Penyebaran Data Kelompok dan Contoh Soal 1. Jangkauan (Range)
Untuk data kelompok, jangkauan dapat dihitung dengan beberapa cara. Dua cara yang umum adalah:
1. Selisih antara titik tengah kelas tertinggi dan titik tengah kelas terendah.
2. Selisih antara tepi atas kelas interval tertinggi dan tepi bawah kelas interval terendah.
Cara kedua ini lebih sering digunakan karena mencakup keseluruhan rentang nilai yang mungkin dalam data kelompok (Nurhaswinda, Muharroma, & Febriani, 2025).
Rumus (menggunakan tepi kelas):
R=Tepi Atas Kelas Tertinggi−Tepi Bawah Kelas Terendah
Contoh Soal: Untuk mengilustrasikan perhitungan ukuran penyebaran data kelompok, akan digunakan contoh tabel distribusi frekuensi hipotetis berikut:
Tabel Distribusi Frekuensi Nilai Ujian Statistika Nilai
Ujian Frekuensi (fi) Titik Tengah (xi)
50-59 5 54.5
60-69 10 64.5
70-79 15 74.5
80-89 8 84.5
90-99 2 94.5
Total n=40
Panjang kelas interval (c) untuk tabel di atas adalah 10 (misalnya,59.5−49.5=10 atau 60−50+1=10 jika menggunakan batas kelas, namun lebih konsisten menggunakan selisih tepi kelas atau titik tengah kelas berurutan).
Pembahasan:
1. Identifikasi kelas terendah: 50-59. Tepi bawah kelas terendah = 50−0.5=49.5 2. Identifikasi kelas tertinggi: 90-99. Tepi atas kelas tertinggi = 99+0.5=99.5
3. Hitung jangkauan: R=99.5−49.5=50. Jadi, jangkauan nilai ujian statistika tersebut adalah 50.
2. Jangkauan Antarkuartil (IQR) dan Simpangan Kuartil (Quartile Deviation)
Definisi: Konsep IQR dan simpangan kuartil untuk data kelompok sama dengan data tunggal. Namun, karena nilai individu tidak diketahui, perhitungan Q1 dan Q3 memerlukan rumus interpolasi yang melibatkan frekuensi kelas dan frekuensi kumulatif.
Rumus Kuartil untuk Data Kelompok (misalnya Q1): Qk=Lk+
(
k × n4 −fkFkkum)
× c Dimana:Qk = Kuartil ke-k (k=1 untuk Q1, k=3 untuk Q3), Lk = Tepi bawah kelas interval dimana Qk be rada n = Jumlah total frekuensi (total observasi), Fkkum = Frekuensi kumulatif dari semua kelas sebelum kelas interval yang mengandung Qk, fk = Frekuensi kelas interval yang mengandung Qk, c = Panjang kelas interval.
Rumus IQR: IQR=Q3−Q1
Rumus Simpangan Kuartil: SK=Q3−Q1 2
Contoh Soal: Menggunakan tabel distribusi frekuensi nilai ujian di atas (n=40, c=10).
Pembahasan: Langkah pertama adalah membuat kolom frekuensi kumulatif (kurang dari):
Nilai Ujian Frekuensi (fi) Titik Tengah (xi) Frekuensi Kumulatif (<)
50-59 5 54.5 5
60-69 10 64.5 15 (5+10)
70-79 15 74.5 30 (15+15)
80-89 8 84.5 38 (30+8)
90-99 2 94.5 40 (38+2)
Total n=40
1. Hitung Q1:
o Posisi Q1=(1× n)
4 =(1×40)
4 =10. Ini berarti Q₁ adalah data ke-10.
o Dari tabel frekuensi kumulatif, data ke-10 jatuh pada kelas interval 60-69.
o L₁=60−0.5=59.5 (tepi bawah kelas Q₁)
o F1kum=5 (frekuensi kumulatif sebelum kelas Q₁)
o f₁=10 (frekuensi kelas Q₁)
o c=10 (panjang kelas interval)
o Rumus Untuk: Q1=L1+
(
1× n4 −f1F1kum)
× co PerhitunganQ1=59.5+
(
10−510)
×10¿59.5+(
105)
×10¿59.5+0.5×10¿59.5+5=64.5 2. Hitung Kuartil Ketiga (Q3):
o Posisi Q3=3× n
4 =3×40
4 =30. Ini berarti Q3 adalah data ke-30.
o Dari tabel frekuensi kumulatif, data ke-30 jatuh pada kelas interval 70-79.
(Frekuensi kumulatif sebelum kelas 70-79 adalah 15, dan frekuensi kelas 70-79 adalah 15. Karena posisi Q3 (yaitu 30) sama dengan total frekuensi kumulatif hingga akhir kelas 70-79 (15+15=30), maka Q3 akan menjadi tepi atas kelas tersebut).
o Maka, parameter yang digunakan adalah:
1. L3=70−0.5=69.5 (tepi bawah kelas Q3)
2. F3kum=15 (frekuensi kumulatif sebelum kelas Q3) 3. f3=15 (frekuensi kelas Q3)
4. c=10 (panjang kelas interval)
o Rumus Untuk: Q3=L3+
(
3× n4 −f3F3kum)
× co PerhitunganQ3=69.5+
(
30−1515)
×10¿69.5+(
1515)
×10¿6 9.5+1×10¿69.5+10=79.5
3. Hitung Jangkauan Antarkuartil (IQR):
Jangkauan Antarkuartil dihitung dengan mengurangkan kuartil pertama dari kuartil ketiga.
IQR=Q3−Q1
¿79.5−64.5=15 4. Hitung Simpangan Kuartil (SK):
Simpangan Kuartil adalah setengah dari Jangkauan Antarkuartil.
SK=IQR 2 =15
2 =7.5
Jadi, berdasarkan perhitungan di atas:
Jangkauan Antarkuartilnya (IQR)adalah 15.
Simpangan Kuartilnya (SK) adalah 7.5.
3. Varians (Variance)
Definisi: Untuk data kelompok, varians dihitung sebagai rata-rata dari kuadrat deviasi titik tengah setiap kelas dari rata-rata hitung data kelompok, dengan mempertimbangkan frekuensi masing-masing kelas.
Rumus Varians Sampel (s2):s2=
∑
fi(
xi−x)
2n−1 Dimana: fi = Frekuensi kelas ke-i, xi = Titik tengah kelas ke-i, x = Rata-rata hitung data kelompok (x=
∑
fixin ), n = Jumlah total frekuensi (total observasi), k = Banyaknya kelas interval. Beberapa sumber mungkin menggunakan n sebagai pembagi untuk sampel besar (Nurhaswinda, Muharroma, &
Febriani, 2025). Namun, untuk konsistensi estimasi, (n−1) lebih umum untuk sampel.
Contoh Soal: Menggunakan tabel distribusi frekuensi nilai ujian di atas.
Pembahasan:
1. Hitung rata-rata hitung data kelompok (xi): Buat kolom fixi: Nilai Ujian fi xi fixi
50-59 5 54.5 272.5
60-69 1
0 64.5 645.0
70-79 1
5 74.5 1117.5
80-89 8 84.5 676.0
90-99 2 94.5 189.0
Total 4
0 2900.0
Selanjutnya hitung x: x=
∑
fixin =2900.0
40 =¿ 72.5
2. Buat kolom tambahan untuk menghitung
(
xi−x)
,(
xi−x)
2, dan fi(
xi−x)
2: Menggunakan x=72.5xi fi (xi−x)
(
xi−x)
2 fi(
xi−x)
254.5 5 54.5−72.5=−18 (−18)2=324 5×324=1620
64.5 10 64.5−72.5=−8 (−8)2=64 10×64=640
74.5 15 74.5−72.5=2 (2)2=4 15×4=60
84.5 8 84.5−72.5=12 (12)2=144 8×144=1152
94.5 2 94.5−72.5=22 (22)2=484 2×484=968
Total ∑ fi
(
xi−x)
2 44403. Jumlahkan fi
(
xi−x)
2:Dari tabel diatas ∑ fi
(
xi−x)
2=44404. Hitung varians sampel (s2):
Menggunakan rumus varians sampel: s2=
∑
fi(
xi−x)
2n−1 = 4400
40−1=4440
39 ≈113.85 Jadi, varians sampel nilai ujian tersebut adalah sekitar 113.85
4. Simpangan Baku (Standard Deviation)
Definisi: Untuk data kelompok, simpangan baku adalah akar kuadrat positif dari varians data kelompok. Ini mengukur rata-rata penyimpangan titik tengah kelas dari rata-rata hitung, dengan mempertimbangkan frekuensi.
Rumus Simpangan Baku Sampel (s):s=
√ ∑
fni(
−xi1−x)
2 Contoh Soal: Menggunakan hasil perhitungan varians sampel dari contoh sebelumnya, dimana s2≈113.85
Pembahasan:
1. Simpangan baku sampel (s) adalah akar kuadrat dari varians sampel (s2). s=
√
113.85≈10.67. Jadi, simpangan baku sampel nilai ujian tersebut adalah sekitar 10.67.Tabel 2: Ringkasan Rumus Ukuran Penyebaran Data Kelompok
Tabel berikut merangkum rumus-rumus penting untuk ukuran penyebaran data kelompok.
Ukuran Penyebaran Simbol (Sampel) Rumus
Jangkauan R Tepi atas kelas tertinggi−Tepi bawah kelas terendah
Kuartil (Misal Q1) Q1 L1+
(
1× n4 −f1F1kum)
× cJangkauan Antarkuartil IQR Q3−Q1
Simpangan Kuartil SK(Qd) Q3−Q1 2
Varians Sampel s2
∑
fi(
xi−x)
2n−1
Simpangan Baku Sampel s
√ ∑
fn−1i(
xi−x)
2II. Aplikasi Komputasi untuk Menghitung Ukuran Penyebaran Data (Minimal 100 Data) A. Pengantar Penggunaan Perangkat Lunak Statistik
Perhitungan manual ukuran penyebaran data, meskipun penting untuk pemahaman konseptual, dapat menjadi sangat melelahkan, memakan waktu, dan rentan terhadap kesalahan, terutama ketika berhadapan dengan dataset yang besar (misalnya, lebih dari 100 data). Untuk mengatasi tantangan ini, berbagai perangkat lunak statistik telah dikembangkan. Microsoft Excel dan SPSS (Statistical Package for the Social Sciences) adalah dua contoh perangkat lunak yang populer dan menyediakan alat yang efisien serta akurat untuk melakukan analisis statistik deskriptif, termasuk perhitungan berbagai ukuran penyebaran data. Penggunaan perangkat lunak ini tidak hanya mempercepat proses analisis tetapi juga mengurangi potensi human error.
B. Studi Kasus: Analisis Penyebaran Data Nilai Ujian Statistika Mahasiswa (N=120)
Deskripsi Dataset: Untuk mendemonstrasikan penggunaan perangkat lunak komputasi, akan digunakan sebuah dataset hipotetis yang berisi nilai ujian akhir mata kuliah Statistika dari 120 mahasiswa Program Studi Sistem Informasi. Nilai ujian ini berkisar antara 0 hingga 100. Dataset ini akan digunakan untuk menghitung ukuran penyebaran seperti Jangkauan, Jangkauan Antarkuartil (IQR), Varians, dan Simpangan Baku menggunakan Microsoft Excel dan SPSS.
Tujuan: Tujuan dari studi kasus ini adalah untuk mendemonstrasikan langkah-langkah praktis dalam menghitung Jangkauan, IQR, Varians, dan Simpangan Baku untuk data nilai ujian mahasiswa (N=120) menggunakan fungsionalitas yang tersedia di Microsoft Excel dan SPSS, serta menginterpretasikan output yang dihasilkan oleh kedua perangkat lunak tersebut.
C. Perhitungan Menggunakan Microsoft Excel
Excel memiliki berbagai fungsi statistik yang dapat langsung diketikkan ke dalam sel untuk melakukan perhitungan.
Langkah-langkah:
1. Input Data: Masukkan 120 data nilai ujian mahasiswa ke dalam satu kolom di lembar kerja Excel. Sebagai contoh, data dimasukkan pada Kolom A, mulai dari sel A1 hingga A120.
2. Penggunaan Fungsi: Di sel kosong mana pun pada lembar kerja, ketikkan fungsi-fungsi berikut untuk menghitung ukuran penyebaran yang diinginkan (gantilah A1:A120 dengan rentang sel aktual jika berbeda):
Jangkauan (Range): =MAX(A1:A120) - MIN(A1:A120)
Kuartil 1 (Q1): =QUARTILE.INC(A1:A120, 1)
Kuartil 3 (Q3): =QUARTILE.INC(A1:A120, 3)
Jangkauan Antarkuartil (IQR): Setelah mendapatkan nilai Q1 dan Q3 di sel terpisah (misalnya, Q1 di B1 dan Q3 di B2), IQR dapat dihitung dengan formula
=B2-B1.
Varians Sampel (s2): =VAR.S(A1:A120). Untuk versi Excel yang lebih lama, fungsi yang digunakan adalah =VAR(A1:A120).
Simpangan Baku Sampel (s): =STDEV.S(A1:A120). Untuk versi Excel yang lebih lama, fungsi yang digunakan adalah =STDEV(A1:A120).
Penyajian dan Interpretasi Output: Hasil dari setiap fungsi akan langsung ditampilkan di sel tempat formula tersebut diketik. Misalnya, jika data nilai ujian memiliki nilai minimum 40 dan maksimum 98, maka fungsi jangkauan akan menghasilkan nilai 59. Jika varians sampel yang dihitung adalah 317.025, maka simpangan baku sampelnya adalah
√
317.025≈17.805. Interpretasi dilakukan berdasarkan nilai numerik yang diperoleh, misalnya, simpangan baku sebesar 17.805 menunjukkan rata-rata penyimpangan nilai ujian dari rata-rata keseluruhan nilai ujian adalah sekitar 17.805 poin.Gambar 1. Hasil Akhir
D. Perhitungan Menggunakan SPSS
SPSS adalah perangkat lunak yang dirancang khusus untuk analisis statistik dan banyak digunakan dalam penelitian akademis dan profesional.
1. Input Data dan Definisi Variabel:
Langkah-langkah:
1. Buka program SPSS.
2. Klik pada tab Variable View di bagian kiri bawah jendela SPSS. Di sini, definisikan variabel yang akan digunakan. Misalnya:
Pada kolom Name, ketik nama variabel (misalnya, NilaiUjian). Nama variabel di SPSS tidak boleh mengandung spasi atau karakter khusus tertentu.
Pada kolom Type, pilih Numeric karena data nilai ujian berupa angka.
Pada kolom Width dan Decimals, dapat disesuaikan (misalnya, Width 8, Decimals 0 jika nilai ujian adalah bilangan bulat).
Pada kolom Label, dapat diberikan deskripsi yang lebih panjang untuk variabel (misalnya, Nilai Ujian Akhir Statistika).
Pada kolom Measure, pilih Scale karena nilai ujian merupakan data skala (interval atau rasio).
3. Setelah variabel didefinisikan, klik pada tab Data View di bagian kiri bawah.
4. Masukkan 120 data nilai ujian ke dalam kolom yang telah diberi nama NilaiUjian. Setiap baris mewakili satu mahasiswa.
2. Menggunakan Menu Frequencies:
Menu Frequencies di SPSS sangat berguna untuk mendapatkan statistik deskriptif, termasuk berbagai ukuran penyebaran dan ukuran letak seperti kuartil.
Langkah-langkah:
1. Setelah data dimasukkan dan variabel didefinisikan, klik menu Analyze di bagian atas jendela SPSS.
2. Pilih Descriptive Statistics, kemudian klik Frequencies....
3. Akan muncul kotak dialog Frequencies. Di panel kiri, akan terlihat daftar variabel yang telah didefinisikan (dalam kasus ini, NilaiUjian). Pilih variabel NilaiUjian dan klik tombol panah (►) untuk memindahkannya ke kotak Variable(s) di sebelah kanan.
4. Klik tombol Statistics... yang ada di sebelah kanan kotak dialog Frequencies.
5. Akan muncul kotak dialog Frequencies: Statistics. Di sini, pilih ukuran statistik yang diinginkan:
Pada bagian Dispersion, centang kotak untuk Std. deviation (Simpangan Baku), Variance (Varians), dan Range (Jangkauan).
Dapat juga mencentang Minimum dan Maximum untuk melengkapi informasi jangkauan.
Pada bagian Percentile Values, centang kotak Quartiles. Opsi ini akan secara otomatis menghitung Kuartil Pertama (persentil ke-25), Kuartil Kedua (persentil ke-50 atau Median), dan Kuartil Ketiga (persentil ke-75).22
(Opsional) Untuk mendapatkan gambaran yang lebih lengkap, pada bagian Central Tendency, dapat juga dicentang Mean (Rata-rata) dan Median.
6. Setelah memilih semua statistik yang diinginkan, klik Continue.
7. Kembali ke kotak dialog Frequencies utama. Secara default, opsi Display frequency tables akan tercentang. Karena kita berhadapan dengan 120 data individual dan tujuan utama adalah mendapatkan statistik ringkasan (bukan tabel frekuensi untuk setiap nilai unik), hilangkan centang pada kotak Display frequency tables untuk output yang lebih ringkas.
8. Klik OK untuk menjalankan analisis.
III. Kumpulan Contoh Soal Kontekstual
1. Analisis Sebaran Jumlah Penduduk antar Provinsi di Indonesia Tahun 2023
Data jumlah penduduk per provinsi di Indonesia pada Desember 2023 digunakan untuk menganalisis seberapa merata atau beragam jumlah penduduk di berbagai provinsi. Data ini bersumber dari Direktorat Jenderal Kependudukan dan Pencatatan Sipil (Dukcapil) Kementerian Dalam Negeri, sebagaimana dilaporkan oleh Databoks Katadata. Analisis sebaran penduduk penting untuk perencanaan pembangunan nasional, alokasi sumber daya yang adil, serta perumusan kebijakan terkait infrastruktur dan layanan publik.
Berikut adalah data jumlah penduduk untuk sampel 10 provinsi di Indonesia pada Desember 2023 (dalam juta jiwa).
Tabel 1: Data Jumlah Penduduk 10 Provinsi di Indonesia (Desember 2023)
No. Nama Provinsi Jumlah Penduduk (juta jiwa)
1 Jawa Barat 49.90
2 Jawa Timur 41.64
3 Jawa Tengah 38.13
4 Sumatera Utara 15.47
5 Banten 12.47
6 DKI Jakarta 11.34
7 Sulawesi Selatan 9.40
8 Lampung 9.05
9 Papua Selatan 0.53
10 Kalimantan Utara 0.75
*Sumber: Diolah dari Databoks Katadata (Dukcapil Kemendagri)
Pertanyaan:
Berdasarkan data sampel jumlah penduduk 10 provinsi di atas. hitunglah:
a. Jangkauan (R)
b. Kuartil Pertama
(
Q1)
dan Kuartil Ketiga (Q3) c. Jangkauan Antarkuartil (IQR)d. Varians Sampel (s2)
e. Simpangan Baku Sampel (s)
Interpretasikan setiap hasil perhitungan dalam konteks sebaran penduduk antar provinsi tersebut.
Solusi Lengkap:
Langkah pertama adalah mengurutkan data dari yang terkecil hingga terbesar:
0.53; 0.75; 9.05; 9.40; 11.34; 12.47; 15.47; 38.13; 41.64; 49.90.
Jumlah data (n)=10.
a. Jangkauan (Range. R)
Rumus: R=Xmaks−Xmin Xmaks=49.90 juta jiwa (Jawa Barat) Xmin=0.53 Juta jwa (Papua Selatan R=49.90−0.53=49.37 juta jiwa
Interpretasi: Jangkauan sebesar 49.37 juta jiwa menunjukkan adanya perbedaan yang sangat besar antara provinsi dengan jumlah penduduk terbanyak (Jawa Barat) dan provinsi dengan jumlah penduduk paling sedikit (Papua Selatan) dalam sampel ini. Hal ini mengindikasikan variasi yang ekstrem dalam skala populasi antar provinsi.
b. Kuartil Pertama
(
Q1)
dan Kuartil Ketiga(
Q3)
Metode yang digunakan adalah metode interpolasi linear berdasarkan posisi k(n+1)
4 .
Data terurut: x1=0.53. x2=0.75. x3=9.05. x4=9.40. x5=11.34. x6=12.47. x7=15.47. x8=38.13. x9=41.64. x10=49.90.
Posisi Q1=1
4(n+1)=1
4(10+1)=11 4 =2.75
Q1 adalah nilai data ke-2 ditambah 0.75 dari selisih antara data ke-3 dan data ke-2.
Q1=x2+0.75×
(
x3−x2)
¿0.75+0.75×(9.05−0.75)
¿0.75+0.75×8.30
¿0.75+6.225=6.975 juta jiwa Posisi Q3=3
4(n+1)=3
4(10+1)=33 4 =8.25
Q3 adalah nilai data ke-8 ditambah 0.25 dari selisih antara data ke-9 dan data ke-8.
Q3=x8+0.25×
(
x9−x8)
¿38.13+0.25×(41.64−38.13)
¿38.13+0.25×3.51
¿38.13+0.8775=39.0075 juta jiwa
Interpretasi: Q1=6.975 juta jiwa berarti 25% provinsi dalam sampel memiliki jumlah penduduk kurang dari atau sama dengan 6.975 juta jiwa. Q3=39.0075 juta jiwa berarti 75% provinsi dalam sampel memiliki jumlah penduduk kurang dari atau sama dengan 39.0075 juta jiwa. atau 25% provinsi memiliki jumlah penduduk lebih dari nilai tersebut.
c. Jangkauan Antarkuartil (IQR) Rumus: IQR=Q3−Q1
IQR=39.0075−6.975=32.0325 juta jiwa.
Interpretasi: IQR sebesar 32.0325 juta jiwa menunjukkan bahwa rentang sebaran untuk 50% provinsi yang berada di tengah (setelah mengabaikan 25% provinsi dengan penduduk paling sedikit dan 25% provinsi dengan penduduk terbanyak) adalah 32.0325 juta jiwa.
IQR memberikan gambaran variasi penduduk yang tidak terlalu dipengaruhi oleh nilai- nilai ekstrem di kedua ujung distribusi.
d. Varians Sampel (s2) Rumus: s2=
∑ (
xi−x)
2n−1
Pertama. hitung rata-rata (x):
x=0.53+0.75+9.05+9.40+11.34+12.47+15.47+38.13+41.64+49.90
10 =188.68
10 =18.868 juta jiwa
Selanjutnya. hitung ∑
(
xi−x)
2:(0.53−18.868)2=(−18.338)2=336.294224 (0.75−18.868)2=(−18.118)2=328.261924 (9.05−18.868)2=(−9.818)2=96.393124 (9.40−18.868)2=(−9.468)2=89.643024 (11.34−18.868)2=(−7.528)2=56.670784 (12.47−18.868)2=(−6.398)2=40.934404 (15.47−18.868)2=(−3.398)2=11.546404 (38.13−18.868)2=(19.262)2=371.024644
(41.64−18.868)2=(22.772)2=518.563984 (49.90−18.868)2=(31.032)2=962.985024
∑
(
xi−x)
2=336.294224+328.261924+96.393124+89.643024+56.670784+40.934404+11.546404+371.024644+518.563984+962.985024=2812.317544s2=∑
(
xi−x)
2n=1 =2812.317544
10−1 =2812.317544
9 ≈312.480(juta jiwa)2.
Interpretasi: Varians sampel sebesar 312.480 (juta jiwa)2 mengukur rata-rata kuadrat deviasi jumlah penduduk setiap provinsi dari rata-rata sampel. Nilai ini sulit diinterpretasikan secara langsung karena satuannya adalah kuadrat dari unit asli (juta jiwa kuadrat). Simpangan baku akan lebih mudah diinterpretasikan.
e. Simpangan Baku Sampel (s) Rumus: s=
√
s2s=
√
312.47972711..≈17.677 juta jiwa.Interpretasi: Simpangan baku sampel sebesar 17.677 juta jiwa menunjukkan bahwa rata-rata.
jumlah penduduk provinsi dalam sampel ini menyimpang sekitar 17.677 juta jiwa dari rata- rata jumlah penduduk sampel (x=18.868 juta jiwa). Nilai simpangan baku yang relatif besar terhadap rata-rata. ditambah dengan jangkauan yang lebar (49.37 juta jiwa). secara kuantitatif menegaskan adanya tingkat ketimpangan distribusi penduduk yang signifikan di Indonesia.
setidaknya berdasarkan sampel ini. Hal ini mencerminkan konsentrasi penduduk yang tinggi di beberapa provinsi (khususnya di Pulau Jawa) dibandingkan dengan wilayah lain. Penggunaan IQR (32.0325 juta jiwa) juga membantu mengidentifikasi bahwa bahkan di luar nilai ekstrem.
masih terdapat variasi yang cukup besar. meskipun IQR lebih kecil dari jangkauan. yang mengindikasikan pengaruh kuat dari nilai ekstrem (Papua Selatan dan Jawa Barat) pada jangkauan keseluruhan.
2. Analisis Ukuran Penyebaran Data Kelompok – Data Kependudukan Berdasarkan Kelompok Usia
Sebuah data kependudukan Indonesia tahun 2022 berdasarkan kelompok usia yang bersumber dari Badan Pusat Statistik (BPS). Data ini sudah disajikan dalam bentuk kelompok usia.
Tabel 2: Distribusi Frekuensi Jumlah Penduduk Indonesia Tahun 2022 berdasarkan Kelompok Usia
Kelompok Usia
Titik Tengah
(Xi)
Frekuensi (fi - Ribu
Jiwa)
fiXi
Frekuensi Kumulatif Kurang Dari (<
Fk)
(Xi−X)
(
Xi−X)
2 fi(
Xi−X)
20-4 2 22,094.40 44,188.80 22,094.40 -30.07 904.20 19,977,864.74 5-9 7 22,013.80 154,096.60 44,108.20 -25.07 628.50 13,835,781.17 10-14 12 22,088.70 265,064.40 66,196.90 -20.07 402.80 8,897,436.59 15-19 17 22,163.50 376,779.50 88,360.40 -15.07 227.10 5,033,439.45 20-24 22 22,490.40 494,788.80 110,850.80 -10.07 101.40 2,280,636.76 25-29 27 22,463.70 606,519.90 133,314.50 -5.07 25.70 577,427.16 30-34 32 22,066.80 706,137.60 155,381.30 -0.07 0.005 108.13 35-39 37 21,248.00 786,176.00 176,629.30 4.93 24.30 516,430.52 40-44 42 20,295.20 852,398.40 196,924.50 9.93 98.60 2,001,206.17 45-49 47 18,727.20 880,178.40 215,651.70 14.93 222.90 4,174,384.64 50-54 52 16,500.30 858,015.60 232,152.00 19.93 397.20 6,554,000.01 55-59 57 13,961.20 795,788.40 246,113.20 24.93 621.50 8,676,954.21 60-64 62 11,061.50 685,813.00 257,174.70 29.93 895.80 9,908,945.90 65-69 67 8,199.00 549,333.00 265,373.70 34.93 1,220.10 10,003,640.08 70-74 72 5,269.40 379,396.80 270,643.10 39.93 1,594.40 8,401,557.18 75-79
(asumsi) 77 5,130.60 395,056.20 275,773.70 44.93 2,018.70 10,357,167.36
Total 275,773.70 8,829,731.40 111,196,980.07
Catatan: Untuk kelas terbuka 75+ diasumsikan intervalnya 75-79 dengan titik tengah 77. Panjang kelas sebelumnya (70-74) adalah 5 tahun.
Rata-rata Usia (X)=Σ
(
fiXi)
n =8,829,731,40
275,773.7 =32.02 tahun.
Perhitungan dan Interpretasi Ukuran Penyebaran Data Kependudukan
Kelas interval terbuka seperti "75+" memerlukan asumsi untuk menentukan titik tengahnya, yang penting untuk perhitungan mean, varians dan simpangan baku. Metode yang umum adalah menganggap panjang kelas terbuka sama dengan panjang kelas interval tertutup sebelumnya. Dalam kasus ini, kelas sebelumnya (70-74) memiliki panjang 5 tahun. Maka. kelas 75+ diasumsikan sebagai 75-79. dengan titik tengah 75+79
2 =77 tahun. Pilihan metode ini dapat memengaruhi hasil akhir. dan ini merupakan salah satu keterbatasan dalam analisis data kelompok dengan kelas terbuka.
Jangkauan (Range):
Menggunakan titik tengah:
R=Titik Tengah Kelas Tertinggi(asumsi)−Titik Tengah Kelas Terendah=77−2=75tahun . Interpretasi: Rentang usia penduduk yang tercakup dalam data ini adalah sekitar 75
tahun. dari usia balita hingga lansia.
Kuartil (Q1,Q3) dan Jangkauan Antarkuartil (IQR):
o Letak Kuartil Pertama (Q1): LetakQ1=1
4× n=1
4×275,773.70=68,943.42. Data ke- 68943.45 berada pada kelas interval 15 – 19 tahun.
o Nilai Kuartil Pertama
(
Q1)
: Q1=L1+
( (14)× nf−1 F1kum)× c
Q1=14.5+
(
68,943.42−66,196.9 22,163.5)
×5¿14.5+
(
2,746.5522,163.5)
×5¿14.5+(0.1239×5)
¿14.5+0.62=15.12tahun .
o Letak Kuartil Ketiga (Q3): Letak Q3=
(
34)
× n=(
34)
×275,773.70=206,829.75. Data ke- 206830.35 berada pada kelas interval 45 – 49 tahun.o Nilai Kuartil Ketiga
(
Q3)
: Q3=L3+
( (34)× nf−3 F4kum)× c
Q3=44.5+
(
206,829.75−196,924.5 18727.2)
×5¿44.5+
(
9,905.2518727.2)
×5¿44.5+(0.5289×5)
¿44.5+2.64=47.14tahun .
o Jangkauan Antarkuartil (IQR): IQR=Q3−Q1=47.14−15.12=32.02 tahun.
Interpretasi:Q1=15.12 tahun menunjukkan bahwa 25% penduduk Indonesia berusia di bawah 15.12 tahun. Q3=47.14 tahun menunjukkan bahwa 75% penduduk berusia di bawah 47.14 tahun. IQR=32.02 tahun menunjukkan bahwa sebaran usia 50%
penduduk "inti" (bagian tengah) adalah sekitar 32 tahun. Ini memberikan gambaran variasi usia penduduk yang tidak terlalu dipengaruhi oleh kelompok usia sangat muda atau sangat tua.
Varians dan Simpangan Baku:
Menggunakan rumus data kelompok dan nilai dari Tabel 2:
o Varians Sampel
(
s2)
:s2=∑
fi(
xi−x)
2n−1 =111,196,980.07
275773.70−1 =111,196,980,07 275772.70
≈403.22(tahun kuadrat).
o Simpangan Baku Sampel (s):s=
√
s2=√
403.22≈20.08 tahun. Interpretasi: Simpangan baku usia penduduk Indonesia pada tahun 2022 adalah sekitar 20.08 tahun. Ini menunjukkan rata-rata sebaran usia penduduk dari usia rata-rata (32.02 tahun). Nilai simpangan baku ini mengindikasikan adanya variasi usia yang cukup signifikan dalam populasi. yang mencerminkan struktur usia yang heterogen. Variasi usia ini memiliki implikasi penting bagi perencanaan pembangunan di berbagai sektor. seperti kebutuhan akan layanan pendidikan untuk kelompok usia muda. penyediaan lapangan kerja untuk usia produktif. dan fasilitas kesehatan serta jaminan sosial untuk kelompok usia lanjut.Tabel 3: Perhitungan Ukuran Penyebaran Data Kependudukan Indonesia Tahun 2022
Ukuran Hasil Interpretasi Singkat
Jangkauan (Range) 75 tahun Rentang usia penduduk yang
tercakup adalah 75 tahun.
Kuartil Pertama (Q1) 15.12 tahun 25% penduduk berusia di bawah
15.12 tahun.
Kuartil Ketiga (Q3) 47.14 tahun 75% penduduk berusia di bawah
47.14 tahun.
Jangkauan Antarkuartil (IQR) 32.02 tahun Sebaran usia 50% penduduk bagian tengah adalah 32.02 tahun.
Varians Sampel (s2) 403.22 Rata-rata kuadrat simpangan usia
dari rata-rata adalah 338.24 tahun kuadrat.
Simpangan Baku Sampel (s) 20.08 tahun Rata-rata simpangan usia penduduk dari usia rata-ratanya adalah 20.08 tahun.
3. Analisis Variabilitas Indeks Pembangunan Manusia (IPM) antar Provinsi di Indonesia Tahun 2021
Indeks Pembangunan Manusia (IPM) adalah ukuran komposit yang mencerminkan capaian rata-rata dalam tiga dimensi dasar pembangunan manusia: umur panjang dan hidup sehat. pengetahuan. dan standar hidup layak. Data IPM tahun 2021 per provinsi bersumber dari Badan Pusat Statistik (BPS). yang diakses melalui laman Wikipedia. Analisis variabilitas IPM penting untuk mengidentifikasi kesenjangan pembangunan antar wilayah dan merumuskan kebijakan yang lebih merata.
Penyajian Data (Data Tunggal): Berikut adalah data IPM untuk sampel 10 provinsi di Indonesia pada tahun 2021:
Tabel 4: Data Indeks Pembangunan Manusia (IPM) 10 Provinsi di Indonesia Tahun 2021
No. Nama Provinsi IPM 2021
1 DKI Jakarta 81.11
2 Yogyakarta 80.22
3 Kalimantan Timur 76.88
4 Kepulauan Riau 75.79
5 Bali 75.69
6 Papua 60.62
7 Nusa Tenggara Timur 65.28
8 Sulawesi Barat 66.36
9 Kalimantan Barat 67.90
10 Gorontalo 69.00
Sumber: Diolah dari Wikipedia (BPS)
Pertanyaan:
Berdasarkan data sampel IPM 10 provinsi di atas. hitunglah:
a. Jankauan (Range)
b. Simpangan Baku Sampel (s)
Solusi Lengkap:
Data IPM: 81.11; 80.22; 76.88; 75.79; 75.69; 60.62; 65.28; 66.36; 67.90; 69.00.
Jumlah data (n) = 10.
Urutkan data: 60.62; 65.28; 66.36; 67.90; 69.00; 75.69; 75.79; 76.88; 80.22; 81.11.
a. Jangkauan (Range. R)
R=Xmaks−Xmin=81.11(DKI Jakarta)−60.62(Papua)=20.49
Interpretasi: Jangkauan IPM sebesar 20.49 poin menunjukkan selisih yang cukup signifikan antara provinsi dengan capaian pembangunan manusia tertinggi dan terendah dalam sampel ini.
b. Simpangan Baku Sampel (s) Pertama. hitung rata-rata (x):
x=60.62+65.28+66.36+67.90+69.00+75.69+75.79+76.88+80.22 10
x=71.885Selanjutnya.
hitung ∑
(
xi−x)
2:(60.62−71.885)2=(−11.265)2=126.9002(65.28−71.885)2=(−6.605)2=43.6260 (66.36−71.885)2=(−5.525)2=30.5256(67.90−71.885)2=(−3.985)2=15.8802
(69.00−71.885)2=(−2.885)2=8.3232(75.69−71.885)2=(3.805)2=14.4780 (75.79−71.885)2=(3.905)2=15.2490(76.88−71.885)2=(4.995)2=24.9500 (80.22−71.885)2=(8.335)2=69.4722(81.11−71.885)2=(9.225)2=85.0906
∑
(
xi−x)
2=126.9002+43.6260+30.5256+15.8802+8.3232+14.4780+15.2490+24.9500+69.4722+85.0906=434.495.Varians Sampel
(
s2)
=∑ (
xi−x)
2n−1 =434.495
10−1 =434.495
9 ≈48.277. Simpangan Baku Sampel (s)=
√
s2=√
48.277≈6.948 poin IPM.Interpretasi: Simpangan baku sampel sebesar 6.948 poin IPM mengindikasikan bahwa rata-rata. nilai IPM provinsi dalam sampel ini menyimpang sekitar 6.948 poin dari rata-rata IPM sampel (x =71.885). Nilai simpangan baku ini. bersama dengan jangkauan yang cukupˉ lebar. menunjukkan adanya variasi atau kesenjangan yang nyata dalam capaian pembangunan manusia antar provinsi di Indonesia.
4. Analisis Disparitas Produk Domestik Regional Bruto (PDRB) per Kapita antar Provinsi di Indonesia Tahun 2022
Produk Domestik Regional Bruto (PDRB) per kapita merupakan indikator penting untuk mengukur tingkat kemakmuran ekonomi rata-rata per penduduk di suatu wilayah. Data PDRB per kapita tahun 2022 untuk provinsi-provinsi di Indonesia bersumber dari Badan Pusat Statistik (BPS).11 Analisis disparitas PDRB per kapita ini bertujuan untuk memahami variasi tingkat kesejahteraan ekonomi antar provinsi.
Berikut adalah data PDRB per kapita untuk sampel 10 provinsi di Indonesia pada tahun 2022 (dalam ribu rupiah):
Tabel 5: Data PDRB per Kapita 10 Provinsi di Indonesia Tahun 2022 (Ribu Rp)
No. Nama Provinsi PDRB per Kapita (Ribu Rp)
1 DKI Jakarta 299,675
2 Kalimantan Timur 238,917
3 Kepulauan Riau 145,530
4 Riau 151,259
5 Nusa Tenggara Timur 21,658
6 Maluku 28,537
7 Nusa Tenggara Barat 28,671
8 Sulawesi Barat 37,034
9 Aceh 38,767
10 Gorontalo 39,691
Total 1,029,739
*Sumber: Diolah dari BPS
Pertanyaan:
Berdasarkan data sampel PDRB per kapita 10 provinsi di atas. hitunglah:
a. Jangkauan (Range) b. Varians Sampel (s2)
c. Simpangan Baku Sampel (s) d. Koefisien Variasi (CV)
Interpretasikan setiap hasil perhitungan dalam konteks disparitas ekonomi regional.
Solusi Lengkap:
Data PDRB per kapita (ribu Rp): 299,675; 238,917; 145,530; 151,259; 21,658; 28,537;
28,671; 37,034; 38,767; 39,691.
Jumlah data (n) = 10.
Urutkan data: 21,658; 28,537; 28,671; 37,034; 38,767; 39,691; 145,530; 151,259;
238,917; 299,675.
a. Jangkauan (Range. R)
R=Xmaks−Xmin=299,675(DKI Jakarta)−21,658(Nusa Tenggara Timur) R=278.017ribu Rp
Interpretasi: Jangkauan PDRB per kapita sebesar 278.017 ribu Rp menunjukkan perbedaan yang sangat besar dalam tingkat kemakmuran ekonomi rata-rata antara provinsi terkaya dan termiskin dalam sampel ini.
b. Varians Sampel (s2)
Pertama. hitung rata-rata (x):
x=1,029,739
10 =102,973.9ribu Rp . Selanjutnya. hitung ∑
(
xi−x)
2:(21,658−102.973 .9)2=(−81,315.9)2=6,612,275,888.81 (28,537−102.973 .9)2=(−74,436.9)2=5,540,847,637.61 (28,671−102.973 .9)2=(−74,302.9)2=5,520.919,748 .41 (37,034−102.973 .9)2=(−65.939 .9)2=4,348,070,320.01 (38,767−102.973 .9)2=(−64,206.9)2=4,122,526,255.61 (39,691−102.973 .9)2=(−63,282.9)2=4,004,725,396.41 (145,530−102.973 .9)2=(42,556.1)2=1,811,021,699.21 (151,259−102.973 .9)2=(48,285.1)2=2,331,450,607.01 (238,917−102.973 .9)2=(135.943 .1)2=18,480,518,038.61 (299,675−102.973 .9)2=(196,701.1)2=38,691,719,729.21
∑
(
xi−x)
2≈91,464,075,321.9s2=
∑ (
xi−x)
2n−1 =91,464,075,321.9
10−1 =91,464,075,321.9
9 ≈10,162,675,035.77(ribu Rp)2. Interpretasi: Varians sampel yang sangat besar ini mencerminkan penyebaran nilai PDRB per kapita yang ekstrem di antara provinsi-provinsi dalam sampel.
c. Simpangan Baku Sampel (s)
s=
√
s2=√
10,162,675,035.77≈100,809.99ribu Rp .Interpretasi: Simpangan baku sampel sekitar 100.810 ribu Rp menunjukkan bahwa. rata- rata. PDRB per kapita provinsi dalam sampel ini menyimpang sekitar 100.810 ribu Rp dari nilai rata-rata sampel (x=102,973.9ribu Rp). Besarnya simpangan baku ini. yang hampir sama dengan nilai rata-ratanya. menegaskan tingkat disparitas ekonomi regional yang sangat tinggi.
d. Koefisien Variasi (CV)
CV=
(
sx)
×100 %=(
100,809.99102,973.9)
×100 %≈0.9790×100 %≈97.90 %.Interpretasi: Koefisien variasi PDRB per kapita adalah sekitar 97.90%. Nilai CV yang sangat tinggi ini (mendekati 100%) secara lebih akurat menggambarkan tingkat ketimpangan ekonomi regional y