STK511
Analisis Statistika
1. Dosen : Anang Kurnia (anangk@apps.ipb.ac.id)
2. Asisten : Septian Rahardiantoro
3. Waktu : Rabu –> 08.00 – 09.40 Jumat –> 08.00 – 10.00
4. Office Hours : Rabu -> 11.00-12.00 (STK Darmaga) atau dengan
perjanjian
5. Berpakaian dan berperilaku sopan
5. Selama perkuliahan tidak terdengar bunyi HP
6. Penilaian : NA = UTS (40%) + UAS (40%) + Tugas/Kuis (20%)
No. Pokok Bahasan #Pertemuan
1 Pendahuluan 1
2 Review Statistika Dasar 1
3 Sebaran Peluang 1
4 Sebaran Penarikan Contoh 1
5 Statistika Inferensia (Pendugaan dan Pengujian) 2
6 Analisis Data Perancangan Percobaan 3
7 Analisis Korelasi dan Regresi 2
8 Analisis Data Kategorik 1
9 Analisis Peubah Ganda 2
– Statistika berasal dari kata statistik penduga parameter
– Ilmu yang mempelajari dan mengusahakan agar data menjadi informasi yang bermakna
– Ilmu yang mempelajari teknik-teknik yang diperlukan dalam pengumpulan data, analisis dan penarikan kesimpulan
berdasarkan data contoh mencerminkan ciri populasi
– Statistics vs Statistic 1. Pendahuluan
Statistika
Populasi Contoh Sampling Pendugaan Tingkat Keyakinan Ilmu Peluang Statistika Deskriptif vs Statistika Inferensia Deskriptif 1. Pendahuluan• Tata cara pengumpulan data baik melalui percobaan, survey, dan observasi
• Tata cara analisis data untuk menyarikan keterangan dari data yang terkumpul, numerik maupun grafik, untuk memudahkan pembahasan dan penarikan kesimpulan
Statistika deskriptif
• Tata cara pengukuran kepercayaan dalam penarikan kesimpulan untuk ruang lingkup yang lebih luas
Statistika inferensia 1. Pendahuluan
1. Pendahuluan
Proses Analisis Statistika
Kesimpulan Pengumpulan Data Pengujian Hipotesis Pembandingan Keterangan Pendugaan Penyarian Keterangan
1. Pendahuluan
• Enumeratif
Menduga nilai agregat dari populasi. • Analitik
Membahas perilaku hubungan antar berbagai faktor, menjelaskan hubungan sebab akibat.
Analisis vs Tujuan/Ruang Lingkup
1. Pendahuluan
Metode Pengumpulan Data
Metode Percobaan Metode observasi
(pasif) Metode survey Memiliki keleluasaan untuk melakukan pengawasaan terhadap sumber-sumber keragaman data
Tidak memiliki kendali dalam pengumpulan data (kecuali
menentukan faktor yang diamati dan memeriksa ketelitian data)
Contoh data diambil dengan teknik tertentu dari populasi
mewakili populasi
Dapat menciptakan jenis perlakuan yang
diinginkan dan
mengamati perubahan pada respon
Perubahan pada respon sulit diketahui
penyebabnya
Nilai dugaan populasi dapat ditentukan
dengan tingkat
kepercayaan tertentu namun tidak cukup kuat menggambarkan
1. Pendahuluan
Metode Pengumpulan Data
Metode Percobaan Metode Observasi Metode Survey
Kelebihan Kelemahan Kelebihan Kelemahan Kelebihan Kelemahan
Kuat dalam pengendalian keragaman Represen- tasi hasil Mudah, murah, mengamati masalah dalam kondisi yang sebenarnya Pengendalian keragaman dan Representasi Hasil Represen- tasi hasil Pengendalian keragaman
1. Pendahuluan
Sumber Keragaman
• Dapat diidentifikasi dan diperkirakan pengaruhnya
=> Pengelompokan
• Dapat diidentifikasi tetapi tidak dapat diperkirakan pengaruhnya
=> Pengacakan
• Sulit diidentifikasi
1. Pendahuluan
Keterbatasan Hasil Analisis Statistika • Permasalahan :
– Model kuantitatif yang sempurna belum tentu diketahui – Faktor penyebab bisa banyak sekali
– Adanya keragaman alami -> pengulangan tidak bisa persis – Penelitian yang “sempurna” tidak mungkin dilakukan
• Hasil Penelitian Bersifat Kondisional, tergantung pada :
– Kerangka contoh atau populasi percobaan yang diamati
– Metode pelaksanaannya (alat dan metode pengukuran, jenis dan definisi peubah yang diamati, dll)
1. Pendahuluan
Keterbatasan Hasil Analisis Statistika
Statistika adalah tongkat ke daerah ketidaktahuan.
Semua model adalah salah, namun paling tidak ada
satu yang bisa digunakan (mendekati kondisi
1. Pendahuluan
Gambaran Analisis Statistika : Statistika Deskriptif
Diameter 20 15 10 80 70 60 Height 80 70 60 20 15 10 70 45 20 Volume 70 45 20
Matrix Plot of Diameter, Height, Volume
Stem-and-Leaf Display: Volume
Stem-and-leaf of Volume N = 31 Leaf Unit = 1.0 10 1 0005688999 (9) 2 111224457 12 3 13468 7 4 2 6 5 11558 1 6 1 7 7 4 6 8 10 12 14 0 5 10 15 20 M-GREG MKT-GREG Fr e q u e n cy 400 300 200 100
1. Pendahuluan
Gambaran Analisis Statistika : Statistika Deskriptif
0.0 50.0 100.0 150.0 200.0 250.0 300.0 350.0 Negeri Swasta 33.2 51.6 30.1 44.1 237.5 198.1 322.3 272.3
Statistika Inferensia
• Perbandingan Rataan Populasi
– Satu populasi Uji t atau uji z – Dua populasi Uji t atau uji z – Lebih dari dua populasi anova • Hubungan antar variabel
– Hubungan dua arah Analisis Korelasi
– Hubungan satu arah (sebab akibat) Analisis Regresi
1. Pendahuluan
• Suatu Penelitian dilakukan untuk mengetahui pengaruh kecepatan pengisian cat (X1) dan ketebalan cat (X2) terhadap kualitas hasil pengecatan (Y)
Duga Persamaan Regresi-nya !!!
0.30 60 Y 80 0.25 100 X1 120 0.15 0.20 0.20 0.25 X2 Surface Plot of Y vs X1, X2 1. Pendahuluan
0.30 FITS3 80 0.25 90 100 X1 110 0.15 0.20 0.20 0.25 X2
Surface Plot of FITS3 vs X1, X2
X 1 0.30 0.28 0.26 0.24 0.22 FITS3 85 - 90 90 - 95 95 - 100 100 - 105 105 - 110 < > 110 80 80 - 85
Contour Plot of FITS3 vs X1, X2
Regression Analysis: Y versus X1, X2
The regression equation is Y = 15.0 + 183 X1 + 171 X2
Predictor Coef SE Coef T P Constant 15.02 10.24 1.47 0.155 X1 182.75 33.02 5.53 0.000 X2 170.65 35.38 4.82 0.000 S = 7.41471 R-Sq = 72.6% R-Sq(adj) = 70.4% Analysis of Variance Source DF SS MS F P Regression 2 3503.9 1752.0 31.87 0.000 Residual Error 24 1319.5 55.0 Total 26 4823.4 1. Pendahuluan
Binary Logistic Regression: Y2 versus x1, x2
Link Function: Logit Response Information
Variable Value Count
Y2 1 12 (Event) 0 8
Total 20
Logistic Regression Table
Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Constant 3.87448 3.38365 1.15 0.252
x1 -0.516801 0.357665 -1.44 0.148 0.60 0.30 1.20 x2 0.396576 0.211489 1.88 0.061 1.49 0.98 2.25
1. Pendahuluan
1. Pendahuluan
Analisis Lebih Lanjut : Peubah Ganda
• Menggambarkan suatu objek tidak cukup menggunakan satu peubah saja
• Kasus pengamatan peubah ganda dijumpai di seluruh bidang terapan
• Perlu analisis lebih “canggih” dibandingkan analisis pada peubah tunggal (univariate)
• Peubah yang diamati tidak saling bebas (ada overlapping informasi antar peubah), sehingga diperlukan teknik-teknik penyusunan peubah baru seperti komponen utama dan peubah kanonik
1. Pendahuluan
• Manova
• Analisis Komponen Utama • Analisis Faktor
• Analisis Cluster
• Analisis Diskriminan
• Analisis Korelasi Kanonik • Analisis Biplot
Ilustrasi : Biplot Analisis Lebih Lanjut : Peubah Ganda
• Data time series (deret waktu) merupakan data yang dikumpulkan secara sequensial menurut periode waktu tertentu.
• Peranan ramalan (forecasting) data ke depan memegang peranan penting dalam menyusun kebijakan strategis perusahaan/lembaga
• Metode Forecasting yang berkembang saat ini, antara lain:
– Metode Rataan Kumulatif
– Metode Pemulusan (Smoothing)
– ARIMA (AutoRegressive Integrated Moving Average) – Fungsi Transfer (Bivariate ARIMA)
– MARIMA (Multivariate ARIMA)
1. Pendahuluan
Index x 45 40 35 30 25 20 15 10 5 1 1400 1200 1000 800 600 400 200 0
Time Series Plot of x
Index x 45 40 35 30 25 20 15 10 5 1 1400 1200 1000 800 600 400 200 0 Smoothing Constants Alpha (level) 0.2 Gamma (trend) 0.2 Delta (seasonal) 0.2 Accuracy Measures MAPE 60 MAD 267 MSD 101122 Variable Actual Smoothed
Winters' Method Plot for x Additive Method
1. Pendahuluan
Analisis Lebih Lanjut : Time Series
Ilustrasi Metode Winter (Kasus data musiman)
perlu informasi yang lebih rinci, cepat, dan handal, tidak saja untuk lingkup superpopulasi tetapi pada lingkup yang lebih kecil
Pada level nasional, data tersedia baik melalui BPS “DESAIN SURVEY PADA LEVEL NASIONAL”
Masalah : tingkat akurasi dan
presisi pendugaan langsung untuk area kecil akan rendah karena
ukuran contoh sedikit atau bahkan
Solusi Alternatif :
Small Area Estimation (SAE)
1. Pendahuluan
• Suatu metode untuk menduga parameter pada suatu area (sub-domain) yang relatif kecil dalam percontohan survey dengan memanfaatkan informasi dari luar area, dari dalam area itu sendiri dan dari luar survey.
• Menambah informasi pada data contoh tanpa menambah ukuran contoh.
• => Generalized Linear Mixed Model
1. Pendahuluan