Analisa Data Statistik
Referensi
Daftar Isi
Hipotesa Statistik : Konsep Umum
Hipotesa statistik adalah sebuah klaim/pernyataan atau conjecture tentang populasi.
Contoh masalah yg akan dijawab dengan hipotesa statistik:
- Apakah merokok menaikkan resiko kanker?
- Apakah tipe darah ada hubungannya dengan berat badan?
- Berapa persen pemilih yg akan memilih calon A sebagai
presiden?
Situasi Yang Mungking Dalam Test Hipotesa Statistik
H0 benar H0 salah
H0 Tidak ditolak Keputusan Benar Error Tipe II (β)
H0 Ditolak Error Tipe I (α) Keputusan Benar
Error tipe I adalah situasi dimana H0 benar tetapi ditolak (berarti H1 diterima)
Besarnya probabilitas ( α) untuk melakukan error tipe I disebut juga tingkat signifikan (level of significance) dari test statistik.
Daerah Kritis dan Nilai Kritis
Daerah kritis adalah luas ekor di kurva normal, yang menyatakan
probabilitas untuk mendapatkan nilai rata-rata sampel lebih besar atau lebih kecil dari nilai kritis tertentu, walaupun nilai rata-rata populasinya sebesar X=X0. Luas daerah kritis ini mencerminkan probabilitas untuk menolak H0 walaupun sebenarnya H0 benar.
Test 1 Ekor dan 2 Ekor
Jika Hipotesa Alternatif berupa ketidaksamaan disebut test 1 ekor:
H0 : X = X0 H1 : X > X0
Atau
H0 : X = X0 H1 : X < X0
Sedangkan jika H1 berupa ketidaksamaan disebut test 2 ekor:
H0 : X = X0
Prosedur Testing Hipotesis Dengan Error Tipe I
ditentukan dulu (
α
Fixed)
1. Tuliskan H0 dan H1
2. Pilih tingkat signifikan yaitu α (biasanya 5% atau 10%)
3. Pilih test statistik yg sesuai dan nilai kritis yg membatasi daerah
kritis sesuai dengan tingkat signifikan yg dipilih
4. Hitung statistik yg bersesuaian dengan (3) di atas berdasarkan
sampel data.
5. Ambil keputusan : H0 ditolak jika hasil hitung test statistik masuk
di daerah kritis, kalau tidak H0 tidak bisa ditolak (atau terima H1)
Test STatistik Berkenaan dengan Rata-Rata 1 Populasi
(Variansi Populasi diketahui)
Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi (σ) diketahui . Dari sampel yg diambil berukuran n diketahui rata-rata sampelnya xs.
Test – 1 ekor
1. Tuliskan H0 dan H1
H0 : μ = μ0 H1 : μ ≠ μ0
2. Pilih tingkat signifikan : α (misal 5%)
3. Test statistik bagi rata-rata adalah nilai Z dari rata-rata, karena
α=5% maka nilai kritis yg bersesuaian dari tabel adalah Z0.025 = 1.96 dan –Z0.025 (test 2 ekor).
Daerah kritis adalah Z>1.96 atau Z<-1.96. 4. Hitung Z dari sampel
5. Ambil keputusan berdasarkan (4) dan (3)
n x Zhitung
/
Contoh
Sebuah pabrik senar pancing mengklaim produk barunya memiliki kekuatan rata-rata 8kg dan standard deviasi 0.5kg. Sampel
Solusi
1. H0: μ=8 dan H1: μ≠8
2. α = 0.01
3. Daerah kritis Z0.005 = 2.575
Tolak H0 jika Z < -2.575 atau Z > 2.575, dengan
4. Hitung statistik:
5. Keputusan : Tolak H0 sebab Zhitung < -2.575
6. Kesimpulan: kekuatan rata-rata senar tidak 8 kg (kenyataannya < 8 kg)
n Zhitung
/
Soal: test 1 ekor
Sampel random 100 catatan kematian di USA tahun lalu menyatakan umur rata-rata penduduknya 71.8 tahun. Misalkan diketahui
Test STatistik Berkenaan dengan Rata-Rata 1 Populasi
(Variansi Populasi Tidak diketahui)
Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi (σ) TIDAK diketahui tetapi populasi dianggap normal. Dari sampel yg diambil berukuran n diketahui rata-rata sampelnya xs. Maka statistik yg bersesuaian adalah student-t statistik:
Dengan derajat kebebasan v=n-1
n
S
x
t
/
0
Contoh
Hasil studi tentang konsumsi listrik berbagai peralatan rumah tangga mengklaim bahwa vacuum cleaner rata-rata mengkonsumsi 46 KwH/tahun. Sampel random 12 rumah tangga yg memiliki
vacuum cleaner menghasilkan rata-rata 42 KwH/tahun dengan standard deviasi sampel 11.9 KwH. Apakah hasil ini menyarankan bahwa sebenarnya vacuum cleaner mengkonsumsi listrik
Solusi
1. H0: μ=46 dan H1: μ < 46 2. α = 0.05
3. Daerah kritis (1 ekor, student-t)
n= 12, derajat kebebasan v=n-1=11 t0.05 =-1.796 (ekor kiri)
Tolak H0 jika t < -1.796
4. Hitung statistik:
5. Keputusan : Tidak bisa menolak H0 sebab thitung > -1.796
6. Kesimpulan: rata-rata konsumsi listrik vacuum cleaner tidak secara signifikan kurang dari 46 KwH/tahun
16 . 1 12
/ 9 . 11
46 42
/
n S
x
Test STatistik Berkenaan dengan Rata-Rata 2 Populasi
(Variansi Populasi diketahui)
Situasi : berdasarkan 2 set sampel dengan rata-rata xSA dan xSB yg berasal dari dua populasi, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Jika variansi populasi (σ1 dan σ2 ) diketahui, maka variabel statistik:
Akan terdistribusi normal standard.
2 2 2
1 2 1
2 1
2
1
)
(
)
(
n
n
x
x
Z
Contoh
Pabrik benang mengklaim bahwa rata-rata kekuatan benang tipe A paling tidak 12 kg lebih besar dibandingkan benang tipe B. Untuk memeriksa klaim tersebut diambil sampel 50 buah dari tiap-tiap tipe benang. Ternyata sampel benang A memiliki rata-rata
kekuatan 86.7 kg, standard deviasi populasi dari benang tipe A diketahui 6.26 kg. Sedangkan rata-rata kekuatan sampel benang B adalah 77.8 kg, dan dari data-data sebelumnya diketahui
Solusi
Diketahui:
Benang A Benang B
nA = 50 nB=50
xsA = 86.7 xsB = 77.8
σA = 6.26 σB = 5.61
α=5%
Klaim : xSA-xsB > 12
1. Hipotesa
H0: μA- μB ≤ 12 H1: μA- μB> 12
Solusi
Zhitung
3. Daerah kritis
Test statistik untuk kasus ini adalah Z, :
dengan nilai kritis Z0.05 = 1.65. Tolak H0 jika Z > 1.65
4. Hitung statistik
5. Keputusan
Test STatistik Berkenaan dengan Rata-Rata 2 Populasi
(Variansi Populasi TIDAK diketahui TAPI SAMA)
Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel xSA dan xSB serta standard deviasi sampel SA dan SB yang berasal dari dua populasi normal, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Variansi populasi (σ1 dan
σ2 ) TIDAK diketahui tapi dapat dianggap SAMA, maka variabel
statistik:
Contoh
Kecepatan penipisan lapisan pelindung produksi dari sebuah pabrik ditest secara statistik. Pabrik tsb ingin mengetahui perbedaan
kecepatan penipisan lapisan pelindung yg terbuat dari bahan A dan dari bahan B. 12 sampel dari bahan A dicek, dan didapati rata-rata penipisan 85 unit dan standard deviasi 4. Sedangkan 10 buah sampel dari bahan B memiliki rata-rata 81 dengan sampel standard deviasi 5. Dapatkah disimpulkan bahwa rata-rata penipisan bahan A lebih besar dari 2 unit dibandingkan penipisan bahan B? Asumsikan populasi
Solusi
Diketahui:
Sampel A Sampel B
nA = 12 nB = 10
xsA = 85 xSB = 81
SA = 4 SB = 5.
σ tidak diketahui, tapi dianggap sama. Populasi normal.
α= 5%
Solusi
1. Hipotesa
H0: μA – μB ≤ 2
H1: μA – μB > 2
2. Tingkat signifikan α = 5% 3. Daerah kritis
Solusi
4. Hitung statistik:
478
5. Keputusan:
Karena thitung < 1.725, maka H0 tak dapat ditolak,
Test Statistik Berkenaan dengan Rata-Rata 2 Populasi
(Variansi Populasi TIDAK diketahui TAPI BEDA)
Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel xSA dan xSB serta standard deviasi sampel SA dan SB yang berasal dari dua populasi normal, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Variansi populasi (σ1 dan
σ2 ) TIDAK diketahui tapi dapat dianggap BEDA, maka variabel
statistik:
dengan derajat kebebasan v:
Contoh
Berikut ini adalah data lama waktu pemutaran film yg diproduksi oleh dua buah rumah produksi:
Rumah
Produksi LAMA WAKTU (menit)
A 102 80 98 109 92
B 81 165 97 134 92 87 114
Solusi
Perhitungan rata-rata dan variansi
Solusi
Derajat kebebasan v:
Solusi
1. Hipotesa
H0: μB – μA ≥ 10 H1: μB – μA <10
2. Tingkat signifikan α = 0.1 3. Daerah kritis
Test statistik yg dipakai adalah variabel t:
Nilai kritis -t0.1 = -1.397 untuk derajat kebebasan v=8 Tolak H0 jika t < -1.397
2 2 2 1
2 1
2 1
2
1 ) ( )
(
n S n
S x x t
Solusi
4. Perhitungan statistik:
5. Keputusan:
Karena thitung > -1.397 maka H0 tak bisa ditolak atau lama waktu film A memang lebih dari 10 menit dari pada film B
Test Statistik Berkenaan dengan Pengamatan
Pasangan Data
Situasi : Pengamatan pasangan data, dengan d1, d2 dst adalah
selisih dari data-data hasil pengamatan yang diambil dari populasi normal. Ingin diketahui apakah rata-rata selisihnya sama dengan nilai tertentu. Dari sampel-sampel diketahui rata-rata dan
standard deviasi selisih sampel sebagai D dan SD. Variabel statistik yg diperiksa adalah:
dimana μD adalah rata-rata populasi yang memiliki distribusi student t dengan derajat kebebasan v=n-1
n
S
d
t
D
D