Statistika Nonparametrik

(1)

Statistika Nonparametrik

(2)

Asumsi2 Parametrik

 Observasinya harus independen

 Observasinya harus diambil dari populasi

normal, kecuali ukuran sampel cukup besar

 Semua populasi variansinya harus sama

(3)

Asumsi2 Nonparametrik

 Observasi2 nya independen

 Variablenya merupakan variabel yang

(4)

Ukuran/Skala Data

 Ada 4 (empat) macam, yaitu:

1. Skala Nominal (Classificatory)  Gender, latar belakang etnik

2. Skala Ordinal (Ranking)

 Kekerasan batu, kecantikan, pangkat militer 3. Skala Interval

 Celsius atau Fahrenheit 4. Skala Ratio

(5)

Metode Nonparametrik

 Ada paling sedikit satu uji nonparametrik

yang ekivalen dgn suatu uji parametrik

 Uji2 tersebut dapat di kelompokkan

dalam beberapa kategori, yaitu:

1. Uji beda antar kelompok (sampel independen)

(6)

Jika berhadapan dengan suatu

populasi dichotomous (hasilnya

digolongkan sebagai sukses atau

gagal: biasa juga dikenal sebagai

populasi dua hasil), maka objek

yang dapat dijadikan perhatian

Inferensi Statistika Untuk

Parameter Distribusi Binomial

(7)

Untuk melakukan inferensi statistika

untuk p, maka diambil sampel

random berukuran-n dari populasi

tersebut dan diketahui bahwa

distribusi sampling jumlah sukses

(dalam sampel random berukuran-n)

berdistribusi Binomial dengan

(8)

Jika X ~ Bin (n , p), maka

dengan mean X = np variansi

X = np( 1 - p), dan X adalah

jumlah sukses.

( ) ( ) n x(1 )n x, 0, 1, 2, .... f x P X x p p x n x       _{ }    

(9)

Jelas

bahwa

menggunakan

teorema

limit

pusat

dapat

dibuktikan bahwa untuk n yang

cukup besar

atau

~

(

.

(1

))

X

N np np



p

x p 

(10)

sehingga inferensi statistika untuk p

dapat dilakukan berdasarkan

distribusi normal. Suatu hal yang

sering dilakukan agar hasil yang

diperoleh menjadi lebih tepat adalah

menggunakan faktor koreksi

berhubung distribusi binomial adalah

distribusi variabel random diskrit

(11)

Faktor koreksi yang digunakan adalah + ditambah untuk batas atas dari X dan -ditambahkan untuk batas bawah.

Jika n tidak cukup besar, maka pendekatan normal tidak dapat dilakukan, sehingga inferensi statistika untuk p adalah harus didasarkan pada distribusi binomial, yaitu dengan cara berikut:

(12)

Karena X ~ Bin (n , p), dari

dapat diperoleh interval konfidensi (1 -α) 100% untuk p adalah

1.1. Estimasi Interval

( _L _u ) (1 )100%

P X  X  X  



(13)

dengan

p

_L

,

p

_u

dapat

diperoleh dari suatu tabel,

misalnya tabel C6 dalam

buku

"Statistics

:

A

Biomedical

Introduction"

(14)

Untuk menguji H₀ = p = p₀, daerah X ~ Bin (n , p₀), maka

 untuk menguji H_a = p ≠ p₀, daerah

kritisnya adalah X > x_u atau X < X_L dengan X_u ditentukan dari dan X_L ditentukan dari atau sebaliknya

 untuk H_a = p > p₀, daerah kritisnya adalan

X < X dengan X ditentukan dari P(X < X ) ≤

(15)

Catatan:

1. Untuk n , p tertentu X_u atau X_L dapat

dicari dengan tabel distribusi Binomial.

2. Inferensi Statistika untuk experimen

Bernoulli atau Binomial atau populasi dichotomous dapat pula dilakukan dengan pendekatan ke distribusi normal.

(16)

Karena X ~ Bin (n , p) dengan X =

jumlah sukses dalam sampel,

maka X adalah variabel random

diskrit. Kriteria untuk menentukan

apakah berlaku pendekatan normal

adalah 0,1 < p < 0,9 (rule of

thumb), maka distribusi

tidak

(17)

Contoh 6.1 : Dari tabel di bawah ini ujilah apakah merokok mempengaruhi waktu hidup ? Hidup dalam 6 th Hidup Jumlah Yang tidak merokok 117 950 1067 perokok 54 348 402 Jumlah 171 1298 1469

(18)

Jika X1 ~ Bin (n1 , p1) dan X2 ~ Bin(n2 , p2), maka untuk menguji H_o = p₁ = p₂ = p digunakan statistik

1.3. Inferensi Statistika

Untuk Beda Proporsi

1 2 1 2

X

P

n







(19)

A Ā Jumlah Sampel I X₁ n₁ - X₁ n Sampel II X₂ n₂ - X₂ n₂ Jumlah X₁ + X₂ n₁ + n₂ - X₁ - X₂ n₁ + n₂

(20)

Berikut ini adalah suatu cara lain untuk melakukan inferensi statistika untuk membandingkan dua proporsi. Cara yang sangat populer ini adalah:

Sukses Gagal

Sampel I p₁ 1 - p₁

(21)

dengan X₁ ~ Bin (n₁ , p₁) dan X₂ ~ Bin (n₂ , p₂) saling independen, maka H_o benar berakibat p₁ = p₂ = p, sehingga X₁ + X₂ ~ Bin (n₁ + n₂ , p) dan





1 2 1 1 1 1 1 2 n n x k x P X x X X k n n      _           

(22)

Jika X berdistribusi Binomial ditulis : X ~ Bin (n , p), maka

dengan x = 0, 1, 2, ... n dan o < p < 1.

Jika X ~ Bin (n_x , p_x) dan Y ~ Bin (n_y , p_y) dengan X dan Y saling independen, maka

( ) n x (1 )n x P X x p p x      _{ }   

(23)

Jika dua populasi dependen, maka penyajian tabel keadaan berikut

adalah tidak benar, karena yang

Sembuh tidak

Obat A 18 82 100

(24)

Dengan demikian penyajian tabel yang benar adalah sebagai berikut

Sembuh tidak

Sakit 9 1 10

tidak 9 81 90

(25)

Dengan mudah dapat dilihat bahwa PA dan PB tidak independen.

AB

n

_AB

_

(26)

Dari tabel di atas dapat diperoleh dengan mudah bahwa

Dengan demikian untuk menguji H_o = p_A = p_B adalah sama/ekivalen dengan menguji

dan

A AB _AB B AB _AB

P  p  p _ p  p  p _

(27)

Jika dan tertentu maka

Untuk dan besar, biasanya 25, maka atau AB

n

_

n

_AB_ ₁ 1 ( , ) 2 AB AB AB n _  B n_  n _ AB

n

_

n

_AB_ (0 , 1) AB AB AB AB n n N n n        2 2 1 AB AB AB AB n n n n   _     _        

(28)

Perhatikan tabel berikut

Jika x + y, n_x dan n_y diketahui, maka yang lain juga diketahui dan

I X n_X - X n_X II Y n_Y - Y n_Y X + Y n_X + n_Y - X - Y n_X + n_Y n n k k      

(29)

Untuk menguji H_o = p_x = p_y = p, maka X ~ Bin(n_x , p_x) dan Y ~ Bin (n_y , p_y) saling independen mengakibatkan X - Y ~ Bin (n_x + n_y , p) jika H_o benar. Dengan demikian berlaku





~ (0,1) x x y n x k n n N     

(30)

Uji hipotesis di atas dapat juga digunakan untuk menguji homogenitas atau independensi. Jika digunakan tabel berikut

Sukses O₁₁ O₁₂ n_1.

Gagal O₂₁ O₂₂ n_2.

(31)

maka statistik yang digunakan untuk menguji homogenitas adalah

sedangkan yang digunakan untuk menguji independensi adalah

2 x



2

(32)

Setelah kita mempelajari bagaimana

cara menguji Ho bahwa tidak ada

beda antara mean dua populasi,

suatu hal yang dapat difikirkan

sebagai

kelanjutannya

adalah

bagaimana cara menguji H

bahwa

II. INFERENSI STATISTIKA UNTUK MEMBANDINGKAN k (> 2) POPULASI

(33)

Suatu cara yang dapat difikirkan untuk menyelesaikan hal tersebut adalah menguji H_o dari semua pasangan 2 secara terpisah masing-masing menggunakan uji distribusi normal atau uji distribusi t.

Andaikan ada 5 populasi yang akan diuji beda meannya, maka banyak semua

(34)

Jika dipilih tingkat signifikansi α = 5% untuk setiap uji hipotesis, maka kemungkinan gagal menolak H_o bahwa tidak ada aturan multiplikatif kemungkinan, jika dianggap masing-masing uji hipotesis independen satu dengan yang lain, maka kemungkinan gagal menolak H_o dalam kesepuluh uji hipotesis adalah (95%)10 _{= 59,87%.}

(35)

Ini

berakibat

kemungkinan

menolak paling sedikit satu Ho

adalah 1 - 59,87% = 40,13%,

yang

adalah

terlalu

besar.

Tentunya hal ini tidak akan disukai,

sehingga

perlu

dicari

jalan

keluarnya,

yaitu

menggunakan

(36)

Model ini sering juga disebut Rancangan Random Lengkap atau Model Analisis Satu Faktor.

Data dari populasi-populasi yang diteliti dapat disajikan dengan cara sebagai berikut:

2.1. Model Analisis variansi

satu arah

(37)

Treatment (= Perlakuan)

1 2 3 ... k

x₁₁ x₁₂ x₁₃ x_1k

xn₁1 xn₂2 xn₃3 ... Xn_kk Total T_.1 T_.2 T_.3 T_.k T_..

(38)

-x_ij = Observasi ke-i dari atau dalam populasi ke j. i = 1, 2, ..., n_i dan j = 1, 2, ....k, ( k > 2). = mean perlakuan ke - j. = mean dari  , , . j x  _

x



_{ } 1

x

_ x2 x__k

(39)

Model Analisis variansi satu faktor ini adalah suatu teknik statistik untuk mempelajari hubungan antara suatu vairabel dependen dengan satu variabel independen (dalam hal ini biasa disebut faktor).

Model ini dapat dibedakan menurut 2 macam, yaitu model efek tetap dan model efek random.

(40)

Beda antar kelompok independen

 Dua sampel – membandingkan mean beberapa variabel yang menjadi perhatian Parametrik Nonparametrik Uji-t untuk sampel independen

Uji runs Wald-Wolfowitz

Uji U Mann-Whitney

(41)

Kolmogorov-Uji U Mann-Whitney

 Padanan nonparametrik untuk uji t dua sampel  Ukuran sebenarnya diganti dengan/oleh ranknya  Data dapat di rank dari nilai tertinggi ke

terendah atau dari terendah ke tertinggi

 Statistik U Mann-Whitney

(42)

Contoh Soal Uji U Mann-Whitney

 Hipotesis null dua sisi bahwa tidak ada

beda tinggi mahasiswa putra dan putri

 H_o: Tinggi mahasiswa putra dan putri

sama

 H_A: Tinggi mahasiswa putra dan putri

(43)

Tinggi mhs putra (cm) Tinggi mhs putri (cm) Rank tinggi mhs putra Rank tinggi mhs putri 193 175 1 7 188 173 2 8 185 168 3 10 183 165 4 11 180 163 5 12 178 6 170 9 n₁ = 7 n₂ = 5 R₁ = 30 R₂ = 48 U = n₁n₂ + n₁(n₁+1) – R₁ 2 U=(7)(5) + (7)(8) – 30 2 U = 35 + 28 – 30 U = 33 U’ = n₁n₂ – U U’ = (7)(5) – 33 U’ = 2

(44)

Beda antar kelompok independen

 Kelompok lebih dari satu Parametrik Nonparametrik Analisis variansi (ANOVA/ MANOVA) Analisis rank Kruskal-Wallis Uji Median

(45)

Beda antar kelompok dependen

 Membanding dua

variabel diukur dalam sampel yang sama

Parametrik Nonparametrik

Uji-t untuk sampel

dependen Uji Tanda Uji Data

Berpasangan Wilcoxon

(46)

Hubungan Antar Variabel

 Kedua variabel kategorik Parametrik Nonparametrik Koefisien Korelasi Pearson r Spearman R Kendall Tau Gamma Koefisien Chi Kuadrat Koefisien Phi

(47)

Tabel Statistik Uji

Parametrik dan Nonparametrik

Skala Pengukuran

Karakteristik Sampel Korelasi 1 Sampel 2 Sampel K ( >2) Sampel

Independen Dependen Independen Dependen Kategorik atau Nominal Χ2_atau binomi al Χ2 _{McNemar Χ}2 _Χ2 _{Cochran Q} Rank atau Ordinal Rank Bertan da Wilcox on Mann Whitney U Rank Bertanda Wilcoxon Data Ber-pasangan Kruskal Wallis H Friendman ANOVA Spearman rho Parametrik (Interval & Ratio) Uji z atau Uji t Uji t antar kelompok Uji t dalam kelompok ANOVA 1 arah/faktor antar ANOVA 1 arah/faktor (within or Pearson r

(48)

Keuntungan Uji Nonparametrik

 Probability statements obtained from most

nonparametric statistics are exact

probabilities, regardless of the shape of

the population distribution from which the random sample was drawn

 If sample sizes as small as N=6 are used,

(49)

Keuntungan Uji Nonparametrik

 Treat samples made up of observations from

several different populations.

 Can treat data which are inherently in ranks as

well as data whose seemingly numerical scores have the strength in ranks

 They are available to treat data which are

(50)

Kritik untuk Metode Nonparametrik

 Losing precision/wasteful of data

 Kuasa rendah

 False sense of security

 Tidak banyak

software

pendukung  Hanya menguji distribusi saja

 Tidak dapat digunakan untuk interaksi

(51)

Kuasa suatu Uji

 Kuasa statistik – probability of rejecting

the null hypothesis when it is in fact false and should be rejected

– Power of parametric tests – calculated from formula, tables, and graphs based on their underlying distribution

(52)