STATISTICS. Hanung N. Prasetyo WEEK 10 TELKOM POLTECH/HANUNG NP

(1)

Hanung N. Prasetyo

STATISTICS

Hanung N. Prasetyo WEEK 10

(2)

A. BEBERAPA CARA UJI NORMALITAS

1. RASIO SKEWNESS DAN RASIO KURTOSIS

Rasio Skewnwss = Nilai Skewnwss / S.E. Skewness Rasio Kurtosis = Nilai Kurtosis / S.E. Kurtosis

Jika Nilai Rasio Diantara - 2 s/d + 2 Sebarannya Bersifat Normal

2. UJI KOLMOGOROV SMIRNOV = UJI LILLIEFOR

Jika Nilai Prob. / Sig F > 5 % Sebaran Bersifat Normal

Jika Nilai Prob. / Sig F < 5 % Sebaran Bersifat Tidak Normal

3. UJI SHAPIRO WILK

Jika Nilai Prob. / Sig F > 5 % Sebaran Bersifat Normal Jika Nilai Prob. / Sig F > 5 % Sebaran Bersifat Normal

Jika Nilai Prob. / Sig F < 5 % Sebaran Bersifat Tidak Normal

4. UJI Anderson-Darling 5. GAMBAR / PLOT

Histogram dengan Normal Curve Q-Q Plot

Pembentukan Garis Berdasarkan Nilai Z.

Jika Data Tersebar Di sekeliling Garis Berdistribusi Normal

6. DETRENDED Q-Q PLOT

(3)

Untuk mengetahui apakah sebuah distribusi Normal atau mendekati Normal atau bisa dianggap Normal, bisa dilakukan beberapa prosedur:

1. Melakukan metode statistik tertentu, seperti Uji Kolmogorv-Smirnov, Uji Shapiro-Wilk dan

sebagainya.

2. Membuat Grafik dengan prosedur tertentu dan 2. Membuat Grafik dengan prosedur tertentu dan

mengamati pola plot atau grafik tersebut.

Pada kasus berikut dan hanya akan dijelaskan kedua metode tersebut.

(4)

Uji Normalitas Distribusi

Kolmogorov Smirnov

Metode Kolmogorov-Smirnov, yang merupakan uji kenormalan paling populer, didasarkan pada

nilai D yang didefinisikan sebagai berikut: nilai D yang didefinisikan sebagai berikut:

(5)

Pada hakekatnya D adalah nilai deviasi absolut maksimum antara Fn (x) dan F0 (x)

Nilai D ini selanjutnya dibandingkan dengan nilai D kritis untuk ukuran tes α.

Stephens memberikan

nilai kritis tersebut untuk berbagai kondisi pengujian nilai kritis tersebut untuk berbagai kondisi pengujian Untuk α = 1%, nilai D kritis adalah

1.035*(√n – 0.01 + 0.85/√n).

Sedangkan untuk α = 5% dan α = 10%, nilai D kritis

berturut-turut sebesar 0.895*(√n – 0.01 + 0.85/√n) dan

(6)

Terdapat beberapa cara pengujian normalitas distribusi

yaitu menggunakan formula/prosedur Kolmogorov-Smirnov, Liliefors, dan Chi Square (X 2 ₎

Untuk perhitungan normalitas distribusi, dimisalkan

terdapat sekelompok data dengan skala pengukuran terdapat sekelompok data dengan skala pengukuran interval dengan dua variabel bebas dan satu variabel terikat sebagai berikut :

(7)

X₁ X₂ Y

4 1 7

4 2 12

Tabel skor Variabel bebas (X) dan variabel terikat (Y)

9 8 17

12 8 20

(8)

Skor Y f p kp z_x z_t a₁ A2 7 1 0.2 0.2 -1.43 0.08 0.08 0.12 12 1 0.2 0.4 -0.58 0.28 0.08 0.12 17 1 0.2 0.6 0.27 0.61 0.21 0.01

Dari tabel tersebut misalkan kita ingin menguji normalitas variabel Y , maka untuk memudahkan diperlukan tabel bantu sebagai berikut :

Tabel bantu Perhitungan Normalitas

17 1 0.2 0.6 0.27 0.61 0.21 0.01 20 1 0.2 0.8 0.78 0.79 0.19 0.01 21 1 0.2 1.0 0.96 0.83 0.03 0.17 77 5 1.0 - 0 - - -Mean = 15.4 SD = 5.86

(9)

Langkah-langkah perhitungan :

Setelah data dimasukan dalam kolom pertama dan dihitung

frekuensinya, kemudian dilakukan perhitungan sebagai berikut :

1. Cari prosentasi (p) dengan cara frekuensi (f) dibagi dengan

jumlah data. Dalam contoh baris pertama di atas adalah 1 : 5 = 0.2, demikian seterusnya sampai selesai untuk setiap frekuensi.

2. Cari Kp (prosesntase kumulatif) dengan cara menjumlahkan

prosen tase kumulatif dengan prosentase di bawahnya, khusus untuk baris pertama nilai p langsung dipindahkan, untuk baris ke dua adalah 0,2 + 0.2 = 0.4, baris ke tiga 0.4 + 0.2 = 0.6, dan seterusnya.

(10)

3. Cari nilai Z_x dengan cara Skor Y dikurangi dengan Mean/nilai

rata-rata dibagi nilai Standar Deviasi, sebagai contoh untuk baris pertama adalah (7 – 15.4)/5.86 = - 1.43. untuk baris selanjutnya dihitung dengan cara yang sama.

4. Cari nilai Z tabel (Z_t) dengan melihat Tabel Kurva Normal baku (Tabel Z ) berdasarkan nilai Z_x –nya, contoh untuk baris pertama. Nilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai Z Nilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai Z sebesar 0.4236, karena nilai Z_x – nya bernilai minus maka nilai Z tabel yang diisikan adalah 0.5 - 0.4236 = 0.0764 (0.08). bila Z_x bernilai positif maka nilai Z tabel yang diisikan adalah ditambah 0.5.

(11)

5. Nilai a₁ diperoleh dengan cara menyelisihkan nilai Kp dengan nilai Z_t di bawahnya, sedang untuk baris pertama nilai Z_t langsung diisikan,

contoh untuk baris kedua nilai 0.08 diperoleh dengan cara 0.2 – 0.28 = -0.08 (yang dipakai nilai mutlaknya).

6. nilai a₂ diperoleh dengan menyelisihkan nilai Kp dengan nilai Z_tyang sejajar, contoh untuk baris pertama 0.2 – 0.08 = 0.12.

7. setelah selesai cari nilai a maksimum, diperoleh nilai 0.21, kemudian bandingankan dengan nilai tabel pada baris N = 5, pada tingkat

signifikansi 0.05 diperoleh nilai 0.565, karena a maksimum lebih kecil dari nilai D maksimum berarti distribusi normal.

(12)

Uji Kenormalan Shapiro-Wilk

Pengujian Shapiro-Wilk, yang diusulkan 1965,

mengkalkulasi suatu W statistik yang menguji apakah suatu sampel acak, x1, x2,..., xn mengikuti distribusi normal atau tidak. Nilai W yang kecil menunjukkan normal atau tidak. Nilai W yang kecil menunjukkan kenormalan dan persentase untuk W statistik,

formula ini ditemukanoleh Simulasi Monte Carlo , telah direproduksi oleh Pearson Dan Hartley.

Pengujian Shapiro-Wilk lebih baik dibandingkan dengan test yang lain.

(13)

W statistik dihitung sebagai berikut:

di mana x(i) adalah nilai-nilai sampel ( x(1) adalah

yang paling kecil) dan ai adalah nilai konstanta tetap yang diturunkan dari nilai rata-rata, perbedaan dan kovarians statistik sampel ukuran n dari suatu

(14)

Algoritma Shapiro Wilk

Procedure

Order the observations from low to high. Compute S² = (n-1)s²

where s² is the sample variance.

If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then

where a(n+i+1) for i = 1 to k, are found in tables. Compute the test statistic. W = b² / S²

(15)

Dalam ilmu statistika seringkali digunakan asumsi

dari bentuk data yang akan di analisis. Aasumsi yang lazim digunakan adalah data berdistribusi normal, dengan mean µ dapat digambarkan sebagai berikut: dengan mean µ dapat digambarkan sebagai berikut:

(16)

Dalam kenyataannya seringkali bentuk data yang

diperoleh tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan atau menjulur kekiri, seperti gambar berikut:

Curve B : Skewed Left Curve A :

(17)

Transformasi Data

Diperbolehkan untuk koreksi dari

ketidak-normalan yang disebabkan oleh skewness,

kurtosis, atau problem lainnya (kurang linearitas)

Tidak harus dilakukan jika nilai mengandung

meaningful scale

Jenis transformasi :

Square root – moderate violations

LOG – severe, dan

(18)

Agar asumsi bahwa data berdistribusi normal tetap dipenuhi maka perlu dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk satu angkatan data bila data yang akan ditransformasi hanya satu angkatan data. Untuk memilih fungsi transformasi yang tepat dapat digunakan tangga transformasi Tukey yang digambarkan sebagai berikut:

x x x x x x Log x x 10 1 1 ₂ ₃ 2 − − kekanan menjulur kiri ke menjulur Kuat sedang lemah lemah sedang Kuat

(19)

Tangga transformasi dapat dijelaskan sebagai berikut: Transformasi 10x _{akan membuat bentuk distribusi data}

menjadi menjulur kekanan secara kuat, sedangkan transformasi akan membuat bentuk distribusi data menjadi menjulur kekiri secara kuat.

Sebagai contoh jika kita memiliki data yang menjulur 2

1

x

−

Sebagai contoh jika kita memiliki data yang menjulur kekanan secara lemah maka kita dapat tranformasi

agar data menjadi normal

x

(20)

Transformasi

Untuk data yang skewnessnya positif (pelajari apakah

artinya condong ke kiri atau ke kanan) square root dan log akan membuat data tetap pada susunan aslinya tetapi

membawanya dalam sebaran, akan tetapi inverse akan membalik susunan data

membalik susunan data

Untuk data yang skewnessnya negatif (pelajari apakah

artinya condong ke kiri atau ke kanan) berlaku

kebalikannya; tanpa penyesuaian, square root dan log akan

membalik susunan sedangkan inverse membuatnya tetap pada susunan aslinya

(21)

Original Data

60 80 100 120

1

4

9

0 20 40 60 1 2 3 4 5 6

10

36

100

(22)

Square Root Transform

8 10 12

1

2

3

0 2 4 6 1 2 3 4 5 6

3 3.16227

8

6

10

(23)

Log Transform

1.5 2 2.5

0 0.60206

0.954243

0 0.5 1 1.5 1 2 3 4 5 6

0.954243

1 1.556303

2

(24)

Inverse Transform

0.8 1 1.2

1

0.25 0.111111

0 0.2 0.4 0.6 1 2 3 4 5 6

STATISTICS. Hanung N. Prasetyo WEEK 10 TELKOM POLTECH/HANUNG NP

STATISTICS

Uji Normalitas Distribusi

Kolmogorov Smirnov

Uji Kenormalan Shapiro-Wilk

Transformasi Data

Diperbolehkan untuk koreksi dari

ketidak-normalan yang disebabkan oleh skewness,

kurtosis, atau problem lainnya (kurang linearitas)

Tidak harus dilakukan jika nilai mengandung

Tidak harus dilakukan jika nilai mengandung

meaningful scale

Jenis transformasi :

x

Transformasi

Original Data

1

4

9

10

36

100

Square Root Transform

1

2

3

3

3.16227

8

6

10

Log Transform

0

0.60206

0.954243

0.954243

1

1.556303

2

Inverse Transform

1

0.25

0.111111

0.111111

0.1

0.027778

0.01