• Tidak ada hasil yang ditemukan

STATISTICS. Hanung N. Prasetyo WEEK 10 TELKOM POLTECH/HANUNG NP

N/A
N/A
Protected

Academic year: 2021

Membagikan "STATISTICS. Hanung N. Prasetyo WEEK 10 TELKOM POLTECH/HANUNG NP"

Copied!
24
0
0

Teks penuh

(1)

Hanung N. Prasetyo

STATISTICS

Hanung N. Prasetyo WEEK 10

(2)

A. BEBERAPA CARA UJI NORMALITAS

1. RASIO SKEWNESS DAN RASIO KURTOSIS

Rasio Skewnwss = Nilai Skewnwss / S.E. Skewness Rasio Kurtosis = Nilai Kurtosis / S.E. Kurtosis

Jika Nilai Rasio Diantara - 2 s/d + 2  Sebarannya Bersifat Normal

2. UJI KOLMOGOROV SMIRNOV = UJI LILLIEFOR

Jika Nilai Prob. / Sig F > 5 %  Sebaran Bersifat Normal

Jika Nilai Prob. / Sig F < 5 %  Sebaran Bersifat Tidak Normal

3. UJI SHAPIRO WILK

Jika Nilai Prob. / Sig F > 5 %  Sebaran Bersifat Normal Jika Nilai Prob. / Sig F > 5 %  Sebaran Bersifat Normal

Jika Nilai Prob. / Sig F < 5 %  Sebaran Bersifat Tidak Normal

4. UJI Anderson-Darling 5. GAMBAR / PLOT

Histogram dengan Normal Curve Q-Q Plot

Pembentukan Garis Berdasarkan Nilai Z.

Jika Data Tersebar Di sekeliling Garis  Berdistribusi Normal

6. DETRENDED Q-Q PLOT

(3)

Untuk mengetahui apakah sebuah distribusi Normal atau mendekati Normal atau bisa dianggap Normal, bisa dilakukan beberapa prosedur:

1. Melakukan metode statistik tertentu, seperti Uji Kolmogorv-Smirnov, Uji Shapiro-Wilk dan

sebagainya.

2. Membuat Grafik dengan prosedur tertentu dan 2. Membuat Grafik dengan prosedur tertentu dan

mengamati pola plot atau grafik tersebut.

Pada kasus berikut dan hanya akan dijelaskan kedua metode tersebut.

(4)



Uji Normalitas Distribusi

Kolmogorov Smirnov

Metode Kolmogorov-Smirnov, yang merupakan uji kenormalan paling populer, didasarkan pada

nilai D yang didefinisikan sebagai berikut: nilai D yang didefinisikan sebagai berikut:

(5)

Pada hakekatnya D adalah nilai deviasi absolut maksimum antara Fn (x) dan F0 (x)

Nilai D ini selanjutnya dibandingkan dengan nilai D kritis untuk ukuran tes α.

Stephens memberikan

nilai kritis tersebut untuk berbagai kondisi pengujian nilai kritis tersebut untuk berbagai kondisi pengujian Untuk α = 1%, nilai D kritis adalah

1.035*(√n – 0.01 + 0.85/√n).

Sedangkan untuk α = 5% dan α = 10%, nilai D kritis

berturut-turut sebesar 0.895*(√n – 0.01 + 0.85/√n) dan

(6)

 Terdapat beberapa cara pengujian normalitas distribusi

yaitu menggunakan formula/prosedur Kolmogorov-Smirnov, Liliefors, dan Chi Square (X 2 )

 Untuk perhitungan normalitas distribusi, dimisalkan

terdapat sekelompok data dengan skala pengukuran terdapat sekelompok data dengan skala pengukuran interval dengan dua variabel bebas dan satu variabel terikat sebagai berikut :

(7)

X1 X2 Y

4 1 7

4 2 12

Tabel skor Variabel bebas (X) dan variabel terikat (Y)

9 8 17

12 8 20

(8)

Skor Y f p kp zx zt a1 A2 7 1 0.2 0.2 -1.43 0.08 0.08 0.12 12 1 0.2 0.4 -0.58 0.28 0.08 0.12 17 1 0.2 0.6 0.27 0.61 0.21 0.01

Dari tabel tersebut misalkan kita ingin menguji normalitas variabel Y , maka untuk memudahkan diperlukan tabel bantu sebagai berikut :

Tabel bantu Perhitungan Normalitas

17 1 0.2 0.6 0.27 0.61 0.21 0.01 20 1 0.2 0.8 0.78 0.79 0.19 0.01 21 1 0.2 1.0 0.96 0.83 0.03 0.17 77 5 1.0 - 0 - - -Mean = 15.4 SD = 5.86

(9)

Langkah-langkah perhitungan :

Setelah data dimasukan dalam kolom pertama dan dihitung

frekuensinya, kemudian dilakukan perhitungan sebagai berikut :

1. Cari prosentasi (p) dengan cara frekuensi (f) dibagi dengan

jumlah data. Dalam contoh baris pertama di atas adalah 1 : 5 = 0.2, demikian seterusnya sampai selesai untuk setiap frekuensi.

2. Cari Kp (prosesntase kumulatif) dengan cara menjumlahkan

prosen tase kumulatif dengan prosentase di bawahnya, khusus untuk baris pertama nilai p langsung dipindahkan, untuk baris ke dua adalah 0,2 + 0.2 = 0.4, baris ke tiga 0.4 + 0.2 = 0.6, dan seterusnya.

(10)

3. Cari nilai Zx dengan cara Skor Y dikurangi dengan Mean/nilai

rata-rata dibagi nilai Standar Deviasi, sebagai contoh untuk baris pertama adalah (7 – 15.4)/5.86 = - 1.43. untuk baris selanjutnya dihitung dengan cara yang sama.

4. Cari nilai Z tabel (Zt) dengan melihat Tabel Kurva Normal baku (Tabel Z ) berdasarkan nilai Zx –nya, contoh untuk baris pertama. Nilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai Z Nilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai Z sebesar 0.4236, karena nilai Zx – nya bernilai minus maka nilai Z tabel yang diisikan adalah 0.5 - 0.4236 = 0.0764 (0.08). bila Zx bernilai positif maka nilai Z tabel yang diisikan adalah ditambah 0.5.

(11)

5. Nilai a1 diperoleh dengan cara menyelisihkan nilai Kp dengan nilai Zt di bawahnya, sedang untuk baris pertama nilai Zt langsung diisikan,

contoh untuk baris kedua nilai 0.08 diperoleh dengan cara 0.2 – 0.28 = -0.08 (yang dipakai nilai mutlaknya).

6. nilai a2 diperoleh dengan menyelisihkan nilai Kp dengan nilai Ztyang sejajar, contoh untuk baris pertama 0.2 – 0.08 = 0.12.

7. setelah selesai cari nilai a maksimum, diperoleh nilai 0.21, kemudian bandingankan dengan nilai tabel pada baris N = 5, pada tingkat

signifikansi 0.05 diperoleh nilai 0.565, karena a maksimum lebih kecil dari nilai D maksimum berarti distribusi normal.

(12)

Uji Kenormalan Shapiro-Wilk

 Pengujian Shapiro-Wilk, yang diusulkan 1965,

mengkalkulasi suatu W statistik yang menguji apakah suatu sampel acak, x1, x2,..., xn mengikuti distribusi normal atau tidak. Nilai W yang kecil menunjukkan normal atau tidak. Nilai W yang kecil menunjukkan kenormalan dan persentase untuk W statistik,

formula ini ditemukanoleh Simulasi Monte Carlo , telah direproduksi oleh Pearson Dan Hartley.

Pengujian Shapiro-Wilk lebih baik dibandingkan dengan test yang lain.

(13)

 W statistik dihitung sebagai berikut:

 di mana x(i) adalah nilai-nilai sampel ( x(1) adalah

yang paling kecil) dan ai adalah nilai konstanta tetap yang diturunkan dari nilai rata-rata, perbedaan dan kovarians statistik sampel ukuran n dari suatu

(14)

Algoritma Shapiro Wilk

Procedure

 Order the observations from low to high.  Compute S² = (n-1)s²

 where s² is the sample variance.

 If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then  If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then

 where a(n+i+1) for i = 1 to k, are found in tables.  Compute the test statistic. W = b² / S²

(15)

 Dalam ilmu statistika seringkali digunakan asumsi

dari bentuk data yang akan di analisis. Aasumsi yang lazim digunakan adalah data berdistribusi normal, dengan mean µ dapat digambarkan sebagai berikut: dengan mean µ dapat digambarkan sebagai berikut:

(16)

Dalam kenyataannya seringkali bentuk data yang

diperoleh tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan atau menjulur kekiri, seperti gambar berikut:

Curve B : Skewed Left Curve A :

(17)

Transformasi Data



Diperbolehkan untuk koreksi dari

ketidak-normalan yang disebabkan oleh skewness,

kurtosis, atau problem lainnya (kurang linearitas)



Tidak harus dilakukan jika nilai mengandung



Tidak harus dilakukan jika nilai mengandung

meaningful scale



Jenis transformasi :

 Square root – moderate violations

 LOG – severe, dan

(18)

Agar asumsi bahwa data berdistribusi normal tetap dipenuhi maka perlu dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk satu angkatan data bila data yang akan ditransformasi hanya satu angkatan data. Untuk memilih fungsi transformasi yang tepat dapat digunakan tangga transformasi Tukey yang digambarkan sebagai berikut:

x x x x x x Log x x 10 1 1 2 3 2 − − kekanan menjulur kiri ke menjulur Kuat sedang lemah lemah sedang Kuat

(19)

Tangga transformasi dapat dijelaskan sebagai berikut: Transformasi 10x akan membuat bentuk distribusi data

menjadi menjulur kekanan secara kuat, sedangkan transformasi akan membuat bentuk distribusi data menjadi menjulur kekiri secara kuat.

Sebagai contoh jika kita memiliki data yang menjulur 2

1

x

Sebagai contoh jika kita memiliki data yang menjulur kekanan secara lemah maka kita dapat tranformasi

agar data menjadi normal

x

(20)

Transformasi

 Untuk data yang skewnessnya positif (pelajari apakah

artinya condong ke kiri atau ke kanan) square root dan log akan membuat data tetap pada susunan aslinya tetapi

membawanya dalam sebaran, akan tetapi inverse akan membalik susunan data

membalik susunan data

 Untuk data yang skewnessnya negatif (pelajari apakah

artinya condong ke kiri atau ke kanan) berlaku

kebalikannya; tanpa penyesuaian, square root dan log akan

membalik susunan sedangkan inverse membuatnya tetap pada susunan aslinya

(21)

Original Data

60 80 100 120

1

4

9

0 20 40 60 1 2 3 4 5 6

10

36

100

(22)

Square Root Transform

8 10 12

1

2

3

0 2 4 6 1 2 3 4 5 6

3

3.16227

8

6

10

(23)

Log Transform

1.5 2 2.5

0

0.60206

0.954243

0 0.5 1 1.5 1 2 3 4 5 6

0.954243

1

1.556303

2

(24)

Inverse Transform

0.8 1 1.2

1

0.25

0.111111

0 0.2 0.4 0.6 1 2 3 4 5 6

0.111111

0.1

0.027778

0.01

Gambar

Tabel skor Variabel bebas (X) dan variabel terikat (Y)
Tabel bantu Perhitungan Normalitas

Referensi

Dokumen terkait

Jika dari populasi tersebut diambil sampel berukuran n yang juga mengandung proporsi x/n dan sampel diambil berulang maka distribusi sampel proporsinya mempunyai

a) Umur, seseorang yang telah berumur 15 tahun ke atas baru disebut nelayan, dibawah umur tersebut walaupun ia turut melaut tidak disebut sebagai nelayan.. b) Pendidikan,

bahwa dalam rangka pelaksanaan ketentuan Pasal 8 Peraturan Daerah Kota Surabaya Nomor 5 Tahun 2008 tentang Kawasan Tanpa Rokok dan Kawasan Terbatas Merokok dan

Seluruh pihak yang terkait dalam proses procurement antara lain Unit Pelaksana Procurement, Pengguna Barang dan Jasa serta Penyedia Barang dan Jasa wajib dari waktu ke waktu

Untuk melindungi benih kacang hijau dari pengaruh kondisi lingkungan simpan yang tidak baik yaitu kelembaban relatif dan suhu tinggi dapat dilakukan dengan cara

Saran yang dapat disampaikan peneliti adalah untuk pemerintah Provinsi Jawa Timur dalam meningkatkan angka harapan hidup dan menurunkan angka kematian bayi dengan

Dari hasil penilaian panelis terhadap mie substitusi pisang ini ternyata terbalik dengan hasil penilaian warna dan aroma, dimana semakin banyak penambahan tepung pisang maka

Dengan kata lain salah satu faktor yang diakui sebagai aset tidak berwujud adalah Sumber Daya Manusia, dimana melalui upaya yang sedemikian rupa dilakukan perusahaan baik