• Tidak ada hasil yang ditemukan

Tujuan PENDAHULUAN. Latar Belakang

N/A
N/A
Protected

Academic year: 2021

Membagikan "Tujuan PENDAHULUAN. Latar Belakang"

Copied!
7
0
0

Teks penuh

(1)

PENDAHULUAN Latar Belakang

Saat ini, pembajakan perangkat lunak di Indonesia masih sangat tinggi. Berdasarkan hasil survei Business Software Alliance (BSA) dalam Kompas (2009), tingkat pembajakan perangkat lunak di Indonesia sebesar 84% pada tahun 2007. Indonesia menempati peringkat ke-12 negara pembajakan perangkat lunak di dunia dalam Fifth Annual Global Software Piracy Study untuk tahun 2007. Kondisi ini tentu saja merugikan negara terutama dalam hubungan bilateral perdagangan antara Indonesia dengan luar negeri.

Perangkat lunak untuk analisis statistika saat ini sangat banyak namun penggunaannya di Indonesia masih dilakukan secara ilegal. Salah satu upaya untuk mengurangi tingkat pembajakan perangkat lunak di Indonesia ialah mengembangkan perangkat lunak Statistika yang open source, salah satunya ialah R. R merupakan perangkat lunak untuk analisis statistika dan grafik yang dapat dikembangkan serta didistribusikan ulang secara bebas dengan dasar bahasa pemrograman S. R dikembangkan oleh AT&T’s Bell Laboratories. R terdiri dari paket-paket yang berisi fungsi-fungsi, data, dan dokumentasi dalam R. Ada dua jenis paket R yaitu paket standar yang harus ada dalam R dan paket yang dikembangkan oleh banyak ahli. Paket R dapat didownload secara gratis pada http://CRAN.R-project.org. Untuk membuat paket R di lingkungan Windows dibutuhkan perangkat lunak tambahan yaitu Perl, MinGW, HTML Help Workshop dan Tex. R dapat berjalan pada sistem operasi Unix, Windows, dan Mac. Saat ini, versi terakhir R ialah R 2.9.2 (Hornik, 2009).

Penggunaan R untuk analisis statistika di Indonesia masih sangat kurang karena perangkat ini tidak mudah digunakan khususnya bagi yang belum terlalu paham statistika dan pemrograman. Oleh karena itu, diperlukan pembuatan paket R dengan antarmuka yang user friendly sehingga memudahkan pengguna nonstatistisi dan nonprogramer untuk melakukan analisis statistika, yaitu statistika dasar, analisis regresi, analisis perancangan percobaan, analisis deret waktu, dan analisis multivariat. Penelitian ini difokuskan hanya pada paket statistika dasar dan analisis regresi linier yang merupakan satu-kesatuan dari empat karya ilmiah.

Tujuan

Penelitian ini bertujuan untuk menyusun dan mengembangkan paket R dalam analisis regresi linier dengan antarmuka user friendly bagi praktisi sehingga mudah digunakan.

Ruang Lingkup

Penelitian ini merupakan penyusunan paket R untuk analisis statistika yang mudah digunakan. Analisis statistika tersebut mencakup:

 Analisis statistika dasar meliputi ukuran lokasi, ukuran pemusatan dan penyebaran, statistika deskriptif, kovarian dan korelasi, uji kenormalan, dan inferensia dasar.  Statistika grafik

 Analisis regresi linier meliputi model/koefisien regresi, analisis ragam, uji parsial, uji asumsi, penentuan selang kepercayaan dan selang prediksi bagi dugaan respon, nilai VIF, sisaan, sisaan terstandarkan, dugan respon, indikator data berpengaruh (Leverages, Cook’s Distance, DFFITS, DFBETAS, dan COVRATIO), dan prosedur pemilihan peubah prediktor (stepwise, forward, dan backward).

 Analisis rancangan percobaan meliputi model RAL, RAK, RBSL, faktorial RAL, faktorial RAK, Split plot, uji asumsi, dan uji lanjut (BNT, BNJ, dan Duncan).  Analisis deret waktu mencakup plot deret

waktu, pemulusan, pemodelan ARIMA, dan uji asumsi.

 Analisis multivariat mencakup statistika dasar, uji kenormalan ganda, analisis komponen utama, analisis gerombol, analisis faktor, dan biplot.

Penelitian ini hanya difokuskan pada penyusunan paket R untuk menghitung dan menganalisis kovarian dan korelasi, uji kenormalan, dan analisis regresi linier.

TINJAUAN PUSTAKA Rekayasa Perangkat Lunak Rekayasa perangkat lunak ialah disiplin ilmu yang membahas semua aspek produksi perangkat lunak, mulai dari tahap awal spesifikasi sistem sampai pemeliharaan sistem setelah digunakan (Sommerville, 2003). Proses perangkat lunak ialah serangkaian kegiatan dan hasil-hasil relevannya yang menghasilkan perangkat lunak. Representasi abstrak yang merupakan penyederhanaan dari proses perangkat lunak disebut dengan model

(2)

proses perangkat lunak. Dalam Sommerville (2003), terdapat empat jenis model proses perangkat lunak yaitu model air terjun (waterfall), pengembangan evolusioner, pengembangan sistem formal, dan pengembangan berdasarkan pemakaian ulang.

Tahapan utama dalam pengembangan perangkat lunak model air terjun ialah: 1. Analisis dan definisi persyaratan.

Pelayanan, batasan, dan tujuan sistem ditentukan melalui konsultasi dengan pengguna sistem. Persyaratan ini kemudian didefinisikan secara rinci dan berfungsi sebagai spesifikasi sistem. 2. Perancangan sistem dan perangkat lunak.

Proses perancangan sistem membagi persyaratan dalam sistem perangkat keras atau perangkat lunak. Kegiatan ini menentukan arsitektur sistem secara keseluruhan. Perancangan perangkat lunak melibatkan identifikasi dan deskripsi abstraksi sistem perangkat lunak yang mendasar dan hubungan-hubungannya. 3. Implementasi dan pengujian unit.

Pada tahap ini, perancangan perangkat lunak direalisasikan sebagai serangkaian program atau unit program. Pengujian unit melibatkan verifikasi bahwa setiap unit telah memenuhi spesifikasinya.

4. Integrasi dan pengujian sistem.

Unit program atau program individual diintegrasikan dan diuji sebagai sistem yang lengkap untuk menjamin bahwa persyaratan sistem telah dipenuhi.

5. Operasi dan pemeliharaan.

Tahapan ini merupakan fase siklus hidup yang paling lama. Sistem dipasang dan dipakai. Pemeliharaan mencakup koreksi dari berbagai kesalahan yang tidak ditemukan pada tahap-tahap sebelumnya, perbaikan atas implementasi unit sistem dan pengembangan pelayanan sistem, sementara persyaratan-persyaratan baru ditambahkan.

Hubungan antar Dua Peubah Hubungan antar dua peubah dapat dilihat dari koefisien korelasinya. Korelasi merupakan nilai yang menunjukkan keeratan hubungan linier antara dua peubah (Aunuddin, 2005). Metode korelasi terdiri dari korelasi parametrik untuk peubah kontinu (berskala interval dan rasio) dan korelasi nonparametrik untuk peubah yang berskala ordinal. Metode korelasi parametrik yaitu korelasi Pearson sedangkan korelasi nonparametrik yaitu korelasi Spearman dan korelasi Kendall.

Korelasi Pearson

Data yang dihitung dalam korelasi Pearson merupakan contoh acak berukuran n berupa data berpasangan (x1,y1),…,(xn,yn) yang

sifatnya kontinu. Koefisien korelasi Pearson dihitung dengan rumus :

        n i i n i i n i i i y y x x y y x x r 1 2 1 2 1 y x, ) ( ) ( ) )( ( .

Menurut Aunuddin (2005), koefisien korelasi ini mempunyai sifat-sifat antara lain: 1. Tanpa satuan dan bebas terhadap satuan

pengukuran X dan Y.

2. Nilai rx,yberkisar antara -1 hingga +1.

3. Besar nilai |rx,y| menunjukkan keeratan

hubungan linier antara dua peubah. 4. Tanda nilai rx,y (positif atau negatif)

menunjukkan arah hubungan kedua peubah.

Semakin besar nilai |rx,y| atau mendekati 1

menunjukkan semakin kuat hubungan linier antar peubah tersebut.

Korelasi Spearman

Menurut Aunuddin (2005), korelasi Spearman umumnya digunakan pada nilai peringkat dari peubah X dan Y atau pengukuran pada peubah yang diteliti berskala ordinal. Data merupakan contoh acak berukuran n berpasangan (x1,y1),…,(xn,yn).

Jika Ridan Simerupakan peringkat dari

nilai-nilai pengamatan xidan yiyang berpasangan

maka korelasi Spearman dirumuskan sebagai :

        n i n i i i n i i i s S S R R S S R R r 1 1 1 ) ( ) ( ) )( ( atau

       n i n i i i n i i i s C S C R C S R r 1 1 2 2 1 ) ( ) ( dimana C=n(n+1)2/4.

Jika semua amatan berlainan satu sama lainnya maka dapat disederhanakan menjadi :

) ( ) ( 1 6 1 1 2 2    

n n S R r n i i i s .

(3)

Korelasi Kendall

Korelasi Kendall atau biasa disebut dengan Tau Kendall umumnya digunakan untuk data berukuran n berpasangan (x1,y1),…,(xn,yn) berskala ordinal. Nilai

statistik yang digunakan dalam Daniel (1990) ialah : 2 1 /) ( ˆ   n n S

jika ada amatan yang sama maka nilai statistiknya menjadi : y x nn T T n n S      ) ( ) ( ˆ 1 2 1 1 2 1  dimana ), ( 1 2 1

x x x t t T ) ( 1 2 1

y y y t t T

tx ialah jumlah amatan X yang sama pada

peringkat tertentu, ty ialah jumlah amatan Y

yang sama pada peringkat tertentu dan nilai S diperoleh dari prosedur berikut :

a. Urutkan amatan (Xi, Yi) pada sebuah

kolom mengikuti urutan nilai X dari yang terkecil hingga yang terbesar, X disebut terurut secara natural.

b. Bandingkan nilai Y pada suatu urutan dengan nilai Y di bawahnya, jika nilai Y di bawahnya lebih besar daripada nilai Y di atasnya maka disebut dengan terurut secara natural dan jika sebaliknya, nilai Y di bawahnya lebih kecil daripada nilai Y di atasnya maka disebut dengan terurut secara berkebalikan.

c. Misalkan P ialah banyaknya pasangan yang terurut secara natural dan Q adalah banyaknya pasangan yang terurut secara berkebalikan.

d. S = P – Q.

Analisis Regresi Linier Analisis Regresi

Analisis regresi merupakan alat statistika untuk mengevaluasi hubungan antara satu atau lebih peubah bebas X1,X2,…,Xk dengan

peubah tak bebas (Y) (Mattjik-Sumertajaya, 2002). Bentuk umum model regresi dengan k peubah bebas adalah sebagai berikut:

Yi= 0+ 1X1i+ 2X2i+ ... + kXki+ i

dengan :

Yi = peubah tak bebas

Xki = peubah bebas ke-i pada ulangan ke-k

εi = sisaan

βj = koefisien regresi.

Secara umum model regresi dapat dituliskan dalam notasi matriks sebagai berikut :

Y = X + .

Pendugaan koefisien regresi dilakukan menggunakan metode kuadrat terkecil yaitu dengan meminimumkan jumlah kuadrat sisaan. Pengujian hipotesis mengenai parameter persamaan regresi dilakukan melalui penguraian sumber-sumber keragaman model tersebut. Untuk melihat pengaruh masing-masing peubah bebas dilakukan uji-t terhadap nilai dugaan parameter regresi dengan hipotesis nol βi= 0

dan hipotesis alternatif βi≠ 0 atau βi> 0 atau

βi< 0. Nilai statistik yang digunakan ialah :

i b i

hitung

b

s

t

0

yang dibandingkan dengan sebaran t dengan derajat bebas n-2.

Pemilihan Model Regresi Terbaik

Ada beberapa indikator untuk menentukan model regresi terbaik. Indikator kebaikan model regresi tersebut diantaranya ialah nilai s, R2, R2adjusted, dan statistik Cp Mallows

(Rawlings, Pantula, dan Dickey, 1998). Statistik s merupakan akar kuadrat dari kuadrat tengah sisaan. Kuadrat tengah sisaan merupakan bagian keragaman peubah respon yang tidak mampu dijelaskan oleh model, sehingga semakin besar nilai s maka semakin besar pula keragaman peubah respon yang tidak mampu dijelaskan oleh model.

Statistik R2 atau koefisien determinasi

merupakan ukuran keragaman peubah respon yang mampu diterangkan oleh model. Rumus dari statistik ini ialah

JKT JKS JKT

JKR

R2 1

.

Semakin besar R2suatu model maka semakin

terandalkan model tersebut. Penambahan peubah penjelas baru dalam model dapat meningkatkan nilai R2 namun belum tentu

akan mengurangi keragaman sisaan jika pengurangan jumlah kuadrat sisaan karena penambahan peubah penjelas baru ini tidak sebanding dengan pengurangan derajat bebas sisaan. Pengembangan dari statistik R2 yang

mengakomodir besarnya derajat bebas sisaan ialah statistik R2 adjusted dengan formula :

) /( ) /( 1 1 2     n JKT p n JKS R

.

Statistik Cp Mallows ialah dugaan bagi

total kuadrat tengah sisaan pendugaan terbakukan (standardized total mean squared error of estimation) dari data dengan formula :

n p s JKSp p 2 ' C 2

.

(4)

JKSp adalah jumlah kuadrat sisaan dari

himpunan bagian model dengan p peubah penjelas dan s2adalah penduga bagi 2yang

berasal dari informasi di luar model atau dari model yang mengandung semua peubah penjelas. Jumlah kuadrat sisaan ialah penduga yang tak bias bagi (n-p’)2

dan nilai Cp

kira-kira akan sama dengan p’ jika modelnya layak.

Ada beberapa saran bagi kriteria nilai Cp

yang optimal. Mallows dalam Rawlings, Pantula, dan Dickey (1998) menyarankan untuk menggunakan model dengan nilai Cp

yang kecil dan dekat dengan p’ sedangkan Hocking menggunakan dua kriteria tergantung apakah model tersebut digunakan untuk prediksi peubah respon atau untuk pendugaan parameter. Untuk keperluan prediksi, Hocking dalam Rawlings, Pantula, dan Dickey (1998) menyarankan untuk menggunakan model dengan Cp  p’ sedangkan untuk pendugaan

parameter nilai Cpyang disarankan adalah Cp

 2p’ – t, dengan t adalah banyaknya peubah penjelas dalam model dengan semua peubah penjelas masuk dalam model.

Terdapat beberapa metode dalam pemilihan peubah bebas untuk menentukan model regresi terbaik diantaranya metode eliminasi langkah maju (forward selection), metode eliminasi langkah mundur (backward elimination), dan metode regresi bertatar (stepwise regression). Model diidentifikasi secara bertahap dengan memasukkan atau mengeluarkan peubah bebas (tergantung metode yang digunakan) yang mempunyai pengaruh yang besar terhadap jumlah kuadrat sisaan. Model yang terbaik dilihat dari indikator kebaikan modelnya seperti s, R2, R2

adjusted, dan statistik Cp Mallows.

a. Metode eliminasi langkah maju (forward selection)

Prosedur ini memilih himpunan bagian model dengan cara menambahkan satu per satu peubah penjelas pada model yang didapatkan pada langkah sebelumnya (Rawlings, Pantula dan Dickey, 1998). Peubah penjelas yang dimasukkan terlebih dahulu ialah peubah yang menerangkan keragaman respon paling besar yaitu peubah yang mempunyai korelasi terbesar terhadap peubah respon. Peubah terus ditambahkan ke dalam model sampai tidak ada lagi peubah yang berpengaruh terhadap peubah respon atau penambahan peubah baru tidak berpengaruh besar terhadap jumlah kuadrat sisaan. Model terakhir dipilih menjadi model yang terbaik.

b. Metode eliminasi langkah mundur (backward elimination)

Metode ini dimulai dengan regresi terbesar dengan menggunakan semua peubah dan secara bertahap mengurangi banyaknya peubah di dalam persamaan untuk mengurangi jumlah kuadrat sisaan. Peubah pertama yang dikeluarkan ialah peubah yang menerangkan keragaman respon paling kecil. Model terbaik ialah model yang peubah-peubah penjelasnya berpengaruh terhadap respon atau uji pasialnya signifikan pada taraf nyata tertentu.

c. Metode regresi bertatar (stepwise regression)

Metode ini merupakan kombinasi dari metode forward dan backward. Ide dari metode ini ialah peubah yang telah dimasukkan pada metode forward dapat menjadi tidak penting setelah ditambahkan peubah baru atau peubah yang telah dikeluarkan dari metode backward dapat menjadi penting setelah peubah penjelas lain dikeluarkan dari model. Prosedur ini dimulai dengan memasukkan peubah bebas yang paling berkorelasi ke dalam model kemudian dilakukan evaluasi terhadap peubah yang sudah ada di dalam model. Jika peubah dalam model setelah penambahan peubah baru tidak berpengaruh nyata terhadap peubah respon maka keluarkan peubah tersebut. Model terbaik dipilih jika tidak ada peubah yang dapat keluar dan masuk ke dalam model. Pencilan dan Amatan Berpengaruh

Pencilan ialah amatan yang nilai mutlak sisaannya lebih besar daripada sisaan-sisaan lainnya. Draper & Smith (1992) menyatakan bahwa suatu amatan dianggap pencilan jika nilai mutlak sisaan suatu amatan lebih besar dari tiga atau empat simpangan baku atau lebih jauh lagi dari rata-ratanya. Amatan berpengaruh ialah pengamatan yang nilai datanya jauh dari data lainnya yang memiliki pengaruh yang hampir sama besar dengan keseluruhan data lainnya. Pemeriksaan terhadap pengamatan berpengaruh dapat dilakukan pada unsur diagonal utama (hii)

matriks proyeksi X(X’X)-1X’. Belsley, Kuh,

and Welsch (1980) dalam Rawlings, Pantula, dan Dickey (1998) menyarankan menggunakan hii>2p’/n dengan p ialah jumlah

parameter regresi dan n ialah jumlah amatan untuk mengidentifikasi kemungkinan amatan berpengaruh. Ukuran pengaruh pengamatan lainnya dalam Rawlings, Pantula, dan Dickey

(5)

(1998) antara lain Cook’s Distance, DFFITS, DFBETAS, dan COVRATIO.

a. Cook’s Distance

Cook’s Distance digunakan untuk mengukur perubahan dalam ˆ jika suatu amatan dikeluarkan dari analisis. Cook’s Distance didefinisikan sebagai :

        ii ii i i rp hh D 1 2 '

dimana ri ialah sisaan terbakukan

ii i i h s e r   1 .

Suatu amatan berpotensi mempengaruhi

ˆ jika nilai Di> 4/n atau Di> F(α,p,n-p).

b. DFFITS

DFFITS menunjukkan ukuran perubahan

jika amatan ke-i tidak digunakan dalam pendugaan β. DFFITS didefinisikan sebagai : ii i i ii ii ii i i i i i h s e h h h s Y Y DFFITS            1 1 () ) ( ) ( ˆ ˆ

dimanaYˆi(i) ialah dugaan nilai tengah bagi

amatan ke-i dan s(i) ialah dugaan bagi σ

ketika amatan tidak digunakan dalam pendugaan β. Belsley, Kuh, and Welsch (1980) dalam Rawlings, Pantula, dan Dickey (1998) menyarankan jika |DFFITSi| > 2 p /' n maka amatan tersebut

berpotensi merupakan amatan berpengaruh.

c. DFBETAS

DFBETAS menunjukkan dampak amatan ke-i terhadap masing-masing dugaan koefisien regresi. DFBETAS didefinisikan sebagai : jj i i j j i c s DFBETAS () ˆ ˆ   

dimana cjj ialah elemen diagonal ke-(j+1)

dari matriks (X’X)-1. Jika |DFBETAS i| >

n

2 maka amatan tersebut berpotensi merupakan amatan berpengaruh menurut Belsley, Kuh, and Welsch (1980) dalam Rawlings, Pantula, dan Dickey (1998). d. COVRATIO

COVRATIO menunjukkan pengaruh amatan ke-i terhadap matriks ragam-peragam pada dugaan koefisien regresi yang dihitung dari perbandingan antara determinan dua matriks ragam-peragam. COVRATIO didefinisikan sebagai :

]) ' [ det( ]) ' [ det( () () () X X s X X s COVRATIO i i 2 i i 2  1 2 1 1                           ( ) ' ' ' * ii p i i nn pp nr p h COVRATIO

COVRATIO merefleksikan dampak amatan ke-i terhadap presisi pendugaan koefisien regresi. Belsley, Kuh, and Welsch (1980) dalam Rawlings, Pantula, dan Dickey (1998) menyarankan nilai COVRATIO yang berada di luar selang 1±(3p’/n) berpotensi menjadi amatan berpengaruh untuk meningkatkan atau mengurangi presisi penduga parameter regresi.

Multikolinieritas

Kolinear ganda (multikolinieritas) adalah hubungan linear yang kuat antara peubah-peubah bebas dalam persamaan regresi berganda. Untuk mendeteksi adanya masalah multikolinier dapat dilakukan dengan eksplorasi hubungan antar peubah penjelas, baik lewat plot pencaran maupun korelasi antar peubah penjelas. Cara lain dapat dilakukan dengan menghitung Variance Inflation Factor (VIF). Nilai VIF ini mengukur seberapa besar ragam dari dugaan koefisien regresi akan meningkat apabila antar peubah penjelas terdapat masalah multikolinier. Formula bagi VIF ini adalah sebagai berikut:

VIF = (1 – R2 i)-1

dimana R2

i merupakan koefisien determinasi

regresi antara peubah X ke-i sebagai peubah responnya dengan peubah X lainnya sebagai peubah penjelasnya. Nilai VIF = 1 menunjukkan tidak ada korelasi antar peubah penjelas. Myers (1989) menyatakan nilai VIF>10 mengindikasikan terdapatnya multikolinieritas.

Asumsi Analisis Regresi Linier

Asumsi-asumsi yang harus dipenuhi dalam analisis regresi linier adalah :

1. Sisaan menyebar normal dengan nilai tengah nol dan ragam konstan (εi~N(0,σ2))

2. Tidak ada autokorelasi antar sisaan (cov(εi,εj) = 0, i).

3. Sisaan saling bebas terhadap peubah bebas (cov (Xi, εj)=0,i).

Uji Kenormalan

Pemeriksaan kenormalan data dapat dilakukan secara eksplorasi melalui plot kuantil-kuantil maupun dengan pengujian formal. Secara umum, uji kenormalan dibedakan menjadi uji nonparametrik dan uji

(6)

parametrik. Uji kenormalan nonparametrik diantaranya yaitu uji Pearson chi-square, uji Kolmogorv-Smirnov, dan uji Cramer-von Mises. Uji kenormalan parametrik antara lain uji Shapiro-Wilk, uji Ryan-Joiner, dan uji Anderson-Darling. Hipotesis nol untuk uji kenormalan ini ialah data mengikuti sebaran normal dan hipotesis alternatifnya ialah data tidak mengikuti sebaran normal.

Uji Kenormalan Nonparametrik 1. Uji Pearson chi-square

Uji ini merupakan uji kenormalan tertua yang dikenalkan oleh Pearson pada tahun 1900 (Conover, 1980). Data yang diuji merupakan n amatan saling bebas dari peubah acak X numerik. Uji ini dilakukan dengan membagi n amatan ke dalam k kelas yang saling bebas dengan ni ialah jumlah amatan

yang masuk kelas ke-i dan pi ialah peluang

amatan masuk kelas ke-i. Statistik ini didefinisikan sebagai :

2 1 2

   n i i i i np np n

dimana npiialah jumlah amatan harapan yang

masuk kelas ke-i. Data menghampiri sebaran normal jika statistik uji (χ2) < χ2

(k-m-1) dengan

m ialah banyaknya parameter yang akan diduga.

Kelemahan dari uji ini ialah hasil yang diperoleh dipengaruhi oleh jumlah dan ukuran k kelas yang dipilih (Thode, 2002) serta tidak tepat digunakan jika jumlah amatan harapan terlalu kecil (Conover, 1980). Cochran dalam Conover (1980) menyarankan tidak ada jumlah amatan harapan kelas ke-i yang kurang dari 5. Uji ini kurang powerful dibandingkan dengan uji kenormalan lainnya.

2. Uji Kolmogorov-Smirnov

Uji Kolmogorv-Smirnov didasarkan pada perbedaan maksimum antara fungsi sebaran kumulatif normal dengan fungsi sebaran empiris. Data merupakan n amatan saling bebas dari peubah acak X numerik. Statistik uji yang digunakan :

| ) ( ) ( | sup S x F x D x 0  

dengan S(x) ialah sebaran kumulatif contoh dan F0(x) ialah sebaran kumulatif normal.

Data menghampiri sebaran normal pada taraf nyata α jika nilai D < D(1- α, n)pada tabel

nilai kritis uji Kolmogorov-Smirnov atau nilai-p lebih besar daripada taraf nyata (Daniel, 1990). Uji ini kurang powerful dibandingkan dengan uji yang berbasis fungsi sebaran kumulatif lainnya yaitu uji

Cramer-von Mises dan uji Anderson-Darling (Thode, 2002). Namun menurut Conover (1980), uji ini secara umum lebih powerful daripada uji Pearson chi-square.

3. Uji Cramer-von Mises

Uji ini berdasarkan pada fungsi sebaran empiris dengan statistik uji :

) ( )] ( ) ( [F x F x dF x n W2

n  0 2 0   

Untuk kepraktisan, bila n pengamatan x(i)

sudah diurutkan, maka rumus yang biasa dipakai : 2 1 2 2 1 2 12 1

         n i i in p n W ()

dimana p(i) ialah sebaran kumulatif normal

dengan modifikasi W2*= (1+0.5n) W2.

Nilai W2* dibandingkan dengan nilai kritis

pada tabel dan jika nilai-p hasil pengujian lebih besar dari taraf nyata maka disimpulkan data menghampiri sebaran normal. Stephens (1974) dalam Thode (2002) membandingkan uji ini dengan uji Kolmogorov-Smirnov dan Anderson-Darling. Hasil pengujian yaitu uji Cramer-von Mises tidak lebih baik dari uji Anderson-Darling tapi lebih baik jika dibandingkan dengan uji Kolmogorov-Smirnov.

Uji Kenormalan Parametrik 1. Uji Anderson-Darling

Uji Anderson-Darling merupakan uji berbasis fungsi sebaran kumulatif dengan statistik uji :

      n i i n i p p i n n A 1 1 1 2 - 2 1log log1 ( ) ( ) (

yang dimodifikasi oleh Stephens (1986a) dalam Thode (2002) menjadi A2*= (1.0 +

0.75/n + 2.25/n2)A2dimana p

(i)ialah sebaran

kumulatif normal. Nilai A2* dibandingkan

dengan nilai kritis pada tabel dan jika nilai-p hasil pengujian lebih besar dari taraf nyata maka disimpulkan data menghampiri sebaran normal. Uji ini merupakan uji yang paling powerful dibandingkan dengan uji Kolmogorov-Smirnov dan uji Cramer-von Mises (Thode, 2002).

2. Uji Shapiro-Wilk

Uji kenormalan Shapiro-Wilk didefinisikan sebagai :

             n i i i n i n i n i x x x x a W 1 2 2 2 1 1 1 ) ( ) ( () / ) ( ) (

(7)

dimana data terurut dari kecil ke besar X(1)≤X(2)≤…≤X(n) dan koefisien a1,a2,… ,an/2

diperoleh dari tabel uji Shapiro-Wilk. Data menghampiri sebaran normal jika W > Wtabel

atau nilai W mendekati 1. Uji ini relatif powerful dibandingkan dengan uji kenormalan lainnya. Uji ini juga mempunyai kekuatan uji yang relatif tinggi untuk data simetrik menjulur dengan ekor pendek dan data menjulur dengan ekor panjang dibandingkan dengan uji lain. Thode (2002) merekomendasikan uji ini untuk pengujian kenormalan data secara umum.

3. Uji Ryan-Joiner

Uji Ryan-Joiner merupakan modifikasi dari uji Shapiro-Wilk. Uji ini menghasilkan koefisien korelasi yang mengindikasikan hubungan antara data yang diuji dengan skor normal dari data tersebut. Jika korelasinya mendekati satu maka data tersebut menghampiri plot sebaran normal.

Statistik uji yang digunakan :

    2 2 2 1 x x z z R i iˆ

zi ialah skor normal dan  ialah penduga ˆ1 1

bagi model linier xi= 0+ 1zi+ ei.

Jika statistik uji kurang dari nilai kritis maka tolak H0 (Minitab Help, 2003).

Uji ini setara dengan uji Shapiro-Wilk. Simulasi yang dilakukan oleh Ryan & Joiner (1976) menunjukkan bahwa hanya ada perbedaan kecil kekuatan uji antara uji Ryan-Joiner dengan uji Wilk. Uji Shapiro-Wilk lebih baik dibandingkan dengan uji Ryan-Joiner untuk data menjulur dengan ekor pendek seperti menyebar uniform dan triangular sedangkan untuk data menjulur dengan ekor panjang seperti Cauchy dan normal yang dikontaminasi, uji Ryan-Joiner menunjukkan kekuatan uji yang lebih baik.

Uji Kebebasan Uji Durbin-Watson

Uji Durbin-Watson digunakan untuk mendeteksi korelasi serial tertentu (Draper & Smith, 1992) . Statistik uji yang digunakan :

     n u u n u u u e e e d 1 2 2 2 1) (

Kaidah pengambilan kesimpulan yaitu :  Untuk uji satu arah dengan hipotesis

alternatif ρ>0 maka jika d<dL tolak H0,

jika d>dU tidak tolak H0, dan jika dL≤d≤dU

pengujian tidak konklusif pada taraf nyata α.

 Untuk uji satu arah dengan hipotesis alternatif ρ<0 maka jika 4-d<dLtolak H0,

jika 4-d>dU tidak tolak H0, dan jika dL

≤4-d≤dUpengujian tidak konklusif pada taraf

nyata α.

 Untuk uji dua arah dengan hipotesis alternatif ρ≠0 maka jika d<dLatau 4-d<dL

tolak H0, jika d>dUatau 4-d>dUtidak tolak

H0, dan jika dL≤d≤dU atau dL≤4-d≤dU

pengujian tidak konklusif pada taraf nyata α.

Uji Runtunan

Uji runtunan ialah uji nonparametrik untuk melihat keacakan data. Hipotesis yang diuji ialah

H0 : data mempunyai pola yang acak

H1 : data mempunyai pola yang tidak acak

atau tidak saling bebas.

Statistik ujinya ialah u yaitu jumlah runtunan dengan , 1 2 2 1 2 1   n n n n) ( ) ( ) ( 1 2 2 2 1 2 2 1 2 1 2 1 2 1 2       n n n n n n n n n n

µ dan σ2 merupakan nilai tengah dan ragam

bagi sebaran u yang diskret.

  ) ( 2 1    u z

Nilai z merupakan suatu simpangan normal dengan n ialah jumlah ukuran contoh, n1ialah

jumlah amatan tipe satu, dan n2ialah jumlah

amatan tipe lainnya.

Data berpola acak pada taraf nyata α jika nilai-p pada tabel uji runtunan lebih besar dari taraf nyata α untuk statistik uji u, n1, dan n2.

Menurut Draper & Smith (1992), uji ini cukup baik digunakan jika n1>10 dan n2>10.

METODOLOGI

Pembuatan paket R ini mengikuti kaidah rekayasa perangkat lunak dengan model air terjun (waterfall) melalui tahapan-tahapan sebagai berikut:

1. Analisis dan identifikasi kebutuhan sistem. Analisis ini bertujuan untuk melihat kebutuhan pengguna meliputi batasan, tujuan, masukan, dan keluaran dari perangkat lunak. Tahapan ini dilakukan dengan menggali informasi yang dibutuhkan dari perangkat lunak yang

Referensi

Dokumen terkait

62 Gambar 4.48 Diagram Lingkaran Alasan mengapa tidak setuju dengan rencana KA Komuter rute Sidoarjo- Mojokerto terhadap Responden Pengguna Angkutan Umum

memiliki perempuan lain selain Penggugat, dan dari hubungannya dengan perempuan lain tersebut, Tergugat sudah dikaruniai seorang anak.Sejak itulah sering

Penelitian bertujuan untuk mengetahui pengaruh penggunaan bahan fillter berbeda yang merupakan zeolit dan bioball dalam ikan pemeliharaan media nila (Oreochromis

Perhitungan dengan metode Admiralty saat ini dapat dilakukan dengan bantuan komputer dimana masalah tabel yang semula terbatas untuk data sampai dengan tahun 2000 telah dapat

Berdasarkan pendekatan informasi etnobotani (Farnsworth, 1996) yang diasumsikan kulit akar tumbuhan Awar-awar mengandung senyawa antibakteri, kandungan senyawa

Model pendekatan kooperatif yang paling sederhana dalam pembelajaran kooperatif adalah model Student Team achievment Division (STAD). Berdasarkan observasi pada hari

Ekosistem merupakan kesatuan antara komponen biotik dan abiotik. Jadi, di dalam ekosistem terdapat interaksi antara produser, konsumen, pengurai dan benda seperti tanah, air,

Dari hasil anamnesa ini gambaran lesi mirip mucocele dan hasil AJH dari dokter yang merujuk adalah benigna cystic lesion yang condong ke mucocele, namun dari hasil