Variance
Variance berhubungan erat denganberhubungan erat dengan standard deviationstandard deviation, yaitu, yaitudigunakan untuk mengukur dandigunakan untuk mengukur dan mengetahui seberapa jauh bagaimana penyebaran data dalam distribusi data.
mengetahui seberapa jauh bagaimana penyebaran data dalam distribusi data. Dengan kata lainDengan kata lain digunakan
digunakanuntuk mengukur variabilitas datauntuk mengukur variabilitas data, dalam bahasa awam variance adalah, dalam bahasa awam variance adalahuntuk mengetahui untuk mengetahui tingkat keragaman dalam data
tingkat keragaman dalam data.. Semakin tinggi nilai variance berarti semakin bervariasi dan Semakin tinggi nilai variance berarti semakin bervariasi dan beragamberagam suatu data
suatu data. Untuk menghitung. Untuk menghitung variancevariance, harus diketahui terlebih dahulu, harus diketahui terlebih dahulu meanmean-nya, kemudian-nya, kemudian menjumlahkan kuadrat selisih dari tiap-tiap data terhadap
menjumlahkan kuadrat selisih dari tiap-tiap data terhadap meanmean tersebut. Secara numeric,tersebut. Secara numeric, variancevariance merupakan rata-rata dari kuadrat selisih data terhadap
merupakan rata-rata dari kuadrat selisih data terhadap meanmean..
Standard deviation
Standard deviation diperoleh dari akar daridiperoleh dari akar dari variancevariance dan digunakan untukdan digunakan untuk mengukur penyebaran datamengukur penyebaran data.. Standard deviation
Standard deviation dandan meanmean (rata-rata) lebih sering digunakan untuk mengetahui pola sebaran data,(rata-rata) lebih sering digunakan untuk mengetahui pola sebaran data, seperti contoh pola sebaran normal. Dalam sebaran normal, 68% data berart
seperti contoh pola sebaran normal. Dalam sebaran normal, 68% data berart i mean +/- 1 * sti mean +/- 1 * st andardandard deviation, dan 95% data berarti mean +/-
deviation, dan 95% data berarti mean +/- 2 * standard deviation. Di sini2 * standard deviation. Di sini standard deviationstandard deviation memiliki artimemiliki arti yang sama dengan
yang sama dengan standard error meanstandard error mean..
Standard deviation
Standard deviation merupakan salah satu dari beberapa ukuran penyebaran dalam statistika. Untukmerupakan salah satu dari beberapa ukuran penyebaran dalam statistika. Untuk menghitung
menghitung standard deviationstandard deviation dari populasi perlu diketahui terlebih dari populasi perlu diketahui terlebih dahuludahulu variancevariance dari populasidari populasi tersebut. Hal ini karena
tersebut. Hal ini karena standard deviationstandard deviation adalah akar kuadrat dariadalah akar kuadrat dari variancevariance. Tidak seperti. Tidak seperti variancevariance yang tidak mudah digunakan mengetaui
yang tidak mudah digunakan mengetaui tingkat variabilitas,tingkat variabilitas, standard deviationstandard deviation digunakan dengandigunakan dengan mudah untuk mengetahui penyebaran.
mudah untuk mengetahui penyebaran.
Misal ada data tinggi badan siswa (cm) dalam satu kelas seperti berikut ini: Misal ada data tinggi badan siswa (cm) dalam satu kelas seperti berikut ini: 151.65 152.46 152.63 152.91 154.22 155.83 156.06 156.14 156.44 151.65 152.46 152.63 152.91 154.22 155.83 156.06 156.14 156.44 156.67 157.14 157.60 157.74 158.07 158.82 158.98 159.94 161.34 156.67 157.14 157.60 157.74 158.07 158.82 158.98 159.94 161.34 161.67 161.79 162.68 162.71 164.83 165.58 165.65 167.70 168.07 161.67 161.79 162.68 162.71 164.83 165.58 165.65 167.70 168.07 168.45 169.01 179.68 168.45 169.01 179.68
Dari data tersebut diketahui bahwa
Dari data tersebut diketahui bahwa meanmean-nya adalah 160.42 dan-nya adalah 160.42 dan standar deviationstandar deviation adalah 6.24. Melaluiadalah 6.24. Melalui mean
mean dandan standard deviationstandard deviation dapat diketahui bahwa terdapat beberapa data yang berada di luardapat diketahui bahwa terdapat beberapa data yang berada di luar “standard”, “standard” dapat diketahui da
“standard”, “standard” dapat diketahui dariri meanmean +/-+/- standard deviationstandard deviation, yaitu 154.18 dan 166.66., yaitu 154.18 dan 166.66.
Seperti yang telah diketahui bahwa
Seperti yang telah diketahui bahwa variancevariance dandan standard deviationstandard deviation memiliki hubungan secaramemiliki hubungan secara matematis, yaitu
matematis, yaitu variancevariance merupakan kuadrat darimerupakan kuadrat dari standard deviationstandard deviation. Mengapa menggunakan kuadrat. Mengapa menggunakan kuadrat ? Pengkuadratan pada tiap-tiap selisih membuat nilai selisih tersebut menjadi positif (nilai negative ? Pengkuadratan pada tiap-tiap selisih membuat nilai selisih tersebut menjadi positif (nilai negative dapat mengurangi nilai pada
dapat mengurangi nilai pada variancevariance). Pengkuadratan ini juga menyebabkan nilai yang besar pada). Pengkuadratan ini juga menyebabkan nilai yang besar pada variance
variance, contoh 100^2 = 10.000 lebih besar , contoh 100^2 = 10.000 lebih besar daripada 50^2=2.500. Oleh karena itu secara praktek daripada 50^2=2.500. Oleh karena itu secara praktek yangyang paling mudah digunakan adalah
Istilah“standard error” dan “standard deviation” terkadang membingungkan. Namun sebenarnya ada hal pokok yang membedakan. Ilustrasinya sebagai berikut: Apabila kita ingin mengetahui variance populasi maka untuk menduganya digunakan variance sampel. Hal yang sama apabila melakukan pendugaan mean terhadap populasi maka kita menggunakan mean sample, selanjutnya dalam pendugaan tersebut kemungkinan nilai mean akan berbeda-beda untuk tiap sample. Perbedaan ini dapat menimbulkan variasi pada penduga mean. Variasi pada penduga itulah yang disebut sebagai standard error . Oleh karena dalam ilustrasi menggunakan penduga mean maka variasi penduga disebut sebagaistandard error mean. Dari masalah ini dapat diambil kesimpulan bahwa standard deviation mengukur variasi pengamatan, sedangkan standard error mengukur variasi penduga atau statistics.
Ilustrasi lain yang membedakan“standard error” dan “standard deviation” adalah sebagai berikut: Dalam suatu kelas berisi 40 murid melakukan ujian untuk mata pelajaran A.
-. Standard deviation score test adalah variasi nilai antara 40 murid tersebut yang melakukan ujian untuk mata pelajaran A.
-. Standard error score test adalah variasi nilai dari seorang murid bernama Ali yang melakukan ujian mata pelajaran A secara berulang-ulang (murid Ali melakukan ujian lebih dari satu kali).
Hal ini membuktikan bahwa memang pengertian standard deviation hampir sama dengan standard error, dan kebingungan dua istilah ini memang dapat dimaklumi.
Perhitungan standard error berbeda-beda tergantung pada penduganya, misal untuk mean menggunakan standard error mean (SE(mean)).Rumus SE(mean) adalah SE(mean) = Standar
deviation/√(sample size), ini menunjukkan bahwa nilai SE(mean) bergantung pada standard deviation dan ukuran sample. Dari rumus tersebut dapat diketahui pula bahwa nilai standard error akan turun apabila ukuran sample diperbanyak dan variance atau standard deviation sample dikurangi . Oleh karena itu, standard error dapat digunakan untuk menentukan dan mengontrol ukuran sample, hal ini berbeda dengan standard deviation yang nilainya tidak dipengaruhi ukuran sample.
Standard error dapat menunjukkan bagaimana tingkat fluktuasi dari penduga atau statistic. Standard error juga dapat diintepretasikan seberapa akurat penduga dalam menduga parameter.
Standard error dapat diaplikasikan dalam dua hal:
1. Nilai penduga atau statistic yang dibagi dengan standard error penduga akan menunjukkan apakah statistic sama dengan nol, kemudian nilai tersebut dibandingkan dengan nilai distribusi t. Berdasarkan beberapa literatur, rasio dari nilai penduga atau statistic dengan st andard error disebut dengan Wald Test, atau dalam beberapa aplikasi disebut dengan t-test.
2. Standard error sebagai bagian dari confidence interval. Untuk sample yang besar, 95% confidence interval diperoleh dari 1.96 x standard error penduga. Standard error yang digunakan untuk confidence interval adalah standard error mean (SE(mean)), dengan ketentuan sebagai berikut:
a. 90% CI -> mean +/- 1.64 SE(mean) b. 95% CI -> mean +/- 1.96 SE(mean) c. 99% CI -> mean +/- 2.58 SE(mean)
Contoh: Dalam sekumpulan cabe, diketahui mean untuk 64 cabe adalah 10 gram, standard deviasinya 2 gram. Standard error dari sampel tersebut, SE(mean) = 2/√64 = 0.25. 95% confidence interval dari mean adalah
95% CI = 10 +/- 1.96*0.25 = 10 +/- 0.49 = 9.51 hingga 10.49
Penggunaan lain dari standard error adalahtidak sebagai bagian dari penduga atau statistic tetapi bagian dari logaritma statistic . Sebagai contoh, model logistic regresion dihitung dari odds ratio data, tapi standard error bukan sebagai odds ratio melainkan sebagai log odds ratio. Dalam kondisi ini
diperlukan perhitungan secara komputer untuk mendapatkan confidence interval dalam log scale dan ditransformasi kembali ke skala asli.
Standard error dapat diketahui dari nilai confidence interval dan selang interval, dengan rumus: a. 90% -> standard error = interval /1.64
b. 95% -> standard error = interval /1.96 c. 99% -> standard error = interval /2.58
Contoh: Masih dalam sekumpulan cabe, kita ingin mengetahui berapa standard error dari cabe apabila kita ingin menduga 95% confidence interval dengan selang +/ - 0.5 gram. Standar errorr diperoleh dari SE(mean) = 0.5/1.96 = 0.26
Standard error dapat juga digunakan untuk menentukan ukuran sample secara sederhana, dengan rumus:n = (standard deviasi/standard error)^2, atau kuadrat dari pembagian standard deviasi dibagi standard error. Contoh: Sama seperti contoh di atas, kita ingin mengetahui berapa ukuran sample dari cabe apabila kita ingin menduga 95% confidence interval dengan selang +/ - 0.5 gram dengan standar error 0.26, standard deviasi 2. Ukuran contoh diperoleh dari n = (standard deviasi/standard error)^2 = (2/0.26)^2 = 7.69^2 = 59.1 = 60. Maka sample yang dibutuhkan sebanyak 60 cabe.
Confidence interval merupakan interval atau range nilai penduga (estimated value) dari populasi, nilai ini diperoleh dari sample yang dikumpulkan dari populasi tertentu. Confidence interval dapat diartikan pula sebagai penduga interval, apabila diinterpretasikan confidence interval berarti berapa persen (yang kita kehendaki) sample dari populasi yang berada dalam interval atau range parameter populasi.
Sebagai contoh: kita mengukur mean (rata-rata) tinggi badan siswa SMU sekolah X, sample yang kita ambil sebanyak 100 siswa. Agar hasilnya valid dan reliable (baca: validitas, reliabilitas, validitas dan reliabilitas) kita lakukan perhitungan tersebut berulang-ulang, katakanlah 50 kali pengambilan sample, dengan sample 100 siswa yang berbeda-beda. Setelah kita hitung mean tinggi badan siswa, maka hasilnya akan bermacam-macam, misalnya 164.5; 165 cm; 167.5 cm; 163 cm; 166 cm; 165,25 cm, dan seterusnya hingga kita memperoleh 50 mean. Dari contoh ini kita akan kesulitan mengukur
keakuratannya apabila menggunakan hanya menggunakan satu mean saja, meskipun mungkin salah satu dari 50 mean tersebut merupakan mean tinggi badan siswa SMU yang sebenarnya. Untuk itu dibutuhkan confidence interval , dengan menggunakan confidence interval dari mean, kita dapat mengetahui keakuratan penduga sampel tersebut dalam menduga parameter populasi.
Salah satu untuk melihat keakuratan interval pendugaan kita adalah dengan melihat confidence level nya. Seperti yang disebutkan di atas bahwa keakuratan dapat dilihat dari confidence level nya, semakin tinggi confidence level yang kita gunakan maka semakin akurat pendugaan yang dilakukan artinya apabila researcher menggunakan 100 % confidence level berarti seluruh nilai statistic (penduga) dalam pengambilan sample berada dalam nilai penduga parameter populasi atau statistic (penduga) yang diduga dari sample merupakan statistic pula bagi parameter populasi. Hal ini m enunjukkan bahwa kita tidak mentolerir kesalahan dalam pendugaan populasi. Namun karena pertimbangan ekonomis, waktu, tenaga, dan teknis yang sulit dilakukan maka 100 % confidence level jarang bahkan tidak pernah digunakan.
Confidence interval menggunakan persentase, maka yang digunakan antara 1 – 100 %. Confidence interval sering menggunakan confidence level (tingkat kepercayaan) 95% tapi dapat juga menggunakan 90%, 99% dan 99,9 % atau berapapun confidence level untuk populasi yang tidak diketahui.
Confidence interval dapat dihitung dengan rumus sederhana sebagai berikut:
Confidence level = Point estimate of population parameter +/- (confidence factor)(measure variability)(adjusting factor)
atau
Confidence level = Point estimate of population parameter +/- margin error
Measurement of skewness, ukuran ini digunakan untuk mengetahui bentuk sebaran data . Suatu sebaran dikatakan setangkup atau simetrik bila sebaran tersebut mempunyai sisi kanan dan kiri yang sama besar atau dapat dikatakan bahwa sebaran tersebut mempunyai simetri lipat sepanjang suatu sumbu tegak yang kedua sisinya dapat saling menutupi atau mempunyai bentuk simetris. Dalam sebaran simetris, kedudukan mean, median dan modus berada pada satu utitik. Sebaran simetris ini disebut j uga sebagai sebaran normal. Sebaran yang tidak setangkup atau simetris dikatakan menjulur.
Gambar sebaran simetris
Gambar sebaran menjulur positif (skewness to right )
Sebaran menjulur positif (skewness to right ) artinya dalam sebaran ini mean > median > modus, sedangkan sebaran menjulur negatif (skewness to left ) artinya dalam sebaran ini mean <> Untuk mengukur kemenjuluran (measurement of skewness) digunakan koefisien kemunjuluran Pearson, skewness = (mean
–
modus)/s, dimana s adalah simpangan baku, atau skewness = 3(mean-median)/s, dimana s adalah simpangan baku.Simpangan baku dapat digunakan untuk mengukur jarak r elative setiap hasil pengamatan ke pusat data. Sehingga dapat diketahui dalam kisaran k (k-1, 2, 3) simpangan baku berapa dari titik pusat. Dalam sebaran normal atau sebaran yang setangkup dimana mean=median=modus, terdapat aturan empiris yang menyatakan bahwa:
-. 68.27 % dari hasil pengukuran akan terletak dalam jarak 1 simpangan baku dari pusat atau dalam selang mean+/- s
-. 95.45 % dari hasil pengukuran akan terletak dalam jarak 2 simpangan baku dari pusat atau dalam selang mean+/-2 s
-. 99.73 % dari hasil pengukuran atau hamper seluruh pengamatan akan terletak dalam jarak 3 simpangan baku dari pusat atau dalam selang mean+/- 3s