Analisa Data: Statistik
Tjipto Juwono, Ph.D.
October 31, 2017
Riset
Riset
Sebagian dari Riset
1 Rumusan masalah: Memuat variabel-variabel yang diteliti dan ekspektasi mengenai hubungan antara variabel-variabel itu
2 Pengolahan data untuk membuktikan hubungan antar variabel-variabel itu. Di sinilah statistik bisa berperan.
Riset
Experimental Design
Bagaimana anda merancang experiment sehingga data-data yang anda peroleh akan dapat memperlihatkan hubungan-hubungan antar variabel-variabel sebagaimana ekspektasi anda.
Riset
Experimental Design
Peneliti perlu mendesain risetnya supaya semua variabel (bebas, independen, dll) dapat terkendali sehingga tingkat kepastian jawaban jauh lebih terkendali juga.
1 Benarkah variabel bebas yang diteliti menyebabkan perubahan pada variabel dependen?
2 Benarkah variabel-variabel yang diteliti mempunyai hubungan yang logis dan asimetris?
3 Apakah ada bias dari variabel-variabel lain yang tidak diteliti?
Riset
Experimental Design
Salah satu bagian penting dari experimental design adalah:
sampling. Mengapa mengambil sample? Mengapa tidak mempelajari seluruh populasi?
1 Terlalu mahal
2 Obyek yang diteliti mungkin akan rusak
3 Mustahil untuk meneliti seluruh populasi
4 Tidak perlu
Bagaimana menentukan ukuran sample? (a) Berdasarkan pengalaman, (b) Berdasarkan rumus. Ada sejumlah rumus yang dapat dipakai. Rumus yang dipakai bergantung pada karakteristik
Ukuran Sample
Contoh rumus untuk menghitung ukuran sample, rumus Slovin
n = N
1 + Ne2
dengan: n: ukuran sample, N: ukuran populasi, e: level of significance
Contoh
Jumlah penduduk Jakarta: 11 juta, e=0.05, maka n=400.
catatan: Rumus ini dipakai jika statistik bersifat non-parametrik, kita tidak mengetahui perilaku dari populasi, tidak ada informasi tentang distribusi probabilitas dari populasi. Jelaslah bahwa rumus ini bukanlah rumus yang terbaik yang pernah ada. Tetapi manfaat (atau kesia-siaan) dari rumus ini akan terlihat dari hasilnya.
Ukuran Sample
Contoh rumus untuk menghitung ukuran sample
n = Z2pq e2
dengan: n: ukuran sample, Z : titik kritis, e: akurasi, p:
variabilitas, q = 1 − p.
Contoh:
n = 1.962(50 × 50) 102
= 96
Statistik
Setelah semua data telah diperoleh melalui desain eksperimen yang baik (termasuk ukuran sample yang tepat) maka kita dapat
melakukan uji statistik.
Statistik
Statistik adalah sains tentang pengumpulan, organisasi, analisa, interpretasi dan presentasi data
1 statistik deskriptif
2 statistik inferensial
Di dalam riset yang anda lakukan, pada dasarnya anda melakukan statistik inferensial. Tetapi tentu saja anda harus melakukan juga statistik deskriptif untuk memahami dan memperoleh gambaran umum dari data yang anda gunakan.
Uji Hipotesa
Bagaimana anda menggunakan statistik inferensial untuk menguji apakah variabel-variabel independen yang anda teliti memang memberikan pengaruh yang signifikan pada variabel dependen?
Jawab: Uji Hipotesa.
Anda akan membuat dua hipotesa:
Hipotesa Null: Jika tidak ditolak, maka berarti variabel yang anda teliti tidak berpengaruh secara signifikan
Hipotesa Alternatif: Jika tidak ditolak, maka berarti variabel yang anda teliti berpengaruh secara signifikan
Uji Hipotesa
Dalam melakukan uji hipotesa ini, anda harus terlebih dahulu mengetahui statistik yang mana yang anda gunakan dalam riset ini. Apakah statistik-Z? Statistik-t? Statistik-F? Statistik non-parametrik? Dan sebagainya. Pemilihan statistik ini
berdasarkan pada jenis variabel yang anda gunakan, dan informasi tentang perilaku populasi yang anda ketahui (atau anda tidak ketahui).
Uji Hipotesa
Contoh uji statistik parametrik:
Uji hipotesa satu sampel, Z atau t Uji hipotesa dua sampel, Z atau t ANOVA
Contoh uji statistik non-parametrik:
Chi-square Mann Whitney Wilcoxon Kruskal-Wallis
Validitas dan Reliabilitas
Validitas: Sejauh mana suatu alat ukur mampu mengukur apa yang ingin diukur. Contoh: Pearson Correlation Reliabilitas: Sejauh mana hasil pengukuran dari suatu alat ukur
itu akan tetap konsisten apabila dilakukan pengukuran gejala yang sama dua kali atau lebih dengan alat ukur yang sama. Contoh: Alpha Cronbach
t-distribution: Sebelum vs Sesudah
Studi Kasus 1
Di sebuah perusahaan asuransi, diketahui bahwa biaya rata-rata untuk memproses suatu klaim adalah $60. Perusahaan kemudian menerapkan prosedur baru yang diharapkan akan mengurangi biaya pemrosesan. Selanjutnya setelah penerapan metode itu, diambil sampel 26 klaim, yang hasilnya:
45 49 62 40 43 61 48 53 67 63 78 64 48 54 51 56 63 69 58 51 58 59 56 57 38 76
Pada α = 0.01 dapatkah diambil kesimpulan bahwa ada penurunan biaya pemrosesan?
t-distribution: Sebelum vs Sesudah
Langkah-langkah penyelesaian 1. Hypothesis
H0 : µ ≥ $60 H1 : µ < $60
2. Level of Significance: α = 0.01 3. Test Statistic
t = X¯ − µ s/√
n 4. Decision Rule: H0 ditolak jika t < −2.485 5. Keputusan:
t = X¯ − µ s/√
n = 56.42 − 60 10.04√
26 = −1.818 H0 tidak ditolak.
t-distribution: membandingkan dua metode
Studi Kasus 2
Sebuah alat dapat dirakit dengan menggunakan dua metode, A dan B. Diperoleh hasil (dalam satuan menit):
Metode A: 2 4 9 3 2 Metode B: 3 7 5 8 4 3
Pada α = 0.01 tentukan apakah ada perbedaan signifikan antara hasil-hasil dari dua metode itu!
t-distribution: membandingkan dua metode
Langkah-langkah penyelesaian 1. Hypothesis
H0 : µ1= µ2 H1 : µ16= µ2
2. Level of Significance: α = 0.01 3. Test Statistic
t = X¯1− ¯X2
q sp2(n1
1 +n1
2)
4. Decision Rule: H0 ditolak jika −1.833 < t < 1, 833 5. Keputusan:
thitung= −0.662 H0 tidak ditolak.
Sign Test: Sebelum dan Sesudah
Studi Kasus 3
15 orang karyawan dipilih untuk mengikuti training program.
Sebelum training mereka ditest dan diberi label ”poor”, ”fair”,
”good”, ”excellent”, ”outstanding”. Sesudah training, mereka kembali ditest dan diberi label. Pertanyaan: apakah training itu berhasil meningkatkan kemampuan karyawan?
Sign Test: Sebelum dan Sesudah
Figure 1: Hasil training
Sign Test: sebelum dan sesudah
Langkah-langkah penyelesaian 1. Hypothesis
H0 : π ≤ 0.5 H1 : π > 0.5
2. Level of Significance: α = 0.1 3. Test Statistic: Jumlah tanda plus
4. Decision Rule: Jika jumlah sukses lebih kecil daripada jumlah sukses yang diperoleh dari cumulative probability pada distribusi binomial untuk n=14, π = 0.5, α = 0.1
5. Keputusan:
Dari tabel: Jumlah sukses yang sesuai dengan α = 0.1 adalah 10.
Sedangkan, jumlah sukses pada pelatihan adalah 11
Sign Test: Sebelum dan Sesudah
Figure 2: Tabel Binomial
Sign Test: Sebelum dan Sesudah
χ
2test: apakah ada perbedaan antara satu item dan lainnya?
Studi Kasus 4
120 pengunjung sebuah restoran dipilih secara acak, dan ditanya apa makanan favorit mereka. Diperoleh hasil:
Chicken 32 Fish 24 Meat 35 Pasta 29
Dapatkah disimpulkan bahwa tidak ada perbedaan pilihan antara satu jenis makanan dan jenis lainnya?
χ
2test: apakah ada perbedaan antara satu item dan lainnya?
Figure 4: Distribusi Binomial
χ
2test: apakah ada perbedaan antara satu item dan lainnya?
Langkah-langkah penyelesaian 1. Hypothesis
H0 : Tidak ada perbedaan pilihan antara satu makanan dan lainnya.
H1 : Ada perbedaan pilihan antara satu makanan dan lainnya.
2. Level of Significance: α = 0.05 3. Test Statistic
χ2 =X (f0− fe)2 f0
χ
2test: apakah ada perbedaan antara satu item dan lainnya?
Langkah-langkah penyelesaian 4. Decision Rule:
Jika χ2hitung > 7.815 maka H0 ditolak.
5. Keputusan:
χ2hitung= 2.20 < 7.815 H0 diterima.
One Way Anova
Studi Kasus 1
Seorang mahasiswa ingin mengetahui apakah ada perbedaan kinerja dari tiga merek ponsel (Asus, Lenovo, Samsung) menurut persepsi para responden di Surya University. Kuesioner disebarkan pada sampel 20 orang mahasiswa untuk setiap merek ponsel, sehingga total responden menjadi N = 60 orang.
One Way Anova
Jumlah pertanyaan yang diajukan ada 4 pertanyaan, yaitu:
1 Bagaimana kecepatan load aplikasi pada ponsel anda?
2 Bagaimana aplikasi berjalan pada ponsel anda?
3 Bagaimana kualitas kamera pada ponsel anda?
4 Bagaimana kualitas batere pada ponsel anda?
One Way Anova
Untuk setiap pertanyaan, jawabannya berupa skala: (5)=Sangat Memuaskan, (4)=Memuaskan, (3)=Cukup, (2)=Tidak
Memuaskan, (1)=Sangat Tidak Memuaskan. Jawaban untuk keempat pertanyaan dijumlahkan sehingga untuk setiap responden diperoleh angka pada kisaran antara 4 s/d 20.
One Way Anova
Hipotesa
H0 : Tidak ada perbedaan nilai rata-rata kinerja yang signifikan antara ponsel Asus, Lenovo, dan Samsung.
H1 : Terdapat perbedaan nilai rata-rata kinerja yang signifikan antara ponsel Asus, Lenovo dan Samsung.
One Way Anova
Hipotesa
H0 : ¯X1 = ¯X2 = ¯X3
H1 : ¯X1 6= ¯X2 6= ¯X3
One Way Anova
Hipotesa
Tentukan Level of Significance, α = 0.01 Fhitung≤ Ftabel, maka H0 diterima Fhitung> Ftabel, maka H1 diterima
One Way Anova
Hasil Kuesioner:
Responden Asus Lenovo Samsung
1 18 16 18
2 19 19 18
3 17 15 15
4 20 20 16
5 15 15 16
6 20 20 20
7 18 18 14
8 18 15 15
9 18 16 16
10 16 16 18
One Way Anova
Responden Asus Lenovo Samsung
11 15 15 16
12 15 15 15
13 15 15 14
14 14 17 15
15 16 16 16
16 18 18 16
17 18 18 18
18 15 15 18
19 16 16 20
20 14 14 20
One Way Anova
Source Sum of Squares df MS F
of Variation
Treatements SST k-1 SST/(k-1)=MST F=MST/MSE
Error SSE n-k SSE/(n-k)=MSE
—– —–
Total SS Total n-1
One Way Anova
Global Average ¯XG =P X /N Treatment Average ¯XC =P XC/NC
SS Total = P(X − ¯XG)2 SSE = P(X − ¯XC)2 SST = SS Total - SSE, or:
SST = P( ¯Xc− ¯XG)2
One Way Anova
Source Sum of Squares df MS F
of Variation
Treatements 1.03 2 0.52 F=0.148
Error 198.9 57 3.48
—– —–
Total 199.93 59
Fhitung=0.148 Ftabel=4.14
Fhitung < Ftabel, H0 diterima.
Two Way Anova
Studi Kasus 2
Seorang mahasiswa ingin mengetahui apakah merek air mineral berpengaruh pada penjualan, dan apakah ukuran kemasan juga berpengaruh pada penjualan. Mahasiswa itu mengumpulkan data penjualan untuk satu bulan dan ditabelkan berdasarkan ukuran dan merek.
Two Way Anova
Hipotesa
H0a: Tidak ada perbedaan signifikan rata-rata penjualan berdasarkan merek.
H1a: Terdapat perbedaan signifikan rata-rata penjualan berdasarkan merek.
H0b: Tidak ada perbedaan signifikan rata-rata penjualan berdasarkan ukuran.
H1b: Terdapat perbedaan signifikan rata-rata penjualan berdasarkan ukuran.
Two Way Anova
Ukuran Merek A Merek B Merek C Merek D
Kecil 1500 1350 1650 1500
Sedang 1750 1450 1750 1400
Besar 1700 1500 1600 1450
Two Way Anova
Source SS df MS F
of Var.
Treatements SST k-1 SST/(k-1)=MST MST/MSE
Blocks SSB b-1 SSB/(b-1)=MSB MSB/SSB
Error SSE (k-1)(b-1) SSE/(k-1)(b-1)=MSE
—– —–
Total SS Total n-1
Two Way Anova
Global Average ¯XG =P X /N Treatment Average ¯XC =P XC/NC
Block Average ¯Xb =P Xb/Nb SS Total = P(X − ¯XG)2 SSB = kP( ¯Xb− ¯XG)2 SST = P( ¯Xc− ¯XG)2 SSE = SS Total - SST -SSB
Two Way Anova
Source SS df MS F
of Var.
Treatements 141667 3 47.22 6.018 Blocks 16250 2 8.125 1.0353
Error 47083 6 7.847
—– —–
Total 205000 11
Treatements: Fhitung = 6.018, Ftabel = 4.53, H1 diterima Block: Fhitung = 1.0353, Ftabel = 5.14, H0 diterima
Statistik Non Parametrik
Beberapa Contoh kasus:
Apakah selera terhadap rasa mie instant (kari ayam, soto, dll) bergantung pada etnis seseorang (jawa, batak, dll)?
(Menggunakan Chi-square).
Apakah ada perbedaan antara rating produk sabun (Lux, Sunsilk, Clear, dll) pada iklan di TV dan iklan di Radio?
(Menggunakan uji-Z)
Apakah ada perbedaan signifikan nilai UAS mahasiswa siang dan mahasiswa malam (Spearman Correlation Coeff.) Membandingkan dua merek minuman energi (A dan B).
Responden ditanya apakah mereka setuju minuman A dapat meningkatkan energi atau tidak, demikian pula minuman B.
(Chi-square).