Analisa Data: Statistik

(1)

Analisa Data: Statistik

Tjipto Juwono, Ph.D.

October 31, 2017

(2)

Riset

(3)

Riset

Sebagian dari Riset

1 Rumusan masalah: Memuat variabel-variabel yang diteliti dan ekspektasi mengenai hubungan antara variabel-variabel itu

2 Pengolahan data untuk membuktikan hubungan antar variabel-variabel itu. Di sinilah statistik bisa berperan.

(4)

Riset

Experimental Design

Bagaimana anda merancang experiment sehingga data-data yang anda peroleh akan dapat memperlihatkan hubungan-hubungan antar variabel-variabel sebagaimana ekspektasi anda.

(5)

Riset

Experimental Design

Peneliti perlu mendesain risetnya supaya semua variabel (bebas, independen, dll) dapat terkendali sehingga tingkat kepastian jawaban jauh lebih terkendali juga.

1 Benarkah variabel bebas yang diteliti menyebabkan perubahan pada variabel dependen?

2 Benarkah variabel-variabel yang diteliti mempunyai hubungan yang logis dan asimetris?

3 Apakah ada bias dari variabel-variabel lain yang tidak diteliti?

(6)

Riset

Experimental Design

Salah satu bagian penting dari experimental design adalah:

sampling. Mengapa mengambil sample? Mengapa tidak mempelajari seluruh populasi?

1 Terlalu mahal

2 Obyek yang diteliti mungkin akan rusak

3 Mustahil untuk meneliti seluruh populasi

4 Tidak perlu

Bagaimana menentukan ukuran sample? (a) Berdasarkan pengalaman, (b) Berdasarkan rumus. Ada sejumlah rumus yang dapat dipakai. Rumus yang dipakai bergantung pada karakteristik

(7)

Ukuran Sample

Contoh rumus untuk menghitung ukuran sample, rumus Slovin

n = N

1 + Ne²

dengan: n: ukuran sample, N: ukuran populasi, e: level of significance

Contoh

Jumlah penduduk Jakarta: 11 juta, e=0.05, maka n=400.

catatan: Rumus ini dipakai jika statistik bersifat non-parametrik, kita tidak mengetahui perilaku dari populasi, tidak ada informasi tentang distribusi probabilitas dari populasi. Jelaslah bahwa rumus ini bukanlah rumus yang terbaik yang pernah ada. Tetapi manfaat (atau kesia-siaan) dari rumus ini akan terlihat dari hasilnya.

(8)

Ukuran Sample

Contoh rumus untuk menghitung ukuran sample

n = Z²pq e²

dengan: n: ukuran sample, Z : titik kritis, e: akurasi, p:

variabilitas, q = 1 − p.

Contoh:

n = 1.96²(50 × 50) 10²

= 96

(9)

Statistik

Setelah semua data telah diperoleh melalui desain eksperimen yang baik (termasuk ukuran sample yang tepat) maka kita dapat

melakukan uji statistik.

Statistik

Statistik adalah sains tentang pengumpulan, organisasi, analisa, interpretasi dan presentasi data

1 statistik deskriptif

2 statistik inferensial

Di dalam riset yang anda lakukan, pada dasarnya anda melakukan statistik inferensial. Tetapi tentu saja anda harus melakukan juga statistik deskriptif untuk memahami dan memperoleh gambaran umum dari data yang anda gunakan.

(10)

Uji Hipotesa

Bagaimana anda menggunakan statistik inferensial untuk menguji apakah variabel-variabel independen yang anda teliti memang memberikan pengaruh yang signifikan pada variabel dependen?

Jawab: Uji Hipotesa.

Anda akan membuat dua hipotesa:

Hipotesa Null: Jika tidak ditolak, maka berarti variabel yang anda teliti tidak berpengaruh secara signifikan

Hipotesa Alternatif: Jika tidak ditolak, maka berarti variabel yang anda teliti berpengaruh secara signifikan

(11)

Uji Hipotesa

Dalam melakukan uji hipotesa ini, anda harus terlebih dahulu mengetahui statistik yang mana yang anda gunakan dalam riset ini. Apakah statistik-Z? Statistik-t? Statistik-F? Statistik non-parametrik? Dan sebagainya. Pemilihan statistik ini

berdasarkan pada jenis variabel yang anda gunakan, dan informasi tentang perilaku populasi yang anda ketahui (atau anda tidak ketahui).

(12)

Uji Hipotesa

Contoh uji statistik parametrik:

Uji hipotesa satu sampel, Z atau t Uji hipotesa dua sampel, Z atau t ANOVA

Contoh uji statistik non-parametrik:

Chi-square Mann Whitney Wilcoxon Kruskal-Wallis

(13)

Validitas dan Reliabilitas

Validitas: Sejauh mana suatu alat ukur mampu mengukur apa yang ingin diukur. Contoh: Pearson Correlation Reliabilitas: Sejauh mana hasil pengukuran dari suatu alat ukur

itu akan tetap konsisten apabila dilakukan pengukuran gejala yang sama dua kali atau lebih dengan alat ukur yang sama. Contoh: Alpha Cronbach

(14)

t-distribution: Sebelum vs Sesudah

Studi Kasus 1

Di sebuah perusahaan asuransi, diketahui bahwa biaya rata-rata untuk memproses suatu klaim adalah $60. Perusahaan kemudian menerapkan prosedur baru yang diharapkan akan mengurangi biaya pemrosesan. Selanjutnya setelah penerapan metode itu, diambil sampel 26 klaim, yang hasilnya:

45 49 62 40 43 61 48 53 67 63 78 64 48 54 51 56 63 69 58 51 58 59 56 57 38 76

Pada α = 0.01 dapatkah diambil kesimpulan bahwa ada penurunan biaya pemrosesan?

(15)

t-distribution: Sebelum vs Sesudah

Langkah-langkah penyelesaian 1. Hypothesis

H₀ : µ ≥ $60 H₁ : µ < $60

2. Level of Significance: α = 0.01 3. Test Statistic

t = X¯ − µ s/√

n 4. Decision Rule: H₀ ditolak jika t < −2.485 5. Keputusan:

t = X¯ − µ s/√

n = 56.42 − 60 10.04√

26 = −1.818 H₀ tidak ditolak.

(16)

t-distribution: membandingkan dua metode

Studi Kasus 2

Sebuah alat dapat dirakit dengan menggunakan dua metode, A dan B. Diperoleh hasil (dalam satuan menit):

Metode A: 2 4 9 3 2 Metode B: 3 7 5 8 4 3

Pada α = 0.01 tentukan apakah ada perbedaan signifikan antara hasil-hasil dari dua metode itu!

(17)

t-distribution: membandingkan dua metode

H₀ : µ₁= µ₂ H₁ : µ₁6= µ2

t = X¯1− ¯X2

q s_p²(_n¹

1 +_n¹

2)

4. Decision Rule: H0 ditolak jika −1.833 < t < 1, 833 5. Keputusan:

t_hitung= −0.662 H₀ tidak ditolak.

(18)

Sign Test: Sebelum dan Sesudah

Studi Kasus 3

15 orang karyawan dipilih untuk mengikuti training program.

Sebelum training mereka ditest dan diberi label ”poor”, ”fair”,

”good”, ”excellent”, ”outstanding”. Sesudah training, mereka kembali ditest dan diberi label. Pertanyaan: apakah training itu berhasil meningkatkan kemampuan karyawan?

(19)

Sign Test: Sebelum dan Sesudah

Figure 1: Hasil training

(20)

Sign Test: sebelum dan sesudah

H0 : π ≤ 0.5 H₁ : π > 0.5

2. Level of Significance: α = 0.1 3. Test Statistic: Jumlah tanda plus

4. Decision Rule: Jika jumlah sukses lebih kecil daripada jumlah sukses yang diperoleh dari cumulative probability pada distribusi binomial untuk n=14, π = 0.5, α = 0.1

5. Keputusan:

Dari tabel: Jumlah sukses yang sesuai dengan α = 0.1 adalah 10.

Sedangkan, jumlah sukses pada pelatihan adalah 11

(21)

Sign Test: Sebelum dan Sesudah

Figure 2: Tabel Binomial

(22)

Sign Test: Sebelum dan Sesudah

(23)

χ

²

test: apakah ada perbedaan antara satu item dan lainnya?

Studi Kasus 4

120 pengunjung sebuah restoran dipilih secara acak, dan ditanya apa makanan favorit mereka. Diperoleh hasil:

Chicken 32 Fish 24 Meat 35 Pasta 29

Dapatkah disimpulkan bahwa tidak ada perbedaan pilihan antara satu jenis makanan dan jenis lainnya?

(24)

χ

²

test: apakah ada perbedaan antara satu item dan lainnya?

Figure 4: Distribusi Binomial

(25)

χ

²

test: apakah ada perbedaan antara satu item dan lainnya?

H0 : Tidak ada perbedaan pilihan antara satu makanan dan lainnya.

H₁ : Ada perbedaan pilihan antara satu makanan dan lainnya.

χ² =X (f0− fe)² f₀

(26)

χ

²

test: apakah ada perbedaan antara satu item dan lainnya?

Langkah-langkah penyelesaian 4. Decision Rule:

Jika χ²_hitung > 7.815 maka H₀ ditolak.

5. Keputusan:

χ²_hitung= 2.20 < 7.815 H₀ diterima.

(27)

One Way Anova

Studi Kasus 1

Seorang mahasiswa ingin mengetahui apakah ada perbedaan kinerja dari tiga merek ponsel (Asus, Lenovo, Samsung) menurut persepsi para responden di Surya University. Kuesioner disebarkan pada sampel 20 orang mahasiswa untuk setiap merek ponsel, sehingga total responden menjadi N = 60 orang.

(28)

One Way Anova

Jumlah pertanyaan yang diajukan ada 4 pertanyaan, yaitu:

1 Bagaimana kecepatan load aplikasi pada ponsel anda?

2 Bagaimana aplikasi berjalan pada ponsel anda?

3 Bagaimana kualitas kamera pada ponsel anda?

4 Bagaimana kualitas batere pada ponsel anda?

(29)

One Way Anova

Untuk setiap pertanyaan, jawabannya berupa skala: (5)=Sangat Memuaskan, (4)=Memuaskan, (3)=Cukup, (2)=Tidak

Memuaskan, (1)=Sangat Tidak Memuaskan. Jawaban untuk keempat pertanyaan dijumlahkan sehingga untuk setiap responden diperoleh angka pada kisaran antara 4 s/d 20.

(30)

One Way Anova

Hipotesa

H₀ : Tidak ada perbedaan nilai rata-rata kinerja yang signifikan antara ponsel Asus, Lenovo, dan Samsung.

H₁ : Terdapat perbedaan nilai rata-rata kinerja yang signifikan antara ponsel Asus, Lenovo dan Samsung.

(31)

One Way Anova

Hipotesa

H0 : ¯X1 = ¯X2 = ¯X3

H1 : ¯X1 6= ¯X2 6= ¯X3

(32)

One Way Anova

Hipotesa

Tentukan Level of Significance, α = 0.01 F_hitung≤ Ftabel, maka H0 diterima Fhitung> Ftabel, maka H1 diterima

(33)

One Way Anova

Hasil Kuesioner:

Responden Asus Lenovo Samsung

1 18 16 18

2 19 19 18

3 17 15 15

4 20 20 16

5 15 15 16

6 20 20 20

7 18 18 14

8 18 15 15

9 18 16 16

10 16 16 18

(34)

One Way Anova

Responden Asus Lenovo Samsung

11 15 15 16

12 15 15 15

13 15 15 14

14 14 17 15

15 16 16 16

16 18 18 16

17 18 18 18

18 15 15 18

19 16 16 20

20 14 14 20

(35)

One Way Anova

Source Sum of Squares df MS F

of Variation

Treatements SST k-1 SST/(k-1)=MST F=MST/MSE

Error SSE n-k SSE/(n-k)=MSE

—– —–

Total SS Total n-1

(36)

One Way Anova

Global Average ¯XG =P X /N Treatment Average ¯X_C =P X_C/NC

SS Total = P(X − ¯X_G)² SSE = P(X − ¯X_C)² SST = SS Total - SSE, or:

SST = P( ¯Xc− ¯XG)²

(37)

One Way Anova

Source Sum of Squares df MS F

of Variation

Treatements 1.03 2 0.52 F=0.148

Error 198.9 57 3.48

—– —–

Total 199.93 59

F_hitung=0.148 F_tabel=4.14

F_hitung < F_tabel, H₀ diterima.

(38)

Two Way Anova

Studi Kasus 2

Seorang mahasiswa ingin mengetahui apakah merek air mineral berpengaruh pada penjualan, dan apakah ukuran kemasan juga berpengaruh pada penjualan. Mahasiswa itu mengumpulkan data penjualan untuk satu bulan dan ditabelkan berdasarkan ukuran dan merek.

(39)

Two Way Anova

Hipotesa

H_0a: Tidak ada perbedaan signifikan rata-rata penjualan berdasarkan merek.

H1a: Terdapat perbedaan signifikan rata-rata penjualan berdasarkan merek.

H0b: Tidak ada perbedaan signifikan rata-rata penjualan berdasarkan ukuran.

H_1b: Terdapat perbedaan signifikan rata-rata penjualan berdasarkan ukuran.

(40)

Two Way Anova

Ukuran Merek A Merek B Merek C Merek D

Kecil 1500 1350 1650 1500

Sedang 1750 1450 1750 1400

Besar 1700 1500 1600 1450

(41)

Two Way Anova

Source SS df MS F

of Var.

Treatements SST k-1 SST/(k-1)=MST MST/MSE

Blocks SSB b-1 SSB/(b-1)=MSB MSB/SSB

Error SSE (k-1)(b-1) SSE/(k-1)(b-1)=MSE

—– —–

Total SS Total n-1

(42)

Two Way Anova

Global Average ¯XG =P X /N Treatment Average ¯X_C =P X_C/NC

Block Average ¯X_b =P X_b/N_b SS Total = P(X − ¯X_G)² SSB = kP( ¯X_b− ¯X_G)² SST = P( ¯Xc− ¯XG)² SSE = SS Total - SST -SSB

(43)

Two Way Anova

Source SS df MS F

of Var.

Treatements 141667 3 47.22 6.018 Blocks 16250 2 8.125 1.0353

Error 47083 6 7.847

—– —–

Total 205000 11

Treatements: Fhitung = 6.018, Ftabel = 4.53, H1 diterima Block: Fhitung = 1.0353, Ftabel = 5.14, H0 diterima

(44)

Statistik Non Parametrik

Beberapa Contoh kasus:

Apakah selera terhadap rasa mie instant (kari ayam, soto, dll) bergantung pada etnis seseorang (jawa, batak, dll)?

(Menggunakan Chi-square).

Apakah ada perbedaan antara rating produk sabun (Lux, Sunsilk, Clear, dll) pada iklan di TV dan iklan di Radio?

(Menggunakan uji-Z)

Apakah ada perbedaan signifikan nilai UAS mahasiswa siang dan mahasiswa malam (Spearman Correlation Coeff.) Membandingkan dua merek minuman energi (A dan B).

Responden ditanya apakah mereka setuju minuman A dapat meningkatkan energi atau tidak, demikian pula minuman B.

(Chi-square).