ANALISIS DATA
Menara Salemba Lt. 10
Jl. Salemba Raya No. 5, Jakarta 10440
Telp.: (021) 3984 2998 Fax.: (021) 3984 2878 E-mail: [email protected]
1
Agenda
Langkah Analisis Data 1
Statistik Deskriptif 2
Pengujian Hipotesis 3
4
2
Langkah Analisis Data Kuantitatif
1.
Data Coding
2.
Data Entering
3.
Data Cleaning
4.
Data Output
5.
Data Analyzing
Pengkodean Data ( Data Coding)
Proses memberikan kode atas data yang diperoleh atau proses penyusunan secara
sistematis data mentah (yang terdapat dalam kuesioner) ke dalam tabel excell atau
pengolah data semisal SPSS agar siap untuk diolah.
Contoh
Variabel jenis kelamin 1: laki-laki 2: Perempuan
Variabel pendikan 1: SLTA 2:D1 3:DIII 4:DIV/S1 5:S2 6:S3
Variabel lama kerja 1: <1tahun 2: 1-3 tahun 3: 3-5 tahun 4: >5tahun
Data Coding
Data Coding digunakan sebagai dasar
dalam pembuatan Buku Coding ( Coding Book)
Kuesioner dalam pertanyaan tertutup lebih mudah untuk dilakukan coding, apabila
dibandingkan dengan pertanyaan terbuka.
Jika anda menggunakan pertanyaan
terbuka dalam kuesioner anda harus
menginventarisasi jawaban responden.
Pemindahan Data ( Data Entry )
Kegiatan memindahkan data yang telah diubah menjadi kode ( data coding ) ke dalam mesin pengolah data.
Dipindahkan ke program pengolah data seperti SPSS, Minitab, SAS, dsb.
Untuk mempermudah mengolah data, pastikan bahwa format dalam data coding sesuai dengan tipe data dalam pengolah data.
Pembersihan Data (data cleaning)
Kegiatan untuk memastikan bahwa seluruh data yang telah dimasukkan kedalam mesin pengolah data sudah sesuai dengan keadaan sebenarnya.
Data Cleaning harus dilakukan dengan teliti agar data dapat diolah dengan mesin pengolah data sehingga mendapatkan data valid.
Pastikan tidak ada data yang berada diluar range, misal
Jenis kelamin hanya berisikan nilai 1 dan 2.
Jika pertanyaan kuesioner menggunakan skala likert 1-5 pastikan data yang ada hanya terdiri dari nilai 1-5.
Kesalahan dalam Data Cleaning
1. Possible Code Cleaning : kesalahan yang
diakibatkan oleh peneliti ketika memasukan data ke dalam mesin pengolah data.
2. Contingency Cleaning: Kesalahan yang
diakibatkan oleh adanya struktur kuesioner yang hanya khusus digunakan atau dijawab oleh sebagian orang saja, sedangkan yang lain tidak.
Contoh Kuesioner
1. Apakah anda menggunakan Aplikasi Portal DJP?
A. ya B. tidak (lanjut ke no 6 )
2. Apakah anda puas menggunakan aplikasi tersebut?
A. Puas B. Tidak Puas
3. Apakah menurut Anda aplikasi tersebut handal?
A. Handal B. Tidak handal
Data Coding
No Nama variabel Kode
Var001 Menggunakan Aplikasi Portal
DJP 1= ya
2= tidak Var002 Tingkat Kepuasan Aplikasi
Portal DJP 1=puas
2=tidak puas var003 Kehandalan Aplikasi Portal
DJP 1=handal
2=tidak handal
Coding Book
Var /
responden Responden
1 Responden
2 Responden
3 Responden 4
Var001 1 1 1 2
Var002 1 1 2 2
Var003 2 3 1 1
Contoh data cleaning
Possible Code Cleaning : dapat ditemukan pada responden nomor 2 variabel 003, yakni angka 3.
nilai 3 tidak ada dalam buku koding. Yang tersedia dalam buku koding adalah kode 1 & 2.
Contingency Cleaning : ditemukan pada responden no.4 variabel 001-003.ketika
menjawab tidak (kode 2) seharusnya responden tidak dapat menjawab pertanyaan selanjutnya.
Responden tersebut diperbolehkan menjawab pada kembali pada no.6. Ia Tidak menggunakan Aplikasi Portal DJP, sehingga tidak dapat menilai kehandalan dan tingkat kepuasannya.
Data Ouput
Data Univariat : analisis 1 variabel
Analisis dilakukan dalam bentuk Tabel dan grafik,
Ukuran Pemusatan : Mean, Median, Modus, Ukuran
Persebaran : Range, standar Deviasi dan Ragam
Data Bivariat : analisis 2 variabel
Tabulasi Silang,
Uji Statistik chi square,
Lambda dsb.
Data Multivariat : analisis lebih dari 2 variabel
Tabel dan Grafik
Terdapat 3 unsur utama dalam penyusunan tabel dan grafik
1. Judul
2. Isi / Substansi
3. Sumber Data
Analisis Bivariat
Tabulasi Silang ( Crosstab )
Variabel Independen Persentase
Variabel Dependen Interpretasi
Terbagi menjadi Persentase Baris, Kolom dan Total
Tabel frekuensi
Kategori Frekuensi Persentase
Laki-laki 125 62,5%
Perempuan 75 37,5%
Jumlah 200 100%
Hubungan Grafik dengan Skala Pengukuran
Nominal : Piechart, Bargraph
Ordinal : Pie chart, Bargraph
Interval : Histogram, Poligon, Ogive
Rasio : Histogram, Poligon, Ogive, Diagram batang daun dan scatter plot
( diagram titik ) .
Penyajian Data Diagram Batang
Jenis Kelamin Responden
Jenis Kelamin
Perempuan Laki-Laki
Percent
60
50
40
30
20
10 0
Diagram Lingkaran
PIlihan Partai Politik
PPP
PKB PDIP
Diagram Garis
Tingkat Pendapatan
Pendapatan (jutaan)
9 8
7 6
5 4
3 2
Percent 1 40
30
20
10
0
Diagram Area
Tabungan
20 19 18 16 15 14 12 11 8 6 5 4 2
Count
30
20
10
0
Jenis Kelamin
Perempuan Laki-Laki
Diagram Titik
Lama Kerja ( tahun )
7 6
5 4
3 2
1 0
-1
Tabungan
30
20
10
0
Deskriptif
Descriptive Statistics
70 3.91 2.749 7.558
70 2.43 1.470 2.161
70 7.63 5.253 27.599
70 1.44 .500 .250
70 2.01 .789 .623
70 VAR001 Pendapatan
(jutaan)
VAR002 Lama Kerja ( tahun )
VAR003 Tabungan VAR004 Jenis Kelamin VAR00001 Pilihan Partai Politik
Valid N (listwise)
N Mean Std. Deviation Variance
Statistik Deskriptif
Descriptive Statistics
70 3.91 .575 .287 -1.194 .566
70 2.43 .426 .287 -.632 .566
70 7.63 .911 .287 -.432 .566
70 1.44 .235 .287 -2.003 .566
70 2.01 -.026 .287 -1.384 .566
70 VAR001 Pendapatan
(jutaan)
VAR002 Lama Kerja ( tahun )
VAR003 Tabungan VAR004 Jenis Kelamin VAR00001 Pilihan Partai Politik
Valid N (listwise)
Statistic Statistic Statistic Std. Error Statistic Std. Error
N Mean Skewness Kurtosis
Statistik Deskriptif
Mean Std. Dev Median Max. Min. Obs.
P 2.451,59 7.708,90 390,00 66.912,00 43,00 781
NOA 1.642,55 3.460,04 462,33 19.890,66 3,69 781
NFA -462,99 2.184,26 -71,00 11.904,71 -15.827,07 781
AOE -28,20 795,36 -16,83 6.049,13 -6.257,48 781
DTA 26,49 86,54 2,91 1.087,84 0,00 781
DTL 20,89 59,33 0,00 359,94 0,00 781
netDT 5,60 100,20 1,21 1.087,84 -359,94 781
netDT1 -16,00 51,49 0,00 0,00 -359,94 781
netDT2 -0,20 0,85 0,00 0,40 -7,71 781
netDT3 0,31 0,75 0,00 3,78 0,00 781
netDT4 1,81 3,99 0,00 20,74 0,00 781
netDT5 19,67 82,20 0,00 1.087,84 0,00 781
netDTA 21,80 81,78 1,21 1.087,84 0,00 781
netDTL 16,20 51,43 0,00 359,94 0,00 781
netDTo -9,02 84,33 2,00 393,13 -405,05 154
ADJ 1,93 18,78 0,00 113,40 -110,53 154
For variable definitions, see Table 2.
Tabulasi Silang
VAR004 Jenis Kelamin * VAR00001 Pilihan Partai Politik Crosstabulation
20 14 5 39
28.6% 20.0% 7.1% 55.7%
1 13 17 31
1.4% 18.6% 24.3% 44.3%
21 27 22 70
30.0% 38.6% 31.4% 100.0%
Count
% of Total Count
% of Total Count
% of Total 1 Laki-Laki
2 Perempuan VAR004 Jenis
Kelamin
Total
1 PDIP 2 PKB 3 PPP VAR00001 Pilihan Partai Politik
Total
Pengujian Beda rata-rata 2 Populasi
Pendugaan Interval Pengujian Hypotesis
(
1 -
2)Nilai (
1-
2)tidak diketahui
Nilai (
1 -
2) diketahui, tetapi baru anggapan, belum tentu sebenarnyaMenduga Menguji
(
1 -
2) = Do(
x
1 -x
2)(
x
1 -x
2)Uji Hypotesis Beda 2 rata- rata
Design Hypotesis :
Z
satu arah kanan
satu arah kiri
- Z
H
0:
1-
2= Do
1=
2H
1:
1-
2≠ Do
1≠
2Do = 0 Do ≠ 0
H
1:
1-
2> Do
1>
2H
1:
1-
2< Do
1<
2Dua arah
H
0:
1-
2= Do
1=
2H
0:
1-
2= Do
1=
21. Menentukan Design Hypotesis
2. Menentukan Batas Kritis (menentukan Stat Uji Teoritis) 3. Menghitung Statistik Uji Empiris (Z hitung)
4. Tentukan letak Z hitung pada batas kritis 5. Ambil keputusan
Statisik Uji Beda 2 Rata-rata
1 2 1 2
1 2 1 2 1 2 0
h
X X X X
X X X X D
Z
2 2 2 1
2 1
2
1 X n n
X
Contoh soal 2
Seorang pengusaha lampu neon cap “Cahaya” mengklaim bahwa produknya lebih awet dari pada lampu neon cap
“Pilipus”dan awetnya lebih dari 100 jam. Suatu penelitian dilakukan untuk menguji pernyataan pengusaha tersebut.
Dengan mengambil sampel random masing-masing sebanyak 50. Setelah dilakukan pengujian daya tahan, diperoleh angka sebagai berikut: rata-rata umur lampu cap “Cahaya” = 2305jam dengan deviasi standar 16jam dan rata-rata umur lampu cap “Pilipus” = 2200 jam dengan deviasi standar 14jam.
Dengan taraf nyata 5% ujilah pernyataan seorang pengusaha tersebut!
Jawaban :
Diketahui: Do = 100 = 5%
Merk “Cahaya”:n1=50 = 2305 S1= 16 Merk “Pilipus”: n2=50 = 2200 S2= 14 1. Ho :
1 -
2 = 100H1 :
1 -
2 > 1002. = 5% Z = 1,64 3. Zh = 1,66
4. Letak Zh = 1,66 berada di wilayah H1 :
1 -
2 > 1005. Keputusan : klaim seorang pengusaha dapat diterima.
X 2
X 1
1,6601 , 3
5 50
14 50
16
100 2200
2305
2 2
2 22
1 12
2 1
n S n
S
Do X
Zh X
1,645
satu arah kanan
Uji Hypotesis Beda Proporsi 2 Populasi
Design Hypotesis :
Z
satu arah kanan
satu arah kiri
- Z
Dua arah
H
0:
P1-
P2= Do
P1=
P2H
1:
P1-
P2≠ Do
P1≠
P2Do ≠ 0 Do = 0
H
1:
P1-
P2> Do
P1>
P2H
1:
P1-
P2< Do
P1<
P2H
0:
P1-
P2= Do
P1=
P2H
0:
P1-
P2= Do
P1=
P2Statistik Uji Beda 2 Proporsi (Langkah 3)
1 2 1 2
1 2 1 2 1 2 0
h
P P P P
P P P P P P D
Z
1 2 1 2
1 1 2 2 1 1 2 2
1 2 1 2
(1 ) (1 ) (1 ) (1 )
P P P P
P P P P P P P P
n n S n n
2 1
0
0 1 1
) 1
2 (
1 P P n n
SP P
2 1
2 0 1
n n
k P k
Bila Do=0 , maka
dimana
Contoh soal 3
Sebuah stasiun TV swasta ingin mengetahui apakah TV-nya lebih disukai kalangan muda dibandingkan kalangan dewasa. Untuk itu ia melakukan survey dengan sampel random masing-masing 2000 orang. Diperoleh angka yang menyukai stasiun TV itu dari kalangan dewasa 400 orang dan kalangan muda 500 orang. Dengan taraf nyata 5%, ujilah apakah stasiun TV itu memang lebih disukai kalangan muda!
Diketahui :
Muda : n1 = 2000 , x1 = 500
Dewasa: n2 = 2000, x2 = 400
= 5%
25 2000 0
1 500 ,
P
2 , 2000 0
2 400
P
Jawaban
1. Ho : P1 = P2 H1 : P1 > P2
Tolak Ho bila Zh>1.645: = 5% 2. Zh = ? Do = 0 maka :
1 2
1 2 0
0, 25 0, 2 0 0, 0132
3, 786
h
P P
P P D
Z S
0
2000 2000
400 500
0132 ,
0
2000 1 2000
775 1 , 0 225 , 0
1 1
0 0
2 1
0
2 0
1
q P
n q n
p SP P
3. Letak Zh = 3,786 > Z = 1,64, ada di wil. H1 : P1 > P2
4. Benar bahwa Stasiun TV tersebut lebih disukai kalangan muda
1,645
satu arah kanan
= 0,225 ,775
Statistik Parametrik
The Comparison of Groups (Compare Mean)
t-test Anova Manova
Measure of Association between Two or more Variables (Correlate)
Pearson’s Product Moment Regression
Canonical Correlation Analysis
Compare mean
t-test =alat untuk menguji hipotesis untuk dua mean.
t-test untuk independent sample artinya t-test untuk mean dari dua kelompok yang berbeda yang memperoleh perlakuan
t-test untuk dependent sample artinya t-test untuk mean dari kelompok yang sama dari dua perlakuan yang berbeda.
Analysis of Variance (ANOVA) adalah alat menguji hipotesis untuk mean lebih dari dua.
Multifactor Analysis of variance/ Factorial Analysis adalah alat untuk menganalisis efek interaksi
lebih dari dua variabel.
Correlate
Pearson’s Product Moment adalah untuk mencari koefisien korelasi dari variabel data interval atau rasio
Regression adalah untuk mengetahui bagaimana variabel dependent dapat
diprediksi melalui veriabel independent, secara individu atau bersama.
Canonical Correlation Analysis
digunakan untuk tujuan menganalisis beberapa variabel terikat (dependent variable) dan beberapa variabel bebas
(independent variable).
.Correlational
Apakah terdapat hubungan antara X dan Y?
Apakah terdapat hubungan antara X1 dan Y? X2 dan Y, atau X1 dan X2 dengan Y secara bersama-sama?
Apakah terdapat hubungan antara X1 dan Y1? X2 dan Y1, atau X1 dan Y2 atau X2 dan Y2, atau X2 dan Y1, X2 dan Y2?
Pearson Product Moment Correlation
Regression
Canonical Correlation Analysis
Correlate
Statistik Non-parametrik
Dua sampel saling berhubungan (two dependent samples)
Dua sampel tidak berhubungan (two independent samples)
Beberapa sampel berhubungan (several dependent samples)
Beberapa sampel tidak berhubungan (several independent samples)
Sign test
Wilcoxon Signed-Rank
Mc Nemar Change test
Mann-Whitney U test
Moses Extreme reactions
Chi-Square test
Kolmogorov-Smirnov test
Walt-Wolfowitz runs
Friedman test
Kendall W test
Cochran’s Q
Kruskal-Wallis test
Chi-Square test
Median test
Ukuran Asosiasi dan Korelasi
Chi square : menguji hipotesis antara
variabel independen dan dependen terdapat hubungan yang signifikan atau tidak.
Tau Kendall : ukuran korelasi non parametrik yang digunakan untuk variabel ordinal
dengan arah hubungan simetrik atau simetrik.
Sommers D : mengukur kekuatan hubungan pada tingkat pengkuran ordinal dengan
asimetrik/ simetrik
Korelasi Spearman : mengukur korelasi antar 2 variabel yang memiliki ukuran skala ordnal
Chi-Square Tests
.906b 1 .341
.711 1 .399
.931 1 .335
.385 .201
.905 1 .341
919 Pearson Chi-Square
Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 table a.
0 cells (.0%) have expected count less than 5. The minimum expected count is 32.37.
b.
Hasil Output SPSS uji chi Square
UJI KORELASI
Correlations
1 .910** .698**
. .000 .000
70 70 70
.910** 1 .719**
.000 . .000
70 70 70
.698** .719** 1
.000 .000 .
70 70 70
Pearson Correlation Sig. (2-tailed)
N
Pearson Correlation Sig. (2-tailed)
N
Pearson Correlation Sig. (2-tailed)
N VAR003 Tabungan
VAR001
Pendapatan (jutaan)
VAR002 Lama Kerja ( tahun )
VAR003 Tabungan
VAR001 Pendapatan
(jutaan)
VAR002 Lama Kerja (
tahun )
Correlation is significant at the 0.01 level (2-tailed).
**.
Uji Regresi Sederhana
Variables Entered/Removedb
VAR001 Pendapata n (jutaan)a
. Enter Model
1
Variables Entered
Variables
Removed Method
All requested variables entered.
a.
Dependent Variable: VAR003 Tabungan b.
Model Summary
.910a .828 .825 2.195
Model 1
R R Square
Adjusted R Square
Std. Error of the Estimate Predictors: (Constant), VAR001 Pendapatan (jutaan) a.
Uji Regresi
ANOVAb
1576.715 1 1576.715 327.251 .000a
327.628 68 4.818
1904.343 69
Regression Residual Total Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), VAR001 Pendapatan (jutaan) a.
Dependent Variable: VAR003 Tabungan b.
Coefficientsa
.822 .459 1.793 .077
1.739 .096 .910 18.090 .000
(Constant) VAR001
Pendapatan (jutaan) Model
1
B Std. Error Unstandardized
Coefficients
Beta Standardized
Coefficients
t Sig.
Dependent Variable: VAR003 Tabungan a.
Uji Regresi Multivariat
Model Summary
.917a .842 .837 1.110
Model 1
R R Square
Adjusted R Square
Std. Error of the Estimate
Predictors: (Constant), VAR002 Lama Kerja ( tahun ) , VAR003 Tabungan
a.
Pengujian Hipotesis Korelasi
Ho : Tidak Terdapat hubungan antara variabel X dengan variabel Y
Ha : Terdapat hubungan antara variabel X dengan variabel Y
Aturan Pengujian : jika nilai signifikansi yang dipilih < 0,05 maka Ho DITOLAK.
Kesalahan Hipotesis
Hipotesis
peneliti Keadaan yang sebenarnya
Tidak Ada hubungan Ada Hubungan Tdk Ada
Hubungan Keputusan Tepat Kesalahan Tipe 2 Ada Hubungan Kesalahan Tipe 1 Keputusan Tepat
Hal-Hal yang harus diperhatikan dalam penelitian Kuantitatif
Berikan interpretasi dari hasil ouput.
Analisa data tidak dapat dipisahkan dari
kajian teoritis yang dipergunakan. Teori tetap digunakan sebagai alat analisis dari temuan data kuesioner.
Pola penelitian kuantitatif bersifat linear dan baku.
Penelitian Kuantitatif
Berpola
Bebas nilai obyektif
Deduktif nomotetik
Ilmu adalah cara terbaik memperoleh pengetahuan
Mencari penjelasan
Menemukan hukum universal
Dwi Martani
Departemen Akuntansi FEUI
[email protected] atau [email protected] http://staff.blog.ui.ac.id/martani/
Terima Kasih
51