Pelatihan Olah Data Statistik untuk Skripsi dengan
Perangkat Lunak JASP
O l e h :
Kelompok Keahlian Transportasi Prodi Teknik Sipil/Jurusan Teknik Sipil Fakultas Teknik
Universitas Tanjungpura
2024
Pengantar Statistik
Pengolahan data dibutuhkan dalam pengerjaan skripsi yang bertujuan untuk menganalisis berbagai aspek teknis melalui penggunaan metode statistik. Beberapa uji seperti Uji t digunakan untuk membandingkan rata-rata dua kelompok data, sementara ANOVA (Analisis Varian) diterapkan untuk mengevaluasi perbedaan antara tiga atau lebih kelompok. Selain itu, analisis regresi digunakan untuk mengidentifikasi hubungan dan pola antara variabel-variabel yang diamati. Data diperoleh melalui eksperimen dan survei, kemudian diolah menggunakan perangkat lunak statistik seperti SPSS, R atau JASP. Hasil analisis ini diharapkan memberikan wawasan mendalam dan mendukung hipotesis penelitian, serta berkontribusi pada pengembangan ilmu teknik di bidang studi yang relevan.
Perlu juga diketahui pembagian statistik inferensi dan non inferensi. Statistik inferensi melibatkan pengambilan kesimpulan tentang populasi berdasarkan sampel data. Metode ini mencakup uji hipotesis, estimasi interval kepercayaan, dan analisis regresi, memungkinkan peneliti membuat prediksi atau generalisasi dari sampel ke populasi yang lebih besar. Sebaliknya, statistik non- inferensi, atau statistik deskriptif, berfokus pada penggambaran dan ringkasan data tanpa mencoba membuat generalisasi atau prediksi. Ini mencakup penggunaan ukuran seperti mean, median, modus, standar deviasi, dan visualisasi data seperti grafik dan tabel. Statistik deskriptif memberikan gambaran menyeluruh tentang data yang ada, sementara statistik inferensi digunakan untuk menjawab pertanyaan spesifik dan membuat keputusan berdasarkan data sampel.
Apa itu JASP
JASP merupakan singkatan dari Jeffrey’s Amazing Statistics Program sebagai bentuk penghargaan atas pelopor analisis statistik Bayesian, Sir Harold Jeffreys. JASP adalah aplikasi olah data statistik yang dapat diakses secara bebas dan gratis. Aplikasi ini terus dikembangkan dan terus diperbarui (saat ini v 0.11.1 pada Oktober 2019) oleh sekelompok peneliti di University of Amsterdam. Tujuan mereka adalah untuk mengembangkan sebuah program statistik yang dapat diakses secara bebas dan gratis yang mencakup teknik statistik dasar dan teknik yang lebih kompleks (advance) dengan penekanan utama pada tampilan yang lebih sederhana (Goss- Samson, 2019).
JASP dapat diunduh secara gratis dari situs web https://jasp-stats.org/ dan tersedia untuk Windows, Mac OS X, dan Linux. Anda juga dapat mengunduh versi Windows yang telah terinstal sebelumnya yang akan dijalankan langsung dari USB atau hard drive eksternal tanpa harus menginstalnya pada PC atau laptop Anda
Menggunakan JASP
Bukalah aplikasi JASP
Gambar 1. Tampilan perangkat lunak JASP
Jenis Data di JASP
Data yang dapat diolah di JASP adalah data dengan format: .csv; .txt; .sav; .ods. Data yang berasal dari Mixrosoft Excel dapat di save as (di Ms. Excel), lalu pilih CSV (Comma delimited).
Gambar 2. Menyimpan data dalam format CSV
Membuka data di JASP; terdapat beberapa pilihan yaitu:
Gambar 3. Tampilan pilihan untuk mengakses data yang akan dianalisis
Ketika membuka data di JASP, terdapat tiga jenis data yaitu
Contoh data nominal adalah jenis kelamin, asal daerah dan lain-lain
Contoh data ordinal (bertingkat) adalah tingkat pendidikan, tingkat kualitas produk dan lain-lain Contoh data continous (hasil pengukuran) adalah tinggi badan, suhu dan lain-lain.
Analisis Deskriptif
Analisis statistik deskriptif digunakan untuk menyajikan, meringkas, dan menggambarkan data dengan cara yang mudah dipahami tanpa membuat kesimpulan yang lebih mendalam tentang populasi yang lebih besar. Tujuannya adalah untuk memberikan gambaran umum mengenai distribusi data, kecenderungan sentral, dan penyebaran data dalam satu kumpulan data. statistik deskriptif sangat bermanfaat untuk memahami dataset sebelum melangkah ke analisis inferensial yang lebih kompleks.
Manfaat utama dari analisis statistik deskriptif antara lain:
1. Menjelaskan Karakteristik Data: Menyajikan informasi dasar seperti ukuran, frekuensi, proporsi, dan pola dalam data yang membantu memahami sifat dari data tersebut.
2. Menentukan Kecenderungan Sentral: Pengukuran seperti rata-rata (mean), median, dan modus digunakan untuk menentukan nilai tengah atau nilai yang paling umum dalam dataset.
3. Mengukur Penyebaran Data: Ukuran seperti rentang, standar deviasi, dan variansi membantu menggambarkan seberapa tersebar data dari nilai rata-rata.
4. Menyederhanakan Data: Data yang besar dan kompleks dapat disederhanakan menjadi informasi yang lebih mudah dipahami dengan menggunakan tabel, grafik, dan statistik ringkasan.
Misal kita menggunakan data sebagai berikut:
Untuk melakukan analisis deskriptif adalah dengan memilih ‘Descriptives’ – Descriptive statistics
Tampilan berikutnya dari tahapan analisis deskriptif ini adalah sebagai berikut.
Results
Descriptive Statistics
Descriptive Statistics
age married collgrad wage
union nonunion union nonunion union nonunion union nonunion
Valid 9 14 9 14 9 14 9 14
Missing 0 0 0 0 0 0 0 0
Mode 37.000 40.000 2.000 2.000 1.000 1.000 6.401 3.052
Median 39.000 40.500 10.185 8.571
Mean 38.667 40.714 12.547 8.973
Std. Deviation 2.449 2.234 6.574 4.237
Minimum 35.000 35.000 6.401 3.052
Maximum 43.000 44.000 28.457 17.206
Note. Excluded 4 rows from the analysis that correspond to the missing values of the split-by variable union ᵃ The mode is computed assuming that variables are discrete.
Frequency Tables
Frequencies for age
union age Frequency Percent Valid Percent Cumulative Percent
union 35 1 11.111 11.111 11.111
36 0 0.000 0.000 11.111
37 3 33.333 33.333 44.444
39 2 22.222 22.222 66.667
40 1 11.111 11.111 77.778
41 1 11.111 11.111 88.889
42 0 0.000 0.000 88.889
43 1 11.111 11.111 100.000
44 0 0.000 0.000 100.000
Missing 0 0.000
Total 9 100.000
nonunion 35 1 7.143 7.143 7.143
36 0 0.000 0.000 7.143
37 0 0.000 0.000 7.143
39 1 7.143 7.143 14.286
40 5 35.714 35.714 50.000
41 2 14.286 14.286 64.286
42 3 21.429 21.429 85.714
43 0 0.000 0.000 85.714
44 2 14.286 14.286 100.000
Missing 0 0.000
Total 14 100.000
Note. wage has more than 10 distinct values and is omitted.
Frequencies for married
union married Frequency Percent Valid Percent Cumulative Percent
union single 4 44.444 44.444 44.444
married 5 55.556 55.556 100.000
Missing 0 0.000
Total 9 100.000
nonunion single 2 14.286 14.286 14.286
married 12 85.714 85.714 100.000
Missing 0 0.000
Total 14 100.000
Frequencies for collgrad
union collgrad Frequency Percent Valid Percent Cumulative Percent
union not college grad 6 66.667 66.667 66.667
college grad 3 33.333 33.333 100.000
Missing 0 0.000
Total 9 100.000
nonunion not college grad 8 57.143 57.143 57.143
college grad 6 42.857 42.857 100.000
Missing 0 0.000
Total 14 100.000
Distribution Plots age
union
nonunion
married union
nonunion
wage union
nonunion
One-Sample T Test
One-Sample T Test digunakan untuk menguji perbedaan rata-rata suatu sampel dengan suatu nilai hipotesis
Contoh, produsen baterai HP memberikan satu hipotesa bahwa rata-rata lama pemakaian baterai HP-nya adalah 50 jam (Trihendradi, 2004)1. Dilakukan sampling untuk mengetahui kebenarannya dengan data sebagai berikut:
Tabel 1. Data One-Sample Test no lmpakai
1 48
2 45
3 50
4 53
5 51
6 49
7 44
8 55
9 54
10 52
11 51
12 47
13 50
14 54
15 48
Yang dilakukan adalah:
▪ Copy-paste data ke microsoft excel, save as dalam format csv (comma delimited)
▪ Masuk ke JASP
▪ Klik tiga garis biru di atas kiri
▪ Pilih ‘Open’ – Computer – Browse untuk menampilkan data
1 Trihendradi, C. (2004). Langkah Mudah Memecahkan Kasus Statistik Deskriptif, Parametrik, dan Non- Parametrik dengan SPSS 12
Gambar 3. Tampilan data pada perangkat lunak JASP
Catatan: Jika terdapat kesalahan JASP dalam menentukan jenis data, klik lambang jenis-data lalu pilih yang sesuai.
Pada menu, pilih T-Test, pada bagian Classical, pilih One-Sample T Test,
Gambar 4. Analisis One-Sample Test pada perangkat lunak JASP
Pilih dan klik ‘lmpakai’, lalu klik tanda segitiga untuk memindahkan ke bagian variables.
Selanjutnya pada bagian Tests, centang ‘Student’, lalu masukkan angka 50 di ‘Test value’. Pada Additional Statistic, ‘Location estimate, Pilih Confidence interval 95%.
Gambar 5. Hasil analisis One-Sample T-Test
Dengan hipotesis:
H0 = rata-rata lama pemakaian = 50 jam H1 = rata-rata lama pemakaian ≠ 50 jam
Maka jika nilai p ( 0.938) > α (0.05), maka H0 diterima. Jadi HP yang diproduksi produsen tersebut memiliki rata-rata lama pemakaian selama 50 jam.
Independent-Sample T Test
Independent-Sample T Test digunakan untuk menguji signifikansi beda rata-rata dua kelompok.
Test ini biasanya digunakan untuk menguji pengaruh suatu perlakuan terhadap satu kelompok target.
Contoh, dilakukan pengamatan tentang pengaruh kursus terhadap peningkatan nilai tes mahasiswa. Setelah tes, dilakukan sampling secara random antara mahasiswa yang mengikuti kursus dengan mahasiswa yang tidak mengikuti kursus.
Tabel 2. Data Kasus Independent-Sample T-Test
No. Kondisi Nilai No. Kondisi Nilai
1 ikut kursus 8.50 16 tdk ikut kursus 7.00 2 ikut kursus 7.00 17 tdk ikut kursus 8.00 3 ikut kursus 7.25 18 tdk ikut kursus 8.25 4 ikut kursus 7.50 19 tdk ikut kursus 7.00 5 ikut kursus 8.50 20 tdk ikut kursus 6.50 6 ikut kursus 9.00 21 tdk ikut kursus 6.00 7 ikut kursus 8.00 22 tdk ikut kursus 5.50 8 ikut kursus 9.00 23 tdk ikut kursus 6.00 9 ikut kursus 7.00 24 tdk ikut kursus 6.75 10 ikut kursus 7.50 25 tdk ikut kursus 7.00 11 ikut kursus 8.00 26 tdk ikut kursus 7.25 12 ikut kursus 7.00 27 tdk ikut kursus 7.00 13 ikut kursus 7.50 28 tdk ikut kursus 6.00 14 ikut kursus 8.25 29 tdk ikut kursus 6.50 15 ikut kursus 8.00 30 tdk ikut kursus 7.00
Catatan: Jika hendak mengedit data atau menghapus kolom, klik ‘Edit Data’ di menu, lalu edit.
Untuk kembali, pilh ‘Analyses’.
(i)
(ii)
Gambar 6. Hasil analisis Independent Samples T-Test
Dengan H0 = ‘ tidak ada perbedaan yang signifikan antara 2 kelompok’, maka jika p-value (<
0.01) kurang dari nilai α (0.05) maka H0 ditolak; jadi kursus berpengaruh terhadap nilai tes.
Tambahan: Jika hendak mengetahui apakah varian dari kedua kelompok sama atau tidak, dapat menggunakan Equality of variances - Levene’s.
Paired-Sample T Test
Paired-Sample T Test adalah dua pengukuran pada subyek yang sama terhadap suatu pengaruh atau perlakuan tertentu. Ukuran sebelum dan sesudah mengalami perlakuan tertentu diukur.
Dasar pemikirannya adalah: apabila suatu perlakuan tidak memberikan pengaruh, maka perbedaan rata-rata adalah nol.
Contoh dilakukan pre-test dan post-test pada sebuah pelatihan terhadap 15 peserta dengan hasil sebagai berikut.
Tabel 3. Data Paired-Sample T Test no pre-test post-test
1 7.50 8.50
2 7.00 8.50
3 7.75 8.00
4 6.00 7.00
5 6.50 7.50
6 8.00 9.00
7 6.50 8.00
8 6.00 7.00
9 6.75 7.50
10 5.50 7.50
11 5.00 7.00
12 5.75 7.00
13 7.00 8.00
14 7.50 8.50
15 6.00 7.50
(i)
(ii)
Gambar 7. Hasil analisis Paired Samples T-Test
Dari hasil uji-t berpasangan, yaitu pada nilai p (<.001) yang kurang dari α (0.05) menunjukkan terdapat perbedaan yang signifikan pada hasil pre-test dan post-test dengan perbedaan rata- rata 1.183. Tanda minus menunjukkan kenaikan, (pre-test – post-test).
Data deskriptif dan plot menunjukkan adanya kenaikan nilai post-test jika dibandingkan dengan nilai pre-test.
Catatan: Pengecekan asumsi normalitas data (Shapiro-Wilk) tidak signifikan. Hal ini menandakan data terdistribusi normal. Jika hasilnya signifikan, maka analisis yang digunakan nantinya adalah uji non- parametrik Wilcoxon’s signed-rank.
Analisis Korelasi
Korelasi merupakan teknik statistik yang dapat digunakan untuk menentukan apakah terdapat hubungan antara dua variabel, dan seberapa kuat hubungan tersebut. Korelasi hanya sesuai untuk data yang dapat dikuantifikasi, di mana angka memiliki makna, seperti data kontinus atau pun data ordinal. Teknik ini tidak dapat digunakan untuk data kategorikal di mana kita harus menggunakan analisis tabel kontingensi (lihat Analisis Chi-kuadrat dengan JASP).
Tabel 4. Data Analisis Korelasi masa_kerja gaji_ribu
3 3500
2 3000
3 4000
5 5500
6 5000
8 7500
9 6500
10 8500 12 9500
9 6500
10 8500 15 9500 11 7500
5 4000
7 5250
8 6000
12 7500 14 8250
Pilih ‘Rgression – [Pada bagian Classical] Correlation
Gambar 8. Hasil Analisis Korelasi Dengan hipotesis:
H0 = tidak ada hubungan antara kedua variabel;
H1 = ada hubungan antara kedua variabel
Dengan nilai p-value (<.001) yang kurang dari α(0.05), maka H0 ditolak, jadi terdapat hubungan antara kedua variabel.
Kasus ke 2. Pada buku Perencanaan Pemodelan Ofyar Z Tamin, Bab 4, terdapat analisis korelasi dengan data sebagai berikut.
Tabel 5. Data Karakteristik Bangkitan Perjalanan
Jumlah Panjang Jumlah Jumlah PDRB
Bangkitan Jumlah Rumah jalan
diaspal Perusahaan kamar
hotel (juta No Kabupaten Perjalanan Penduduk Sakit (km) Perdagangan berbintang Rupiah)
Y X1 X2 X3 X4 X5 X6
1 Pandeglang 12,035,567 926,316 1 470 5,706 582 1,053,924
2 Lebak 7,647,167 963,307 3 387 2,418 0 971,543
3 Bogor 39,564,090 3,592,646 10 1,581 10,421 1,036 6,464,158
4 Sukabumi 18,150,017 1,930,097 3 813 4,282 385 2,111,595
5 Cianjur 13,658,862 1,766,413 2 765 5,204 1,322 1,992,958
6 Bandung 85,239,366 3,471,886 10 2,406 12,324 316 7,514,143
7 Garut 13,539,514 1,767,732 2 713 6,217 40 2,253,897
8 Tasikmalaya 20,590,334 1,892,301 2 822 11,364 87 2,096,317
9 Ciamis 16,650,852 1,485,334 2 1,240 10,705 60 2,067,602
10 Kuningan 8,338,062 929,320 3 508 5,717 70 896,980
11 Cirebon 19,682,714 1,757,629 5 555 8,285 166 1,777,528
12 Majalengka 9,973,952 1,091,130 2 764 7,727 0 1,043,769
13 Sumedang 7,504,292 871,440 1 574 5,044 0 1,090,687
14 Indramayu 14,707,679 1,537,392 2 507 7,928 0 4,964,716
15 Subang 9,677,077 1,211,990 3 563 10,747 120 1,667,729
16 Purwakarta 6,769,081 616,852 2 483 3,171 131 980,760
17 Karawang 11,163,886 1,565,355 3 577 6,499 174 2,798,437
18 Bekasi 17,463,903 2,383,771 7 709 13,796 449 6,509,838
19 Tangerang 13,578,144 1,882,352 5 945 18,610 197 4,040,121
20 Serang 19,972,140 1,618,534 3 708 8,751 601 5,419,289
21 Kodya Bogor 20,753,695 665,731 5 260 6,504 115 1,045,309
22 Kodya Sukabumi 2,941,253 229,748 3 142 2,080 28 512,680
23 Kodya Bandung 57,742,897 1,882,913 23 844 41,038 2,917 6,349,876
24 Kodya Cirebon 7,952,916 255,677 8 146 5,103 503 854,716
25 Kodya Tangerang 7,430,548 1,049,265 6 205 0 203 6,014,924
Dari data tersebut diperoleh hasil korelasi antar variabelnya adalah sebagai berikut:
Gambar 9. Hasil Analisis Korelasi di buku Perencanaan Pemodelan karangan Ofyar Z. Tamin Untuk memperoleh hasil ini, copy-paste data, Y – X1, X2 dan seterusnya ke Microsoft Excel, lalu save as ke format csv, sehingga muncul data sebagaimana yang dapat dilihat di bawah ini.
Gambar 10. Tampilan data Karakteristik Bangkitan Perjalanan di JASP Pilih Regression – Classical – Correlation.
Gambar 11. Langkah analisis Korelasi di JASP
Lalu blok Y s/d X6 dan pindahkan ke kotak Variables. Untuk mendapatkan hasil yang diinginkan, cukup mencentang Pearson’s r. Hasilnya adalah sebagai berikut:
Gambar 12. Hasil Analisis Korelasi di JASP
Regresi
Regresi menguji hipotesis nol (H0) bahwa tidak ada prediksi signifikan terhadap variabel outcome oleh variabel prediktor atau dengan kalimat lain, pada model, variabel bebas tidak dapat secara signifikan memprediksi variabel tak bebasnya.
Terdapat kasus dimana ingin diketahui hubungan antara stres kerja (X) dan kinerja pegawai (Y), dengan data seperti yang dapat dilihat pada Tabel di bawah ini.
A. Regresi Linier Sederhana
No X Y
1 28 21
2 20 24
3 21 27
4 23 22
5 17 26
6 25 24
7 22 23
8 19 25
9 27 21
10 25 22
11 24 25
12 17 28
Kasus ini telah dikerjakan dengan SPSS (dapat dilihat pada website: www.spssindonesia.com)2 dan dapat dilihat pada bagian Lampiran.
Selanjutnya data tersebut akan dianalisis dengan menggunakan JASP. Jika data tersebut dimasukkan ke dalam format csv dan dibuka dengan JASP akan terlihat seperti ini.
2 https://www.spssindonesia.com/2017/03/uji-analisis-regresi-linear-sederhana.html
Selanjutnya yang dilakukan adalah sebagai berikut; pilih ‘Regression’ – pada bagian Classical, pilih
Gambar
Hasil analisis JASP dapat dilihat di bawah ini.
Dapat dilihat bahwa hasil yang diperoleh persis sama dengan hasil pada SPSS.
B. Regresi Linier Berganda
Untuk itu dapat digunakan data pada Tabel 5 (Karakteristik Bangkitan Perjalanan). Hasil analisis regresi pada kasus atau data tersebut dapat dilihat pada Lampiran (2).
Untuk mendapatkan hasil sebagaimana Lampiran (2) (kolom 1), yang dilakukan adalah: gunakan data Korelasi – pilih menu Regression – Classical – Linear Regression
Y dimasukkan ke ‘Dependent Variables’ dan X1 s/d X6 dimasukkan ke dalam ‘Covariates’. Metode yang digunakan yaitu metode ‘Enter’.
Yang dicentang pada bagian bawah adalah Estimates dan Model Fit
Gambar 14. Analisis Regresi Berganda di JASP (1)
Gambar 15. Analisis Regresi Berganda di JASP (2)
One-Way ANOVA
Analisis varian satu variabel independent digunakan untuk menentukan apakah rata-rata dua atau lebih keloMpok berbeda secara signifikan.
Contoh. Ingin diketahui pengaruh lama kursus terhadap nilai test. Lama kursus yang diamati adalah 3 bulan, 6 bulan, dan 9 bulan dengan jumlah partisipan masing-masing kelompok 7 siswa dipilih secara random.
Tabel Data One-Way ANOVA
lama_kursus nilai lama_kursus nilai
3 bulan 7.0 3 7.0
3 bulan 8.0 3 8.0
3 bulan 7.25 3 7.25
3 bulan 7.5 3 7.5
3 bulan 7.0 3 7.0
3 bulan 7.5 3 7.5
3 bulan 7.75 3 7.75
6 bulan 8.0 6 8.0
6 bulan 8.5 6 8.5
6 bulan 8.0 6 8.0
6 bulan 8.25 6 8.25
6 bulan 7.5 6 7.5
6 bulan 8.75 6 8.75
6 bulan 8.5 6 8.5
9 bulan 9.0 9 9.0
9 bulan 9.5 9 9.5
9 bulan 9.25 9 9.25
9 bulan 9.0 9 9.0
9 bulan 8.5 9 8.5
9 bulan 8.75 9 8.75
9 bulan 9.25 9 9.25
Dalam pengolahan data, 3 bulan =3; 6 bulan = 6; 9 bulan = 9,
Kasus ini jika diolah dengan menggunakan perangkat lunak SPSS akan memberikan hasil:
Dengan hasil sebagaimana yang dapat dilihat pada Gambar di bawah ini.
Selanjutnya kita akan melakukan analisis dengan menggunakan perangkat lunak JASP sebagai berikut.
Hasil yang diperoleh dapat dilihat pada Gambar di bawah ini.
Karena p-value < α , maka H0 ditolak, jadi ketiga kelompok memiliki nilai rata-rata yang berbeda Dari nilai Mean di Descriptive dan Descriptive Plots diketahui terdapat peningkatan nilai yang berbanding lurus dengan lama kursus.
* * *
LAMPIRAN
1. One-Sample T Test
Pada SPSS, pilih Analyze – Compare Means – One Sample T Test – ‘Test Value=50’ – pada Option, pilih Confidence Interval Percentage = 95%
Hasil regresi (www.spssindonesia.com)3
3 https://www.spssindonesia.com/2017/03/uji-analisis-regresi-linear-sederhana.html
2. Regresi Linier Berganda
Hasil pemodelan dari buku Ofyar Z. Tamin