Dapus 8-14
Sesi 8 : Membaca, Menyusun, dan Menginterpretasikan Data yang Disajikan dalam Tabel 1. Tidy data dan Pivoting (panjang [long] vs lebar [wide])
2. Membuat tabel distribusi frekuensi
3. Membuat tabel kontijensi (cross tabulation)
4. Menghitung probabilitas, persentase kolom dan baris, proporsi, rasio, dan rate dari tabel kontijensi
Visualisasi dan tata letak tabel
Baris merupakan record yang dapat berisi informasi mengenai unit analisis (case), mulai dari usia, gender, hasil pengukuran, atau yang lainnya.
Kolom merupakan representasi dari variabel
Dalam menyimpan data dalam bentuk tabel (set data/dataset), gunakan prinsip tidy 1. Satu kolom memuat satu variabel
2. Satu baris mewakili satu unit analisis (case) 3. Satu tabel mewakili satu observational unit
Long form disarankan karena sesuai dengan prinsip tidy
Wide form digunakan ketika peneliti ingin melihat tren
Cara penyusunan tabel
1. Penyusunan secara alfabetis Memudahkan mencari nama 2. Penyusunan secara geografis
3. Penyusunan menurut besaran angka-angkanya 4. Penyusunan secara historis
5. Penyusunan atas dasar kelas-kelas yang lazim 6. Penyusunan secara progresif
7. Tabel distribusi frekuensi 8. Tabulasi silang
Tabel distribusi frekuensi adalah tabel yang memuat data frekuensi dari tiap variabel
sehingga tiap case dalam tabel memuat frekuensi dari nilai tertentu. Contoh: Line graph, bar chart, histogram, dll
Tabel distribusi frekuensi cocok digunakan untuk menyajikan data dari satu variabel
Dalam kasus dua variabel, tabel kontijensi adalah teknik terbaik dalam menyajikan atau memproses data dalam kasus tertentu
jenis variabel yang dapat disajikan dalam tabel kontijensi adalah variabel nominal
Rasio adalah besaran relatif atau perbandingan dari dua nilai
Proporsi adalah perbandingan sebagian dengan keseluruhan
Rate merupakan salah satu bentuk pengukuran frekuensi yang menggambarkan
suatu kejadian di suatu populasi dalam satu periode waktu tertentu
Sesi 9 : Distribusi Data, Tendensi Sentral, dan Dispersi (Variabilitas) 1. Menghitung tendensi sentral
2. Membedakan jenis-jenis distribusi data 3. Melakukan uji normalitas data
4. Menginterpretasi hasil uji normalitas data 5. Menginterpretasi boxplot dan violin plot
Beberapa ukuran pemusatan/ ukuran sentral : 1. Rata-rata hitung (mean)
m n
2. Rata-rata terboboti 1
nΣ m. f (m=nilai tengah) 3. Median
B+ n 2−F Fm−F.i
( B= tepi bawah, F = Frekuensi kumulatif sebelum kelas median, Fm = Frekuensi kumulatif pada kelas median, I = interval kelas)
4. Modus
B+ f0−f−1
(
f0−f−1)
+(
f0−f+1)
.i(f0 = frekuensi kelas modus, F-1 = frekuensi sebelum kelas modus, f+1 = frekuensi setelah kelas modus)
5. Rata-rata ukur 6. Rata-rata harmonis
Variabilitas/Dispersi Data 1. Range
Nilai terbesar dikurangi nilai terkecil Kelebihan range yaitu :
1. Perhitungannya sederhana
2. Perhitungan dapat dilakukan secara cepat
3. Sudah dapat menggambarkan ketersebaran data observasi Kelemahan range yaitu :
1. Hasil pengukurannya kasar
2. Perhitungan hanya berdasarkan pada dua titik ekstrim dalam distribusi sehingga informasi tentang pola ketersebaran nilai nilai observasi tidak didapatkan.
2. Inter Quartile Range (IQR) IQR = Q3 – Q1
Kisaran yang besar dari IQR menunjukkan variabilitas yang besar antara di tengah 50% pengamatan yang relevan
3. Varians
Ukuran penyebaran dengan melibatkan deviasi kuadrat rata-rata Σ(mi−x)2f1
n 4. Standar Deviasi
Deviasi standar merupakan akar dari varians
Data yang berdistribusi normal / distribusi gauss adalah data yang pola distribusinya berbentuk lonceng dan simetris. Data yang diambil secara acak dan berdistribusi normal akan memudahkan dalam melakukan analisis dan meramalkan serta mengambil kesimpulan untuk cakupan yang lebih luas. Memiliki satu modus (disebut juga unimodal).
Ogive
Distribusi unimodal/bimodal
Distribusi frekuensi uniform
Distribusi frekuensi tidak umum
Uji Normalitas Distribusi Data 1. K-S
2. Shapiro-Wilk 3. Skewness 4. Kurtosis
Box plot
Violin plot
Sesi 10: Korelasi Antara 2 Variabel 1. Kekuatan dan arah korelasi
2. Mengestimasi korelasi data kategori 3. Mengestimasi korelasi data kontinum
4. Perbedaan antara korelasi dengan hubungan sebab-akibat (causal inference)
Koefisien korelasi adalah ukuran yang digunakan untuk mengetahui derajat hubungan
Pola hubungan
1. Korelasi positif (kanan naik) 2. Korelasi Negatif (kanan turun) 3. Tidak berkorelasi (acak) 4. Korelasi tidak linier (grafik) Ukuran korelasi
0 – 0,199 Sangat Rendah 0,2 – 0,399 Rendah 0,4 – 0,599 Sedang 0,6 – 0,799 Kuat 0,8 - 1 Sangat Kuat
Uji korelasi
1. Data nominal (Coeficient contingency, V-Cramer) 2. Data ordinal (korelasi spearman)
3. Data Kontinyu (Korelasi pearson)
Jenis korelasi
Berdasarkan arah pergantian nilai variable 1. Positive
2. Negative
Berdasarkan jumlah variabel
1. Simple correlation 2. Multiple correlation 3. Partial correlation
Berdasarkan konstanta rasion pergantian antar variabel 1. Linear correlation
2. Non-linear correlation
Koefisien korelasi pearson Syarat :
1. Berskala minimal interval (kontinyu) 2. Data distribusi normal
i Σ x¿
√
n Σ xi2−¿(¿)2 n Σ xiyi−Σ xiΣ yi
¿
Korelasi parsial melibatkan lebih dari satu variabel dependen dan lebih dari satu variabel independen
Korelasi ganda adalah Hubungan yang terjadi antara variabel dependen dengan lebih dari 1 variabel independen
Apabila beberapa variabel independen/bebas dihubungkan dengan satu variabel
dependen/tak bebas disebut korelasi berganda. Dan apabila satu variabel independen/bebas berhubungan dengan satu variabel dependent/takbebas disebut korelasi parsial.
Korelasi spearman digunakan untuk menganalisis hubungan pada variabel dengan skala data minimal ordinal
Coefficient contigency berguna untuk mengukur keeratan hubungan antara 2 variabel dengan skala data nominal
Necessary Condition for causal relationship:
1. Empirical association (korelasi)
2. Appropriate time order: sebab (faktor independen) ada sebelum dampak ada (faktor dependen)
3. Nonspuriousness: bukan terjadi karena variabel lain
Sesi 11: Gaya Bahasa yang Digunakan dalam Menginterpretasi Data dan Melaporkannya 1. Prinsip-prinsip dasar melaporkan interpretasi atas hasil analisis data melalui data tulis 2. Menarasikan uncertainty dengan hedging language
3. Menarasikan rentang kepercayaan (confidence interval) Ada tiga jenis audiens:
1. Komunitas akademik serumpun 2. Informed lay public
3. General lay public
Komunitas akdemik serumpun
Bidang medis : American medical association (AMA) Bidang Sosiologi : American sociological association (ASA)
Bidang Teknik : Institute of Electrical and electronics engoneers (IFEE) Bidang Psikologi : Ameican psychological association (APA)
Hedging language adalah gaya bahasa yang biasa digunakan ilmuwan untuk mengekspresikan kehati- hatian ketika mendiskusi ketidakpastian
Sesi 12:
1. Standar Error 2. Sampling Error
3. Menghitung Confidence Interval (Mean and SD) 4. Menginterpretasikan Confidence Interval
Semakin kecil standar error, maka estimasi rata-rata sampel terhadap rata-rata populasi maka semakin baik
Confidence interval adalah proses melakukan estimasi
Estimasi adalah proses memperkirakan nilai parameter dengan menggunakan nilai statistik
Estimasi terdapat estimasi titik dan estimasi interval
Estimator yang valid :
1. Unbiased : Nilai estimator sama dengan nilai yang diestimasi 2. Efisien : Estimator memiliki varian yang kecil
3. Konsisten :
Ukuran sampel bertambah = estimator mendekati parameter
Ukuran sampel bertambah tak terhingga = distribusi sampling estimator mengecil
Estimasi titik memperkirakan nilai parameter dengan menggunakan satu nilai statistik tertentu
Estimasi interval memperkirakan nilai parameter dengan menggunakan 2 nilai
Confidence interval adalah estimasi rentang nilai parameter populasi sebenarnya
Sesi 13: Mengorganisasi Data Teks
1. Mengorganisasi data verba dalam bentuk transkrip/verbatim 2. Penggunaan Wordcloud
Data kualitatif berbentuk non-angka
Data kualitatif berasal dari 1. Data penelitian sebelumnya 2. Data observasi peneliti 3. Data wawancara peneliti 4. Data catatan lapangan / visual
Langkah analisis dan penyajian data kualitatif 1. Mengorganisasikan data
2. Membaca dan membuat memo
3. Mendeskripsikan kasus dan konteksnya
4. Mengklarifikasikan data menjadi kode dan tema 5. Menafsirkan data
6. Menyajikan dan memvisualisasikan data
Langkah mengorganisasi data dan informasi 1. Transkripsi -> membuat uraian rinci 2. Reduksi data -> merangkum data 3. Koding data -> mengelompokkan data
Mengelola data hasil wawancara 1. Direkam dalam bentuk audio
2. Melakukan proses transkripsi sehingga verbatim
Sesi 14: Mengakses Sumber Daya Statistik Resmi dan Menjelaskan Metode Pemerolehan Data pada Surver Skala Besar