Membaca, Menyusun, dan Menginterpretasikan Data yang

(1)

Dapus 8-14

Sesi 8 : Membaca, Menyusun, dan Menginterpretasikan Data yang Disajikan dalam Tabel 1. Tidy data dan Pivoting (panjang [long] vs lebar [wide])

2. Membuat tabel distribusi frekuensi

3. Membuat tabel kontijensi (cross tabulation)

4. Menghitung probabilitas, persentase kolom dan baris, proporsi, rasio, dan rate dari tabel kontijensi

 Visualisasi dan tata letak tabel

 Baris merupakan record yang dapat berisi informasi mengenai unit analisis (case), mulai dari usia, gender, hasil pengukuran, atau yang lainnya.

 Kolom merupakan representasi dari variabel

 Dalam menyimpan data dalam bentuk tabel (set data/dataset), gunakan prinsip tidy 1. Satu kolom memuat satu variabel

2. Satu baris mewakili satu unit analisis (case) 3. Satu tabel mewakili satu observational unit

 Long form disarankan karena sesuai dengan prinsip tidy

 Wide form digunakan ketika peneliti ingin melihat tren

 Cara penyusunan tabel

1. Penyusunan secara alfabetis Memudahkan mencari nama 2. Penyusunan secara geografis

3. Penyusunan menurut besaran angka-angkanya 4. Penyusunan secara historis

5. Penyusunan atas dasar kelas-kelas yang lazim 6. Penyusunan secara progresif

7. Tabel distribusi frekuensi 8. Tabulasi silang

 Tabel distribusi frekuensi adalah tabel yang memuat data frekuensi dari tiap variabel

sehingga tiap case dalam tabel memuat frekuensi dari nilai tertentu. Contoh: Line graph, bar chart, histogram, dll

 Tabel distribusi frekuensi cocok digunakan untuk menyajikan data dari satu variabel

 Dalam kasus dua variabel, tabel kontijensi adalah teknik terbaik dalam menyajikan atau memproses data dalam kasus tertentu

 jenis variabel yang dapat disajikan dalam tabel kontijensi adalah variabel nominal

 Rasio adalah besaran relatif atau perbandingan dari dua nilai

 Proporsi adalah perbandingan sebagian dengan keseluruhan

 Rate merupakan salah satu bentuk pengukuran frekuensi yang menggambarkan

 suatu kejadian di suatu populasi dalam satu periode waktu tertentu

Sesi 9 : Distribusi Data, Tendensi Sentral, dan Dispersi (Variabilitas) 1. Menghitung tendensi sentral

(2)

2. Membedakan jenis-jenis distribusi data 3. Melakukan uji normalitas data

4. Menginterpretasi hasil uji normalitas data 5. Menginterpretasi boxplot dan violin plot

 Beberapa ukuran pemusatan/ ukuran sentral : 1. Rata-rata hitung (mean)

m n

2. Rata-rata terboboti 1

nΣ m. f (m=nilai tengah) 3. Median

B+ n 2−F Fm−F.i

( B= tepi bawah, F = Frekuensi kumulatif sebelum kelas median, Fm = Frekuensi kumulatif pada kelas median, I = interval kelas)

4. Modus

B+ f₀−f₋₁

(

^f0−f₋₁

)

⁺

(

^f0−f₊₁

)

^.i

(f0 = frekuensi kelas modus, F-1 = frekuensi sebelum kelas modus, f+1 = frekuensi setelah kelas modus)

5. Rata-rata ukur 6. Rata-rata harmonis

 Variabilitas/Dispersi Data 1. Range

Nilai terbesar dikurangi nilai terkecil Kelebihan range yaitu :

1. Perhitungannya sederhana

2. Perhitungan dapat dilakukan secara cepat

3. Sudah dapat menggambarkan ketersebaran data observasi Kelemahan range yaitu :

1. Hasil pengukurannya kasar

2. Perhitungan hanya berdasarkan pada dua titik ekstrim dalam distribusi sehingga informasi tentang pola ketersebaran nilai nilai observasi tidak didapatkan.

2. Inter Quartile Range (IQR) IQR = Q3 – Q1

Kisaran yang besar dari IQR menunjukkan variabilitas yang besar antara di tengah 50% pengamatan yang relevan

3. Varians

Ukuran penyebaran dengan melibatkan deviasi kuadrat rata-rata Σ(mi−x)²f1

n 4. Standar Deviasi

Deviasi standar merupakan akar dari varians

(3)

 Data yang berdistribusi normal / distribusi gauss adalah data yang pola distribusinya berbentuk lonceng dan simetris. Data yang diambil secara acak dan berdistribusi normal akan memudahkan dalam melakukan analisis dan meramalkan serta mengambil kesimpulan untuk cakupan yang lebih luas. Memiliki satu modus (disebut juga unimodal).

 Ogive

 Distribusi unimodal/bimodal

 Distribusi frekuensi uniform

 Distribusi frekuensi tidak umum

 Uji Normalitas Distribusi Data 1. K-S

2. Shapiro-Wilk 3. Skewness 4. Kurtosis

 Box plot

 Violin plot

Sesi 10: Korelasi Antara 2 Variabel 1. Kekuatan dan arah korelasi

2. Mengestimasi korelasi data kategori 3. Mengestimasi korelasi data kontinum

4. Perbedaan antara korelasi dengan hubungan sebab-akibat (causal inference)

 Koefisien korelasi adalah ukuran yang digunakan untuk mengetahui derajat hubungan

 Pola hubungan

1. Korelasi positif (kanan naik) 2. Korelasi Negatif (kanan turun) 3. Tidak berkorelasi (acak) 4. Korelasi tidak linier (grafik) Ukuran korelasi

0 – 0,199 Sangat Rendah 0,2 – 0,399 Rendah 0,4 – 0,599 Sedang 0,6 – 0,799 Kuat 0,8 - 1 Sangat Kuat

 Uji korelasi

1. Data nominal (Coeficient contingency, V-Cramer) 2. Data ordinal (korelasi spearman)

3. Data Kontinyu (Korelasi pearson)

 Jenis korelasi

Berdasarkan arah pergantian nilai variable 1. Positive

2. Negative

Berdasarkan jumlah variabel

(4)

1. Simple correlation 2. Multiple correlation 3. Partial correlation

Berdasarkan konstanta rasion pergantian antar variabel 1. Linear correlation

2. Non-linear correlation

 Koefisien korelasi pearson Syarat :

1. Berskala minimal interval (kontinyu) 2. Data distribusi normal

i Σ x_¿

√

^{n Σ x}i

2−¿(¿)² n Σ x_iy_i−Σ x_iΣ y_i

¿

 Korelasi parsial melibatkan lebih dari satu variabel dependen dan lebih dari satu variabel independen

 Korelasi ganda adalah Hubungan yang terjadi antara variabel dependen dengan lebih dari 1 variabel independen

 Apabila beberapa variabel independen/bebas dihubungkan dengan satu variabel

dependen/tak bebas disebut korelasi berganda. Dan apabila satu variabel independen/bebas berhubungan dengan satu variabel dependent/takbebas disebut korelasi parsial.

 Korelasi spearman digunakan untuk menganalisis hubungan pada variabel dengan skala data minimal ordinal

 Coefficient contigency berguna untuk mengukur keeratan hubungan antara 2 variabel dengan skala data nominal

Necessary Condition for causal relationship:

1. Empirical association (korelasi)

2. Appropriate time order: sebab (faktor independen) ada sebelum dampak ada (faktor dependen)

3. Nonspuriousness: bukan terjadi karena variabel lain

Sesi 11: Gaya Bahasa yang Digunakan dalam Menginterpretasi Data dan Melaporkannya 1. Prinsip-prinsip dasar melaporkan interpretasi atas hasil analisis data melalui data tulis 2. Menarasikan uncertainty dengan hedging language

3. Menarasikan rentang kepercayaan (confidence interval) Ada tiga jenis audiens:

1. Komunitas akademik serumpun 2. Informed lay public

3. General lay public

(5)

Komunitas akdemik serumpun

Bidang medis : American medical association (AMA) Bidang Sosiologi : American sociological association (ASA)

Bidang Teknik : Institute of Electrical and electronics engoneers (IFEE) Bidang Psikologi : Ameican psychological association (APA)

Hedging language adalah gaya bahasa yang biasa digunakan ilmuwan untuk mengekspresikan kehati- hatian ketika mendiskusi ketidakpastian

Sesi 12:

1. Standar Error 2. Sampling Error

3. Menghitung Confidence Interval (Mean and SD) 4. Menginterpretasikan Confidence Interval

 Semakin kecil standar error, maka estimasi rata-rata sampel terhadap rata-rata populasi maka semakin baik

 Confidence interval adalah proses melakukan estimasi

 Estimasi adalah proses memperkirakan nilai parameter dengan menggunakan nilai statistik

 Estimasi terdapat estimasi titik dan estimasi interval

 Estimator yang valid :

1. Unbiased : Nilai estimator sama dengan nilai yang diestimasi 2. Efisien : Estimator memiliki varian yang kecil

3. Konsisten :

Ukuran sampel bertambah = estimator mendekati parameter

Ukuran sampel bertambah tak terhingga = distribusi sampling estimator mengecil

 Estimasi titik memperkirakan nilai parameter dengan menggunakan satu nilai statistik tertentu

 Estimasi interval memperkirakan nilai parameter dengan menggunakan 2 nilai

 Confidence interval adalah estimasi rentang nilai parameter populasi sebenarnya

Sesi 13: Mengorganisasi Data Teks

1. Mengorganisasi data verba dalam bentuk transkrip/verbatim 2. Penggunaan Wordcloud

 Data kualitatif berbentuk non-angka

 Data kualitatif berasal dari 1. Data penelitian sebelumnya 2. Data observasi peneliti 3. Data wawancara peneliti 4. Data catatan lapangan / visual

 Langkah analisis dan penyajian data kualitatif 1. Mengorganisasikan data

(6)

2. Membaca dan membuat memo

3. Mendeskripsikan kasus dan konteksnya

4. Mengklarifikasikan data menjadi kode dan tema 5. Menafsirkan data

6. Menyajikan dan memvisualisasikan data

 Langkah mengorganisasi data dan informasi 1. Transkripsi -> membuat uraian rinci 2. Reduksi data -> merangkum data 3. Koding data -> mengelompokkan data

 Mengelola data hasil wawancara 1. Direkam dalam bentuk audio

2. Melakukan proses transkripsi sehingga verbatim

Sesi 14: Mengakses Sumber Daya Statistik Resmi dan Menjelaskan Metode Pemerolehan Data pada Surver Skala Besar