01/27/10 1
PENDAHULUAN
Pada setiap penelitian biasanya data dikumpulkan untuk sejumlah besar variabel, sehingga dapat
menyulitkan pemilihan uji statistik yang sesuai dan urutan penggunaannya
Pemilihan uji statistik perlu direncanakan sejak awal penelitian, sehingga analisis data dapat
memaksimalkan kualitas dan interpretasi dari temuan
PENDAHULUAN
Manfaat dari perencanaan analisis:
١) Pedoman untuk menganalisis data
٢) Membantu pada saat interpretasi dan
melaporkan hasil penelitian
٣) Menghasilkan analisis yang dapat
PERENCANAAN ANALISIS
UNTUK STUDI RCT
Sesuai dengan rincian pertanyaan penelitian
Perencanaannya meliputi:
١) Definisi operasional dari outcome primer
dan/atau sekunder
٢) Metoda statistik yang akan digunakan
٣) Pedoman untuk penyesuaian data dasar variabel
PERENCANAAN ANALISIS UNTUK
STUDI OBSERVASIONAL
Seringkali tidak memungkinkan untuk menyusun perencanaan lengkap secara spesifik, namun minimal berdasar pada hipotesis2 nya
Perencanaannya meliputi:
١) Definisi operasional dari variabel outcome dan
exposure
٢) Variabel pengganggu dari hubungan antara
DATA CHECKING & EDITING
Harus dilakukan sebelum melakukan analisis data
Tahap 1 dengan memeriksa distribusi dari masing2 variabel:
١) Untuk data kategorik, pastikan data sesuai
dengan kategori yang ada dan frekuensi dari masing2 kategori masuk akal
٢) Untuk data numerik, lakukan range check
DATA CHECKING & EDITING
Tahap 2 dengan melakukan consistency check untuk memeriksa konsistensi kaitan antara 2 atau lebih variabel:
١) Dengan cross-classification, contoh antara
seks dan paritas;
DATA CHECKING & EDITING
Tindakan yang harus dilakukan:
١) Kesalahan harus diperbaiki dengan merujuk ke
data aslinya (kuesioner) atau diisi sebagai missing value
٢) Bila datanya ekstrim tapi masih mungkin terjadi,
maka tidak perlu diganti
ANALISIS AWAL
Distribusi dari masing2 variabel untuk:
Checking ulang bahwa kesalahan telah diperbaiki
Lebih mengenal karakteristik dari populasi yang diteliti
SPESIFIKASI VARIABEL
UNTUK ANALISIS
Variabel2 dapat berperan lebih dari 1 dalam analisis Perlu dilakukan identifikasi:
Variabel yang sudah diketahui sebagai
pengganggu hubungan antara outcome-exposure
Variabel lain yang mungkin menjadi pengganggu nantinya
REDUKSI DATA
Sebelum melakukan analisis data secara formal, terkadang diperlukan untuk membuat variabel baru dengan
mengelompokkan beberapa variabel asli
REDUKSI DATA
2) Untuk variabel exposure numerik, pengelompokkan diperlukan untuk:
Menggunakan metoda berdasarkan stratifikasi
Menggunakan metoda grafik untuk memeriksa bagaimana outcome yang non-numerik berubah pada setiap tingkatan exposure
Memeriksa adanya hubungan liniar antara
REDUKSI DATA
Untuk variabel exposure numerik,
pengelompokkan dapat dilakukan dengan:
Misalnya quintiles, untuk pengelompokkan menjadi 5
Cut-off points berdasarkan data dari
ANALISIS UNI-VARIABEL
Dilakukan crude association antara exposure dan outcome, yaitu memeriksa hubungan antara outcome dengan masing2 exposure tanpa menghiraukan variabel2 lain dengan manfaat:
Memeriksa tabel atau grafik sederhana serta hubungan yang merupakan informasi mengenai masing2 data
Dapat memberikan pemikiran awal mengenai masing2
variabel tsb yang mempunyai hubungan kuat dengan outcome
ANALISIS VARIABEL PENGGANGGU
Untuk studi observasional mengontrol efek variabel pengganggu merupakan fokus utama analisis dengan:
Metoda Mantel-Haenszel berdasarkan stratifikasi
ANALISIS VARIABEL PENGGANGGU
Strategi memilih variabel pengganggu:
Membuat kerangka konsep untuk hubungan antara berbagai variabel dengan variabel outcome sebagai gambaran dari teori yang ada dan arah dari hubungan
Variabel yang sejak awal telah diketahui sebagai pengganggu harus dikontrol dalam analisis
Variabel pengganggu lainnya dapat ditemukan sebagai hasil analisis eksplorasi:
a) variabel yang berhubungan dengan outcome dan exposure namun bukan sebagai penyebab antara keduanya
b) berdasarkan data yang dianalisis dan pengetahuan yang ada serta setelah memperhatikan arah dari hubungannya
ANALISIS UNTUK INTERAKSI
Ada tiga interaksi yang harus dibedakan:
Interaksi antara variabel pengganggu
Interaksi antara variabel pengganggu dengan variabel exposure yang diteliti
ANALISIS YANG REPRODUKTIF
1. Masukkan file data mentah ke program statistik, buat label untuk setiap variabel supaya mudah diidentifikasi, check
ANALISIS YANG REPRODUKTIF
2. Gunakan data dalam file baru untuk memeriksa hubungan antara variabel
outcome dengan variabel2 exposure dan variabel pengganggu yang diteliti dengan menggunakan tabel, grafik serta
ANALISIS YANG REPRODUKTIF
3. Gunakan uji Mantel-Haenszel dan analisis regresi untuk mengetahui efek variabel exposure yang dikontrol oleh variabel pengganggu potensial
4. Periksa interaksi antara variabel outcome, exposure dan pengganggu
PERMASALAHAN PADA ANALISIS DAN INTERPRETASI DATA
١. Multiple comparisons, menghubungkan semua variabel
yang ada di luar hipotesis = data dredging akan
mengakibatkan pelaporan hasil yang tidak benar/palsu
٢. Subgroup analysis, kadang sangat menggoda untuk mengembangkan hasil yang menarik bila hipotesis tak terbukti
٣. Data-driven comparisons, sebaiknya tidak melakukan
pengelompokkan pada variabel exposure untuk
APA ITU STATISTIK
Statistik merupakan kegiatan untuk:
Mengumpulkan data
Meringkas/menyajikan data
Menganalisis data dengan metoda tertentu
Menginterpretasi hasil analisis tersebut.
MANFAAT STATISTIK
Memperkirakan rata2
JENIS STATISTIK
Statistik deskriptif: Berkaitan dengan
bagaimana data dikumpulkan dan diringkas
Statistik inferensi: Berkaitan dengan
JENIS DATA
Data kualitatif:
Data yang dinyatakan dalam bentuk bukan angka
Contoh: jenis pekerjaan,
status perkawinan, gender, kepuasan, dll
Harus dikuantifikasikan
dengan skor atau ranking
Data kuantitatif:
Data yang dinyatakan dalam bentuk angka
JENIS DATA
Data berskala nominal: data yang diperoleh dengan cara kategorisasi atau klasifikasi Contoh: jenis pekerjaan,
pegawai negeri, diberi tanda 1 pegawai swasta, diberi tanda 2 wiraswasta, diberi tanda 3
JENIS DATA
Data berskala ordinal: data yang diperoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data tsb terdapat hubungan
Contoh: kepuasan pelayanan,
sangat puas, diberi tanda 1 puas, diberi tanda 2
cukup puas, diberi tanda 3 tidak puas, diberi tanda 4
JENIS DATA
Data berskala interval: data yang diperoleh dengan cara pengukuran, di mana jarak dua titik pada skala sudah diketahui
Contoh: temperatur ruangan untuk air membeku dan mendidih
Celcius pada 0 sampai 100, jarak 100
Fahrenheit pada 32 sampai 212, jarak 180
JENIS DATA
Data berskala rasio: data yang diperoleh
dengan cara pengukuran, di mana jarak dua titik pada skala sudah diketahui, dan
mempunyai titik 0 yang absolut
Contoh: jumlah buku di perpustakaan
jika 5, berarti ada 5 buku, jika 0, berarti tidak ada buku sama sekali
JENIS DATA VERSUS UJI STATISTIK
Jenis data akan mempengaruhi pemilihan prosedur statistik yang akan digunakan:
Data kuantitatif akan menggunakan prosedur statistik parametrik;
Pengolahan Data Statistik
Statistik parametrik, berhubungan dengan inferensi statistik yang membahas
parameter2 populasi, seperti rata2, proporsi, dll.
Pengolahan Data Statistik
Statistik non-parametrik, berhubungan dengan inferensi statistik yang tidak membahas
parameter2 populasi
Cirinya: jenis data nominal atau ordinal, serta distribusi data (populasi) tidak diketahui
Pengolahan Data Statistik
Analisis univariat, di mana hanya ada satu pengukuran (variabel) untuk n sampel
(Alat analisis: uji t, uji F< ANOVA dsb)
Pemilihan uji statistik
Jumlah variabel
Analisis univariat Analisis multivariat
Jenis data
Interval, rasio Nominal, ordinal
Pengolahan data kuantitatif
Data interval/rasio
Ukuran Variasi Bentuk
Menguji normal tidaknya
distribusi data
Boxplot
Stem and Leaf
Kolmogorov-Smirnov
Plot
Boxplot:
jika MEDIAN terletak persis di tengah boxplot, maka distribusi data adalah normal Nilai di atas garis adalah outlier atau nilai ekstrem
Persentile (25) disebut HINGES
Persentile (50) atau MEDIAN
Stem and leaf
Frequency Stem Leaf
1,00 4 0
2,00 5 00
3,00 6 000
1,00 7 0
Kolmogorov-Smirnov dan Shapiro Wilk, bila nilai signifikansi < 0,05 maka distribusi adalah tidak normal
Kolmogorov-smirnov Shapiro-Wilk
Usia Statistik Df Sig. Statistik Df Sig
Belum menikah
0,176 35 0,008 0,926 35 0,033
Plot
Normal Q-Q plot Detrended Normal Q-Q
Kurtosis dan skewness
Jika rasio kurtosis (keruncingan) dan
skewness (kemiringan) berada di antara –2 sampai dengan +2, maka distribusi data
adalah normal
Rasio kurtosis = nilai kurtosis /SE kurtosis Rasio skewness = nilai skewness / SE
Penyebaran Data
Distribusi data normal: mean dan standar deviasi
Distribusi data tidak normal: median atau mode
Persentil biasanya 10, 25, 50, 75, 90
Distribusi data: skewness (kemiringan) dan kurtosis (keruncingan)
Analisis statistik (inferensi)
Digunakan untuk estimasi nilai suatu parameter populasi dan uji hipotesis
Bagan statistik inferensi
S tatistik P aram etrik
Uji Z Uji t
S atu populasi
Uji Z Uji t A NO V A /
Uji F B eb as
Uji t berpasangan B erhubungan Hubungan
antar sam ple Dua populasi