Managemen Data
- Pendahuluan
- Tujuan
- Pokok Bahasan
- Managemen Data Menggunakan Stata
- Format perintah stata
- Operator Pada Stata
- Membuat Strukrur Data
- Merekam Data
- Menyimpan dan Membuka Data
- Transformasi Data
- Compute
Klik "OK" untuk kembali ke properti variabel, lalu klik panah bawah dan pilih nama label yang Anda buat. Oleh karena itu, sebelum mulai merekam, aktifkan terlebih dahulu Data Editor dengan mengetikkan perintah edit atau klik Data pada menu bar, lalu pilih Data Editor, lalu pilih Data Editor (edit). Setelah muncul editor data, buatlah struktur data untuk variabel: ID, umur, jenis kelamin, berat badan, tinggi badan, dan diare, kemudian catat datanya seperti gambar di bawah ini:.
Tidak jarang dalam proses analisis data dalam suatu penelitian harus dibuat variabel baru dari data yang sudah ada, misalnya dalam analisis diperlukan variabel anemia, namun variabel tersebut belum ada, sedangkan variabel yang ada adalah Hb. Prosedur Recode digunakan untuk membuat variabel baru dengan cara mengubah nilai variabel lama, misalnya variabel umur diubah menjadi variabel klp_age sebagai berikut :. Proses perhitungan digunakan bila variabel baru yang ingin dibuat merupakan hasil perhitungan variabel lama, misalnya variabel imt akan dibuat dari variabel berat dan tinggi badan dengan menggunakan rumus imt=berat/(Tinggi Badan/100) 2.
Statistik Deskriptif
- Pendahuluan
- Tujuan
- Pokok Bahasan
- Statistik Deskriptif
- Statistik Deskritif Data Kategorikal
- Statistik Deskritif Data Kontinyu
- Latihan Analisis Deskriptif Dengan Stata
- Summarize
- Summarize by group
- Histogram
- Box plot
- Uji Normalitas Data
- Two-way Tables (Crosstabs)
Seperti pada contoh tabel cross-scatter di bawah ini, sel pertama menunjukkan jumlah sampel yang memiliki kebiasaan merokok dan menderita PJK. Ada tiga ukuran nilai tendensi sentral suatu data, yaitu nilai mean, nilai median, dan nilai paling sering (Modus). Jika sebaran datanya normal atau mendekati normal, maka mean, median, dan modusnya akan sama besarnya atau mendekatinya, sehingga ukuran tendensi sentral yang digunakan adalah mean.
Yang dimaksud dengan nilai mean di sini adalah “mean aritmatika”, yang diberi simbol x untuk sampel dan µ untuk populasi. Anda dapat menghitung nilai rata-rata suatu observasi dengan membagi jumlah seluruh nilai observasi dengan banyaknya observasi. Nilai tengah adalah nilai yang berada di tengah-tengah seluruh nilai pengamatan setelah diurutkan dari yang terkecil ke yang terbesar atau sebaliknya.
Sedangkan jika jumlah observasinya genap, maka mediannya adalah rata-rata dari dua nilai observasi yang paling tengah. Misal ada 6 observasi, maka nilai observasi yang di tengah adalah nilai observasi ke 3 dan ke 4. Selain ke arah mana hasil observasi tersebut bertemu, kita juga perlu mengetahui variasi antara nilai observasi yang satu dengan nilai observasi yang lain agar kita dapat mengetahui ciri-ciri kelompok subjek yang diamati dijelaskan lebih jelas.
Kita mengenal beberapa ukuran sebaran suatu kelompok data, yaitu: rentang, deviasi dari mean (deviasi standar), deviasi standar, dan koefisien variasi. Kisaran hasil pengamatan adalah jarak antara hasil pengamatan minimum dan maksimum. Besar kecilnya rentang hasil pengamatan hanya ditentukan oleh dua nilai ekstrim pengamatan yaitu minimum dan maksimum.
Tidak jarang nilai ekstrim tersebut jauh dari nilai umum yang diamati, sehingga kisaran bukanlah ukuran distribusi yang baik. Simpangan baku adalah akar jumlah kuadrat selisih antara nilai pengamatan dan nilai rata-rata dibagi derajat kebebasan (jumlah pengamatan – 1). Cara membuat boxplot hampir mirip dengan histogram: pilih menu Graphics pada toolbar lalu pilih Boxplot dan akan muncul kotak dialog mirip histogram.
Mean Comparison
- Pendahuluan
- Tujuan
- Pokok Bahasan
- One Sample T Test
- Indikasi
- Persyaratan
- Hipotesis
- Uji Statistik
- CI Perbedaan rerata
- Cara membuat kesimpulan
- Prosedur One sample T Test dengan STATA
- Interpretasi
- Paired Samples T Test
- CI perbedaan
- Prosedur Paired Samples T Test
- Independent Samples T Test
- Uji Statistik Homogenitas Varian
- Uji Statistik Perbedaan Rerata
- CI perbedaan rerata
- Cara membuat kesimpulan
- Prosedur Independent Samples T Test
- Interpretasi
Berdasarkan hasil tersebut dapat diartikan sebaran data TIO berdistribusi normal sehingga syarat untuk melakukan uji t satu sampel terpenuhi. Ho diterima jika angka nol berada di dalam CI, dan sebaliknya Ho ditolak jika angka nol berada di luar CI. Berdasarkan hasil tersebut dapat diartikan bahwa sebaran data efikasi sebelum dan sesudah pengobatan berdistribusi normal sehingga memenuhi syarat untuk dilakukan uji t sampel berpasangan.
Berdasarkan hasil analisis diperoleh nilai p-value (Ha: mean(diff) != 0 Pr(|T| > |t) artinya produktivitas setelah dilakukan intervensi ergonomi lebih tinggi dibandingkan sebelum intervensi. Uji Independent Samples T Test adalah bagian dari uji parametrik yang mengasumsikan bahwa data berdistribusi normal dan kedua kelompok mempunyai varians yang sama (homogen). Varians homogen dijelaskan untuk kedua sampel jika uji Levene menunjukkan p-value > α, dan sebaliknya dinyatakan tidak homogen jika nilai p ≤ α.
Uji statistik yang digunakan untuk menguji kebenaran hipotesis nol perbedaan mean dua sampel independen adalah Independent Samples T-test. Cara penghitungan nilai uji T pada uji Independent Samples T-test membedakan antara dua sampel yang homogen dan dua sampel yang tidak homogen. Ho diterima jika p-value > α atau nilai null terletak di dalam CI selisih mean, sedangkan Ho ditolak jika p-value ≤ α atau nilai null terletak di luar CI selisih mean. dari kedua kelompok.
Berdasarkan hasil tersebut dapat diartikan bahwa sebaran data kadar feritin pada kelompok kontrol dan kelompok kontrol berdistribusi normal sehingga syarat untuk melakukan uji Independent Sample t-test terpenuhi. Masukkan variabel Ferritin pada kotak variabel sebagai variabel yang akan diuji homogenitas (kesamaan) variannya, kemudian masukkan variabel kelompok pada variabel kelompok pembanding penentu. Berdasarkan hasil analisis diperoleh p-value (Pr > F) = 0,180 (dibulatkan) yang berarti asumsi equal variance terpenuhi sehingga jenis uji independen sample t-test yang dipilih adalah dimana sama asumsi varians terpenuhi.
Ketikkan variabel Ferritin pada nama variabel dan group pada nama variabel Group, karena asumsi equal variance terpenuhi maka pilihan Unequal Variance tidak perlu dicentang.
One-Way ANOVA
- Pendahuluan
- Tujuan
- Indikasi
- Persyaratan
- Hipotesis
- Uji Statistik
- Cara membuat kesimpulan uji Anova
- Uji Post Hoc
- Latihan
- Prosedur STATA
- Interpretasi
Berdasarkan uraian di atas, maka ringkasan analisis perhitungan varians pada One-Way Anova dapat disajikan sebagai berikut. Ho diasumsikan jika p-value > α yang berarti tidak terdapat kelompok yang berbeda. Ho ditolak jika p-value ≤ α yang berarti terdapat kelompok yang berbeda. Uji Post Hoc merupakan tindak lanjut analisis varians jika Ho ditolak dalam analisis varians.
Tes post hoc digunakan untuk menguji kelompok mana yang berbeda dengan cara membandingkan seluruh kelompok (perbandingan berganda). Uji statistik uji Post Hoc dikelompokkan menjadi dua kelompok, yaitu jenis uji Post Hoc jika semua kelompok mempunyai varian yang sama (homogen) dan jika variannya tidak homogen. Jenis uji Post Hoc untuk varians homogen antara lain LSD, Scheffe, Duncan, dll. dan untuk varians tidak homogen Thamhane, Dunnet, dll.
Penelitian eksperimental dengan rancangan acak lengkap dimana terdapat tiga kelompok eksperimen yaitu: kelompok kontrol, ekstrak seredelai dosis 50% dan ekstrak seredelai dosis 75%. Berdasarkan hasil tersebut dapat diartikan bahwa sebaran data kadar feritin pada kelompok kontrol masing-masing 50% dan 70% berdistribusi normal sehingga memenuhi syarat kinerja uji One-way ANOVA terpenuhi. Hasil analisis menunjukkan bahwa dosis 50% tidak memberikan pengaruh terhadap peningkatan Fe serum, sebaliknya dosis 75% terbukti memberikan pengaruh terhadap peningkatan Fe serum mencit sebesar 19,8 dan secara statistik terjadi peningkatan. signifikan (p-value = 0,043).
Korelasi & Regresi Linear
Korelasi
Dari scatter plot terlihat kekuatan dan arah hubungan kedua variabel tersebut. Jika seluruh koordinat (X,Y) terletak pada satu garis lurus, maka hubungan kedua variabel dinyatakan sempurna. Sebaliknya jika koordinat (X,Y) tersebar pada seluruh area grafik dan tidak menunjukkan bentuk tertentu, maka variabel-variabel tersebut dinyatakan tidak berhubungan.
Jika koordinat (X,Y) menyebar berbentuk elips, maka kedua variabel tersebut dikatakan mempunyai hubungan tidak sempurna. Arah hubungan kedua variabel X dan Y bisa positif atau searah dan bisa negatif atau berlawanan arah. Kedua variabel tersebut diindikasikan memiliki hubungan searah jika pada grafik terlihat bahwa jika nilai X meningkat maka nilai Y juga meningkat.
Sebaliknya kedua variabel dikatakan mempunyai hubungan negatif apabila dari scatter plot menunjukkan bahwa jika bernilai , dapat juga ditentukan oleh koefisien korelasi hubungan kedua variabel tersebut. Nilai r = 0, artinya kedua variabel tersebut independen sepenuhnya, atau nilai suatu variabel sama sekali tidak berhubungan dengan nilai variabel lainnya.
Jika nilai r dikatakan korelasi kecil, nilai r antara 0,4-0,69 dikatakan korelasi sedang, nilai r 0,7-0,99 dikatakan korelasi kuat, dan jika nilai r = 1 dikatakan hubungan sempurna antara kedua variabel tersebut. Sebaliknya jika nilai r positif maka kedua variabel mempunyai korelasi positif (searah). Perubahan kedua nilai variabel tersebut searah. Jika nilai salah satu variabel meningkat, maka nilai variabel lainnya juga akan meningkat.
Jika variabel yang akan kita pelajari hubungannya adalah variabel X dan Y, maka koefisien korelasi hubungan kedua variabel tersebut dapat dihitung sebagai berikut:
Regresi
Y = variabel terikat (variabel terikat) Xi = variabel bebas (variabel bebas) i bi = koefisien regresi variabel bebas i a = konstanta atau intersep. Data dari variabel hasil Y untuk setiap nilai variabel prediktor Misalnya dari hasil analisis dampak variabel independen
Sebaliknya jika nilai R2 = 0 menunjukkan bahwa variabel independen X sama sekali tidak berpengaruh terhadap variabel dependen Y. Jika persamaan regresi linier antara variabel bebas . Tahap pertama, seluruh variabel dimasukkan ke dalam model, kemudian variabel prediktor yang tidak berhubungan dengan variabel hasil dikeluarkan satu per satu dari model. Berbeda dengan metode Backward, pada metode ini variabel prediktor yang berpengaruh akan dimasukkan ke dalam model secara bertahap dari .. yang mempunyai pengaruh terbesar hingga yang terkecil.
Pada output STATA di atas, nilai VIF masing-masing prediktor adalah ≤ 10, sehingga dapat disimpulkan tidak terjadi multikolinearitas antar variabel prediktor. Pada hasil analisa diatas diperoleh p-value dari hasil Anova < 0,05 yang berarti terdapat variabel prediktor Xi yang mempengaruhi Y. Jika menggunakan metode ENTER untuk memilih variabel prediktor, dari hasil prediktor tersebut variabel dengan analisis Anova tidak dapat diketahui variabel prediktor mana yang mempengaruhi.
Sebaliknya jika metode pemilihannya menggunakan metode bertahap, maju atau mundur, maka akan diketahui variabel prediktor mana yang berpengaruh. Besarnya pengaruh variabel-variabel yang dimasukkan dalam model regresi dapat dilihat dari nilai R2 yang terdapat pada rangkuman model. Bila menggunakan metode pemilihan ENTER, nilai R2 yang diberikan merupakan nilai R2 gabungan seluruh variabel prediktor.
Bila menggunakan metode Stepwise atau Forward, R2 setiap variabel prediktor yang berpengaruh dapat dilihat dari nilai perubahan R2nya.