BIOSTATISTIK
Diah
Prihatiningsih Alexander Kurniawan Galuh
Juniarto
Nicea Roona Paranoan Aryanto
Maitri Anindita
CV HEI PUBLISHING
INDONESIA
BIOSTATISTIK
Penulis:
Diah Prihatiningsih
Alexander Kurniawan Galuh
Juniarto Nicea Roona Paranoan Aryanto
Maitri Anindita
ISBN:
Editor : Penyuntin
g :
Desain Sampul dan Tata Letak : Penerbit : CV HEI PUBLISHING
INDONESIA Nomor IKAPI 043/SBA/2023
Redaksi :
Jl. Air Paku No.29 RSUDRasidin, Kel. Sungai Sapih, Kec Kuranji Kota Padang Sumatera Barat
Website :
www.HeiPublishing.id Email : [email protected]
Cetakan pertama, Maret
undang-undang
Dilarang memperbanyak karyatulis ini dalambentuk dan dengan cara apapun tanpa izin tertulis dari penerbit.
KATA PENGANTAR
Puji syukur kepada Allah subhanahu waātaala atas rahmat dan karunia-Nya sehingga buku āBiostatistik", dapat terselesaikan dengan baik. Buku ini berisikan tentang Hubungan Statistik Dengan Penelitian, Statistik Deskriptif, Konsep Probabilitas, Konsep Distribusi Probabilitas, Konsep Hipotesis, Uji Beda 2 Mean Independen dan Dependen (Parametrik).
Semoga buku ini dapat menjadi referensi yang bermanfaat bagi mahasiswa, dosen, dan para profesional di bidang Biostatistik, serta siapa saja yang tertarik mempelajari Biostatistik. Terima kasih kepada semua pihak yang telah berkontribusi dalam penyusunan buku ini, Harapan terbesar buku ini dapat memberikan manfaat dan kontribusi positif dalam perkembangan ilmu pengetahuan.
Selamat membaca dan semoga bermanfaat.
Padang, Maret 2025
Penulis
ii
DAFTAR ISI
KATA PENGANTAR...i
DAFTAR ISI...ii
DAFTAR TABEL...v
DAFTAR GAMBAR...vi
BAB 1 HUBUNGAN STATISTIK DENGAN PENELITIAN.1 1.1...Peran Statistik dalam Metodologi Penelitian...1
1.1.1...Peran Statistik dalam Penelitian...1
1.1.2...Statistik dalam Perancangan Penelitian...3
1.1.3...Menentukan Ukuran Sampel dan Teknik Sampling...6
1.2...Penggunaan Statistik dalam Analisis Data Penelitian...9
1.2.1...Analisis Data dengan Statistik...9
1.2.2...Evaluasi dan Interpretasi Hasil Statistik...12
1.3...Analisis Data Statistik dalam Penelitian...14
1.3.1...Pengolahan dan Pembersihan data...14
1.3.2...Teknik Analisis Data...16
1.3.3...Interpretasi dan Pelaporan Hasil Statistik...19
1.4 Tantangan dan Keterbatasan Statistik dalam Penelitian...22
1.4.1...Tantangan dalam Penggunaan Statistik...22
1.4.2...Keterbatasan Statistik dalam Penelitian...24
1.5...A plikasi dan Implikasi Statistik dalam Penelitian
Multidisipliner
...
26
1.5.1...P enerapan Statistik dalam berbagai bidang penelitian
...
26
1.5.2 Etika dan Tantangan Penggunaan Statistik dalam Penelitian...28 DAFTAR PUSTAKA...31 BAB 2 STATISTIKA DESKRIPTIF DALAM
BIOSTATISTIKA
...
33
2.1...Pendahuluan ...33
2.2...Asal-usul Statistik Deskriptif...33
2.3...Definisi Statistik Deskriptif...34
2.4...Ukuran Pemusatan...34 2.5...Ukuran
Penyebaran...36
2.6...Distribusi Data ...37
2.7...Visualisasi Data...39
2.6 Pengolahan Data dalam Statistik Deskriptif....42 2.8...A
plikasi Statistik Deskriptif dalam Penelitian Kesehatan
...
44
2.9...Kesimpul an...46
iv
DAFTAR PUSTAKA...47 BAB 3 KONSEP PROBABILITAS...49
3.1...Pendahul uan...49
3.2...Pengertian Probabilitas...50
3.3...Dalil Probabilitas...53
3.4...Hubungan Antar Peristiwa...54
3.5...Teorema Bayes...59
DAFTAR PUSTAKA...62 BAB 4 KONSEP DISTRIBUSI PROBABILITAS...63
4.1...Pendahul uan...63
4.2...Distribusi Bernoulli...64
4.3...Distribusi Binomial...64
4.4...Distribusi Binomial Negatif...66
4.5...Distribusi Hipergeometrik...67
4.6...Distribusi Poisson...69
4.7...Distribusi Seragam Kontinu...70
4.8...Distribusi Normal dan Normal Standar...71
4.9 Distribusi ... 72
4.10...Distribusi Chi-Kuadrat...73
4.11...Distribusi Pearson...74
4.12...Macam- Macam Distribusi Probabilitas...76
4.13...Latihan Soal...77 DAFTAR PUSTAKA...78 BAB 5 KONSEP HIPOTESIS...79
5.1...Pengertian Hipotesis...79
5.2...Peran Hipotesis dalam Penelitian...82 5.3...Kriteria
Hipotesis yang Baik...86
5.4...Jenis-Jenis Hipotesis...89
5.5...Proses Merumuskan Hipotesis...92 5.6...Uji Hipotesis...94 DAFTAR PUSTAKA...101 BAB 6 UJI BEDA 2 MEAN INDEPENDEN
DAN DEPENDEN...103
6.1...Pendahuluan ...103
6.2...Konsep Dasar Statistik Parametrik...104
6.3...Konsep Uji Beda 2 Mean...107
6.4...Uji Beda 2 Mean Independen...109
6.5...Contoh Penggunaan Uji Beda 2 Mean Independen...112
6.6...Uji Beda 2 Mean Dependen...116
6.7...Contoh Penggunaan Uji Beda 2 Mean Independen...119 6.8...Pe
rbandingan Uji Beda 2 Mean Independen dan Dependen
vi
...
123
6.9...Aplikasi dalam Berbagai Jenis Penelitian Kedokteran...126
6.10...Perangkap dan Kesalahan Umum...129
DAFTAR PUSTAKA...132 BIODATA PENULIS
DAFTAR TABEL
Tabel 2.1. Distribusi kasus penyakit X berdasarkan kelompok usia dan jenis kelamin di
Kabupaten Y... 42 Tabel 2.2. Hasil integrasi SIMRS- SITB yang menunjukkan
bagian data yang telah dilakukan
pembersihan data duplikat atau dikenal dengan cleaning duplikasi, dapat dilihat pada simbol huruf kecil āaā
...
43
Tabel 2.3. Attack Rate Pada Kejadian Keracunan Pangan di Desa XX Puskesmas X Kabupaten Y
Pada Tanggal 21 April 2017...46
viii
DAFTAR GAMBAR
Gambar 2.1. Tampilan grafik yang membentuk seperti lonceng pada distribusi normal standar.37 Gambar 2.2. Tampilan grafik yang membentuk
seperti ekor lebih panjang di salah satu sisi pada
distribusi skewed...38 Gambar 2.3. Tampilan grafik pada distribusi binomial
untuk jawaban responden pengguna QR Code 38 Gambar 2.4. Tampilan grafik pada distribusi binomial
untuk jawaban responden pengguna QR Code 39 Gambar 2.5. Histogram dengan menggunakan
contoh kasus Masa Inkubasi (menit) pada KLB Keracunan Pangan di Desa XX Puskesmas X 05 Oktober
2018...40 Gambar 2.6. Box Plot dengan menggunakan
contoh kasus Masa Inkubasi pada KLB Keracunan Pangan di Desa XX Puskesmas X Kabupaten Y pada
05 Oktober 2018...40 Gambar 2.7. Scatter Plot dengan menggunakan
contoh kasus Berat Badan Ibu terhadap Berat Badan Bayi Lahir di Puskesmas X Kabupaten Y
Tahun 2018...41 Gambar 2.8. Stem-and-Leaf Plot dengan
menggunakan contoh kasus Masa Inkubasi pada KLB Keracunan Pangan di Desa XX Puskesmas X
Kabupaten Y pada 05 Oktober 2018...42 Gambar 2.9. Tren estimasi insidens dan mortalitas
tuberkulosis Indonesia tahun 2000- 2022
...
45
BAB 1
HUBUNGAN STATISTIK DENGAN PENELITIAN
Oleh Diah Prihatiningsih
1.1 Peran Statistik dalam Metodologi Penelitian
1.1.1 Peran Statistik dalam Penelitian
Statistik memainkan peran yang sangat penting dalam metodologi penelitian, memberikan dasar yang kuat untuk pengambilan keputusan, pengolahan data, dan interpretasi hasil. Tanpa penggunaan statistik, penelitian akan kehilangan arah dan akurasi dalam menyimpulkan hasil yang didapat. Dalam konteks metodologi penelitian, statistik tidak hanya digunakan untuk mengolah data, tetapi juga untuk merancang eksperimen, mengembangkan hipotesis yang dapat diuji, serta mengevaluasi kesimpulan penelitian.
1. Statistik dalam Penelitian
Statistik dalam penelitian merujuk pada teknik dan metode yang digunakan untuk mengumpulkan, menganalisis, dan menginterpretasikan data yang diperoleh dari berbagai sumber. Dalam penelitian ilmiah, statistik memiliki peran yang sangat penting dalam membantu peneliti mengorganisir data dengan cara yang sistematis dan mengidentifikasi pola atau hubungan antar variabel. Salah satu fungsi utama statistik adalah untuk menyediakan alat bagi peneliti dalam merumuskan dan menguji hipotesis.
Secara umum, statistik dalam penelitian berfungsi untuk:
a. Menganalisis data ā Statistik memungkinkan peneliti untuk menyusun data menjadi informasi yang bermakna. Data yang dikumpulkan melalui berbagai instrumen, seperti survei atau
2
eksperimen, perlu diolah secara sistematik agar dapat mengungkapkan pola, tren, dan hubungan antar variabel yang diuji (Sugiyono, 2017).
b. Menentukan validitas hasil ā Dengan menggunakan teknik statistik yang tepat, peneliti dapat memastikan bahwa data yang dikumpulkan adalah valid dan dapat diandalkan. Validitas ini penting untuk memastikan bahwa hasil penelitian tidak hanya bersifat kebetulan dan dapat diterapkan pada populasi yang lebih luas (Field, 2013).
c. Menguji hipotesis ā Statistik menyediakan berbagai uji statistik yang digunakan untuk menguji apakah hipotesis yang diajukan dalam penelitian dapat diterima atau ditolak. Uji hipotesis ini membantu peneliti untuk menentukan hubungan sebab-akibat antar variabel yang sedang diteliti (Arikunto, 2013).
Penggunaan statistik dalam penelitian tidak terbatas pada penelitian kuantitatif saja. Dalam penelitian kualitatif, statistik juga berfungsi untuk menganalisis data numerik yang mungkin dikumpulkan dalam bentuk survei atau wawancara terstruktur yang menghasilkan data kuantitatif yang dapat diolah secara statistik.
2. Signifikansi Statistik dalam Proses Penelitian
Signifikansi statistik dalam penelitian sangat penting karena membantu peneliti untuk menguji apakah temuan yang diperoleh dari sampel dapat digeneralisasi ke populasi yang lebih besar. Dengan kata lain, signifikansi statistik memberikan gambaran apakah hasil yang ditemukan dalam penelitian tersebut terjadi karena kebetulan atau karena pengaruh yang signifikan dari variabel yang diuji.
Dalam penelitian, signifikansi statistik umumnya diuji menggunakan uji hipotesis, di mana peneliti menetapkan tingkat signifikansi (alpha) yang diinginkan, sering kali sebesar 0,05 atau 0,01. Ini
4
menunjukkan bahwa peneliti siap menerima kemungkinan 5% atau 1% bahwa hasil yang ditemukan adalah kebetulan (Creswell, 2014). Jika nilai p yang diperoleh dari uji statistik lebih kecil dari tingkat signifikansi yang ditentukan, maka hipotesis nol dapat ditolak dan hipotesis alternatif diterima, yang berarti ada hubungan yang signifikan antara variabel yang diteliti.
Selain itu, signifikansi statistik memungkinkan peneliti untuk menilai kekuatan atau keandalan hasil penelitian. Dalam uji statistik seperti uji t, uji F, atau regresi linier, peneliti dapat menentukan seberapa besar kontribusi setiap variabel terhadap hasil yang diamati. Oleh karena itu, signifikansi statistik tidak hanya penting untuk validitas internal penelitian, tetapi juga untuk implikasi eksternal hasil penelitian terhadap dunia nyata (Sekaran & Bougie, 2016).
1.1.2 Statistik dalam Perancangan Penelitian
Perancangan penelitian yang baik adalah dasar dari setiap penelitian yang sukses. Statistik memainkan peran penting dalam menentukan desain penelitian yang tepat, pemilihan variabel yang relevan, serta skala pengukuran yang digunakan untuk mengumpulkan data.
Dengan menggunakan pendekatan statistik yang tepat, peneliti dapat memastikan bahwa data yang dikumpulkan dapat dianalisis secara objektif dan hasil penelitian dapat diinterpretasikan dengan benar.
1. Penentuan Desain Penelitian
Desain penelitian adalah rencana atau kerangka yang digunakan untuk mengumpulkan, menganalisis, dan menginterpretasikan data dalam penelitian. Statistik memiliki peran utama dalam menentukan jenis desain penelitian yang akan digunakan, apakah itu desain eksperimen, deskriptif, atau korelasional. Pemilihan desain yang tepat sangat penting karena akan mempengaruhi bagaimana data dikumpulkan dan dianalisis.
a. Desain Eksperimen
Dalam desain eksperimen, peneliti melakukan intervensi atau manipulasi terhadap satu atau lebih variabel independen untuk mengamati dampaknya terhadap variabel dependen. Statistik digunakan untuk merancang eksperimen yang sistematis dan untuk menentukan apakah
6
perubahan pada variabel independen memiliki pengaruh yang signifikan pada variabel dependen.
Contohnya, dalam penelitian yang menguji efek obat baru terhadap tekanan darah, statistik membantu dalam menentukan ukuran sampel yang tepat,
alokasi perlakuan, dan pengujian hipotesis menggunakan uji statistik yang relevan (Sugiyono, 2017).
b. Desain Deskriptif
Desain deskriptif digunakan untuk menggambarkan karakteristik dari suatu populasi atau fenomena tanpa mencoba untuk memanipulasi variabel. Statistik deskriptif, seperti mean, median, dan modus, digunakan untuk merangkum data dan memberikan gambaran umum tentang populasi yang diteliti. Sebagai contoh, dalam penelitian yang mempelajari tingkat kepuasan pelanggan terhadap layanan tertentu, statistik deskriptif digunakan untuk menghitung rata-rata skor kepuasan dan variasinya (Sugiyono, 2017).
c. Desain Korelasional
Desain korelasional digunakan untuk mengidentifikasi hubungan antara dua variabel atau lebih tanpa intervensi langsung dari peneliti.
Statistik digunakan untuk mengukur kekuatan dan arah hubungan antar variabel, sering kali menggunakan koefisien korelasi seperti Pearson atau Spearman. Desain ini sangat berguna dalam penelitian yang bertujuan untuk mengetahui apakah ada hubungan antara variabel yang ada dalam suatu populasi (Sugiyono, 2017).
2. Variabel dan Skala Pengukuran
Dalam setiap penelitian, peneliti harus mendefinisikan variabel-variabel yang akan diukur dan menentukan bagaimana pengukuran tersebut dilakukan. Variabel adalah atribut atau karakteristik yang dapat diukur dan bervariasi dalam suatu penelitian. Skala pengukuran merujuk pada cara variabel diukur dan tingkat pengukuran yang digunakan, yang mempengaruhi jenis analisis statistik
8
yang dapat dilakukan.
a. Jenis Variabel
Variabel dapat dibedakan menjadi beberapa jenis, tergantung pada peranannya dalam penelitian:
1) Variabel Independen (X): Variabel yang dikendalikan atau dimanipulasi oleh peneliti untuk mengamati pengaruhnya terhadap variabel dependen.
2) Variabel Dependen (Y): Variabel yang dipengaruhi oleh variabel independen dan diukur untuk menilai hasil eksperimen.
3) Variabel Kontrol: Variabel yang tidak dimanipulasi tetapi dikendalikan untuk memastikan bahwa pengaruh variabel independen dapat dilihat secara jelas terhadap variabel dependen (Cohen, 2013).
b. Skala Pengukuran
Skala pengukuran merujuk pada tingkat pengukuran yang digunakan untuk mengukur variabel dalam penelitian. Terdapat empat jenis skala pengukuran yang umum digunakan dalam penelitian:
1) Skala Nominal: Skala pengukuran yang digunakan untuk mengategorikan variabel tanpa ada urutan. Contohnya adalah jenis kelamin, status perkawinan, atau kategori profesi.
2) Skala Ordinal: Skala pengukuran yang menunjukkan urutan atau ranking, tetapi tidak menunjukkan jarak yang konsisten antara kategori. Misalnya, peringkat dalam kompetisi atau tingkat pendidikan.
3) Skala Interval: Skala pengukuran yang memiliki jarak yang konsisten antara nilai-nilai, tetapi tidak memiliki titik nol yang absolut.
Contoh: suhu dalam derajat Celsius.
4) Skala Rasio: Skala pengukuran yang memiliki jarak konsisten dan titik nol absolut, memungkinkan perbandingan rasio. Contohnya adalah pengukuran waktu, panjang, atau berat (Fowler, 2014).
Pemilihan skala pengukuran mempengaruhi jenis analisis statistik yang dapat diterapkan pada data.
Misalnya, data nominal hanya dapat dianalisis
10
menggunakan statistik deskriptif seperti frekuensi atau modus, sedangkan data interval dan rasio memungkinkan penggunaan analisis inferensial yang lebih kompleks, seperti uji t atau regresi linier (Tabachnick & Fidell, 2013). Dengan pemilihan skala pengukuran yang tepat, peneliti
dapat memilih metode statistik yang sesuai untuk menguji hipotesis dan mencapai kesimpulan yang valid.
1.1.3 Menentukan Ukuran Sampel dan Teknik Sampling Pengambilan sampel yang tepat adalah langkah krusial dalam penelitian, karena sampel yang representatif akan memastikan bahwa hasil penelitian dapat digeneralisasikan kepada populasi yang lebih besar.
Dalam perancangan penelitian, statistik berperan penting dalam membantu peneliti menentukan ukuran sampel yang tepat serta memilih teknik sampling yang sesuai untuk mencapai hasil yang valid dan dapat dipertanggungjawabkan.
1. Menentukan Ukuran Sampel
Ukuran sampel yang tepat sangat penting dalam penelitian untuk memastikan validitas dan kekuatan statistik dari hasil yang diperoleh. Ukuran sampel yang terlalu kecil dapat menghasilkan hasil yang kurang representatif dan meningkatkan risiko kesalahan tipe I (false positive) atau tipe II (false negative).
Sebaliknya, sampel yang terlalu besar dapat mengarah pada pemborosan sumber daya dan waktu tanpa memberikan peningkatan yang signifikan pada ketepatan hasil.
a. Faktor yang Mempengaruhi Ukuran Sampel
Beberapa faktor yang perlu dipertimbangkan dalam menentukan ukuran sampel antara lain:
1) Tingkat Kepercayaan (Confidence Level):
Tingkat kepercayaan adalah tingkat keyakinan bahwa hasil penelitian mencerminkan populasi secara akurat.
Biasanya, tingkat kepercayaan yang digunakan dalam penelitian adalah 95% atau 99%.
2) Margin of Error (MoE): Margin of error menunjukkan rentang kesalahan yang dapat
12
diterima dalam estimasi hasil penelitian.
Semakin kecil margin of error, semakin besar ukuran sampel yang dibutuhkan.
3) Variabilitas Populasi (Standard Deviation): Jika populasi yang diteliti sangat bervariasi, maka ukuran sampel yang lebih besar diperlukan untuk mencapai hasil yang akurat. Sebaliknya, jika populasi relatif homogen, ukuran sampel yang lebih kecil dapat memadai.
b. Rumus untuk Menentukan Ukuran Sampel
Salah satu rumus yang umum digunakan untuk menghitung ukuran sampel adalah rumus Cochran (1977) yang dirancang untuk sampel acak
sederhana:
Dimana:
1) = ukuran sampel yang dibutuhkan
2) Z = nilai Z yang sesuai dengan tingkat kepercayaan (misalnya, 1,96 untuk 95%
tingkat kepercayaan)
3) p = proporsi perkiraan populasi (jika tidak diketahui, gunakan 0,5 sebagai nilai
konservatif)
4) E = margin of error yang diterima (biasanya 0,05 atau 5%)
Rumus ini membantu peneliti menentukan ukuran sampel yang memadai untuk mendapatkan hasil yang representatif dan valid berdasarkan parameter yang telah ditentukan.
2. Teknik Sampling
Teknik sampling merujuk pada metode yang digunakan untuk memilih individu atau unit dari populasi untuk menjadi bagian dari sampel penelitian.
Pemilihan teknik sampling yang tepat sangat penting karena dapat mempengaruhi keakuratan dan generalisasi hasil penelitian. Berikut adalah beberapa teknik sampling yang umum digunakan dalam penelitian.
a. Sampling Acak Sederhana (Simple Random Sampling) Sampling acak sederhana adalah teknik di mana setiap individu dalam populasi memiliki peluang yang sama untuk dipilih sebagai bagian dari sampel. Teknik ini dianggap sebagai metode yang paling obyektif dan mengurangi
14
bias, karena setiap elemen populasi memiliki kesempatan yang sama untuk dimasukkan dalam sampel (Sekaran & Bougie, 2016). Misalnya, jika sebuah penelitian memiliki populasi 1000 orang,
maka dengan menggunakan
sampling acak sederhana, peneliti akan memilih sampel secara acak tanpa
memandang karakteristik individu.
b. Sampling Sistematis (Systematic Sampling)
Dalam teknik sampling sistematis, peneliti memilih elemen sampel dengan interval tertentu dari populasi yang terdaftar. Misalnya, jika ada 1000 individu dalam populasi dan peneliti ingin mengambil sampel 100 orang, mereka akan memilih setiap individu ke-10 (1000 dibagi 100).
Teknik ini lebih mudah diterapkan daripada sampling acak sederhana dan sering digunakan dalam penelitian di mana populasi terdaftar atau urutan sudah ada (Taherdoost, 2016).
c. Sampling Strata (Stratified Sampling)
Sampling strata digunakan ketika populasi terdiri dari kelompok atau subkelompok yang berbeda (strata), dan peneliti ingin memastikan bahwa setiap strata terwakili dalam sampel.
Teknik ini melibatkan pembagian populasi menjadi strata berdasarkan karakteristik tertentu (misalnya, usia, jenis kelamin, status sosial ekonomi) dan kemudian sampel diambil secara acak dari setiap strata. Sampling strata dapat meningkatkan presisi estimasi dan membuat sampel lebih representatif dibandingkan dengan sampling acak sederhana (Cochran, 1977).
d. Sampling Klaster (Cluster Sampling)
Dalam teknik sampling klaster, populasi dibagi menjadi beberapa kelompok atau klaster yang lebih kecil, dan sampel dipilih dengan cara acak dari beberapa klaster. Selanjutnya, semua elemen dalam klaster yang terpilih akan menjadi bagian dari sampel. Teknik ini sering digunakan dalam penelitian yang melibatkan populasi besar yang tersebar secara geografis, seperti penelitian di tingkat negara atau provinsi (Yin, 2018).
e. Sampling Bertujuan (Purposive Sampling)
Sampling bertujuan adalah teknik di mana peneliti memilih sampel berdasarkan karakteristik
16
tertentu yang relevan dengan tujuan penelitian.
Meskipun teknik ini tidak acak, namun digunakan ketika peneliti ingin mendapatkan informasi yang sangat spesifik dari sampel yang memiliki pengalaman atau kualifikasi tertentu (Etikan, Musa, &
Alkassim, 2016). Teknik ini sering diterapkan dalam penelitian kualitatif.
1.2 Penggunaan Statistik dalam Analisis Data Penelitian
1.2.1 Analisis Data dengan Statistik
Dalam penelitian, pengolahan dan analisis data adalah tahap krusial untuk menguji hipotesis dan menarik kesimpulan yang dapat dipertanggungjawabkan. Statistik menyediakan alat dan teknik yang diperlukan untuk mengolah data mentah menjadi informasi yang bermakna. Tanpa analisis yang tepat, data yang dikumpulkan bisa kehilangan nilai ilmiah.
1. Pengolahan Data Mentah
Pengolahan data mentah adalah tahap pertama dalam analisis statistik yang bertujuan untuk mempersiapkan data sehingga siap untuk dianalisis lebih lanjut. Proses ini sangat penting karena data yang belum diolah bisa saja mengandung kesalahan, inkonsistensi, atau informasi yang tidak relevan. Dalam pengolahan data mentah, peneliti melakukan beberapa langkah kunci, seperti:
a. Pembersihan Data (Data Cleaning):
Pembersihan data merupakan langkah awal yang penting untuk memastikan kualitas data. Pada tahap ini, peneliti memeriksa data untuk kesalahan atau nilai yang tidak valid, seperti data yang hilang, duplikat, atau input yang tidak sesuai.
Proses ini juga melibatkan pengidentifikasian dan penanganan outliers (nilai yang jauh dari rata- rata), yang dapat memengaruhi hasil analisis secara signifikan (Field, 2013).
b. Transformasi Data:
Transformasi data dilakukan untuk mengubah data mentah menjadi format yang lebih mudah dianalisis. Ini bisa melibatkan normalisasi data,
18
yaitu mengubah data menjadi skala yang lebih mudah dibandingkan, atau mengkategorikan data yang bersifat numerik menjadi kategori tertentu (misalnya, mengubah usia dalam bentuk rentang umur).
c. Penyusunan Dataset:
Setelah data dibersihkan dan ditransformasi, peneliti perlu menyusun dataset dalam format yang sesuai untuk analisis statistik. Ini bisa berupa tabel yang mengelompokkan variabel- variabel penelitian dan memungkinkan peneliti untuk memverifikasi hubungan antar variabel.
Pengolahan data mentah yang benar sangat penting karena kualitas analisis bergantung pada kualitas data yang ada. Semakin baik data yang diproses, semakin valid pula hasil analisis yang diperoleh.
2. Metode Analisis Statistik
Setelah data siap, langkah selanjutnya adalah melakukan analisis statistik. Metode yang digunakan dalam analisis data bergantung pada jenis data yang dikumpulkan dan tujuan penelitian.
a. Analisis Deskriptif
Analisis deskriptif digunakan untuk menggambarkan atau merangkum data sehingga peneliti dapat memperoleh pemahaman yang lebih baik tentang pola atau tren yang ada dalam data. Teknik ini termasuk perhitungan rata-rata (mean), median, modus, serta penyajian data dalam bentuk grafik dan tabel.
Analisis deskriptif membantu peneliti untuk menyajikan informasi secara ringkas dan mudah dipahami tanpa melakukan generalisasi lebih lanjut.
Contoh teknik analisis deskriptif termasuk:
1) Mean, Median, dan Modus: Ukuran pemusatan data yang memberikan informasi mengenai titik tengah distribusi data.
2) Standar Deviasi dan Varians: Ukuran penyebaran data yang menggambarkan sejauh mana data tersebar di sekitar nilai
20
rata-rata.
3) Distribusi Frekuensi: Digunakan untuk menggambarkan seberapa sering suatu nilai atau kategori muncul dalam dataset.
b. Analisis Inferensial
Analisis inferensial digunakan untuk membuat kesimpulan atau generalisasi mengenai populasi yang lebih besar berdasarkan sampel data yang dianalisis. Melalui teknik inferensial, peneliti dapat menguji hipotesis dan menentukan apakah hasil yang ditemukan dalam sampel dapat diterapkan pada seluruh populasi. Beberapa metode analisis inferensial yang umum digunakan meliputi:
1) Uji Hipotesis (Hypothesis Testing):
Digunakan untuk menguji klaim atau hipotesis yang diajukan dalam penelitian.
Salah satu metode yang sering digunakan adalah uji t (t-test) untuk membandingkan rata- rata dua kelompok atau uji ANOVA untuk lebih dari dua kelompok.
2) Regresi: Metode regresi digunakan untuk menganalisis hubungan antara satu atau lebih variabel independen (prediktor) dengan variabel dependen (hasil). Contohnya, regresi linier digunakan untuk memprediksi nilai variabel dependen berdasarkan hubungan linier dengan variabel independen.
3) Korelasi: Korelasi mengukur sejauh mana dua variabel saling berhubungan. Korelasi Pearson sering digunakan untuk data numerik, sedangkan korelasi Spearman digunakan untuk data ordinal.
c. Analisis Multivariat
Pada penelitian yang melibatkan lebih dari dua variabel, analisis multivariat digunakan untuk melihat hubungan antara banyak variabel secara bersamaan. Teknik ini meliputi analisis regresi berganda, analisis faktor, dan analisis klaster. Analisis multivariat memungkinkan peneliti untuk memahami hubungan yang lebih kompleks antara berbagai variabel yang saling
22
berinteraksi.
Metode analisis statistik yang tepat akan bergantung pada tujuan penelitian, desain penelitian, serta jenis data yang dikumpulkan. Oleh karena itu, pemahaman yang baik tentang metode- metode ini sangat penting untuk menghindari kesalahan dalam
analisis dan memastikan bahwa kesimpulan yang diambil valid dan dapat diandalkan.
1.2.2 Evaluasi dan Interpretasi Hasil Statistik
Evaluasi dan interpretasi hasil statistik merupakan langkah penting dalam penelitian, karena tahap ini menentukan apakah hipotesis yang diuji dapat diterima atau ditolak. Statistik menyediakan alat yang memungkinkan peneliti untuk menarik kesimpulan yang valid berdasarkan data yang dianalisis.
1. Uji Signifikansi
Uji signifikansi adalah prosedur statistik yang digunakan untuk menentukan apakah hasil yang diperoleh dari sampel cukup kuat untuk digeneralisasikan ke populasi yang lebih besar. Dengan kata lain, uji ini membantu peneliti untuk memutuskan apakah hipotesis yang diuji dapat diterima atau ditolak berdasarkan bukti data yang ada. Uji signifikansi memungkinkan peneliti untuk mengevaluasi apakah perbedaan atau hubungan yang ditemukan dalam data bersifat nyata atau hanya kebetulan semata.
a. Nilai p (p-value)
Salah satu aspek kunci dari uji signifikansi adalah nilai p, yang menunjukkan probabilitas bahwa hasil yang diperoleh terjadi secara kebetulan. Jika nilai p lebih kecil dari tingkat signifikansi yang telah ditentukan (misalnya, α = 0.05), maka hasil tersebut dianggap signifikan secara statistik, dan hipotesis nol (Hā) ditolak. Sebaliknya, jika nilai p lebih besar dari α, maka hasil tersebut tidak signifikan, dan hipotesis nol tidak ditolak.
b. Uji Statistik yang Umum Digunakan:
Beberapa uji statistik yang sering digunakan untuk menguji signifikansi antara lain:
1) Uji t (t-test): Digunakan untuk menguji perbedaan rata- rata antara dua kelompok.
24
2) Uji Chi-Square (ϲ): Digunakan untuk menguji hubungan antara dua variabel kategori.
3) Uji ANOVA (Analysis of Variance): Digunakan untuk membandingkan rata-rata lebih dari dua kelompok.
Uji signifikansi ini memberikan dasar yang kuat untuk menginterpretasikan hasil penelitian dan menentukan apakah hasil yang diperoleh dapat dipercaya secara statistik (Field, 2013).
2. Kesimpulan Berdasarkan Hasil Statistik
Setelah melakukan uji signifikansi dan memperoleh hasil yang valid, peneliti harus menginterpretasikan hasil tersebut dan menarik kesimpulan. Interpretasi hasil statistik bukan hanya tentang angka-angka yang diperoleh, tetapi juga tentang makna yang dapat diambil dari data tersebut dalam konteks penelitian.
a. Menarik Kesimpulan dari Uji Signifikansi:
Berdasarkan hasil uji signifikansi, peneliti dapat memutuskan apakah hipotesis yang diajukan diterima atau ditolak. Jika nilai p lebih kecil dari tingkat signifikansi (misalnya 0.05), maka hipotesis alternatif (Hā) diterima, yang berarti ada bukti yang cukup untuk mendukung perbedaan atau hubungan yang diuji. Jika nilai p lebih besar dari 0.05, hipotesis nol (Hā) diterima, yang berarti tidak ada cukup bukti untuk mendukung perbedaan atau hubungan yang diuji.
b. Pertimbangan Praktis dalam Kesimpulan:
Meskipun hasil uji signifikansi menunjukkan adanya perbedaan atau hubungan yang signifikan, peneliti juga perlu mempertimbangkan ukuran efek (effect size) dan relevansi praktis dari hasil tersebut. Ukuran efek mengukur seberapa besar pengaruh variabel independen terhadap variabel dependen dan memberikan gambaran yang lebih lengkap daripada sekadar uji signifikansi.
c. Generalisasi dan Implikasi:
Setelah kesimpulan statistika dibuat, peneliti harus mempertimbangkan apakah hasil
26
penelitian dapat digeneralisasikan ke populasi yang lebih besar. Jika penelitian dilakukan dengan sampel yang representatif, maka hasilnya dapat diperluas ke populasi secara lebih luas. Peneliti juga harus menghubungkan hasil penelitian dengan teori yang ada atau temuan sebelumnya untuk memberikan pemahaman yang lebih mendalam.
Dengan evaluasi yang hati-hati dan interpretasi yang tepat, hasil statistik dapat memberikan wawasan yang berguna bagi perkembangan ilmu pengetahuan dan praktik dalam berbagai bidang (Creswell, 2014).
1.3 Analisis Data Statistik dalam Penelitian
1.3.1 Pengolahan dan Pembersihan data
Pengolahan dan pembersihan data adalah tahap awal yang sangat penting dalam analisis data statistik.
Sebelum peneliti dapat menarik kesimpulan atau menguji hipotesis, data yang dikumpulkan harus dipersiapkan dengan benar. Pengolahan data memastikan bahwa data siap digunakan untuk analisis lebih lanjut, sementara pembersihan data bertujuan untuk memastikan bahwa data yang digunakan adalah akurat dan valid.
1. Pengolahan Data
Pengolahan data adalah langkah pertama dalam analisis statistik yang melibatkan transformasi data mentah menjadi format yang lebih terstruktur dan siap dianalisis. Pada tahap ini, data yang telah dikumpulkan melalui survei, eksperimen, atau observasi akan diproses untuk memastikan bahwa data tersebut dapat digunakan untuk analisis statistik lebih lanjut.
a. Kategorisasi Data
Pengolahan data dimulai dengan mengelompokkan data berdasarkan kategori tertentu, baik itu variabel numerik maupun kategorikal. Misalnya, jika penelitian melibatkan data tentang usia dan jenis kelamin, usia akan digolongkan dalam rentang tertentu (misalnya, usia 20-30, 31-40), sementara jenis kelamin akan dikategorikan sebagai laki- laki atau perempuan.
Pengelompokan ini penting untuk mempermudah analisis statistik dan memastikan konsistensi dalam pengolahan data.
b. Penanganan Data Hilang (Missing Data)
28
Salah satu bagian penting dalam pengolahan data adalah penanganan data yang hilang. Data yang hilang dapat muncul karena responden tidak menjawab beberapa pertanyaan atau kesalahan dalam pencatatan data. Tergantung pada
penyebabnya, data hilang dapat ditangani dengan berbagai cara, seperti imputasi (mengisi data yang hilang dengan nilai perkiraan berdasarkan data lainnya), menghapus observasi dengan data hilang, atau menggunakan metode analisis yang robust terhadap data yang hilang (Little & Rubin, 2019).
c. Normalisasi dan Transformasi Data
Dalam beberapa kasus, data perlu dinormalisasi atau ditransformasi untuk memastikan bahwa analisis statistik yang digunakan memberikan hasil yang valid. Misalnya, data yang memiliki distribusi sangat miring mungkin perlu diubah menggunakan transformasi logaritmik untuk membuat distribusi data lebih mendekati distribusi normal. Transformasi ini membantu meningkatkan akurasi hasil analisis statistik, terutama untuk metode yang mengasumsikan distribusi normal (Tabachnick & Fidell, 2013).
2. Pembersihan Data
Pembersihan data adalah proses identifikasi dan perbaikan kesalahan atau inkonsistensi dalam data yang dapat mengurangi kualitas hasil penelitian.
Data yang tidak bersih dapat menyebabkan kesalahan dalam analisis statistik dan merusak kesimpulan yang ditarik dari penelitian.
Pembersihan data melibatkan beberapa langkah, yang masing-masing bertujuan untuk meningkatkan akurasi dan konsistensi data yang digunakan.
a. Deteksi dan Penanganan Outliers
Outliers atau nilai yang jauh berbeda dari data lainnya sering kali dapat mempengaruhi hasil analisis statistik. Misalnya, dalam penelitian tentang pendapatan, seseorang yang memiliki pendapatan jauh lebih tinggi dari yang lain mungkin dianggap sebagai outlier. Outliers dapat dikenali
30
melalui visualisasi data seperti boxplot atau dengan menggunakan metode statistik tertentu, seperti z-scores atau IQR (Interquartile Range).
Setelah diidentifikasi, peneliti harus memutuskan apakah akan menghapus, mengganti, atau mempertahankan nilai outlier tersebut, tergantung pada sifat data dan tujuan penelitian (Barnett &
Lewis, 1994).
b. Validasi dan Konsistensi Data
Selanjutnya, penting untuk memastikan bahwa data yang digunakan dalam penelitian konsisten dan valid. Misalnya, jika ada data yang tidak sesuai dengan kategori yang diharapkan, seperti jenis kelamin yang tercatat sebagai
"perempuan" tetapi berisi angka, ini harus diperbaiki. Proses validasi melibatkan pengecekan format data untuk memastikan bahwa informasi yang dimasukkan sesuai dengan kategori yang ditentukan dan bahwa tidak ada kesalahan pengetikan atau ketidaksesuaian dalam data.
c. Penyatuan Data dari Sumber Berbeda
Jika data dikumpulkan dari berbagai sumber, penting untuk memastikan bahwa data dari sumber-sumber tersebut disatukan dengan benar. Misalnya, dalam penelitian yang melibatkan data dari survei online dan wawancara tatap muka, data harus digabungkan dalam satu format yang konsisten dan dapat dibandingkan. Pembersihan ini juga mencakup penggabungan duplikat dan pemrosesan variabel yang mungkin memiliki cara pengkodean yang berbeda antara sumber data.
1.3.2 Teknik Analisis Data
Teknik analisis data adalah metode yang digunakan untuk mengolah dan menginterpretasikan data dalam penelitian. Dalam analisis statistik, teknik- teknik ini dibagi menjadi dua kategori utama, yaitu Analisis Deskriptif dan Analisis Inferensial. Kedua teknik ini memainkan peran penting dalam menyajikan informasi yang diperoleh dari data, dengan tujuan untuk memberikan wawasan yang lebih dalam tentang fenomena yang diteliti.
1. Analisis Deskriptif
32
Analisis deskriptif adalah teknik statistik yang digunakan untuk menggambarkan atau meringkas data tanpa membuat kesimpulan atau inferensi yang lebih jauh. Teknik ini memberikan gambaran umum tentang data yang telah dikumpulkan dan menyajikan informasi yang mudah dipahami. Dalam analisis deskriptif, peneliti tidak berusaha untuk menguji hipotesis atau
membuat prediksi, tetapi lebih fokus pada pemahaman karakteristik dasar dari data tersebut.
a. Ukuran Pemusatan Data
Salah satu aspek utama dari analisis deskriptif adalah penghitungan ukuran pemusatan, yang memberikan informasi tentang nilai pusat dari distribusi data. Beberapa ukuran pemusatan yang umum digunakan adalah:
1) Mean (Rata-rata): Merupakan nilai rata-rata yang diperoleh dengan menjumlahkan semua nilai dalam dataset dan membaginya dengan jumlah data.
2) Median: Nilai tengah dalam dataset ketika data diurutkan dari yang terkecil hingga terbesar.
3) Mode (Modus): Nilai yang paling sering muncul dalam dataset.
Ukuran-ukuran ini membantu peneliti memahami bagaimana data tersebar dan
memberikan gambaran mengenai
kecenderungan umum dalam data. Misalnya, dalam penelitian pendidikan, peneliti dapat menggunakan ukuran pemusatan untuk menggambarkan rata-rata nilai ujian siswa (Tabachnick & Fidell, 2013).
b.Ukuran Penyebaran Data
Selain ukuran pemusatan, analisis deskriptif juga melibatkan ukuran penyebaran data, yang menggambarkan sejauh mana data tersebar.
Beberapa ukuran penyebaran yang umum digunakan adalah:
1) Range (Rentang): Selisih antara nilai terbesar dan terkecil dalam dataset.
2) Variance (Varians): Rata-rata kuadrat perbedaan antara nilai data dan rata-rata.
3) Standard Deviation (Simpangan Baku): Akar kuadrat dari varians, yang mengukur seberapa jauh data tersebar di sekitar rata-rata.
34
Ukuran penyebaran ini penting untuk memahami seberapa homogen atau heterogen data yang ada.
Sebagai contoh, dalam penelitian tentang kepuasan pelanggan, simpangan baku yang rendah menunjukkan bahwa sebagian besar pelanggan memiliki
pengalaman yang serupa, sementara simpangan baku yang tinggi menunjukkan variasi yang besar dalam pengalaman pelanggan (Field, 2013).
2. Analisis Inferensial
Analisis inferensial adalah teknik statistik yang digunakan untuk membuat kesimpulan atau prediksi tentang populasi berdasarkan data sampel.
Berbeda dengan analisis deskriptif, yang hanya menggambarkan data, analisis inferensial memungkinkan peneliti untuk menguji hipotesis dan menarik kesimpulan yang lebih luas dari data yang diperoleh. Analisis inferensial mencakup berbagai metode statistik, seperti uji hipotesis, regresi, dan analisis varians.
a. Uji Hipotesis
Uji hipotesis adalah prosedur yang digunakan untuk menentukan apakah ada cukup bukti dalam data untuk mendukung atau menolak suatu hipotesis. Dalam uji hipotesis, peneliti menentukan dua hipotesis, yaitu hipotesis nol (Hā) dan hipotesis alternatif (Hā). Hipotesis nol menyatakan tidak ada perbedaan atau hubungan yang signifikan dalam data, sementara hipotesis alternatif menyatakan sebaliknya. Peneliti kemudian menggunakan data untuk menghitung nilai uji statistik dan membandingkannya dengan nilai kritis untuk menentukan apakah hipotesis nol dapat diterima atau ditolak (Cohen, 2013).
b. Interval Kepercayaan (Confidence Interval)
Dalam analisis inferensial, interval kepercayaan digunakan untuk memberikan rentang nilai yang mungkin mengandung parameter populasi yang tidak diketahui, berdasarkan sampel data.
Misalnya, jika kita mengestimasi rata-rata tinggi badan dalam sebuah populasi, kita dapat
36
menyatakan bahwa rata-rata tinggi badan kemungkinan berada dalam interval tertentu, dengan tingkat kepercayaan 95%.
c. Regresi dan Korelasi
Metode regresi digunakan untuk mengevaluasi hubungan antara satu atau lebih variabel independen dan variabel
dependen. Analisis regresi linear, misalnya, digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen.
Sedangkan analisis korelasi digunakan untuk mengukur kekuatan dan arah hubungan antara dua variabel. Analisis ini sangat berguna dalam penelitian sosial dan kesehatan untuk memahami bagaimana faktor-faktor tertentu berhubungan satu sama lain (Hair et al., 2010).
d. Analisis Varian (ANOVA)
Analisis varian (Analysis of Variance, ANOVA) digunakan untuk menguji apakah ada perbedaan yang signifikan antara rata-rata dari dua kelompok atau lebih. Teknik ini sering digunakan ketika peneliti ingin membandingkan lebih dari dua grup dalam suatu eksperimen.
1.3.3 Interpretasi dan Pelaporan Hasil Statistik
Interpretasi dan pelaporan hasil statistik adalah dua aspek yang sangat penting dalam setiap penelitian yang menggunakan analisis statistik. Setelah data dianalisis, peneliti perlu menginterpretasikan hasil yang diperoleh secara tepat dan menyusunnya dalam format yang dapat dipahami oleh pembaca. Dengan pelaporan yang jelas, peneliti dapat mengkomunikasikan temuan penelitian secara efektif dan memungkinkan orang lain untuk menilai validitas serta relevansi hasil tersebut.
1. Interpretasi Hasil
Interpretasi hasil statistik adalah proses untuk menjelaskan makna dari temuan yang diperoleh setelah data dianalisis. Tahap ini sangat penting karena meskipun analisis statistik memberikan angka dan hasil matematis, pengertian tentang bagaimana angka-angka tersebut berhubungan dengan fenomena yang diteliti harus dipahami dan disampaikan dengan cara yang tepat.
a. Menyimpulkan Temuan Statistik
38
Setelah uji hipotesis atau analisis dilakukan, peneliti harus menginterpretasikan nilai-nilai statistik yang diperoleh, seperti nilai p, koefisien korelasi, atau rata-rata. Peneliti harus menentukan apakah hasil tersebut signifikan atau tidak berdasarkan tingkat signifikansi yang telah ditentukan sebelumnya. Misalnya, jika nilai p kurang dari 0,05, maka
dapat disimpulkan bahwa hasil tersebut signifikan secara statistik dan hipotesis nol dapat ditolak.
b. Konteks Penelitian
Interpretasi hasil harus selalu dilakukan dalam konteks penelitian. Hal ini berarti peneliti harus memastikan bahwa hasil yang ditemukan sesuai dengan teori atau hipotesis yang diajukan sebelumnya. Sebagai contoh, dalam penelitian tentang pengaruh obat terhadap tekanan darah, hasil analisis statistik yang menunjukkan penurunan tekanan darah yang signifikan harus dipertimbangkan dalam konteks dosis obat yang digunakan, durasi penggunaan, serta karakteristik sampel.
c. Batasan Interpretasi
Selain menarik kesimpulan utama, peneliti juga harus menyampaikan batasan dari interpretasi hasil. Ini mencakup pertimbangan seperti ukuran sampel, potensi kesalahan dalam data, serta kemungkinan bias yang dapat mempengaruhi temuan. Ini penting agar pembaca atau pengguna hasil penelitian dapat memahami konteks di mana hasil tersebut dapat diterapkan.
2. Pelaporan Hasil
Pelaporan hasil statistik adalah cara peneliti menyampaikan temuan mereka kepada audiens, baik itu dalam bentuk laporan penelitian, artikel jurnal, atau presentasi. Pelaporan yang baik tidak hanya mencakup hasil yang diperoleh, tetapi juga cara peneliti mengkomunikasikan interpretasi dan implikasi dari temuan tersebut secara jelas dan terstruktur.
a. Struktur Pelaporan Statistik
Pelaporan hasil statistik biasanya mengikuti format yang sistematis dan terstruktur.
Sebagian besar laporan penelitian, terutama yang
40
dipublikasikan dalam jurnal ilmiah, mengikuti struktur tertentu yang meliputi:
1) Pendahuluan: Menjelaskan tujuan penelitian, pertanyaan penelitian, dan hipotesis yang diuji.
2) Metode: Menggambarkan desain penelitian, sampel yang digunakan, teknik pengumpulan data, dan alat analisis statistik yang digunakan.
3) Hasil: Menyajikan hasil analisis statistik secara rinci. Ini dapat meliputi tabel, grafik, dan angka statistik seperti mean, standar deviasi, nilai p, dan lainnya.
4) Diskusi: Menginterpretasikan hasil, membandingkan temuan dengan hipotesis, serta membahas keterbatasan penelitian dan implikasi praktis dari temuan.
b. Penyajian Data dalam Tabel dan Grafik
Penting untuk menyajikan hasil analisis dalam bentuk yang mudah dipahami oleh pembaca.
Salah satu cara untuk melakukan ini adalah dengan menggunakan tabel atau grafik. Tabel memberikan detail numerik yang lebih lengkap, sementara grafik (seperti diagram batang, grafik garis, atau diagram pencar) dapat membantu untuk menggambarkan hubungan antara variabel dengan cara yang lebih visual dan mudah dipahami. Penyajian hasil dalam bentuk tabel dan grafik harus jelas dan memadai, dengan penjelasan yang memadai tentang setiap elemen.
c. Penggunaan Bahasa yang Jelas dan Objektif
Pelaporan hasil statistik harus dilakukan dengan bahasa yang jelas, tepat, dan objektif. Hindari penggunaan istilah yang ambigu atau terlalu teknis tanpa penjelasan yang cukup. Peneliti juga harus menghindari penyajian data secara selektif (misalnya, hanya melaporkan hasil yang sesuai dengan harapan) dan harus jujur dalam melaporkan semua temuan, baik yang mendukung hipotesis maupun yang tidak mendukung.
d. Menghubungkan Hasil dengan Tujuan Penelitian Setelah hasil dianalisis dan dipresentasikan,
42
peneliti harus menjelaskan bagaimana temuan tersebut mendukung atau menantang hipotesis penelitian dan apa implikasinya bagi bidang studi yang lebih luas. Pelaporan hasil harus menunjukkan relevansi temuan dengan tujuan penelitian serta kontribusinya terhadap pengetahuan yang ada.
1.4 Tantangan dan Keterbatasan Statistik dalam Penelitian
Meskipun statistik adalah alat yang sangat penting dalam penelitian, ada berbagai tantangan dan keterbatasan yang dapat mempengaruhi penggunaannya. Tantangan ini dapat muncul pada berbagai tahap penelitian, mulai dari pengumpulan data hingga analisis statistik. Salah satu tantangan terbesar adalah memastikan bahwa data yang digunakan valid dan bahwa teknik statistik yang diterapkan sesuai dengan tujuan penelitian.
1.4.1 Tantangan dalam Penggunaan Statistik 1. Masalah Validitas Data
Validitas data adalah sejauh mana data yang dikumpulkan mewakili fenomena yang sebenarnya ingin diteliti. Tanpa validitas yang baik, hasil analisis statistik tidak akan mencerminkan kenyataan dan dapat menghasilkan kesimpulan yang salah atau menyesatkan. Salah satu tantangan terbesar dalam penelitian adalah memastikan bahwa data yang dikumpulkan adalah valid dan dapat dipercaya.
a. Jenis-jenis Validitas yang Perlu Diperhatikan
Beberapa jenis validitas yang perlu diperhatikan dalam penelitian statistik antara lain:
1) Validitas Internal: Menyatakan apakah hubungan antara variabel yang diuji dalam eksperimen benar-benar mencerminkan hubungan sebab-akibat, tanpa dipengaruhi oleh faktor lain yang tidak terkendali.
2) Validitas Eksternal: Menyatakan sejauh mana temuan penelitian dapat digeneralisasikan ke populasi yang lebih luas.
3) Validitas Pengukuran: Berkaitan dengan seberapa akurat instrumen pengukuran yang digunakan dalam penelitian dapat menangkap variabel yang dimaksud.
Masalah validitas data dapat muncul dalam
44
berbagai bentuk, seperti adanya bias dalam pengambilan sampel, kesalahan dalam pengukuran, atau ketidaktepatan instrumen yang digunakan untuk mengumpulkan data. Peneliti harus memastikan bahwa instrumen yang digunakan dalam
pengumpulan data sudah teruji validitasnya dan bahwa data yang diambil benar-benar representatif terhadap populasi yang diteliti (Dharmawan, 2018).
Sebagai contoh, dalam penelitian mengenai pengaruh sosial media terhadap perilaku remaja, jika instrumen survei yang digunakan tidak cukup valid untuk mengukur dampak sosial media secara akurat, maka hasil penelitian yang diperoleh akan dipertanyakan. Validitas pengukuran yang baik akan memastikan bahwa hasil yang diperoleh relevan dengan fenomena yang diteliti.
2. Kesalahan dalam Pemilihan Teknik Statistik
Kesalahan dalam pemilihan teknik statistik adalah tantangan umum lainnya yang sering dihadapi dalam penelitian. Pemilihan teknik yang salah atau tidak tepat dapat menyebabkan kesalahan dalam analisis dan interpretasi data, yang pada akhirnya akan mempengaruhi validitas kesimpulan penelitian.
a. Pemilihan Teknik yang Tidak Sesuai dengan Jenis Data
Salah satu kesalahan yang sering terjadi adalah memilih teknik statistik yang tidak sesuai dengan jenis data yang dikumpulkan. Misalnya, menggunakan analisis regresi linier untuk data yang tidak terdistribusi normal, atau menggunakan uji t untuk data yang memiliki lebih dari dua kelompok atau kategori. Pemilihan teknik yang tidak tepat dapat menghasilkan kesimpulan yang salah.
b. Kurangnya Pemahaman tentang Asumsi Statistik Setiap teknik statistik memiliki asumsi tertentu yang harus dipenuhi agar hasil analisis dapat dipercaya. Sebagai contoh, banyak uji statistik, seperti uji t atau ANOVA, mengasumsikan bahwa data mengikuti distribusi normal. Jika asumsi ini tidak dipenuhi, maka hasil uji statistik tersebut
46
dapat menghasilkan kesimpulan yang bias atau salah. Oleh karena itu, penting bagi peneliti untuk memeriksa asumsi-asumsi statistik sebelum menerapkan teknik analisis tertentu (Kusnendi
& Suryani, 2020).
1.4.2 Keterbatasan Statistik dalam Penelitian
Meskipun statistik memberikan kontribusi besar terhadap pemahaman dan analisis data dalam penelitian, ada beberapa keterbatasan yang harus diperhatikan oleh peneliti. Keterbatasan ini sering kali berkaitan dengan asumsi-asumsi yang harus dipenuhi dalam model statistik serta kesulitan dalam menangani variabel yang tidak dapat diukur secara langsung.
1. Ketergantungan pada Asumsi
Sebagian besar teknik statistik, terutama dalam analisis inferensial, bergantung pada asumsi-asumsi tertentu yang harus dipenuhi agar hasil analisis menjadi valid dan dapat diandalkan. Asumsi ini sering kali berkaitan dengan distribusi data, hubungan antar variabel, atau jenis model yang digunakan. Jika asumsi- asumsi tersebut tidak dipenuhi, hasil statistik bisa menjadi bias atau tidak valid, meskipun teknik yang digunakan sudah benar secara teknis.
a. Asumsi yang Sering Digunakan dalam Statistik
Beberapa asumsi umum dalam analisis statistik meliputi:
1) Normalitas Data: Banyak uji statistik (seperti uji t atau ANOVA) mengasumsikan bahwa data yang digunakan mengikuti distribusi normal.
Jika data tidak normal, hasil analisis dapat menjadi tidak akurat.
2) Independensi Variabel: Beberapa teknik statistik mengasumsikan bahwa variabel yang dianalisis adalah independen satu sama lain.
Ketika ada hubungan antar variabel yang tidak terdeteksi, ini bisa memengaruhi hasil.
3) Homoskedastisitas: Asumsi ini mengacu pada anggapan bahwa variansi data di seluruh rentang nilai prediktor adalah konstan. Ketika variansi berubah, hasil analisis dapat terganggu (misalnya, pada regresi).
Ketergantungan pada asumsi-asumsi ini menciptakan tantangan bagi peneliti, terutama ketika
48
data yang dikumpulkan tidak sepenuhnya memenuhi asumsi tersebut. Peneliti sering kali harus mencari solusi alternatif, seperti transformasi data atau menggunakan metode statistik non-parametrik yang lebih fleksibel (Tabachnick & Fidell, 2013).
2. Kesulitan dalam Mengatasi Variabel yang Tak Terukur Salah satu keterbatasan utama dalam analisis statistik adalah kesulitan dalam menangani variabel yang tidak dapat diukur secara langsung. Dalam banyak penelitian, ada faktor- faktor yang dapat memengaruhi hasil tetapi tidak dapat diukur dengan tepat atau tidak dapat dimasukkan ke dalam model statistik. Variabel-variabel ini, yang sering disebut sebagai variabel laten atau variabel tersembunyi, dapat menyebabkan bias dalam hasil penelitian.
a. Dampak Variabel Tak Terukur pada Analisis
Variabel tak terukur dapat memengaruhi hubungan yang diamati antara variabel yang terukur, menciptakan kesalahan pengukuran atau confounding effect. Misalnya, dalam penelitian yang menguji hubungan antara pendidikan dan pendapatan, faktor seperti motivasi individu atau peluang ekonomi yang tidak dapat diukur langsung bisa mempengaruhi hasil, meskipun tidak disertakan dalam analisis.
Akibatnya, hubungan yang terlihat antara pendidikan dan pendapatan bisa jadi lebih lemah atau lebih kuat dari kenyataannya.
b. Solusi untuk Mengatasi Variabel Tak Terukur
Salah satu cara untuk mengatasi masalah variabel yang tidak terukur adalah dengan menggunakan desain penelitian yang lebih kompleks, seperti penelitian longitudinal atau penelitian eksperimen, yang dapat membantu mengidentifikasi hubungan sebab-akibat dengan lebih jelas. Selain itu, metode statistik seperti model struktural atau analisis faktor dapat digunakan untuk mengestimasi variabel laten berdasarkan indikator yang tersedia.
Namun, meskipun berbagai teknik dapat membantu mengurangi dampak variabel tak terukur,
50
peneliti tetap harus menyadari keterbatasan ini dalam interpretasi hasil penelitian (Hair et al., 2010).
1.5Aplikasi dan Implikasi Statistik dalam Penelitian Multidisipliner
Statistik memainkan peran yang sangat penting dalam berbagai bidang penelitian, baik dalam ilmu sosial, kesehatan dan kedokteran, maupun bisnis dan ekonomi.
Masing-masing bidang ini menggunakan statistik untuk menganalisis data, menguji hipotesis, serta menarik kesimpulan yang dapat diterapkan dalam kebijakan, diagnosis, maupun pengambilan keputusan.
1.5.1 Penerapan Statistik dalam berbagai bidang penelitian 1. Ilmu Sosial
Dalam ilmu sosial, statistik digunakan untuk memahami dan menganalisis pola perilaku manusia, interaksi sosial, dan faktor- faktor yang mempengaruhi masyarakat. Data yang dikumpulkan melalui survei, wawancara, dan observasi digunakan untuk menguji teori, mengidentifikasi tren, dan merumuskan kebijakan publik yang lebih efektif. Adapun penggunakan statistik dalam ilmu sosial :
a. Survei dan Polling: Statistik digunakan untuk menganalisis hasil survei atau polling yang berkaitan dengan opini publik, pemilu, atau preferensi sosial. Uji signifikansi, analisis regresi, dan teknik lain digunakan untuk memahami faktor- faktor yang mempengaruhi keputusan atau pandangan masyarakat.
b. Pengujian Hipotesis Sosial: Statistik digunakan untuk menguji hipotesis mengenai fenomena sosial, seperti hubungan antara tingkat pendidikan dan pendapatan, pengaruh media sosial terhadap perilaku remaja, atau faktor-faktor yang mempengaruhi ketimpangan sosial (Sugiyono, 2017).
2. Kesehatan dan Kedokteran
Di bidang kesehatan dan kedokteran, statistik digunakan untuk menganalisis data pasien, uji klinis,
52
dan epidemiologi untuk memahami pola penyakit, efektivitas pengobatan, serta faktor- faktor yang memengaruhi kesehatan masyarakat. Statistik dalam bidang ini membantu dalam pengambilan keputusan yang dapat
menyelamatkan nyawa dan meningkatkan kualitas hidup. Adapun penggunakan statistik dalam bidang kesehatan adalah :
a. Uji Klinis dan Epidemiologi: Statistik digunakan untuk menguji efektivitas obat atau terapi dalam uji klinis.
Misalnya, teknik statistik digunakan untuk membandingkan hasil pengobatan antara kelompok kontrol dan kelompok eksperimen.
b. Analisis Risiko Kesehatan: Statistik membantu dalam memodelkan dan memprediksi risiko kesehatan, seperti risiko penyakit jantung atau diabetes, berdasarkan faktor- faktor individu seperti usia, jenis kelamin, pola makan, dan riwayat kesehatan keluarga (Notoatmodjo, 2018).
3. Bisnis dan Ekonomi
Statistik sangat penting dalam bisnis dan ekonomi untuk merencanakan strategi perusahaan, menganalisis pasar, serta memahami perilaku konsumen. Teknik statistik digunakan untuk mengevaluasi tren pasar, memprediksi permintaan produk, dan mengoptimalkan operasi bisnis. Adapun penggunakan statistik dalam bisnis dan ekonomi adalah :
a. Analisis Pasar: Statistik digunakan untuk menganalisis data pasar, mengidentifikasi tren, serta memprediksi permintaan produk atau jasa.
Analisis regresi dan analisis multivariat sering digunakan untuk mengidentifikasi faktor-faktor yang mempengaruhi keputusan pembelian konsumen.
b. Pengambilan Keputusan Ekonomi: Statistik membantu pengambil kebijakan dalam menganalisis dampak kebijakan ekonomi, seperti perubahan tarif pajak atau kebijakan moneter. Uji signifikansi dan model ekonomi digunakan untuk mengevaluasi efektivitas kebijakan yang
54
diterapkan.
c. Pengukuran Kinerja Bisnis: Di perusahaan, statistik digunakan untuk menganalisis kinerja finansial, misalnya dalam pengukuran profitabilitas, efisiensi operasional, dan analisis biaya versus manfaat. Model statistik ini membantu perusahaan untuk merencanakan investasi dan strategi pertumbuhan (Tjiptono, 2020).
Statistik memiliki aplikasi yang luas dan signifikan dalam berbagai disiplin ilmu, termasuk ilmu sosial, kesehatan, dan ekonomi. Dalam ilmu sosial, statistik membantu untuk memahami dinamika masyarakat, dalam kesehatan, statistik berperan dalam menganalisis efektivitas pengobatan dan pola penyakit, sementara dalam bisnis dan ekonomi, statistik digunakan untuk merencanakan strategi dan mengevaluasi kebijakan.
Penerapan statistik yang tepat di setiap bidang ini tidak hanya meningkatkan akurasi hasil penelitian tetapi juga membantu pengambilan keputusan yang lebih baik dan berbasis data.
1.5.2Etika dan Tantangan Penggunaan Statistik dalam Penelitian Penggunaan statistik dalam penelitian bukan hanya soal
penerapan teknik yang tepat, tetapi juga harus mempertimbangkan aspek etika dan potensi tantangan yang dapat memengaruhi hasil penelitian. Etika yang baik dalam analisis data dan pemilihan teknik statistik sangat penting untuk memastikan bahwa hasil penelitian dapat dipertanggungjawabkan dan tidak menyesatkan.
1. Manipulasi Data
Manipulasi data merujuk pada upaya untuk memodifikasi atau mengubah data dengan cara yang tidak sah atau tidak jujur untuk mencapai hasil yang diinginkan. Tindakan ini tidak hanya melanggar etika penelitian, tetapi juga merusak integritas ilmiah dan dapat merusak kredibilitas penelitian secara keseluruhan. Manipulasi data sering kali terjadi ketika peneliti merasa tertekan untuk memperoleh hasil yang signifikan atau sesuai dengan hipotesis yang telah ditentukan.
a. Bentuk-bentuk Manipulasi Data
Beberapa bentuk manipulasi data yang sering terjadi dalam penelitian statistik antara lain:
1) Penyusunan atau Pemilihan Data Secara
56
Selektif: Peneliti mungkin memilih hanya data yang mendukung hipotesis mereka, mengabaikan data yang bertentangan.
2) Penghapusan Data atau Outliers: Menghapus data yang tidak sesuai dengan pola yang diinginkan dalam analisis untuk
"menyempurnakan" hasil.
3) Pemalsuan Data: Pembuatan data baru yang tidak pernah dikumpulkan atau diobservasi.
b. Dampak Manipulasi Data
Manipulasi data dapat menghasilkan kesimpulan yang salah, yang pada gilirannya dapat memengaruhi kebijakan, praktik medis, atau pengambilan keputusan dalam bisnis. Dalam beberapa kasus, manipulasi data dapat menyebabkan kerugian yang lebih besar, seperti hilangnya kepercayaan publik terhadap penelitian ilmiah atau bahkan membahayakan keselamatan manusia jika terkait dengan bidang medis (Borgerson, 2019).
2. Bias Statistik
Bias statistik adalah sistematisnya kesalahan dalam pengumpulan, analisis, atau interpretasi data yang menyebabkan hasil penelitian tidak mencerminkan kenyataan yang sesungguhnya.
Bias ini bisa terjadi pada berbagai tahap penelitian, mulai dari desain penelitian hingga proses analisis data. Bias dapat menyebabkan peneliti menarik kesimpulan yang keliru dan merugikan integritas penelitian.
a. Jenis-jenis Bias Statistik
Beberapa jenis bias yang umum terjadi dalam penelitian statistik meliputi:
1) Bias Pemilihan (Selection Bias): Terjadi ketika sampel yang dipilih untuk penelitian tidak representatif terhadap populasi yang lebih luas. Misalnya, hanya memilih partisipan dari satu kelompok usia tertentu dalam penelitian yang seharusnya lebih inklusif.
2) Bias Pengukuran (Measurement Bias): Terjadi ketika alat ukur yang digunakan tidak akurat atau konsisten, yang dapat menyebabkan
58
kesalahan dalam data yang dikumpulkan.
3) Bias Pengingat (Recall Bias): Terjadi ketika peserta penelitian tidak dapat mengingat dengan akurat informasi yang diminta, yang sering terjadi dalam studi retrospektif atau wawancara.
b. Mengatasi Bias Statistik
Untuk mengurangi bias dalam penelitian, peneliti perlu menerapkan teknik sampling yang tepat, menggunakan instrumen pengukuran yang valid dan reliabel, serta merencanakan desain penelitian yang minimalkan potensi bias.
Selain itu, transparansi dalam pelaporan metodologi dan analisis data sangat penting untuk meminimalkan kemungkinan bias yang tidak terdeteksi.
60
DAFTAR PUSTAKA
Arikunto, S. (2010). Prosedur Penelitian: Suatu Pendekatan Praktik.
Rineka Cipta.
Arikunto, S. (2013). Prosedur Penelitian: Suatu Pendekatan Praktek
(Edition ke-10). Jakarta: Rineka Cipta.
Barnett, V., & Lewis, T. (1994). Outliers in Statistical Data (3rd ed.).
Wiley.
Borgerson, J. (2019). The ethics of data manipulation in research.
Journal of Ethical Research, 23(2), 45-58.
Cochran, W. G. (1977). Sampling Techniques (3rd ed.). Wiley.
Cohen, L. (2013). Research methods in education (7th ed.).
Routledge.
Cohen, J. (2013). Statistical power analysis for the behavioral sciences
(2nd ed.). Routledge.
Creswell, J. W. (2014). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches (4th ed.). Thousand Oaks, CA:
Sage. Dharmawan, I. G. B. (2018). Metodologi Penelitian Sosial:
Teori dan Aplikasi. Jakarta: RajaGrafindo Persada.
Etikan, I., Musa, S. A., & Alkassim, R. S. (2016).
Comparison of Convenience Sampling and Purposive Sampling. American Journal of Theoretical and Applied Statistics, 5(1), 1-4.
Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics (4th ed.). London: Sage Publications.
Fowler, F. J. (2014). Survey research methods (5th ed.). Sage Publications.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E.
(2010).
Multivariate data analysis (7th ed.). Pearson Prentice Hall.
Kusnendi, D., & Suryani, R. (2020). Statistika dalam Penelitian: Konsep dan Aplikasi. Yogyakarta: Penerbit Andi.
Little, R. J. A., & Rubin, D. B. (2019). Statistical Analysis with Missing Data (3rd ed.). Wiley.
Notoatmodjo, S. (2018). Metodologi Penelitian Kesehatan.
Rineka Cipta. Sekaran, U., & Bougie, R. (2016). Research Methods for Business: A
Skill-Building Approach (7th ed.). New York: Wiley.
Sugiyono. (2017). Metode Penelitian Kuantitatif, Kualitatif, dan R&D. Bandung: Alfabeta.
62
Tabachnick, B. G., & Fidell, L. S. (2013). Using multivariate statistics (6th ed.). Pearson.
Taherdoost, H. (2016). Sampling Methods in Research Methodology; How to Choose a Sampling Technique for Research. International Journal of Academic Research in Management, 5(2), 18-27.
Tjiptono, F. (2020). Strategi Pemasaran (Edisi Revisi). Andi.
Yin, R. K. (2018). Case Study Research and Applications:
Design and Methods (6th ed.). Sage Publications.
BAB 2
STATISTIKA DESKRIPTIF DALAM BIOSTATISTIKA
2.1 Pendahuluan
Statistik deskriptif digunakan untuk menyajikan informasi kesehatan dalam format yang lebih mudah dipahami. Dengan berbagai metode analisis, peneliti dapat mengenali pola, tren, serta karakteristik data yang terdapat dalam suatu populasi.
Bab ini akan menjelaskan berbagai metode statistik deskriptif yang sering diterapkan dalam biostatistika, meliputi ukuran pemusatan, ukuran penyebaran, distribusi data, serta teknik visualisasi dalam penelitian kesehatan.
2.2 Asal-usul Statistik Deskriptif
Statistik deskriptif memiliki sejarah panjang yang berawal dari kebutuhan manusia untuk mengumpulkan dan mengelola informasi numerik. Konsep statistik telah digunakan sejak peradaban Mesir kuno, di mana pemerintah melakukan pencatatan populasi dan produksi pertanian untuk keperluan ad