Dan Alhamdulillah, penulis panjatkan puji syukur kehadirat Allah SWT karena buku ini dapat diselesaikan. Penulis juga menyadari kekurangan dalam penyusunan buku ini, namun penulis yakin sepenuhnya bahwa buku ini, sekecil apapun, akan tetap membawa manfaat bagi para pembacanya.
PENGENALAN STATISTIKA DASAR
- Tahap-Tahap Kegiatan Statistik
- Pembagian Data Menurut Sifatnya
- Skala Pengukuran Data
- Data Intern dan Data Ekstern
- Data Primer dan Data Sekunder
Jika tinggi badan setiap siswa diukur lalu dicatat, cara pengumpulan data ini disebut sensus. Editing adalah kegiatan mendeteksi kemungkinan kesalahan, ketidakkonsistenan, dan ketidakteraturan atau ketidakakuratan data yang dikumpulkan. Tabulasi merupakan kegiatan mengelompokkan data menurut ciri-ciri data yang telah kita tentukan dalam susunan kolom dan baris agar mudah diambil kesimpulan dari data tersebut.
Penyajian data dimaksudkan agar data yang dikumpulkan dapat tersebar luas dan mudah dilihat secara visual. Berdasarkan sumber data yang dikumpulkan, data dibedakan menjadi dua, yaitu data internal dan data eksternal. Data internal merupakan data yang dikumpulkan oleh suatu instansi mengenai kegiatan instansi tersebut, dan hasilnya digunakan untuk kepentingan instansi tersebut.
Sedangkan data sekunder merupakan data yang diperoleh dari pihak lain atau dari hasil penelitian orang lain. Sedangkan data yang diperoleh dari wawancara terhadap responden merupakan data primer siswa tersebut.
DISTRIBUSI FREKUENSI
- Penyusunan Data
- Penyusunan Data Berdasarkan Frekuensi
- Histogram dan Poligon
- Ogive
Data primer yang diperoleh dari pengamatan langsung peneliti disebut data mentah. Data mentah yang disajikan dalam urutan menaik disebut ascending dan urutan menurun disebut descending dan bentuk penyajian ini disebut array. Untuk memudahkan pengerjaannya, jika data yang dimiliki cukup besar, sebaiknya disajikan dalam bentuk kelas (kelompok data) berdasarkan kategori tertentu beserta frekuensinya yang sesuai.
Tabel yang menyajikan kelas data dan frekuensinya disebut distribusi frekuensi atau tabel frekuensi. Angka 160 dan 162 pada kelas pertama disebut batas kelas, dimana angka 160 disebut batas kelas bawah dan angka 162 disebut batas kelas atas. Misalnya pengukuran tinggi badan di atas dilakukan dengan ketelitian 0,5 cm, maka batas kelas bawah adalah 159,5 pada kelas satu dan batas kelas atas adalah 162,5.
Diperoleh dengan membagi jumlah batas bawah dan batas atas suatu interval kelas menjadi dua. Dalam mengolah data statistik, sering kali kita dihadapkan pada rekapitulasi sejumlah besar data yang tidak dikelompokkan, sehingga memerlukan pengelompokan data menurut kelas-kelas tertentu. Histogram adalah deretan persegi panjang yang alasnya terletak pada sumbu X, pusat alasnya adalah tanda kelas, dan lebar alasnya adalah lebar interval kelas.
Hal ini dapat digambarkan dengan menghubungkan suatu garis lurus melalui pasangan titik frekuensi kelas dan titik tengah (label) interval kelas. Ogive merupakan grafik yang diplot berdasarkan data yang telah disusun dalam bentuk tabel distribusi frekuensi kumulatif. Untuk data yang disusun dalam bentuk tabel distribusi frekuensi kumulatif kurang dari , grafiknya berbentuk ogive positif, sedangkan untuk data yang disusun dalam bentuk tabel distribusi frekuensi kumulatif lebih dari , grafiknya berbentuk dari ogif negatif.
Frekuensi yang kurang dari kumulatif suatu kelas adalah jumlah frekuensi seluruh kelas sebelum kelas tersebut dan frekuensi kelas tersebut. Sedangkan frekuensi kumulatif lebih dari satu kelas merupakan penjumlahan frekuensi seluruh kelas pada kelas tersebut dengan frekuensi kelas tersebut.
UKURAN PEMUSATAN DATA
Pengertian Mean, Median, Modis
Syarat data tidak dikelompokkan adalah ukuran yang mempunyai frekuensi tertinggi atau nilai data yang paling sering muncul.
Rata-Rata Polar (Andi Supangat)
Dispersi relatif digunakan untuk membandingkan tingkat variabilitas nilai observasi suatu data dengan tingkat variabilitas nilai observasi data lainnya. Distribusi yang miring akan memiliki mean, median, dan modus yang ukurannya tidak sama. Regresi linier merupakan teknik yang digunakan untuk memperoleh model hubungan antara 1 variabel terikat dengan 1 atau lebih variabel bebas.
Analisis ini digunakan untuk mengetahui arah hubungan antara variabel bebas dan variabel terikat, apakah positif atau negatif, dan untuk memprediksi nilai variabel terikat jika nilai variabel bebas bertambah atau berkurang. Regresi linier berganda merupakan model persamaan yang menjelaskan hubungan antara satu variabel terikat/respon (Y) dengan dua atau lebih variabel/prediktor bebas (X1, X2,…Xn). Tujuan dari uji regresi linier berganda adalah untuk memprediksi nilai variabel terikat/respon (Y) jika diketahui nilai variabel bebas/prediktor (X1, X2,.., Xn).
Korelasi adalah suatu teknik analisis dalam statistik yang digunakan untuk mencari hubungan antara dua variabel yang juga bersifat kuantitatif. Perubahan nilai variabel diikuti dengan perubahan nilai variabel lainnya secara teratur dalam arah yang sama. Perubahan nilai variabel diikuti dengan perubahan nilai variabel lainnya secara teratur namun berlawanan arah.
Kenaikan nilai suatu variabel kadang-kadang diikuti dengan penurunan variabel lain atau kadang-kadang kenaikan variabel lain.Arah hubungannya tidak beraturan, searah dan kadang berlawanan arah. Koefisien determinasi dalam regresi linier sering diartikan sebagai seberapa besar kemampuan seluruh variabel independen dalam menjelaskan varians variabel dependen. Penggunaan R Square seringkali menimbulkan masalah yaitu nilainya akan selalu bertambah seiring dengan bertambahnya variabel independen dalam suatu model.
Hal ini akan menimbulkan bias karena jika ingin mendapatkan model dengan R yang tinggi, bisa jadi seorang peneliti sembarangan menambahkan variabel independen dan nilai R akan semakin besar, terlepas dari apakah variabel independen tambahan tersebut ada hubungannya dengan variabel dependen atau tidak. Penafsirannya sama dengan R Square, namun nilai Adjusted R Square dapat bertambah atau berkurang dengan adanya penambahan variabel baru, tergantung korelasi antara tambahan variabel bebas dengan variabel terikat. Nilai Adjusted R-squared bisa saja bernilai negatif, sehingga jika nilainya negatif maka nilainya dianggap 0, atau variabel independen sama sekali tidak mampu menjelaskan varians variabel dependen.
UKURAN PENYEBARAN, DISPERSI DAN
Rentang (Range)
Rentang Inter-Kuartil
Simpangan Mutlak Rata-Rata (Mean Absolute
Simpangan Kuartil (Quartile Deviation)
Simpangan Baku (Std. Deviation)
UKURAN KEMIRINGAN DAN
- Ukuran Kemiringan (Skewness)
- Koefisien Kemiringan Pearson
- Koefisien Kemiringan Bowley
- Koefisien Kemiringan Andi Supangat
- Ukuran Keruncingan (Kurtosis)
Menurut Pearson, berdasarkan hasil koefisien kemiringan di atas, terdapat tiga kriteria untuk mengetahui model distribusi suatu kumpulan data (baik data berkelompok maupun data tidak berkelompok), yaitu. Berat badan bayi (dicatat dalam kg) yang dilahirkan di rumah bersalin “Ibu” dapat dilihat pada tabel 5.1 di bawah ini. Ukuran ketajaman adalah derajat puncak suatu distribusi, yang biasanya diambil relatif terhadap distribusi normal.
Distribusi yang mempunyai puncak relatif tinggi disebut leptokurtik, distribusi yang mempunyai puncak datar disebut platikurtik, distribusi normal yang puncaknya tidak terlalu tinggi atau datar disebut mesokurtik. Untuk mengetahui apakah suatu kumpulan data mengikuti sebaran leptokurtik, platikurtik, dan mesokurtik dapat dilihat dari koefisien kurtosis. Dari hasil koefisien kurtosis di atas terdapat tiga kriteria untuk mengetahui model sebaran suatu kumpulan data, yaitu.
REGRESI LINIER SEDERHANA
Regresi Linier Sederhana
REGRESI LINIER BERGANDA
KORELASI DAN KOEFISIEN DETERMINASI
Bentuk Hubungan Antara 2 Variabel
Jika nilai koefisien korelasinya mendekati +1 (positif) berarti pasangan data Variabel X dan Y mempunyai korelasi Linier Positif yang kuat. Jika nilai koefisien korelasinya mendekati -1, maka hal ini menunjukkan bahwa pasangan data variabel X dan variabel Y mempunyai korelasi linier negatif yang kuat/mendekati. Jika nilai koefisien korelasi mendekati 0 (nol), berarti pasangan data variabel X dan Y mempunyai korelasi yang sangat lemah atau kemungkinan besar tidak berkorelasi.
Koefisien Determinasi