• Tidak ada hasil yang ditemukan

TERTINGGI DAN TERENDAH

Dalam dokumen Analisis Statistik (Halaman 105-110)

MERINGKAS SEMUANYA

7.2 TERTINGGI DAN TERENDAH

Dua statistik deskriptif yang tidak perlu diperkenalkan adalah nilai maksimum dan minimum dalam satu set skor:

Jika Anda membutuhkan kedua nilai secara bersamaan:

Hidup di dalam momen

Dalam statistika, momen adalah besaran-besaran yang berhubungan dengan bentuk suatu himpunan bilangan. Yang saya maksud dengan “bentuk sekumpulan angka” adalah

“seperti apa bentuk histogram berdasarkan angka” — seberapa tersebarnya, seberapa simetrisnya, dan banyak lagi.

Momen mentah orde k adalah rata-rata dari semua angka dalam himpunan, dengan setiap angka dipangkatkan ke k sebelum Anda meratakannya. Jadi momen mentah pertama adalah mean aritmatika. Momen mentah kedua adalah rata-rata skor kuadrat. Momen mentah ketiga adalah rata-rata skor pangkat tiga, dan seterusnya.

Momen sentral didasarkan pada rata-rata penyimpangan angka dari rata-ratanya.

rata, Anda memiliki momen sentral kedua. Jika Anda memotong deviasi sebelum Anda rata-rata, itulah momen sentral ketiga. Naikkan masing-masing ke kekuatan keempat sebelum Anda rata-rata, dan Anda memiliki momen sentral keempat. Aku bisa terus dan terus, tapi Anda mendapatkan ide.

Dua pertanyaan singkat:

1. Untuk setiap rangkaian angka, berapa momen sentral pertama?

2. Dengan nama lain apa Anda mengetahui momen sentral kedua?

Dua jawaban cepat: 1. Nol. 2. Varians populasi. Baca ulang Bab 5 jika Anda tidak percaya.

Momen yang bisa diajarkan

Sebelum saya melanjutkan, saya pikir itu ide yang baik untuk menerjemahkan ke dalam R semua yang telah saya katakan sejauh ini dalam bab ini. Dengan begitu, ketika Anda masuk ke paket R berikutnya untuk menginstal (yang menghitung momen), Anda akan tahu apa yang terjadi di balik layar.

Berikut adalah fungsi untuk menghitung momen pusat suatu vektor:

Argumen pertama, x, adalah vektor. Argumen kedua, y, adalah urutannya (kedua, ketiga, keempat ...).

Berikut adalah vektor untuk mencobanya:

Dan inilah momen sentral kedua, ketiga, dan keempat:

Kembali ke deskriptif

Apa hubungan semua ini tentang momen dengan statistik deskriptif? Seperti yang saya katakan . . . dengan baik . . . beberapa saat yang lalu, pikirkan histogram yang didasarkan pada sekumpulan angka. Momen mentah pertama (rata-rata) menempatkan pusat histogram.

Momen sentral kedua menunjukkan penyebaran histogram. Momen sentral ketiga terlibat dalam simetri histogram, yang disebut skewness. Momen sentral keempat menggambarkan seberapa gemuk atau tipisnya ekor (ujung ekstrem) dari histogram. Ini disebut kurtosis. Masuk ke momen-momen dengan tatanan yang lebih tinggi dari itu jauh di luar cakupan buku ini.

Tapi mari kita masuk ke simetri dan "tailedness."

Kecondongan

Gambar 7.1 menunjukkan tiga histogram. Yang pertama adalah simetris; dua lainnya tidak. Simetri dan asimetri tercermin dalam statistik skewness.

Gambar 7.1 Tiga histogram, menunjukkan tiga jenis kemiringan.

Untuk histogram simetris, skewness adalah 0. Untuk histogram kedua — histogram yang mengarah ke kanan — nilai statistik skewness adalah positif. Itu juga dikatakan "miring ke kanan." Untuk histogram ketiga (yang mengarah ke kiri), nilai statistik skewness adalah negatif. Itu juga dikatakan "miring ke kiri".

Sekarang untuk formula. Saya akan membiarkan Mk mewakili momen sentral ke-k.

Untuk menghitung skew- ness, itu

Dalam bahasa Inggris, skewness dari sekumpulan angka adalah momen pusat ketiga dibagi dengan momen pusat kedua yang dipangkatkan menjadi tiga bagian. Dengan fungsi R yang saya definisikan sebelumnya, lebih mudah dilakukan daripada mengatakan:

Dengan paket momen, lebih mudah lagi. Pada tab Paket, klik Instal dan ketik momen ke dalam kotak dialog Instal Paket, dan klik Instal. Kemudian pada tab Paket, klik kotak centang di sebelah momen.

Inilah fungsi skewness() dalam aksinya:

Jadi kemiringannya positif. Bagaimana itu dibandingkan dengan tenaga kuda untuk mobil non-AS?

Kemiringannya lebih positif untuk mobil AS daripada mobil non-AS. Seperti apa kedua histogram itu? Saya membuatnya berdampingan pada Gambar 4.1, di Bab 4. Untuk memudahkan, saya menunjukkannya di sini sebagai Gambar 7.2.

Kode yang menghasilkannya adalah:

Konsisten dengan nilai skewness, histogram menunjukkan bahwa di mobil USA, skornya lebih banyak di sebelah kiri daripada di mobil non-USA. Terkadang lebih mudah untuk melihat tren dalam plot kepadatan daripada dalam histogram. Plot kepadatan menunjukkan proporsi skor antara batas bawah yang diberikan dan batas atas yang diberikan (seperti proporsi mobil dengan tenaga kuda antara 100 dan 140). Saya membahas kepadatan secara lebih rinci di Bab 8.

Gambar 7.2 Histogram tenaga kuda untuk mobil AS dan non-AS.

Mengubah satu baris kode menghasilkan plot kepadatan:

Gambar 7.3 menunjukkan dua plot kepadatan.

Gambar 7.3 Plot kepadatan tenaga kuda untuk mobil AS dan mobil non-AS.

Dengan plot kepadatan, tampaknya lebih mudah (bagi saya, bagaimanapun) untuk melihat lebih banyak kemiringan ke kiri (dan karenanya, kemiringan yang lebih positif) di plot di sebelah kiri.

Kurtosis

Gambar 7.4 menunjukkan dua histogram. Yang pertama memiliki ekor yang lebih gemuk daripada yang kedua. Yang pertama dikatakan leptokurtik. Yang kedua adalah platikurtik. Kurtosis untuk histogram pertama lebih besar daripada yang kedua.

Gambar 7.4 Dua histogram, menunjukkan dua jenis kurtosis.

Rumus untuk kurtosis adalah:

dimana M4 adalah momen pusat keempat dan M2 adalah momen pusat kedua. Jadi kurtosis

Banyak ahli statistik mengurangi 3 dari hasil rumus kurtosis. Mereka menyebut nilai itu sebagai kelebihan kurtosis. Yang dimaksud dengan “berlebihan” adalah kurtosis yang lebih besar (atau mungkin lebih kecil) daripada kurtosis dari sesuatu yang disebut distribusi normal standar, yang saya bahas di Bab 8. Karena pengurangan, kelebihan kurtosis bisa negatif.

Mengapa 3 mewakili kurtosis dari distribusi normal standar? Jangan tanya. Menggunakan fungsi yang saya definisikan sebelumnya, kurtosis tenaga kuda untuk mobil AS adalah:

Tentu saja, fungsi kurtosis() dalam paket momen membuat ini menjadi mudah:

Ekor yang lebih gemuk pada plot kepadatan sisi kiri pada Gambar 7-3 menunjukkan bahwa mobil AS memiliki kurtosis yang lebih tinggi daripada mobil non-AS. Apakah ini benar?

Ya itu!

Selain skewness() dan kurtosis(), paket momen menyediakan fungsi yang disebut moment() yang melakukan semua yang dilakukan cen.mom() dan sedikit lebih banyak lagi.

Saya hanya berpikir itu akan menjadi ide yang baik untuk menunjukkan kepada Anda fungsi yang ditentukan pengguna yang menggambarkan apa yang masuk ke dalam menghitung momen sentral. (Apakah saya sedang "menjadi penting" ... atau apakah saya hanya "merebut momen"? Oke. Saya akan berhenti).

Dalam dokumen Analisis Statistik (Halaman 105-110)