• Tidak ada hasil yang ditemukan

Tampilan Grafik

Ringkasan datanya adalah : Nilai terkecil = 296.66 Nilai terbesar = 586.58

Rumus dari kuartil n adalah (Qi) = b + p (

i 4 n−F

fi )

Dimana b = batas bawah kelas median, adalah kelas dimana median akan terletak, p = panjang kelas median

n = ukuran sampel atau banyak data F =

Fi = jumlah semua frekuensi dengan tanda kelas lebih kecil dari tanda kelas median.

F = Frekuensi kelas Median

Kuartil Pertama (Q1) 0 2 4 6 8 10 12 14 16 318,66 362,67 406,68 450,69 494,7 538,71 582,72

Tampilan Grafik

1/4 . n = 1/4 . 50 = 12.5 b = 428.69 – 0.005 = 428.685 p = 472.69 - 428.69 = 44 (Q1) = b + p ( 1 4 n−F fi ) = 428.685+ 44 ( 12.56 15 ) = 428.685 + 44 (6.5/15) = 447.75 Kuartil Kedua(Median/Q2) ½ n = ½ . 50 = 25 b = 472.70 – 0.005 = 472.695 p = 516.70 – 472.70 = 44 (Q2) = b + p ( 1 2 n−F fi ) = 472.695+ 44 ( 2521 12 ) = 472.695+ 44 (4/12) = 487.36 Kuartil Ketiga (Q3) 3/4 . n = 3/4 . 50 = 37.5 b = 516.71 – 0.005 = 516.705 p = 560.71 – 516.71 = 44 (Q3) = b + p ( 3 4 n−F fi ) = 516.705+ 44 ( 37.533 14 ) = 516.705+ 44 (4.5/14) = 530.85

Laporan dari penggunaan Gasoline pada tahun 2000 adalah besar penggunaan gasoline paling sedikit adalah 296.66 dan paling banyak digunakan sebesar 586.58 dan penggunaan Gasoline paling banyak berada pada kisaran angka sebesar 428.69 sampai 472.69.

Nomor 42 halaman 77 (Chapter 4)

Job growth. In 1996 the firm Standard and Poor's DRI predicted that the cities listed below would experience the fastest growing job markets in the United States over the next 3 years and predicted their growth rates, given here.

a) Make a suitable display of the growth rates.

b) Summarize the central growth rate with a median and mean. Why do they differ? c) Given what you know about the distribution, which of these measures does the

better job of summarizing the growth rates? Why?

d) Summarize the spread of the growth rate distribution with a standard deviation and with an IQR.

e) Given what you know about the distribution, which of these measures does the better job of summarizing the growth rates? Why?

f) Suppose we subtract from each of these growth rates the predicted U.S. average growth rate of 1.20%, so that we could look at how much these growth rates exceed the U.S. rate. How would this change the values of the summary statistics you calculated above? (Hint: You need not recompute any of the summary statistics from scratch.

g) If we were to omit Las Vegasfrom the data, how would you expect the mean, median, standard deviation, and I QR to change? Explain your expectations for each.Write a brief report about these growth rates.

h) Write a brief report about these growth rates.

Dari soal di atas diramalkan bahwa kota-kota yang tercantum di bawah ini akan menjadi pasar kerja yang paling cepat berkembang di Amerika Serikat selama 3 tahun ke depan Pada tahun 1996. Berikut adalah data laju pertumbuhan masing-masing kota :

a) Tampilan grafik yang sesuai dengan laju pertumbuhannya adalah sebagai berikut :

0 0,5 1 1,5 2 2,5 3 3,5 4 NV-AZ NC TX CA ID FL AZ GA OR-WA NC-SC NE-IA UT NM

b) Ringkasan dari laju pertumbuhan pusat dengan sebuah median dan meannya adalah sebagai berikut :

Dari soal di atas diketahui urutan data dari laju pertumbuhan setiap kota adalah sebagai berikut :

1,86 1,87 1,90 1,93 2,02 2,07 2,07 2,13 2,16 2,22 2,25 2,26 2,37 2,44 2,51 2,61 2,62 2,64 2,69 3,72.

Median dari data adalah berada pada data ke-10 + data ke-11 = 2,22+ 2,25

2 = 2,235 Mean dari datadi atas adalah

= 1,86+1,87+1,90+1,93+2,02+2,07+2,07+2,13+2,16+2,22+ 2,25+2,26+2,37+2,44+2,51+2,61+2,62+2,64+2,69+3,72.

20

= 46,3620 = 2,318

Mean dan mediannya berbeda karena mean menggunakan seluruh angka dalam perhitungannya sedangkan median hanya menghitung dua angka saja yang berada di posisi ke-10 dan ke-11. Serta angka yang dihitung oleh median dan mean berbeda kisaran angkanya.

c) Pengukuran yang baik untuk ringkasan laju pertumbuhan ini adalah median karena median lebih banyak dipengaruhi oleh angka lainnya daripada rata-rata.

d) Ringkasan penyebaran dari distribusi laju pertumbuhan dengan menggunakan standar deviasi dengan menggunakan rentang antar kuartil adalah sebagai berikut :

1,86 1,87 1,90 1,93 2,02 2,07 2,07 2,13 2,16 2,22

2,25 2,26 2,37 2,44 2,51 2,61 2,62 2,64 2,69 3,72.

Kuartil pertamanya berada pada data ke-5 dan ke-6 yaitu 2,02+ 2,072 = 2,045 Kuartil ketiganya berada pada data ke-15 dan ke-16 yaitu 2,51+ 2,612 = 2,56

Rentang antar kuartilnya = Q3– Q1 = 2,56 – 2,045 = 0,515

Jadi simpangan kuartilnya adalah = ½ (Q3– Q1) = ½ (2,56 – 2,045) = 0.2575.

Maka standar deviasinya adalah : Simpangan kuartil = 2/3 standar deviasi 0.2575 = 2/3 SD

SD = (0.2575 x 3)/2 Jadi standar deviasinya adalah 0.38625.

e) Menurut kelompok kami pengukuran yang paling baik di antara mean, median, rentang antar kuartil dan standar deviasi yang ada disini adalah standar deviasinya karena disini standar deviasi dipengaruhi oleh semua angka yang ada di atas dibandingkan dengan mean, median, rentang antar kuartil.

f) Jika 1,2% yang dikurangi dari masing-masing suku yang diprediksi oleh laju pertumbuhan, maka rata-rata dan median akan mengalami penurunan setiap suku sebesar 1,2%. Sedangkan nilai standar Deviasi dan Rentang antar Kuartil tidak akan berubah.

g) Jika Las Vegas dihilangkan dari data di atas maka datanya akan menjadi :

1,86 1,87 1,90 1,93 2,02 2,07 2,07 2,13 2,16 2,22

2,25 2,26 2,37 2,44 2,51 2,61 2,62 2,64 2,69

Sehingga mediannya berubah menjadi data yang ada di posisi ke-10 = 2.22 Rata-ratanya menjadi = 46,36193.72 = 2,24

Kuartil ketiganya terletak pada data ke-15 = 2.51 Kuartil pertamanya terletak pada data ke-5 = 2.02

Rentang antar kuartil = Q3– Q1 = 2,51 – 2,02 = 0,49 Simpangan Kuartil = ½ (Q3– Q1) = ½ (0.49) = 0.245

Maka standar deviasinya adalah : Simpangan kuartil = 2/3 standar deviasi

0.245 = 2/3 SD SD = (0.245 x 3)/2 Jadi standar deviasinya adalah 0.3675

h) Dari data di atas rata-rata laju pertumbuhannya adalah 2.318. Kebanyakan angka berada kisaran lebih dari angka 2. Laju pertumbuhannya selalu meningkat. Dimana rata-rata terkecilnya berada pada For Worth Arlington,TX sebesar 1.86 dan rata-rata terbesar berada pada Las Vegas, NV-AZ sebesar 3.72

Nomor 43 halaman 77-78 (Chapter 4)

Customer database. A philanthropic organization has a database of millions of donors that they contact by mail to raise money for charities. One of the variables in the database, Title, contains the title of the person or persons printed on the address label. The most common are Mr., Ms.l, Miss, and Mrs., but there are also Ambassador and Mrs., Your Imperial Majesty, and Cardinal to name few others. In all there are over 100 different titles, each with a corresponding numeric code. Here are a few of them:

An intern who was asked to analyze the organization's fundraising efforts presented these summary statistics for the variable Title:

b) What are the typical reasons that cause measures of center and spread to be as different as those in this table?

c) Is that why these are so different?

Jawab :

Dari soal di atas diketahui data bahwa ada lebih dari 100 nama yang berbeda dari orang-orang yang tercetak pada label alamat untuk mendonorkan darah. Berikut adalah beberapa dari nama orang tersebut :

Jika disajikan ringkasan datanya maka akan menjadi seperti berikut :

a) Arti dari 54.41 adalah angka ini hanya sebagai yang ditugaskan untuk judul kategori, bahkan meskipun kategori ini diwakili oleh angka. Averaging hanya cocok untuk Data kuantitatif(data yang bisa dihitung).

b) Yang menyebabkan ukuran pusat dan menyebar menjadi berbeda seperti yang ada di tabel ini adalah bisanya karena ada outlier (data yang menyimpang) dan kemiringan.

c) Disini tidak perlu membahas mengenai perbedaan dalam ringkasan datanya, karena ringkasan data hanya sesuai untuk data kuantitatif (yang bisa dihitung). Sedangkan disini kode judulnya bersifat kategorik.

Nomor 44 halaman 79 (Chapter 4)

Zip codes revisited. Here are some summary statistics to go with the histogram of the zip codes of 500 customers from the Holes-R-Us Internet Jewelry Salon that we saw in Exercise 29 of Chapter 4.

a) Is the mean or median a "better" summary of the center of the zip code distribution? Why?

b) Is the standard deviation or the IQR a better summary of the spread? Why? c) What can these statistics tell you about the company's sales?

Jawab :

a) Baik mean atau median cocok untuk data ini. Kode pos kategori, dan berarti dan median hanya sesuai untuk data kuantitatif.

b) Baik standar deviasi atau IQR cocok untuk data ini. Kode pos kategori, dan standar deviasi dan IQR hanya sesuai untuk data kuantitatif.

c) Statistik tidak dapat memberikan informasi yang cukup karena kode pos kategori yang ada. Namun, ada beberapa informasi dalam digit pertama dari kode pos.

mereka menunjukkan timur umum (0-1) ke barat (8-9) arah. jadi, distribusi menunjukkan bahwa sebagian besar penjualan mereka terjadi di barat dan satu lagi di 32000 daerah. tapi grafik batang digit pertama akan menjadi tampilan yang sesuai untuk menampilkan informasi ini.

Dokumen terkait