Tugas
Analisis Data A
PENGANTAR ANALISIS DATA
Kelompok 6:
St. Surya Rahmi ( H12113013)
Citra Farahdiba Isnandar (H12113022)
Fahri Fadlianto Nur (H12110267)
PRODI STATISTIKA
JURUSAN MATEMATIKA
(Part 1 Exploring and Understanding Data)
Nomor 6 halaman 142 (Part 1 Exploring and Understanding Data)
Bread. Clarksburg Bakery is trying to predict how many loaves to bake. In the last 100 days, they have sold between 95 and 140loaves. Here is a histogram of the number of loaves they sold for the last 100 days. Here is a histogram of the number of loaves they sold for the last 100 days.
a. Describe the distribution.
b. Which should be larger, the mean number of sales or the median? Explain.
c. Here are the summary statistics for Clarksburg Bakery's bread sales. Use these
statistics and the histogram above to create a boxplot. You may approximate the
values of any outliers.
Jawab :
Toko roti Clarksburg sedang mencoba untuk memprediksikan berapa banyak papan roti untuk dibakar. Pada 100 hari terakhir, mereka telah menjual antara 95 dan 140 roti per hari.
a. Deskripsi distribusi.
b. Untuk kasus kemencengan positif, diketahui bahwa Modus < Median < Mean, maka seharusnya pada kasus diata nilai Mean (rata-rata) harus lebih besar daripada Mediannya.
c. Boxplot dari ringkasan data untuk Toko roti Clarksburg adalah sebagai berikut :
Nomor 14 halaman 144 (Part 1 Exploring and Understanding Data)
Accidents. In 2001, Progressive Insurance asked customers who had been involved in auto
accidents how far they were from home when the accident happened. The data are
summarized in the table.
Miles from Home % of Accidents
Less than 1 23
1 to 5 29
6 to 10 17
11 to 15 8
16 to 20 6
a) Create an appropriate graph of these data.
b) Do these data indicate that driving near home is particularlydangerous? Explain.
Jawab :
Kecelakaan. Pada tahun 2001, Asuransi progresif meminta pelanggan yang telah terlibat dalam kecelakaan mobil seberapa jauh mereka dari rumah ketika kecelakaan itu terjadi.
a. Grafik yang tepat untuk data diatas adalah :
Karena data menggunakan persentase, maka grafik yang cocok ialah pie chart.
b. Data yang menunjukkan bahwa mengendarai dari dekat rumah berbahaya yaitu data 1 mile sampai 5 mile, karena menunjukkan persentasi paling tinggi yaitu 29%.
Nomor 22 halaman 146 (Part 1 Exploring and Understanding Data)
Winter Olympics 2002 speed skating. The top 25 men's and 25 women's SOO-mspeed skating times are listed in the table below:
23%
29% 17%
8% 6%
17%
Accidents
<1
1--5
6--10
11--15
16--20
a) The mean finishing time was 73.46 seconds, with a standard deviation of 3.33 seconds. If the Normal model is appropriate, what percent of the times should be within 1.67seconds of 73.46?
Jawab :
a) Jika waktu penyelesaian rata-rata adalah 73,46 detik, dengan deviasi standar 3,33 detik. Jika model normal sesuai, maka waktu harus berada dalam jarak 1.67seconds dari 73,46.
Berikut adalah tampilan dari datanya :
b) Waktu yang benar-benar jatuh dalam kisaran ini adalah 6%.
Nomor 30 halaman 148 (Part 1 Exploring and Understanding Data)
Birth order revisited. Consider again the data on birth order and college majors in Exercise 28.
a) What is the marginal distribution of majors?
b) What is the conditional distribution of majors for the oldest children? c) What is the conditional distribution of majors for the children born second?
d) Do you think that college major appears to be independent of birth order? Explain.
Jawab :
a) Distribusi marginalnya adalah : �� �� = (� �� �� �) (�� ��,� �� �� �)
b) Distribusi bersyarat dari jurusan untuk anak-anak tertua adalah : Math/science : 213 = 0.14 = 14%
Agriculture : 219 = 0.43 = 43%
Humanities : 213 = 0.14 = 14%
Other : 216 = 0.29 = 29%
c) Distribusi bersyarat dari jurusan untuk anak-anak yang lahir kedua adalah :
Math/science : 1469 = 0.20 = 20%
Agriculture : 27
69= 0.39 = 39%
Humanities : 1769 = 0.25 = 25%
d) Ya, menurut kami distribusi mayor bisa tampil sebagai urutan kelahiran yang independen. Karena nilai dari distribusinya cukup akurat dan nilainya sesuai.
Nomor 38 halaman 150 (Part 1 Exploring and Understanding Data)
Profits. Here is a stem-and-leaf display showing profits as a percent of sales for 29 of the forbes 500 largest U.S. corporation. The stems are split; each stem represents a span of 5%, from a loss 9% to a profit of 25%.
a) Find the 5-number summary. b) Draw a boxplot for these data.
c) Find the median and standard deviation.
d) Describe the distribution of profits for these corporation.
Jawab :
Laba. Berikut adalah tampilan stem-and-leaf menunjukkan keuntungan sebagai persen dari penjualan untuk 29 dari Forbes 500 terbesar perusahaan-perusahaan AS. Batang yang terbelah; setiap batang mewakili rentang 5%, dari kerugian sebesar 9% menjadi keuntungan sebesar 25%.
a. Ringkasan data didapatkan pada diagram batang daun -9,-9,-4,-3,-2,-1,1,1,1,1,2,3,4,4,4,5,5,5,5,6,7,9,10,10,11,11,13,22,25
Median = Jumla2h data = 30
2 = 15
Kuartil 1 = X(n+2)/4 = X(30+2)/4= X8
Kuartil 1 adalah data ke 1, yaitu 1
Kuartil 3 = X(3n+2)/4 = X(90+2)/4= X23 Kuartil 3 adalah data ke 23, yaitu 10
Nilai minimum = -9
Nilai maksimum = 25
b. Boxplot ketika dideroleh ringkasan data
c. Mean = Σn X= 137 perusahaan melaporkan % profit antara 1% dan 9%. Ada satu outlier di 25% dari penjualan.
(Chapter II)
Nomor 11 Halaman 16 (Chapter 2)
Jawab :
Sebuah artikel dalam edisi Mei 2002, isu Kedokteran dan Ilmu di Olahraga dan Latihan melaporkan hasil dari sebuah penelitian yang diikuti oleh 25.892 pria berusia 30-87 selama 10 tahun. Paling sehat secara fisik laki-laki memiliki risiko 55% lebih rendah dari kematian akibat kanker.
When : Mei 2002
How (berapa lama dilakukan penelitian) : 10 tahun
Who : laki-laki yang berumur 30-87 tahun
What : Kemungkinan hidup karena kanker (hidup, mati) (kuantitatif)
Why : Untuk mengetahui pengaruh olahraga dan latihan dalam kehidupan
Nomor 17 Halaman 16 (Chapter 2)
Streams. As research for an ecology class, students at a college in upstate New York collect
data on streams each year. They record a number of biological, chemical, and physical
variables, including the stream name, the substrate of the stream (limestone, shale, or mixed),
the acidity of the water (pH), the temperature (0C), and the BCI(a numerical measure of
biological diversity).
Jawab :
Sebagai penelitian untuk kelas ekologi, mahasiswa di sebuah perguruan tinggi di New York
mengumpulkan data tentang aliran setiap tahun. Mereka merekam sejumlah biologi, kimia,
dan variabel fisik, termasuk nama sungai, substrat dari aliran (batu kapur, serpih, atau
campuran), keasaman air (pH), suhu (0C), dan BCI (ukuran numerik keanekaragaman
hayati).
What : Nama sungai(kualitatif), substrat dari aliran (batu kapur, serpih, atau campuran) (kualitatif), keasaman air (pH) (kuantitatif), suhu (0C) (kuantitatif), dan BCI (ukuran numerik keanekaragaman hayati)(kuantitatif).
Who : Nama Sungai (yang terlibat).
Why : Untuk belajar ekologi dari sungai.
Nomor 18 Halaman 18 (Chapter 2)
Age and party. The Gallup Poll conducted a representative telephone survey of
1180American voters during the first quarter of 1999. Among the reported results were the
voter's region (Northeast, South, etc.), age, party affiliation, and whether or not the person
had voted in the 1998midterm Congressional election.
Jawab :
The Gallup Poll melakukan survei telepon perwakilan pemilih 1180 American selama kuartal pertama tahun 1999. Di antara hasil yang dilaporkan adalah wilayah pemilih (Northeast, South, dll), usia, afiliasi partai, dan apakah atau tidak orang telah memilih dalam pemilihan Kongres 1998midterm.
What : Wilayah pemilih (Northeast, South, dll) (kualitatif), usia (kuantitatif), afiliasi pesta(kualitatif), dan apakah atau tidak orang telah memilih atau tidak(kualitatif).
Who : Umur dan Pesta.
Why : Untuk mempelajari pengaruh usia dan pesta.
When : Tahun 1999.
Nomor 19 Halaman 16 (Chapter 2)
Air travel. The Federal Aviation Administration (FAA) monitors airlines for safety and
customer service.For each flight the carrier must report the type of aircraft, number of
passengers, whether or not the flights departed and arrived on schedule, and any
Jawab :
Federal Aviation Administration (FAA) memonitor penerbangan untuk keselamatan dan
pelanggan layanan.Untuk setiap penerbangan pembawa harus melaporkan jenis pesawat,
jumlah penumpang, apakah atau tidak penerbangan berangkat dan tiba sesuai jadwal, dan
masalah mekanis.
What : jenis pesawat (kualitatif), jumlah penumpang (kuantitatif), apakah atau tidak
penerbangan berangkat dan tiba sesuai jadwal(kualitatif), dan masalah mekanis(kualitatif).
Who : Perjalanan Udara
Why : Untuk memonitor keselamatan dan layanan pelanggan
Nomor 20 Halaman 16 (Chapter 2)
Fuel Economy. The Environmental Protection Agency (EPA) tracks fuel economy of
automobiles. Among the data they collect are the manufacturer (Ford, Toyota, etc.), vehicle
type (car, SUV,etc.), weight, horsepower, and gas mileage (mpg) for city and highway
driving.
Jawab :
Badan Perlindungan Lingkungan (EPA) melacak ekonomi bahan bakar mobil. Di antara
data yang mereka kumpulkan adalah produsen (Ford, Toyota, dll), jenis kendaraan (mobil,
SUV, dll.), Berat badan, tenaga kuda, dan gas mileage (mpg) untuk kota dan mengemudi
jalan raya.
Why :Untuk melacak ekonomi bahan bakar mobil
What : produsen (Ford, Toyota, dll)(kualitatif), jenis kendaraan (mobil, SUV, dll.)
(kualitatif), berat badan (kuantitatif), tenaga kuda(kuantitatif),
dan gas mileage (mpg) untuk kota dan mengemudi jalan raya.
Who : Produsen
Nomor 21 Halaman 17 (Chapter 2)
Refrigerators. In 2002, Consumer Reports published an article evaluating refrigerators. It
listed 41 models, giving the brand, cost, size (cu ft), type (such as top-freezer), estimated
annual energy cost, an overall rating (good, excellent, etc.), and the repair history for that
Jawab :
Pada tahun 2002, Consumer Reports menerbitkan sebuah artikel mengevaluasi lemari es.
Terdaftar 41 model, merek, biaya, ukuran (cu ft), jenis (seperti top-freezer), diperkirakan
biaya tahunan energi, rating keseluruhan (baik, sangat baik, dll), dan sejarah perbaikan
untuk setiap merek (persentase yang membutuhkan perbaikan selama 5 tahun terakhir).
What : merek (kualitatif), biaya (kuantitatif), ukuran (cu ft)( kuantitaif), jenis (seperti
top-freezer)(kualitatif), estimasi biaya tahunan energy (kualitatif), rating keseluruhan (baik
dll)(kualitatif), dan sejarah perbaikan untuk itu merek (persentase membutuhkan perbaikan
selama 5 tahun terakhir) (kualitatif).
When : 2002
Why : untuk mengevaluasi lemari es
Who : kulkas
Nomor 22 Halaman 18 (Chapter 2)
Lotto. A study of state-sponsored Lotto games in the United States (Chance, Winter 1998)listed the names of the states and whether or not the state had Lotto. For states that did, the study indicated the number of numbers in the lottery, the number of matches required to win, and the probability of holding a winning ticket.
Jawab :
Sebuah studi dari permainan Lotto disponsori negara di Amerika Serikat (Chance, Musim Dingin 1998) terdaftar nama negara dan juga bukan negara memiliki Lotto. Untuk negara yang memiliki Lotto penelitian menunjukkan jumlah angka dalam undian, jumlah pertandingan yang dibutuhkan untuk menang, dan kemungkinan memegang tiket menang.
Who : Lotto
What : jumlah angka dalam undian (kuantitatif), jumlah pertandingan yang dibutuhkan untuk menang (kuantitatif) dan kemungkinan memegang tiket menang (kualitatif)
When : tahun 1998
Nomor 23 Halaman 17 (Chapter 2)
Sleep. In the Spring 2001 issue of Chance magazine, a psychology professor reported on data
he had collected about his sleep patterns. He kept daily records of the number of hours of
sleep he got, whether or not he suffered from "early awakening," whether or not he watched
TVin the morning and in the evening, the number of hours he spent standing during the
day, and his mood (happy/sad, on a scale from 10-90).
Jawab :
Pada musim semi 2001 isu dari majalah Chance, seorang profesor psikologi melaporkan
data yang telah dikumpulkan tentang pola tidurnya. Dia menyimpan catatan harian dari
jumlah jam tidur dia, apakah dia menderita “bangun lebih awal”, apakah dia menyaksikan
TV pagi dan malam hari, jumlah jam ia menghabiskan dengan berdiri di siang hari, dan
suasana hatinya (senang / sedih, dengan skala 10-90).
When ; tahun 2001
Who : Tidur
What : apakah dia menderita dari "kebangkitan awal (kualitatif), apakah dia
menyaksikan TV pagi hari dan di malam hari(kualitatif), jumlah
jam ia menghabiskan berdiri di siang hari(kuantitatif), dan mood (senang / sedih, dengan
skala 10-90) (kualitatif)
Nomor 24 Halaman 17 (Chapter 2)
Indy. The 2.5-mile Indianapolis Motor Speedway has been the home to a race on Memorial
Day nearly every year since 1911.Even during the first race there were controversies. Ralph
Mulford was given the checkered flag first but took three extra laps just to make sure he'd
completed 500 miles. When he finished, another driver, Ray Harroun, was being presented
for the 500miles. In 2003 the winner, Gil de Ferran, averaged 153.6mph. Here are the data for
the first few and four recent Indianapolis 500 races. Included also are the pole winners (the
winners of the trial the day before, when each driver drives alone to determine the position
on race day).
Jawab :
2,5 mil Indianapolis Motor Speedway telah menjadi rumah bagi perlombaan pada hari
peringatan hampir setiap tahun sejak 1911. Saat balapan pertama ada kontroversi. Ralph
Mulford diberi bendera kotak-kotak pertama tetapi mengambil tiga lap ekstra hanya untuk
memastikan ia menyelesaikan 500 mil. Ketika ia selesai, driver lain, Ray Harroun,
dipresentasikan dengan piala pemenang, dan protes Mulford telah diabaikan. Harroun
rata-rata 74.6mph untuk 500miles. Pada 2003the pemenang, Gil de Ferran, rata-rata-rata-rata 153.6mph.
Berikut adalah data untuk beberapa pertama dan empat Indianapolis 500 ras. Termasuk
juga adalah pole winner (pemenang sidang sehari sebelumnya, ketika setiap driver
mengendarai sendiri untuk menentukan posisi pada hari perlombaan).
Who : pemenang
What : tahun (kualitatif), pemenang (kualitatif), posisi jarak(kuantitatif), kecepatan
rata-rata(kuantitatif), pole winner (kualitatif), rata-rata kecepatan pole (kuantitatif)
Why : untuk mengetahui pemenang dengan kecepatan rata-ratanya
Nomor 25 Halaman 17 (Chapter 2)
Horse race. The Kentucky Derby is a horse race that has been run every year since 1875 at
race that early in the season (it has been run in May every year but one-1901-when it took
place on April 29). Here are the data for the first few and a few recent races.
Jawab :
Pacuan kuda. The Kentucky Derby adalah pacuan kuda yang telah dijalankan setiap tahun
sejak 1875 di Churchill Downs, Louisville, Kentucky. Perlombaan dimulai dari1,5 mil, tetapi
pada tahun 1896 itu disingkat menjadi 1,25 kilometer karena para ahli merasa bahwa kuda 3
tahun tidak boleh menjalankan seperti perlombaan panjang yang di awal musim (telah
dijalankan Mei setiap tahun tetapi satu-1901-ketika itu terjadi pada tanggal 29 April).
Berikut adalah data untuk balapan pertama dan balapan terakhir :
Where: Churchill Downs, Louisville, Kentucky
Who : Balapan Kuda
What : Tanggal (kuantitatif), pemenang(kualitatif), margin (kuantitatif), jockey (kualitatif),
hadiah pemenang (kuantitatif), durasi (kuantitatif), kondisi jaur (kualitatif)
When : tahun 1901
Why : untuk mengetahui tentang perlombaan kuda di Churchill Downs
(Chapter III)
Auditing reform. In the wake of the EnronCorporation scandal, the Gallup Organization asked 1001 American adults what kind of changes, if any, are needed in the way major corporations are audited. Here is a display of the results.
a) Make a pie chart of the same data.
b) Which chart works better to summarize the data? Why?
c) Summarize the findings of the poll in a few sentences that might appear in a newspaper article.
Jawab :
a) Pie Chart dari data yang sama adalah :
b) Grafik yang bekerja lebih baik untuk meringkas data adalah grafik batang karena dengan grafik batang lebih mudah untuk membandingkan persentase dan membuat urutan respon.
utama, 35% mengatakan reformasi kecil yang diperlukan. Sementara hanya 17% dari Amerika orang dewasa yang disurvei merekomendasikan lengkap overhaul, 74% dari responden direkomendasikan baik besar atau kecil reformasi dengan cara bahwa korporasi diaudit. Hanya 4% yang mendukung tidak ada reformasi sistem saat ini.
Nomor 31 halaman 43 (Chapter 3)
Blood Pressure. A company held a blood pressure screening clinic for its employees. The results are summarized in the table below by age group and blood pressure level :
a) Find the marginal distribution of blood pressure level
b) Find the conditional distribution of blood pressure level within each age group. c) Compare these distribution with a segmented bar graph.
d) Write a brief description of the association between age and blood pressure among these employees.
e) Does this prove that people’s blood pressure increases as they age? Explain.
Jawab :
a) Distribusi marjinal tekanan darah untuk karyawan perusahaan adalah total kolom tabel, dikonversi ke persentase. 20% rendah, 49% normal dan 31% tekanan darah tinggi.
Di bawah umur 30 tahun
Rendah : 2798= 0.28 = 28%
Normal : 48
98 = 0.49 = 49%
Tinggi : 2398 = 0.23 = 23%
Umur 30 – 49 tahun
Rendah : 17937 = 0.21 = 21%
Normal : 17991 = 0.51 = 51%
Tinggi : 17951 = 0.28 = 28%
Umur di atas 50 tahun
Rendah : 19731 = 0.16 = 16%
Normal : 93
197= 0.47 = 47%
Tinggi : 19773 = 0.37 = 37%
d) Deskripsi singkat mengenai persatuan umur dan tekanan darah diantara semua karyawan adalah dalam perusahaan ini, umur meningkat, persentase karyawan dengan tekanan darah rendah berkurang, dan persentase karyawan dengan tekanan darah tinggi meningkat.
e) Ini tidak membuktikan bahwa tekanan darah masyarakat meningkatkan dengan bertambahnya usia mereka. Umumnya, sebuah asosiasi antara dua variabel tidak berarti hubungan sebab-akibat. Secara khusus, ini Databerasal dari hanya satu perusahaan dan tidak dapat diterapkan untuk semua orang. Selain itu, mungkin ada beberapa variabel lain yang terkait dengan usia dan tekanan darah. Hanya percobaan terkontrol dapat mengisolasi hubungan antara usia dan tekanan darah.
Nomor 33 halaman 43 (Chapter 3)
Family Planning. A 1945 study of 1438 pregnant women examined the associated between
the woman’s education level and the occurrence of unplanned pregnancies, producing these
data:
Does this indicate that more schooling taught young women better family planning? What
other explanations for these data can you think of? (Fertilihj Planning andFertility Rates by Socio-Economic Status, Social and Psychological Factors Affecting Fertility, 1954).
Jawab :
Nomor 34 halaman 43 (Chapter 3)
Pet ownership. The U.S.Census Bureau reports the number of households owning various
types of pets. Specifically, they keep track of dogs, cats, birds, and horses
a) Do you think the income distributions of the households who own these different
animals would be roughly the same? Why or why not?
b) The table shows the percentages of income levels for each type of animal owned. Are
these row percentages, column percentages, or table percentages? c) Do the data support your initial guess? Explain.
Jawab :
a) Tidak, menurut kami distribusi pendapatan rumah tangga menurut kepemilikan hewan peliharaan tidak akan diharapkan sama. Merawat kuda jauh lebih mahal, umumnya, daripada merawat anjing, kucing, atau burung. Rumah tangga dengan kuda sebagai hewan peliharaan akan diharapkan untuk menjadi lebih umum di kategori pendapatan yang lebih tinggi.
c) Ya, data mendukung tapi sampai batas tertentu. Persentase kuda dimana pemiliknya memiliki pendapatan kurang dari $12.500 hanya 9%, dibandingkan dengan persentase tahun 20-an untuk tingkat pendapatan lainnya, sedangkan tingkat pendapatan dari pemilik hewan peliharaan lainnya kira-kira memiliki persentase yang sama. Namun, dengan pengecualian mereka yang berpenghasilan kurang dari $12.500, persentase di setiap tingkat pendapatan antara pemilik kuda yang tidak jauh berbeda.
Nomor 37 halaman 44 (Chapter 3)
Hospitals. Most patients who undergo surgery make routine recoveries and are discharged
as planned. Others suffer excessive bleeding, infection, or other postsurgical complications
and have their discharges from the hospital delayed. Suppose your city has a large hospital
and a small hospital, each performing major and minor surgeries. You collect data to see
how many surgical patients have their discharges delayed by postsurgical complications,
and find the results shown in the following table.
a) Overall, for what percent of patients was discharge delayed?
b) Were the percentages different for major and minor surgery? c) Overall, what were the discharge delay rates at each hospital? d) What were the delay rates at each hospital for each kind of surgery?
e) The small hospital advertises that it has a lower rate of postsurgical complications.
Do you agree?
f) Explain, in your own words, why this confusion occurs.
Jawab :
a) Total marjinal telah ditambahkan ke tabel:
Procedure
Large Hospital Small Hospital Total
Major
Jumlah Operasi besar =120 dari 800 ,10 dari 50 ,130 dari 850. Jumlah Operasi kecil = 10 dari 200, 20 dari 250, 30 dari 450 ,
Prosedur Total = 130 1000 30 300 160 1300 160 dari 1.300, atau sekitar 12,3% dari pasien memiliki debit tertunda.
b) Perbedaan persentase antara operasi besar dan operasi kecil adalah pasien operasi besar tertunda 130 dari 850 kali, atau sekitar 15,3% dari waktu. Pasien operasi kecil tertunda 30 dari 450 kali, atau sekitar 6,7% dari waktu.
c) Tingkat penundaan untuk masing-masing rumah sakit adalah :
Rumah Sakit besar memiliki tingkat penundaan 130 dari 1000, atau 13%. Rumah Sakit Kecil memiliki tingkat penundaan 30 dari 300, atau 10%. Rumah sakit kecil memiliki tingkat keseluruhan yang lebih rendah tertunda debit.
d) Laju penundaan untuk masing-masing rumah sakit pada setiap bedah adalah : Rumah Sakit besar: Bedah Mayor 15% Bedah tertunda dan Kecil 5% tertunda. Rumah Sakit kecil: Bedah Mayor 20% Bedah tertunda dan kecil 8% tertunda. Meskipun rumah sakit kecil memiliki tingkat keseluruhan yang lebih rendah dari debit tertunda, rumah sakit besar memiliki tingkat lebih rendah daripada debit tertunda untuk setiap jenis operasi.
e) Kami tidak setuju karena tingkat penundaan secara keseluruhan untuk debit lebih rendah untuk rumah sakit kecil, rumah sakit besar melakukan lebih baik untuk kedua operasi baik operasi besar maupun operasi kecil.
f) Menurut kami, kekeliruan ini terjadi karena rumah sakit kecil melakukan persentase yang lebih tinggi dari operasi minor dari operasi besar. 250 dari 300 operasi kecil di rumah sakit kecil atau sebesar (83%). Hanya 200 dari 1000 operasi yang kecil di rumah sakit besar atau sebesar (20%). Operasi kecil memiliki tingkat keterlambatan lebih rendah dari operasi besar (6,7% menjadi 15,3%), sehingga tingkat keseluruhan rumah sakit kecil itu telah artifisial meningkat. Sederhananya, itu adalah kesalahan untuk melihat persentase keseluruhan. Kebenaran yang nyata ditemukan oleh melihat tingkat setelah informasi dipecah oleh jenis operasi, karena tarif kelambatan untuk setiap jenis operasi yang begitu berbeda. Rumah sakit yang lebih besar adalah lebih baik rumah sakit ketika membandingkan tarif delay discharge.
Nomor 38 halaman 45 (Chapter 3)
a) Compare the two services overall percentage of late deliveries.
b) Based on the results in part a, the company has decided to hire Pack Rats. Do you agree they deliver ontime more often? Why or why not? Be specific.
c) The results here are an instance of what phenomenon?
Jawab :
a) Persentase keseluruhan dua layanan dari pengiriman yang terlambat adalah pada Pack Rats telah menyampaikan total 28 paket terlambat (12 Regular + 16 Semalam), dari Sebanyak 500 pengiriman (400 Regular + 100 Semalam). 28/500 = 5,6% dari paket yang terlambat. Kotak R Us telah melahirkan total 30 paket terlambat (2 Regular + 28 Semalam) dari total 500 pengiriman (100 Regular + 400 Semalam). 30/500 = 6% dari paket yang terlambat.
b) Kami kurang sependapat, perusahaan harus menyewa box R Us bukannya Pack Rats. Kotak R Us hanya memberikan 2% (2 dari 100) paket Reguler yang terlambat, dibandingkan dengan Pack Rats, yang memberikan 3% (12 dari 400) paket Reguler yang terlambat. Selain itu, box R Us hanya memberikan 7% (28 out 400) paket Overnight yang terlambat, dibandingkan dengan Pack Rats, yang memberikan 16% nya Paket semalam terlambat. Kotak R Us baik di memberikan Reguler dan Overnight paket.
c) Hasilnya adalah sebuah contoh turunan dari Simpson Paradox, karena tarif pengiriman akhir keseluruhan rata-ratanya tidak adil. Kotak R Us memberikan persentase yang lebih besar dari paket yang Semalam, di mana itu relatif lebih sulit untuk tepat waktu. Pack Rats memberikan banyak paket Regular, di mana lebih mudah untuk membuat pengiriman tepat waktu.
Nomor 39 halaman 45 (Chapter 3)
Graduate Admissions. A 1975 article in the magazine Science examined the graduate
admissions process at Berkeley for evidence of gender bias. The table below shows the
number of applicants accepted to each of four graduate programs. What percent of total
applicants were admitted?
a) Overall, were a higher percentage of males or females admitted?
b) Compare the percentage of males and females admitted in each program.
c) Which of the comparisons you made do you consider to be the most valid? Why?
Jawab :
a) Persentase yang lebih tinggi dari laki-laki atau perempuan yang mengaku adalah ada 1284 pelamar yang mengaku dari total dari 3.014 pelamar = 1284/3014 = 42,6%
b) Perbandingan antara laki-laki dan perempuan yang mengaku adalah 1022 dari 2165 (47,2%) dari laki-laki yang mengaku sedangkan 262 dari 849 (30,9%) dari perempuan dirawat. Karena ada empat perbandingan, maka tabel mengatur persentase laki-laki dan perempuan diterima di masing-masing program. Perempuan diterima pada tingkat yang lebih tinggi dalam setiap program.
Program Males Females 1 69 .9% 82.40% 2 62.90% 68.00% 3 33.70% 35.20%
4 5.90% 7%
c) Perbandingan tingkat penerimaan dalam setiap Program yang paling valid. Keseluruhan persentase adalah rata-rata tidak adil. Gagal untuk mengambil perbedaan jumlah pelamar dan tingkat penerimaan yang berbeda dari masing-masing program. perempuan cenderung berlaku untuk program-program yang mendapatkan penerimaan sulit bagi semua orang. Ini adalah contoh dari Simpson Paradox.
Nomor 40 halaman 45 (Chapter 3)
Show how it's possible for Company B to fill a higher percentage of both full-time and part-time jobs with local residents, even though Company A hired more local residents overalL (Answers will vary.)
Jawab :
Jawaban dari soal ini akan bervariasi. Tiga arah tabel di bawah ini menunjukkan salah satu kemungkinan. Jumlah lokal karyawan dari karyawan baru akan ditampilkan dalam setiap sel.
Company A Company B
Full-time New Employees 40 of 100 = 40% 90 of 200 = 45%
Part-time New Employees 170 of 200 = 85% 90 of 100 = 90%
Total 210 of 300 = 70% 180 of 300 = 60%
(Chapter IV)
Nomor 2 halaman 72 (Chapter 4)
Not a Histogram. Find a graph other than a histogram that shows the distribution of a quantitive variable in a newspaper or a magazine article.
a) Does the article discuss the W's for the data? b) What are the units for the variable?
c) Does the article use the range, IQR, or standard deviation?
d) Is the choice of measure of spread appropriate for the situation? Explain.
Jawab :
Sumber (www.ekonomi.kompasiana.com)
Dalam beberapa tahun terakhir, khususnya setelah pemilihan umum yang lalu, sejumlah inisiatif
a. What : Pertumbuhan Ekonomi Timor Leste – Indonesia When : Tahun 200-2014
Why : Perbandingan ekonomi antara Timor Leste-Indonesia Who : Timor Leste dan Indonesia
b. Tampilan data sudah sesuai dengan data yang ada. Karena untuk perbandingan 2 buah objek, maka di butuhkan grafik garis yang terdiri dari 2 garis, yang satunya menginterpretasikan Timor Leste, dan garis berwarna merah menginterpretasikan data dari Indonesia. Jika kita menggunakan histogram, maka akan sulit melihat perbedaan dari pertumbuhan ekonomi Timor Leste dan Indonesia.
d. Pada artikel tidak menjelaskan secara rinci tentang grafik yang ada. Karena kita tidak dapat mengetahui secara pasti tentang pertumbuhan ekonomi setiap tahunnya. Yang dapat di baca dari grafik ialah posisi pertumbuhan ekonomi Timor Leste itu meningkat, sedangkan Indonesia datar , namun jumlah pertumbuhannya tidak dijelaskan pada aartikel.
Nomor 19 halaman 73 (Chapter 4)
Payroll. A small warehouse employs a supervisor at $1200 a week, an inventory manager at $700 a week, six stock boys at $400 a week, and four drivers at $500 a week.
a) Find the mean and median wage.
b) How many employees earn more than the mean wage?
c) Which measure of center best describes a typical wage at this company, the mean or the median?
d) Which measure of spread would best describe the payroll, the range, the IQR, or the standard deviation? Why?
Jawab :
Berdasarkan data di atas maka diketahui gaji dari pekerja sebuah gudang kecil dalam seminggu adalah:
Seorang Supervisor sebesar 1200 dollar.
Seorang Manajer Persediaan sebesar 700 dollar. 6 orang laki-laki Penyedia Stok sebesar 400 dollar. Dan 4 orang pengemudi sebesar 500 dollar. Jika data ini disusun maka jadinya adalah .
400 400 400 400 400 500 500 500 500 700 1200
a) Median dan rata-rata dari data di atas adalah :
400 400 400 400 400 400 500 500 500 500 700 1200
Median berada pada data ke-6 dan data ke-7 = (400+500)/2 = 450 dollar.
b) Hanya ada dua pekerja yang gajinya melebihi gaji rata-rata yaitu gaji dari supervisor dan manajer persediaan. Yang masing-masing gajinya adalah 1200 dollar dan 700 dollar.
c) Median lebih baik daripada rata-rata untuk untuk mengukur pusat terbaik yang menggambarkan upah khas di perusahaan ini. Karena mean hanya dipengaruhi oleh dua upah saja. Sedangkan median dipengaruhi oleh enam upah.
d) Rentang Antar Kuartil karena Rentang Antar Kuartil adalah ukuran yang lebih baik dari penyebaran untuk distribusi gaji dari kisaran atau deviasi standar. Standar deviasi dan rentang keduanya dipengaruhi oleh dua upah yang lebih tinggi.
Nomor 33 halaman 75 (Chapter 4)
Acid rain. Two researchers measured the pH (a scale on which a value of 7 is neutral and values below 7 are acidic) of water collected from rain and snow over a 6-month period in Allegheny County, Pennsylvania. Describe their data with a graph and a few sentences.
4.57 5.67 5.08 5.62 4.39 4.41 5.29 4.26 5.51 4.64 4.26 4.82 4.31 4.40 4.63 4.30 5.78 4.29 4.45 4.56 4.52 4.12 4.12 4.39 4.73 4.60
Jawab :
Diketahui data dari suatu penelitian yang mengukur PH air dalam periode 6 bulan di Allegheny Country,PA sebagai berikut :
4.57 5.67 5.08 5.62 4.39 4.41 5.29 4.26 5.51 4.64 4.26 4.82 4.31 4.40 4.63 4.30 5.78 4.29 4.45 4.56 4.52 4.12 4.12 4.39 4.73 4.60
Distribusi pembacaan pH sampel air di Allegheny Country,PA adalah bimodal. Data kasar seragam berpusat di sekitar PH dari 4.4. Data ini berkisar dari pH 4,1 - 4,9. Sedangkan pada kelompok yang lain berpusat di sekitar pH 5,6.
Nomor 34 halaman 76 (Chapter 4)
Marijuana. In 1995 the Council of Europe published a report entitled The European School Survey Project an Alcohol and Other Drags. Among other issues, the survey investigated the percentages of 9th graders who had used marijuana. Here are the results for 20 Western European countries.
Create an appropriate graph of these data, and describe the distribution.
Austria 10% Italy 19%
Belgium 19% Luxemburg 6% Denmark 17% Netherlands 31% England 40% No.Ireland 23%
Finland 5% Norway 6%
France 12% Portugal 7%
Germany 21% Scotland 53%
Greece 2% Spain 15%
Iceland 10% Sweden 6%
Ireland 37% Switzerland 27%
Jawab :
Dari laporan berjudul “The School Survey Eropa” yang memproyeksikan Alkohol dan
Austria 10% Italy 19% Belgium 19% Luxemburg 6% Denmark 17% Netherlands 31% England 40% No.Ireland 23%
Finland 5% Norway 6%
France 12% Portugal 7%
Germany 21% Scotland 53%
Greece 2% Spain 15%
Iceland 10% Sweden 6%
Ireland 37% Switzerland 27%
Grafik yang sesuai dari data di atas adalah sebagai berikut :
Pendeskripsian dari distribusi datanya adalah :
Pada grafik di atas berbentuk Unimodal dengan pusat sekitar 10, tetapi hanya beberapa negara yang melaporkan persentase lebih dari 20. Ini membuat distribusi terlihat miring ke kanan, kecuali pada dua kelompok pertama yang berbeda.
Nomor 35 halaman 76 (Chapter 4)
Jawab :
Pada soal di atas didistribusikan histogram berikut untuk menunjukkan distribusi nilai pada 200- titik ujian terakhirnya.
Komentar untuk tampilan grafiknya adalah lebar histogram terlalu lebar sehingga skala untuk jumlah pelajar dengan nilai finalnya tidak begitu sesuai.
Nomor 36 halaman 76 (Chapter 4)
Final grades revisited. After receiving many complaints about his final grade histogram fromstudents currently taking a Statistics course, the professor distributed the following revised histogram.
a) Comment on this display.
b) Describe the distribution of grades.
Jawab :
a) Komentar untuk tampilan grafiknya adalah batang dari histogram terlalu sempit sehingga sulit untuk membaca informasi dari datanya.
b) Tampilan distribusinya miring ke kiri, modusnya dekat dengan 170, beberapa outliernya berada di bawah 100. Data berkerumun cukup erat berkerumun kecuali untuk outlier.
Nomor 37 halaman 76 (Chapter 4)
Zip codes. Holes R Us, an Internet company that sells piercing jewelry, keeps transaction records on its sales. At a recent sales meeting, one of the staff presented a histogram of the zip codes of the last 500 customers so that they might understand where sales are coming from. Comment on the usefulness and appropriateness of the display.
Jawab :
Komentar untuk kegunaan dan kesesuaian layar adalah baik yang sesuai atau berguna. Kode pos adalah data kategori, tidak kuantitatif. Tabel di atas memang mengandung beberapa informasi. Digit terkemuka memberikan gambaran kasar dari Timur ke Barat penempatan di Amerika Serikat. Jadi kita melihat bahwa grafik hampir tidak memiliki pelanggan di timur laut, tapi bar chart dengan digit terkemuka akan lebih tepat untuk menggambarkannya.
Nomor 38 halaman 76 (Chapter 4)
Industry Codes. A recently hired investment analyst has been assigned to analyzed the companies that make up the Fortune 800, a collection of the largest U.S companies. He codes each company by the type of industry to which they belong. Here is a table showing some of the industry types and the corresponding codes he uses.
The analyst produces the following histogram of the industry codes for the companies :
a) What might account for the gaps seen in the histogram? b) Is the histogram unimodal?
Jawab :
Dari soal di atas diketahui tabel yang menunjukkan beberapa jenis industri dan sejumlah kode yang terkait yang dipakai seorang analis untuk menganalisis perusahaan yang membentuk Fortune 800, koleksi perusahaan-perusahaan AS terbesar, yaitu sebagai berikut :
Adapun histogram dari kode industri untuk perusahaannya adalah sebagai berikut :
a) Yang memperlihatkan kesenjangan di histogram adalah kodenya. Kodenya merupakan bilangan bulat dan lebar binnya kurang dari 1. Kode dari histogram ini kategoris dan tidak kuantitatif.
b) Tidak ada jawaban yang tepat untuk menjawab dari pernyataan ini. Karena tampilannya tidak sesuai untuk jawaban yang diharapkan.
c) Tampilan histogramnya tidak sesuai. Datanya termasuk data kategoris. Sebaiknya kita harus menggunakan bar chart.
Math Scores. The national Center for Education Statistics reported 1999 average mathematics achievement scores for eight graders in 38 nations. Singapore led the group, with an average of 604, while South Africa had the lowest average of 275. The United States scored 502. The Average scores for each nation are given below :
604 587 585 582 579 558 540 534 532 531
b) Which would you report? Why?
c) Write a brief summary of the performance of eighth graders worldwide. Be sure to comment on the performance of the United States.
Jawab :
Dari soal di atas diketahui skor rata-rata nilai prestasi matematika untuk siswa kelas delapan di 38 negara dilaporkan dari Pusat nasional untuk Statistik Pendidikan pada tahun 1999. Dimana Singapura memimpin kelompok, dengan rata-rata 604, sedangkan Afrika Selatan memiliki rata-rata terendah dari 275. Amerika Serikat mencetak 502. Rata-rata nilai tersebut adalah sebagai berikut :
604 587 585 582 579 558 540 534 532 531 530 526 525 520 520 519 511 505 502 496 491 482 479 476 472 469 467 466 448 447 429 428 422 403 392 345 337 275
a) Median, Rentang antar Kuartil, Rata-rata, dan Standar Deviasi dari rata-rata nasional di atas adalah :
Pertama-tama akan dibuat tabel distribusinya
Rentang = data terbesar – data terkecil = 604 – 275 = 329 Banyak Kelas (K)= 1 + 3.322 log n
= 1 + 5.248 = 6.248
Panjang Kelas (P) = Rentang/Banyak Kelas = 329/6.248 = 52.66 ≈ 53
Dimana b = batas bawah kelas median, adalah kelas dimana median akan terletak, p = panjang kelas median
n = ukuran sampel atau banyak data
(Q1) = b + p (
Rata-rata dari data di atas adalah = fi xi
fi = 18477/38 = 486.24
( Dimana fi xi, fi diperoleh dari tabel frekuensi yang ada di atas )
Standar Deviasi dari data di atas adalah : S2 = fi (xi − x)2
n−1 = 531089.53/6 = 88514.92
S = 88514.92 = 297.51
b) Yang akan kami laporkan adalah karena rata-rata akan lebih besar dari median, karena distribusinya tepat miring.
Nomor 40 halaman 77 (Chapter 4)
Prisons. A report from the U.S. Department of Justice gave the following percent increases in federal prison populations in 20 northeastern and midwestern states during 1999.
5.9, 1.3, 3.0, 5.9, 4.5, 5.6, 2.1, 6.3, 4.8, 6.9, 5.5, 5.3, 8.0, 4.4, 7.2, 3.2, 4.5, 3.5, 7.2, 6.4
a) Graph these data.
b) Calculate appropriate summary statistics.
c) Write a few sentences about these data. (Remember: shape, center, spread, unusual features.)
Jawab :
Diketahui Populasi penjara federal di 20 negara bagian timur laut dan barat tengah selama tahun 1999 adalah sebagai berikut :
5.9, 1.3, 3.0, 5.9, 4.5, 5.6, 2.1, 6.3, 4.8, 6.9, 5.5, 5.3, 8.0, 4.4, 7.2, 3.2, 4.5, 3.5, 7.2, 6.4
a) Grafik dari data di atas adalah sebagai berikut : Satuan desimal
b) Ringkasan datanya adalah sebagai berikut :
5.5 5.6 5.9 5.9 6.3 6.4 6.9 7.2 7.2 8.0
Nilai terkecil = 1,3 Nilai terbesar = 8,0
Kuartil Pertama = 3,5 +4,42 = 7,9 Kuartil Kedua = 5,3+5,5 2 = 5,4 Kuartil Ketiga = 6,3+6,42 = 6,35
c) Bentuknya mendekati pola simetris. Frekuensi terbanyak pada satuan 5, pusat atau nilai tengahnya berada pada 5,4 dan penyebaranya hampir merata.
Nomor 41 halaman 77 (Chapter 4)
Gasoline usage. The U.S. Department of Transportation collects data on the amount of gasoline sold in each state.The following data show the per capita (gallons used per person) consumption in the year 2000. Using appropriate graphical displays and summary statistics, write a report on the gasoline use by state in the year 2000.
Jawab :
Diketahui data tentang jumlah bensin yang dijual di setiap state pada tahun 2000 yang ditampilkan seperti di atas. Apabila data tersebut dibuatkan tabel distribusi frekuensi maka tampilannya akan menjadi :
296.66-340.66 2 2
Tampilan grafik yang sesuai dengan data di atas adalah sebagai berikut :
Ringkasan datanya adalah :
Dimana b = batas bawah kelas median, adalah kelas dimana median akan terletak, p = panjang kelas median
318,66 362,67 406,68 450,69 494,7 538,71 582,72
1/4 . n = 1/4 . 50 = 12.5
Laporan dari penggunaan Gasoline pada tahun 2000 adalah besar penggunaan gasoline paling sedikit adalah 296.66 dan paling banyak digunakan sebesar 586.58 dan penggunaan Gasoline paling banyak berada pada kisaran angka sebesar 428.69 sampai 472.69.
Nomor 42 halaman 77 (Chapter 4)
a) Make a suitable display of the growth rates.
b) Summarize the central growth rate with a median and mean. Why do they differ? c) Given what you know about the distribution, which of these measures does the
better job of summarizing the growth rates? Why?
d) Summarize the spread of the growth rate distribution with a standard deviation and with an IQR.
e) Given what you know about the distribution, which of these measures does the better job of summarizing the growth rates? Why?
f) Suppose we subtract from each of these growth rates the predicted U.S. average growth rate of 1.20%, so that we could look at how much these growth rates exceed the U.S. rate. How would this change the values of the summary statistics you calculated above? (Hint: You need not recompute any of the summary statistics from scratch.
g) If we were to omit Las Vegasfrom the data, how would you expect the mean, median, standard deviation, and I QR to change? Explain your expectations for each.Write a brief report about these growth rates.
h) Write a brief report about these growth rates.
Dari soal di atas diramalkan bahwa kota-kota yang tercantum di bawah ini akan menjadi pasar kerja yang paling cepat berkembang di Amerika Serikat selama 3 tahun ke depan Pada tahun 1996. Berikut adalah data laju pertumbuhan masing-masing kota :
a) Tampilan grafik yang sesuai dengan laju pertumbuhannya adalah sebagai berikut :
0 0,5 1 1,5 2 2,5 3 3,5 4
b) Ringkasan dari laju pertumbuhan pusat dengan sebuah median dan meannya adalah sebagai berikut :
Dari soal di atas diketahui urutan data dari laju pertumbuhan setiap kota adalah sebagai berikut :
1,86 1,87 1,90 1,93 2,02 2,07 2,07 2,13 2,16 2,22 2,25 2,26 2,37 2,44 2,51 2,61 2,62 2,64 2,69 3,72.
Median dari data adalah berada pada data ke-10 + data ke-11 = 2,22+ 2,25
2 = 2,235
Mean dari datadi atas adalah
= 1,86+1,87+1,90+1,93+2,02+2,07+2,07+2,13+2,16+2,22+ 2,25+2,26+2,37+2,44+2,51+2,61+2,62+2,64+2,69+3,72.
20
= 46,3620 = 2,318
Mean dan mediannya berbeda karena mean menggunakan seluruh angka dalam perhitungannya sedangkan median hanya menghitung dua angka saja yang berada di posisi ke-10 dan ke-11. Serta angka yang dihitung oleh median dan mean berbeda kisaran angkanya.
c) Pengukuran yang baik untuk ringkasan laju pertumbuhan ini adalah median karena median lebih banyak dipengaruhi oleh angka lainnya daripada rata-rata.
d) Ringkasan penyebaran dari distribusi laju pertumbuhan dengan menggunakan standar deviasi dengan menggunakan rentang antar kuartil adalah sebagai berikut :
1,86 1,87 1,90 1,93 2,02 2,07 2,07 2,13 2,16 2,22
2,25 2,26 2,37 2,44 2,51 2,61 2,62 2,64 2,69 3,72.
Rentang antar kuartilnya = Q3– Q1 = 2,56 – 2,045 = 0,515
Jadi simpangan kuartilnya adalah = ½ (Q3– Q1) = ½ (2,56 – 2,045) = 0.2575.
Maka standar deviasinya adalah : Simpangan kuartil = 2/3 standar deviasi 0.2575 = 2/3 SD
SD = (0.2575 x 3)/2 Jadi standar deviasinya adalah 0.38625.
e) Menurut kelompok kami pengukuran yang paling baik di antara mean, median, rentang antar kuartil dan standar deviasi yang ada disini adalah standar deviasinya karena disini standar deviasi dipengaruhi oleh semua angka yang ada di atas dibandingkan dengan mean, median, rentang antar kuartil.
f) Jika 1,2% yang dikurangi dari masing-masing suku yang diprediksi oleh laju pertumbuhan, maka rata-rata dan median akan mengalami penurunan setiap suku sebesar 1,2%. Sedangkan nilai standar Deviasi dan Rentang antar Kuartil tidak akan berubah.
g) Jika Las Vegas dihilangkan dari data di atas maka datanya akan menjadi :
1,86 1,87 1,90 1,93 2,02 2,07 2,07 2,13 2,16 2,22
2,25 2,26 2,37 2,44 2,51 2,61 2,62 2,64 2,69
Sehingga mediannya berubah menjadi data yang ada di posisi ke-10 = 2.22 Rata-ratanya menjadi = 46,3619−3.72 = 2,24
Kuartil ketiganya terletak pada data ke-15 = 2.51 Kuartil pertamanya terletak pada data ke-5 = 2.02
Rentang antar kuartil = Q3– Q1 = 2,51 – 2,02 = 0,49
Simpangan Kuartil = ½ (Q3– Q1) = ½ (0.49) = 0.245
0.245 = 2/3 SD SD = (0.245 x 3)/2 Jadi standar deviasinya adalah 0.3675
h) Dari data di atas rata-rata laju pertumbuhannya adalah 2.318. Kebanyakan angka berada kisaran lebih dari angka 2. Laju pertumbuhannya selalu meningkat. Dimana rata-rata terkecilnya berada pada For Worth Arlington,TX sebesar 1.86 dan rata-rata terbesar berada pada Las Vegas, NV-AZ sebesar 3.72
Nomor 43 halaman 77-78 (Chapter 4)
Customer database. A philanthropic organization has a database of millions of donors that they contact by mail to raise money for charities. One of the variables in the database, Title, contains the title of the person or persons printed on the address label. The most common are Mr., Ms.l, Miss, and Mrs., but there are also Ambassador and Mrs., Your Imperial Majesty, and Cardinal to name few others. In all there are over 100 different titles, each with a corresponding numeric code. Here are a few of them:
An intern who was asked to analyze the organization's fundraising efforts presented these summary statistics for the variable Title:
b) What are the typical reasons that cause measures of center and spread to be as different as those in this table?
c) Is that why these are so different?
Jawab :
Dari soal di atas diketahui data bahwa ada lebih dari 100 nama yang berbeda dari orang-orang yang tercetak pada label alamat untuk mendonorkan darah. Berikut adalah beberapa dari nama orang tersebut :
Jika disajikan ringkasan datanya maka akan menjadi seperti berikut :
a) Arti dari 54.41 adalah angka ini hanya sebagai yang ditugaskan untuk judul kategori, bahkan meskipun kategori ini diwakili oleh angka. Averaging hanya cocok untuk Data kuantitatif(data yang bisa dihitung).
c) Disini tidak perlu membahas mengenai perbedaan dalam ringkasan datanya, karena ringkasan data hanya sesuai untuk data kuantitatif (yang bisa dihitung). Sedangkan disini kode judulnya bersifat kategorik.
Nomor 44 halaman 79 (Chapter 4)
Zip codes revisited. Here are some summary statistics to go with the histogram of the zip
codes of 500 customers from the Holes-R-Us Internet Jewelry Salon that we saw in Exercise
29 of Chapter 4.
a) Is the mean or median a "better" summary of the center of the zip code distribution?
Why?
b) Is the standard deviation or the IQR a better summary of the spread? Why? c) What can these statistics tell you about the company's sales?
Jawab :
a) Baik mean atau median cocok untuk data ini. Kode pos kategori, dan berarti dan median hanya sesuai untuk data kuantitatif.
b) Baik standar deviasi atau IQR cocok untuk data ini. Kode pos kategori, dan standar deviasi dan IQR hanya sesuai untuk data kuantitatif.