Kesalahan-kesalahan di Statistik
Depok, 2011
Lingkup bahasan
•
•
•
•
•
•
Kesalahan di Statistik
Kesalahan di Sampling
Kesalahan Analisis Data
Penggunaan Kata--kata Multi Tafsir
Kesimpulan yang Salah
Kesalahan Visualisasi
Naskah ini disusun lebih mirip sebagai suatu ringkasan diktat dengan tujuan agar mahasiswa dapat menggunakannya untuk belajar mandiri. Isi naskah berupa kalimat-kalimat pendek sebagai pokok atau kunci materi sehingga mahasiswa dapat cepat mempelajari dan mudah mengingatnya.
Kesalahan di Statistik: Ketidaktahuan atau Kesengajaan?
•
•
•
•
•
•
Statistik sangat bermanfaat bagi kita untuk mengetahui suatu kenyataan atau
memprediksi suatu kejadian sehingga dapat memberikan kita bekal yang baik dalam mengambil keputusan.
Meskipun demikian terkadang kita jumpai ada kesalahan di statistik.
Kesalahan ini dapat terjadi di setiap tahapan ketika kita bekerja dengan data, mulai dari mengumpulkan, mengorganisasi, menganalisis, mempresentasikan, dan menyimpulkan data.
Pada umumnya kesalahan ini disebabkan oleh kekeliruan, ketidaktahuan, atau kekurangtelitian dalam bekerja.
Walaupun begitu tidak dapat disangkal, beberapa kesalahan di statistik terjadi karena adanya unsur kesengajaan yang didasari oleh berbagai kepentingan, misalnya
kepentingan individu, kelompok, bisnis, iklan, politik praktis, dll.
Oleh sebab itu, ketika menanggapi suatu hasil atau pernyataan statistik, kita harus
Jenis Kesalahan di Statistik
•
Kesalahan-kesalahan di statistik secara umum dapat dikelompokkan
dalam:
Kesalahan pemilihan metode sampling.
Kesalahan dalam pengolahan dan analisis data.
Kesalahan dalam pemilihan kata ketika memberikan pernyataan
untuk menafsirkan data.
Kesalahan dalam meyimpulkan suatu hasil statistik.
Kesalahan dalam memvisualisasikan data.
Pemilihan Sampel dan Jumlah Sampel
Contoh 1: Pernyataan statistik
“Lebih dari 70% mahasiswa UI suka mengendarai sepeda di
lingkungan kampus.”
• Sebelum kita menerima hasil atau kenyataan ini, kita perlu bersikap kritis, misalnya dengan mengemukakan pertanyaan:
Apakah surveinya dilakukan pada semua mahasiswa UI atau sebagian mahasiswa saja?
Jika sebagian mahasiswa saja yang disurvei, mahasiswa seperti apa yang dijadikan sampel?
Berapa jumlah mahasiswa yang dijadikan sampel?
Di statistik, kesalahan yang sering terjadi ketika sampling adalah metode
Pemilihan Sampel dan Jumlah Sampel (lanjutan)
Analisis kritis Contoh 1: Pernyataan statistik
“Lebih dari 70% mahasiswa UI suka mengendarai sepeda di
lingkungan kampus.”
• Marilah kita analisis setiap pertanyaan di atas:
Apakah surveinya dilakukan pada semua mahasiswa UI atau sebagian mahasiswa saja? Jika survei dilakukan untuk semua mahasiswa UI, maka data tersebut akurat (di sini kita asumsikan kuisioner yang digunakan sudah baik).
Jika sebagian mahasiswa saja yang disurvei, mahasiswa seperti apa yang dijadikan sampel?
Sampel yang baik adalah yang representatif. Sampel yang buruk adalah sampel bias. Berapa jumlah mahasiswa yang dijadikan sampel?
Tidak ada aturan jumlah sampel minimum. Jumlah sampel yang baik adalah yang mencukupi untuk menggambarkan sifat dan karakter populasi yang diwakilinya.
Contoh 2: Pemilihan Sampel dan Jumlah Sampel
Sebuah perusahaan permen karet mengeluarkan pernyataan: “ Empat dari lima dokter gigi merekomendasikan permen karet bebas gula untuk pasien yang suka mengunyah permen.”
Analisis: Berapa jumlah dokter gigi yang disurvei? Seandainya hanya 5 atau mungkin
10 dokter gigi yang disurvei, fakta ini belum dapat diterima. Sangat mungkin hasilnya akan berbeda jika ada 100 dokter yang disurvei.
Sebuah produsen sepak bola mengklaim, bolanya (bola A) lebih baik dari pada bola B (produk perusahaan saingannya), karena setelah diuji dengan menendangnya, bola A dapat meluncur lebih cepat dan jauh dibandingkan dengan bola B.
Analisis: Klaim ini terlalu ceroboh, sebab hanya diuji untuk satu bola saja. Disamping
itu kecepatan meluncur dan jangkauan luncur bola dipengaruhi oleh banyak
faktor, seperti kekasaran permukaan lapangan, arah angin, apakah tendangan untuk kedua bola identik, dll. Sehingga agar datanya akurat perlu dilakukan eksperimen yang berulang, agar diperoleh data statistik yang representatif.
Analisis nilai rata-rata
Sebuah perusahaan mengeluarkan pernyataan: “Gaji rata-rata karyawan di
perusahaan kami adalah lebih dari 3 juta per bulan.”
• Kita perlu bersikap kritis terhadap pernyataan ini, misalnya perlu
dipertanyakan:
Bagaimana pengolahan datanya, apakah sudah benar atau ada ketidaktelitian dalam perhitungannya?
Apa yang dimaksud dengan rata-rata di sini? Apakah mean, median, atau mode?
Pada kasus ini kita tidak perlu mempermasalahkan metode
samplingnya, sebab setiap perusahaan pasti mempunyai daftar gaji yang lengkap, sehingga data yang digunakan adalah populasi.
Jabatan Jumlah karyawan Gaji (Rp.)/bulan
Direksi 2 10.000.000
Manager 4 5.000.000
Staf 10 2.000.000
Pembantu 5 750.000
Contoh 3: Analisis nilai rata-rata
Marilah kita analisis peryataan di atas: “Gaji rata-rata karyawan di
perusahaan kami adalah lebih dari 3 juta per bulan.”
• Seandainya data gaji perusahaan tsb adalah sbb:
• Jika dilakukan perhitungan untuk data di atas, diperoleh: nilai mean = 3,035 juta, median = 2 juta, dan mode = 2 juta.
• Jadi pernyataan di atas telah menggunakan mean untuk menyatakan gaji rata-rata. Apakah nilai mean ini representatif untuk gaji karyawan? Jumlah karyawan adalah 21 dan mayoritas
berkedudukan staf dengan gaji 2 juta. Nilai mean sangat sensitif dipengaruhi oleh gaji Direksi dan Manager yang ekstrim besar. Jika kita tinjau nilai median yang 2 juta, nilai inilah yang mewakili gaji kebanyakan karyawan.
Analisis nilai deviasi
Sebuah perusahaan A mengeluarkan pernyataan: “Layar LCD kami
mempunyai waktu hidup 80.000 jam, lebih unggul dari pada layar LCD lainnya yang rata-rata hanya punya waktu hidup 75.000 jam.”
Kita sebagai konsumen tidak boleh serta-merta mempercayai peryataan ini dan langsung memutuskan perusahaan A mempunyai layar LCD yang lebih lama hidup dari pada perusahaan lainnya, misalnya B.
Kita perlu bersikap kritis, misalnya mempertanyakan bagaimana metode pengujian dan analisis datanya sampai mendapatkan angka waktu hidup. Bagaimana dengan sebaran datanya?
Berfikir kritis untuk Contoh kasus seperti ini dapat lebih difokuskan pada
Contoh 4: Analisis nilai deviasi
Sebaran data dari suatu eksperimen sangat penting, sebab informasi ini menentukan kualitas dari data.
Sebagai contoh untuk kasus di atas, seandainya kita mendapatkan distribusi data eksperimennya, maka dapat diambil keputusan yang tepat. Misalnya:
Kondisi 1 Kondisi 2
Kita dapat langsung memutuskan LCD-A lebih baik dibandingkan LCD-B jika sebaran datanya seperti kondisi 1. Tidak ada satupun LCD –B yang lebih baik dari LCD-A. Jika sebaran datanya seperti kondisi 2, maka LCD-B, lebih baik dari pada LCD-A. Dijumpai beberapa LCD-A lebih buruk dari pada LCD-B.
LCD-B=75.000 LCD-A=80.000 LCD-B =75.000 LCD-A =80.000
Contoh 5: Analisis nilai deviasi
Pada waktu kampanye politik sering diungkapkan berbagai macam hasil survei atau poling untuk tujuan mendapatkan simpati atau dukungan masa yang lebih banyak. Sebagai contoh, sebuah lembaga survei menampilkan
grafik hasil surveinya untuk beberapa partai menjelang pemilu. Lembaga tersebut membuat pernyataan:
“Partai A akan memenangkan pemilu dengan suara 40%, sesuai dengan hasil survei terakhir ini.”
Kita perlu kristis dalam membaca hasil survei ini.
Bagaimana dengan deviasi datanya. Seandainya survei mempunyai deviasi 2%, maka Partai A dapat mempunyai suara 38% - 42%, sedangkan Partai C mendapatkan suara 35% - 39%.
Secara statistik suara Partai A dan C tidak berbeda karena ada daerah data yang bertindih (overlap), sehingga ada kemungkinan Partai C yang menang.
Kata-kata Multi Tafsir
Kita sering menjumpai pernyataan statistik yang menggunakan kata-kata multi tafsir.
Pada umumnya kata-kata ini dipilih untuk tujuan propaganda atau iklan. Contoh 6:
Sebuah perusahaan super market menyatakan: “ABC adalah super market terbesar
di Indonesia.”
Analisis: kata terbesar mempunyai banyak tafsir, apakah terbesar
karyawannya, labanya, jumlah tokonya, pengunjungnya, dll.
Contoh 7:
Sebuah perusahaan mie instan menyatakan: “DEF adalah mie terlezat di
Indonesia.”
Analisis: kata terlezat sangat relatif. Rasa lezat tidak dapat didefinisikan dengan
Kata-kata Multi Tafsir
Ketika menjumpai kata-kata multi tafsir yang dikaitkan dengan data kuantitatif, kita harus hati-hati dan kritis. Pernyataan pada contoh 6 dan
7, mungkin didukung dengan data yang benar, tetapi penyampaiannya dalam bentuk pernyataan mempunyai maksud propaganda menggiring opini
masyarakat untuk maksud tertentu.
Analisis lanjutan Contoh 6 dan 7:
Bisa jadi supermarket ABC mempunyai jumlah karyawan terbesar di antara semua supermarket yang ada di Indonesia. Informasi jumlah karyawan sengaja tidak disebutkan untuk mencapai tujuan tertentu.
Survei yang dilakukan oleh perusahaan mie DEF dan melibatkan mie merek lainnya menunjukkan mie DEF yang paling disukai. Walaupun demikian selera/rasa lezat dari setiap orang bisa berbeda, demikian juga faktor lainnya yang mempengaruhi hasil survei misalnya penyajian, metode memasak, dll. belum dipertimbangkan.
Pengambilan Kesimpulan Yang Tidak Tepat
Contoh 8: Sebuah perusahaan desinfektan melakukan eksperimen, produknya
mampu membunuh 5000 kuman di laboratorium hanya dalam waktu 5 detik. Kemudian ia mengeluarkan pernyataan: “Gunakanlah desinfektan A untuk
mencegah flu.”
• Kita perlu bersikap kritis terhadap pernyataan ini. Memang benar banyak
kuman yang dapat dibunuh oleh desinfektan ini, tetapi apakah kuman flu yang ada disekitar kita termasuk yang diujicobakan di laboratorium?
• Perusahaan tersebut telah mengambil kesimpulan yang salah terhadap hasil uji laboratoriumnya. Tidak semua kuman flu telah mereka uji, sehingga tidak boleh diambil kesimpulan yang bersifat umum.
• Kesalahan dalam pengambilan kesimpulan ini dapat terjadi karena
kekurangfahaman seseorang terhadap permasalahan atau mungkin disebabkan oleh kekurangan penalaran berlogika.
Pengambilan Kesimpulan Yang Tidak Tepat
Contoh 9: Sebuah perusahaan mengeluarkan pernyataan: “Handuk Q lebih
berat dari pada handuk lainnya, sehingga dapat menyerap air lebih banyak.”
Analisis: Berat handuk tidak ada kaitannya dengan kemampuan handuk menyerap
air. Kemampuan serapan air ditentukan oleh absorbansi bahan handuk, bukan beratnya. Sebagai analogi: Batu lebih berat dari pada sepon, tetapi sepon mudah sekali menyerap air dibandingkan batu.
Contoh 10: Sebuah perusahaan iklan asuransi menyatakan: ”Pada bulan lalu
452 orang memindahkan asuransi kecelakaannya ke Asuransi Z.”
Analisis: Iklan ini memberikan kesan perusahaan asuransi lainnya telah
memberikan layanan yang kurang baik, sehingga banyak orang yang pindah ke asuransi Z mungkin karena lebih dipercaya dan memberikan pelayanan lebih prima. Data 452 orang yang pindah ke asuransi Z adalah benar, tetapi data jumlah orang yang pindah dari asuransi Z ke perusahaan asuransi lainnya tidak diinformasikan.
Mot or ( x1000 ) Mot or ( x1000 )
Visualisasi Dapat Memberikan Kesan Positif atau Negatif
Contoh 11:
•
•
Data yang digunakan untuk menggambar kedua grafik di atas adalah sama. Tetapi, kesan yang diberikan berbeda. Grafik sebelah kiri mengesankan pertumbuhan produksi motor dari tahun 2005 – 2010 tetap, tetapi grafik disebelah kanan memberikan kesan terjadi kenaikan produksi yang cukup besar.
Perbedaan kedua grafik terletak pada skala sumbu tegaknya. Grafik kiri mempunyai skala antara 30 – 80 sedangkan grafik kanan 50 – 54, sehingga perubahan sedikit yang ada di grafik kanan dapat menimbulkan kesan perubahan yang besar.
Produksi Sepeda Motor Z
54 53 52 51 50 2004 2005 2006 2007 2008 2009 2010 Tahun
Produksi Sepeda Motor Z
80 70 60 50 40 30 2004 2005 2006 2007 2008 2009 2010 Tahun
Visualisasi Dapat Memberikan Kesan yang Salah
Contoh 11 menunjukkan bahwa visualisasi dapat memberikan kesan
terhadap hasil, bahkan bisa menyebabkan kesimpulan yang salah pada data.
Pada pembahasan ini akan kita diskusikan beberapa kesalahan yang dapat disebabkan oleh visualisasi data, antara lain:
Pemilihan skala
Visualisasi 2D atau 3D Perbandingan bentuk Kesalahan persentasi data Keakuratan grafik
Ju ml ah s el Ju ml ah s el
Pemilihan Skala
Contoh 12: 8.E+07 7.E+07 Pertumbuhan Sel1.E+08 Pertumbuhan Sel
•
•
Data yang digunakan kedua grafik di atas adalah sama. Tetapi, kesan yang diberikan berbeda. Grafik sebelah kiri menggunakan skala linear pada sumbu tegaknya, sedangkan grafik sebelah kanan menggunakan skala logaritmik pada sumbu tegaknya.
Kesan pola grafik yang sangat berbeda ini dapat menjerumuskan kita pada suatu kesimpulan yang salah, jika kurang cermat dan berhati-hati.
6.E+07 5.E+07 4.E+07 3.E+07 2.E+07 1.E+07 0.E+00 1 2 3 4 5 6 7 8 9 0 Hari 1.E+06 1.E+04 1.E+02 1.E+00 1 2 3 4 5 6 7 8 9 0 Hari
Visualisasi 2D atau 3D
Contoh 13:
•
•
Data yang digunakan oleh kedua grafik di atas adalah sama. Grafik 3D sebelah kiri
memberikan kesan Grup B mempunyai persentasi hasil investasi yang lebih baik dari pada Grup A pada 4 tahun terakhir. Di pihak lain, grafik 2D sebelah kanan menunjukkan dengan jelas tahun 1, 3, dan 4, Grup A mempunyai persentasi hasil investasi yang lebih baik dari B. Kesimpulan yang dapat diambil dari sini adalah, kita harus berhati-hati dalam visualisasi 3D. Efek 3D indah dilihat tetapi dapat memberikan kesan yang salah. Grafik 2D memberikan visualisasi yang lebih akurat.
Perbandingan Bentuk
Contoh 14:
$1 $2 $1 $2
Tahun ini Tahun depan Tahun ini Tahun depan
•
•
Suatu perusahaan mengiklankan: “Jika anda investasi tahun ini 1 Dolar, akan mendapatkan 2 Dolar di tahun depan.” Gambar di atas ingin memvisualisasikan peningkatan jumlah Dolar dari tahun ini ke tahun depan. Peningkatan nilai 1 Dolar ke 2 Dolar digambarkan dengan
menambah panjang sisi-sisi kotak dari satu satuan ($1) ke dua satuan ($2) panjang.
Kesan yang ditimbulkan oleh gambar di atas lebih pada proporsional gambar bujur sangkar atau kubusnya, bukan pada nilai/angka Dolarnya. Untuk bujur sangkar, tahun depan sama dengan 4 kali tahun ini, sedangakan pada kubus, tahun depan sama dengan 8 kali tahun ini. Padahal sebenarnya peningkatan tahun ini ke tahun depan hanya 2 kali.
Perbandingan Bentuk
Contoh 15:
Gambar di samping menunjukkan perbandingan bentuk yang tidak proporsional. Bentuk batang yang ditampilkan adalah 2D, jadi
proporsional yang dilihat adalah lebar dan tinggi batang.
•
Jika kita bandingkan batang angka 204% dan 283%, perbandingan bentuk batang tidak sesuai denganperbandingan persentase angkanya. Batang 283% mempunyai lebar dan tinggi yang tidak berbanding linear dengan batang 204%.
Kesalahan Persentasi Data
Contoh 16:
Grafik di samping menunjukkan persentasi makanan pokok yang
9%
Makanan pokok yang disukai penduduk daerah Z
5% Padi
•
disukai oleh penduduk daerah Z. Visualisasi grafik pie menuntut penampilan data dalam
persentase, sehingga total data harus bernilai 100%.
Grafik di samping, jika kita hitung total persentasi data adalah 106%. Jadi ada kesalahan dalam analisis data.
67% 14% 11% Kentang Ubi Kedelai Lain-lain
Keakuratan Grafik
Contoh 17:
•
•
Grafik pola konsumsi beras 30 tahun terakhir ditunjukkan oleh gambar di sebelah kiri. Gambar ini memberi pelajaran bahwa 20 tahun pertama konsumsi beras rata-rata relatif stabil. Kemudian ada beberapa tahun di periode tsb konsumsi beras menurun tajam. Tetapi konsumsi beras sepuluh tahun terakhir meningkat sangat tajam.
Ketika hanya diambil 4 data saja dan kemudian ditarik garis lengkung, maka tampilan grafik jadi berbeda (grafik sebelah kanan). Kita lebih terpengaruh oleh pola kenaikan konsumsi beras.
Kesimpulan
•
•
•
Statistik sangat bermanfaat untuk mempelajari dan memprediksi suatu keadaan, walaupun kadangkala menampilkan suatu kesalahan.
Pada umumnya kesalahan ini disebabkan oleh kekeliruan, ketidaktahuan, atau kekurangtelitian dalam bekerja. Walaupun begitu tidak dapat disangkal, beberapa kesalahan di statistik terjadi karena adanya unsur kesengajaan yang ditunggangi oleh berbagai kepentingan.
Kesalahan-kesalahan di statistik secara umum dapat dikelompokkan dalam: Kesalahan pemilihan metode sampling.
Kesalahan dalam pengolahan dan analisis data.
Kesalahan dalam pemilihan kata ketika memberikan pernyataan untuk menafsirkan data. Kesalahan dalam meyimpulkan suatu hasil statistik.
Kesalahan dalam memvisualisasikan data.
Akhir kata kita harus hati-hati dan teliti sebelum memutuskan menerima data atau fakta statistik.
Daftar Pustaka
• • • •
Angel, R.A, Abbott, D.C, Runde, C.D. 2009, A Survey of Mathematics with
Application, Ed. Ke-8, Boston, Pearson Addison Wesley.
Blitzer, R. 2008, Thinking mathematically, Ed. Ke-4, New Jersey, Pearson Addison Wesley.
Miller, D.C, Heeren, E.V, Hornsby, J, Morrow, L.M, Newenhizen, V.J, 2008, Mathematical Ideas, Ed. Ke-11, Boston, Pearson Addison Wesley.
Pirnot, L.T, 2007, Mathematics All Around, Ed.Ke-3, Boston, Pearson Addison Wesley.