• Tidak ada hasil yang ditemukan

Kesalahan-kesalahan di Statistik

N/A
N/A
Protected

Academic year: 2021

Membagikan "Kesalahan-kesalahan di Statistik"

Copied!
33
0
0

Teks penuh

(1)

Kesalahan-kesalahan di Statistik

Depok, 2011

(2)

Lingkup bahasan

Kesalahan di Statistik

Kesalahan di Sampling

Kesalahan Analisis Data

Penggunaan Kata--kata Multi Tafsir

Kesimpulan yang Salah

Kesalahan Visualisasi

Naskah ini disusun lebih mirip sebagai suatu ringkasan diktat dengan tujuan agar mahasiswa dapat menggunakannya untuk belajar mandiri. Isi naskah berupa kalimat-kalimat pendek sebagai pokok atau kunci materi sehingga mahasiswa dapat cepat mempelajari dan mudah mengingatnya.

(3)
(4)

Kesalahan di Statistik: Ketidaktahuan atau Kesengajaan?

Statistik sangat bermanfaat bagi kita untuk mengetahui suatu kenyataan atau

memprediksi suatu kejadian sehingga dapat memberikan kita bekal yang baik dalam mengambil keputusan.

Meskipun demikian terkadang kita jumpai ada kesalahan di statistik.

Kesalahan ini dapat terjadi di setiap tahapan ketika kita bekerja dengan data, mulai dari mengumpulkan, mengorganisasi, menganalisis, mempresentasikan, dan menyimpulkan data.

Pada umumnya kesalahan ini disebabkan oleh kekeliruan, ketidaktahuan, atau kekurangtelitian dalam bekerja.

Walaupun begitu tidak dapat disangkal, beberapa kesalahan di statistik terjadi karena adanya unsur kesengajaan yang didasari oleh berbagai kepentingan, misalnya

kepentingan individu, kelompok, bisnis, iklan, politik praktis, dll.

Oleh sebab itu, ketika menanggapi suatu hasil atau pernyataan statistik, kita harus

(5)

Jenis Kesalahan di Statistik

Kesalahan-kesalahan di statistik secara umum dapat dikelompokkan

dalam:

Kesalahan pemilihan metode sampling.

Kesalahan dalam pengolahan dan analisis data.

Kesalahan dalam pemilihan kata ketika memberikan pernyataan

untuk menafsirkan data.

Kesalahan dalam meyimpulkan suatu hasil statistik.

Kesalahan dalam memvisualisasikan data.

(6)
(7)

Pemilihan Sampel dan Jumlah Sampel

Contoh 1: Pernyataan statistik

“Lebih dari 70% mahasiswa UI suka mengendarai sepeda di

lingkungan kampus.”

• Sebelum kita menerima hasil atau kenyataan ini, kita perlu bersikap kritis, misalnya dengan mengemukakan pertanyaan:

 Apakah surveinya dilakukan pada semua mahasiswa UI atau sebagian mahasiswa saja?

 Jika sebagian mahasiswa saja yang disurvei, mahasiswa seperti apa yang dijadikan sampel?

 Berapa jumlah mahasiswa yang dijadikan sampel?

Di statistik, kesalahan yang sering terjadi ketika sampling adalah metode

(8)

Pemilihan Sampel dan Jumlah Sampel (lanjutan)

Analisis kritis Contoh 1: Pernyataan statistik

“Lebih dari 70% mahasiswa UI suka mengendarai sepeda di

lingkungan kampus.”

• Marilah kita analisis setiap pertanyaan di atas:

 Apakah surveinya dilakukan pada semua mahasiswa UI atau sebagian mahasiswa saja?  Jika survei dilakukan untuk semua mahasiswa UI, maka data tersebut akurat (di sini kita asumsikan kuisioner yang digunakan sudah baik).

 Jika sebagian mahasiswa saja yang disurvei, mahasiswa seperti apa yang dijadikan sampel?

 Sampel yang baik adalah yang representatif. Sampel yang buruk adalah sampel bias.  Berapa jumlah mahasiswa yang dijadikan sampel?

Tidak ada aturan jumlah sampel minimum. Jumlah sampel yang baik adalah yang mencukupi untuk menggambarkan sifat dan karakter populasi yang diwakilinya.

(9)

Contoh 2: Pemilihan Sampel dan Jumlah Sampel

Sebuah perusahaan permen karet mengeluarkan pernyataan: “ Empat dari lima dokter gigi merekomendasikan permen karet bebas gula untuk pasien yang suka mengunyah permen.”

Analisis: Berapa jumlah dokter gigi yang disurvei? Seandainya hanya 5 atau mungkin

10 dokter gigi yang disurvei, fakta ini belum dapat diterima. Sangat mungkin hasilnya akan berbeda jika ada 100 dokter yang disurvei.

Sebuah produsen sepak bola mengklaim, bolanya (bola A) lebih baik dari pada bola B (produk perusahaan saingannya), karena setelah diuji dengan menendangnya, bola A dapat meluncur lebih cepat dan jauh dibandingkan dengan bola B.

Analisis: Klaim ini terlalu ceroboh, sebab hanya diuji untuk satu bola saja. Disamping

itu kecepatan meluncur dan jangkauan luncur bola dipengaruhi oleh banyak

faktor, seperti kekasaran permukaan lapangan, arah angin, apakah tendangan untuk kedua bola identik, dll. Sehingga agar datanya akurat perlu dilakukan eksperimen yang berulang, agar diperoleh data statistik yang representatif.

(10)
(11)

Analisis nilai rata-rata

Sebuah perusahaan mengeluarkan pernyataan: “Gaji rata-rata karyawan di

perusahaan kami adalah lebih dari 3 juta per bulan.”

• Kita perlu bersikap kritis terhadap pernyataan ini, misalnya perlu

dipertanyakan:

 Bagaimana pengolahan datanya, apakah sudah benar atau ada ketidaktelitian dalam perhitungannya?

 Apa yang dimaksud dengan rata-rata di sini? Apakah mean, median, atau mode?

 Pada kasus ini kita tidak perlu mempermasalahkan metode

samplingnya, sebab setiap perusahaan pasti mempunyai daftar gaji yang lengkap, sehingga data yang digunakan adalah populasi.

(12)

Jabatan Jumlah karyawan Gaji (Rp.)/bulan

Direksi 2 10.000.000

Manager 4 5.000.000

Staf 10 2.000.000

Pembantu 5 750.000

Contoh 3: Analisis nilai rata-rata

Marilah kita analisis peryataan di atas: “Gaji rata-rata karyawan di

perusahaan kami adalah lebih dari 3 juta per bulan.”

• Seandainya data gaji perusahaan tsb adalah sbb:

• Jika dilakukan perhitungan untuk data di atas, diperoleh: nilai mean = 3,035 juta, median = 2 juta, dan mode = 2 juta.

• Jadi pernyataan di atas telah menggunakan mean untuk menyatakan gaji rata-rata. Apakah nilai mean ini representatif untuk gaji karyawan? Jumlah karyawan adalah 21 dan mayoritas

berkedudukan staf dengan gaji 2 juta. Nilai mean sangat sensitif dipengaruhi oleh gaji Direksi dan Manager yang ekstrim besar. Jika kita tinjau nilai median yang 2 juta, nilai inilah yang mewakili gaji kebanyakan karyawan.

(13)

Analisis nilai deviasi

Sebuah perusahaan A mengeluarkan pernyataan: “Layar LCD kami

mempunyai waktu hidup 80.000 jam, lebih unggul dari pada layar LCD lainnya yang rata-rata hanya punya waktu hidup 75.000 jam.”

Kita sebagai konsumen tidak boleh serta-merta mempercayai peryataan ini dan langsung memutuskan perusahaan A mempunyai layar LCD yang lebih lama hidup dari pada perusahaan lainnya, misalnya B.

Kita perlu bersikap kritis, misalnya mempertanyakan bagaimana metode pengujian dan analisis datanya sampai mendapatkan angka waktu hidup. Bagaimana dengan sebaran datanya?

Berfikir kritis untuk Contoh kasus seperti ini dapat lebih difokuskan pada

(14)

Contoh 4: Analisis nilai deviasi

Sebaran data dari suatu eksperimen sangat penting, sebab informasi ini menentukan kualitas dari data.

Sebagai contoh untuk kasus di atas, seandainya kita mendapatkan distribusi data eksperimennya, maka dapat diambil keputusan yang tepat. Misalnya:

Kondisi 1 Kondisi 2

Kita dapat langsung memutuskan LCD-A lebih baik dibandingkan LCD-B jika sebaran datanya seperti kondisi 1. Tidak ada satupun LCD –B yang lebih baik dari LCD-A. Jika sebaran datanya seperti kondisi 2, maka LCD-B, lebih baik dari pada LCD-A. Dijumpai beberapa LCD-A lebih buruk dari pada LCD-B.

LCD-B=75.000 LCD-A=80.000 LCD-B =75.000 LCD-A =80.000

(15)

Contoh 5: Analisis nilai deviasi

Pada waktu kampanye politik sering diungkapkan berbagai macam hasil survei atau poling untuk tujuan mendapatkan simpati atau dukungan masa yang lebih banyak. Sebagai contoh, sebuah lembaga survei menampilkan

grafik hasil surveinya untuk beberapa partai menjelang pemilu. Lembaga tersebut membuat pernyataan:

“Partai A akan memenangkan pemilu dengan suara 40%, sesuai dengan hasil survei terakhir ini.”

Kita perlu kristis dalam membaca hasil survei ini.

Bagaimana dengan deviasi datanya. Seandainya survei mempunyai deviasi 2%, maka Partai A dapat mempunyai suara 38% - 42%, sedangkan Partai C mendapatkan suara 35% - 39%.

Secara statistik suara Partai A dan C tidak berbeda karena ada daerah data yang bertindih (overlap), sehingga ada kemungkinan Partai C yang menang.

(16)
(17)

Kata-kata Multi Tafsir

Kita sering menjumpai pernyataan statistik yang menggunakan kata-kata multi tafsir.

Pada umumnya kata-kata ini dipilih untuk tujuan propaganda atau iklan. Contoh 6:

Sebuah perusahaan super market menyatakan: “ABC adalah super market terbesar

di Indonesia.”

Analisis: kata terbesar mempunyai banyak tafsir, apakah terbesar

karyawannya, labanya, jumlah tokonya, pengunjungnya, dll.

Contoh 7:

Sebuah perusahaan mie instan menyatakan: “DEF adalah mie terlezat di

Indonesia.”

Analisis: kata terlezat sangat relatif. Rasa lezat tidak dapat didefinisikan dengan

(18)

Kata-kata Multi Tafsir

Ketika menjumpai kata-kata multi tafsir yang dikaitkan dengan data kuantitatif, kita harus hati-hati dan kritis. Pernyataan pada contoh 6 dan

7, mungkin didukung dengan data yang benar, tetapi penyampaiannya dalam bentuk pernyataan mempunyai maksud propaganda menggiring opini

masyarakat untuk maksud tertentu.

Analisis lanjutan Contoh 6 dan 7:

Bisa jadi supermarket ABC mempunyai jumlah karyawan terbesar di antara semua supermarket yang ada di Indonesia. Informasi jumlah karyawan sengaja tidak disebutkan untuk mencapai tujuan tertentu.

Survei yang dilakukan oleh perusahaan mie DEF dan melibatkan mie merek lainnya menunjukkan mie DEF yang paling disukai. Walaupun demikian selera/rasa lezat dari setiap orang bisa berbeda, demikian juga faktor lainnya yang mempengaruhi hasil survei misalnya penyajian, metode memasak, dll. belum dipertimbangkan.

(19)
(20)

Pengambilan Kesimpulan Yang Tidak Tepat

Contoh 8: Sebuah perusahaan desinfektan melakukan eksperimen, produknya

mampu membunuh 5000 kuman di laboratorium hanya dalam waktu 5 detik. Kemudian ia mengeluarkan pernyataan: “Gunakanlah desinfektan A untuk

mencegah flu.”

• Kita perlu bersikap kritis terhadap pernyataan ini. Memang benar banyak

kuman yang dapat dibunuh oleh desinfektan ini, tetapi apakah kuman flu yang ada disekitar kita termasuk yang diujicobakan di laboratorium?

• Perusahaan tersebut telah mengambil kesimpulan yang salah terhadap hasil uji laboratoriumnya. Tidak semua kuman flu telah mereka uji, sehingga tidak boleh diambil kesimpulan yang bersifat umum.

• Kesalahan dalam pengambilan kesimpulan ini dapat terjadi karena

kekurangfahaman seseorang terhadap permasalahan atau mungkin disebabkan oleh kekurangan penalaran berlogika.

(21)

Pengambilan Kesimpulan Yang Tidak Tepat

Contoh 9: Sebuah perusahaan mengeluarkan pernyataan: “Handuk Q lebih

berat dari pada handuk lainnya, sehingga dapat menyerap air lebih banyak.”

Analisis: Berat handuk tidak ada kaitannya dengan kemampuan handuk menyerap

air. Kemampuan serapan air ditentukan oleh absorbansi bahan handuk, bukan beratnya. Sebagai analogi: Batu lebih berat dari pada sepon, tetapi sepon mudah sekali menyerap air dibandingkan batu.

Contoh 10: Sebuah perusahaan iklan asuransi menyatakan: ”Pada bulan lalu

452 orang memindahkan asuransi kecelakaannya ke Asuransi Z.”

Analisis: Iklan ini memberikan kesan perusahaan asuransi lainnya telah

memberikan layanan yang kurang baik, sehingga banyak orang yang pindah ke asuransi Z mungkin karena lebih dipercaya dan memberikan pelayanan lebih prima. Data 452 orang yang pindah ke asuransi Z adalah benar, tetapi data jumlah orang yang pindah dari asuransi Z ke perusahaan asuransi lainnya tidak diinformasikan.

(22)
(23)

Mot or ( x1000 ) Mot or ( x1000 )

Visualisasi Dapat Memberikan Kesan Positif atau Negatif

Contoh 11:

Data yang digunakan untuk menggambar kedua grafik di atas adalah sama. Tetapi, kesan yang diberikan berbeda. Grafik sebelah kiri mengesankan pertumbuhan produksi motor dari tahun 2005 – 2010 tetap, tetapi grafik disebelah kanan memberikan kesan terjadi kenaikan produksi yang cukup besar.

Perbedaan kedua grafik terletak pada skala sumbu tegaknya. Grafik kiri mempunyai skala antara 30 – 80 sedangkan grafik kanan 50 – 54, sehingga perubahan sedikit yang ada di grafik kanan dapat menimbulkan kesan perubahan yang besar.

Produksi Sepeda Motor Z

54 53 52 51 50 2004 2005 2006 2007 2008 2009 2010 Tahun

Produksi Sepeda Motor Z

80 70 60 50 40 30 2004 2005 2006 2007 2008 2009 2010 Tahun

(24)

Visualisasi Dapat Memberikan Kesan yang Salah

Contoh 11 menunjukkan bahwa visualisasi dapat memberikan kesan

terhadap hasil, bahkan bisa menyebabkan kesimpulan yang salah pada data.

Pada pembahasan ini akan kita diskusikan beberapa kesalahan yang dapat disebabkan oleh visualisasi data, antara lain:

Pemilihan skala

Visualisasi 2D atau 3D Perbandingan bentuk Kesalahan persentasi data Keakuratan grafik

(25)

Ju ml ah s el Ju ml ah s el

Pemilihan Skala

Contoh 12: 8.E+07 7.E+07 Pertumbuhan Sel

1.E+08 Pertumbuhan Sel

Data yang digunakan kedua grafik di atas adalah sama. Tetapi, kesan yang diberikan berbeda. Grafik sebelah kiri menggunakan skala linear pada sumbu tegaknya, sedangkan grafik sebelah kanan menggunakan skala logaritmik pada sumbu tegaknya.

Kesan pola grafik yang sangat berbeda ini dapat menjerumuskan kita pada suatu kesimpulan yang salah, jika kurang cermat dan berhati-hati.

6.E+07 5.E+07 4.E+07 3.E+07 2.E+07 1.E+07 0.E+00 1 2 3 4 5 6 7 8 9 0 Hari 1.E+06 1.E+04 1.E+02 1.E+00 1 2 3 4 5 6 7 8 9 0 Hari

(26)

Visualisasi 2D atau 3D

Contoh 13:

Data yang digunakan oleh kedua grafik di atas adalah sama. Grafik 3D sebelah kiri

memberikan kesan Grup B mempunyai persentasi hasil investasi yang lebih baik dari pada Grup A pada 4 tahun terakhir. Di pihak lain, grafik 2D sebelah kanan menunjukkan dengan jelas tahun 1, 3, dan 4, Grup A mempunyai persentasi hasil investasi yang lebih baik dari B. Kesimpulan yang dapat diambil dari sini adalah, kita harus berhati-hati dalam visualisasi 3D. Efek 3D indah dilihat tetapi dapat memberikan kesan yang salah. Grafik 2D memberikan visualisasi yang lebih akurat.

(27)

Perbandingan Bentuk

Contoh 14:

$1 $2 $1 $2

Tahun ini Tahun depan Tahun ini Tahun depan

Suatu perusahaan mengiklankan: “Jika anda investasi tahun ini 1 Dolar, akan mendapatkan 2 Dolar di tahun depan.” Gambar di atas ingin memvisualisasikan peningkatan jumlah Dolar dari tahun ini ke tahun depan. Peningkatan nilai 1 Dolar ke 2 Dolar digambarkan dengan

menambah panjang sisi-sisi kotak dari satu satuan ($1) ke dua satuan ($2) panjang.

Kesan yang ditimbulkan oleh gambar di atas lebih pada proporsional gambar bujur sangkar atau kubusnya, bukan pada nilai/angka Dolarnya. Untuk bujur sangkar, tahun depan sama dengan 4 kali tahun ini, sedangakan pada kubus, tahun depan sama dengan 8 kali tahun ini. Padahal sebenarnya peningkatan tahun ini ke tahun depan hanya 2 kali.

(28)

Perbandingan Bentuk

Contoh 15:

Gambar di samping menunjukkan perbandingan bentuk yang tidak proporsional. Bentuk batang yang ditampilkan adalah 2D, jadi

proporsional yang dilihat adalah lebar dan tinggi batang.

Jika kita bandingkan batang angka 204% dan 283%, perbandingan bentuk batang tidak sesuai dengan

perbandingan persentase angkanya. Batang 283% mempunyai lebar dan tinggi yang tidak berbanding linear dengan batang 204%.

(29)

Kesalahan Persentasi Data

Contoh 16:

Grafik di samping menunjukkan persentasi makanan pokok yang

9%

Makanan pokok yang disukai penduduk daerah Z

5% Padi

disukai oleh penduduk daerah Z. Visualisasi grafik pie menuntut penampilan data dalam

persentase, sehingga total data harus bernilai 100%.

Grafik di samping, jika kita hitung total persentasi data adalah 106%. Jadi ada kesalahan dalam analisis data.

67% 14% 11% Kentang Ubi Kedelai Lain-lain

(30)

Keakuratan Grafik

Contoh 17:

Grafik pola konsumsi beras 30 tahun terakhir ditunjukkan oleh gambar di sebelah kiri. Gambar ini memberi pelajaran bahwa 20 tahun pertama konsumsi beras rata-rata relatif stabil. Kemudian ada beberapa tahun di periode tsb konsumsi beras menurun tajam. Tetapi konsumsi beras sepuluh tahun terakhir meningkat sangat tajam.

Ketika hanya diambil 4 data saja dan kemudian ditarik garis lengkung, maka tampilan grafik jadi berbeda (grafik sebelah kanan). Kita lebih terpengaruh oleh pola kenaikan konsumsi beras.

(31)

Kesimpulan

Statistik sangat bermanfaat untuk mempelajari dan memprediksi suatu keadaan, walaupun kadangkala menampilkan suatu kesalahan.

Pada umumnya kesalahan ini disebabkan oleh kekeliruan, ketidaktahuan, atau kekurangtelitian dalam bekerja. Walaupun begitu tidak dapat disangkal, beberapa kesalahan di statistik terjadi karena adanya unsur kesengajaan yang ditunggangi oleh berbagai kepentingan.

Kesalahan-kesalahan di statistik secara umum dapat dikelompokkan dalam: Kesalahan pemilihan metode sampling.

Kesalahan dalam pengolahan dan analisis data.

Kesalahan dalam pemilihan kata ketika memberikan pernyataan untuk menafsirkan data. Kesalahan dalam meyimpulkan suatu hasil statistik.

Kesalahan dalam memvisualisasikan data.

Akhir kata kita harus hati-hati dan teliti sebelum memutuskan menerima data atau fakta statistik.

(32)

Daftar Pustaka

• • • •

Angel, R.A, Abbott, D.C, Runde, C.D. 2009, A Survey of Mathematics with

Application, Ed. Ke-8, Boston, Pearson Addison Wesley.

Blitzer, R. 2008, Thinking mathematically, Ed. Ke-4, New Jersey, Pearson Addison Wesley.

Miller, D.C, Heeren, E.V, Hornsby, J, Morrow, L.M, Newenhizen, V.J, 2008, Mathematical Ideas, Ed. Ke-11, Boston, Pearson Addison Wesley.

Pirnot, L.T, 2007, Mathematics All Around, Ed.Ke-3, Boston, Pearson Addison Wesley.

(33)

Gambar

Grafik sebelah kiri menggunakan skala linear pada sumbu tegaknya, sedangkan grafik sebelah  kanan menggunakan skala logaritmik pada sumbu tegaknya
Gambar di samping menunjukkan    perbandingan bentuk yang tidak    proporsional. Bentuk batang yang    ditampilkan adalah 2D, jadi
Grafik di samping menunjukkan  persentasi makanan pokok yang
Grafik pola konsumsi beras 30 tahun terakhir ditunjukkan oleh gambar di sebelah kiri. Gambar ini  memberi pelajaran bahwa 20 tahun pertama konsumsi beras rata-rata relatif stabil

Referensi

Dokumen terkait

Penelitian selanjutnya dilakukan di Rumah Sakit Umum Pusat(RSUP) Dr.Kariadi Semarang oleh Junait dkk tahun 2013, menunjukkan bahwa pasien yang menjalani angiografi sebanyak 92

Berdasarkan penelitian secara langsung dilapangan dapat disimpulkan bahwa sistem informasi pengolahan data yang telah dibangun dapat membantu kelancaran pengolahan pendataan

Mereka juga saling tertarik satu sama lain, namun disisi lain remaja retardasi mental ringan memiliki hambatan yaitu kemampuan penalaran yang sangat terbatas

Hal ini sesuai dengan apa yang disampaikan oleh Musfah, bahwa kepala sekolah harus memiliki kemampuan komunikasi yang baik (interpersonal) dengan bawahan, sehingga

kelompok kontrol. Kesimpulan dan Saran.. Berdasarkan hasil dari analisa data dan perhitungan uji statistik, dapat diambil kesimpulan bahwa Ada perbedaan pengaruh core

Hasil uji korelasi Spearman diperoleh nilai -0,550 dengan p = 1,000; hal ini menunjukan ada hubungan yang kuat dan signifikan serta berlawanan arah antara tingkat

Kemampuan siswa menyelesaikan soal cerita pada aspek konsep diamati dari indikator (1) ketercapaian indikator mampu memeriksa kembali dari penyelesaian soal, belum

Penelitian ini bertujuan untuk mengetahui peran beberapa bahan silikat dan pupuk P dalam memperbaiki sifat kimia tanah Andisol dan pertumbuhan tanaman. Bahan tanah