Kesalahan Acak dan
Statistik Data dalam Analisis Kimia
Data kualitatif vs Data kuantitatif
Apakah sampel air suling ini mengandung boron?
Mungkinkah kedua sampel tanah ini berasal dari sumber yang sama?
Berapa banyak albumin yang ada dalam sampel serum darah ini?
Berapa kadar timbal dalam sampel air keran?
Sampel baja ini mengandung sedikit chromium, tungsten dan mangan. Berapa banyak kadar masing- masing unsur tersebut?
1
Data kualitatif vs Data kuantitatif
Berapa banyak albumin yang ada dalam sampel serum darah ini?
hampir semua sampel serum darah mengandung albumin, jadi pertanyaannya adalah berapa?
Apakah sampel air suling ini mengandung boron?
ojauh lebih berguna untuk dapat mengatakan berapa banyak boron yang ada.
oPelaporan hasil seringali menyatakan hasil analisis kuantitatif
'Saya bisa / tidak bisa mendeteksi boron dalam sampel air ini ‘.
“ Sampel ini mengandung kurang dari 1 μg/mL boron”
“ sampel dilaporkan mengandung paling sedikit 1 μg/mL boron”
Analisis, Penentuan dan Pengukuran
Analysis / Analisis : Proses yang menghasilkan informasi secara fisis maupun kimia terkait keberadaaan suatu komponen dalam sampel atau sampel itu sendiri. Komponen dalam sampel yang menjadi fokus pengukuran disebutanalit, sedangkan bagian lain dalam sampel disebutmatriks.
Determination / Penentuan : Analisis sampel untuk menemukan identitas, konsentrasi, atau sifat analit.
Measurement / pengukuran : Penentuan secara eksperimental terhadap sifat kimia atau fisika suatu analit.
3
Teknik, Metode, Prosedur dan Protokol
Teknik : Prinsip kimia maupun fisika yang digunakan untuk analisis sampel.
Metode : Pengapikasian teknik untuk penentuan suatu analit dalam sampel yang memiliki matriks tertentu.
Prosedur : Petunjuk tertulis yang merinci tahapan analisis sampel.
Protokol : pedoman tertulis ketat yang merinci prosedur yang harus diikuti jika lembaga yang menetapkan protokol akan menerima hasil analisis, biasanya analisis terkait digunakan untuk mendukung atau mendefinisikan kebijakan publik.
Pengukuran dan Kesalahan
1. Tidak ada hasil analisis kimia yang terbebas dari suatu kesalahan dalam pengukuran atau adanya suatu ketidakpastian.
2. Kesalahan tidak dapat dihilangkan, namun dapat diminimalkan serta diperkirakan besarannya dengan akurasi yang masih dapat diterima.
3. Pengolahan data secara statistik digunakan untuk menilai kualitas data hasil percobaan.
4. Hasil analisis kimia dilaporkan dengan menyertakan ketidakpastian dari hasil analisis, sehingga hasil yang sebenarnya berada dalam suatu rentang dengan adanya ketidakpastian tersebut.
5
Menyebabkan hasil analisis jauh berbeda dari nilai yang sebenarnya.
Kesalahan ini dapat ditimbulkan oleh : instrumen yang tidak berfungsi dengan baik, kontaminasi reagen yang digunakan,atau karena salah satu tahap analisis terabaikan.
Percobaan harus dimulai lagi dari awal secara menyeluruh.
Kesalahan total kadang terjadi bahkan di Lab berkualifikasi sangat baik.
Kesalahan total dapat diidentifikasi dan dihilangkan.
Kesalahan Total (Gross error)
Kesalahan Total
Biasanya jarang terjadi dan data yang dihasilkan merupakan suatu pencilan (outliers), dan ditandai dengan nilai yang jauh lebih besar atau lebih kecil.
Analisis terkait outliers menggunakan uji secara statistik.
7
Menyebabkan hasil analisis selalu lebih tinggi atau selalu lebih rendah dari nilai yang sebenamya.
Misalnya : kesalahan analis yang selalu membaca volume larutan dalam buret lebih tinggi dari nilai yang sebenarnya maka hasil
analisis akan selalu lebih tinggi dibanding nilai sebenarnya.
Kesalahan sistematis dapat diidentifikasi dan dihilangkan.
Kesalahan Sistematis (Systematic Error)
Sumber kesalahan sistematis
◦ Instrument errors : alat yang tidak terkalibrasi dengan baik
◦ Method errors : terjadi akibat ketidakidealan sifat fisis maupun kimia dalam sistem analisis.
◦ Personal errors : terjadi karena kecerobohan, kurang fokus maupun keterampilan bekerja yang masih perlu ditingkatkan.
9
Menyebabkan hasil analisis selalu berada pada kedua sisi nilai yang sebenarnya.
Tidak dapat dihilangkan, sehingga setiap hasil analisis selalu mengandung kesalahan acak. Karena kesalahan acak terjadi pada analisis kimia maka pengukuran biasanya dilakukan antara dua sampai lima kali.
Hasil pengukuran yang diperoleh dengan semakin banyaknya pengukuran.
Hasil yang diperoleh dari tiap pengukuran dalam serangkaian pengukuran jarang sekali memiliki nilai yang sama.
Jika tidak terdapat kesalahan total maupun kesalahan sistematis, maka hasil setiap pengukuran akan berada pada kedua sisi nilai yang sebenarnya.
Kesalahan Acak (Random Error)
11
Presisi
(Ketelitian) dan Akurasi (Ketepatan)
Data hasil analisis terhadap larutan Ca
2+10,00 ppm yang diperoleh 4 praktikan
hasil Hasil sebenarnya
Konsentrasi Ca2+(ppm)
Data praktikan A :
o Memiliki ketertiruan yang tinggi(repeatable),kelima hasil pengukuran hampir sama (10,08-10,12 ppm)
o Kelima hasil terlalu tinggi nilainya dari nilai yang sebenarnya o Terjadi kesalahan, baik kesalahan sistematis maupun kesalahan
acak.
o Terdapatnya kesalahan acak menyebabkan hasil pengukuran terdapat di kedua sisi dari nilai yang sebenarnya. kesalahan acak mempengaruhi kesaksamaan/presisi(precision)atau ketertiruan (repeatability) suatu percobaaan. Kesalahan acak praktikan A kecil, data yang diperoleh presisi/saksama.
o Terdapatnya kesalahan sistematis menyebabkan semua hasil nilainya terlalu besar. Kesalahan sistematis mempengaruhi ketelitian/ kecermatan/akurasi(accuration), yang menunjukkkan kedekatan hasil dengan nilai yang sebenarnya.
10,10 ppm Rata-rata
13
Data hasil analisis terhadap larutan Ca
2+10,00 ppm yang diperoleh 4 praktikan
hasil Hasil sebenarnya
Konsentrasi Ca2+(ppm)
Data praktikan B :
o Memiliki akurasi yang tinggi, kesalahan sistematis kecil.
o Sebaran hasil sangat besar, menunjukkan presisi/kesaksamaan buruk atau adanya kesalahan acak yang besar.
Data praktikan C :
o Tidak saksama/presisi rendah o Tidak teliti /akurasi rendah Data praktikan D :
o Saksama dan teliti / presisi dan akurasi tinggi.
Rata-rata 10,01 ppm
Rata-rata 9,90 ppm
Rata-rata 10,01 ppm
Hasil Pengukuran
Hasil tiap pengukuran dapat lebih kecil atau lebih besar dari nilai yang sebenarnya.
Nilai tengah dari satu set hasil pengukuran lebih dapat dipercaya(reliable)paling dekat dengan hasil yang sebenarnya dan digunakan untuk menyatakan hasil pengukuran.
Variasi nilai-nilai individu dalam satu set hasil pengukuran di kedua sisi nilai tengah merupakan ukuran ketidakpastian dari nilai tengah tersebut.
Nilai tengah suatu set pengukuran dapat dinyatakan denganMean(rata-rata) atau Median 15
Rata-rata (Mean) dan Median
Rata-rata
Median atau nilai tengah diperoleh setelah data diurutkan berdasarkan besarannya, sehingga sejumlah data dalam jumlah yang sama bernilai lebih besar dan lebih kecil dari median.
Nilai tengah data berjumlah genap merupakan nilai rata-rata dari kedua nilai tengah kelompok data tersebut.
Presisi dan akurasi
Presisi/ Ketelitian dari pengukuran kimia menunjukkan kebolehulangan (reproducibility) hasil-hasil pengukuran dan menunjukkan kedekatan hasil-hasil yang diperoleh dengan cara yang sama.
Tiga besaran yang biasa digunakan untuk menyatakan presisi:
(1) simpangan baku, deviasi standar (standard deviation) (2) varian (variance)
(3) koefisien variasi (cofficient of variation)
Akurasi menunjukkan kedekatan hasil pengukuran dengan nilai yang sebenarnya (atau nilai yang dianggap benar).
Besarnya kesalahan (error) menunjukkan tingkat akurasi sebuah pengukuran.
Kesalahan (error) biasanya dinyatakan dengan dua cara
.
17
Kesalahan acak
Apabila kita mengetahui penyebabgross errordan systematic error, maka kedua jenis kesalahan tersebut dapat dihilangkan.
Efek kumulatif darirandom errormenyebabkan hasil pengukuran berfluktuasi di sekitarmean(nilai tengah) dari sekumpulan pengukuran.
Asumsikan terdapat empatrandom erroryang kecil bergabung menghasilkan kesalahan total dengan masing-masing error besarnya sama (U), sehingga hasil akhir akan lebih besar atau lebih kecil sebesar±U dari sebuah nilai tertentu.
19
Semakin banyak sumber kesalahan acak dalam sebuah analisis kimia, distribusi hasil analisis akan mendekati distribusi normal seperti yang ditunjukkan oleh Gambar b dan Gambar c. Pada distribusi normal, jumlah data di kedua sisi nilai yang sebenarnya sama banyak dan simetris.
21
A histogram (A) showing distribution of the 50 results in Table 3-3 and a
23
Perlakuan Statistik Untuk Random Errors
Analisis statistik dari data pengukuran didasarkan pada asumsi bahwa random error memenuhi distribusi norrnal atau distribusi Gaussian.
Distribusi Gaussian yang ideal hanya diperoleh jika kita memiliki jumlah data tak terhingga.
Hal ini hanya dapat diperoleh jika kita memiliki waktu tak hingga. Data dalam jumlah tak hingga sering disebut populasi atau universe.
Keterbatasan waktu yang tersedia menjadi penyebab hanya sejumlah tertentu data yang dapat diperoleh dari pengukuran kimia. Data seperti ini sebut dengan cuplikan atau sampel.
Hukum statistik diturunkan dari populasi data dengan asumsi sebaran data bersifat Gaussian. Hukum ini seringkali dimodifikasi secara substansial jika sampel hanya terdiri dari beberapa data.
Sifat Kurva Gaussian
Kurva Gaussian secara sederhana dapat dijelaskan dengan hanya dua parameter, rata-rata atau meandari populasi (μ) dan the population standard deviation /simpangan baku dari populasi(σ).
25
Kurva kesalahan normal. Simpangan baku untuk kurva B dua kali kurva A, σB= 2σA. (a) Absis (sumbu mendatar) adalah simpangan dari rata-rata dalam satuan pengukuran.
(b) Absis adalah simpangan dari rata-rata dalam satuanσ. Jadi, kedua kurva, kurva A dan kurva B berimpit.
•Rata-rata populasi (μ) dan rata-rata sampel( )
◦Rata-rata sampel= , dengan jumlah data relatif sedikit
◦Rata-rata populasi = μ, dengan jumlah data N → ∞
◦ Perbedaan nilai x and μdapat diabaikan jika jumlah sampel (N) =20 - 30.
x
x
x
27
Standar deviasi/ simpangan baku populasi (σ)
◦σ(simpangan baku populasi) adalah ukuran presisi atau sebaran untuk populasi data
Sebanyak 68,3% daerah di bawah kurva Gaussian terletak antara ±1σ ; 95,5% data ada di antara ± 2σ ; 99,7% data ada di antara ± 3 σ
Simpangan Baku/ Standar Deviasi Sampel
Seringkali data yang kita peroleh berjumlah terbatas, sehingga untuk kondisi tersebut ditentukan simpangan baku sampel.
Dengan N-1 adalah derajat kebebasan.
29
Pada penentuan kandungan timbal (ppm Pb) dalam sejumlah sampel darah diperoleh data sebagai berikut : 0,752 ; 0,756 ; 0,752 ; 0,751 dan 0,760. Hitung rata-rata dan simpangan baku untuk set data tersebut.
Perbedaan antaa nilai Σx2idan (Σxi)2/Nsangat kecil, sehingga jangan pernah melakukan pembulatan perhitungan standar deviasi sampai akhir.
31
Peningkatan keakuratan s sebagai ukuran presisi
Standar deviasi sampel (s) tidak sama dengan standar deviasi populasi (σ). Nilai keduanya mendekati sama dengan meningkatnya jumlah sarnpel. Jika jumlah sampel (N) lebih besar dari 20, s dapat dianggap sama denganσ.
Peningkatan keakuratan s sebagai ukuran presisi dapat diiakukan dengan menggabungkan hasil analisis dari sampel yang mirip dengan metode analisis yang persis sama. Standar deviasi dalam hal ini dapat dihitung dengan persamaan berikut.
Kadar merkuri, Hg yang terdapat dalam sampel ikan yang diambil dari sebuah teluk ditampilkan pada tabel berikut.
Hitung simpangan baku gabungan data tersebut.
Spesimen Jumlah sampel
Kadar Hg (ppm) 33
The values in the last two columns for specimen 1 were computed as follows:
Selain simpangan baku sampel , untuk menyatakan presisi pengukuran dapat dinyatakan juga sebagai
1. Varian (s2)
2. Simpangan baku relatif /Relative standard deviation:
3. Koefisien variasi / Coefficient of variation (CV) 35
Pada penentuan kandungan timbal (ppm Pb) dalam sejumlah
sampel darah diperoleh data sebagai berikut : 0,752 ; 0,756 ; 0,752 ; 0,751 dan 0,760. Hitung (a) varians, (b) standar deviasi relatif, (c) koefisien variasi, dan (d) jangkauan /spread.
In Example 3-3, we found
= 0.754 ppm Pb dan s =0.0038 ppm Pb
(a) s2 = (0.0038)2= 1.410-5 (b) RSD = 1000ppt = 5.0ppt
(c) CV = 100% = 0.50%
(d) w =0.760 – 0.751 = 0.009
x
0.0038 0.754 0.0038
0.754
Pada penentuan kandungan timbal (ppm Pb) dalam sejumlah sampel darah diperoleh data sebagai berikut : 0,752 ; 0,756 ; 0,752 ; 0,751 dan 0,760. Hitung (a) varians, (b) standar deviasi relatif, (c) koefisien variasi, dan (d) jangkauan /spread.
37
Berbagai aplikasi statistik yang umum dalam pengolahan data kimia untuk menentukan:
1. confidence limit(batas kepercayaan) dari rata-rata data.
2. jumlah data yang diperlukan untuk menurunkan batas kepercayaan dari rata-rata sampai tingkat tertentu.
3. apakah pada tingkat kepercayaan tertentu, nilai rata-rata yang diperoleh dari data eksperimen berbeda dari data yang benar.
4. apakah pada tingkat kepercayaan tertentu, dua rata-rata hasil eksperimen berbeda.
5. apakah pada tingkat kepercayaan tertentu, ketelitian atau presisi dari dua set data eksperimen berbeda.
6. apakah sebuah data mengandunggross error, sehingga harus dikeluarkan dari perhitungan rata-rata.
Aplikasi statistik untuk pengolahan data kimia
Batas Kepercayaan (Confidence Limit)
Nilai rata-rata populasi (μ)tidak dapat ditentukan karena memerlukan jumlah data tak hingga.
Teori statistik memungkinkan untuk menentukan batas di sekitar rata-rata hasil eksperimen dimanaμberada pada tingkat kepercayaan tertentu. Batas ini disebut denganconfidence limits.
Interval antara batas ini disebutconfidence interval.
Ukuran interval kepercayaan, yang diperoleh dari simpangan baku sampel tergantung pada ketepatan/keakuratan simpangan baku tersebut.
39
90 dari 100 kemungkinan rata-rata populasi terletak antara -1,64 dan +1,64.
41
43
Interval Kepercayaan Jika σ Tidak Diketahui
Jika jumlah data hasil pengukuran (N) sedikit, maka s tidak dapat dianggap mendekati nilai. Dalam analisis digunakan variabel t, yaitu faktor untuk interval kepercayaan sebagai pengganti z.
• Nilai t bergantung pada tingkat kepercayaan
• Nilai t bergantungpada derajat kebebasan
• Nilai t mendekati nilai z jlka derajat kebebasan menjadi tak hingga.
45
47
Bantuan Statistik untuk Menguji Hipotesis
Hasil eksperimen jarang sekali sama persis dengan yang diramalkan oleh model teoritis.
Uji statistic digunakan sebagai alat untuk menentukan apakah perbedaan yang timbul diakibatkan oleh kesalahan acak (random errors) yang tak dapat dihindarkan, atau akibat kesalahan sistematik.
Uji statistik menggunakan hipotesis nol (null hypothesis) yang mengasumsikan bahwa kuantitas numerik yang dibandingkan pada dasarnya sama.
.
49
Uji-t (t-Test) : Membandingkan rata-rata hasil eksperimen dengan nilai yang sebenarnya.
Jika hipotetis nol terpenuhi, maka perbedaan antara rata-rata dan nilai sebenarnya adalah
Hasil yang lebih besar dari rumusan ini menunjukkan adanya perbedaan yang berarti antara keduanya.
A new procedure for the rapid determination of sulfur in kerosenes was tested on a sample known from its method of preparation to contain 0.123% S
.
The results were % S = 0.112, 0.118, 0.115, and 0.119. Do the data indicate that there is bias in the method?at the 95% confidence level, t has a value of 3.18 for three degrees of freedom. we conclude that a 51
TUGAS 1
Membandingkan rata-rata dari dua sampel
Jika hipotesis nol terpenuhi, maka perbedaan antara kedua rata-rata adalah
53
Example 19-2
The critical value of t at the 95% confidence level for 10
–
2=
8 degrees of freedom is 2.31. Since 1.771 <2.31, we accept the null hypothesis at the 95%confidence level and conclude that there is no difference in the alcohol content of the wines.
Two barrels of wine were analyzed for their alcohol content to determine whether they were from different sources. On the basis of six analyses, the average content of the first barrel was established to be 12.61% ethanol. Four analyses of the second barrel gave a mean of 12.53% alcohol. The ten analyses yielded a pooled value of s =
0.070%. Do the data indicate a difference between the wines?
TUGAS 2
55
Uji-t Berpasangan
Uji-t dapat digunakan untuk melihat apakah ada perbedaan antara sekelompok hasil pengukuran dengan nilai sebenarnya, atau perbedaan antara dua kelompok hasil pengukuran,
Uji-t berpasangan digunakan untuk melihat apakah ada perbedaan antara dua kelompok hasil pengukuran, dan yang dianalisis tidak hanya satu sampel, namun beberapa sarnpel, dengan dua metode yang berbeda.
57
TUGAS 3
TUGAS 4
59
Uji-F (F-Test): Pembandingan Ketelitian
61
TUGAS 5
Mendeteksi Gross Errors
63
The analysis of a calcite sample yielded CaO percentages of 55.95, 56.00, 56.04, 56.08, and 56.23. The last value appears anomalous; should it be retained or rejected?
The difference between 56.23 and 56.08 is 0.15%. The spread (56.23-
55.95) is 0.28%. Thus,
For five measurements, Qcritat the 90% confidence level is 0.64. Because 0.54<0.64, we must retain the outlier at the 90% confidence level.
65
TUGAS 6
67