5
BAB II
LANDASAN TEORI
Bab ini terdiri dari dua bagian. Pada bagian pertama berisi tinjauan pustaka dari penelitian-penelitian sebelumnya dan beberapa teori penunjang berisi definisi-definisi yang digunakan dalam pembahasan. Pada bagian kedua berisi kerangka pemikiran yang menjelaskan alur pikir dalam pembuatan skripsi.
2.1 Tinjauan Pustaka
Cochran [5] menjelaskan penduga rasio klasik untuk rata-rata populasi variabel penelitian pada pengambilan sampel acak sederhana. Penduga rasio klasik tersebut memanfaatkan korelasi positif antara variabel bantu dan variabel penelitian. Kadilar dan Cingi [8] menemukan penduga rasio yang lebih baik dibandingkan penduga rasio klasik, menggunakan koefisien kurtosis variabel bantu dan regresi. Penduga rasio tersebut adalah gabungan penduga rasio Ray dan Singh serta Singh dan Kakran. Penduga rasio Ray dan Singh merupakan penduga rasio menggunakan koefisien regresi, dengan memanfaatkan informasi variansi dan kovariansi sampel. Koefisien regresi diperoleh melalui metode kuadrat terkecil. Sedangkan penduga rasio Singh dan Kakran merupakan penduga rasio menggunakan koefisien kurtosis variabel bantu. Koefisien kurtosis merupakan ukuran keruncingan suatu distribusi. Kemudian Kadilar et al. [9] menemukan penduga rasio yang dapat mengurangi dampak negatif dari pencilan pada data, yaitu menggunakan regresi robust estimasi-M. Penduga rasio Kadilar et al. [9]
lebih baik daripada penduga rasio Kadilar dan Cingi [8] jika terdapat korelasi positif antara variabel bantu ( ) dan variabel penelitian ( ) serta terdapat pencilan pada data, karena penduga rasio Kadilar et al. [9] memiliki rata-rata kuadrat sesatan terkecil.
Selanjutnya diberikan beberapa teori yang melandasi penyelesaian rumusan masalah. Teori tersebut meliputi pengambilan sampel acak sederhana, nilai harapan matematis, variansi dan kovariansi, model regresi linier sederhana, koefisien korelasi, koefisien kurtosis, median absolute deviation (MAD), estimasi- M, deret Taylor, rata-rata kuadrat sesatan, penduga rasio, outlier.
6
2.1.1 Pengambilan Sampel Acak Sederhana
Sampel adalah bagian populasi yang akan diteliti. Pengambilan sampel acak sederhana didefinisikan sebagai prosedur pemilihan sampel dimana setiap sampel mempunyai peluang yang sama untuk terpilih (Yamane [20]). Jika sampel acak yang sudah terpilih tidak dikembalikan, maka disebut pemilihan sampel acak tanpa pengembalian. Jika sampel acak yang terpilih dikembalikan, maka disebut pemilihan sampel acak sederhana dengan pengembalian. Menurut Cochran [5]
pengambilan sampel acak sederhana adalah sebuah metode untuk memilih sampel dari populasi sehingga setiap sampel mempunyai kesempatan yang sama untuk terpilih. Observasi dalam populasi diberi nomor 1 sampai . Nomor- nomor tersebut dipilih, dengan cara mencari nilai pada tabel bilangan acak atau dengan menempatkan nomor itu pada sebuah wadah dan mengundinya. Kelebihan dari pengambilan sampel acak sederhana adalah mudah dipelajari dan lebih efisien waktu, biaya serta tenaga.
Pengambilan sampel acak sederhana dapat dilakukan dengan dua cara, yaitu mengundi dan menggunakan tabel bilangan acak. Pengambilan sampel dengan cara mengundi dilakukan apabila jumlah populasi sedikit. Sedangkan pengambilan sampel dengan tabel bilangan acak dilakukan apabila populasinya besar. Pada pengambilan sampel terdapat empat karakteristik dari populasi yang biasa dihitung, yaitu rata-rata populasi, total populasi, rasio dan proporsi.
populasi dari variabel ditulis . Sedangkan n sampel dari variabel ditulis . Rata-rata populasi variabel dirumuskan
̅ ∑ sedangkan rata-rata sampelnya dirumuskan
̅ ∑
Ukuran sampel pada pengambilan sampel acak sederhana untuk penduga rasio menurut Yamane [20] adalah
⁄ ( )
7 dengan
̂
̅ ̂ ∑ ( )
dengan adalah ukuran populasi, adalah ukuran sampel tanpa pengembalian, adalah ukuran sampel dengan pengembalian, adalah ukuran sampel awal, adalah nilai ke- populasi variabel penelitian dan . adalah nilai ke- sampel variabel penelitian, adalah reliabilitas, adalah ketelitian, dan ̂ adalah variansi dari dan adalah rasio sampel.
2.1.2 Nilai Harapan Matematis
Nilai harapan adalah rata-rata dari variabel acak (Johnson dan Bhattacaryya [7]). Dimisalkan adalah variabel acak, maka rata-rata dari disebut nilai harapan dan dinotasikan dengan ( ). Jika mempunyai nilai dan probabilitas adalah ( ) , -, maka
( ) ∑ ( )
dengan n adalah banyaknya nilai , adalah nilai ke- dari variabel acak dan ( ) adalah probabilitas terjadinya .
2.1.3 Variansi dan Kovariansi
Yamane [20] menyatakan variansi ̅, variansi ̅ dan kovariansi antara ̅ dan ̅ pada pengambilan sampel acak sederhana tanpa pengembalian dirumuskan
̅
( )
̅
( )
̅ ̅
( ) dengan adalah fraksi pengambilan sampel, adalah banyaknya sampel, adalah banyaknya populasi, adalah variansi populasi variabel , adalah
8
variansi populasi variabel dan adalah kovariansi populasi antara variabel dan .
2.1.4 Model Regresi Linier Sederhana
Menurut Sembiring [13] model regresi linier yang paling sederhana adalah garis lurus. Garis lurus pada diagram pencar disebut garis regresi atau garis perkiraan. Model regresi linier sederhana untuk populasi dapat dirumuskan sebagai berikut
dan adalah parameter dan adalah kesalahan acak yang diasumsikan ( ). Nilai dan merupakan parameter yang nilainya tidak diketahui dan harus diduga. Penduga dari dan adalah dan , sehingga penduga model regresi linier sederhananya adalah
̂
Salah satu metode yang dapat digunakan untuk menduga parameter regresi adalah metode kuadrat terkecil. Metode kuadrat terkecil adalah metode untuk menghitung dan sebagai penduga dan , sedemikian rupa sehingga jumlah kuadrat sesatan memiliki nilai terkecil (Supranto [17]). Jumlah kuadrat sesatan ( ) ini dinamakan fungsi kuadrat terkecil dan dirumuskan dengan
∑
∑( ̂)
∑( )
Penduga dan diperoleh dengan cara meminimumkan fungsi kuadrat terkecil
∑ terhadap dan . Langkah pertama yang harus dilakukan adalah menurunkan ∑ terhadap dan menyamakannya dengan nol, sehingga diperoleh
∑
∑( )
∑( )
∑
∑
∑
9 ∑
∑
∑
∑
∑
∑
∑ ∑
̅ ̅ Langkah selanjutnya menurunkan ∑ terhadap dan menyamakannya dengan nol, sehingga diperoleh
∑
∑( ) ∑( )
∑
∑
∑
∑
∑
∑
∑
( ̅ ̅) ∑
∑
∑
̅ ∑
̅ ∑
∑
∑
̅ ∑
(∑
̅ ∑
)
(∑
̅ ∑
) ∑
̅ ∑
∑ ̅ ∑ (∑ ̅ ∑ )
10
∑ ∑ ∑
.∑ ∑ ∑ /
∑ ∑ ∑
.∑ ∑ / ∑ ∑ ∑ ̅
∑ ( ̅) ∑ ( ̅)
∑ ( ̅)
2.1.5 Koefisien Korelasi
Interpretasi koefisien korelasi menurut Supranto [17] adalah nilai untuk mengukur kuatnya hubungan antara dua variabel. Pada analisis regresi, koefisien korelasi digunakan untuk mengukur ketepatan garis regresi sebagai pendekatan data hasil observasi. Koefisien korelasi dinotasikan dengan . Nilai koefisien korelasi berkisar pada interval . Apabila nilai koefisien korelasi positif, maka hubungan antar variabel juga positif atau searah. Namun apabila nilai koefisien korelasi negatif, maka hubungan antar variabel juga negatif atau berlainan arah. Apabila nilai koefisien korelasi nol, maka hubungan antar variabel sangat lemah dan dianggap tidak ada. Rumus untuk koefisien korelasi yaitu
∑ ∑ ∑
√ ∑ (∑ ) √ ∑ (∑ )
dengan adalah ukuran populasi.
2.1.6 Koefisien Kurtosis
Koefisien kurtosis adalah ukuran keruncingan atau kepuncakan suatu distribusi (Supranto [17]). Distribusi yang mempunyai puncak relatif tinggi dinamakan leptokurtik. Distribusi yang mempunyai puncak mendatar dinamakan
11
platikurtik. Sedangkan sebuah distribusi normal yang puncaknya tidak terlalu tinggi ataupun tidak mendatar dinamakan mesokurtik.
Menurut Subramani [15], koefisien kurtosis dinotasikan dengan ( ) dan dirumuskan sebagai berikut
( ) ( ) ∑ ( ̅) ( )( )( )
( ) ( )( )
dengan adalah ukuran populasi, adalah observasi ke-i populasi variabel , ̅ adalah rata-rata populasi variabel dan adalah simpangan baku.
2.1.7 Median Absolute Deviation (MAD)
Sampel acak yang berasal dari populasi berdistribusi tertentu dimisalkan sebagai , maka ( ) didefinisikan
( ) ( ) *| ( )|+
dengan (median) adalah ukuran pemusatan data yang robust terhadap pengaruh outlier.
Jika simetris maka ( ) , sehingga ( ) *| |+ dan berlaku persamaan
*| | ( )+ ( ) Karena | | sama dengan , maka persamaan ( ) berubah menjadi
* ( ) ( )+
, ( ) ( ) -
, ( )
( ) -
, ( ) -
( )
12
Jadi, penduga standar deviasi yang robust terhadap outlier adalah ̂ ( )
( )
2.1.8 Estimasi-M
Pada tahun 1973 Huber memperkenalkan metode estimasi-M. M pada estimasi-M adalah maximum likelihood. Jadi metode estimasi-M merupakan perluasan dari maximum likelihood estimation (MLE). Menurut Chen [4] metode estimasi-M dipilih karena metode ini robust terhadap outlier. Sesatan persamaan regresi diasumsikan saling independen, ( ). Penduga maximum likelihood dari ( ) adalah ( ) yang memaksimalkan
∏ ( ) dengan . Perkalian fungsi sesatan diubah menjadi penjumlahan logaritma fungsi sesatan agar perhitungan menjadi lebih sederhana.
Memaksimalkan ∏ ( ) sama dengan memaksimalkan ∑ ( ) Misal fungsi maka memaksimalkan ∑ ( ) sama dengan meminimalkan ∑ ( ) Fungsi dari sesatan diduga dengan ( )
Untuk memperoleh penduga adalah dengan cara meminimalkan ∑ ( ) yang dirumuskan sebagai
∑ ( )
∑ (
̂ )
Nilai ̂ terdapat pada persamaan ( ) . Turunan parsial dari terhadap disamakan dengan nol untuk meminimalkan ∑ ( ), sehingga
∑ . ̂ /
( ) Penduga merupakan penyelesaian persamaan ( )
∑ (
̂ )
( ) Turunan parsial dari terhadap dimisalkan sebagai , maka persamaan ( ) dapat dituliskan
13
∑ (
̂ )
( ) Pada umumnya penyelesaian eksak dari persamaan ( ) sulit untuk diperoleh.
Oleh karena itu dibutuhkan penyelesaian numerik. Beaton dan Tukey (Draper dan Smith [6]) memberikan penyelesaian dengan mendefinisikan fungsi pembobot
. ̂ /
̂
( ) Berdasarkan fungsi pembobot ( ), persamaan ( ) dapat dituliskan
∑ ( ̂ )
∑ ( )
∑
( ) Persamaan ( ) jika dituliskan dalam notasi matriks menjadi
. Penyelesaian iteratif untuk dirumuskan
( ) ( ( ) ) ( )
Iterasi berhenti jika ( ) ( ) cukup kecil, misalnya . Metode kuadrat terkecil (MKT) digunakan untuk memperoleh nilai ( ) dari koefisien regresi yang diduga. Fungsi objektif ( ) dan fungsi pembobot pada tiap interval didefinisikan oleh Huber seperti pada Tabel 2.1.
Tabel 2.1. Fungsi objektif dan pembobot
( ) Interval
⁄
| | ⁄| | atau
Menurut Draper dan Smith [6] langkah-langkah yang dilakukan untuk menduga parameter menggunakan regresi robust estimasi-M adalah
1. menghitung ( ) dengan metode kuadrat terkecil, 2. menghitung nilai sesatan (ei),
14 3. menghitung median dari sesatan,
4. menghitung MAD = median |ei -median(ei)|, 5. menghitung nilai ̂
6. menghitung nilai ̂,
7. melakukan pembobotan dengan rumus
atau
| ⁄ | atau
8. menduga koefisien regresi robust dengan pemberian bobot , 9. mengulangi tahap 2-8 sehingga diperoleh ( ) yang konvergen.
2.1.9 Deret Taylor
Deret Taylor adalah pendekatan yang paling umum digunakan untuk mengevaluasi fungsi. Hal ini karena deret Taylor memiliki tingkat keakuratan yang lebih tinggi dibandingkan dengan metode numerik yang lain (Mathews [10]). Menurut Atkinson [1] jika f adalah fungsi dari x dan terdapat titik di sekitar x, maka pendekatan deret Taylor untuk satu variabel dirumuskan dengan
( ) ( ) ( )
( ) ( )
( ) ( )
( ) Sedangkan menurut Weisstein [19] pendekatan deret Taylor untuk dua variabel dinyatakan dengan
( ) ( ) * ( )
( ) +
* ( )
( )
( )
+
dengan pendekatan pada orde pertama deret Taylor dituliskan ( ) ( ) * ( )
( ) + ( ) ( ) * ( )
( )
+ ( )
15
2.1.10 Rata-rata Kuadrat Sesatan
Rata-rata kuadrat sesatan (RKS) dapat digunakan untuk membandingkan penduga bias dan tak bias, atau dua penduga yang mempunyai nilai bias berbeda.
Jika memiliki rata-rata kuadrat sesatan yang lebih kecil. maka suatu penduga dikatakan lebih baik daripada penduga yang lain. Misalkan dan adalah penduga parameter tertentu ( ), adalah penduga tak bias dan adalah penduga bias dengan variansi lebih kecil dari . Walaupun adalah penduga tak bias dan adalah penduga bias, belum tentu adalah penduga yang lebih baik daripada . Karena jika bias kecil, maka adalah penduga yang lebih baik daripada . Jadi penduga bias dapat lebih baik daripada penduga tak bias. Hal tersebut tergantung dari besarnya variansi dan bias (Yamane [20]).
Misalkan ̂ merupakan penduga parameter , maka rata-rata kuadrat sesatan dirumuskan sebagai
( ̂) [ ̂]
Maka rata-rata kuadrat sesatan untuk dan dapat dirumuskan dengan ( ) , -
dan
( ) , - Variansi dan dirumuskan dengan
, ( ) - dan
, ( ) -
Jika adalah penduga tak bias untuk , maka ( ) sehingga ( ) , -
, ( ) -
Sehingga rata-rata kuadrat sesatan penduga tak bias sama dengan variansinya.
Jika adalah penduga bias untuk , maka ( ) sehingga ( ) , -
, ( ) ( ) -
16
,* ( )+ * ( ) +-
* ( ) + * ( )+ * ( ) +* ( )+
* ( ) + * ( )+
Sehingga rata-rata kuadrat sesatan penduga bias sama dengan penjumlahan variansi dan kuadrat biasnya.
Sesatan dari penduga rasio dapat dihitung menggunakan persamaan ( ).
Rasio dan penduga rasio adalah perbandingan dari dua variabel yaitu ̅ dan ̅ serta ̅ dan ̅. Selisih dari rasio dengan penduganya merupakan sesatan penduga rasio. Sesatan penduga rasio dirumuskan
( ̅ ̅) ( ̅ ̅) ( ̅ ̅)
̅ ( ̅ ̅) ( ̅ ̅)
̅ ( ̅ ̅) ( ) dengan ( ̅ ̅) adalah rasio populasi dan ( ̅ ̅) ̂ adalah penduga rasio populasi.
2.1.11 Penduga Rasio
Penduga rasio klasik untuk menduga rata-rata populasi dari variabel penelitian dirumuskan dengan
̅ ̅
̅ ̅ ̂ ̅ ( ) dengan ̅ adalah penduga rasio klasik, ̅ adalah rata-rata sampel dari variabel penelitian, ̅ adalah rata-rata sampel dari variabel bantu, ̅ adalah rata-rata populasi dari variabel bantu dan ̂ ̅ ̅ adalah penduga rasio populasi.
Berdasarkan persamaan ( ), rata-rata kuadrat sesatan dari ̅ adalah ( ̅ )
( )
dengan adalah jumlah sampel, adalah jumlah populasi, ̅ ̅ adalah rasio populasi, adalah variansi populasi variabel , adalah variansi populasi variabel , adalah kovariansi populasi antara variabel dan .
17
Ray dan Singh mengembangkan penduga rasio dengan menambahkan koefisien regresi pada penduga rasio klasik, sehingga diperoleh penduga rasio baru
̅ ̅ ( ̅ ̅ )
̅ ̅
dengan ̅ adalah modifikasi penduga rasio oleh Ray dan Singh, adalah koefisien regresi sampel.
Singh dan Kakran memodifikasi penduga rasio menggunakan koefisien kurtosis variabel bantu
̅ ̅ ̅ ( ) ̅ ( )
̅
̅ ̅ ̂ ̅ ( ) dengan ̅ adalah modifikasi penduga rasio oleh Singh dan Kakran, ( ) adalah koefisien kurtosis dari variabel . Dari persamaan ( ) , ̅ ̅
( ) , ̅ ̅ ( ), ̂ ̅ ̅
.
Berdasarkan persamaan ( ), rata-rata kuadrat sesatan dari ̅ adalah ( ̅ )
̅ , ( )-
dengan ( ̅ ) adalah rata-rata kuadrat sesatan dari ̅ , ̅ ̅( ) dan , adalah koefisien korelasi antara variabel dan variabel , adalah koefisien variasi dari variabel dan adalah koefisien variasi dari variabel .
Penduga rasio Kadilar dan Cingi [8] menggunakan koefisien kurtosis variabel bantu dan regresi yang merupakan gabungan penduga rasio Ray dan Singh serta Singh Kakran
̅ ̅ ( ̅ ̅)
̅ ( ) , ̅ ( )- ̂ ̅
dengan ̅ adalah modifikasi penduga rasio oleh Kadilar dan Cingi, koefisien regresi sampel, adalah kovariansi sampel variabel dan , adalah variansi sampel variabel , dan ̂ ̅ ( ̅ ̅)
̅ ( ).
18
Penduga rasio untuk ̅ menggunakan koefisien kurtosis variabel bantu dan regresi robust yang ditemukan oleh Kadilar et al. [9] dirumuskan sebagai
̅ ̅ ( ̅ ̅)
̅ ( ) , ̅ ( )- ̂ ̅ dengan ̅ adalah modifikasi penduga rasio oleh Kadilar et al., adalah penduga koefisien regresi robust estimasi-M dan ̂ ̅ ̅ ( ̅ ̅)( ) . Pada penduga rasio tersebut, penggunaan dimaksudkan untuk mengurangi pengaruh pencilan pada estimasi parameter regresi.
Penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi robust lebih baik daripada penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi jika memenuhi kondisi tertentu. Untuk membuktikannya maka rata-rata kuadrat sesatan kedua penduga dibandingkan.
2.1.12 Outlier
Outlier atau pencilan adalah suatu data yang jauh berbeda dibandingkan dengan keseluruhan data (Soemartini [14]). Adanya outlier menyebabkan estimasi koefisien regresi menjadi kurang tepat. Hal-hal yang diakibatkan karena adanya outlier adalah
1. sesatan dari model regresi menjadi besar,
2. variansi dari penduga koefisien regresi menjadi besar, 3. taksiran interval memiliki rentang lebar.
Menurut Montgomery dan Peck [11], salah satu metode yang dapat digunakan untuk mengidentifikasi outlier yang berpengaruh terhadap koefisien regresi adalah DFFITS (Difference fitted values fits). Perhitungan DFFITS dirumuskan
̂ ̂( )
√ ( )( )
dengan adalah difference fitted values fits observasi ke-i, ( ) adalah variansi sampel dari sesatan jika observasi ke-i dikeluarkan dari penelitian dan
19
adalah leverage dari observasi ke-i. Pada model regresi linear dirumuskan sebagai
( ̅)
dan
∑
dengan p adalah banyaknya parameter model regresi. Suatu observasi dikatakan outlier jika memenuhi kondisi
| | √
2.2 Kerangka Pemikiran
Penduga rasio memberikan hasil pendugaan yang lebih baik dari penduga yang lain dan meningkatkan ketelitian (Cochran [5]). Penduga rasio memanfaatkan korelasi antara variabel bantu ( ) dan variabel penelitian ( ). Jika variabel bantu berkorelasi positif dengan variabel penelitian, maka penduga rasio baik digunakan untuk menduga rata-rata populasi. Koefisien kurtosis dan regresi digunakan untuk meningkatkan ketelitian dari penduga rasio. Namun, adanya pencilan dalam data umumnya mengurangi ketelitian karena penduga rasio klasik sensitif terhadap nilai-nilai ekstrim (Chatterjee dan Price [3]). Oleh karena itu, digunakan regresi robust estimasi-M pada penduga rasio untuk mengurangi dampak negatif dari masalah pencilan data. Selain itu, akan dibuktikan bahwa penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi robust lebih baik daripada penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi. Caranya adalah dengan membandingkan rata-rata kuadrat sesatan penduga rasio Kadilar et al. [9] dengan penduga rasio Kadilar dan Cingi [8].
Selanjutnya, menerapkan kedua penduga tersebut dan menginterpretasikannya.