• Tidak ada hasil yang ditemukan

Regresi. Data : Untuk melakukan regresi linear, langkah-langkah sebagai berikut, 1. Pilih Stat > Regression > Regression

N/A
N/A
Protected

Academic year: 2021

Membagikan "Regresi. Data : Untuk melakukan regresi linear, langkah-langkah sebagai berikut, 1. Pilih Stat > Regression > Regression"

Copied!
11
0
0

Teks penuh

(1)

1

Regresi

Fungsi regresi yang tersedia pada Minitab yang dibahas disini adalah regresi tipe least squares regression atau kuadrat terkecil, sedangkan regresi tipe logaritma walaupun juga tersedia dalam Minitab tidak akan dibahas disini.

Kita dapat menggunakan fungsi regresi untuk regresi sederhana dan regresi rangkap dengan kuadrat terkecil. Menggunakan prosedur ini untuk mencocokkan model kuadrat terkecil, menyimpan statistik regresi, memeriksa diagnosa residu, menghasilkan estimasi titik, menghasilkan prediksi dan interval kepercayaan dan melakukan pengujian lack of fit. Disamping itu kita juga dapat menggunakan fungsi ini untuk mencocokkan model polinomial, namun jika kita ingin mencocokkan model regresi polinomial dengan penduga tunggal, akan lebih mudah menggunakan fungsi Fitted Line Plot.

Data :

Masukan respon dan variabel penduga dalam bentuk angka ke kolom dengan panjang yang sama sehingga tiap baris pada lembaran kerja/worksheet yang memuat pengukuran terhadap satu obyek atau pengamatan. Minitab secara otomatis akan mengabaikan semua pengamatan yang nilai-nilainya tidak lengkap dalam respon atau penduga dari perhitungan persamaan regresi dan item-item tabel ANOVA. Akan tetapi Minitab dapat mengandung nilai-nilai tidak lengkap bila memperhitungkan ŷi dan hi bila hi adalah tidak lengkap atau dalam kasus i mempunyai bobot sama dengan 0 dan semua penduga muncul.

Untuk melakukan regresi linear, langkah-langkah sebagai berikut, 1. Pilih Stat > Regression > Regression

2. Pada Response, masukan kolom yang memuat variabel respon (Y)

3. Pada Predictor, masukan kolom yang memuat variabel-variabel penduga (X) 4. Jika perlu, dapat memilih opsi lain, lalu tekan OK

Opsi-Opsi : Graphs :

(2)

2 Menggambarkan 5 macam plot residu yang berbeda untuk regular, standardized atau deleted residue, individual plot dan four in one.

- Untuk Four in one, plot secara terpisah untuk residu terhadap tiap kolom tertentu. Results :

- Ketetapan awal adalah pilihan ke 3, yang memuat semua hasil dari 2 item diatas tambah jumlah sekuensial kuadrat dan persamaan sesuai dan residu pada pengamatan tidak biasa/unusual observation. Options :

(3)

3 - Melakukan regresi diboboti

- Tidak termasuk suku perpotongan dari regresi bila pilihan Fit Intercept tidak ditandai

- Menampilkan varian inflation factor (VIF, sebuah ukuran efek multi-kolinear) terkait dengan tiap penduga

- Menampilkan statistik Durbin-Watson untuk mendeteksi otokorelasi pada residu

- Melakukan pengujian pure error pada lack of fit untuk kecukupan model bila terdapat replikasi penduga

- Melakukan pengujian data sub pengaturan lack of fit untuk memeriksa kecukupan model - Memprediksi respon untuk pengamatan baru

Storage :

- Kita dapat memilih parameter apa yang perlu disimpan dengan menandai item-item yang dikehendaki. Contoh Regresi Linear Sederhana :

(4)

4 Misalkan kita ingin memeriksa hubungan antara dua skor atau nilai untuk melihat jika kita dapat memprediksi skor yang diinginkan (Score 2) dari skor yang mudah diperoleh (Score 1).Kita juga ingin memperoleh interval prediksi untuk sebuah pengamatan dengan Score 1 berupa 8.2. Misalnya file disimpan dengan nama score.MTW sebagai berikut (sebagian data tidak terkait tidak ditampilkan walaupun pada menu pilihan muncul) :

1. Buka file score.MTW (File > open worksheet > nama file) 2. Pilih Stat > Regression > Regression

3. Pada Regression, masukan Score2, pada Predictors, masukan Score1 4. Pilih Options

(5)

5 Hasil :

Interpretasi :

Prosedur regresi yang cocok pada model Y = β0 + β1X + ε

(6)

6 Y adalah respon, X adalah penduga,β0 dan β1 adalah koefisien regresi dan ε adalah suku kemelesetan /error yang mempunyai distribusi normal dengan rata-rata nol dan standar deviasi . Minitab mengestimasi β0 dengan b0 dan β1 dengan b1, dan  dengan s. Persamaan yang sesuai atau cocok adalah,

Ŷ = b0 + b1X

Dimana Ŷ dikatakan terprediksi atau nilai cocok/ sesuai model. Dari data diatas b0 = 1.12 dan b1= 0.218 atau, Ŷ =1.12 + 0.218 X

Tabel Koefisien :

Tabel keluaran memberikan koefisien estimasi,b0 dan b1 dengan standar deviasi, nilai t yang menguji apakah hipotesis null pada koefisien adalah sama dengan nol dan juga p-value untuk pengujian ini. Nilai-nilai ini menunjukkan apakah terdapat cukup bukti bahwa koefisien adalah tidak nol untuk kemungkinan kesalahan tipe I (tipe I adalah benar dinyatakan salah, Tipe II adalah salah dinyatakan benar)

S = 0.1274, ini adalah sebuah estimasi , yaitu standar deviasi estimasi mengenai garis regresi. s2 = MSError

R-Sq = 95.7%, ini adaah R2 yang juga disebut koefisien determinasi. R2 = korelasi(Y,Ŷ)2. Juga, R2 = (SS Regression) / (SS Total)

Nilai R2 adalah proporsi variabilitas pada variabel Y (contoh ini adalah Score2) yang dihitung dengan penduga (dalam hal ini Score1).

R-Sq(adj) = 95.1%. ini adalah R2 koreksi untuk derajat kebebasan. Jika sebuah variabel dibutuhkan oleh persamaan, R2 akan menjadi lebih besar jika variabel tambahan tidak nyata. Untuk mengkompensasi ini, Minitab juga menampilkan R-Sq(adj) yang mana adalah sebuah pendekatan estimasi tidak bias pada populasi R2 yang dihitung dengan rumus,

R2(adj) = [1 – SS Error/(n-p)] / [ SS Total/ (n-1)]

Diubah ke %, dimana p adalah banyaknya koefisien sesuai pada persamaan regresi ( dalam contoh ini adalah 2). Untuk notasi sama, biasanya R2 adalah

R2 = 1 – SS Error/SS Total

Analisi Varian :

Tabel ini mengandung jumlah kuadrat (disingkat SS).SS regresi kadang ditulis SS (Regresi| b0) dan kadang disebut SS model.SS Error kadang ditulis SS Residu, SSE atau SSR.Sedangkan MS Error sering ditulis MSE. SS Total adalah total jumlah kuadrat koreksi untuk rata-rata. Kita gunakan tabel analisi varian untuk menilai secara keseluruhan kecocokan. Pengujian F pada hipotesis H0 : semua koefisiensi regresi adalah nol kecuali β0. Pengamatan Tidak Biasa :

Unusual Observation ditandai dengan X jika penduga adalah tidak biasa (pengungkitan besar) dan mereka ditandai dengan R jika respon adalah tidak biasa (standar residu besar). Fit atau fitted Y value sering disebut nilai Y prediksi atau Ŷ. StDev Fit adalah standar deviasi estimasi pada nilai sesuai/ fit. St Resid adalah residu

(7)

7 distandarkan.

Nilai Prediksi :

Interval yang ditampilkan pada 95% CI adalah internal kepercayaan untuk rata-rata populasi pada semua respon (Score2) yang sesuai dengan nilai diberikan pada penduga (Score1=8.2). Interval yang ditampilkan pada 95% CI adalah interval prediksi untuk sebuah pengamatan individual yang diambil pada Score1 =8.2. Interval kepercayaan adalah tepat untuk data digunakan dalam regresi.Jika kita mempunyai pengamatan baru maka gunakan interval prediksi.

Analisis regresi belumlah lengkap tanpa memeriksa pola residu. Contoh berikut dan prosedur plot residu memberikan tambahan informasi mengenai analisis regresi.

Contoh Regresi Ganda.

Dalam pengujian energi termal cahaya matahari, kita mengukur total fluk panas dari wadah. Kita ingin memeriksa apakah total fluk panas dapat diprediksi dengan isolasi, dengan posisi fokus pada arah timur, selatan dan utara dan dengan waktu tiap hari. Misalkan data disimpan dalam file panas. MTW sebagai berikut :

1. Buka file panas.MTW

2. Pilih Stat > Regressioan > Regression 3. Pada Respon, masukan Heatflux

4. Pada Prediction, masukan North, South, East, lalu tekan OK Hasil :

(8)

8 Interpretasi :

Minitab mencocokkan model regresi, Y = β0 + β1X1+ β2X2 +β3X3 + ε

Y adalah respon, X1, X2 dan X3 adalah penduga-penduga,β0, β1 dan β2 adalah koefisien-koefisien regresi dan ε adalah suku kemelesetan /error yang mempunyai distribusi normal dengan rata-rata nol dan standar deviasi . Minitab mengestimasi β0 dengan b0 dan β1 dengan b1, dan  dengan s. Persamaan yang sesuai atau cocok adalah,

Ŷ = b0 + b1X1 +b2X2 +b3X3

Keluaran regresi ganda adalah sama dengan keluaran regresi sederhana, tetapi ia juga mengandung jumlah sekuensial kuadrat. Jumlah sekuensial kuadrat berbeda dari statistik t. Pengujian T-statistik hipotesis null bahwa tiap koefisien adalah nol, yang diberikan semua variabel-variabel lain yang berada dalam model, sedangkan jumlah sekuensi kuadrat adalah jumlah unik kuadrat pada variabel kerja, yang diberikan jumlah kuadrat pada tiap variabel masukan sebelumnya.

Misalnya, jumlah sekuensial kuadrat kolom pada tabel analisa varian, nilai North (10578.7) adalah jumlah kuadrat untuk North, nilai untuk South (2028.9) adalah jumlah unik kuadrat untuk South yang diberikan jumlah kuadrat untuk North, dan nilai untuk East (226.3) adalah jumlah unik kuadrat untuk East yang diberikan jumlah kuadrat North dan South.

(9)

9 Error yang disebabkan mencocokkan suku b1 (sebuah ekivalen adalah menggunakan X1 sebagai sebuah penduga), mengasumsikan bahwa kita telah mempunyai b0. Garis berikutnya memberikan SS (b2|b0, b1) atau reduksi SS Error yang disebabkan mencocokkan suku b2, mengasumsikan bahwa kita telah mempunyai suku b0 dan b1.Garis berikut adalah SS (b3|b0, b1,b2) dan seterusnya. Jika kita ingin sebuah urutan beda, katakan SS(b2|b0, b3), maka mengulang prosedur regresi dan memasukan X3 terlebih dahulu, kemudian X2. Minitab tidak mencetak p-value untuk jumlah sekuensial kuadrat.kecuali untuk jumlah sekuensial kuadrat terakhir, rata-rata kuadrat kemelesetan atau error tidak harus digunakan untuk menguji signifikasi suku-suku.

Pada contoh, pengujian t, p-value kurang dari 0.0005 menunjukkan bahwa terdapat bukti signifikan bahwa koefisien variabel Nort dan South tidak nol. Koefisien pada variabel East mempunyai pengujian t, dimana p-value adalah 0.092. Jika bukti untuk koefisien tidak nol muncul tidak signifikan dan jika itu menambah sedikit penduga, kita dapat memilih model lebih hemat atau sederhana dengan penduga North dan South. Membuat keputusan ini hanya setelah memeriksa residu.Pada plot residu (contoh dibawah), kita memeriksa residu dari model dengan penduga North dan South.

Dari tabel diatas,b0 = 389.17, b1= -24.13 untuk X1 = North, b2 = 5.32 untuk X2 = South, sedangan b3 = 2.13 untuk X3 = East tidak signifikan (tidak dimasukan ke model).

Contoh Plot Residu :

Kita dapat menghasilkan sebuah himpunan plot untuk analisis residu dengan menyimpan model cocok dan residu menggunakan prosedur lain seperti regresi dan kemudian menggunakan prosedur plot residu untuk menghasilkan sebuah plot score normal, sebuah grafik residu individual, sebuah histogram residu dan sebuah plot model cocok terhadap residu, semua pada satu grafik.

Data :

Kita harus menyimpan sebuah kolom residu dan sebuah kolom model cocok dari prosedur Minitab lain. Minitab secara otomatis mengabaikan baris-baris dengan nilai-nilai tidak lengkap dari file.

Untuk menampilkan plot residu, langkah-langkah sebagai berikut 1. Buka file yang berisi data (File > Open worksheet > nama file) 2. Pilih Stat > Regression > Regression

3. Pada Response, masukan kolom yang memuat Y 4. Pada Predictors, masukan kolom yang memuat X

5. Pada Graphs,bisa tandai tiap item sesuai yang dibutuhkan atau semua ditampilkan dengan memilih Four in one

(10)

10 Contoh :

Dengan contoh file panas.MTW diatas, kita bisa lakukan pengujian residu sebagai berikut, 1. Bukan file panas. MTW

2. Pilih Stat > Regression > Regression 3. Pada Response, masukan Heatflux

4. Pada Predictors, masukan South dan North 5. Pada Graphs, tandai Four in one

6. Tekan OK

(11)

11 Interpretasi :

Plot normal memperlihatkan sebuah pola cukup linear yang adalah konsisten dengan sebuah distribusi normal.Histogram juga menghasilkan sebuah pola yang konsisten dengan sampel dari sebuah distribusi normal. Namun pada plot Residu terhadap order, yang menampilkan pengamatan individual, dimana pada grafik terdapat 1 titik diatas garis 20 yang mengungkapkan diluar 3 sigma. Pada plot residu terhadap fit memperlihatkan bahwa pada bagian terbesar cenderung lebih baik untuk nilai prediksi lebih besar. Pengamatan lebih lanjut menunjukkan bahwa residu terbesar bertepatan dengan nilai terbesar dari variabel East. Dengan demikian memasukan variabel East dalam model dan mengulang regresi menunjukkan titik diluar 3 sigma menjadi sedikit lebih baik, sehingga memasukkan variabel East ke dalam model dapat dipertimbangkan lebih lanjut.

Referensi

Dokumen terkait

Salah satu data mortalitas (kematian) yang cocok dianalisis dengan menggunakan model Regresi Zero Inflated Negative Binomial (ZINB) adalah data kematian anak balita..

Model persamaan regresi linear berganda yang baik setelah melakukan estimasi menggunakan metode robust least trimmed square (LTS) yaitu dengan melihat nilai

Melakukan prediksi terhadap nilai suatu variabel, misalkan Y, berdasarkan nilai variabel yang lain , misalkan X, dengan menggunakan model regresi linier ( ( interpolasi te po

Oleh karena itu pada penelitian ini dilakukan analisis dengan memperhatikan excess zero dan overdispersi menggunakan regresi ZINB dan model regresi HNB, dimana kedua

Penelitian ini bertujuan untuk mengetahui: (1) Bagaimana model persamaan regresi dengan metode Partial Least Square (PLS) untuk mengatasi multikolinearitas; (2) Bagaimana model

Tahapan untuk melakukan pemodelan spasial adalah regresi linear berganda, uji asumsi residual, uji multikolinearitas, model spasial, Spatial Autoregressive Model

Representasi model-model tersebut dapat membantu analisis dan pengamatan untuk mengambil asumsi-asumsi hasil kerja ANFIS seperti memahami dan membuat keputusan

Berdasarkan model yang dihasilkan diperoleh model terpilih dari regresi polynomial dengan formula: Kata Kunci: Analisis Regresi, Estimasi Berat Lahir Bayi, Biometri Janin, USG