STATISTIKA INDUSTRI 2
TIN 4004
Pertemuan 10
•
Outline:
–
Multiple Linear Regression and Correlation
–
Non Linear Regression
•
Referensi:
–
Montgomery, D.C., Runger, G.C.,
Applied Statistic
and Probability for Engineers
, 5
thEd. John Wiley &
Sons, Inc., 2011.
–
Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K.,
Probability & Statistics for Engineers & Scientists
, 9
thEd. Prentice Hall, 2012.
Multiple Linear Regression
•
Terdiri atas lebih dari satu independent
variable
•
Metode yang digunakan untuk estimasi
koefisien:
–
Least square estimation (metode kuadarat
terkecil)
–
Normal equation (Persamaan Normal)
–
Matrix approach (Sistem Matriks)
Multiple Linear Regression
•
Terdiri atas lebih dari satu independent
variable
•
Metode yang digunakan untuk estimasi
koefisien:
–
Least square estimation (metode kuadarat
terkecil)
–
Normal equation (Persamaan Normal)
–
Matrix approach (Sistem Matriks)
Multiple Linear Regression
Multiple Linear Regression
Estimator of Variance
•
Residual:
–
the difference between the observation
𝑦
𝑖dengan
nilai
𝑦
𝑖Multiple Linear Regression
Estimator of Variance
•
Residual:
–
Contoh soal:
Multiple Linear Regression
Estimator of Variance
•
Variance Estimator
Error atau
Residual Sum of Squares
Multiple Linear Regression
Estimator of Variance
•
Variance Estimator
Contoh soal:
𝜎
2= 𝑠
2=? ? ? ?
Interval Keyakinan Bagi penduga
B
1dan B
2SI 2 - Regresi & Korelasi
Berganda 10
Pengujian menggunakan distribusi t dengan derajat bebas (db) = n –m, Dengan contoh soal sebelumnya, dgn ∝=5%, db = n –m = n –k -1 = 10 –2 - 1 = 7, maka:
Interval keyakinan bagi penduga B1adalah
b1–t(α/2, n-k-1).Sb1< B1< b1+ t(α/2, n-k-1).Sb1
0,564 –(2,365)(0,303) < B1< 0,564 + (2,365)(0,303)
-0,153 < B1< 1,281
Interval keyakinan bagi penduga B2 adalah
b2–t(α/2, n-k-1).Sb2 < B2< b2+ t(α/2, n-k-1).Sb2
1,099 –(2,365)(0,313) < B2< 1,099 –(2,365)(0,313)
0,359 < B2< 1,839
Pengujian Parameter Koefisien
Regresi Berganda
SI 2 - Regresi & Korelasi
Berganda 11
Bertujuan untuk menentukan apakah ada sebuah hubungan linear antar variabel tidak bebas Y dengan variabel bebas X1, X2,… ,Xk.
Ada 2 bentuk pengujian hipotesis bagi koefisien regresi berganda: 1. Pengujian hipotesis serentak
2. Pengujian hipotesis individual
Pengujian Hipotesis Serentak
Merupakan pengujian hipotesis koefisien regresi berganda dengan B1dan
B2serentak atau secara bersama-sama mempengaruhi Y.
Pengujian Hipotesis individual
Merupakan pengujian hipotesis koefisien regresi berganda dengan hanya satu B (B1atau B2) yang mempengaruhi Y.
Pengujian Hipotesis Serentak
Langkah-langkah pengujian:
1. Menentukan formulasi hipotesis
»
H
0: B
1= B
2= 0 (X
1dan X
2tidak mempengaruhi Y)
»
H
1: B
1
B
2
0 (X
1dan X
2mempengaruhi Y atau
paling tidak ada X yang mempengaruhi Y
2. Menentukan taraf nyata (
) dan nilai F tabel
»
Taraf (
) dan nilai F tabel ditentukan dengan derajat bebas
1 = k dan
2 = n - k -1
SI 2 - Regresi & Korelasi
Berganda 12
Pengujian Hipotesis Serentak - lanjutan
Langkah-langkah pengujian:
3. Menentukan kriteria pengujian
H
0diterima jika F
0≤ F
(
1)(
2)
H
0ditolak jika F
0> F
(
1)(
2)
4. Menentukan nilai uji statistik dengan tabel ANOVA
SI 2 - Regresi & Korelasi
Berganda 13 Sumber Variasi Jumlah Kuadrat Derajat Bebas Rata-rata Kuadrat F0 Regresi (X1, X2) Error
JKR
JKE k
n –k - 1 JKR
k
JKE n - k -1
RKR RKE
Total JKT n - 1
Pengujian Hipotesis Serentak - lanjutan
SI 2 - Regresi & Korelasi
Berganda 14
∑
-=
∑
=
y
2Y
2n
Y
2JKT
JKR
b
1
x
1y
b
2
x
2y
(
∑
-
)
+
(
∑
-
∑
)
=
b
X
Y
n
X
Y
b
X
Y
n
X
Y
JKR
1 1 1 2 2 2JKE = JKT - JKR
Selain menggunakan tabel ANOVA di atas, nilai Fo dapat pula ditentukan dengan
menggunakan rumus:
) 3 ( 1 2 0 n KPB KPB F Dimana:KPB = (R2) = koefisien penentu atau koefisien determinasi berganda
n = jumlah sampel
atau
Pengujian Hipotesis Serentak - lanjutan
KPB = (R
2) = koefisien penentu atau koefisien
determinasi berganda
5. Membuat kesimpulan
Menyimpulkan apakah H
0diterima atau ditolak
SI 2 - Regresi & Korelasi
Berganda 15
𝑅
2=
𝑏
1𝑥
1𝑦
+
𝑏
2𝑥
2𝑦
𝑦
2Pengujian Hipotesis Individual
Langkah-langkah pengujian:
1. Menentukan formulasi hipotesis
H
0: B
i= 0 (tidak ada pengaruh X
iterhadap Y)
H
1: B
i> 0 (ada pengaruh positif X
iterhadap Y)
B
i< 0 (ada pengaruh negatif X
iterhadap Y)
B
i≠ 0 (ada pengaruh X
iterhadap Y)
2. Menentukan taraf nyata (
) dan nilai t tabel
db = n
–
k
–
1
SI 2 - Regresi & Korelasi
Berganda 16
Pengujian Hipotesis Individual - lanjutan
Langkah-langkah pengujian:
3. Menentukan kriteria pengujian
H
0diterima jika t
0≥ t
(n-m)H
0ditolak jika t
0< t
(n-m)4. Menentukan nilai uji statistik
5. Membuat kesimpulan
SI 2 - Regresi & Korelasi
Berganda 17
Latihan
•
Coba uji secara 2 arah parameter B1 dan B2
dengan menggunakan taraf nyata sebesar
=
0,05 dari soal di atas secara individual maupun
serentak!
SI 2 - Regresi & Korelasi
Jawab (pengujian individual)
1. Menentukan formulasi hipotesis
H0: B1 = 0 (tidak ada pengaruh X1terhadap Y)
H1: B1≠ 0 (ada pengaruh X1terhadap Y)
Dan
H0: B2 = 0 (tidak ada pengaruh X2terhadap Y)
H1: B2≠ 0 (ada pengaruh X2terhadap Y)
2. Menentukan taraf nyata () dan nilai t tabel
∝= 0,05
derajat bebas = 10 –3 =7 t (0,025;7)= 2,365
SI 2 - Regresi & Korelasi
Berganda 19
Jawab (pengujian individual)- lanjutan
3. Menentukan kriteria pengujian
H0diterima jika ti< t (0,025;7)= 2,365 dan ti> t (0,025;7)= - 2,365
H0ditolak jika ti> t (0,025;7)= 2,365 dan ti< t (0,025;7)= - 2,365
4. Menentukan nilai uji statistik
Untuk uji B
1Untuk uji B
2SI 2 - Regresi & Korelasi
Berganda 20
Jawab (pengujian individual)- lanjutan
5. Kesimpulan
Karena t1
1,859 < 2,365
Maka terima hipotesis
H
0: B
1= 0
Karena t2
3,511 > 2,365 Maka tolak
H
o: B
2= 0
Berarti:
tidak ada hubungan linier antara variabel
X
1dgn Y ada hubungan linier antara variabelX
2dgn Y SI 2 - Regresi & KorelasiBerganda 21
Multiple Linear Regression
Correlation
Multiple Linear Regression
Correlation
•
Coefficient of multiple determination
𝑅
2
•
Adjoint
𝑅
2
Multiple Linear Regression
Multicollinearity
•
strong dependencies among regressor
variables
𝑥
𝑗
–
The estimates of the regression coefficients are
very imprecise and affects the stability of the
regression coefficients.
–
To detect:
•
Variance inflation factors > 1
Multiple Linear Regression
Uji Hipotesa
•
Uji Koefisien Subset
–
Test the siginificance of a set of variables. Test
contribution of new variables.
–
Menggunakan uji F
Partial F-test
–
Area Penolakan:
𝒇 > 𝒇
𝜶(𝒗𝟏=𝒓,𝒗𝟐=𝒏−𝒑)𝒇 =
𝑺𝑺
𝑹(𝜷
𝒋|𝜷
𝟎, 𝜷
𝑺𝑺
𝟏, … , 𝜷
𝒋−𝟏, 𝜷
𝒋+𝟏, … , 𝜷
𝒌)/𝒓
𝑬
/(𝒏 − 𝒑)
=
(𝑺𝑺𝑹𝜷
𝟏, 𝜷
𝟐, … , 𝜷
𝒌𝒔𝟐𝜷
𝟎 −𝑺𝑺𝑹𝜷
𝒋𝜷
𝟎 )/𝒓Multiple Linear Regression
Uji Hipotesa
•
Uji Koefisien Subset
–
Contoh:
Kasus Wire Bond Strength
𝒇 =
𝟑𝟑. 𝟐/𝟐
𝟒. 𝟏 = 𝟒. 𝟎𝟓
NOTE:
partial
F
-test to a single variable =
t
-test
General Linear Model (GLM)
•
GLM is the mathematical framework used in
many common statistical analysis, including
multiple regression and ANOVA
–
ANOVA is typically prsented as distinct from
multiple regression but it IS a multiple regression
Characteristics of GLM
•
Linear
, pairs of variables are assumed to have
linear relations
•
Additive
, if one set of variables predict
another variable, the effect are thought to be
additive
•
BUT! This does not preclude testing non-linear
or non additive effects (by doing some
transformations)
Analysis of Variance (ANOVA)
•
Appropriate when the predictors (independent
variables) are all categorical and the outcome
(dependent variable) is continous
–
Most common application is to analyze data from
randomized experiments
•
More specifically, randomized experiments that
generate more than 2 means
–
If only 2 means thes use:
NONLINEAR REGRESSION
Nonlinear Regression
Beberapa Jenis Nonlinear Regression:
•
Polynomial Regression Models
–
Bersifat curvilinear
•
Logistic Regression
–
For non normal distribution data, binary
responses
TUGAS KELOMPOK
•
Cari kasus permasalahan yang diselesaikan
dengan:
–
Multiple Linear Regression
–
Non Linear Regression
•
Selesaikan dengan menggunakan software
statistik
•
Interpretasikan hasil output software tersebut
•
Catatan:
–
Kasus yang digunakan tidak boleh sama antar