• Tidak ada hasil yang ditemukan

Multilevel Logistik Ordinal Biner

N/A
N/A
Protected

Academic year: 2021

Membagikan "Multilevel Logistik Ordinal Biner"

Copied!
10
0
0

Teks penuh

(1)

PERBANDINGAN REGRESI LOGISTIK DAN

PERBANDINGAN REGRESI LOGISTIK DAN

MODEL MULTILEVEL PADA DATA ORDINAL DAN BINER 

MODEL MULTILEVEL PADA DATA ORDINAL DAN BINER 

UNTUK MENGETAHUI VARIABEL YANG MEMPENGARUHI

UNTUK MENGETAHUI VARIABEL YANG MEMPENGARUHI

HASIL BELAJAR MENGAJAR KALKULUS I DI ITS

HASIL BELAJAR MENGAJAR KALKULUS I DI ITS

1

1

Soehermin Ari Poedjiati,

Soehermin Ari Poedjiati,

22

Prof. Dra. Susanti Linuwih, M.Stat.,Ph.D, dan

Prof. Dra. Susanti Linuwih, M.Stat.,Ph.D, dan

3

3

Ir. Dwiatmono AW, M.Ikom.

Ir. Dwiatmono AW, M.Ikom.

1

1Mahasiswa Program Pasca Sarjana - Mahasiswa Program Pasca Sarjana - Magister Statistika, Institut Teknologi Sepuluh Nopember Magister Statistika, Institut Teknologi Sepuluh Nopember  Jl. Arief Rahman Hakim Surabaya – Indonesia

Jl. Arief Rahman Hakim Surabaya – Indonesia

2,3

2,3Jurusan Statistika, Institut Teknologi Sepuluh Nopember Jurusan Statistika, Institut Teknologi Sepuluh Nopember  Jl. Arief Rahman Hakim Surabaya – Indonesia Jl. Arief Rahman Hakim Surabaya – Indonesia

e-mail :

e-mail :11[email protected][email protected],,22[email protected][email protected],,33[email protected][email protected]

Abstrak.

Abstrak. Kalkulus merupakan mata kuliah yang cukup penting di ITS karena kalkulus merupakan ilmuKalkulus merupakan mata kuliah yang cukup penting di ITS karena kalkulus merupakan ilmu  yang

 yang mendasari mendasari perkembangan perkembangan teknologi teknologi modern, modern, mempunyai mempunyai peran peran penting penting dalam dalam berbagai berbagai disiplindisiplin ilmu dan mengembangkan daya pikir manusia. Oleh karenanya, mengetahui variabel apa saja yang ilmu dan mengembangkan daya pikir manusia. Oleh karenanya, mengetahui variabel apa saja yang berpengaruh

berpengaruh pada pencapaian nilai pada pencapaian nilai kalkulus adalah merupakan hal kalkulus adalah merupakan hal yang cukup penting. yang cukup penting. KarenaKarena variabel respon, yakni nilai kalkulus memiliki skala pengukuran ordinal maka pemodelan nilai variabel respon, yakni nilai kalkulus memiliki skala pengukuran ordinal maka pemodelan nilai Kalkulus I dilakukan dengan memanfaatkan pemodelan ordinal, diantaranya adalah regresi logistik  Kalkulus I dilakukan dengan memanfaatkan pemodelan ordinal, diantaranya adalah regresi logistik  ordinal dan model multilevel ordinal. Namun, untuk mengetahui variabel yang berpengaruh pada ordinal dan model multilevel ordinal. Namun, untuk mengetahui variabel yang berpengaruh pada kelulusan mahasiswa yang mengambil mata kuliah Kalkulus dapat diterapkan regresi logistik binner  kelulusan mahasiswa yang mengambil mata kuliah Kalkulus dapat diterapkan regresi logistik binner  maupun model multilevel binner. Model Multilevel dipilih karena ada dugaan awal, bahwa terdapat  maupun model multilevel binner. Model Multilevel dipilih karena ada dugaan awal, bahwa terdapat  variabilitas nilai yang besar antar fakultas di ITS. Untuk mendapatkan masing-masing model, variabilitas nilai yang besar antar fakultas di ITS. Untuk mendapatkan masing-masing model, dilakukan estimasi parameter, salah satunya adalah dengan metode maximum likelihood estimator  dilakukan estimasi parameter, salah satunya adalah dengan metode maximum likelihood estimator  (MLE). Dari hasil pengolahan data terdapat masing-masing 6 model pada logistik ordinal dan (MLE). Dari hasil pengolahan data terdapat masing-masing 6 model pada logistik ordinal dan multilevel ordinal serta masing-masing satu model logistik binner dan multilevel binner. Namun karena multilevel ordinal serta masing-masing satu model logistik binner dan multilevel binner. Namun karena  persentase

 persentase kesalahan kesalahan prediksi prediksi dari dari model model yang yang diperoleh diperoleh dari dari regresi regresi logistik logistik binner binner adalah adalah yangyang  paling

 paling rendah, rendah, maka maka model model yang yang dipilih dipilih digunakan digunakan dalam dalam menganalisis menganalisis variabel variabel yang yang berpengaruhberpengaruh  pada

 pada hasil hasil proses proses belajar belajar mengajar mengajar Kalkulus Kalkulus I I di di ITS ITS adalah adalah regresi regresi logistik logistik binner. binner. Dari Dari hasilhasil  pengujian

 pengujian parameter parameter secara secara individu, individu, diketahui diketahui hanya hanya 4 4 variabel variabel diantara diantara 7 7 variabel variabel yang yang signifikansignifikan mempengaruhi hasil belajar mengajar Kalkulus I mahasiswa ITS yaitu : pendidikan di sekolah mempengaruhi hasil belajar mengajar Kalkulus I mahasiswa ITS yaitu : pendidikan di sekolah menengah atas, asal daerah (Jawa Timur selain Surabaya dibandingkan Surabaya), nilai matematika menengah atas, asal daerah (Jawa Timur selain Surabaya dibandingkan Surabaya), nilai matematika SMA dan jenis kelamin.

SMA dan jenis kelamin.

 Kata

 Kata KunciKunci: Regresi Logistik Ordinal, Regresi Logistik Binner, Model Multilevel Ordinal, Model: Regresi Logistik Ordinal, Regresi Logistik Binner, Model Multilevel Ordinal, Model  Multilevel Binner, Nilai Kalkulus

 Multilevel Binner, Nilai Kalkulus

1.

1. Pendahuluan

Pendahuluan

Kalkulus merupakan ilmu universal yang mendasari perkemba

Kalkulus merupakan ilmu universal yang mendasari perkembangan tehnologi ngan tehnologi modern, mempunyamodern, mempunyai perani peran  penting

 penting dalam dalam berbagai berbagai disiplin disiplin ilmu ilmu dan dan mengembangkan mengembangkan daya daya pikir pikir manusia. manusia. Di Di ITS, ITS, mata mata kuliahkuliah kalkulus merupakan mata kuliah wajib di hampir semua jurusan dan bagi hampir seluruh mahasiswa kalkulus merupakan mata kuliah wajib di hampir semua jurusan dan bagi hampir seluruh mahasiswa  baru, karena sebagai bekal mempelaj

 baru, karena sebagai bekal mempelajari ilmu-ilmu lainnari ilmu-ilmu lainnya. Sangat diharapkan nilai untuk mya. Sangat diharapkan nilai untuk mata kuliah iniata kuliah ini minimal adalah D. Namun pada kenyataannya tidak semuanya mahasiswa dapat dinyatakan lulus pada minimal adalah D. Namun pada kenyataannya tidak semuanya mahasiswa dapat dinyatakan lulus pada  pengambilan p

 pengambilan pertama.ertama.

 Nilai

 Nilai kalkulus kalkulus di di ITS ITS dinyatakan dinyatakan dengan dengan grade grade A A sampai sampai dengan dengan E. E. Grade Grade ini ini merupakan merupakan penilaianpenilaian dengan skala ordinal. Sehingga analisa yang digunakan merupakan analisa data kategorik yang berskala dengan skala ordinal. Sehingga analisa yang digunakan merupakan analisa data kategorik yang berskala ordinal, seperti Regresi Logistik Ordinal dan Model Multilevel Biner. Namun, karena keputusan akhir  ordinal, seperti Regresi Logistik Ordinal dan Model Multilevel Biner. Namun, karena keputusan akhir  dari proses belajar mengajar adalah menyatakan bahwa seorang mahasiswa lulus atau tidak lulus dari proses belajar mengajar adalah menyatakan bahwa seorang mahasiswa lulus atau tidak lulus

(2)

kategorik dengan 2 kategori yaitu lulus atau tidak lulus Kalkulus I dengan Regresi Logistik Biner dan Model Multilevel Biner. Model multilevel dipilih karena diyakini dapat memperkecil kesalahan pada model dibandingkan pemodelan sederhana (Hedeker, 2004).

Berkaitan dengan paparan diatas, maka dapat dirumuskan tujuan dari penelitian adalah untuk mencari estimasi parameter dari model yang paling sesuai berdasarkan ketepatan dugaannya agar selanjutnya dapat dilakukan dianalisa mengenai variabel-variabel yang mempengaruhi hasil proses belajar mengajar  Kalkulus I di ITS.

2. Dasar Teori

2.1. Regresi Logistik Biner

Regresi logistik adalah prosedur pemodelan yang diterapkan untuk memodelkan variabel respon (Y) yang bersifat kategori berdasarkan satu atau lebih variabel prediktor (X), baik itu yang bersifat kategori maupun kontinu. Apabila variabel responnya terdiri dari 2 kategori yaitu Y=1 (sukses) dan Y=0 (gagal) maka metode regresi logistik yang dapat diterapkan adalah regresi logistik biner. Untuk satu buah objek penelitian, kondisi dengan 2 kategori tersebut mengakibatkan y berdistribusi Bernoulli. Fungsi distribusi peluang untuk y dengan parameter 

γ 

adalah P(Y=y)=

γ 

 y

(

1

γ 

)

1− ydengan y=0,1. Sehingga  probabilitas untuk masing-masing kategori adalah P(Y=1)=

γ 

dan P(Y=0)=1-

γ 

dengan E(y)=

γ 

, 0

γ 

1. Secara umum model probabilitas regresi logistik dengan melibatkan beberapa variabel  prediktor (x) dapat diformulasikan sebagai berikut :

E(y

 x

) = ( ... ) ) ... ( 2 2 1 1 0 2 2 1 1 0

1

 p  p  p  p  x  x  x  x  x  x

e

e

 β   β   β   β   β   β   β   β  + + + + + + + +

+

(1)

Fungsi

γ 

(

 x

)

merupakan fungsi non linier sehingga perlu dilakukan transformasi logit untuk memperoleh fungsi yang linier agar dapat dilihat hubungan antara variabel respon (y) dengan variabel prediktornya (x) (Hosmer dan Lemeshow, 2000). Bentuk logit dari

γ 

(

 x

)

dinyatakan sebagai

g

(

 x

)

, yaitu :

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

=

) ( 1 ) ( ln ) (  x  x  x g γ  γ  (2)

sehingga setelah persamaan (1) disubstitusikan pada (2) akan diperoleh :

 p  p x  x  x  x  x  β   β   β   β  γ  γ 

+

+

+

+

=

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

( ) ... 1 ) ( ln 0 1 1 2 2 (3)

Salah satu metode yang dapat digunakan dalam mengestimasi parameter model regresi logistik  adalah  Maximum Estimation Likelihood  (MLE). Pada dasarnya metode ini memberikan nilai estimasi  parameter 

 β 

dengan cara memaksimumkan fungsi likelihood-nya. Jika fungsi distribusi peluang untuk yi

adalah f(yi)= i i  y  y

1−

)

1

(

γ 

γ 

, maka fungsi likelihood untuk n pengamatan independen adalah :

 p  L β 0, β 1, β 2,...,β  =

{

[ ] [

]

}

= −

n i  y i  y i i  x i  x 1 1 ) ( 1 ) ( γ  γ  =

[

]

=

⎪⎭

⎪⎩

n i i  y i i  x  x  x i 1 ) ( 1 ) ( 1 ) ( γ  γ  γ  =

[

i

]

n  y i i  x  x  x n i i ) ( 1 ) ( 1 ) ( 1 γ  γ  γ 

= (4)

(3)

) ,..., , , ( ,..., , , ln L β 0  β 1 β 2  β  p

=

l β 0  β 1 β 2 β  p =

[

]

⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ −

= n i i  y i i  x  x  x i 1 ) ( 1 ) ( 1 ) ( ln γ  γ  γ  =

[

]

=

⎪⎭

⎪⎩

⎪⎭

⎪⎩

n i i  y i i  x  x  x i 1 ) ( 1 ) ( 1 ) ( ln γ  γ  γ  =

{

(

...

)

ln

[

1 ( ... )

]

}

1 2 2 1 1 0 2 2 1 1 0  x  x  p x p n i  p  p i  x  x  x e  y  β   β   β   β   β + β  + β  + +β  =

+

+

+

+

+

+

(5)

Estimasi parameter regresi logistik didapatkan dari turunan parsial pertama fungsi ln likelihood terhadap  parameter yang akan diestimasi kemudian disamakan dengan nol.

2.2 Regresi Logistik Ordinal

Regresi Logistik Ordinal merupakan salah satu metode statistika yang dipergunakan untuk  menganalisis data dengan variabel respon berskala ordinal. Sifat ordinal dituangkan dalam peluang kumulatif. Sebagaimana dalam model linier lainnya, sedangkan variabel independen dapat berupa peubah kontinu atau variabel yang berskala kategorik (Agresti, 1990). Apabila terdapat sampel random dari distribusi bersama (Y,X), dimana Y merupakan variabel respon berskala ordinal dan

X

= (X1, X2, …X p) adalah vektor variabel prediktor. Variabel respon Y dengan k kategori dapat dipandang sebagai k titik   pada variabel acak kontinu tak teramati (

~

). Sehingga bila Y=r dan

θ

r berada diantara

θ

0= -

dan

θ

k =

+

, maka dapat dinyatakan bahwa

θ

r-1<

~

<

θ

r  untuk r = 1,2,…, k-1, sedangkan -

=

θ

0<

θ

1< … <

θ

k =

dengan mengasumsikan bahwa variabel

~

ditentukan oleh variabel prediktor dengan bentuk linier   pada (2.4) dimana

β

= (

β

1, ...,

β

 p) adalah vektor koefisien.

~

=

θ

r +

β

X (6)

Selanjutnya, bila peluang klasifikasi

π

r (X) merupakan peluang klasifikasi yang didefinisikan sebagai P(Y=r|X) dari variabel respon Y pada nilai X’ = (X1, X2, …X p). maka peluang kumulatif dapat dinyatakan pada (2.2).

) | ( ... ) | 2 ( ) | 1 ( ) ' ( ) | ( X X X X β x r  Y  P Y  P Y  P F  r  Y  P

=

+

+

=

+

=

=

+

=

θ  (7)

Fungsi distribusi logistik didefinisikan sebagai :

Y  e Y  F  ~ 1 1 ) ~ ( −

+

=

Maka P(Y 

r |X)

=

(

θ 

+

β'X

)

= ( ' ) ) ' (

1

βX X β + +

+

r  r 

e

e

θ  θ  (8) Dengan r = 1,2,....,(k-1) Sehingga :

[

]

β x X X X ' ) | ( 1 ) | ( ln ) | ( logit

=

+

=

r  Y  P r  Y  P r  Y  P θ  (9)

Jika

θ

r-1<

θ

r maka model ini adalah model kumulatif dengan slope yang sama, yaitu model garis regresi yang berdasar pada peluang kumulatif kategori respon. Jika terdapat k  kategori respon, maka model logistik ordinal yang terbentuk adalah :

( )

⎟⎟

=

+

β'X

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

=

i i i θ  γ  γ  γ  1 ln logit i (10) Dengan i =1, 2,...(k-1)

Salah satu cara estimasi parameter yang dapat dipergunakan pada regresi logistik ordinal adalah dengan  Maximum Likelihood Estimator  (MLE). Konsepnya adalah memaksimumkan fungsi likelihood dari sampel random untuk menduga parameter (Hosmer dan Lemeshow, 2000). Ketika lebih dari satu observasi Y muncul pada nilai Xi, adalah cukup menyatakan jumlah obeservasi untuk setiap munculnya nilai r  pada Y dengan n , dimana r  adalah kategori tertentu dari variabel respon ( r =1,...,k )

(4)

(Kim, 2004). Maka [Yi,i=1,...,n] merupakan variabel random yang berdistribusi multinomial independen dengan E(Yi) = nriγ r (Xi), sedemikian hingga dapat dinyatakan :

R 1i= n1i (11) R 2i= n1i+ n2i (12) ...

=

=

k  r  r  n n 1 ri= R  (13)

Karena peluang kumulatif yang digunakan dalam menaksir parameter, maka likelihood  dapat ditulis sebagai perkalian (k-1) kategori, sehingga fungsi likelihood  dapat dinyatakan sebagai fungsi kepadatan  peluang bersama pada persamaan 2.20 (Kim, 2004).

( )

( ) ( | ) 1 i i n i i  f  y  f   Lθ,β

x x =

=

[

]

=

=

n i m  x  x b  x a 1

...

(14) dimana :

⎪⎭

⎪⎩

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

=

− i i i  R  R i i i  R i i a 1 2 1 2 1 2 2 1 γ  γ  γ  γ  γ 

⎪⎭

⎪⎩

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

=

− i i i  R  R i i i  R i i b 2 3 2 3 2 3 3 2 γ  γ  γ  γ  γ  ) 1 ( ) 1 ( ) 1 ( 1)i -(k 

⎪⎭

⎪⎩

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

=

− − − − ki k  i i k   R  R ki i k  ki  R ki m γ  γ  γ  γ  γ 

Selanjutnya untuk mendapatkan matrik informasi Fisher, dicari ln dari fungsi likelihood. Langkah awal estimasi parameter dari regresi logistik ordinal melalui MLE ( Maximum Likelihood Estimator) adalah dengan memaksimalkan turunan fungsi log likelihood  pada terhadap parameter. Untuk mendapatkan estimasi parameter dari kedua persamaan tersebut digunakanlah metode  Newton Raphson dengan iterasi Weighted Least Square.

2.3 Model Multilevel Biner

Pada saat data respon merupakan variabel kategorik yang terdiri dari 2 kategori, maka model multilevel yang dapat diterapkan adalah model multilevel biner. Sebagai contoh, bila y=1 menyatakan sukses dan y=0 menyatakan gagal, maka probabilitas akan terjadi sukses pada subyek ke- i dan level ke- j dinyatakan dengan P(Y=1) =

γ 

ijdan probabilitas akan terjadi gagal pada subyek ke- i dan level ke- j dinyatakan dengan P(Y=0) = 1-

γ 

ij. Sehingga varians Y dinyatakan sebagai var(Y ij)

=

γ ij(1

γ ij). Untuk  keperluan pemodelan multilevel maka digunakan model logit, sedemikian hingga untuk 1 variabel  prediktor dapat dinyatakan :

( )

 ⎠

 ⎞

⎝ 

⎛ 

=

ij ij ij it  γ  γ  γ  1 ln log = β 0 j

+

β ij xij

+

eij (15) Dan secara umum, model multilevel biner dapat dinyatakan pada (16).

{ }

 j ij  j  j ij ij ij 0 u0 1 ln logit

=

+

X

β

+

z

⎪⎭

⎪⎩

=

β  γ  γ  γ  (16)

Salah satu cara yang dapat digunakan untuk melakukan estimasi parameter pada model multilevel biner adalah dengan metode Maximum Likelihood Estimator (MLE) (Flom, 2008). Fungsi likelihood yang digunakan untuk menyelesaikan estimasi parameter pada model multilevel biner  dinyatakan pada (17).

(5)

(

)

(

ij ij  j  j

) ( )

 j  j i  j u g u  f u du  L , 2 | , , | , , 0 0 0 0 y x z

Y X z +∞ ∞ −

=

σ  γ  (17) dimana :

(

) ( )

ij  yij ij  y ij  j  j ij ij

u

g

y

|

x

,

z

,

0

=

γ 

1

γ 

1−

Selanjutnya PROC NLMIXED dengan iterasi Gaussian Quadrature digunakan untuk menyelesaikan integrasi pada (17).

2.4. Model Multilevel Ordinal

Pada saat data respon berskala ordinal, maka model multilevel linear atau yang dibahas pada model multilevel point skor tidak dapat langsung diterapkan. Oleh karenanya digunakan pendekatan model logit, sehingga variabel respon yang dinyatakan dengan

γ 

ij(k ) merupakan probabilitas subjek ke-i  pada level ke- j berada pada suatu tingkatan (Bauer dan Sterba, 2007). Tingkatan atau order dari variabel

respon dinotasikan dengan k, yaitu nilai berskala ordinal (k =1,2,3,...K). Selanjutnya dapat dinyatakan  bahwa

0

<

γ 

ij(1)

<

γ 

ij(2)

<

...

<

γ 

ij(K )

=

1

(Fielding, dkk, 2003).

Dengan menganalogikan model pada (2.21), untuk variabel respon

γ 

ij(k ) yang mengikuti distribusi multinomial dapat dinyatakan model logit untuk kasus data multilevel ordinal dinyatakan pada (18).

{ }

k  k   j ij k  ij k  ij ( ) u0 ) ( 1 ln logit

=

+

⎪⎭

⎪⎩

=

θ  γ  γ  γ  (18) dimana : k  θ  = intersep model (θ  ,1 θ  , …2 θ  )k −1

Jika terdapat sejumlah variabel prediktor, maka akan menambah parameter sehingga diperoleh model  pada (19 )

{ }

k  k  ij  j ij k  ij k  ij ( ) u0 ) ( 1 ln logit

=

+

+

⎪⎭

⎪⎩

=

θ  X β γ  γ  γ  (19)

Dan dengan bentuk umum, model pada (19), dapat dinyatakan dalam persamaan sebagaimana tertulis  pada (20).

{ }

k  ij ij  j ij k  ij k  ij

=

+

X

β

+

Z

u

⎪⎭

⎪⎩

=

θ  γ  γ  γ  ( ) ) ( 1 ln logit (20)

Salah satu cara yang dapat digunakan untuk melakukan estimasi parameter pada model multilevel adalah dengan metode Maximum Likelihood Estimator (MLE). Pfeffermann, Skinner, Holmes, Goldstein, Korn dan Graubard dalam Grili dan Pratesi (2004) menyatakan bahwa model multilevel ordinal seperti pada (2.40) dapat dinyatakan dalam bentuk linier melalui variabel laten untuk  mempermudah mendapatkan estimasi parameternya. Untuk model multilevel ordinal dengan 2 level, variabel respon yang berskala ordinal (Y) dengan k  tingkatan (k =1,2,...K) dinyatakan melalui variabel laten berskala kontinu

~

yang mengikuti model komponen varians pada (21) (Hedeker dan Gibbons, 1994). ij  j ij ij e Y ~

=

β'x

+

u

+

(21) dengan : xij : vektor kovariat

: vektor slope (parameter)

eij : variabel random pada unit sampel (level 1), diasumsikan IID dengan mean nol dan varians (

σ

2) tidak diketahui

u j : variabel random pada model level 2, diasumsikan IIDN dengan mean nol dan varians adalah satu

(6)

Variabel respon berskala ordinal, Y terhubung dangan variabel laten

~

melalui hubungan  pada persamaan (22) (Grili dan Pratesi, 2004; Hedeker, dkk, 2006).

} ~ {

}

{Y ij

=

γ 1

<

ij

γ  (22) Model pada (22) memuat batasan bahwa

γ 

0

γ 

1

...

γ 

1

γ 

(Hedeker, dkk, 2006). Sehingga, model probabilitas bersyarat respon pada level tertentu dengan syarat u jdinyatakan pada (23).

)

|

(

ij u j P

=

γ 

=

P(Y ~ij

γ |u j)

P(Y ~ij

γ 1|u j) (23) dimana : ]) [ ( ) | ] ' [ ( ) | ~ ( ' ,k  ij  j  j  j ij k  ij  j k  ij u F  u u P u Y  P

+

=

+

=

x β x β ε σ  σ  γ  γ  γ 

Dan

(

γ 

σ ,

[

β

σ '

x

ij

+

u

 j

])

merupakan fungsi penghubung (link function) yang diperoleh dari fungsi distribusi residual pada level pertama (

ε

ij/

σ

)

Misalkan terdapat yang merupakan vektor untuk semua parameter yang estimable meliputi

β

σ,

ω

σdan sebanyak K-2 batasan {

γ

σ,k : k = 2, …, K-1} dimana

γ

σ,1adalah sama dengan nol, maka dapat dinyatakan fungsi likelihood bersyarat untuk subjek pengamatan ke- i pada level ke- j seperti pada (24).

∏∏

= =

=

=

i ijk  n  j K  k  d   p  j ij  p  j i

P

1 1 0 0

,

)

[

(

|

,

)]

|

(

Y

 β 

 β 

 β 

β 

l (24)

Selanjutnya dicari fungsi likelihood marginal untuk kelompok ke- j, dimana ϕ  adalah fungsi kepadatan  peluang dari sebaran normal standar sehingga fungsi likelihood  marginal untuk kelompok ke- j juga dapat

dituliskan seperti pada (25).

∫∏

+∞ ∞ − =

=

 j n i ij  j

 L

u

u

du

 L

1

)

(

)

|

(

)

(

θ

θ

ϕ 

(25)

Estimasi parameter selanjutnya diperoleh dengan memaksimalkan fungsi pada (2.34) melalui iterasi Gaussian Quadrature (Grilli dan Pratesi, 2002; Grilli dan Pratesi, 2004) dengan bantuan PROC  NLMIXED pada software SAS .

3. Metodologi Penelitian

3.1 Sumber Data

Dalam penelitian ini digunakan data mahasiswa S1 ITS semester I tahun ajaran 2007/2008 yang diperoleh dari BAAK dan TPB-ITS.

3.2 Identifikasi Variabel

Menurut beberapa teori dan penelitian terdahulu, hal-hal yang dapat mempengaruhi nilai atau prestasi akademik siswa bisa berasal dari kondisi internal siswa maupun kondisi eksternal siswa. Dari informasi ini, maka dipilihlah beberapa variabel yang akan dianalisis terkait dengan evaluasi faktor-faktor yang mempengaruhi nilai kalkulus I mahasiswa strata I di ITS Surabaya. Secara umum, model hipotesis pada Gambar 1 menggambarkan dugaan sementara hubungan antar masing-masing variabel dengan nilai kalkulus I mahasiswa ITS.

Gambar 3.1. Model Hipotesis Hubungan Antar Variabel dengan  Nilai Kalkulus I Mahasiswa ITS

( K e m a m p . A k a d e m i k ) N i l a i M a t – S M A ( X3) H A S IL E V A L U A SI ( N i l a i /   P r e st a s i A k a d e m i k ) N i l a i K a l k u l u s I M h s . ( L i n g k . K e l u a r g a ) A s a l D a e r a h ( X2) ( L i n g k . P e n d i d i k a n ) P e n d i d i l a n S e b e lu m ( X1) J a l u r M a s u k ( X5) J e n is K e lam in ( X4) ( L i n g k . P e n d i d i k a n ) T i n g k a t P e n d i d i k a n /   g e l a r d o s e n ( X6) ( L i n g k . P e n d i d i k a n ) J u m l a h L a t i h a n / Q u i z ( X7) ( K e m a m p . A k a d e m i k ) N i l a i M a t – S M A ( X3) H A S IL E V A L U A SI ( N i l a i /   P r e st a s i A k a d e m i k ) N i l a i K a l k u l u s I M h s . ( L i n g k . K e l u a r g a ) A s a l D a e r a h ( X2) ( L i n g k . K e l u a r g a ) A s a l D a e r a h ( X2) ( L i n g k . P e n d i d i k a n ) P e n d i d i l a n S e b e lu m ( X1) J a l u r M a s u k ( X5) J e n is K e lam in ( X4) ( L i n g k . P e n d i d i k a n ) T i n g k a t P e n d i d i k a n /   g e l a r d o s e n ( X6) ( L i n g k . P e n d i d i k a n ) J u m l a h L a t i h a n / Q u i z ( X7)

(7)

3.3 Langkah-langkah Penelitian

Terkait dengan tujuan penelitian yang telah dikemukakan pada bagian Pendahuluan, maka beberapa tahapan diperlukan untuk dapat menjawab tujuan tersebut, yaitu :

a. Mencari estimasi parameter dari Regresi Logistik Ordinal dan Model Multilevel Ordinal a.1. Mencari estimasi parameter dari Regresi Logistik Ordinal, dengan langkah-langkah :

1. Mengumpulkan pengamatan dan mendefinisikan variabel respon (y) adalah nilai kalkulus I mahasiswa ITS dengan 7 kategori, sehingga ditetapkan k =7.

2. Menyelesaikan estimasi parameter dari turunan fungsi log likelihood  dengan metode  Newton  Raphson melalui iterasi Weighted Least Square pada software Minitab 14

3. Melakukan pengujian signifikansi model melalui uji serentak dan melakukan pengujian individu  pada parameter.

4. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.1.3.

a.2. Mencari estimasi parameter pada Model Multilevel Biner dengan langkah-langkah :

1. Menentukan variabel respon yij adalah nilai kalkulus I mahasiswa S1 tahun ajaran 2007/2008 yang berskala ordinal.

2. Menentukan model umum multilevel ordinal adalah seperti pada (2.25), dengan 7 kategori pada variabel respon sehingga ditetapkan k = 1, 2, 3, 4, 5, 6, 7.

3. Menetapkan banyaknya level adalah 2 dan banyaknya kelompok pada level 2 adalah 5.

4. Mencari estimasi parameter melalui iterasi Gaussian Quadratur dan bantuan program komputer : SAS PROC NLMIXED.

5. Melakukan pengujian signifikansi model dengan cara yang sama seperti pada langkah a.1.3. 6. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.2.4 dan

telah diuji pada langkah a.2.5 dan a.2.6.

 b. Mencari estimasi parameter dari Regresi Logistik Biner dan Model Multilevel Biner dengan langkah-langkah :

 b.1. Mencari estimasi parameter dari Regresi Logistik Biner, dengan langkah-langkah :

1. Mengumpulkan pengamatan dan mendefinisikan variabel respon (y) adalah hasil kalkulus I mahasiswa ITS dengan 2 kategori.

2. Menyelesaikan estimasi parameter dari turunan fungsi log likelihood  dengan metode  Newton  Raphson melalui iterasi Weighted Least Square pada software Minitab 14

3. Melakukan pengujian signifikansi model melalui uji serentak melakukan pengujian individu  pada parameter, untuk menguji peran dari masing-masing variabel prediktor.

4. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.1.3.

 b.2. Mencari estimasi parameter pada Model Multilevel Ordinal dengan langkah-langkah :

1. Menentukan variabel respon yij adalah hasil kuliah kalkulus I mahasiswa S1 tahun ajaran 2007/2008 yang berskala ordinal.

2. Menentukan model umum multilevel ordinal adalah seperti pada (2.29), dengan 2 kategori pada variabel respon.

3. Menetapkan banyaknya level adalah 2 dan banyaknya kelompok pada level 2 adalah 5.

4. Mencari estimasi parameter melalui iterasi Gaussian Quadratur dan bantuan program komputer : SAS PROC NLMIXED.

5. Melakukan pengujian signifikansi model dengan cara yang sama seperti pada langkah a.1.3. 6. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.2.4 dan

telah diuji pada langkah a.2.5 dan a.2.6.

c. Membandingkan besarnya kesalahan prediksi pada Regresi Logistik Biner, Regresi Logistik  Ordinal, Model Multilevel Biner dan Model Multilevel Ordinal, untuk memilih model yang paling sesuai, dengan mencari nilai dugaan untuk variabel respon (

 y

ˆ

) dari masing-masing model regresi logistik dan multilevel pada langkah a.1.4, a.2.6, b.1.4 dan b.2.6. Selanjutnya, dihitung persentase ketepatan dugaan perbedaan antara dugaan masing-masing model. Model yang dinyatakan memberikan dugaan lebih baik adalah model yang persentase selisih antara nilai dugaan dan nilai sebenarnya adalah yang terkecil.

(8)

4. Analisa Data dan Pembahasan

4.1 Deskripsi Data

Berdasarkan data yang diperoleh dari BAAK ITS, pada tahun ajaran 2007/2008 terdapat 1949 mahasiswa baru yang mengikuti mata kuliah Kalkulus I dan terbagi atas 39 kelas. Hasil dari proses  belajar mengajar Kalkulus I untuk 1945 mahasiswa tersebut, ditunjukkan pada Gambar 2.

 A   AB B BC C D E Category E 120; 6,2% D 358; 18,4% C 278; 14,3% BC 211; 10,8% B232; 11,9%  AB 366; 18,8%  A  380; 19,5%

Pie Chart of NI LAI_KALK

Gambar 2. Pie Chart Nilai Kalkulus I Mahasiswa ITS

tampak bahwa mahasiswa yang mendapatkan nilai rendah dan tidak dinyatakan lulus pada mata kuliah Kalkulus I sebanyak 120 mahasiswa atau sebanyak 6,2% dari total mahasiswa yang mengambil mata kuliah Kalkulus I pada tahun ajaran 2007/2008.

4.2. Perbandingan Hasil Estimasi Parameter

Dalam penelitian ini, parameter  β diestimasi dengan menggunakan metode  Maximum  Likelihood Estimation (MLE). Dari masing-masing metode, diperoleh estimasi β dan akhirnya dapat dihitung ketepatan prediksi dari masing-masing model. Perbandingan hasil estimasi parameter dari ke-empat metode disajikan pada Tabel 1.

Tabel 1 menunjukkan bahwa model logistik memberikan tingkat kesalahan klasifikasi lebih kecil daripada model multilevel. Ini berlaku pada data biner maupun data ordinal. Pada model ordinal, tingkat kesalahan klasifikasi tergolong besar (yakni diatas 70%). Kemungkinan yang menyebabkan hal ini adalah bahwa variabel-variabel prediktor yang dipakai dalam penelitian, bukan merupakan variabel utama yang mempengaruhi nilai Kalkulus I mahasiswa ITS. Sehingga model yang dihasilkan tidak cukup untuk  dapat menduga nilai Kalkulus I mahasiswa. Namun, untuk mengetahui variabel yang mempengaruhi kelulusan seorang siswa dari proses belajar mengajar Kalkulus I di ITS, model regresi logistik biner dan multilevel biner menghasilkan kesalahan prediksi kurang dari 10%. Karena, regresi logistik biner  memberikan tingkat kesalahan prediksi terkecil, maka selanjutnya untuk mengetahui variabel yang mempengaruhi hasil proses belajar mengajar Kalkulus I mahasiswa ITS digunakan regresi logistik biner.

Berdasarkan hasil estimasi dan pengujian parameter regresi logistik biner, diketahui terdapat 4 (empat) variabel prediktor yang mempengaruhi kelulusan untuk mata kuliah Kalkulus I di ITS, yaitu : - X1(Pendidikan di sekolah menengah atas), yaitu sekolah SMA dibandingkan selain SMA.

- X2(Asal Daerah), yaitu daerah asal Jawa Timur selain Surabaya dibandingkan daerah asal Surabaya dan daerah asal diluar Jawa Timur dibandingkan daerah asal Surabaya

- X3(Nilai Matematika di SMA)

(9)

Tabel 1. Perbandingan Koefisien dan Prosentase Kesalahan Prediksi Model

Parameter

ORDINAL BINER 

LOGISTIK MULTILEVEL LOGISTIK MULTILEVEL

Koefisien  p-value Koefisien  p-value Koefisien  p-value Koefisien  p-value Konstan (

θ

1) 2,17817 0,000 2,24900 0,005 0,27232 0,800 0,66100 0,5942 Konstan (

θ

2) 3,89308 0,000 4,01400 0,000 Konstan (

θ

3) 4,62948 0,000 4,78220 0,000 Konstan (

θ

4) 5,11564 0,000 5,29220 <0,0001 Konstan (

θ

5) 5,65063 0,000 5,85670 <0,0001 Konstan (

θ

6) 6,66713 0,000 6,92420 <0,0001 X1- Pendidikan di sekolah Menengah (1) SMA -0,64376 0,072 -0,76030 0,095 1,29585 0,029 1,10970 0,1506 X2- Asal Daerah (1) Jawa Timur  selain Surabaya -0,61966 0,000 -0,64610 0,003 0,80903 0,000 0,85150 0,0220 (2) Diluar  Jawa Timur  -0,28847 0,020 -0,43320 0,027 0,05935 0,813 0,15240 0,5831 X3- Nilai Matematika di SMA -0,49034 0,000 -0,43960 0,000 0,30061 0,000 0,23240 0,0412 X4- Jenis Kelamin (1) Laki-laki 0,54121 0,000 0,57370 0,003 -1,60677 0,000 -1,74580 0,0050 X5- Jalur  masuk  (1) SPMB -0,22234 0,01800 -0,73950 0,002 0,11726 0,614 0,76670 0,0612 X6- Tingkat  pendidikan/ gelar dosen (1) Master 0,16333 0,416 0,17920 0,415 -0,96732 0,121 -1,01570 0,1815 (2) Doktor/ Ph.D 0,48165 0,089 0,53210 0,131 -0,46248 0,580 -0,49940 0,5865 X7- Jumlah latihan/ quiz -0,02278 0,056 -0,02651 0,090 0,03960 0,177 0,04321 0,2198 % Kesalahan Prediksi 74,40 84,00 6,12 6,17

5. Kesimpulan dan Saran

5.1 Kesimpulan

Berdasarkan analisa pada Bab 4, diperoleh kesimpulan sebagai berikut :

1. Untuk dapat memprediksi keberhasilan seorang mahasiswa setelah mengikuti proses belajar  mengajar Kalkulus I di ITS, dipakai regresi logistik biner karena metode ini memberikan yang  persentase kesalahan prediksi lebih kecil dibandingkan model yang lainnya yaitu sebesar 6,12%. 2. Dari hasil estimasi parameter dengan regresi logistik biner diperoleh model berikut ini :

7 ) 2 ( 6 ) 1 ( 6 ) 1 ( 5 ) 1 ( 4 3 ) 2 ( 2 ) 1 ( 2 ) 1 ( 1 03960 , 0 46248 , 0 96732 , 0 11726 , 0 60677 , 1 30061 , 0 05935 , 0 80903 , 0 29585 , 1 27232 , 0 ) ( 1 ) ( ln  X   X   X   X   X   X   X   X   X   x  x

+

+

+

+

+

+

+

=

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

γ  γ 

(10)

3. Berdasarkan analisis regresi logistik biner, diketahui 4 variabel yang berpengaruh terhadap nilai Kalkulus I mahasiswa ITS, yaitu :

- X1(Pendidikan di sekolah menengah atas), yaitu sekolah SMA dibandingkan selain SMA. - X2 (Asal Daerah), yaitu daerah asal Jawa Timur selain Surabaya dibandingkan daerah asal

Surabaya.

- X3(Nilai Matematika di SMA)

- X4(Jenis Kelamin), yaitu jenis kelamin laki-laki dibandingkan perempuan 5.2 Saran

Berdasarkan hasil analisis yang telah dilakukan, diberikan beberapa saran untuk perbaikan  proses belajar mengajar Kalkulus I di ITS dan untuk penelitian selanjutnya, yaitu :

1. Karena asal pendidikan di sekolah menengah, nilai matematika berpengaruh terhadap kelulusan Kalkulus I mahasiswa, maka disarankan pembentukan kelas TPB didasarkan dari kedua variabel ini. Sebagai contoh, mahasiswa yang berasal dari selain SMA dikelompokkan agar mendapatkan kemampuan awal yang setidaknya sama dengan mahasiswa sekelasnya dan mendapatkan proses  perkuliahan lebih intensif untuk bisa mengejar ketertinggalan kemampuan matematika/ kalkulus yang

terjadi akibat adanya perbedaan kurikulum saat d i sekolah menengah atas.

2. Berdasarkan model regresi logistik ordinal dan model multilevel ordinal, diketahui bahwa kedua model tidak cukup untuk dapat dipakai menduga nilai Kalkulus I mahasiswa karena persentase kesalahan klasifikasi yang tergolong besar. Kemungkinan penyebab adalah variabel prediktor dalam  penelitian ini bukanlah variabel utama yang mempengaruhi nilai Kalkulus I mahasiswa ITS. Oleh karenanya, untuk penelitian selanjutnya disarankan menggunakan variabel-variabel lain yang terkait langsung dengan pengamatan proses belajar mengajar Kalkulus I di kampus dan diluar kampus serta  persepsi mahasiswa terhadap proses belajar mengajar yang berlangsung.

Daftar Pustaka

Agresti, A (1990), Categorical Data Analysis, John Wiley and Sons.Inc, New York.

Bauer, D.J. dan Sterba, S.K. (2007), Multilevel Models for Ordinal Outcomes in Longitudinal and Clustered Data, http://www.unc.edu/~dbauer/conference/Bauer%20&%20Sterba%20APA.pdf , (didownload pada 30-05-2008, jam 10 .28 WIB).

Fielding A., Yang M., dan Goldstein H. (2003), “Multilevel ordinal models for examination grades ”, Statistical modelling, vol. 3, No.2, hal. 127 - 153.

Goldstein H. (2003), Multilevel statistical models, Arnold Publishers, London.

Grilli, L. dan Pratesi, M. (2002), “Weighted Estimation in Multilevel Ordinal Models to Allow for  Informativeness of the Sampling Design”, Dipartimento di Statistica G. Parenti Working Paper, 2002/01, Università degli Studi di Firenze.

Grili, L. dan Pratesi, M. (2004), “Weighted Estimation in Multilevel Ordinal and Binary Models to Presence of  Informative Sampling Designs “, Statistics Canada, Catalogue No.1-001, Vol.30, No.1, hal. 93-103. Hedeker, D. dan Gibbons, RD (1994), “A Random-Effect Ordinal Regression Model for Multilevel Analysis”,

 Biometrics, Vol. 50, No.4, hal.933-944.

Hedeker D. (2004), Multilevel Models for Ordinal and Nominal Variables, http://tigger.uic.edu/~hedeker/ml.html , (didownload pada 29-05-2008, jam 20.28 WIB).

Hosmer, D.W. dan Lemeshow, S. (2000), Applied Logistic Regression, second edition, John Wiley & Sons, USA Kim, H.S (2004), Topics In Ordinal Logistic Regression And Its Applications, Disertasi, Texas A&M University,

Gambar

Gambar 3.1. Model Hipotesis Hubungan Antar Variabel dengan  Nilai Kalkulus I Mahasiswa ITS
Gambar 2. Pie Chart Nilai Kalkulus I Mahasiswa ITS
Tabel 1. Perbandingan Koefisien dan Prosentase Kesalahan Prediksi Model

Referensi

Dokumen terkait

Implementasi Metode Penalized Maximum Likelihood Estimation pada Model Regresi Logistik Biner ; Miftahus Sholihin, 101810101001; 2014; 58 halaman; Jurusan Matematika

Estimasi parameter regresi logistik biner berdasarkan hasil pengujian independensi sehingga variabel yang digunakan pada analisis regresi logistik biner yaitu

Pada laporan ini akan dibahas mengenai keadaan kelahiran prematur menggunakan model regresi logistik biner dengan data yang diperoleh dari Rumah

Sehingga variabel yang digunakan dalam model regresi logistik biner adalah variabel-variabel yang memiliki nilai signifikansi kurang dari alfa (0,05) atau variabel

Untuk tahap prediksi perubahan tutupan lahan dilakukan dengan analisis spasial regresi logistik. Regresi logistik digunakan untuk memperkirakan besarnya probabilitas

Model regresi logistik biner merupakan salah satu model regresi logistik yang digunakan untuk menganalisa hubungan antara variabel satu variabel respon dan

Putuhena, Kampus Unpatti, Poka, Ambon, Indonesia e-mail: [email protected] Abstrak Regresi logistik ordinal dengan efek interaksi merupakan model regresi yang dapat

Hasil klasifikasi model regresi logistik biner tanpa peubah usia dan jenis kelamin pada data training Keadaan Sesungguhnya Prediksi TOP NEW TOP 1988 11862 NEW 1379 64771 Akurasi