369
HIERARCHICAL LINIER MODELS (HLM) PADA DATA
BERSTRUKTUR HIERARKI
Diana Kartikawati
Jurusan Matematika, F.MIPA, Universitas Brawijaya
Email : [email protected]
Abstrak. HLM merupakan teknik analisis yang tepat untuk analisis data tersarang atau berstruktur hirarki di mana pengamatan individu tersarang dalam kelompok. Menganalisis data yang bersifat hirarki dengan HLM dapat digunakan untuk memperoleh informasi mengenai keragaman pada level kelompok yang tidak dapat diketahui jika analisis yang digunakan adalah model regresi linier sederhana. Penerapan HLM dalam disiplin ilmu pendidikan misalnya mengenai intelegensi dan masalah status sosial ekonomi siswa terhadap nilai ujian bahasa, di mana siswa tersarang di dalam sekolah. Penelitian ini bertujuan membentuk beberapa model HLM 2 level dan menentukan model terbaik pada kasus pengaruh IQ dan Status sosial ekonomi terhadap nilai ujian bahasa. HLM 2 level terdiri dari 2 submodel yaitu model level 1 dan model level 2, gabungan 2 submodel tersebut menjadi bentuk model kombinasi yang terdiri dari efek tetap dan efek acak. Model-model HLM yang dibangun adalah Model-model random intersept level 1, model random intersept level 2 dan model random coefficient. Kumpulan data hirarki dibedakan dari level 1 yang tersarang dalam kelompok pada level 2, dalam hal ini siswa dikelompokkan dalam sekolah. Data yang digunakan pada penelitian ini terdiri dari peubah respon hasil nilai ujian dengan dua peubah prediktor level 1 yaitu IQ dan status sosial ekonomi siswa, satu peubah prediktor level 2 yaitu peubah rata-rata status sosial ekonomi masing-masing sekolah. Hasil pengujian dengan deviance menunjukkan model terbaik untuk kasus ini, adalah model random coefficient.
Kata Kunci :Hierarchical Linier Model, Data Berstruktur Hierarki .
1. PENDAHULUAN
Data berkelompok yaitu kumpulan data dengan peubah respon diukur sekali untuk setiap subjek (unit analisis) dan unit analisis dikelompokkan ke dalam, atau tersarang di dalam atau dikelompokkan ke dalam kelompok unit (West dkk., 2007) sehingga unit analisis dan kelompok unit merupakan suatu sistem hirarki atau merupakan suatu struktur tersarang. Data berstruktur hirarki merupakan kelompok unit berkumpul yang sering dijumpai pada penelitian ilmu-ilmu sosial, karena pada penelitian sosial terpusat pada masalah bagaimana hubungan antara individu dengan lingkungannya. (Hox, 2002).
Data hirarki melanggar asumsi kebebasan karena dalam struktur hirarki, individu di dalam kelompok lebih homogen, sebab individu-individu di dalam kelompok cenderung untuk berbagi karakteristik tertentu. Maka secara umum model regresi linier klasik kurang tepat digunakan untuk menganalisis data dengan struktur hirarki (Osborne, 2000 ). Oleh karena itu perlu adanya strategi pemodelan yang lebih baik. Salah satu pemodelan yang dapat digunakan untuk teknik analisis data berstruktur hirarki yaitu Hierarchical Linear Model (HLM). Dengan menggunakan HLM dapat mengetahui informasi mengenai keragaman pada level-2 yang tidak dapat diketahui jika analisis yang digunakan adalah model regresi linier sederhana yang tanpa memperhatikan struktur hirarki.
2. TINJAUAN PUSTAKA
Data berstruktur hirarki merupakan kelompok unit berkumpul. Kumpulan data hirarki dibedakan dari level-1 yang tersarang dalam kelompok pada level lebih tinggi. Banyak penelitian sosial melibatkan data berstruktur hirarki. Sebagai contoh pekerja dan perusahaan adalah unit analisis, di mana peubah diukur pada kedua level (Heck dkk., 2010).
Hierarchical Linear Model (HLM) telah disebut sebagai model random coefficient, model linier
multilevel, model covariance component, dan model unbalanced dengan efek acak tersarang. istlah HLM menangkap dua fitur dalam mendefinisikan model. Pertama, data yang sesuai untuk model berstruktur hirarki, dengan unit level pertama tersarang dalam unit level kedua, unit level kedua tersarang di dalam unit level ketiga, dan seterusnya. Kedua, parameter model tersebut terlihat seperti memiliki struktur hirarki (Raudenbush dan Bryk, 1993).
Model dua level terdiri dari dua submodel yaitu pada level 1 dan level 2. Model linier hirarki memungkinkan untuk penelitian secara simultan hubungan dalam level hirarki, serta hubungan di seluruh level. Dua model yang dikembangkan agar mencapai hal ini: salah satu yang mencerminkan hubungan dalam unit level yang lebih rendah, dan yang kedua bagaimana hubungan model dalam unit level yang lebih rendah bervariasi antara unit (Woltman dkk., 2012). Gabungan model level 1 dan
level 2 merupakan model linier campuran (mixed linear model ) dengan koefisien regresi fixed (tetap)
dan random (acak)(Raudenbush and Bryk, 1993).
Model matematis berikut adalah model level 1 dengan satu peubah prediktor yaitu:
(1)
Pendugaan parameter (koefisien regresi dan komponen ragam) dalam pemodelan hirarki dilakukan dengan menggunakan metode Maximum Likelohood (ML), yaitu prosedur pendugaan umum, dengan memaksimalkan fungsi kemungkinan (Hox, 2010).
Menurut Goldstein (1989) prosedur ML menghasilkan penduga yang bias dari parameter acak. Hal ini menjadi penting dalam contoh yang kecil, dan dapat menghasilkan penduga yangtak bias jika digunakan Restricted Maximum Likelihood (REML) di mana modifikasi dilakukan pada fungsi profile
log-likelihood yang disebut dengan fungsi Restricted Log-Likelihood (Raudenbush and Bryk, 1993).
∑ | |
Metode maksimum likelihood memberikan suatu ukuran untuk menentukan seberapa baik model cocok dengan data yang disebut dengan Deviance. Secara umum deviance didefinisikan sebagai , di mana adalah nilai dari fungsi likelihood saat mencapai konvergen. Semakin kecil nilai deviance model tersebut dikatakan semakin cocok (Hox, 2002).
3. METODOLOGI
3.1 Sumber Data
Data yang digunakan pada penelitian ini merupakan data sekunder yaitu data hasil ujian bahasa hasil survei sekolah mengenai tingkat intelegensi dan status sosial ekonomi terhadap nilai ujian bahasa di mana siswa tersarang di dalam sekolah. Data tersebut diperoleh dari
http://www.statisticalinnovations.com.
3.2 Metode Analisis
Tahap pertama melakukan ekplorasi data secara grafis, kemudian membangun pemodelan HLM yaitu pertama membangun model model null, model randomintersept level 1, randomintersept level
2, randomcoefficient dan model randomcoefficient dengan interaksi. Kedua menduga parameter dari
model yang telah dibangun dengan metode Maximum Likelihood. Metode ML yang digunakan adalah metode REML. Perhitungan menggunakan software R 2.14 dan SPSS. Kemudian membandingkan model-model tersebut menggunakan pengujian deviance untuk memperoleh model terbaik. Terakhir menentukan keragaman yang dapat dijelaskan pada setiap level menggunakan koefisien determinasi.
4. HASIL DAN PEMBAHASAN
Langkah pertama dalam analisis bertingkat biasanya adalah untuk mengembangkan model dasar yaitu model unconditional means. Pengujian ini digunakan untuk melihat pengaruh kelompok
2). Model unconditional means digunakan untuk menghitung Interclass correlation (ICC). Berdasarkan hasil perhitungan diperoleh nilai ICC sebesar 0.233, artinya proporsi keragaman pada level sekolah sebesar 23.3%.
HLM model dibangun dalam 5 proses yaitu membangun model null, model random intersept
level 1, randomintersept level 2, randomcoefficient, dengan model sebagai berikut:
Tabel 1. Hasil pendugaan parameter model-model HLM
Parameter Model Random
Random Intersept
RandomIntersept Level 1
Level 2
CoefficientEfek tetap
Intersep 40.278** 40.536** 40.526** IQ 2.195** 2.195** 2.240** SSE 0.166** 0.166** 0.164** AGG_SSE - 0.367** 0.351** Efek acak
Intersep 22.399** 17.188** 17.110** Residual 40.091 40.058 39.382 IQ - - 0.193**
** Parameter yang signifikan
Ketiga model yang telah dibangun akan dibandingkan untuk menentukan model yang terbaik pada kasus pengaruh IQ dan status sosial ekonomi terhadap nilai ujian bahasa. Metode maksimum
likelihood memberikan suatu ukuran untuk menentukan seberapa baik model ukuran tersebut adalah
Deviance. Pemilihan model terbaik dapat dijelaskan melalui tabel sebagai berikut:
Tabel 2. Nilai deviance setiap model
Model Deviance P-value
Model Random intersept level 1 15229.630
Model Random intersept level 2 15196.472 <0.000 Model Random Coefficient 15185.740 0.005
Berdasarkan nilai deviance Model random coefficient merupakan model yang terbaik pada kasus ini. Model random coefficient memiliki nilai deviance paling kecil. Sehingga dapat disimpulkan bahwa model randomcoefficient merupakan model terbaik.
Jadi model yang terbentuk adalah : Model level 1
Model level 2
( )
Kemudian subtitusikan model level 2 ke level 1 sehingga diperoleh persamaan akhir untuk model kombinasi adalah:
( )
Berdasarkan hasil persamaan untuk model kombinasi diketahui rata-rata status ekonomi sekolah memiliki hubungan yang positif dengan nilai ujian bahasa, peubah IQ dan status sosial ekonomi siswa secara signifikan berpengaruh terhadap nilai ujian bahasa. Sehingga dengan adanya pengaruh antara IQ dan status sosial ekonomi terhadap hasil ujian bahasa memberikan pemahaman bahwa dengan skor IQ dan status sosial ekonomi yang tinggi dapat meningkatkan hasil nilai ujian siswa. Untuk mengetahui seberapa besar keragaman peubah respon yang dapat dijelaskan oleh peubah
prediktor yang terdapat dalam model yaitu dengan koefisien determinasi. Untuk memperoleh koefisien determinasi dengan menggunakan nilai dugaan komponen ragam.
Level 1
Level 2
Pada level 1 terlihat bahwa keragaman yang dapat dijelaskan oleh peubah IQ dan status sosial ekonomi siswa sebesar 37.9%, sedangkan pada level 2 keragaman yang dapat dijelaskan oleh rata-rata status sosial ekonomi pada setiap sekolah sebesar 12.4%. Keragaman antara rata-rata-rata-rata status sosial ekonomi secara umum dapat disebabkan oleh adanya perbedaan kondisi status sosial ekonomi siswa antar sekolah. Total nilai keragaman pada level 1 dan keragaman pada level 2 sebesar 50.3% belum cukup menjelaskan hasil nilai ujian bahasa siswa, di mana sebesar 49,7% keragaman dijelaskan oleh peubah-peubah prediktor lain yang tidak dilibatkan dalam model. Peubah-peubah tersebut dapat berada pada level siswa maupun level sekolah.
5. KESIMPULAN
Berdasarkan hasil pengujian menggunakan nilai deviance menunjukkan model yang terbaik pada kasus ini adalah model random coefficient. Metode yang dapat digunakan untuk menganalisis data berstruktur hirarki yaitu dengan menggunakan HLM, yang dapat mengatasi kekurangan dalam analisis regresi klasik ketika data yang digunakan adalah data berstruktur hirarki.
DAFTAR PUSTAKA
Goldstein, H., (1989), Restricted Unbiased Iterative Generalised Least Square Estimation, Jurnal
Biomatrika,76, hal. 622-23.
Heck, R., Thomas S.L., dan Tabata L., (2010), Multilevel and Longitudinal Modeling with IBM
SPSS, Taylor & Francis, New York.
Hox. J.J., (2002), Multilevel Analysis: Techiques and Applications, Lawrence Erlbaum Asscociated Inc., New Jersey.
Osborne, J.W., (2000), Advantages of Hierarchical Linear Modeling, Practical Assessment, Research, and Evaluation, A Peer-Reviewed Electronic Journal, 7, hal. 1-3.
Raudenbush, S. W., (1993), Hierarchical Linear Models: Applications and Data Analysis Methods,
First Edition, Sage, Newbury Park.
Raudenbush, S. W. dan Bryk A.S., (2002), Hierarchical Linear Models: Applications and Data
Analysis Methods, First Edition, Sage, Newbury Park.
West, B.T., Welch K.B. dan Galechi A.T., (2007), Linear Mixed Models: A Practical Guide Using
Statistical Software, Chapman & Hall, Boca Raton.
Woltman, H., Andrea F., Christine J.M. dan Meredith R., (2012), An Introduction to Hierarchical Linear Modeling, Tutorial in Quantitative Methods for Psychology, 8, hal. 52-69.
Tantular, Aunuddin B. dan Wijayanto H., (2009), Pemilihan Model Regresi Linier Multilevel Terbaik,
Forum Statistika dan Komputasi, 14, hal.1-7