BAB IV HASIL PENELITIAN DAN PEMBAHASAN

(1)

23

BAB IV

HASIL PENELITIAN DAN PEMBAHASAN

4.1. Pengujian Signifikansi Parameter a. Uji serentak parameter regresi logistik

Uji serentak adalah uji yang mempunyai fungsi dimana untuk mengetahui signifikansi parameter pada konstanta secara keseluruhan. Dibawah ini adalah tabel yang menggambarkan hasil dari uji serentak dengan Hipotesis :

∶ = = . . . = = 0 ∶ Paling tidak ada satu ≠ 0

Tabel 4.1 uji omnibus koefisien model Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 1

Step 595.388 9 .000

Block 595.388 9 .000

Model 595.388 9 .000

Berdasarkan tabel 4.1 diperoleh nilai signifikansi model sebesar 0.000 karena nilai ini lebih kecil dari 5% maka tolak H0 sehingga disimpulkan bahwa

variabel bebas yang digunakan, secara bersama-sama berpengaruh terhadap jenis breast cancer terhadap variabel prediktornya atau ada salah satu variabel prediktor yang berpengaruh.

Pembentukan model pada uji serentak bisa dilihat pada tabel 4.1 Pada uji diharapakan H0 akan ditolak sehingga variabel yang sedang di uji masuk

(2)

kedalam model. Berdasarkan tabel 4.1 dapat dilihat variabel mana saja yang berpengaruh signifikan sehingga bisa dimasukkan ke model. Jika signifikan lebih kecil 5% maka H0 ditolak.

b. Uji parsial

Uji parsial ini berkebalikan dengan uji serentak, salah satu fungsi dari uji parsial adalah untuk mengetahui signifikansi parameter konstanta secara individu. Dimana dapat ditampilkan pada tabel dibawah ini dengan hipotesis

∶ = 0

∶ ≠ 0 ;j = 1,2,…,p

Tabel 4.2 Estimasi Parameter Variables in the Equation

B S.E. Wald df Sig. Exp(B)

Step 1a VAR00001 .522 .134 15.137 1 .000 1.685 VAR00002 -.063 .196 .102 1 .749 .939 VAR00003 .336 .211 2.544 1 .111 1.399 VAR00004 .219 .117 3.505 1 .061 1.245 VAR00005 .108 .155 .485 1 .486 1.114 VAR00006 .388 .093 17.333 1 .000 1.474 VAR00007 .302 .181 2.793 1 .095 1.352 VAR00008 .145 .109 1.780 1 .182 1.156 VAR00009 .504 .315 2.557 1 .110 1.656 Constant -8.893 1.034 73.996 1 .000 .000

a. Variable(s) entered on step 1: VAR00001, VAR00002, VAR00003, VAR00004, VAR00005,

(3)

Tabel 4.2 untuk uji parsial bisa dilihat pada nilai signifikansi mana yang nilainya lebih besar dari alfa. Nilai signifikansi yang sesuai model pada tabel 4.2 ada 2 yaitu pada VAR00001 dan VAR00006, dimana kedua variabel itu dijelaskan oleh jenis kanker antara lain untuk VAR00001 adalah Clump Thickness dan VAR00006 adalah

bare nuclei.

4.2 Uji kesesuaian model

Uji ini dilakukan untuk mengetahui apakah ada perbedaan antara hasil observasi dengan kemungkinan hasil prediksi model. Berdasarkan model regresi logistik diatas untuk selanjutnya pada uji kesesuaian model dapat dilihat pada tabel 4.3

Tabel 4.3 Uji hosmer dan lemeshow Hosmer and Lemeshow Test

Step Chi-square Df Sig.

1 9.429 8 .307

Tabel Hosmer and Lemeshow Test di atas juga dapat menguji kelayakan model serentak, hipotesis yang digunakan sebagai berikut:

H0 : Model sesuai (tidak ada perbedaan yang signifikan antara hasil pengamatan

dengan prediksi model)

H1 : Model tidak sesuai (ada perbedaan yang signifikan antara hasil pengamatan

dengan prediksi model) Tolak H0 jika nilai sig < 0,05

Nilai Chi-Square mendekati 9.429 dengan nilai signifikan sebesar 0.307 maka terima H0, sehingga dapat disimpulkan bahwa model yang dihasilkan pada regresi

(4)

bebas. Dengan kata lain tidak terdapat perbedaan yang signifikan antara hasil pengamatan dengan prediksi model karena terlihat dari tabel bahwa nilai sig = 0.307 yang berarti lebih dari 0,05 (terima H0). Dengan tingkat keyakinan 95 % dapat diyakini

bahwa model regresi logistik yang digunakan telah cukup mampu menjelaskan data/sesuai.

Tabel 4.4 Tabel kontingensi Uji hosmer dan Lemeshow Contingency Table for Hosmer and Lemeshow Test

Jenis Breast Cancer = 2 Jenis Breast Cancer = 4 Total

Observed Expected Observed Expected

Step 1 1 53 52.883 0 .117 53 2 53 52.818 0 .182 53 3 53 52.687 0 .313 53 4 54 53.419 0 .581 54 5 53 51.923 0 1.077 53 6 48 49.068 5 3.932 53 7 10 13.218 43 39.782 53 8 3 .841 50 52.159 53 9 0 .130 53 52.870 53 10 0 .012 52 51.988 52

Berdasarkan tabel 4.4 dapat dilihat frekuensi amatan dan harapan dari data, bahwa pada observasi 1 untuk kasus jenis breast cancer jinak berdasarkan pengamatan sejumlah 53 yang didiagnosa adalah 52 sehingga dapat disimpulkan bahwa selisih keduanya tidak terlalu jauh sehingga model bisa dikatakan sesuai. Sedangkan pada

(5)

observasi 1 untuk kasus jenis breast cancer ganas berdasarkan pengamatan sejumlah 0 yang didiagnosa adalah 0,1 sehingga dapat disimpulkan bahwa model tidak sesuai.

4.3 Interpretasi Koefisien Parameter a. Interpretasi odds ratio

Nilai odds ratio ini juga disediakan oleh tabel “variables in the equation”pada kolom Exp(B):

Tabel 4.5 Estimasi Parameter Variables in the Equation

B S.E. Wald df Sig. Exp(B)

Step 1a VAR00001 .522 .134 15.137 1 .000 1.685 VAR00002 -.063 .196 .102 1 .749 .939 VAR00003 .336 .211 2.544 1 .111 1.399 VAR00004 .219 .117 3.505 1 .061 1.245 VAR00005 .108 .155 .485 1 .486 1.114 VAR00006 .388 .093 17.333 1 .000 1.474 VAR00007 .302 .181 2.793 1 .095 1.352 VAR00008 .145 .109 1.780 1 .182 1.156 VAR00009 .504 .315 2.557 1 .110 1.656 Constant -8.893 1.034 73.996 1 .000 .000

a. Variable(s) entered on step 1: VAR00001, VAR00002, VAR00003, VAR00004, VAR00005,

VAR00006, VAR00007, VAR00008, VAR00009.

Berdasarkan hasil taberl 4.5 di atas kita dapat menginterpretasikan Odds ratio sebagai berikut:

(6)

1. Exp (B) pada observasi 1 artinya bahwa seseorang yang memiliki Clump

Thickness cenderung berisiko terkena breast cancer jinak sebesar 1.6 kali

dibandingkan yang terkena breast cancer ganas.

2. Exp (B) pada observasi 2 artinya bahwa seseorang yang memiliki Uniformity of

Cell size cenderung berisiko terkena breast cancer jinak sebesar 0.9 kali

3. Exp (B) pada observasi 3 artinya bahwa seseorang yang memiliki Uniformity of

Cell shape cenderung berisiko terkena breast cancer jinak sebesar 1.3 kali

4. Exp (B) pada observasi 4 artinya bahwa seseorang yang memiliki Marginal

Adhesion cenderung berisiko terkena breast cancer jinak sebesar 1.2 kali

5. Exp (B) pada observasi 5 artinya bahwa seseorang yang memiliki Single

epithelial cell size cenderung berisiko terkena breast cancer ganas sebesar 1.1

kali dibandingkan yang terkena breast cancer jinak.

6. Exp (B) pada observasi 6 artinya bahwa seseorang yang memiliki bare nuclei cenderung berisiko terkena breast cancer jinak sebesar 1.4 kali dibandingkan yang terkena breast cancer ganas.

7. Exp (B) pada observasi 7 artinya bahwa seseorang yang memiliki Bland

Chromatin cenderung berisiko terkena breast cancer jinak sebesar 1.3 kali

8. Exp (B) pada observasi 8 artinya bahwa seseorang yang memiliki Normal

nucleoli cenderung berisiko terkena breast cancer jinak sebesar 1.1 kali

(7)

9. Exp (B) pada observasi 9 artinya bahwa seseorang yang memiliki mitosis cenderung berisiko terkena breast cancer jinak sebesar 1.65 kali dibandingkan yang terkena breast cancer ganas.

Berdasarkan Tabel 4.5 dari variabel variabel respon untuk peluang besar yang terkena breast cancer adalah padaClump Thickness karena mempunyai nilai yang paling besar yaitu sebesar 1.685 dibanding dengan nilai dari variabel-variabel lain.

b. Model regresi logistik biner

Setelah dilakukan pengujian serentak, maka diperoleh model regresi logistik sebagai berikut:

g (x)= -8.893 + 0.522 x1 – 0.063x2 + 0.336x3 +0.219x4 +0.108x5 +0.388x6 +0.302x7 +

0.145x8+ 0. 504x9

dan model regresi logistiknya adalah:

( ) =

. . . .

1 + . . . .

Model dari regresi logistik diatas bisa disimpulkan bahwa peluang seseorang untuk terkena breast cancer jinak dipengaruhi oleh faktor Clump Thickness sebesar 0.522,

Uniformity of cell size sebesar -0.063, Uniformity of cell shape sebesar 0.336, Marginal Adhesion sebesar 0.219, Single Epithelial cell size sebesar 0.108, Bare nuclei

sebesar 0.388, Bland chromatin sebesar 0.302, Normal nucleoli sebesar 0.145, Mitosis sebesar 0.504.

(8)

c. Model summary

Tabel 4.6 Model summary

Model Summary

Step -2 Log likelihood Cox & Snell R Square

Nagelkerke R Square

1 110.066a .675 .917

a. Estimation terminated at iteration number 8 because parameter estimates changed by less than .001.

Cox & Snell R Square merupakan ukuran yang mencoba meniru ukuran R Square pada multiple regression yang didasarkan pada teknik estimasi likelihood dengan nilai maximum kurang dari 1 sehingga sulit untuk diinterpretasikan. Oleh karena itu, Nagelkerke R Square yang merupakan modifikasi dari cox & Snell di mana nilainya bervariasi dari 0-1, akan lebih mudah untuk diinterpretasikan sebagaimana interpretasi atas R Square pada multiple regression atau Pseudo R-Square dalam multinominal logistik regression.

Berdasarkan tabel model summary diatas menunjukkan nilai -2 log Likelihood sebesar 110.066 dimana nilai tersebut sangat besar. Selain itu dari nilai Nagelkerke R-Square sebesar 0.917 atau 91% maka variabilitas model penyakit breast cancer dapat dijelaskan oleh variabel bebas sebesar 91%, sedangkan sisanya akan dijelaskan oleh variabel lain.

4.4 Ketepatan Klasifikasi

Setelah dilakukan interpretasi koefisien, maka langkah selanjutnya menganalisis ketepatan klasifikasi model. Berikut ini hasil tabel klasifikasi:

(9)

Tabel 4.7 Tabel klasifikasi Classification Tablea

Observed Predicted

Jenis Breast Cancer Percentage

Correct

2 4

Step 1

Jenis Breast Cancer

2 316 11 96.6

4 11 192 94.6

Overall Percentage 95.8

a. The cut value is .500

Dari tabel ketepatan klasifikasi model diperoleh hasil responden jenis breats

cancer dengan kategori jinak dan diprediksi jinak ada 316 sedangkan yang berjenis

jinak tetapi diprediksi ganas ada 11. Responden yang berkategori ganas tetapi diprediksi jinak ada 11, sedangkan untuk responden yang mempunyai breast cancer ganas dan diprediksi ganas ada 192. Sehingga secara keseluruhan ketetapan klasifikasi model regresi logistik biner untuk kategori breats cancer jinak dan ganas sebesar 95.8%.

Penelitian yang sama pada kasus breast cancer yang dilakukan Darsyah (2013) dengan menggunkan Support Vector Machine (SVM) menghasilkan akurasi sebesar 99%. Dari hasil kedua metode SVM dan regresi logistik biner diketahui bahwa metode SVM memiliki tingkat akurasi lebih tinggi tetapi hasil yang diperoleh dari metode regresi logistik biner tidak berbeda jauh dari Support Vector Machine.