BAB III ANALISIS DAN DESAIN
3.3 Data
3.2.1 Pengolahan Data Awal
Data yang digunakan dalam sistem yang akan dibangun ini adalah data penerimaan siswa SMAK Frateran Podor pada tahun 2008 sampai dengan tahun 2010. Data ini diperoleh dari ketua tim penyeleksian siswa SMAK Frateran Podor. Data tersebut diberikan dalam bentuk fisik yang terdiri dari data master keseluruhan calon siswa yang mendaftar dan data calon siswa yang diterima. Kedua ada tersebut akan digunakan dalam proses penambangan data. Data siswa tersebut memiliki atribut antara lain Nomor, Nama, No. Telepon, Tempat Tanggal Lahir, Alamat Asal, Alamat di Larantuka, Nama Orang Tua, Pekerjaan Orang Tua, Nilai Ujian Nasional, Nilai Raport semester 1 sampai dengan semester 5,
Nilai Tes Masuk dan Asal SMP.
Data tahun 2008 memuat 262 calon siswa yang mendaftar, dengan rincian: - Sebanyak 203 siswa yang diterima
- Sebanyak 59 siswa yang tidak diterima
Data tahun 2009 mencakup 283 calon siswa yang mendaftar, dengan rincian: - Sebanyak 206 siswa yang diterima
- Sebanyak 77 siswa yang tidak diterima
Dalam tahun 2010 terdapat sebanyak 273 calon siswa yang mendaftar, dengan rincian:
- Sebanyak 205 siswa yang diterima - Sebanyak 78 siswa yang tidak diterima
Beberapa langkah awal pre-pocessing sebagai berikut:
a. Pembersihan Data ( data cleaning )
Pembersihan data merupakan tahap awal dalam data mining.
Pada data mentah, terdapat beberapa record yang mempunyai data yang tidak lengkap (missing value). Pada proses pembersihan data,
record yang mempunyai data yang tidak lengkaptersebut dihapus.
Pada data tahun 2008 sebanyak 17 record yang dihapus, pada tahun 2009 sebanyak 10 record yang di hapus, dan pada tahun 2010 sebanyak 12 record yang di hapus.
Pada tahap ini dilakukan penggabungan data antara tahun 2008, 2009 dan 2010. Data mentah yang diterima dalam bentuk fisik dan terpisah untuk setiap tahun. Data tersebut dijadikan satu dokumen berformat .xls.
c. Seleksi Data ( data selection )
Data yang sudah diintegrasikan kemudian diseleksi. Pada tahap ini, dipilih atribut –atribut yang menjadi kriteria penerimaan siswa serta relevan untuk dilakukan proses penambangn data.
Data mentah yang diperoleh memiliki atribut – atribut sebagai berikut : Nomor, Nama, No. Telepon, Tempat Tanggal Lahir, Alamat Asal, Alamat di Larantuka, Nama Orang Tua ( Ayah dan Ibu ), Pekerjaan Orang Tua ( Ayah dan Ibu ), Nilai UN, Nilai Raport semester 1 sampai dengan 5, Nilai Tes, dan Asal SMP.
Pada proses ini juga dilakukan analisis korelasi untuk analisis variabel dengan menggunakan aplikasi SPSS. Analisis korelasi dilakukan untuk memastikan apakah 8 atribut yang digunakan untuk penambangan data bersifat independen satu sama lain. Artinya, antara atribut satu dengan atribut yang lain tidak saling mempengaruhi.
Analisis korelasi digunakan untuk menyelidiki hubungan antara dua buah variabel. Analisis korelasi ini akan mengukur seberapa besar hubungan antara dua variabel atau antar set variabel.
Berikut ini adalah hasil analisis korelasi untuk 8 atribut yaitu Nilai UN, Nilai semester 1, Nilai Semester 2, Nilai Semester 3, Nilai Semester 4, Nilai Semester 5, Nilai Tes, Asal SMP.
Tabel 3.1 Tabel output analisis korelasi untuk 8 tribut dengan menggunakan SPSS Correlations NILAI _UN SMSTR1 SMSTR2 SMSTR3 SMSTR4 SMSTR5 NILAI _TES ASAL_ SMP NILAI_UN Pearson Correlation 1 .235** .286** .212** .232** .172** -.021 -.054
Sig. (2-tailed) .000 .000 .000 .000 .000 .543 .123 N 818 818 818 818 818 818 818 818 SMSTR1 Pearson Correlation .235** 1 .527** .500** .570** .332** .048 -.059 Sig. (2-tailed) .000 .000 .000 .000 .000 .166 .094 N 818 818 818 818 818 818 818 818 SMSTR2 Pearson Correlation .286** .527** 1 .534** .627** .356** .041 -.082* Sig. (2-tailed) .000 .000 .000 .000 .000 .240 .019 N 818 818 818 818 818 818 818 818 SMSTR3 Pearson Correlation .212** .500** .534** 1 .515** .337** .066 -.032 Sig. (2-tailed) .000 .000 .000 .000 .000 .059 .363 N 818 818 818 818 818 818 818 818 SMSTR4 Pearson Correlation .232** .570** .627** .515** 1 .445** .066 -.020 Sig. (2-tailed) .000 .000 .000 .000 .000 .061 .572 N 818 818 818 818 818 818 818 818 SMSTR5 Pearson Correlation .172** .332** .356** .337** .445** 1 .012 -.019 Sig. (2-tailed) .000 .000 .000 .000 .000 .739 .586 N 818 818 818 818 818 818 818 818 NILAI_TE S Pearson Correlation -.021 .048 .041 .066 .066 .012 1 -.045 Sig. (2-tailed) .543 .166 .240 .059 .061 .739 .200 N 818 818 818 818 818 818 818 818 ASAL_SM P Pearson Correlation -.054 -.059 -.082* -.032 -.020 -.019 -.045 1 Sig. (2-tailed) .123 .094 .019 .363 .572 .586 .200 N 818 818 818 818 818 818 818 818
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Dari tabel 3.1 dapat dilihat bahwa ada beberapa atribut yang mempunyai hubungan korelasi dengan atribut lain. Berikut rangkuman analisisnya.
Tabel 3.2 Tabel rangkuman analisis korelasi untuk 8 atribut
ATRIBUT
INDEPENDEN TERHADAP
ATRIBUT
BERKORELASI DENGAN ATRIBUT
Nilai UN Nilai Tes, Asal SMP
Nilai Semester 1, Nilai Semester 2, Nilai Semester 3, Nilai Semester 4, Nilai Semester
5. Nilai
Semester 1
Nilai Test, Asal SMP
Nilai UN, Nilai Semester 2, Nilai Semester 3, Nilai Semester 4, Nilai Semester 5. Nilai
Semester 2
Nilai Tes Nilai UN, Nilai Semester 1, Nilai Semester 3, Nilai Semester 4, Nilai Semester 5, Asal SMP. Nilai
Semester 3
Asal SMP Nilai UN, Nilai Semester 1, Nilai Semester 2, Nilai Semester 4, Nilai Semester 5, Nilai Tes. Nilai
Semester 4
Nilai Tes, Asal SMP
Nilai UN, Nilai Semester 1, Nilai Semester 2, Nilai Semester 3, Nilai Semester 5. Nilai
Semester 5
Nilai Tes, Asal SMP
Nilai UN, Nilai Semester 1, Nilai Semester 2, Nilai Semester 3, Nilai Semester 4. Nilai Test Nilai UN, Asal
SMP
Nilai Semester 1, Nilai Semester 2, Nilai Semester 3, Nilai Semester 4, Nilai semester 5. Asal SMP Nilai UN, Nilai
Tes
Nilai Semester 1, Nilai Semester 2, Nilai Semester 3, Nilai Semester 4, Nilai semester 5.
Berdasarkan tabel korelasi Pearson dengan menggunakan SPSS di atas, maka diperoleh kriteria yang dapat digunakan untuk penerimaan siswa SMAK Frateran Podor adalah Nilai UN, Nilai Tes dan Asal SMP.
Berikut ini adalah hasil analisis korelasi untuk 4 atribut yaitu Nilai UN, Rata – rata Nilai Raport, Nilai Tes, Asal SMP.
Tabel 3.3 Tabel output analisis korelasi untuk 4 tribut dengan menggunakan SPSS
Correlations
NILAI_UN RATA_RATA NILAI_TES ASAL_SMP NILAI_UN Pearson Correlation 1 .296** -.021 -.054
Sig. (2-tailed) .000 .543 .123
N 818 818 818 818
RATA_RATA Pearson Correlation .296** 1 .060 -.054
Sig. (2-tailed) .000 .088 .126
N 818 818 818 818
NILAI_TES Pearson Correlation -.021 .060 1 -.045
Sig. (2-tailed) .543 .088 .200
N 818 818 818 818
ASAL_SMP Pearson Correlation -.054 -.054 -.045 1
Sig. (2-tailed) .123 .126 .200
N 818 818 818 818
**. Correlation is significant at the 0.01 level (2-tailed).
Tabel 3.4 Tabel rangkuman analisis korelasi untuk 4 atribut ATRIBUT INDEPENDEN
TERHADAP ATRIBUT
BERKORELASI DENGAN ATRIBUT
Nilai UN Nilai Tes, Asal SMP Rata-rata Nilai Raport Rata-rata
Nilai Raport
Nilai Test, Asal SMP Nilai UN
Nilai Tes Nilai UN, Rata-rata Nilai Raport, Asal SMP
-
Asal SMP Nilai UN, Rata-rata Nilai Raport, Nilai Tes
Berdasarkan tabel korelasi Pearson dengan menggunakan SPSS di atas, maka diperoleh kriteria yang dapat digunakan untuk penerimaan siswa SMAK Frateran Podor adalah Nilai UN, Nilai Tes, Rata-rata Nilai Raport dan Asal SMP.
d. Transformasi Data ( data transformation )
Pada tahap transformasi data, data Nilai UN, Rata-rata Nilai Raport, Nilai Tes dan Asal SMP akan dikategorikan sesuai dengan keputusan pihak SMAK Frateran Podor. Berikut kategorinya:
Nilai UN
Nilai UN dikategorikan menjadi 2 kategori yaitu nilai UN ≥ 24 dan
nilai UN < 24
Rata-rata Nilai Raport
Rata-rata Nilai Raport dikategorikan menjadi 2 kategori yaitu nilai UN ≥ 84 dan nilai UN < 84
Nilai Tes
Nilai Tes dikategorikan menjadi 2 kategori yaitu nilai tes ≥ 7 dan nilai
tes < 7 Asal Sekolah
Asal sekolah dikategorikan menjadi 4 kategori yaitu: Tabel 3.5 Transformasi Data Asal Sekolah
Asal SMP Klasifikasi SMPK Mater Inviolata, SMPK Gabriel, SMP Ratu
Damai
SMP Negeri Larantuka, SMP Negeri Adonara, SMP Darius
Wilayah 2
SMP Negeri Solor, SMP Negeri Lembata, SMP Negeri Tanjung Bunga
Wilayah 3
SMPK Frateran Maumere, SMPK Giovanni Kupang, dan SMP lain di luar Flores Timur
Wilayah 4