• Tidak ada hasil yang ditemukan

BAB IV IMPLEMENTASI METODE WARD DAN HASIL ANALISIS

B. Sumber Data dan Metode Pengambilannya

D. Implementasi Metode Ward E. Hasil Analisis BAB V PENUTUP A. Kesimpulan B. Saran DAFTAR PUSTAKA LAMPIRAN

7 BAB II

LANDASAN TEORI

A. Variabel Acak

Definisi 2.1 Variabel Acak

Variabel acak adalah suatu fungsi bernilai real yang domainnya merupakan ruang sampel.

Contoh 2.1

Berikut ini merupakan diagram panah yang menunjukkan nilai matematika empat siswa sekolah menengah pertama.

Gambar 2.1 Pemetaan Nilai Siswa

Contoh 2.2

Suatu percobaan dilakukan dengan melemparkan dua buah dadu sebanyak satu kali. Variabel acak menyatakan banyaknya mata dadu 6 yang muncul, maka nilai yang menyatakan nilai dari yang mungkin adalah 0,1, atau 2.

1 2 3 4 5 6 1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) 2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) 3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) 5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) 6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Variabel acak dibedakan menjadi dua, yaitu variabel acak diskrit dan variabel acak kontinu.

Definisi 2.2 Variabel Acak Diskrit

Variabel acak dikatakan variabel acak diskrit jika semua nilai yang mungkin dari membentuk himpunan bilangan terbilang.

Definisi 2.3 Variabel Acak Kontinu

Variabel acak dikatakan variabel acak kontinu jika semua nilai yang mungkin dari membentuk himpunan bilangan tak terbilang.

B. Pengukuran

Dalam kehidupan sehari-hari seringkali kita mendengar bahkan melakukan kegiatan pengukuran. Pengukuran merupakan suatu proses memberikan lambang bilangan atau variabel pada obyek penelitian.

Definisi 2.4 Pengukuran

Pengukuran adalah kegiatan memberikan lambang-lambang bilangan pada obyek penelitian menurut aturan tertentu.

Proses pengukuran akan menghasilkan data yang mengandung suatu informasi. Ada banyak contoh pengukuran, misal mengukur tinggi badan, menimbang berat badan, mengukur capaian hasil belajar siswa sekolah menengah pertama, dan lain sebagainya. Pengukuran dapat dilakukan pada hal apapun. Misalnya pada pengukuran capaian hasil belajar, pengukuran dilakukan dengan melihat keberhasilan dalam proses pembelajaran baik dari segi nilai yang diperoleh maupun yang lainnya.

Contoh 2.3

Panjang dua buah kayu diukur dengan menggunakan alat ukur berturut-turut adalah 120 cm dan 3 m.

C. Data dan Jenisnya

Data adalah nilai dari variabel yang merupakan hasil suatu pengukuran atau observasi (Bluman, 2011). Data dapat dikategorikan menjadi beberapa jenis, yaitu berdasarkan cara memperolehnya, sifatnya, dan skala pengukurannya, dan lain sebagainya.

1. Berdasarkan Cara Memperolehnya

Berdasarkan cara memperolehnya data dibedakan menjadi dua, yaitu data primer dan data sekunder.

a. Data Primer

Data primer adalah data yang diperoleh secara langsung berdasarkan obyek yang diteliti. Misalnya data hasil wawancara dengan responden.

b. Data Sekunder

Data sekunder diperoleh secara tidak langsung dari obyek yang diteliti. Data sekunder umumnya diperoleh dari instansi-instansi yang menyediakan kumpulan data untuk keperluan penelitian. Contoh data sekunder adalah data jumlah pengunjung perpustakaan Universitas Sanata Dharma yang diperoleh dari daftar hadir (pengunjung).

2. Berdasarkan Skala Pengukurannya a. Skala Nominal

Skala nominal merupakan skala yang hanya memberikan informasi yang cukup untuk membedakan satu obyek dari yang lain. Contoh dengan mempertimbangkan variabel jenis kelamin, laki-laki dan perempuan. Misalkan dengan menggunakan angka untuk mewakili subjek jenis kelamin. Sebagai contoh bisa ditentukan dengan menetapkan sembarang nomor, misal nomor 1 untuk subjek laki-laki dan nomor 2 untuk subjek perempuan. Angka yang ditetapkan tersebut tidak memiliki arti apapun karena angka tersebut hanya untuk mengkategorikan subjek ke dalam kelompok yang berbeda.

b. Skala Ordinal

Skala ordinal merupakan skala yang mengkategorikan suatu obyek berdasarkan tingkatan atau urutan. Pada skala ordinal, lambang-lambang bilangan hasil pengukuran menunjukkan tingkatan atau urutan obyek-obyek yang diukur menurut dari karakteristik yang dipe lajari. Hal yang dipentingkan pada skala ordinal adalah urutannya, sementara jarak antar urutan tidak menjadi persoalan. Contoh dari skala ordinal adalah status gizi, di mana status gizi dapat diurutkan ke dalam gizi buruk, gizi kurang cukup, atau gizi baik.

c. Skala Interval

Skala interval merupakan skala pengukuran yang mempunyai sifat seperti skala ordinal, yaitu adanya urutan tertentu dalam hasil pengukuran, namun ditambah satu sifat khas yaitu adanya satuan skala. Artinya, perbedaan karakteristik antara obyek yang berpasangan dengan lambang bilangan yang satu dengan obyek yang berpasangan dengan lambang bilangan berikutnya selalu tetap sama. Salah satu contoh dari skala interval adalah suhu yang diukur dalam derajat celcius.

d. Skala Rasio

Skala rasio merupakan skala yang menghasilkan data dengan mutu tertinggi. Perbedaan antara skala rasio dan skala interval terletak pada keberadaan nilai nol pada skala tersebut. Jika skala interval nilai nolnya tidak bersifat mutlak, maka pada skala rasio nilai nolnya bersifat mutlak, di mana nilai nol mutlak ini dapat menunjukkan ketiadaan karakteristik yang diukur. Contohnya adalah perbedaan nilai nol derajat pada variabel suhu dan nilai nol pada variabel berat badan.

3. Berdasarkan Sifatnya a. Data Kualitatif

Data kualitatif tidak dapat diukur maupun dicacah secara langsung, karena data kualitatif bersifat deskriptif. Data kualitatif bisa juga disebut dengan data kategorikal, di mana data kualitatif terdiri dari nama atau label bukan angka yang mewakili hasil perhitungan maupun pengukuran. Contohnya adalah kualitas udara di Jakarta memburuk seiring dengan volume kendaraan yang meningkat.

b. Data Kuantitatif

Data kuantitatif merupakan data yang terdiri atas bilangan-bilangan yang merupakan hasil dari perhitungan maupun pengukuran. Data kuantitatif dapat dibedakan menjadi dua, yaitu data diskrit dan data kontinu.

a) Data Diskrit

Data diskrit adalah data yang diperoleh dari hasil pencacahan atau membilang variabel random diskrit. Salah satu contoh data diskrit adalah data jumlah penduduk di kota X.

b) Data Kontinu

Data kontinu adalah data yang diperoleh dari hasil pengukuran variabel random kontinu. Data kontinu dihasilkan dari banyak kemungkinan nilai kuantitatif yang tak berhingga di mana kumpulan nilainya tak terbilang. Salah satu contoh dari data kontinu adalah data tinggi badan.

4. Berdasarkan Banyaknya Variabel a. Data Univariat

Data univariat merupakan data hasil pengukuran dari sebuah variabel. Pada prinsipnya, kita dihadapkan dengan data sampel berukuran yang menghasilkan pengamatan , di mana variabelnya hanya satu yaitu dengan pengamatan.

Contoh 2.4

Berikut ini merupakan tabel data hasil observasi variabel tinggi badan 5 siswa.

Siswa Tingggi Badan (cm) 1 98 2 105 3 103 4 89 5 110 b. Data Multivariat

Data multivariat merupakan data hasil pengukuran dari dua atau lebih variabel. Analisis multivariat terdiri dari sekumpulan metode yang dapat digunakan ketika beberapa pengukuran dilakukan oleh satu individu atau obyek dalam sampel. Analisis multivariat bertujuan untuk menganalisis data yang terdiri atas banyak variabel yang saling berhubungan satu sama lain. Secara umum data multivariat dapat disajikan dalam bentuk matriks. Misal terdapat deretan bilangan yang akan disusun sebagai matriks dengan baris dan kolom adalah sebagai berikut (Johnson and Wichern, 2007:54).

[ ] di mana:

: banyaknya obyek pengamatan : banyaknya variabel diamati

: data hasil pengamatan obyek ke-i untuk variabel ke-j, dengan dan

Contoh 2.5

Di bawah ini merupakan data penilaian tengah semester 20 siswa kelas 6, SDN 01 Tanjung Serupa tahun ajaran 2019/2020.

Siswa 1 83 79 78 75 84 74 78 86 80 2 79 82 82 78 79 75 77 79 77 3 88 90 89 86 85 87 78 88 85 4 77 78 79 73 84 73 78 78 76 5 78 81 80 73 83 76 78 79 77 6 77 78 82 74 80 73 79 78 77 7 80 76 79 74 77 72 78 80 77 8 83 88 85 80 83 82 80 88 80 9 78 76 84 74 83 78 80 85 78 10 82 89 83 78 85 80 79 80 80 11 80 80 81 75 84 76 79 79 77 12 84 85 85 76 87 87 79 82 79 13 79 83 84 72 90 80 78 81 77 14 80 79 81 72 80 76 79 79 76 15 80 87 84 74 86 82 79 86 77 16 76 80 82 77 79 72 77 77 76 17 78 79 79 79 85 79 78 82 77 18 86 84 84 77 83 88 79 86 80 19 78 77 84 77 80 81 78 88 79 20 81 89 84 77 83 90 80 83 78 dengan

nilai pendidikan agama dan budi pekerti nilai pendidikan kewarganegaraan nilai bahasa indonesia

nilai matematika

nilai ilmu pengetahuan alam nilai ilmu pengetahuan sosial

nilai pendidikan jasmani, olahraga, dan kesehatan nilai seni budaya

nilai bahasa Lampung D. Teorema Limit Pusat

Apabila suatu sampel acak diambil dari populasi yang distribusinya sembarang dengan rata-rata dan variansi , maka distribusi sampling dari ̅ memiliki

( ̅) ( ̅)

Secara umum, distribusi sampling dari ̅ akan selalu normal bila berdistribusi normal. Tetapi, bila tidak berdistribusi normal, maka tidak ada jaminan bahwa distribusi sampling dari ̅ adalah normal. Bila distribusi dari populasi tidak normal, maka distribusi sampling dari ̅ akan normal hanya bila ukuran sampelnya cukup besar (biasanya nilai lebih besar dari 30).

Teorema 2.1 Teorema Limit Pusat

Misalkan merupakan variabel acak independen dan berdistribusi identic dengan ( ) dan ( ) . Didefinisikan

√ ̅ √ ⁄ di mana ̅ ∑

maka fungsi distribusi dari konvergen ke fungsi distribusi Normal Standar untuk .

( ) ∫ √

Bukti dapat dilihat pada buku Mathematical Statistics with Application 7th

Edition (Wackerly, et al., 2008).

E. Analisis Variansi Multivariat

Dalam tugas akhir ini, analisis variansi univariat dan analisis variansi multivariat akan digunakan untuk memvalidasi hasil clustering. Analisis variansi multivariat atau yang lebih dikenal dengan MANOVA merupakan perluasan dari analisis variansi univariat atau lebih dikenal dengan ANOVA. MANOVA digunakan untuk menguji perbedaan untuk dua atau lebih variabel dependen yang berskala metrik berdasarkan kumpulan variabel independen yang berskala non-metrik.

Dalam pengujian MANOVA, asumsi-asumsi yang harus dipenuhi adalah sebagai berikut:

1. adalah sampel acak berukuran dari populasi dengan rata-rata ( ). Sampel acak dari populasi yang berbeda bersifat independen.

2. Masing-masing populasi berdistribusi normal multivariat 3. Matriks-matriks kovarian homogen

1. Analysis of Variance (ANOVA)

ANOVA digunakan untuk menguji hipotesis perbedaan rata-rata lebih dari dua populasi. Asumsi yang harus dipenuhi untuk menguji ANOVA untuk buah populasi adalah sebagai berikut:

1. Normalitas data tiap populasi

2. Homogenitas variansi dari populasi

Diasumsikan terdapat buah populasi yang independen dan berdistribusi normal dengan rata-rata , hipotesis yang digunakan adalah

: sekurang-kurangnya dua rata-rata tidak sama

(2.1)

Populasi biasanya akan sesuai dengan rangkaian kondisi perulangan yang berbeda, dan oleh karena itu, akan lebih mudah untuk menyelidiki deviasi yang terkait dengan populasi (perlakuan). Hipotesis nol menjadi

Variabel respon yang berdistribusi normal ( ), dapat ditulis dalam bentuk

(2.2) di mana adalah variabel acak yang berdistribusi normal ( ) yang independen.

Berdasakaran dekomposisi dalam persamaan (2.2), ANOVA didasarkan pada dekomposisi pengamatan yang analog

̅ ( ̅ ̅) ( ̅ ) (2.3) di mana:

̅ : penduga rata-rata ( ̅ ̅) : penduga efek perlakuan ( ̅): penduga galat

2. Multivariate Analysis of Variance (MANOVA)

Terdapat beberapa statistik uji yang dapat digunakan dalam pengujian MANOVA, yaitu Wilks’ Lambda, Roy‟s, Pillai, dan

Lawley-Hotelling. Dalam tugas akhir ini, hanya akan dibahas mengenai analisis

variansi multivariat satu arah (one-way MANOVA).

One-Way MANOVA

Berikut ini merupakan persamaan model MANOVA untuk membandingkan vektor rata-rata populasi.

(2.4)

dengan dan , di mana adalah variabel dari ( ) yang independen, parameter vektor adalah rata-rata keseluruhan, dan merepresentasikan efek perlakuan ke- dengan ∑ . Selanjutnya vektor pengamatan dapat diuraikan menjadi

̅ ( ̅ ̅) ( ̅) (2.5) di mana:

: pengamatan ke- dari populasi ke- ̅ : rata-rata sampel penduga

( ̅ ̅) : penduga efek perlakuan ( ̅) : penduga galat

Di bawah ini merupakan tabel MANOVA untuk membandingkan vektor rata-rata populasi.

Tabel 2.2 Tabel MANOVA

Sumber Variasi Matriks Jumlah Kuadrat dan Perkalian Silang Derajat Bebas Perlakuan ∑ ( ̅ ̅)( ̅ ̅) Galat ∑ ∑( ̅ )( ̅ ) Total ∑ ∑( ̅)( ̅) ∑

Berikut ini langkah-langkah dalam pengujian hipotesis MANOVA. 1.

atau juga dapat ditulis dalam bentuk vektor dengan populasi dan variabel pengamatan [ ] [ ] [ ]

2. setidaknya ada , di mana 3. Memilih Tingkat Signifikansi

4. Statistik Uji

Dalam pengujian MANOVA terdapat asumsi-asumsi yang harus dipenuhi, yaitu variabel pengamatan berdistribusi normal multivariat dan matriks kovarian homogen. Statistik uji yang digunakan dalam pengujian MANOVA pada tugas akhir ini dibatasi, yakni hanya menggunakan statistik uji Wilks’ Lambda ( ) dan uji Pillai ( ( )).

Berikut ini merupakan rumus statistik uji Wilks’ Lambda | |

| | dan rumus statistik uji Pillai

( ) ,( ) - dengan ∑ ∑( ̅ )( ̅) ∑ ( ̅ ̅)( ̅ ̅) di mana:

: ukuran sampel atau jumlah sampel kelompok ke- ̅ : rata-rata dari sampel ke-

̅ : rata-rata keseluruhan : vektor pengamatan

Dalam hal ini jika asumsi matriks kovarian homogen dipenuhi, statistik uji yang digunakan adalah statistik uji Wilks’ Lambda ( ). Sedangkan jika asumsi matriks kovarian homogen tidak dipenuhi, maka statistik uji yang digunakan adalah statistik uji Pillai ( ).

5. Wilayah Kritis (Daerah penolakan )  Untuk statistik uji Wilk‟s Lambda,

ditolak apabila dengan

( )

di mana:

: derajat bebas untuk hipotesis : derajat bebas untuk galat  Untuk statistik uji Pillai

ditolak bila ( ) ( ) 6. Melakukan Perhitungan

Pada tahap ini, perhitungan dapat dilakukan dengan menggunakan bantuan perangkat lunak-R pada komputer, menggunakan fasilitas yang terdapat pada Microsoft Excel, maupun perangkat-perangkat lunak yang lain yang sesuai dengan statistik uji yang telah dipilih sebelumnya. 7. Membuat Kesimpulan

Berdasarkan hasil yang diperoleh pada tahap perhitungan, maka dapat ditarik suatu kesimpulan apakah vektor rata-rata dari dua populasi atau lebih berbeda secara signifikan.

Contoh 2.6

Dalam percobaan klasik yang dilakukan dari tahun 1918 sampai 1934, Andrews dan Herberg (1985) melaporkan hasil penelitiannya terhadap 6 ladang pohon apel yang berbeda, di mana setiap ladang akan diteliti 8 pohon apel dengan ketentuan variabel pengukuran sebagai berikut

lingkar batang pohon berumur 4 tahun (dalam 10 cm) pertumbuhan pohon berumur 4 tahun (dalam m)

lingkar batang pohon berumur 15 tahun (dalam 10 cm)

berat batang pohon di atas permukaan tanah pada pohon berumur 15 tahun (dalam 1000 pon)

data dari penelitian tersebut dapat dilihat pada Lampiran 1.

Akan diuji apakah vektor rata-rata ukuran dari keenam ladang yang diteliti berbeda secara signifikan. Berikut ini merupakan rumusan hipotesis yang digunakan.

1. Merumuskan hipotesis nol dan alternatif :

: setidaknya ada , di mana 2. Memilih tingkat signifikansi 3. Statistik uji

Statistik uji yang digunakan dalam contoh ini adalah statistik uji Wilk‟s

Lambda. Dalam contoh ini keenam ladang diasumsikan berdistribusi

normal multivariat dan matriks kovarian homogen. | | | | 4. Wilayah kritis Dengan ( ) ( ) sehingga ditolak apabila 5. Perhitungan ( ) ( )

( ) | | | |

Karena , maka dapat disimpulkan bahwa ditolak.

6. Kesimpulan

ditolak, maka terbukti bahwa ada perbedaan rata-rata ukuran dari keenam ladang yang diteliti secara signifikan.

F. Penambangan Data (Data Mining)

Penambangan data atau yang lebih dikenal dengan istilah data mining sangat erat kaitannya dengan analisa data (Kumar, et al., 2006). Data mining

adalah proses menemukan informasi yang berguna secara otomatis dalam repositori data yang besar. Definisi lain dari data mining adalah bagian integral dari Knowledge Discovery in Databases (KDD), yang merupakan keseluruhan proses mengubah data mentah menjadi informasi yang berguna. Kegunaan data mining dibagi menjadi dua, yaitu prediktif dan deskriptif. Prediktif berarti data mining digunakan untung memprediksi nilai variabel tertentu berdasarkan nilai variabel lainnya. Sedangkan deskriptif berarti data

mining digunakan untuk mendapatkan pola baik itu korelasi, cluster, maupun

yang lainnya, yang menjelaskan karakteristik data.

Seiring dengan kemajuan zaman, jumlah data yang ada saat ini meningkat secara eksponensial. Hal ini tentunya menimbulkan permasalahan tersendiri dalam era big data, di mana sangat rentan terhadap data yang berisik (noisy), hilang, dan tidak konsisten dikarenakan ukuran data yang

sangat besar. Prapemrosesan data (data preprocessing) dalam data mining sangat diperlukan dalam hal ini. Tujuan dari prapemrosesan data adalah untuk mempermudah memahami data sehingga mempermudah pemilihan teknik dan metode data mining yang tepat, meningkatkan kualitas data sehingga hasil data mining menjadi lebih baik, meningkatkan efisiensi dan kemudahan proses penambangan data. Pada bagian prapemrosesan data, data dikatakan memiliki kualitas jika memenuhi persyaratan yang dimaksudkan. Prapemrosesan data diperlukan karena data di dunia nyata cenderung kotor, tidak lengkap, berisi gangguan, kesalahan atau pencilan (outliers), tidak konsisten, dan lain sebagainya. Berikut ini merupakan tugas utama dari prapemrosesan data.

1. Pembersihan Data

Pembersihan data atau data cleaning berfungsi untuk membersihkan data dengan mengisi nilai yang hilang, menghaluskan data yang menyimpang (noisy data), mengidentifikasi atau menghapus pencilan (outlier), dan mengatasi ketidakonsistenan.

a. Data Hilang/Kosong (Missing Values)

Jika terdapat sebuah data yang mengandung tuple dengan satu atau lebih atribut tanpa nilai (kosong), maka dapat dibersihkan dengan cara: 1) Abaikan tuple tersebut: cara ini biasanya digunakan jika tuple tersebut tidak memiliki label kelas (dalam kasus klasifikasi data). Metode ini kurang efektif untuk data yang memiliki banyak tuple dengan sedikit atribut kosong. Karena dengan mengabaikan

tuple-tuple tersebut, banyak atribut lain yang memiliki nilai tidak

dipergunakan sama sekali.

2) Isi atribut kosong secara manual: cara ini dapat digunakan untuk mengatasi kelemahan metode pertama. Namun, cara ini

memerlukan banyak waktu dan seringkali tidak layak untuk digunakan pada himpunan data besar yang memilik banyak atribut kosong.

3) Gunakan sebuah konstanta global untuk mengisi atribut kosong: dalam metode ini, dapat dilakukan dengan mengisi semua atribut kosong dengan nilai yang berupa sebuah konstanta yang sama. 4) Gunakan sebuah nilai tendensi sentral (misal rata-rata atau median)

untuk mengisi atribut kosong: rata-rata biasanya digunakan untuk himpunan data yang berdistribusi normal (simetris), sedangkan median umumnya digunakan untuk himpunan data yang memiliki distribusi condong ke kiri atau ke kanan (asimetris).

5) Gunakan rata-rata atau median dari suatu atribut untuk mengisi semua sampel dalam kelas yang sama dengan tuple tersebut.

6) Gunakan nilai yang paling mungkin untuk mengisi atribut kosong.

b. Noisy Data

Kebisingan atau noise dalam himpunan data bisa berupa kesalahan atau variasi yang bersifat acak, misalnya suatu nilai yang jauh lebih kecil atau lebih besar dibanding yang lain. Jika memiliki sebuah data yang bising, maka dapat dibersihkan dengan cara:

1) Binning: metode ini dilakukan dengan cara mengurutkan nilai-nilai

pada suatu atribut, lalu membaginya ke dalam sejumlah interval secara merata, dan penghalusan dapat dilakukan dengan tiga cara, yaitu rata-rata, median, atau batas nilai minimum dan maksimum.

2) Regresi: suatu regresi linear biasa mencari persamaan garis terbaik

yang paling mendekati nilai-nilai dari dua buah atribut sedemikian hingga suatu atribut dapat digunakan untuk memprediksi atribut yang lain.

3) Analisis outliers (pencilan): outliers (pencilan) dapat dideteksi

dengan berbagai metode yang tidak dibahas dalam tugas akhir ini.

2. Integrasi Data

Dalam data mining seringkali membutuhkan integrasi data (penggabungan data dari beberapa penyimpanan data). Integrasi data yang dilakukan secara hati-hati dapat membantu mengurangi dan menghindari redundansi inkonsistensi di antara kumpulan data yang dihasilkan. Suatu atribut dikatakan redundan jika atribut bisa diturunkan dari atribut atau sekumpulan atribut lainnya.

3. Reduksi Data

Data dapat direduksi menjadi jauh lebih kecil dengan tetap menjaga keutuhan data asli. Artinya, menambang pada himpunan data yang direduksi harus lebih efisien namun menghasilkan hasil analisis yang sama.

4. Transformasi

Transformasi adalah proses pentransferan data dalam bentuk standar. Bentuk standar yang dimaksud adalah bentuk data yang akan dicapai oleh algoritma penambangan data. Bentuk standar ini biasanya dalam bentuk

spreadsheet.

G. Ujian Nasional

Dalam pendidikan dasar dan menengah, untuk mengukur pencapaian kompetensi siswa dalam proses pembelajaran salah satunya adalah dengan menyelenggarakan ujian bagi siswa. Ujian adalah kegiatan yang dilakukan untuk mengukur pencapaian kompetensi peserta didik sebagai pengakuan

prestasi belajar dan/atau penyelesaian dari suatu Satuan Pendidikan (permendikbud No. 43 Tahun 2019). Ujian yang diselenggarakan oleh Satuan Pendidikan merupakan penilaian hasil belajar oleh Satuan Pendidikan yang bertujuan untuk menilai pencapaian standar kompetensi lulusan untuk semua mata pelajaran. Sedangkan ujian nasional merupakan ujian yang diselenggarakan secara nasional pada tingkat akhir sekolah dasar dan menengah.

Ujian Nasional yang selanjutnya disingkat UN adalah kegiatan pengukuran capaian kompetensi lulusan pada mata pelajaran tertentu secara nasional dengan mengacu pada Standar Kompetensi Lulusan (permendikbud No. 43 Tahun 2019). Di Indonesia sendiri UN dilaksanakan untuk anak-anak dalam pendidikan dasar hingga dalam pendidikan menengah. UN biasanya dilaksanakan pada akhir semester genap untuk siswa kelas VI sekolah dasar, kelas IX sekolah menengah pertama, dan kelas XII sekolah menengah atas. UN dapat menentukan tingkat kemampuan peserta didik di seluruh Indonesia berdasarkan standar nasional yang telah ditetapkan. Nilai perolehan UN siswa dapat dibandingkan dengan siswa lain antarsekolah, antar-kabupaten, dan antar provinsi di seluruh Indonesia karena menggunakan kisi-kisi UN berstandar nasional. Salah satu kegunaan hasil UN adalah untuk pemetaan serta analisis tingkat pencapaian hasil belajar siswa.

UN dapat digunakan sebagai barometer minimal bagi sekolah di seluruh Indonesia, di mana barometer ini sebagai pengontrol mutu sekolah di Indonesia. UN sebagai barometer minimal bagi sekolah karena UN dapat digunakan untuk mengelompokkan sekolah-sekolah berdasarkan nilai ujian terbaik yang diperoleh. Pada UN SMP terdapat empat mata pelajaran yang diujikan, yaitu bahasa Indonesia, bahasa Inggris, matematika, dan IPA.

H. Ukuran Kesamaan Antar Obyek

Dalam analisis cluster ukuran kedekatan atau kesamaan merupakan hal yang paling mendasar, sebagai upaya untuk menghasilkan struktur kelompok yang agak sederhana dari kumpulan data yang kompleks. Untuk memilih ukuran kesamaan, penting mempertimbangkan beberapa hal yang meliputi sifat variabel (diskrit, kontinu, biner), skala pengukuran (nominal, ordinal, rasio, interval), dan lain sebagainya. Berikut ini terdapat tiga metode yang dapat diterapkan dalam memilih ukuran kesamaan, yaitu ukuran korelasi, ukuran asosiasi, dan ukuran jarak.

1. Ukuran Korelasi

Dalam kehidupan sehari-hari banyak variabel yang saling berhubungan satu dengan yang lain. Hubungan antar variabel tersebut disebut dengan korelasi. Tujuan dari analisis korelasi adalah untuk mengukur kekuatan hubungan antara dua variabel dan menguji apakah kekuatan hubungan tersebut signifikan atau tidak signifikan. Dalam korelasi, ukuran kekuatan hubungan antar variabel memerlukan ukuran korelasi.

Kekuatan hubungan antar variabel dinyatakan dengan ukuran yang disebut koefisien korelasi atau koefisien asosiasi. Mengukur kesamaan antar obyek dapat dilihat dari koefisien korelasi antar sepasang obyek pada beberapa variabel yang diukur. Ukuran korelasi dapat diterapkan pada data yang berskala metrik. Korelasi dalam populasi biasanya disimbolkan dengan (rho), sedangkan korelasi dalam sampel disimbolkan dengan . Dalam tugas akhir ini, untuk mengukur kekuatan hubungan linear antara dua variabel dan menggunakan korelasi Pearson. Berikut ini merupakan langkah-langkah uji korelasi Pearson.

1. Menetapkan Hipotesis Nol dan Hipotesis Alternatif

: (ada korelasi antara variabel dan variabel ) 2. Menetapkan tingkat signifikansi

3. Statistik Uji √ √ dengan ∑ (∑ )(∑ ) √, ∑ (∑ ) -, ∑ (∑ ) -di mana:

: koefisien korelasi sampel

: banyaknya pasangan pengamatan ( ) 4. Wilayah Kritis (Daerah penolakan )

ditolak apabila | | , dengan derajat bebas

Dokumen terkait