• Tidak ada hasil yang ditemukan

: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M.

N/A
N/A
Protected

Academic year: 2022

Membagikan ": Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M."

Copied!
14
0
0

Teks penuh

(1)

v

Judul : Analisis Diskriminan pada Klasifikasi Desa di Kabupaten Tabanan Menggunakan Metode K-Fold Cross Validation Nama : Ida Ayu Made Supartini

Pembimbing : 1. Ir. I Komang Gde Sukarsa, M.Si 2. I Gusti Ayu Made Srinadi, S.Si, M.Si

ABSTRAK

Kabupaten Tabanan merupakan salah satu kabupaten dari kabupaten dan kota yang ada di Provinsi Bali. Secara administratif Kabupaten Tabanan dibagi menjadi kecamatan dan desa. Wilayah kabupaten mempunyai bagian- bagian yang merupakan kawasan perdesaan dan kawasan perkotaan. Analisis Diskriminan adalah metode analisis peubah ganda yang bertujuan untuk memisahkan objek pengamatan yang berbeda dan mengalokasikan objek pengamatan baru ke dalam kelompok yang telah didefinisikan, sehingga analisis diskriminan dapat digunakan untuk mengelompokkan desa ke dalam kelompok perkotaan atau perdesaan. Analisis diskriminan linear mengasumsikan bahwa matriks ragam-peragam adalah homogen, jika asumsi kehomogenan ragam tidak terpenuhi maka dapat digunakan analisis diskriminan kuadratik untuk pengelompokkan. Penelitian ini menggunakan metode k-fold cross validation untuk menghitung keakuratan fungsi diskriminan kuadratik dengan . Fungsi diskriminan kuadratik diperoleh pada dengan nilai APER terkecil ( ). Semua hasil klasifikasi yang diperoleh adalah stabil dan konsisten.

Kata kunci: analisis diskriminan kuadratik, k-fold cross validation klasifikasi, perdesaan, perkotaan

(2)

vi

Title : Discriminant Analysis in Village’s Classification at Tabanan Regency Using K-Fold Cross Validation Method

Name : Ida Ayu Made Supartini

Supervisors : 1. Ir. I Komang Gde Sukarsa, M.Si 2. I Gusti Ayu Made Srinadi, S.Si, M.Si

ABSTRACT

Tabanan Regency is one of regencies and town in Bali Province.

Administratively, it is divided into districs and villages. Discriminant analysis is a technique related to the separation of objects into different groups that have been set previously, thus discriminant analysis can be used to classify villlages into urban or rural groups. Linear discriminant analysis assumes that the covariance matrix of the two groups are equals, if the assumption of equality covariance matrix is denied, quadratic discriminant analysis can be used for classification. This research used k-fold crosss validation method for calculating the accuracy of quadratic discriminant function where . Quadratic discriminant function is obtained by with the smallest APER value ( ). All of classification results are stable and consistence.

Keywords: Quadratic Disciminant Analysis, K-Fold Cross Validation, classification, rural, urban

(3)

x DAFTAR ISI

LEMBAR JUDUL ... i

LEMBAR PERSEMBAHAN ... ii

LEMBAR PERNYATAAN ... iii

LEMBAR PENGESAHAN TUGAS AKHIR ... iv

ABSTRAK ... v

ABSTRACT ... vi

BIODATA ALUMNI ... vii

KATA PENGANTAR ... viii

DAFTAR ISI ... x

DAFTAR TABEL ... xiii

DAFTAR GAMBAR ... xv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 4

1.3 Batasan Masalah ... 5

1.4 Tujuan Penelitian ... 5

1.5 Manfaat Penelitian ... 5

BAB II TINJAUAN PUSTAKA ... 7

2.1 Penelitian Sebelumnya ... 7

2.2 Analisis Peubah Ganda ... 8

2.3 Analisis Diskriminan ... 10

2.3.1 Signifikansi Fungsi Diskriminan ... 18

2.3.2 Uji Distribusi Normal Ganda ... 19

2.3.3 Uji Vektor Nilai Rata-Rata ... 20

2.3.4 Uji Kehomogenan Ragam (Box's M) ... 21

2.3.5 Pencilan Peubah Ganda ... 22

2.3.6 Penduga Maximum Likelihood Estimation (MLE) ... 23

2.3.7 Metode Cross Validation ... 25

2.3.8 Mengalokasikan Individu Baru untuk Analisis Diskriminan dengan Dua Kelompok ... 27

(4)

xi

2.4 Uji Ketepatan Klasifikasi ... 28

2.4.1 Apparent Error Rate (APER) ... 29

2.4.2 Uji Keakuratan ... 29

2.4.3 Uji Kestabilan ... 31

2.5 Penentuan Status Daerah ... 31

2.5.1 Daerah Perkotaan dan Daerah Perdesaan ... 32

2.5.2 Kriteria Desa Perkotaan ... 32

BAB III METODE PENELITIAN ... 35

3.1 Sumber Data ... 35

3.2 Identifikasi Peubah Penelitian ... 35

3.3 Metode Analisis Data ... 35

BAB IV HASIL DAN PEMBAHASAN ... 37

4.1 Statistik Deskriptif ... 37

4.2 Uji Asumsi Dasar Analisis Diskriminan ... 38

4.2.1 Uji Distribusi Normal Ganda ... 38

4.2.2 Uji Vektor Nilai Rata-Rata ... 41

4.2.3 Uji Kehomogenan Matriks Ragam Peragam ... 42

4.2.4 Uji Pencilan (Outlier) ... 43

4.3 Analisis Diskriminan Bertatar (Stepwise Discriminant Analysis) ... 45

4.4 Metode K-Fold Cross Validation ... 47

4.4.1 Metode 2-Fold Cross Validation ... 48

4.4.2 Metode 3-Fold Cross Validation ... 53

4.4.3 Metode 4-Fold Cross Validation ... 63

4.5 Uji Ketepatan Klasifikasi ... 77

4.5.1 Peluang Kesalahan Klasifikasi (APER) ... 77

4.5.2 Uji Keakuratan ... 83

4.5.3 Uji Kestabilan ... 85

BAB V SIMPULAN DAN SARAN ... 87

5.1 Simpulan ... 87

5.2 Saran ... 88

DAFTAR PUSTAKA ... 89

(5)

xii

LAMPIRAN ... 91

(6)

xiii

DAFTAR TABEL

Tabel 2.1 Tabel Kesalahan Klasifikasi ... 29

Tabel 2.2 Variabel, Klasifikasi, Skor, dan Kriteria Desa Perkotaan ... 33

Tabel 4.1 Deskriptif Data Klasifikasi Desa di Kabupaten Tabanan ... 37

Tabel 4.2 Nilai Jarak Mahalanobis masing-masing data ... 39

Tabel 4.3 Hasil Uji Vektor Nilai Rata-Rata ... 41

Tabel 4.4 Hasil Uji Box’s M ... 42

Tabel 4.5 Hasil Uji Stepwise menggunakan Nilai Jarak Mahalanobis ... 46

Tabel 4.6 Hasil Uji Stepwise menggunakan Nilai Wilks' Lambda ... 46

Tabel 4.7Tabel Prediksi untuk Data Training (K2) ... 49

Tabel 4.8 Tabel Prediksi untuk Data Testing (K1) ... 51

Tabel 4.9 Tabel Prediksi untuk Data Training (K2 dan K3) ... 54

Tabel 4.10 Tabel Prediksi untuk Data Testing (K1) ... 56

Tabel 4.11 Tabel Prediksi untuk Data Training (K1 dan K3) ... 57

Tabel 4.12 Tabel Prediksi untuk Data Testing (K2) ... 59

Tabel 4.13 Tabel Prediksi untuk Data Training (K1 dan K2) ... 60

Tabel 4.14 Tabel Prediksi untuk Data Testing (K3) ... 62

Tabel 4.15 Tabel Prediksi untuk Data Training (K2, K3 dan K4)... 64

Tabel 4.16 Tabel Prediksi untuk Data Testing (K1) ... 66

Tabel 4.17 Tabel Prediksi untuk Data Training (K1,K3 dan K4)... 67

Tabel 4.18 Tabel Prediksi untuk Data Testing (K2) ... 69

Tabel 4.19 Tabel Prediksi untuk Data Training (K1,K2 dan K4)... 70

Tabel 4.20 Tabel Prediksi untuk Data Testing (K3) ... 72

Tabel 4.21 Tabel Prediksi untuk Data Training (K1,K2 dan K3 ... 73

Tabel 4.22 Tabel Prediksi untuk Data Testing (K4) ... 75

Tabel 4.23 Hasil klasifikasi data training (K2) ... 77

Tabel 4.24 Hasil klasifikasi data testing (K1) ... 77

Tabel 4.25 Hasil klasifikasi data training (K1) ... 78

Tabel 4.26 Hasil klasifikasi data testing (K2) ... 78

Tabel 4.27 Hasil klasifikasi data training (K2 dan K3) ... 78

Tabel 4.28 Hasil klasifikasi data testing (K1) ... 79

(7)

xiv

Tabel 4.29 Hasil klasifikasi data training (K1 dan K3) ... 79

Tabel 4.30 Hasil klasifikasi data testing (K2) ... 79

Tabel 4.31 Hasil klasifikasi data training (K1 dan K2) ... 80

Tabel 4.32 Hasil klasifikasi data testing (K3) ... 80

Tabel 4.33 Hasil klasifikasi data training (K2, K3 dan K4) ... 80

Tabel 4.34 Hasil klasifikasi data testing (K1) ... 81

Tabel 4.35 Hasil klasifikasi data training (K1, K3 dan K4) ... 81

Tabel 4.36 Hasil klasifikasi data testing (K2) ... 81

Tabel 4.37 Hasil klasifikasi data training (K1, K2 dan K4) ... 82

Tabel 4.38 Hasil klasifikasi data testing (K3) ... 82

Tabel 4.39 Hasil klasifikasi data training (K1, K2 dan K3) ... 82

Tabel 4.40 Hasil klasifikasi data testing (K4) ... 83

Tabel 4.41 Uji Keakuratan Hasil Klasifikasi ... 84

Tabel 4.42 Uji Kestabilan Hasil Klasifikasi... 86

(8)

xv

DAFTAR GAMBAR

Gambar 2.1 Representasi Metode k-Fold Cross Validation ... 27 Gambar 4.1 Plot Distribusi Normal Ganda Seluruh Peubah Prediktor ... 38

(9)

1 BAB I PENDAHULUAN

1.1 Latar Belakang

Seiring dengan perkembangan teknologi komputer dan pengaplikasian perangkat lunak statistika dalam analisis data, ilmu statistika mengalami perkembangan yang pesat dalam hal pengkajian data. Salah satu kajian dalam analisis statistika adalah kajian yang membahas tentang pengelompokkan suatu individu baru ke dalam kelompok yang sudah ada berdasarkan karakteristik data.

Analisis peubah ganda yang digunakan untuk tujuan tersebut adalah analisis diskriminan. Analisis diskriminan bisa digunakan pada hubungan dependensi yaitu hubungan antar peubah yang sudah diketahui dengan jelas perbedaan antara peubah respon yang berskala nominal atau ordinal dan peubah penjelas yang berskala interval atau rasio.

Analisis Diskriminan adalah metode analisis peubah ganda yang bertujuan untuk memisahkan objek pengamatan yang berbeda dan mengalokasikan objek pengamatan baru ke dalam kelompok yang telah didefinisikan (Johnson &

Wichern, 2007). Dua asumsi utama yang harus dipenuhi pada analisis diskriminan adalah sejumlah peubah penjelas harus berdistribusi normal ganda dan memenuhi asumsi kehomogenan ragam. Analisis diskriminan digunakan untuk mengetahui peubah-peubah penciri yang membedakan kelompok populasi yang ada. Kelompok-kelompok yang terbentuk bersifat saling lepas yang artinya bahwa setiap pengamatan hanya dapat dimasukkan ke dalam salah satu kelompok.

(10)

2

Pada analisis diskriminan, estimasi parameter bisa menggunakan metode Maximum Likelihood Estimation (MLE). Metode Maximum Likelihood Estimation (MLE) digunakan sebagai penduga parameter apabila asumsi sebaran normal ganda terpenuhi. Fungsi yang terbentuk dalam analisis diskriminan disebut fungsi diskriminan. Fungsi diskriminan Fisher mengasumsikan bahwa pengamatan diambil dari populasi yang menyebar normal ganda (Johnson dan Wichern, 2007). Fungsi diskriminan Fisher dibentuk berdasarkan pada pendugaan vektor rata-rata dan matriks ragam-peragam yang diukur dengan kriteria rasio kemungkinan maksimum yang disebut sebagai Wilk’s Lambda (Likelihood Ratio Test).

Selain estimasi parameter, pada analisis diskriminan bisa dilakukan suatu validasi keakuratan model fungsi diskriminan. Validasi keakuratan model bisa menggunakan metode cross validation. Prinsip dasar metode cross validation adalah membagi keseluruhan data menjadi data training dan data testing. Data training digunakan untuk membentuk model fungsi diskriminan dan data testing digunakan untuk memeriksa apakah model fungsi diskriminan yang diperoleh menggunakan data training dapat diterapkan pada data baru. Penelitian ini akan menggunakan metode k-fold cross validation. Pada metode k-fold cross validation dataset dibagi menjadi sejumlah buah partisi secara acak. Selanjutnya, dilakukan sejumlah -kali eksperimen dengan masing-masing eksperimen menggunakan data partisi ke- sebagai data testing dan menggunakan sisa partisi lainnya sebagai data training. Eksperimen yang akan dilakukan sesuai dengan jumlah partisi yang dilakukan (Davidson & Hinkley, 1997).

(11)

3

Analisis diskriminan bisa diterapkan di bidang pendidikan, industri, kesehatan, sosial, ekonomi dan lainnya. Penerapan analisis diskriminan pada penelitian ini yaitu pada klasifikasi wilayah desa di Kabupaten Tabanan. Menurut Badan Pusat Statistik (2010), wilayah Indonesia dibagi ke dalam beberapa tingkat wilayah administratif, yaitu provinsi, kabupaten/kota, kecamatan, dan desa atau disebut dengan nama lain yang merupakan wilayah administratif terkecil.

Kabupaten Tabanan merupakan salah satu kabupaten dari 8 kabupaten dan 1 kota yang ada di Provinsi Bali. Secara administratif Kabupaten Tabanan dibagi menjadi 10 kecamatan dan 133 desa. Berdasarkan besarnya wilayah, Kabupaten Tabanan merupakan kabupaten terbesar kedua di Provinsi Bali. Menurut Badan Pusat Statistik Kabupaten Tabanan (2016), luas keseluruhan wilayah Kabupaten Tabanan adalah 839,33 km² (14,90% dari luas provinsi Bali).

Wilayah kabupaten mempunyai bagian-bagian yang merupakan kawasan perdesaan dan kawasan perkotaan. Setiap desa mempunyai karakteristik sosial, ekonomi, kondisi dan akses ke fasilitas perkotaan, ciri dan tipologi lingkungan yang berbeda-beda dan akan terus berubah seiring dengan kemajuan tingkat pembangunan di suatu desa. Badan Pusat Statistik menggunakan kondisi yang berbeda dan terus mengalami perubahan tersebut sebagai indikator untuk menggolongkan suatu desa ke dalam desa perkotaan atau desa perdesaan. Pada pelaksanaannya, penentuan apakah suatu desa/kelurahan termasuk daerah perkotaan atau perdesaan dilakukan oleh Badan Pusat Statistik berdasakan Peraturan Kepala Badan Pusat Statistik Nomor 37 Tahun 2010 tentang Klasifikasi Perkotaan dan Perdesaan di Indonesia (Badan Pusat Statistik, 2010).

(12)

4

Badan Pusat Statistik sebagai badan penyedia data pembagian wilayah administratif yang telah diklasifikasikan menjadi wilayah desa perkotaan atau desa perdesaan digunakan untuk keperluan statistik dan keperluan lainnya yang berhubungan dengan analisis dan perencanaan pembangunan. Data klasifikasi desa perkotaan dan desa perdesaan digunakan sebagai dasar untuk merencanakan kegiatan sensus atau survey (Badan Pusat Statistik, 2010). Kegunaan lainnya adalah jika terdapat perencanaan pembangunan dalam hal pemekaran wilayah maka berdasarkan Peraturan Kepala Badan Pusat Statistik Nomor 37 Tahun 2010 Pasal 4 menyebutkan bahwa apabila ada pembentukan desa/kelurahan/UPT baru, dimana desa/kelurahan baru tidak memiliki desa/kelurahan induk, maka status perkotaan/perdesaan dari desa/kelurahan baru tersebut harus ditentukan dengan mengimplementasikan kriteria wilayah perkotaan yang sama. Menurut Tarigan (2003), perencanaan pembangunan wilayah tersebut mencakup berbagai aspek yang tentunya mempertimbangkan peran keterkaitan antara desa dan kota.

Berdasarkan kriteria desa perkotaan dan desa perdesaan yang tercantum dalam peraturan tersebut penulis bermaksud melakukan pengklasifikasian desa di Kabupaten Tabanan ke dalam kelompok daerah perkotaan atau perdesaan dengan teknik analisis diskriminan menggunakan k-fold cross validation.

1.2 Rumusan Masalah

Berdasarkan pemaparan latar belakang masalah, rumusan masalah dalam penelitian ini yaitu:

1. Bagaimana model klasifikasi desa di Kabupaten Tabanan yang dihasilkan dengan teknik analisis diskriminan menggunakan k-fold cross validation?

(13)

5

2. Bagaimana hasil klasifikasi desa di Kabupaten Tabanan yang dihasilkan dengan teknik analisis diskriminan menggunakan k-fold cross validation? 3. Bagaimana ketepatan hasil klasifikasi desa di Kabupaten Tabanan dengan

teknik analisis diskriminan menggunakan Apparent Error Rate (APER)?

1.3 Batasan Masalah

Adapun batasan dari penelitian ini yaitu:

1. Penelitian ini menggunakan teknik analisis diskriminan dengan metode k- fold cross validation pada klasifikasi desa di Kabupaten Tabanan.

2. Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Badan Pusat Statistik Kabupaten Tabanan tahun 2015.

1.4 Tujuan Penelitian

Berdasarkan pemaparan rumusan masalah, tujuan dari penelitian ini yaitu:

1. Mengestimasi model klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan k-fold cross validation.

2. Mengetahui hasil klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan k-fold cross validation.

3. Mengetahui ketepatan hasil klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan Apparent Error Rate (APER).

1.5 Manfaat Penelitian

Adapun manfaat yang diharapkan peneliti mengenai aplikasi analisis diskriminan dengan metode k-fold cross validation pada klasifikasi desa di Kabupaten Tabananyaitu:

(14)

6

1. Bagi penulis, dapat mengetahui estimasi model klasifikasi dan ketepatan hasil klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan k-fold cross validation.

2. Bagi pembaca, dapat memberikan referensi dalam penelitian selanjutnya mengenai teknik analisis diskriminan menggunakan k-fold cross validation.

Referensi

Dokumen terkait

Natural rate of output Quantity of Output Price Level 0 Short-run aggregate supply Long-run aggregate supply Aggregate demand A Equilibrium price.. TWO CAUSES OF ECONOMIC

SABAR BAKO adik kandung HUMALA BAKO (Ayah Pelawan) dan disaksikan oleh RELLUS BAKO adik kandung HUMALA BAKO dimana tanah yang diperoleh SYEH MUHAMMAD JAMIL

Banyak sproket menggunakan jenis bahan dari baja dengan karbon medium serta unsur lainnya yang ditambahkan demi meningkatkan nilai kekerasan, seperti nikel,

Variabel yang akan diteliti dikelompokkan ke dalam variabel pengalaman pelatihan, latar belakang pendidikan, sikap profesional, kualitas kinerja; serta subvariabel

Penelitian yang dilakukan oleh Adisi Sharesia Rusena dengan judul analisis fundamental dan teknikal pada saham syariah di Indonesia. Penelitian ini bertujuan untuk mengetahui

Identifikasi dan perumusan masalah dari pengabdian masyarakat ini bagaimana mendesain komposter anaerobik untuk sampah basah yang ada di Perumahan Pondok Cempaka Indah Kota

Kromatografi Cair Tenaga Tinggi (KCKT) atau biasa juga disebut dengan High Performance Liquid Chromatography (HPLC) merupakan metode yang tidak destruktif dan

Praktikum kali ini akan dikenalkan dan dilakukan cara pembuatan kandang mencit yang baik, pemberian dosis dan cara injeksi pada mencit putih, sehingga diharapkan praktikan