• Tidak ada hasil yang ditemukan

NONPARAMETRIK BIRESPON PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR SPLINE TRUNCATED (STUDI KASUS: SUNGAI BRANTAS DI SEKITAR LOKASI INDUSTRI) SKRIPSI

N/A
N/A
Protected

Academic year: 2019

Membagikan "NONPARAMETRIK BIRESPON PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR SPLINE TRUNCATED (STUDI KASUS: SUNGAI BRANTAS DI SEKITAR LOKASI INDUSTRI) SKRIPSI"

Copied!
101
0
0

Teks penuh

(1)

PEMODELAN BIOLOGICAL OXYGEN DEMAND (BOD) DAN CHEMICAL

OXYGEN DEMAND (COD) DENGAN PENDEKATAN REGRESI

NONPARAMETRIK BIRESPON PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR SPLINE TRUNCATED

(STUDI KASUS: SUNGAI BRANTAS DI SEKITAR LOKASI INDUSTRI)

SKRIPSI

WINDHU MANJA PERMATA

PROGRAM STUDI S1 STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI

(2)
(3)
(4)

PEDOMAN PENGGUNAAN SKRIPSI

(5)
(6)

KATA PENGANTAR

Alhamdulillah puji syukur kehadirat Allah SWT atas berkat, rahmat, dan

hidayah yang telah diberikan sehingga penulis dapat menyelesaikan skripsi yang berjudul “Pemodelan Biomedical Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) dengan Pendekatan Regresi Nonparametrik Birespon pada Data

Longitudinal Berdasarkan Estimator Spline Truncated (Studi Kasus: Sungai

Brantas di Sekitar Lokasi Industri)”.

Dalam kesempatan ini penulis menyampaikan penghargaan dan ucapan

terima kasih kepada sebesar-besarnya kepada :

1. Kedua Orang Tua tercinta, Bapak Suhadi dan Ibu Dewi Aliah, adik tersayang, Bhaldha Arija Ghoza serta keluarga besar penulis yang tak henti-hentinya

mendoakan dan telah memberikan semangat, kasih sayang, kepercayaan, dan

pengorbanan yang tiada terkira besarnya.

2. Ibu Dr. Nur Chamidah, M.Si selaku dosen pembimbing I dan Bapak Dr. Ardi

Kurniawan, M. Si selaku dosen pembimbing II yang telah memberikan

bimbingan dan arahan kepada penulis dari awal kuliah hingga menyelesaikan

proposal skripsi ini.

3. Bapak Drs. Sediono, M.Si selaku Dosen Wali selama menjadi mahasiswa

Statistika Universitas Airlangga yang telah memberikan bimbingan dan arahan,

serta segenap Dosen Statistika yang telah memberikan ilmu pengetahuan

selama perkuliahan.

4. Keluarga besar “Statistika Unair”, “Statistika Unair 2012”, “HIMATIKA 2014”, “HIMASTA UNAIR” dan keluarga “BPH HIMATIKA 2014” untuk pengalaman dan pembelajaran selama masa kuliah.

5. Teman-teman seperjuangan semester 8, atas bantuan, dukungan, serta

kekompakan selama berjuang mengerjakan skripsi dan menyelesaikan kuliah.

6. Putri, Ria, Inesia, Intan, dan Mifta yang telah membantu penulis dalam

menyelesaikan skripsi.

(7)

8. “Dewan Komodo”, Dian, Lussi, Muiz, Muhindro, Adit, Ali, Mahenda, Arief, Iswah, Alfin, Edo, dan Firman” yang telah menjadi keluarga dan mengajarkan banyak hal.

Penulis menyadari bahwa skripsi ini masih memiliki banyak kekurangan,

oleh karena itu diharapkan kritik dan saran yang membangun dari semua pihak.

Surabaya, Agustus 2016

(8)

Windhu Manja Permata, 2016. Pemodelan Biological Oxygen Demand (BOD)

dan Chemical Oxygen Demand (COD) dengan Pendekatan Regresi

Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator

Spline Truncated (Studi Kasus: Sungai Brantas di Sekitar Lokasi Industri). Skripsi ini dibawah bimbingan Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan M. Si, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.

ABSTRAK

Wilayah Sungai (WS) Brantas yang berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis nasional dan merupakan sungai yang mempunyai manfaat salah satunya untuk pembuangan limbah industri. Sebagian besar limbah industri masih belum melalui proses pengolahan ketika dibuang ke sungai. Tujuan penelitian ini adalah untuk memodelkan kandungan Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) sebagai parameter pencemaran air oleh limbah industri di 18 titik pengamatan WS Brantas di sekitar lokasi industri yaitu Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, PT. Tjiwi Kimia. Penelitian ini menggunakan pendekatan regresi nonparametrik birespon pada data longitudinal berdasarkan estimator spline truncated dengan menggunakan satu prediktor, yaitu Total Suspended Solid (TSS). Hasil penelitian dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan memilih nilai GCV yang minimum diperoleh nilai nilai GCV minimum adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1 adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135; 0,022433; 0,04995; 0,1096; 0,26. Kesimpulan dari hasil estimasi adalah nilai BOD dan COD terendah adalah titik pengamatan di sekitar lokasi PT Pindad dengannilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi PT Pindad terletak pada interval x<0, 01135, sedangkan nilai BOD dan COD BOD tertinggi adalah pada titik pengamatan di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo dengan nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo terletak pada interval

0, 26

x≥ .

(9)

Windhu Manja Permata, 2016. Modeling of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) with Biresponse Nonparametric Regression Approach in Longitudinal Data based of Spline Truncated Estimator (Case Study: Brantas River Around the Industry Location). This

Skripsi is under advised by Dr. Nur Chamidah, M.Si. and Dr. Ardi Kurniawan, M.Si., Mathematics Departemen, Faculty of Science and Technology, Airlangga University, Surabaya.

ABSTRACT

Wilayah Sungai (WS) Brantas in the province of East Java established as one of the national strategic which has the advantage of one of them for the disposal of industrial waste. Most industrial waste have not through the treatment process when thrown into the river. The purpose of this study is to estimation model of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) as a parameter of water pollution by industrial waste in the 18 observation points around the location of industry of WS Brantas, there are, Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, and PT. Tjiwi Kimia. This study uses biresponse nonparametric regression model estimation on longitudinal data based on spline truncated by using one predictor, namely Total Suspended Solid (TSS). The results is using criteria of Generalized Cross Validation (GCV) by selecting the minimum value of GCV. The minimum value of GCV is 0.1929118 so that, the optimum smoothing parameter for response 1 is in orde 1 , and for response 2 is in orde 2, with 5 knots optimum point , there are, 0.01135; 0.022433; 0.04995; 0.1096; 0.26. The conclusion of the estimation is the lowest value of BOD and COD is at observation points that around the location of PT Pindad with TSS value is at the interval x<0, 01135, while the highest value of BOD and COD is at observation points that around the site of Peternakan Babi Hanjoyo and UD. Sumberejo with TSS values is at intervalsx≥0, 26.

(10)

DAFTAR ISI

LEMBAR JUDUL ... i

LEMBAR PERNYATAAN ... ii

LEMBAR PENGESAHAN ... iii

PEDOMAN PENGGUNAAN SKRIPSI ... iv

LEMBAR ORISINALITAS ... v

KATA PENGANTAR ... vi

ABSTRAK ... viii

ABSTRACT ... ix

DAFTAR ISI ... x

DAFTAR TABEL ... xiii

DAFTAR GAMBAR ... xiv

DAFTAR LAMPIRAN ... xv

BAB I PENDAHULUAN 1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 6

(11)

1.4 Manfaat ... 7

1.5 Batasan Masalah ... 8

BAB II TINJAUAN PUSTAKA 2.1 Sungai Brantas ... 9

2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran... 10

2.3 Air Limbah Industri... 10

2.4 BOD dan COD ... 11

2.5 Total Suspended Solid (TSS) ... 12

2.6 Matriks ... 13

2.7 Regresi Nonparametrik ... 17

2.8 Kuantil ... 18

2.9 Estimator Spline Truncated ... 19

2.10Data Longitudinal... 23

2.11Homoskedastisitas dan Heterokedastisitas ... 24

2.12Uji Box’s M ... 25

2.13Uji Korelasi Pearson ... 27

2.14Regresi Nonparametrik Birespon Spline Truncated ... 28

2.15Weighted Least Square ... 29

2.16Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated ... 30

(12)

BAB III METODE PENELITIAN

3.1Data dan Sumber Data ... 35

3.2Variabel Penelitian ... 36

3.3Langkah Analisis ... 37

BAB IV HASIL DAN PEMBAHASAN 4.1Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated ... 43

4.2Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated... 47

BAB V PENUTUP 5.1Kesimpulan ... 55

5.2Saran ... 56

DAFTAR PUSTAKA ... 57

(13)

DAFTAR TABEL

Nomor Judul Tabel Halaman

3.1Daftar Industri Titik Pengambilan Sampel Limbah ...28

3.2Variabel-Variabel Penelitian ...29

4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data

BOD dan COD (Tanpa Pembobot) ...37

4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data

BOD dan COD (Dengan Pembobot) ...38

4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di

(14)

DAFTAR GAMBAR

Nomor Judul Gambar Halaman

4.1 Plot Data Pengamatan BOD terhadap TSS ... 35

4.2 Plot Data Pengamatan COD terhadap TSS ... 36

4.3 Plot Observasi dan Estimasi Data BOD terhadap TSS ... 43

4.4 Plot Observasi dan Estimasi Data COD terhadap TSS ... 44

(15)

DAFTAR LAMPIRAN

Nomor Judul

1 Data BOD, COD, dan TSS 18 Titik WS Brantas di Sekitar Lokasi

Industri

2 Program Estimasi Model BOD dan COD dengan Pendekatan Regresi

Nonparametrik Birespon pada Data Longitudinal Berdasarkan

Estimator Spline Truncated Menggunakan Aplikasi OSS-R

3 Output Program Estimasi Model BOD dan COD dengan Pendekatan

Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan

(16)

BAB I PENDAHULUAN 1.1 Latar Belakang

Sungai merupakan sumber air permukaan yang memberikan manfaat kepada

kehidupan manusia (Sukadi, 1999). Perum Jasa Tirta 1 (PJT 1) dalam “Laporan

Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Wilayah Sungai

Bengawan Solo Tahun 2014” menyatakan Wilayah Sungai (WS) Brantas yang

berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis

nasional dan merupakan sungai yang mempunyai manfaat untuk kebutuhan

sebagai air baku air bersih, untuk proses produksi, PLTA, pertanian, perikanan

sekaligus sebagai sungai untuk pembuangan limbah industri, pertanian, perikanan

dan domestik.

Hasil penelitian dari Krisnawati dkk (2015) yang berjudul “Perancangan

Moolief Biorefactor Untuk Remediasi Air Sungai Brantas Kediri Tercemar

Limbah Domestik dan Industri” disebutkan di WS Brantas terdapat 483 industri

yang berpotensi membuang limbahnya yang berpengaruh langsung pada kualitas

air sungai. Diketahui bahwa hulu hingga hilir kali Brantas telah terdeteksi

konsentrasi senyawa estradiol 42-220 ng/L. Kondisi tersebut membahayakan

karena dapat memacu terjadinya feminisasi ikan yang berujung kepunahan.

Setiap aliran air permukaan seperti sungai memiliki kemampuan self

purification yaitu kemampuan penjernihan kembali secara alamiah dalam kurun

waktu yang berbeda tergantung pada beban pencemarnya. Pada badan-badan air

(17)

kimia, maupun biologis (Ramadhani, 2016). Berdasarkan kemampuan sungai

tersebut, maka seharusnya beban limbah yang dibuang oleh industri mengikuti

kondisi sungai tempat limbah tersebut dibuang, dengan kata lain setiap industri

memiliki ambang batas beban limbah yang berbeda, tergantung letak pembuangan

limbahnya di sungai.

Sebagian besar limbah industri masih belum melalui proses pengolahan

ketika dibuang ke sungai. Kondisi ini sangat memprihatinkan, mengingat banyak

sekali kegunaan sungai yang menjadi tempat pembuangan tersebut . Laporan PJT

1 (2014) menyebutkan bahwa status mutu air di WS Brantas cenderung tercemar

berat, hanya 25,5% yang tercemar sedang dan sekitar 52,38% air buangan limbah

industri belum memenuhi baku mutu. Untuk itu perlu adanya penelitian baku

mutu air sungai sebagai tempat pembuangan limbah industri untuk mengetahui

beban limbah yang terdapat di dalam wilayah sungai Brantas supaya mencegah

limbah industri yang overload dan menjaga kemampuan self purification sungai

tersebut.

Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)

adalah parameter yang umumnya dipakai untuk mengenal adanya pencemaran

dalam air. BOD adalah banyaknya oksigen yang dibutuhkan oleh bakteri untuk

menguraikan bahan pencemar dalam kondisi baku, sedangkan COD

mencerminkan kebutuhan bahan kimia yang dibutuhkan unuk mengoksidasi

bahan pencemar yang ada dalam air. Oleh karena itu nilai BOD dan COD yang

tinggi menunjukkan air tercemar yang berat (Herlambang, 2006). BOD dan COD

(18)

mengoksidasi zat-zat polutan di dalam air. BOD dan COD juga dapat

menggambarkan bahan organik yang terdapat dalam air (PJT1, 2014). BOD

menggambarkan banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk

mengoksidasi bahan organik karbon yang terkandung di dalam air secara

sempurna dengan menggunakan ukuran proses biokimia yang terjadi di dalam air

limbah pada periode 5 hari dan pada suhu 20oC, sedangkan COD ditentukan

dengan menggunakan oksidator kuat kalium bikromat, asam sulfat pekat, dan

perak sebagai katalis. Lamanya waktu yang dibutuhkan untuk menentukan BOD

dan penggunaan bahan-bahan berbahaya dan beracun dalam analisis COD,

sehingga diperlukan metode alternatif lain yang lebih mudah dan ramah

lingkungan untuk menetukan BOD dan COD dalam air (Simata, 2011).

Nilai BOD dipengaruhi oleh jumlah Total Suspended Solid (TSS) dan juga

zat organik yang ada dalam air. Nilai COD adalah total keseluruhan dari pengotor

TSS, zat organik, mineral bervalensi rendah, ditambah dengan zat kimia yang

memakan oksigen (Nurbana, 2015). Ramadhani (2016) menggunakan parameter

BOD, COD, dan TSS untuk menganalisis pencemaran air sungai Bengawan Solo

akibat limbah industri di kecamatan Kebakkramat kabupaten Karanganyar.

Krisnawati, dkk (2015) menggunakan parameter BOD dan COD untuk

mengetahui kualitas air sungai Brantas di wilayah Kediri tercemar limbah

domestik dan industri.

Berdasarkan peraturan gubernur Jawa Timur Nomor 72 Tahun 2013 tentang

Baku Mutu Air Limbah Bagi Industri dan / Kegiatan Usaha Lainnya, parameter

(19)

Oxygen Demand (COD), Total Suspended Solid (TSS) dan disesuaikan dengan

kegiatan usahanya. Parameter TSS digunakan sebagai parameter air limbah dan

sebagai parameter pencemaran karena perannya sebagai penduga bahan organik

dan kaitannya dengan penurunan kandungan oksigen terlarut perairan. TSS

ditentukan dengan menghitung jumlah berat lumpur kering dalam mg/l yang telah

mengalami penyaringan dengan membran berukuran 0,45 mikron dan dipanaskan

dalam oven dengan suhu 105oC selama 1 jam. Oleh karena itu, disimpulkan

adanya korelasi yang erat antara BOD dan COD, dan dalam baku mutu air limbah

penentuan parameter BOD dan COD dapat didekati dengan parameter TSS

(Nurbana, 2015).

Pendekatan parametrik mengasumsikan bahwa pola kecenderungan data

pada kurva regresi mengacu pada suatu bentuk fungsi tertentu, seperti linier,

kuadrat, kubik, dan sebagainya (Budiantara, 2012), apabila data tidak memenuhi

asumsi tersebut maka pemodelan data harus diselesaikan dengan pendekatan

nonparametrik..

Sari (2016) menyatakan bahwa kurva regresi pada pendekatan

nonparametrik hanya diasumsikan mulus atau smooth, sehingga pendekatan

nonparametrik memiliki fleksibilitas yang tinggi karena data diharapkan mencari

sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor

subyektifitas peneliti. Pemaparan sebelumnya telah menjelaskan bahwa TSS

merupakan parameter yang mempengaruhi BOD dan COD, terdapat korelasi

(20)

digunakan regresi nonparametrik birespon dengan BOD dan COD sebagai respon

dan TSS sebagai prediktor.

Berdasarkan waktu pengumpulannya data dibedakan menjadi tiga, yaitu

data cross sectional, longitudinal, dan time series. Pemantauan kualitas air

dilakukan terus menerus sehingga data yang terkumpul dapat menggambarkan

keadaan sesungguhnya dari keadaan lingkungan yang dipantau (PJT1, 2014).

Dalam kasus ini, BOD, COD, dan TSS merupakan data yang diperoleh dari

pengamatan dalam periode waktu yang berbeda beserta variabel yang

mempengaruhinya, sehingga untuk menjelaskan dinamika perubahan kondisi agar

informasi yang diperoleh lebih lengkap, data yang digunakan pada skripsi ini

adalah data longitudinal.

Salah satu pendekatan untuk mengestimasi fungsi dalam regresi

nonparametrik adalah spline truncated. Spline truncated merupakan model

polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada

polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline

truncated menyesuaikan diri secara efektif terhadap karakteristik lokal data.

Penelitian tentang regresi nonparamretrik birespon pada data longitudinal sudah

pernah dilakukan oleh Sari (2016) dengan menggunakan Weighted Spline

Truncated. Dalam skripsi ini, peneliti menggunakan Weighted Spline Truncated

sebagai estimator untuk diterapkan pada data longitudinal BOD, COD, dan TSS.

Estimasi kurva regresi nonparametrik spline truncated dapat dilakukan dengan

memilih parameter smoothing, yaitu orde, banyaknya titik knot, dan titik knot

(21)

dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan

memilih nilai GCV yang minimum.

Berdasarkan pemaparan di atas, peneliti ingin membahas pencemaran

sungai Brantas yang berada di sekitar lokasi industri dengan pendekatan regresi

nonparametrik birespon dengan menggunakan data longitudinal berdasarkan

estimator spline truncated dengan BOD dan COD sebagai respon dan TSS

sebagai prediktor. Penelitian dalam skripsi ini tidak dapat dilakukan secara

manual, untuk itu dibutuhkan bantuan aplikasi dalam penyelesaiannya. Salah satu

aplikasi yang dapat digunakan untuk membantu penyelesaian penilitian ini adalah

aplikasi Open Source Software (OSS) R.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan masalah

sebagai berikut:

1. Bagaimana mengestimasi model BOD dan COD sebagai parameter

kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan

regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator spline truncated menggunakan program pada aplikasi OSS-R?

2. Bagaimana menganalisis dan menginterpretasi hasil estimasi model BOD

dan COD sebagai parameter kualitas air sungai Brantas di sekitar lokasi

industri dengan pendekatan regresi nonparametrik birespon pada data

(22)

1.3 Tujuan

Tujuan yang ingin dicapai dalam skripsi ini diantaranya:

1. Mengestimasi model BOD dan COD sebagai parameter kualitas air

sungai Brantas di sekitar lokasi industri dengan pendekatan regresi

nonparametrik birespon pada data longitudinal berdasarkan estimator

spline truncated menggunakan program pada aplikasi OSS-R

2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD

sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri

dengan pendekatan regresi nonparametrik birespon pada data

longitudinal berdasarkan estimator spline truncated.

1.4 Manfaat

Skripsi ini diharapkan dapat memberikan manfaat sebagai berikut:

1. Menambah wawasan tentang estimasi model regresi nonparametrik

birespon pada data longitudinal berdasarkan estimator spline truncated.

2. Mengetahui estimasi BOD dan COD sebagai parameter kualitas air

sungai Brantas di sekitar lokasi industri untuk dapat digunakan sebagai

acuan dalam pembuangan limbah industri di sungai Brantas

3. Memberikan masukan kepada pemerintah, khususnya PJT 1 dalam

mengukur BOD dan COD dengan cara yang lebih mudah agar nantinya

dapat menindaklanjuti peraturan pembuangan limbah industri di WS

(23)

1.5 Batasan Masalah

Agar pembahasan tidak melebar, maka masalah perlu dibatasi sebagai

berikut:

1. Ruang lingkup pembahasan model regresi nonparametrik birespon pada

data longitudinal BOD dan COD dalam skripsi ini hanya dibatasi satu

variabel prediktor, yaitu TSS.

2. Data pengamatan diambil dari 18 titik WS Brantas yang berada di sekitar

lokasi industri.

Penelitian dalam skripsi ini menggunakan estimator spline truncated dan dalam

(24)

BAB II

TINJAUAN PUSTAKA

Pada bab ini akan dibahas mengenai beberapa tinjauan pustaka yang akan

digunakan untuk pembahasan pada bab-bab berikutnya.

2.1 Sungai Brantas

Wilayah Sungai (WS) Brantas merupakan WS terbesar kedua di pulau Jawa,

terletak di propinsi Jawa Timur. Sungai Brantas mempunyai panjang ± 320 km

dan memiliki luas wilayah sungai ± 14.103 km2 yang mencakup ± 25% luas

propinsi Jawa Timur atau ± 9% luas pulau Jawa. WS Brantas terdiri dari empat

Daerah Aliran Sungai (DAS) yaitu DAS Brantas, DAS Tengah, DAS Ringin

Bandulan, dan DAS Kondang Merak. WS Brantas berhulu di sumber Brantas kota

Batu, mengalir melewati wilayah Malang, Blitar, Tulungagung, Kediri, Nganjuk,

Jombang, Mojokerto dan berhilir di Sidoarjo dan Surabaya dengan luas wilayah ±

1.188.575 Ha.

Sungai Brantas merupakan sungai strategis sebagai penyedia air baku untuk

berbagai kebutuhan seperti, sumber tenaga pada PLTA, PDAM, irigasi, proses

produksi industri, dan lain-lain. Peran sungai Brantas sangat vital dalam

menyangga kehidupan masyarakat Jawa Timur. Aktivitas yang ada saat ini di

sungai Brantas berupa kegiatan-kegiatan industri, penambangan bahan galian

golongan C, transportasi air, perikanan dan pertanian. Jenis kegiatan industri yang

berada di sekitar WS Brantas terdiri dari industri kertas, gula, minuman, tekstil,

(25)

2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran

Air limbah adalah sisa dari suatu hasil usaha dan atau kegiatan yang

berwujud cair. Baku mutu air limbah adalah ukuran batas atau kadar unsur

pencemar dan atau jumlah unsur pencemar yang ditenggang keberadaannya dalam

air limbah yang akan dibuang atau dilepas ke dalam sumber air dari suatu usaha

dan atau kegiatan. Dalam menentukan baku mutu air limbah yang diizinkan,

didasarkan pada daya tampung beban pencemaran pada sumber air. Beban

pencemaran adalah jumlah suatu unsur pencemar yang terkandung dalam air atau

air limbah. Sedangkan daya tampung beban pencemaran adalah kemampuan air

pada suatu sumber air untuk menerima masukan beban pencemaran tanpa

mengakibatkan air tersebut menjadi cemar (Peraturan Pemerintah Republik

indonesia No.82, 2001).

2.3 Air Limbah Industri

Air limbah industri adalah air yang berasal dari rangkaian proses produksi

suatu industri dengan demikian maka air limbah tersebut dapat mengandung

komponen yang berasal dari proses produksi tersebut dan apabila dibuang ke

lingkungan tanpa pengelolaan yang benar tentunya akan dapat mengganggu badan

air penerima. Dampak pencemaran air limbah industri terhadap mutu badan air

penerima bervariasi tergantung kepada sifat dan jenis limbah, volume dan

(26)

Salah satu jenis air limbah industri yang dapat menyebabkan terjadinya

pencemaran lingkungan adalah air limbah dengan kandungan organik tinggi.

Karakteristik air limbah organik tinggi ditunjukan dengan tingginya parameter

BOD dan COD dalam air limbah. Contoh industri dengan air limbah organik

tinggi adalah industri tapioka, tahu, gula, kecap, sitrat, asam glutamat, tekstil, bir,

alkohol dan lain-lain. Kandungan BOD yang tinggi dalam air limbah industri

dapat menyebabkan turunnya oksigen perairan, keadaan anaerob (tanpa oksigen),

sehingga dapat mematikan ikan dan menimbulkan bau busuk. Untuk kandungan

COD yang tinggi dalam air limbah pengaruhnya terhadap lingkungan tergantung

dari zat organiknya, kalau dapat diurai oleh mikroorganisme pengaruhnya seperti

BOD, tetapi untuk yang tidak dapat diurai oleh mikroorganisme pengaruhnya

tergantung dari jenis zat organik yang ada di dalam air (Moertinah, 2010).

2.4 Biological Oxygen Demand dan Chemical Oxygen Demand

Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)

keduanya dapat dikatakan menggambarkan bahan organik (PJT 1, 2015). BOD

dan COD juga dapat dikatakan menggambarkan banyaknya oksigen yang

digunakan untuk mengoksidasi bahan organik di dalam air. BOD menggambarkan

banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk mengoksidasi

bahan organik karbon yang terkandung di dalam air secara sempurna dengan

menggunakan ukuran proses biokimia yang terjadi di dalam air limbah pada

periode tertentu biasanya 5 hari dan pada suhu tertentu biasanya 20oC. BOD tidak

(27)

secara relatif jumlah O2 yang digunakan untuk mengoksidasi bahan-bahan

buangan tersebut. Jika konsumsi mikroorganisme terhadap O2 tinggi yang

ditunjukkan dengan semakin kecilnya O2 terlarut, maka kandungan bahan-bahan

buangan di dalam air tersebut tinggi.

COD atau kebutuhan oksigen kimia adalah jumlah oksigen yang dibutuhkan

untuk mengoksidasi zat-zat organik yang ada dalam air oleh senyawa-senyawa

oksidator kuat kalium bikromat, asam sulfat pekat, (K2Cr2O7) dan perak sebagai

katalis. Nilai COD menunjukkan kebutuhan oksigen yang diperlukan untuk

menguraikan kandungan bahan organik dalam air secara kimiawi, khususnya bagi

senyawa organik yang tidak dapat diuraikan oleh proses biologis (Jatmiko, 2007).

2.5 Total Suspended Solid (TSS)

Nilai kekeruhan dan kecerahan dipengaruhi oleh padatan atau residu yang

tersuspensi (PJT1, 2015). TSS ditentukan dengan menghitung jumlah berat

lumpur kering dalam mg/l yang telah mengalami penyaringan dengan membran

berukuran 0,45 mikron dan dipanaskan dalam oven dengan suhu 105oC selama 1

jam. Penentuan zat padat tersuspensi (TSS) berguna untuk mengetahui kekuatan

pencemaran air limbah dan juga berguna untuk penentuan efisiensi unit

(28)

2.6 Matriks

Menurut Ruppert, et.al (2003) matriks adalah himpunan bilangan real yang

disusun secara persegi panjang, mempunyai m baris dan n kolom dengan bentuk

umum:

masing menyatakan baris dan kolom tempat beradanya sebuah elemen dari

matriks C. Beberapa operasi pada matriks adalah sebagai berikut:

a. Penjumlahan

Jika dua matriks mempunyai ukuran yang sama, maka dapat dikatakan

konformal untuk penjumlahan. Hasil penjumlahan diperoleh dengan

menambahkan elemen yang sesuai. Oleh karena itu, jika A adalah matriks

berukuran n×p dan B adalah matriks berukuran n×p , kemudian C=A+B juga

adalah matriks berukuran n×p dan diperoleh C=

( ) (

cij = aij +bij

)

. Hal ini juga berlaku untuk perhitungan pengurangan antara dua konformal antara matriks A

dan B. jika A dan B adalah matriks berukuran n×p, maka dua sifat dari penjumlahan matriks diberikan dalam teorema berikut:

(i) A+B=B+A

(29)

b. Perkalian

Misalkan A adalah matrik berukuran m n× dan B adalah matriks berukuran

n×p. Hasil perkalian AB adalah matriks C berukuran m×p dengan

jika banyaknya kolom dari mayriks A sama dengan banyaknya baris dari matriks

B.

c. Transpose

Jika A adalah matriks berukuran m n× maka transpose dari notasi A dinotasikan dengan T

A didefinisikan sebagai matriks berukuran n m× yang merupakan hasil pertukaran baris dan kolom matriks A salah satu sifat transpose

yang digunakan adalah

( )

T = T T

AB B A dengan syarat matriks A dan B masing – masing merupakan matriks yang memenuhi sifat perkalian.

d. Invers

Misalkan A adalah matriks berukuran n n× (A adalah matriks persegi). Sebuah matriks B berukuran n n× sedemikian hingga BA= I disebut invers kiri

dari A dan sebuah matriks B berukuran n n× sedemikian hingga AB= I disebut invers kanan dari A dengan I merupakan matriks identitas. Jika AB=BA=I maka

matriks B disebut invers kanan dan invers kiri dari matriks A dan matriks A dikatakan invertibel. Jika matriks A dan B masing – masing merupakan matriks yang invertibel dan AB terdefinisi maka

(

)

−1= −1 −1

AB B A . Jika A adalah matriks

simetri dan nonsingular dan dipartisi menjadi 11 12

(30)

1 invers dari A adalah:

1 1 1 1 1 1

sebagai jumlah dari elemen – elemen diagonal dari A, yaitu tr(A)=

1

f. Matriks Partisi

Partisi dari matriks A menjadi empat submatriks (persegi atau persegi

panjang) dapat diindikasikan secara simbolis sebagai berikut:

11 12 dipartisi sehingga submatrik konformal, maka perkalian AB dapat dinyatakan

sebagai berikut.

Jika B diganti oleh vektor b yang dipartisi menjadi dua himpunan dari elemen –

(31)

g. Turunan Fungsi Vektor dan Matriks

dari suatu konstanta,

1

h. Matriks Kovariansi

Varians 2 2 2 1, 2, , p

σ σ  σ dari x x1, 2,,xp dan kovariansi σij untuk semua

ij merupakan elemen – elemen dari matriks kovariansi yang dinotasikan

(32)

11 12 1

untuk varians. Varians terdapat pada diagonal Σ dan kovariansi berada pada

selain diagonal tersebut (Rencher & Schaaljee, 2008).

2.7 Regresi Nonparametrik

Regresi nonparametrik merupakan salah satu pendekatan dalam analisis

regresi yang digunakan apabila kurva regresinya tidak diasumsikan memiliki

bentuk tertentu. Dalam regresi nonparametrik, kurva regresi hanya diasumsikan

halus (smooth), sehingga pendekatan regresi nonparametrik memiliki fleksibilitas

yang tinggi karena data diharapkan mencari sendiri bentuk estimasi kurva regresi

tanpa dipengaruhi oleh faktor subyektivitas peneliti (Alfiani dkk, 2014).

Jika diberikan pasangan data ( ,x yi i) dengan i=1, 2,...,n dan pola hubungan

antara variabel respon dengan variabel prediktor tidak diketahui bentuknya, maka

dapat digunakan pendekatan regresi nonparametrik. Secara umum, model regresi

nonparametrik adalah

( )

i i i

y = f x +ε , i=1, 2,...,n (2.1)

(33)

prediktor, sedangkan εi adalah error berdistribusi normal independen dengan

mean 0 dan variansi σ2 (Eubank, 1999). Terdapat beberapa teknik untuk

mengestimasi kurva regresi dalam regresi nonparametrik, diantaranya yaitu

regresi spline, kernel, deret fourier dan lain-lain.

2.8 Kuantil

Kuantil adalah nilai-nilai yang membagi suatu jajaran data menjadi

bagian-bagian yang sama. Menurut Walpole (1997), kuantil adalah nilai-nilai yang

dibawahnya terdapat sejumlah pecahan atau persentase tertentu dari seluruh

pengamatan. Beberapa kuantil yang sering dibahas diantaranya adalah persentil,

desil, dan kuartil.

a. Persentil

Nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang

sama disebut persentil dan umumnya dinotasikan dengan P P1, 2,...,P99. Notasi P1

berarti bahwa 1% dari seluruh data terletak di bawah P1, 2% terletak di bawah P2

dan seterusnya sampai P99 yang menyatakan bahwa 99% terletak di bawah P99.

b. Desil

Nilai-nilai yang membagi jajaran data menjadi 10 bagian yang sama

dinamakan desil. Nilai-nilai tersebut dinotasikan dengan D D1, 2,...,D9 yang

berarti bahwa 10% data terletak di bawah D1, 20% terletak di bawah D2, dan

(34)

c. Kuartil

Nilai-nilai yang membagi data menjadi 4 bagian yang sama disebut kuartil

dan dinotasikan dengan Q Q Q1, 2, 3. Notasi Q1 berarti bahwa 25% data terletak di

bawah Q1, 50% data terletak di bawah Q2, dan 75% data terletak di bawah Q3.

Persentil ke-50, desil kelima, dan kuartil kedua dari suatu data disebut median.

Untuk menentukan kuantil data tak terkelompok, dapat digunakan prosedur

seperti dalam menentukan median. Sedangkan untuk data terkelompok, dapat

dengan rumus kuantil ke-i

(

)

L = batas bawah nyata kelas dari kelas kuantil ke-i

n = banyaknya data (jumlah seluruh frekuensi)

r = konstanta (untuk kuartil r=4, desil r=10, persentil r=100)

(

f

)

Li = jumlah frekuensi seluruh kelas yang lebih rendah daripada kelas

kuantil ke-i

,

kuantil i

f = frekuensi kelas kuantil ke-i

c = lebar interval kelas kuantil (Harinaldi, 2005)

2.9 Estimator Spline Truncated

(35)

polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada

polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline

truncated menyesuaikan diri secara efektif terhadap karakteristik lokal dari data.

Secara umum, fungsi spline truncated berorde (p) dengan titik-titik knot

1, 2,..., M

θ θ θ adalah sembarang fungsi yang dapat disajikan dalam bentuk sebagai

berikut:

2.8.1 Estimasi Parameter Regresi Spline Truncated

Misalkan terdapat n pengamatan { , }n1

i i i

x y = yang memenuhi

persamaan (2.1) dengan f x( )i merupakan fungsi spline truncated yang

telah diuraikan pada persamaan (2.2). Dugaan fungsi kurva f x( ) dapat

diperoleh melalui estimasi koefisien

0 1 1 2

Nilai estimasi y

 dapat diperoleh dengan menggunakan rumus sebagai

berikut: ˆ T 1 T ( )

y= X X X − X y= A λ y

   (2.4)

dengan ( ) T 1 T

(36)

orde ( )p , jumlah knot (M), dan titik knot (θ θ1, 2,...,θM ), dapat dituliskan

dalam notasi λ=( ,p M, ( ,θ θ1 2,...,θM))

Apabila ingin mengestimasi kurva regresi nonparametrik dengan

pendekatan regresi spline truncated, maka secara teoritis dapat dilakukan

dengan mencari model spline terbaik berdasarkan orde dan titik knot

optimum yaitu banyaknya titik knot dan letak titik-titik knot (Sari, 2016).

2.8.2 Generalized Cross Validation (GCV)

Dalam analisis regresi nonparametrik dengan pendekatan spline

truncated perlu dilakukan pemilihan parameter smoothing optimum untuk

memperoleh pemodelan yang baik. Salah satu metode yang digunakan

sebagai kriteria untuk menentukan parameter smoothing optimum adalah

dengan menentukan nilai Generalized Cross Validation (GCV) yang

minimum. Menurut Wulandari dan Budiantara (2014) dalam Sari (2016),

secara teoritis kriteria GCV mempunyai sifat optimal asimtotik dan dapat

didefinisikan sebagai berikut:

(

)

2 identitas, dan n adalah jumlah pengamatan (Sari, 2016).

2.8.3 Pemilihan Titik Knot Optimal

Pemilihan jumlah dan titik knot optimal perlu dilakukan untuk

(37)

banyaknya titik knot atau banyaknya titik perubahan perilaku fungsi pada

interval yang berlainan. Ruppert (2002) dalam Sari (2016) menyatakan

bahwa titik knot terletak pada sampel kuantil dari nilai-nilai unique

(tunggal) variabel prediktor

{ }

1

n i i

x = . Salah satu metode yang dapat

digunakan untuk menentukan jumlah dan lokasi titik knot optimal adalah

metode full-search. Algoritma dari metode full-search yang didasarkan pada

kriteria Generalized Cross Validation (GCV) adalah:

a. Membandingkan nilai GCV

( )

λ pada M =1 dan M =2.

i. Apabila nilai GCV

( )

λ pada M =1 lebih kecil dari nilai GCV

( )

λ

pada M =2, maka algoritma berhenti dengan memilih jumlah knot

optimal yaitu M =1.

ii. Apabila nilai GCV

( )

λ pada M =1 lebih besar dari nilai

( )

GCV λ pada M =2, maka algoritma ini akan dilanjutkan

dengan membandingkan nilai GCV

( )

λ untuk M =2 dan M =3.

b. Membandingkan nilai GCV

( )

λ pada M =2 dan M =3.

i. Apabila nilai GCV

( )

λ pada M =2 lebih kecil dari nilai

( )

GCV λ pada M =3, maka algoritma berhenti dengan memilih

(38)

ii. Apabila nilai GCV

( )

λ pada M =2 lebih besar dari nilai

( )

GCV λ pada M =3, maka algoritma ini akan dilanjutkan

dengan membandingkan nilai GCV

( )

λ untuk M =3 dan M =4.

c. Membandingkan nilai GCV

( )

λ pada M =3 dan M =4 yang

dilakukan dengan cara yang sama seperti di atas, demikian seterusnya

hingga diperoleh nilai GCV

( )

λ yang minimum.

2.10 Data Longitudinal

Data longitudinal merupakan data yang diperoleh dari pengamatan yang

dilakukan secara berulang dari waktu ke waktu pada satu unit eksperimen. Pada

data cross sectional setiap obyek hanya diamati satu kali (Wu & Zhang, 2006).

Berbeda dengan data time series, data longitudinal mengobservasi beberapa obyek

yang saling independen. Dengan demikian, data longitudinal juga dikenal sebagai

gabungan antara data cross sectional dan time series (Frees, 2003). Cakupan

pengertian serta karakteristik dari penelitian yang melibatkan data longitudinal

adalah sebagai berikut:

a. Data dikumpulkan untuk setiap obyek dan setiap variabel pada dua atau

lebih periode waktu tertentu.

b. Kasus atau subyek yang dianalisis sama atau setidaknya dapat

diperbandingkan antara satu periode dengan periode berikutnya.

c. Analisis melibatkan perbandingan data dari kasus yang sama dalam satu

(39)

Struktur data longitudinal dapat diuraikan dalam Tabel 2.1 sebagai berikut:

Tabel 2.1 Struktur Data Longitudinal

Subyek Pengamatan Respon Prediktor

1

merupakan banyaknya pengamatan yang dilakukan pada setiap unit eksperimen

sehingga total pengamatan adalah

1

2.11 Homoskedastisitas dan Heteroskedastisitas

Salah satu asumsi dalam analisis regresi adalah homoskedastisitas yang

berarti bahwa variansi dari setiap εi tidak tergantung pada variabel pediktor.

Variansi dari setiap εi bernilai sama untuk semua variabel pediktor, sehingga

(40)

1, 2,...,

i= s. Pelanggaran terhadap asumsi ini disebut heteroskedastisitas yang

berarti bahwa variansi dari setiap error bersifat tidak konstan. Dalam analisis

regresi, heteroskedastisitas dinyatakan sebagai berikut:

(

)

2

i i i

Var ε x =σ , i=1, 2,...,s (2.6)

Persamaan (2.6) juga dapat dinotasikan dalam model di bawah ini.

2

Salah satu metode yang digunakan untuk mendeteksi adanya kasus

heteroskedastisitas adalah uji Box M. Uji Box M adalah uji statistika yang

digunakan untuk menguji heteroskedastisitas suatu kovarians matriks, dengan

subjek ke-i pengamatan ke-j dan dinyatakan dalam model regresi T

(41)

Statistik Uji Box M adalah sebagai berikut :

s : jumlah subjek yang diamati

ti : jumlah pengamatan dalam setiap subjek ke-i

T : jumlah dari ti

ij

W : matriks pembobot (Box, 1949)

Untuk menguji signifikansi nilai N yang telah diperoleh, maka digunakan

(42)

2.13 Uji Korelasi Pearson

Koefisien korelasi merupakan suatu nilai yang mengukur keeratan

hubungan antara dua variabel. Koefisien korelasi yang dihitung untuk data

populasi dinotasikan dengan ρ sedangkan koefisien korelasi yang dihitung untuk

data sampel dinotasikan dengan r. Nilai koefisien korelasi dapat dihitung dengan

menggunakan Pearson Product Moment pada persamaan (2.9) sebagai berikut:

(

)

(

)

(

)

r= maka disebut dengan korelasi linier positif sempurna. Apabila nilai r= −1

maka dinamakan korelasi linier negatif sempurna, sedangkan apabila nilai r=0

menunjukkan bahwa tidak terdapat korelasi diantara kedua variabel tersebut.

Pengujian koefisien korelasi dilakukan dengan menggunakan hipotesis,

yaitu

0

H : ρ=0(kedua variabel tidak memiliki hubungan linier)

1

H : ρ>0, ρ<0 atau ρ ≠0

Konversi nilai koefisien korelasi menjadi distribusi t adalah

2

(43)

variabel-diperoleh berdasarkan persamaan (2.10). Nilai statistik uji t yang telah variabel-diperoleh

berdasarkan persamaan (2.10) selanjutnya dibandingkan dengan nilai t tabel.

Apabila nilai t hitung kurang dari t tabel maka H0 diterima sehingga dapat

disimpulkan bahwa tidak terdapat korelasi linier diantara kedua variabel,

demikian sebaliknya. (Brase dan Corrinne, 2013)

2.14 Regresi Nonparametrik Birespon Spline Truncated

Analisis regresi yang melibatkan dua variabel respon dan diantara variabel

respon tersebut terdapat korelasi atau hubungan yang kuat, baik secara logika

maupun matematis disebut regresi birespon. Apabila bentuk kurva regresi

birespon tidak diketahui, maka pendekatan yang digunakan adalah pendekatan

nonparametrik sehingga disebut regresi nonparametrik bi-response. Secara umum,

model untuk regresi nonparametrik birespon dapat dituliskan sebagai berikut:

( ) menyatakan indeks untuk subyek yang diamati. Fungsi f adalah kurva regresi

yang tidak diketahui bentuknya dan dapat dihampiri dengan fungsi spline

(44)

( )

( )

( ) ( ) ( ) ( )

(

( )

)

parameter variabel respon ke r (Wulandari dkk, 2014).

2.15 Weighted Least Square

Untuk mengilustrasikan metode Weighted Least Square (WLS), digunakan

model dua variabel regresi linier. Metode kuadrat terkecil tanpa pembobot yaitu

Ordinary Least Square (OLS) meminimumkan sedangkan metode WLS

meminimumkan jumlah kuadrat eror terboboti yang dirumuskan sebagai berikut

(

) (

)

variansi-kovariansi dari ε

 atau y dengan syarat X, yang dinotasikan dengan

( )

( )

Var ε X =Var y X = Σ

.

Persamaan (2.13) selanjutnya diturunkan terhadap β

 sedemikian sehingga

diperoleh estimator WLS sebagai berikut:

(

)

1

ˆ T T y

β = X WXX W

  (2.14)

Pada metode OLS, pembobot W merupakan matriks identitas (Farebrother,

(45)

2.16 Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Weighted Spline Truncated

Sari (2016) menyatakan persamaan regresi nonparametrik birespon pada

data longitudinal diasumsikan data berpasangan

(

x yij, ij( )1,yij( )2

)

dan memenuhi

persamaan sebagai berikut:

( )

subyek yang diamati dan j=1, 2,...,ti menyatakan indeks untuk pengamatan di

setiap subyek.

Regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator weighted spline truncated sebagai berikut:

ˆ

(46)

( )

1

(

) (

)

ˆ ˆ

2 T

MSE= T −  yy yy

     (2.17)

selanjutnya dapat diturunkan rumus MSE dalam regresi nonparametrik birespon

pada data longitudinal dan diperoleh rumus MSE sebagai berikut:

(

) (

)

nilai MSE tersebut kemudian digunakan untuk menghitung nilai Generalized

Cross Validation (GCV). Kriteria nilai GCV yang minimum digunakan untuk

menentukan jumlah knot yang optimum. Berdasarkan rumus umum GCV yang

terdapat pada persamaan (2.5), maka nilai GCV dalam regresi nonparametrik

birespon pada data longitudinal dirumuskan pada persamaan sebagai berikut:

( )

(

) (

)

Selanjutnya dilakukan uji kesesuaian model dengan menghitung kriteria

Goodness of Fit yaitu MSE dan 2

(47)

2 1 JKG

R

JKT

= − (2.20)

Jumlah Kuadrat Galat (JKG) =

(

yyˆ

) (

T yyˆ

)

    dan Jumlah Kuadrat Total (JKT)

(

) (

T

)

y y y y

= − −

    .

2.17 Open Source Software (OSS)-R

R merupakan salah satu software yang sering digunakan dalam statistika

dan termasuk dalam kategori Open Source Software (OSS) sehingga dapat

diperoleh secara gratis di situs http://www.r-project.org/ atau

http://cran.r-project.org/. Versi pertama R diluncurkan pada tahun 1992 oleh Ross Ihaka dan

Robert Gentleman (singkatan R berasal dari kedua nama tersebut) yang keduanya

dari The University of Auckland. Bahasa R berbasis bahasa S yang dibangun di

Bell Laboratories di tahun 80-an sehingga syntax R memiliki perbedaan yang

tidak terlalu banyak atau hampir identik jika dibandingkan dengan syntax pada

software S-plus (Sari, 2016).

Beberapa perintah internal yang digunakan dalam OSS-R adalah sebagai

berikut:

1. function( ), merupakan perintah untuk menunjukkan kumpulan dari

beberapa fungsi yang digunakan dalam program. Fungsi dipanggil

(48)

2. length( ), merupakan perintah yang digunakan untuk menghitung

banyaknya data. Misalkan terdapat perintah length(vector), maka akan

diperoleh hasil yaitu panjang dari vector tersebut.

3. plot( ), digunakan untuk membuat plot data. Beberapa penggunaan

perintah ini diantaranya:

a. plot(X,Y) berarti bahwa akan dibuat plot data berupa titik dengan

sumbu datar X dan sumbu tegak Y.

b. plot(X,Y,type=”l”) memberikan hasil plot bertipe garis.

c. plot(X,Y,type=”b”) memberikan hasil plot bertipe garis dan titik.

4. rep(a,b), merupakan perintah yang digunakan untuk membentuk suatu

vektor dengan anggota a sebanyak b.

5. matrix(a,b,c), merupakan perintah yang digunakan untuk membentuk

suatu matriks berukuran b×c dengan elemen a.

6. print( ), digunakan untuk menampilkan hasil atau output dari program.

7. cat(“…”), merupakan perintah untuk menuliskan kemudian

menampilkan argumen dalam bentuk karakter.

8. for( ), merupakan perintah yang digunakan untuk mengulang satu blok

pernyataan berulang kali hingga memenuhi kondisi yang telah

ditentukan. Format penulisan perintah ini adalah for( kondisi ) {

pernyataan }.

9. repeat( ), hampir mirip dengan for( ), apabila kondisi sudah terpenuhi

maka proses pengulangan akan dihentikan. Struktur penulisan

(49)

10. if-else, merupakan perintah yang digunakan untuk seleksi kondisi.

Apabila suatu kondisi bernilai benar, maka pernyataan pertama akan

dijalankan, sedangkan apabila kondisi bernilai salah maka pernyataan

kedua yang akan dijalankan. Struktur penulisan perintah ini adalah

sebagai berikut: if( kondisi ) { pernyataan pertama } else { pernyataan

kedua }

11. solve( A ), digunakan untuk menghitung invers dari suatu matriks A.

12. sum( ), digunakan untuk menghitung jumlah dari keseluruhan data.

13. rbind( ), digunakan untuk menggabungkan suatu matriks atau vektor

berdasarkan baris.

14. cbind( ), digunakan untuk menggabungkan suatu matriks atau vektor

berdasarkan kolom.

15. diag( a ), merupakan perintah yang digunakan untuk membentuk suatu

vektor a menjadi suatu matriks diagonal dengan elemen diagonal

utamanya adalah elemen dari a dan elemen yang lain bernilai nol.

16. sort( ), merupakan perintah yang digunakna untuk mengurutkan

sekumpulan data.

17. unique( ), digunakan untuk menentukan nilai tunggal dari suatu data.

18. quantile(…, …), merupakan perintah untuk menentukan sampel

kuantil.

19. order( ), merupakan perintah untuk menunjukkan vektor posisi data

(50)

20. var( ), merupakan perintah untuk menghitung nilai variansi dari suatu

vektor atau matriks variansi-kovariansi dari suatu matriks.

21. boxM(data, kelompok), merupakan syntax uji Box’s M yang

digunakan untuk menguji homogenitas matriks variansi-kovariansi

yang diperoleh dari data yang berdistribusi normal multivariate

(51)

BAB III

METODOLOGI PENELITIAN 3.1 Data dan Sumber Data

Data yang digunakan dalam skripsi ini adalah data sekunder yang berasal

dari pemantauan kualitas 18 titik WS Brantas (tanpa hilir) di sekitar lokasi industri

yang ditentukan berdasarkan lokasi pembuangannya dan jenis limbah yang

memberikan kontribusi adanya pencemaran dalam 3 triwulan yaitu bulan

April-Juni, Juli-September, dan Oktober-Desember 2015 yang dilakukan oleh Perum

Jasa Tirta 1 (PJT 1).

Titik pengambilan sampel limbah pada WS Brantas di dekitar lokasi industri

disajikan pada Tabel 3.1

Tabel 3.1. Daftar Industri Titik Pengambilan Sampel Limbah

No. Nama Industri Daerah

1 Dinas Pemotongan Hewan Malang Kota Malang

2 PT. Pindad Kabupaten Malang

3 PT. Eka Mas Fortuna Kabupaten Malang

4 Peternakan Babi Sempulur Kabupaten Malang

5 Peternakan Babi Delta Kabupaten Malang

6 CV. Sartimbul Kabupaten Tulungagung

7 Peternakan Babi Hanjoyo Kabupaten Tulungagung

8 PT. Setia Kawan Kabupaten Tulungagung

9 PT. Surya Zig Zag Kabupaten Kediri

10 PT. Surya Pamenang Kabupaten Kediri

11 UD. Sumberejo Kabupaten Kediri

12 PT. Jaya Kertas Kabupaten Nganjuk

(52)

No. Nama Industri Daerah 14 PT. Ajinomoto Indonesia Kabupaten Mojokerto

15 PT. Darmala Kabupaten Mojokerto

16 PT. Pakerin Kabupaten Mojokerto

17 PT. Sateliti Sriti Kabupaten Pasuruan

18 PT. Tjiwi Kimia Kabupaten Sidoarjo

3.2 Variabel Penelitian

Variabel-vaiabel penelitian yang digunakan dalam skripsi ini disajikan

dalam Tabel 3.2.

Tabel 3.2 Variabel-varibel Penelitian

Variabel Keterangan Variabel Satuan Tipe Variabel

ij

x

Kadar TSS pada subjek

ke-i, pengamatan ke-j

gr/l Kontinu

(1)

ij

y

Kadar BOD pada subjek

ke-i, pengamatan ke-j

gr/l Kontinu

(2)

ij

y

Kadar COD pada subjek

ke-i, pengamatan ke-j

(53)

3.3 Langkah Analisis

Langkah analisis yang dilakukan untuk menjawab rumusan masalah dalam

skripsi ini adalah sebagai berikut:

1. Mengestimasi model BOD dan COD sebagai parameter kualitas air sungai

Brantas di sekitar lokasi industri dengan pendekatan regresi nonparametrik

birespon pada data longitudinal berdasarkan estimator spline truncated

menggunakan aplikasi OSS-R dengan langkah-langkah sebagai berikut:

a. Membuat plot antara BOD dengan TSS dan COD dengan TSS.

b. Menginputkan data berpasangan (TSS, BOD, dan COD) yang

memenuhi persamaan (2.15).

c. Menguji korelasi antara variabel BOD dan COD dengan

menggunakan persamaan (2.10)

d. Menentukan parameter smoothing optimum dengan melakukan

estimasi tanpa pembobot W menggunakan metode full-search

berdasarkan kriteria GCV minimum seperti yang telah dijelaskan pada

subbab (2.8.3)

e. Menguji heteroskedastisitas pada error dengan menggunakan uji

Box’s M pada subbab (2.12)

f. Menentukan matriks pembobot W berdasarkan hasil uji heteroskedastisitas.

g. Menentukan parameter smoothing optimum dengan melibatkan

(54)

h. Mengestimasi data dengan menggunakan estimator weighted spline

truncated sehingga diperoleh data berpasangan untuk setiap subyek

pengamatan ke-i,

(

i=1, 2,...,s

)

sebanyak ti pengamatan yang

memenuhi persamaan (2.15)

i. Menghitung nilai kriteria Goodness of Fit yaitu MSE dan R-square

berdasarkan persamaan (2.17) dan (2.20)

2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri

dengan pendekatan regresi nonparametrik birespon pada data longitudinal

berdasarkan estimator spline truncated.

a. Menganalisis hasil estimasi model BOD dan COD sebagai parameter

kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan

regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator spline truncated.

b. Menginterpretasi hasil estimasi model BOD dan COD sebagai parameter

kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan

regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator spline truncated dan membuat plot antara nilai estimasi dan

observasi BOD dengan TSS dan COD dengan TSS.

Berikut disajikan flowchart dari analisis model regresi nonparametrik

(55)

Tidak dapat digunakan analisis regresi

birespon

Selesai

Mulai

Input data

Input alfa

Uji korelasi antara dan

p-value alfa

Input n

• Matriks p, vektor jp. •

xbaru

C=1

B A

Ya

(56)

B A

Vektor MSE; vektor GCV;

dan

dan

Jumlah titik knot optimum untuk orde adalah

Membandingkan untuk kombinasi orde

C Ya

Tidak

(57)

C

Melakukan estimasi dengan menggunakan parameter

smoothing optimal yang telah diperoleh

Uji heteroskedastisitas pada nilai

p-value alfa

Menghitung

variansi-kovariansi dari dan

Menghitung

variansi-kovariansi dari dan

Mereplikasi setiap elemen dari matriks variansi-kovariansi sebanyak

Mereplikasi setiap elemen dari matriks variansi-kovariansi sebanyak

Mendefinisikan hasil dari suatu vektor

Menggabungkan hasil replikasi dalam suatu vektor

Mendefinisikan vektor replikasi sebagai matriks

D

(58)

D

Menggabungkan keempat matriks diagonal, dan menghitung inversnya

Menentukan parameter smoothing optimum dengan menyertakan pembobot W

Melakukan estimasi dengan dengan menggunakan parameter smoothing optimal yang telah diperoleh beserta

Melakukan nilai dan estimasi

Menghitung MSE dan

Membuat plot estimasi

(59)

BAB IV

HASIL DAN PEMBAHASAN

Bab ini berisi pembahasan hasil analisis untuk menjawab tujuan skripsi

yang meliputi estimasi model BOD dan COD dengan pendekatan regresi

nonparametrik birespon pada data longitudinal berdasarkan estimator spline

truncated serta analisis dan interpretasi model.

4.1 Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated

Data yang digunakan dalam estimasi model regresi nonparametrik birespon

pada data longitudinal berdasarkan estimator spline truncated adalah data hasil

pengamatan BOD, COD, dan TSS di titik-titik WS Brantas di sekitar lokasi

industri pada bulan April-Juni, Juli-September, dan Oktober-Desember tahun

2015. Variabel yang digunakan diantaranya BOD sebagai variabel respon 1, COD

sebagai variabel respon 2 dan TSS sebagai variabel prediktor. Data tersebut dapat

dilihat secara lengkap pada Lampiran 1

Gambaran awal tentang hubungan data BOD dengan TSS dan COD dengan

TSS dapat dilakukan dengan membuat plot yang dapat dilihat pada Gambar 4.1

(60)

Gambar 4.1 Plot Data Pengamatan BOD terhadap TSS

Gambar 4.2 Plot Data Pengamatan COD terhadap TSS

Pada Gambar 4.1 dan Gambar 4.2 dapat dilihat pola data BOD dan COD

terhadap TSS tidak beraturan dan pola data tidak dapat diasumsikan mendekati

suatu fungsi tertentu (linier, kuadratik, kubik, dsb).

BOD dan COD memiliki korelasi atau keeratan hubungan baik secara logika

maupun secara matematis yang ditunjukkan dengan uji korelasi pearson.

(61)

H0 : Tidak terdapat korelasi diantara BOD dan COD

(

ρ =0

)

H1 : Terdapat korelasi diantara BOD dan COD

(

ρ≠0

)

Dari hasil uji korelasi pearson yang terdapat pada Lampiran 3 diperoleh nilai

koefisien korelasi antara variabel BOD dan COD sebesar 0,601 dengan nilai

p-value 1,532×10-6. Nilai p-value tersebut kurang dari α bernilai 0,05 sehingga

diperoleh keputusan untuk menolak H0. Dengan demikian diperoleh kesimpulan

bahwa terdapat korelasi antara variabel BOD dan COD sehingga dapat diestimasi

dengan pendekatan regresi birespon.

Analisis data BOD dan COD dengan menggunakan program estimasi tanpa

pembobot W yang telah dibuat menggunakan OSS-R yang telah terlampir pada

Lampiran 2 diperoleh hasil yang ditampilkan dalam Tabel 4.1 berikut,

Tabel 4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum

pada Data BOD dan COD (Tanpa Pembobot)

Orde

Pada Tabel 4.1 dapat dilihat bahwa GCV minimum adalah 0,1840114 sehingga

parameter smoothing optimum yaitu orde respon 1 adalah 2, dan orde respon 2

(62)

Setelah diperoleh perameter smoothing optimum, selanjutnya dilakukan

estimasi dengan menggunakan parameter smoothing optimum tersebut sehingga

diperoleh nilai ˆε

 untuk respon 1 dan respon 2. Pengujian heteroskedastisitas

variansi error perlu dilakukan untuk menentukan matriks pembobot W. Dalam

hal ini, uji heteroskedastisitas dilakukan dengan menggunakan uji Box’s M

dengan hipotesis sebagai berikut:

H0 : Σ = Σ = = Σ1 2 ... 18.

H1 : Minimal ada sepasang Σi yang tidak sama

(

i=1, 2,...,18

)

Berdasarkan hasil uji Box’s M yang terdapat pada Lampiran 3 diperoleh nilai

p-value untuk variansi eror data BOD dan COD adalah 9,259×10-15. Nilai p-value

tersebut kurang dari α bernilai 0,05 sehingga diperoleh keputusan untuk menolah

H0. Dengan demikian diperoleh kesimpulan terdapat kasus heterokedastisitas pada

data BOD dan COD.

Pemilihan parameter smoothing optimum perlu dilakukan ulang dengan

disertai pembobot W karena terdapat kemugkinan bahwa parameter smoothing

optimum yang diperoleh akan berbeda antara sebelum dan setelah ada matriks

pembobot W. Berdasarkan analisis data BOD dan COD dengan menggunakan

program estimasi yang menyertakan pembobot W yang terlampir pada Lampiran

2, diperoleh parameter smoothing dengan menggunakan kombinasi orde dan titik

knot yang terdapat pada Lampiran 3. Pemilihan parameter smoothing optimum

dengan menyertakan matriks pembobot W untuk data BOD dan COD

(63)

Tabel 4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum

pada Data BOD dan COD (Dengan Pembobot)

Orde

dari Tabel 4.2 dapat dilihat bahwa nilai GCV sebelum dan setelah disertakan

pembobot berbeda. Pada tabel tersebut dapat dilihat bahwa nilai GCV minimum

adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1

adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135;

0,022433; 0,04995; 0,1096; 0,26.

4.2 Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Weighted Spline Truncated

Berdasarkan Tabel 4.1 dan Tabel 4.2, diperoleh estimasi model BOD adalah

(64)

( )1

(

)

(

)

(

)

sehingga persamaan (4.1) dapat diuraikan menjadi fungsi potongan sebagai

berikut:

0, 024 1, 251 ; untuk 0,04995 0,1096 0, 082 2, 44 ; untuk 0,1096 0, 26

(65)

nilai TSS kurang dari 0,04995 gr/l, yaitu setiap kenaikan nilai TSS 1 gr/l, maka

kenaikkan BOD sebesar 2,466 gr/l. Sedangkan perubahan nilai BOD terendah di

18 titik sungai tersebut adalah ketika nilai TSS kurang dari 0,01135 gr/l, yaitu

setiap kenaikkan nilai TSS 1 gr/l, maka nilai BOD mengalami penurunan sebesar

0.215 gr/l. Selain itu, dari persamaan (4.2) dapat diketahu estimasi nilai BOD di

18 titik sungai tersebut pada nilai TSS tertentu. Misalkan nilai TSS 0,3 gr/l,

dengan menggunakan persamaan (4.2) pada interval nilai x≥0, 26 dapat

diketahui nilai estimasi BOD yaitu sebesar 0,562 gr/l.

Berdasarkan Tabel 4.2, estimasi model BOD adalah:

( )2 2

(

)

2

(

)

2

ˆ 0, 034 5, 004 326,922 372, 022 0, 01135 266,964 0, 022433

(66)

(

)

2 0, 26 untuk 0, 26

sehingga persamaan (4.3) dapat diuraikan menjadi fungsi potongan sebagai

berikut: 0, 082 13,56 698,944 ; untuk 0,01135 0, 022433 0, 216 25,538 965,908 ; untuk 0,022433 0, 04995 ˆ

0,971 55, 768 1268,511 ; untuk 0,04995 0,1096 1, 732 69, 664 13

31,965 ; untuk 0,1096 0, 26 3,182 80,816 1353, 412 ; untuk 0, 26

x x

Berdasarkan persamaan (4.4), untuk menduga nilai COD misalkan ketika nilai

TSS 0,01 gr/l dengan menggunakan persamaan (4.4) pada interval nilaix<0, 011

dapat diketahui nilai estimasi COD yaitu sebesar 0,016 gr/l. Berdasarkan

persamaan (4.2) dan persamaan (4.4) dan dengan melihat nilai rata-rata TSS pada

setiap titik pengamatan WS Brantas di sekitar lokasi industri maka diperoleh

model BOD dan COD untuk setiap titik pengamatan tersebut yang disajikan

dalam Tabel 4.3 sebagai berikut,

Tabel 4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di

Sekitar Lokasi Industri

No. Nama Industri Model Estimasi

BOD Model Estimasi COD

1 Dinas Pemotongan

Hewan Malang −0, 082 2, 44+ x

2

1, 732 69, 664− x+1331,965x

(67)

No. Nama Industri Model Estimasi

BOD Model Estimasi COD

3 PT. Eka Mas

Fortuna −0, 013 1, 418+ x

2

0, 082 13,56− x+698,944x

4 Peternakan Babi

Sempulur −0, 082 2, 44+ x

2

1, 732 69, 664− x+1331,965x

5 Peternakan Babi

Delta −0, 082 2, 44+ x

2

1, 732 69, 664− x+1331,965x

6 CV. Sartimbul −0, 082 2, 44+ x 2

1, 732 69, 664− x+1331,965x

7 Peternakan Babi

Hanjoyo 0, 487 0, 25+ x

dari Tabel 4.3 dapat dilihat bahwa titik pengamatan yang mempunyai nilai BOD

(68)

dilihat dari model BOD dan COD berturut-turut adalah 0, 00597 0, 215− x dan

2

0, 034 5, 004− x+326,922x , hal ini berarti nilai TSS pada titik pengamatan di

WS Brantas di sekitar lokasi PT Pindad terletak pada interval x<0, 01135,

sedangkan nilai BOD dan COD tertinggi adalah pada titik pengamatan di sekitar

lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo yang dapat dilihat dari

model BOD dan COD berturut-turut adalah 0, 487 0, 25+ x dan

2

3,182 80,816− x+1353, 412x , hal ini berarti nilai TSS pada titik pengamatan di

WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo

terletak pada interval x≥0, 26.

Dari persamaan (4.2) dan persamaan (4.4) diperoleh nilai MSE sebesar 0,143 dan

R-Square sebesar 86,14%. Plot antara hasil observasi dan estimasi BOD terhadap

TSS ditunjukkan pada Gambar 4.3 sebagai berikut,

(69)

Pada Gambar 4.3 di atas menujukkan bentuk kurva estimasi dan plot observasi

BOD terhadap TSS. Dalam Gambar 4.3 tersebut dapat dilihat perubahan bentuk

kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai

titik knot, ketika nilai TDS kurang dari 0,01135 sampai nilai TDS kurang dari

0,26 kurva mengalami kenaikan yang sangat tinggi yaitu dengan rata-rata nilai

kemiringan kurva 1,87 dan ketika nilai TDS 0,26 dan selebihnya perubahan nilai

kenaikan kurva konstan. Sedangakan untuk plot antara hasil estimasi dan

observasi COD terhadap TSS ditunjukkan pada Gambar 4.4 sebagai berikut,

Gambar 4.4 Plot Observasi dan Estimasi Data COD terhadap TSS

Pada Gambar 4.4 di atas menujukkan bentuk kurva estimasi dan plot observasi

COD terhadap TSS. Dalam Gambar 4.4 tersebut dapat dilihat perubahan bentuk

kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai

titik knot. Perubahan kurva sangat tinggi kecuali ketika nilai TDS diantara 0,26

Gambar

Tabel 2.1 Struktur Data Longitudinal
Tabel 3.1. Daftar Industri Titik Pengambilan Sampel Limbah
Tabel 3.2 Variabel-varibel Penelitian
Gambar 4.1 Plot Data Pengamatan BOD terhadap TSS
+7

Referensi

Dokumen terkait

Selain itu kurva regresi untuk estimator kernel lebih mulus dibandingkan dengan estimator spline , karena pada estimator kernel estimasi dilakukan pada setiap

Terlihat bahwa nilai R 2 model dengan komponen nonparametrik menggunakan fungsi atau estimator campuran Spline Truncated dan Kernel sebesar 91,91 % yang berarti

Penerapan interval konfidensi untuk parameter model regresi nonparametrik spline truncated multivariabel pada penelitian ini diterapkan pada data Indeks Pembangunan

Penerapan interval konfidensi untuk parameter model regresi nonparametrik spline truncated multivariabel pada penelitian ini diterapkan pada data Indeks Pembangunan

Artikel ini menguraikan fungsi goodness of fit dari estimator penalized spline yang digunakan dalam estimasi model regresi nonparametrik dengan melibatkan dua respon

Berdasarkan Tabel 4, terlihat estimator spline truncated memiliki nilai GCV dan MSE yang lebih kecil serta nilai koefisien determinasi yang lebih tinggi

Dari beberapa penelitian tersebut di atas, pendekatan regresi nonparametrik spline truncated multiariabel secara umum mampu memberikan analisis kausalitas hubungan

Selain itu kurva regresi untuk estimator kernel lebih mulus dibandingkan dengan estimator spline, karena pada estimator kernel estimasi dilakukan pada setiap titik