PEMODELAN BIOLOGICAL OXYGEN DEMAND (BOD) DAN CHEMICAL
OXYGEN DEMAND (COD) DENGAN PENDEKATAN REGRESI
NONPARAMETRIK BIRESPON PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR SPLINE TRUNCATED
(STUDI KASUS: SUNGAI BRANTAS DI SEKITAR LOKASI INDUSTRI)
SKRIPSI
WINDHU MANJA PERMATA
PROGRAM STUDI S1 STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
PEDOMAN PENGGUNAAN SKRIPSI
KATA PENGANTAR
Alhamdulillah puji syukur kehadirat Allah SWT atas berkat, rahmat, dan
hidayah yang telah diberikan sehingga penulis dapat menyelesaikan skripsi yang berjudul “Pemodelan Biomedical Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) dengan Pendekatan Regresi Nonparametrik Birespon pada Data
Longitudinal Berdasarkan Estimator Spline Truncated (Studi Kasus: Sungai
Brantas di Sekitar Lokasi Industri)”.
Dalam kesempatan ini penulis menyampaikan penghargaan dan ucapan
terima kasih kepada sebesar-besarnya kepada :
1. Kedua Orang Tua tercinta, Bapak Suhadi dan Ibu Dewi Aliah, adik tersayang, Bhaldha Arija Ghoza serta keluarga besar penulis yang tak henti-hentinya
mendoakan dan telah memberikan semangat, kasih sayang, kepercayaan, dan
pengorbanan yang tiada terkira besarnya.
2. Ibu Dr. Nur Chamidah, M.Si selaku dosen pembimbing I dan Bapak Dr. Ardi
Kurniawan, M. Si selaku dosen pembimbing II yang telah memberikan
bimbingan dan arahan kepada penulis dari awal kuliah hingga menyelesaikan
proposal skripsi ini.
3. Bapak Drs. Sediono, M.Si selaku Dosen Wali selama menjadi mahasiswa
Statistika Universitas Airlangga yang telah memberikan bimbingan dan arahan,
serta segenap Dosen Statistika yang telah memberikan ilmu pengetahuan
selama perkuliahan.
4. Keluarga besar “Statistika Unair”, “Statistika Unair 2012”, “HIMATIKA 2014”, “HIMASTA UNAIR” dan keluarga “BPH HIMATIKA 2014” untuk pengalaman dan pembelajaran selama masa kuliah.
5. Teman-teman seperjuangan semester 8, atas bantuan, dukungan, serta
kekompakan selama berjuang mengerjakan skripsi dan menyelesaikan kuliah.
6. Putri, Ria, Inesia, Intan, dan Mifta yang telah membantu penulis dalam
menyelesaikan skripsi.
8. “Dewan Komodo”, Dian, Lussi, Muiz, Muhindro, Adit, Ali, Mahenda, Arief, Iswah, Alfin, Edo, dan Firman” yang telah menjadi keluarga dan mengajarkan banyak hal.
Penulis menyadari bahwa skripsi ini masih memiliki banyak kekurangan,
oleh karena itu diharapkan kritik dan saran yang membangun dari semua pihak.
Surabaya, Agustus 2016
Windhu Manja Permata, 2016. Pemodelan Biological Oxygen Demand (BOD)
dan Chemical Oxygen Demand (COD) dengan Pendekatan Regresi
Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator
Spline Truncated (Studi Kasus: Sungai Brantas di Sekitar Lokasi Industri). Skripsi ini dibawah bimbingan Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan M. Si, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.
ABSTRAK
Wilayah Sungai (WS) Brantas yang berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis nasional dan merupakan sungai yang mempunyai manfaat salah satunya untuk pembuangan limbah industri. Sebagian besar limbah industri masih belum melalui proses pengolahan ketika dibuang ke sungai. Tujuan penelitian ini adalah untuk memodelkan kandungan Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) sebagai parameter pencemaran air oleh limbah industri di 18 titik pengamatan WS Brantas di sekitar lokasi industri yaitu Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, PT. Tjiwi Kimia. Penelitian ini menggunakan pendekatan regresi nonparametrik birespon pada data longitudinal berdasarkan estimator spline truncated dengan menggunakan satu prediktor, yaitu Total Suspended Solid (TSS). Hasil penelitian dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan memilih nilai GCV yang minimum diperoleh nilai nilai GCV minimum adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1 adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135; 0,022433; 0,04995; 0,1096; 0,26. Kesimpulan dari hasil estimasi adalah nilai BOD dan COD terendah adalah titik pengamatan di sekitar lokasi PT Pindad dengannilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi PT Pindad terletak pada interval x<0, 01135, sedangkan nilai BOD dan COD BOD tertinggi adalah pada titik pengamatan di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo dengan nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo terletak pada interval
0, 26
x≥ .
Windhu Manja Permata, 2016. Modeling of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) with Biresponse Nonparametric Regression Approach in Longitudinal Data based of Spline Truncated Estimator (Case Study: Brantas River Around the Industry Location). This
Skripsi is under advised by Dr. Nur Chamidah, M.Si. and Dr. Ardi Kurniawan, M.Si., Mathematics Departemen, Faculty of Science and Technology, Airlangga University, Surabaya.
ABSTRACT
Wilayah Sungai (WS) Brantas in the province of East Java established as one of the national strategic which has the advantage of one of them for the disposal of industrial waste. Most industrial waste have not through the treatment process when thrown into the river. The purpose of this study is to estimation model of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) as a parameter of water pollution by industrial waste in the 18 observation points around the location of industry of WS Brantas, there are, Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, and PT. Tjiwi Kimia. This study uses biresponse nonparametric regression model estimation on longitudinal data based on spline truncated by using one predictor, namely Total Suspended Solid (TSS). The results is using criteria of Generalized Cross Validation (GCV) by selecting the minimum value of GCV. The minimum value of GCV is 0.1929118 so that, the optimum smoothing parameter for response 1 is in orde 1 , and for response 2 is in orde 2, with 5 knots optimum point , there are, 0.01135; 0.022433; 0.04995; 0.1096; 0.26. The conclusion of the estimation is the lowest value of BOD and COD is at observation points that around the location of PT Pindad with TSS value is at the interval x<0, 01135, while the highest value of BOD and COD is at observation points that around the site of Peternakan Babi Hanjoyo and UD. Sumberejo with TSS values is at intervalsx≥0, 26.
DAFTAR ISI
LEMBAR JUDUL ... i
LEMBAR PERNYATAAN ... ii
LEMBAR PENGESAHAN ... iii
PEDOMAN PENGGUNAAN SKRIPSI ... iv
LEMBAR ORISINALITAS ... v
KATA PENGANTAR ... vi
ABSTRAK ... viii
ABSTRACT ... ix
DAFTAR ISI ... x
DAFTAR TABEL ... xiii
DAFTAR GAMBAR ... xiv
DAFTAR LAMPIRAN ... xv
BAB I PENDAHULUAN 1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 6
1.4 Manfaat ... 7
1.5 Batasan Masalah ... 8
BAB II TINJAUAN PUSTAKA 2.1 Sungai Brantas ... 9
2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran... 10
2.3 Air Limbah Industri... 10
2.4 BOD dan COD ... 11
2.5 Total Suspended Solid (TSS) ... 12
2.6 Matriks ... 13
2.7 Regresi Nonparametrik ... 17
2.8 Kuantil ... 18
2.9 Estimator Spline Truncated ... 19
2.10Data Longitudinal... 23
2.11Homoskedastisitas dan Heterokedastisitas ... 24
2.12Uji Box’s M ... 25
2.13Uji Korelasi Pearson ... 27
2.14Regresi Nonparametrik Birespon Spline Truncated ... 28
2.15Weighted Least Square ... 29
2.16Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated ... 30
BAB III METODE PENELITIAN
3.1Data dan Sumber Data ... 35
3.2Variabel Penelitian ... 36
3.3Langkah Analisis ... 37
BAB IV HASIL DAN PEMBAHASAN 4.1Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated ... 43
4.2Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated... 47
BAB V PENUTUP 5.1Kesimpulan ... 55
5.2Saran ... 56
DAFTAR PUSTAKA ... 57
DAFTAR TABEL
Nomor Judul Tabel Halaman
3.1Daftar Industri Titik Pengambilan Sampel Limbah ...28
3.2Variabel-Variabel Penelitian ...29
4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data
BOD dan COD (Tanpa Pembobot) ...37
4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data
BOD dan COD (Dengan Pembobot) ...38
4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di
DAFTAR GAMBAR
Nomor Judul Gambar Halaman
4.1 Plot Data Pengamatan BOD terhadap TSS ... 35
4.2 Plot Data Pengamatan COD terhadap TSS ... 36
4.3 Plot Observasi dan Estimasi Data BOD terhadap TSS ... 43
4.4 Plot Observasi dan Estimasi Data COD terhadap TSS ... 44
DAFTAR LAMPIRAN
Nomor Judul
1 Data BOD, COD, dan TSS 18 Titik WS Brantas di Sekitar Lokasi
Industri
2 Program Estimasi Model BOD dan COD dengan Pendekatan Regresi
Nonparametrik Birespon pada Data Longitudinal Berdasarkan
Estimator Spline Truncated Menggunakan Aplikasi OSS-R
3 Output Program Estimasi Model BOD dan COD dengan Pendekatan
Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan
BAB I PENDAHULUAN 1.1 Latar Belakang
Sungai merupakan sumber air permukaan yang memberikan manfaat kepada
kehidupan manusia (Sukadi, 1999). Perum Jasa Tirta 1 (PJT 1) dalam “Laporan
Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Wilayah Sungai
Bengawan Solo Tahun 2014” menyatakan Wilayah Sungai (WS) Brantas yang
berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis
nasional dan merupakan sungai yang mempunyai manfaat untuk kebutuhan
sebagai air baku air bersih, untuk proses produksi, PLTA, pertanian, perikanan
sekaligus sebagai sungai untuk pembuangan limbah industri, pertanian, perikanan
dan domestik.
Hasil penelitian dari Krisnawati dkk (2015) yang berjudul “Perancangan
Moolief Biorefactor Untuk Remediasi Air Sungai Brantas Kediri Tercemar
Limbah Domestik dan Industri” disebutkan di WS Brantas terdapat 483 industri
yang berpotensi membuang limbahnya yang berpengaruh langsung pada kualitas
air sungai. Diketahui bahwa hulu hingga hilir kali Brantas telah terdeteksi
konsentrasi senyawa estradiol 42-220 ng/L. Kondisi tersebut membahayakan
karena dapat memacu terjadinya feminisasi ikan yang berujung kepunahan.
Setiap aliran air permukaan seperti sungai memiliki kemampuan self
purification yaitu kemampuan penjernihan kembali secara alamiah dalam kurun
waktu yang berbeda tergantung pada beban pencemarnya. Pada badan-badan air
kimia, maupun biologis (Ramadhani, 2016). Berdasarkan kemampuan sungai
tersebut, maka seharusnya beban limbah yang dibuang oleh industri mengikuti
kondisi sungai tempat limbah tersebut dibuang, dengan kata lain setiap industri
memiliki ambang batas beban limbah yang berbeda, tergantung letak pembuangan
limbahnya di sungai.
Sebagian besar limbah industri masih belum melalui proses pengolahan
ketika dibuang ke sungai. Kondisi ini sangat memprihatinkan, mengingat banyak
sekali kegunaan sungai yang menjadi tempat pembuangan tersebut . Laporan PJT
1 (2014) menyebutkan bahwa status mutu air di WS Brantas cenderung tercemar
berat, hanya 25,5% yang tercemar sedang dan sekitar 52,38% air buangan limbah
industri belum memenuhi baku mutu. Untuk itu perlu adanya penelitian baku
mutu air sungai sebagai tempat pembuangan limbah industri untuk mengetahui
beban limbah yang terdapat di dalam wilayah sungai Brantas supaya mencegah
limbah industri yang overload dan menjaga kemampuan self purification sungai
tersebut.
Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)
adalah parameter yang umumnya dipakai untuk mengenal adanya pencemaran
dalam air. BOD adalah banyaknya oksigen yang dibutuhkan oleh bakteri untuk
menguraikan bahan pencemar dalam kondisi baku, sedangkan COD
mencerminkan kebutuhan bahan kimia yang dibutuhkan unuk mengoksidasi
bahan pencemar yang ada dalam air. Oleh karena itu nilai BOD dan COD yang
tinggi menunjukkan air tercemar yang berat (Herlambang, 2006). BOD dan COD
mengoksidasi zat-zat polutan di dalam air. BOD dan COD juga dapat
menggambarkan bahan organik yang terdapat dalam air (PJT1, 2014). BOD
menggambarkan banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk
mengoksidasi bahan organik karbon yang terkandung di dalam air secara
sempurna dengan menggunakan ukuran proses biokimia yang terjadi di dalam air
limbah pada periode 5 hari dan pada suhu 20oC, sedangkan COD ditentukan
dengan menggunakan oksidator kuat kalium bikromat, asam sulfat pekat, dan
perak sebagai katalis. Lamanya waktu yang dibutuhkan untuk menentukan BOD
dan penggunaan bahan-bahan berbahaya dan beracun dalam analisis COD,
sehingga diperlukan metode alternatif lain yang lebih mudah dan ramah
lingkungan untuk menetukan BOD dan COD dalam air (Simata, 2011).
Nilai BOD dipengaruhi oleh jumlah Total Suspended Solid (TSS) dan juga
zat organik yang ada dalam air. Nilai COD adalah total keseluruhan dari pengotor
TSS, zat organik, mineral bervalensi rendah, ditambah dengan zat kimia yang
memakan oksigen (Nurbana, 2015). Ramadhani (2016) menggunakan parameter
BOD, COD, dan TSS untuk menganalisis pencemaran air sungai Bengawan Solo
akibat limbah industri di kecamatan Kebakkramat kabupaten Karanganyar.
Krisnawati, dkk (2015) menggunakan parameter BOD dan COD untuk
mengetahui kualitas air sungai Brantas di wilayah Kediri tercemar limbah
domestik dan industri.
Berdasarkan peraturan gubernur Jawa Timur Nomor 72 Tahun 2013 tentang
Baku Mutu Air Limbah Bagi Industri dan / Kegiatan Usaha Lainnya, parameter
Oxygen Demand (COD), Total Suspended Solid (TSS) dan disesuaikan dengan
kegiatan usahanya. Parameter TSS digunakan sebagai parameter air limbah dan
sebagai parameter pencemaran karena perannya sebagai penduga bahan organik
dan kaitannya dengan penurunan kandungan oksigen terlarut perairan. TSS
ditentukan dengan menghitung jumlah berat lumpur kering dalam mg/l yang telah
mengalami penyaringan dengan membran berukuran 0,45 mikron dan dipanaskan
dalam oven dengan suhu 105oC selama 1 jam. Oleh karena itu, disimpulkan
adanya korelasi yang erat antara BOD dan COD, dan dalam baku mutu air limbah
penentuan parameter BOD dan COD dapat didekati dengan parameter TSS
(Nurbana, 2015).
Pendekatan parametrik mengasumsikan bahwa pola kecenderungan data
pada kurva regresi mengacu pada suatu bentuk fungsi tertentu, seperti linier,
kuadrat, kubik, dan sebagainya (Budiantara, 2012), apabila data tidak memenuhi
asumsi tersebut maka pemodelan data harus diselesaikan dengan pendekatan
nonparametrik..
Sari (2016) menyatakan bahwa kurva regresi pada pendekatan
nonparametrik hanya diasumsikan mulus atau smooth, sehingga pendekatan
nonparametrik memiliki fleksibilitas yang tinggi karena data diharapkan mencari
sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor
subyektifitas peneliti. Pemaparan sebelumnya telah menjelaskan bahwa TSS
merupakan parameter yang mempengaruhi BOD dan COD, terdapat korelasi
digunakan regresi nonparametrik birespon dengan BOD dan COD sebagai respon
dan TSS sebagai prediktor.
Berdasarkan waktu pengumpulannya data dibedakan menjadi tiga, yaitu
data cross sectional, longitudinal, dan time series. Pemantauan kualitas air
dilakukan terus menerus sehingga data yang terkumpul dapat menggambarkan
keadaan sesungguhnya dari keadaan lingkungan yang dipantau (PJT1, 2014).
Dalam kasus ini, BOD, COD, dan TSS merupakan data yang diperoleh dari
pengamatan dalam periode waktu yang berbeda beserta variabel yang
mempengaruhinya, sehingga untuk menjelaskan dinamika perubahan kondisi agar
informasi yang diperoleh lebih lengkap, data yang digunakan pada skripsi ini
adalah data longitudinal.
Salah satu pendekatan untuk mengestimasi fungsi dalam regresi
nonparametrik adalah spline truncated. Spline truncated merupakan model
polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada
polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline
truncated menyesuaikan diri secara efektif terhadap karakteristik lokal data.
Penelitian tentang regresi nonparamretrik birespon pada data longitudinal sudah
pernah dilakukan oleh Sari (2016) dengan menggunakan Weighted Spline
Truncated. Dalam skripsi ini, peneliti menggunakan Weighted Spline Truncated
sebagai estimator untuk diterapkan pada data longitudinal BOD, COD, dan TSS.
Estimasi kurva regresi nonparametrik spline truncated dapat dilakukan dengan
memilih parameter smoothing, yaitu orde, banyaknya titik knot, dan titik knot
dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan
memilih nilai GCV yang minimum.
Berdasarkan pemaparan di atas, peneliti ingin membahas pencemaran
sungai Brantas yang berada di sekitar lokasi industri dengan pendekatan regresi
nonparametrik birespon dengan menggunakan data longitudinal berdasarkan
estimator spline truncated dengan BOD dan COD sebagai respon dan TSS
sebagai prediktor. Penelitian dalam skripsi ini tidak dapat dilakukan secara
manual, untuk itu dibutuhkan bantuan aplikasi dalam penyelesaiannya. Salah satu
aplikasi yang dapat digunakan untuk membantu penyelesaian penilitian ini adalah
aplikasi Open Source Software (OSS) R.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan masalah
sebagai berikut:
1. Bagaimana mengestimasi model BOD dan COD sebagai parameter
kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan
regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator spline truncated menggunakan program pada aplikasi OSS-R?
2. Bagaimana menganalisis dan menginterpretasi hasil estimasi model BOD
dan COD sebagai parameter kualitas air sungai Brantas di sekitar lokasi
industri dengan pendekatan regresi nonparametrik birespon pada data
1.3 Tujuan
Tujuan yang ingin dicapai dalam skripsi ini diantaranya:
1. Mengestimasi model BOD dan COD sebagai parameter kualitas air
sungai Brantas di sekitar lokasi industri dengan pendekatan regresi
nonparametrik birespon pada data longitudinal berdasarkan estimator
spline truncated menggunakan program pada aplikasi OSS-R
2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD
sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri
dengan pendekatan regresi nonparametrik birespon pada data
longitudinal berdasarkan estimator spline truncated.
1.4 Manfaat
Skripsi ini diharapkan dapat memberikan manfaat sebagai berikut:
1. Menambah wawasan tentang estimasi model regresi nonparametrik
birespon pada data longitudinal berdasarkan estimator spline truncated.
2. Mengetahui estimasi BOD dan COD sebagai parameter kualitas air
sungai Brantas di sekitar lokasi industri untuk dapat digunakan sebagai
acuan dalam pembuangan limbah industri di sungai Brantas
3. Memberikan masukan kepada pemerintah, khususnya PJT 1 dalam
mengukur BOD dan COD dengan cara yang lebih mudah agar nantinya
dapat menindaklanjuti peraturan pembuangan limbah industri di WS
1.5 Batasan Masalah
Agar pembahasan tidak melebar, maka masalah perlu dibatasi sebagai
berikut:
1. Ruang lingkup pembahasan model regresi nonparametrik birespon pada
data longitudinal BOD dan COD dalam skripsi ini hanya dibatasi satu
variabel prediktor, yaitu TSS.
2. Data pengamatan diambil dari 18 titik WS Brantas yang berada di sekitar
lokasi industri.
Penelitian dalam skripsi ini menggunakan estimator spline truncated dan dalam
BAB II
TINJAUAN PUSTAKA
Pada bab ini akan dibahas mengenai beberapa tinjauan pustaka yang akan
digunakan untuk pembahasan pada bab-bab berikutnya.
2.1 Sungai Brantas
Wilayah Sungai (WS) Brantas merupakan WS terbesar kedua di pulau Jawa,
terletak di propinsi Jawa Timur. Sungai Brantas mempunyai panjang ± 320 km
dan memiliki luas wilayah sungai ± 14.103 km2 yang mencakup ± 25% luas
propinsi Jawa Timur atau ± 9% luas pulau Jawa. WS Brantas terdiri dari empat
Daerah Aliran Sungai (DAS) yaitu DAS Brantas, DAS Tengah, DAS Ringin
Bandulan, dan DAS Kondang Merak. WS Brantas berhulu di sumber Brantas kota
Batu, mengalir melewati wilayah Malang, Blitar, Tulungagung, Kediri, Nganjuk,
Jombang, Mojokerto dan berhilir di Sidoarjo dan Surabaya dengan luas wilayah ±
1.188.575 Ha.
Sungai Brantas merupakan sungai strategis sebagai penyedia air baku untuk
berbagai kebutuhan seperti, sumber tenaga pada PLTA, PDAM, irigasi, proses
produksi industri, dan lain-lain. Peran sungai Brantas sangat vital dalam
menyangga kehidupan masyarakat Jawa Timur. Aktivitas yang ada saat ini di
sungai Brantas berupa kegiatan-kegiatan industri, penambangan bahan galian
golongan C, transportasi air, perikanan dan pertanian. Jenis kegiatan industri yang
berada di sekitar WS Brantas terdiri dari industri kertas, gula, minuman, tekstil,
2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran
Air limbah adalah sisa dari suatu hasil usaha dan atau kegiatan yang
berwujud cair. Baku mutu air limbah adalah ukuran batas atau kadar unsur
pencemar dan atau jumlah unsur pencemar yang ditenggang keberadaannya dalam
air limbah yang akan dibuang atau dilepas ke dalam sumber air dari suatu usaha
dan atau kegiatan. Dalam menentukan baku mutu air limbah yang diizinkan,
didasarkan pada daya tampung beban pencemaran pada sumber air. Beban
pencemaran adalah jumlah suatu unsur pencemar yang terkandung dalam air atau
air limbah. Sedangkan daya tampung beban pencemaran adalah kemampuan air
pada suatu sumber air untuk menerima masukan beban pencemaran tanpa
mengakibatkan air tersebut menjadi cemar (Peraturan Pemerintah Republik
indonesia No.82, 2001).
2.3 Air Limbah Industri
Air limbah industri adalah air yang berasal dari rangkaian proses produksi
suatu industri dengan demikian maka air limbah tersebut dapat mengandung
komponen yang berasal dari proses produksi tersebut dan apabila dibuang ke
lingkungan tanpa pengelolaan yang benar tentunya akan dapat mengganggu badan
air penerima. Dampak pencemaran air limbah industri terhadap mutu badan air
penerima bervariasi tergantung kepada sifat dan jenis limbah, volume dan
Salah satu jenis air limbah industri yang dapat menyebabkan terjadinya
pencemaran lingkungan adalah air limbah dengan kandungan organik tinggi.
Karakteristik air limbah organik tinggi ditunjukan dengan tingginya parameter
BOD dan COD dalam air limbah. Contoh industri dengan air limbah organik
tinggi adalah industri tapioka, tahu, gula, kecap, sitrat, asam glutamat, tekstil, bir,
alkohol dan lain-lain. Kandungan BOD yang tinggi dalam air limbah industri
dapat menyebabkan turunnya oksigen perairan, keadaan anaerob (tanpa oksigen),
sehingga dapat mematikan ikan dan menimbulkan bau busuk. Untuk kandungan
COD yang tinggi dalam air limbah pengaruhnya terhadap lingkungan tergantung
dari zat organiknya, kalau dapat diurai oleh mikroorganisme pengaruhnya seperti
BOD, tetapi untuk yang tidak dapat diurai oleh mikroorganisme pengaruhnya
tergantung dari jenis zat organik yang ada di dalam air (Moertinah, 2010).
2.4 Biological Oxygen Demand dan Chemical Oxygen Demand
Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)
keduanya dapat dikatakan menggambarkan bahan organik (PJT 1, 2015). BOD
dan COD juga dapat dikatakan menggambarkan banyaknya oksigen yang
digunakan untuk mengoksidasi bahan organik di dalam air. BOD menggambarkan
banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk mengoksidasi
bahan organik karbon yang terkandung di dalam air secara sempurna dengan
menggunakan ukuran proses biokimia yang terjadi di dalam air limbah pada
periode tertentu biasanya 5 hari dan pada suhu tertentu biasanya 20oC. BOD tidak
secara relatif jumlah O2 yang digunakan untuk mengoksidasi bahan-bahan
buangan tersebut. Jika konsumsi mikroorganisme terhadap O2 tinggi yang
ditunjukkan dengan semakin kecilnya O2 terlarut, maka kandungan bahan-bahan
buangan di dalam air tersebut tinggi.
COD atau kebutuhan oksigen kimia adalah jumlah oksigen yang dibutuhkan
untuk mengoksidasi zat-zat organik yang ada dalam air oleh senyawa-senyawa
oksidator kuat kalium bikromat, asam sulfat pekat, (K2Cr2O7) dan perak sebagai
katalis. Nilai COD menunjukkan kebutuhan oksigen yang diperlukan untuk
menguraikan kandungan bahan organik dalam air secara kimiawi, khususnya bagi
senyawa organik yang tidak dapat diuraikan oleh proses biologis (Jatmiko, 2007).
2.5 Total Suspended Solid (TSS)
Nilai kekeruhan dan kecerahan dipengaruhi oleh padatan atau residu yang
tersuspensi (PJT1, 2015). TSS ditentukan dengan menghitung jumlah berat
lumpur kering dalam mg/l yang telah mengalami penyaringan dengan membran
berukuran 0,45 mikron dan dipanaskan dalam oven dengan suhu 105oC selama 1
jam. Penentuan zat padat tersuspensi (TSS) berguna untuk mengetahui kekuatan
pencemaran air limbah dan juga berguna untuk penentuan efisiensi unit
2.6 Matriks
Menurut Ruppert, et.al (2003) matriks adalah himpunan bilangan real yang
disusun secara persegi panjang, mempunyai m baris dan n kolom dengan bentuk
umum:
masing menyatakan baris dan kolom tempat beradanya sebuah elemen dari
matriks C. Beberapa operasi pada matriks adalah sebagai berikut:
a. Penjumlahan
Jika dua matriks mempunyai ukuran yang sama, maka dapat dikatakan
konformal untuk penjumlahan. Hasil penjumlahan diperoleh dengan
menambahkan elemen yang sesuai. Oleh karena itu, jika A adalah matriks
berukuran n×p dan B adalah matriks berukuran n×p , kemudian C=A+B juga
adalah matriks berukuran n×p dan diperoleh C=
( ) (
cij = aij +bij)
. Hal ini juga berlaku untuk perhitungan pengurangan antara dua konformal antara matriks Adan B. jika A dan B adalah matriks berukuran n×p, maka dua sifat dari penjumlahan matriks diberikan dalam teorema berikut:
(i) A+B=B+A
b. Perkalian
Misalkan A adalah matrik berukuran m n× dan B adalah matriks berukuran
n×p. Hasil perkalian AB adalah matriks C berukuran m×p dengan
jika banyaknya kolom dari mayriks A sama dengan banyaknya baris dari matriks
B.
c. Transpose
Jika A adalah matriks berukuran m n× maka transpose dari notasi A dinotasikan dengan T
A didefinisikan sebagai matriks berukuran n m× yang merupakan hasil pertukaran baris dan kolom matriks A salah satu sifat transpose
yang digunakan adalah
( )
T = T TAB B A dengan syarat matriks A dan B masing – masing merupakan matriks yang memenuhi sifat perkalian.
d. Invers
Misalkan A adalah matriks berukuran n n× (A adalah matriks persegi). Sebuah matriks B berukuran n n× sedemikian hingga BA= I disebut invers kiri
dari A dan sebuah matriks B berukuran n n× sedemikian hingga AB= I disebut invers kanan dari A dengan I merupakan matriks identitas. Jika AB=BA=I maka
matriks B disebut invers kanan dan invers kiri dari matriks A dan matriks A dikatakan invertibel. Jika matriks A dan B masing – masing merupakan matriks yang invertibel dan AB terdefinisi maka
(
)
−1= −1 −1AB B A . Jika A adalah matriks
simetri dan nonsingular dan dipartisi menjadi 11 12
1 invers dari A adalah:
1 1 1 1 1 1
sebagai jumlah dari elemen – elemen diagonal dari A, yaitu tr(A)=
1
f. Matriks Partisi
Partisi dari matriks A menjadi empat submatriks (persegi atau persegi
panjang) dapat diindikasikan secara simbolis sebagai berikut:
11 12 dipartisi sehingga submatrik konformal, maka perkalian AB dapat dinyatakan
sebagai berikut.
Jika B diganti oleh vektor b yang dipartisi menjadi dua himpunan dari elemen –
g. Turunan Fungsi Vektor dan Matriks
dari suatu konstanta,
1
h. Matriks Kovariansi
Varians 2 2 2 1, 2, , p
σ σ σ dari x x1, 2,,xp dan kovariansi σij untuk semua
i≠ j merupakan elemen – elemen dari matriks kovariansi yang dinotasikan
11 12 1
untuk varians. Varians terdapat pada diagonal Σ dan kovariansi berada pada
selain diagonal tersebut (Rencher & Schaaljee, 2008).
2.7 Regresi Nonparametrik
Regresi nonparametrik merupakan salah satu pendekatan dalam analisis
regresi yang digunakan apabila kurva regresinya tidak diasumsikan memiliki
bentuk tertentu. Dalam regresi nonparametrik, kurva regresi hanya diasumsikan
halus (smooth), sehingga pendekatan regresi nonparametrik memiliki fleksibilitas
yang tinggi karena data diharapkan mencari sendiri bentuk estimasi kurva regresi
tanpa dipengaruhi oleh faktor subyektivitas peneliti (Alfiani dkk, 2014).
Jika diberikan pasangan data ( ,x yi i) dengan i=1, 2,...,n dan pola hubungan
antara variabel respon dengan variabel prediktor tidak diketahui bentuknya, maka
dapat digunakan pendekatan regresi nonparametrik. Secara umum, model regresi
nonparametrik adalah
( )
i i i
y = f x +ε , i=1, 2,...,n (2.1)
prediktor, sedangkan εi adalah error berdistribusi normal independen dengan
mean 0 dan variansi σ2 (Eubank, 1999). Terdapat beberapa teknik untuk
mengestimasi kurva regresi dalam regresi nonparametrik, diantaranya yaitu
regresi spline, kernel, deret fourier dan lain-lain.
2.8 Kuantil
Kuantil adalah nilai-nilai yang membagi suatu jajaran data menjadi
bagian-bagian yang sama. Menurut Walpole (1997), kuantil adalah nilai-nilai yang
dibawahnya terdapat sejumlah pecahan atau persentase tertentu dari seluruh
pengamatan. Beberapa kuantil yang sering dibahas diantaranya adalah persentil,
desil, dan kuartil.
a. Persentil
Nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang
sama disebut persentil dan umumnya dinotasikan dengan P P1, 2,...,P99. Notasi P1
berarti bahwa 1% dari seluruh data terletak di bawah P1, 2% terletak di bawah P2
dan seterusnya sampai P99 yang menyatakan bahwa 99% terletak di bawah P99.
b. Desil
Nilai-nilai yang membagi jajaran data menjadi 10 bagian yang sama
dinamakan desil. Nilai-nilai tersebut dinotasikan dengan D D1, 2,...,D9 yang
berarti bahwa 10% data terletak di bawah D1, 20% terletak di bawah D2, dan
c. Kuartil
Nilai-nilai yang membagi data menjadi 4 bagian yang sama disebut kuartil
dan dinotasikan dengan Q Q Q1, 2, 3. Notasi Q1 berarti bahwa 25% data terletak di
bawah Q1, 50% data terletak di bawah Q2, dan 75% data terletak di bawah Q3.
Persentil ke-50, desil kelima, dan kuartil kedua dari suatu data disebut median.
Untuk menentukan kuantil data tak terkelompok, dapat digunakan prosedur
seperti dalam menentukan median. Sedangkan untuk data terkelompok, dapat
dengan rumus kuantil ke-i
(
)
L = batas bawah nyata kelas dari kelas kuantil ke-i
n = banyaknya data (jumlah seluruh frekuensi)
r = konstanta (untuk kuartil r=4, desil r=10, persentil r=100)
(
∑
f)
Li = jumlah frekuensi seluruh kelas yang lebih rendah daripada kelaskuantil ke-i
,
kuantil i
f = frekuensi kelas kuantil ke-i
c = lebar interval kelas kuantil (Harinaldi, 2005)
2.9 Estimator Spline Truncated
polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada
polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline
truncated menyesuaikan diri secara efektif terhadap karakteristik lokal dari data.
Secara umum, fungsi spline truncated berorde (p) dengan titik-titik knot
1, 2,..., M
θ θ θ adalah sembarang fungsi yang dapat disajikan dalam bentuk sebagai
berikut:
2.8.1 Estimasi Parameter Regresi Spline Truncated
Misalkan terdapat n pengamatan { , }n1
i i i
x y = yang memenuhi
persamaan (2.1) dengan f x( )i merupakan fungsi spline truncated yang
telah diuraikan pada persamaan (2.2). Dugaan fungsi kurva f x( ) dapat
diperoleh melalui estimasi koefisien
0 1 1 2
Nilai estimasi y
dapat diperoleh dengan menggunakan rumus sebagai
berikut: ˆ T 1 T ( )
y= X X X − X y= A λ y
(2.4)
dengan ( ) T 1 T
orde ( )p , jumlah knot (M), dan titik knot (θ θ1, 2,...,θM ), dapat dituliskan
dalam notasi λ=( ,p M, ( ,θ θ1 2,...,θM))
Apabila ingin mengestimasi kurva regresi nonparametrik dengan
pendekatan regresi spline truncated, maka secara teoritis dapat dilakukan
dengan mencari model spline terbaik berdasarkan orde dan titik knot
optimum yaitu banyaknya titik knot dan letak titik-titik knot (Sari, 2016).
2.8.2 Generalized Cross Validation (GCV)
Dalam analisis regresi nonparametrik dengan pendekatan spline
truncated perlu dilakukan pemilihan parameter smoothing optimum untuk
memperoleh pemodelan yang baik. Salah satu metode yang digunakan
sebagai kriteria untuk menentukan parameter smoothing optimum adalah
dengan menentukan nilai Generalized Cross Validation (GCV) yang
minimum. Menurut Wulandari dan Budiantara (2014) dalam Sari (2016),
secara teoritis kriteria GCV mempunyai sifat optimal asimtotik dan dapat
didefinisikan sebagai berikut:
(
)
2 identitas, dan n adalah jumlah pengamatan (Sari, 2016).2.8.3 Pemilihan Titik Knot Optimal
Pemilihan jumlah dan titik knot optimal perlu dilakukan untuk
banyaknya titik knot atau banyaknya titik perubahan perilaku fungsi pada
interval yang berlainan. Ruppert (2002) dalam Sari (2016) menyatakan
bahwa titik knot terletak pada sampel kuantil dari nilai-nilai unique
(tunggal) variabel prediktor
{ }
1
n i i
x = . Salah satu metode yang dapat
digunakan untuk menentukan jumlah dan lokasi titik knot optimal adalah
metode full-search. Algoritma dari metode full-search yang didasarkan pada
kriteria Generalized Cross Validation (GCV) adalah:
a. Membandingkan nilai GCV
( )
λ pada M =1 dan M =2.i. Apabila nilai GCV
( )
λ pada M =1 lebih kecil dari nilai GCV( )
λpada M =2, maka algoritma berhenti dengan memilih jumlah knot
optimal yaitu M =1.
ii. Apabila nilai GCV
( )
λ pada M =1 lebih besar dari nilai( )
GCV λ pada M =2, maka algoritma ini akan dilanjutkan
dengan membandingkan nilai GCV
( )
λ untuk M =2 dan M =3.b. Membandingkan nilai GCV
( )
λ pada M =2 dan M =3.i. Apabila nilai GCV
( )
λ pada M =2 lebih kecil dari nilai( )
GCV λ pada M =3, maka algoritma berhenti dengan memilih
ii. Apabila nilai GCV
( )
λ pada M =2 lebih besar dari nilai( )
GCV λ pada M =3, maka algoritma ini akan dilanjutkan
dengan membandingkan nilai GCV
( )
λ untuk M =3 dan M =4.c. Membandingkan nilai GCV
( )
λ pada M =3 dan M =4 yangdilakukan dengan cara yang sama seperti di atas, demikian seterusnya
hingga diperoleh nilai GCV
( )
λ yang minimum.2.10 Data Longitudinal
Data longitudinal merupakan data yang diperoleh dari pengamatan yang
dilakukan secara berulang dari waktu ke waktu pada satu unit eksperimen. Pada
data cross sectional setiap obyek hanya diamati satu kali (Wu & Zhang, 2006).
Berbeda dengan data time series, data longitudinal mengobservasi beberapa obyek
yang saling independen. Dengan demikian, data longitudinal juga dikenal sebagai
gabungan antara data cross sectional dan time series (Frees, 2003). Cakupan
pengertian serta karakteristik dari penelitian yang melibatkan data longitudinal
adalah sebagai berikut:
a. Data dikumpulkan untuk setiap obyek dan setiap variabel pada dua atau
lebih periode waktu tertentu.
b. Kasus atau subyek yang dianalisis sama atau setidaknya dapat
diperbandingkan antara satu periode dengan periode berikutnya.
c. Analisis melibatkan perbandingan data dari kasus yang sama dalam satu
Struktur data longitudinal dapat diuraikan dalam Tabel 2.1 sebagai berikut:
Tabel 2.1 Struktur Data Longitudinal
Subyek Pengamatan Respon Prediktor
1
merupakan banyaknya pengamatan yang dilakukan pada setiap unit eksperimen
sehingga total pengamatan adalah
1
2.11 Homoskedastisitas dan Heteroskedastisitas
Salah satu asumsi dalam analisis regresi adalah homoskedastisitas yang
berarti bahwa variansi dari setiap εi tidak tergantung pada variabel pediktor.
Variansi dari setiap εi bernilai sama untuk semua variabel pediktor, sehingga
1, 2,...,
i= s. Pelanggaran terhadap asumsi ini disebut heteroskedastisitas yang
berarti bahwa variansi dari setiap error bersifat tidak konstan. Dalam analisis
regresi, heteroskedastisitas dinyatakan sebagai berikut:
(
)
2i i i
Var ε x =σ , i=1, 2,...,s (2.6)
Persamaan (2.6) juga dapat dinotasikan dalam model di bawah ini.
2
Salah satu metode yang digunakan untuk mendeteksi adanya kasus
heteroskedastisitas adalah uji Box M. Uji Box M adalah uji statistika yang
digunakan untuk menguji heteroskedastisitas suatu kovarians matriks, dengan
subjek ke-i pengamatan ke-j dan dinyatakan dalam model regresi T
Statistik Uji Box M adalah sebagai berikut :
s : jumlah subjek yang diamati
ti : jumlah pengamatan dalam setiap subjek ke-i
T : jumlah dari ti
ij
W : matriks pembobot (Box, 1949)
Untuk menguji signifikansi nilai N yang telah diperoleh, maka digunakan
2.13 Uji Korelasi Pearson
Koefisien korelasi merupakan suatu nilai yang mengukur keeratan
hubungan antara dua variabel. Koefisien korelasi yang dihitung untuk data
populasi dinotasikan dengan ρ sedangkan koefisien korelasi yang dihitung untuk
data sampel dinotasikan dengan r. Nilai koefisien korelasi dapat dihitung dengan
menggunakan Pearson Product Moment pada persamaan (2.9) sebagai berikut:
(
)
(
)
(
)
r= maka disebut dengan korelasi linier positif sempurna. Apabila nilai r= −1
maka dinamakan korelasi linier negatif sempurna, sedangkan apabila nilai r=0
menunjukkan bahwa tidak terdapat korelasi diantara kedua variabel tersebut.
Pengujian koefisien korelasi dilakukan dengan menggunakan hipotesis,
yaitu
0
H : ρ=0(kedua variabel tidak memiliki hubungan linier)
1
H : ρ>0, ρ<0 atau ρ ≠0
Konversi nilai koefisien korelasi menjadi distribusi t adalah
2
variabel-diperoleh berdasarkan persamaan (2.10). Nilai statistik uji t yang telah variabel-diperoleh
berdasarkan persamaan (2.10) selanjutnya dibandingkan dengan nilai t tabel.
Apabila nilai t hitung kurang dari t tabel maka H0 diterima sehingga dapat
disimpulkan bahwa tidak terdapat korelasi linier diantara kedua variabel,
demikian sebaliknya. (Brase dan Corrinne, 2013)
2.14 Regresi Nonparametrik Birespon Spline Truncated
Analisis regresi yang melibatkan dua variabel respon dan diantara variabel
respon tersebut terdapat korelasi atau hubungan yang kuat, baik secara logika
maupun matematis disebut regresi birespon. Apabila bentuk kurva regresi
birespon tidak diketahui, maka pendekatan yang digunakan adalah pendekatan
nonparametrik sehingga disebut regresi nonparametrik bi-response. Secara umum,
model untuk regresi nonparametrik birespon dapat dituliskan sebagai berikut:
( ) menyatakan indeks untuk subyek yang diamati. Fungsi f adalah kurva regresi
yang tidak diketahui bentuknya dan dapat dihampiri dengan fungsi spline
( )
( )
( ) ( ) ( ) ( )(
( ))
parameter variabel respon ke r (Wulandari dkk, 2014).
2.15 Weighted Least Square
Untuk mengilustrasikan metode Weighted Least Square (WLS), digunakan
model dua variabel regresi linier. Metode kuadrat terkecil tanpa pembobot yaitu
Ordinary Least Square (OLS) meminimumkan sedangkan metode WLS
meminimumkan jumlah kuadrat eror terboboti yang dirumuskan sebagai berikut
(
) (
)
variansi-kovariansi dari ε
atau y dengan syarat X, yang dinotasikan dengan
( )
( )
Var ε X =Var y X = Σ
.
Persamaan (2.13) selanjutnya diturunkan terhadap β
sedemikian sehingga
diperoleh estimator WLS sebagai berikut:
(
)
1ˆ T T y
β = X WX − X W
(2.14)
Pada metode OLS, pembobot W merupakan matriks identitas (Farebrother,
2.16 Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Weighted Spline Truncated
Sari (2016) menyatakan persamaan regresi nonparametrik birespon pada
data longitudinal diasumsikan data berpasangan
(
x yij, ij( )1,yij( )2)
dan memenuhipersamaan sebagai berikut:
( )
subyek yang diamati dan j=1, 2,...,ti menyatakan indeks untuk pengamatan disetiap subyek.
Regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator weighted spline truncated sebagai berikut:
ˆ
( )
1(
) (
)
ˆ ˆ
2 T
MSE= T − y−y y−y
(2.17)
selanjutnya dapat diturunkan rumus MSE dalam regresi nonparametrik birespon
pada data longitudinal dan diperoleh rumus MSE sebagai berikut:
(
) (
)
nilai MSE tersebut kemudian digunakan untuk menghitung nilai Generalized
Cross Validation (GCV). Kriteria nilai GCV yang minimum digunakan untuk
menentukan jumlah knot yang optimum. Berdasarkan rumus umum GCV yang
terdapat pada persamaan (2.5), maka nilai GCV dalam regresi nonparametrik
birespon pada data longitudinal dirumuskan pada persamaan sebagai berikut:
( )
(
) (
)
Selanjutnya dilakukan uji kesesuaian model dengan menghitung kriteria
Goodness of Fit yaitu MSE dan 2
2 1 JKG
R
JKT
= − (2.20)
Jumlah Kuadrat Galat (JKG) =
(
y−yˆ) (
T y−yˆ)
dan Jumlah Kuadrat Total (JKT)
(
) (
T)
y y y y
= − −
.
2.17 Open Source Software (OSS)-R
R merupakan salah satu software yang sering digunakan dalam statistika
dan termasuk dalam kategori Open Source Software (OSS) sehingga dapat
diperoleh secara gratis di situs http://www.r-project.org/ atau
http://cran.r-project.org/. Versi pertama R diluncurkan pada tahun 1992 oleh Ross Ihaka dan
Robert Gentleman (singkatan R berasal dari kedua nama tersebut) yang keduanya
dari The University of Auckland. Bahasa R berbasis bahasa S yang dibangun di
Bell Laboratories di tahun 80-an sehingga syntax R memiliki perbedaan yang
tidak terlalu banyak atau hampir identik jika dibandingkan dengan syntax pada
software S-plus (Sari, 2016).
Beberapa perintah internal yang digunakan dalam OSS-R adalah sebagai
berikut:
1. function( ), merupakan perintah untuk menunjukkan kumpulan dari
beberapa fungsi yang digunakan dalam program. Fungsi dipanggil
2. length( ), merupakan perintah yang digunakan untuk menghitung
banyaknya data. Misalkan terdapat perintah length(vector), maka akan
diperoleh hasil yaitu panjang dari vector tersebut.
3. plot( ), digunakan untuk membuat plot data. Beberapa penggunaan
perintah ini diantaranya:
a. plot(X,Y) berarti bahwa akan dibuat plot data berupa titik dengan
sumbu datar X dan sumbu tegak Y.
b. plot(X,Y,type=”l”) memberikan hasil plot bertipe garis.
c. plot(X,Y,type=”b”) memberikan hasil plot bertipe garis dan titik.
4. rep(a,b), merupakan perintah yang digunakan untuk membentuk suatu
vektor dengan anggota a sebanyak b.
5. matrix(a,b,c), merupakan perintah yang digunakan untuk membentuk
suatu matriks berukuran b×c dengan elemen a.
6. print( ), digunakan untuk menampilkan hasil atau output dari program.
7. cat(“…”), merupakan perintah untuk menuliskan kemudian
menampilkan argumen dalam bentuk karakter.
8. for( ), merupakan perintah yang digunakan untuk mengulang satu blok
pernyataan berulang kali hingga memenuhi kondisi yang telah
ditentukan. Format penulisan perintah ini adalah for( kondisi ) {
pernyataan }.
9. repeat( ), hampir mirip dengan for( ), apabila kondisi sudah terpenuhi
maka proses pengulangan akan dihentikan. Struktur penulisan
10. if-else, merupakan perintah yang digunakan untuk seleksi kondisi.
Apabila suatu kondisi bernilai benar, maka pernyataan pertama akan
dijalankan, sedangkan apabila kondisi bernilai salah maka pernyataan
kedua yang akan dijalankan. Struktur penulisan perintah ini adalah
sebagai berikut: if( kondisi ) { pernyataan pertama } else { pernyataan
kedua }
11. solve( A ), digunakan untuk menghitung invers dari suatu matriks A.
12. sum( ), digunakan untuk menghitung jumlah dari keseluruhan data.
13. rbind( ), digunakan untuk menggabungkan suatu matriks atau vektor
berdasarkan baris.
14. cbind( ), digunakan untuk menggabungkan suatu matriks atau vektor
berdasarkan kolom.
15. diag( a ), merupakan perintah yang digunakan untuk membentuk suatu
vektor a menjadi suatu matriks diagonal dengan elemen diagonal
utamanya adalah elemen dari a dan elemen yang lain bernilai nol.
16. sort( ), merupakan perintah yang digunakna untuk mengurutkan
sekumpulan data.
17. unique( ), digunakan untuk menentukan nilai tunggal dari suatu data.
18. quantile(…, …), merupakan perintah untuk menentukan sampel
kuantil.
19. order( ), merupakan perintah untuk menunjukkan vektor posisi data
20. var( ), merupakan perintah untuk menghitung nilai variansi dari suatu
vektor atau matriks variansi-kovariansi dari suatu matriks.
21. boxM(data, kelompok), merupakan syntax uji Box’s M yang
digunakan untuk menguji homogenitas matriks variansi-kovariansi
yang diperoleh dari data yang berdistribusi normal multivariate
BAB III
METODOLOGI PENELITIAN 3.1 Data dan Sumber Data
Data yang digunakan dalam skripsi ini adalah data sekunder yang berasal
dari pemantauan kualitas 18 titik WS Brantas (tanpa hilir) di sekitar lokasi industri
yang ditentukan berdasarkan lokasi pembuangannya dan jenis limbah yang
memberikan kontribusi adanya pencemaran dalam 3 triwulan yaitu bulan
April-Juni, Juli-September, dan Oktober-Desember 2015 yang dilakukan oleh Perum
Jasa Tirta 1 (PJT 1).
Titik pengambilan sampel limbah pada WS Brantas di dekitar lokasi industri
disajikan pada Tabel 3.1
Tabel 3.1. Daftar Industri Titik Pengambilan Sampel Limbah
No. Nama Industri Daerah
1 Dinas Pemotongan Hewan Malang Kota Malang
2 PT. Pindad Kabupaten Malang
3 PT. Eka Mas Fortuna Kabupaten Malang
4 Peternakan Babi Sempulur Kabupaten Malang
5 Peternakan Babi Delta Kabupaten Malang
6 CV. Sartimbul Kabupaten Tulungagung
7 Peternakan Babi Hanjoyo Kabupaten Tulungagung
8 PT. Setia Kawan Kabupaten Tulungagung
9 PT. Surya Zig Zag Kabupaten Kediri
10 PT. Surya Pamenang Kabupaten Kediri
11 UD. Sumberejo Kabupaten Kediri
12 PT. Jaya Kertas Kabupaten Nganjuk
No. Nama Industri Daerah 14 PT. Ajinomoto Indonesia Kabupaten Mojokerto
15 PT. Darmala Kabupaten Mojokerto
16 PT. Pakerin Kabupaten Mojokerto
17 PT. Sateliti Sriti Kabupaten Pasuruan
18 PT. Tjiwi Kimia Kabupaten Sidoarjo
3.2 Variabel Penelitian
Variabel-vaiabel penelitian yang digunakan dalam skripsi ini disajikan
dalam Tabel 3.2.
Tabel 3.2 Variabel-varibel Penelitian
Variabel Keterangan Variabel Satuan Tipe Variabel
ij
x
Kadar TSS pada subjek
ke-i, pengamatan ke-j
gr/l Kontinu
(1)
ij
y
Kadar BOD pada subjek
ke-i, pengamatan ke-j
gr/l Kontinu
(2)
ij
y
Kadar COD pada subjek
ke-i, pengamatan ke-j
3.3 Langkah Analisis
Langkah analisis yang dilakukan untuk menjawab rumusan masalah dalam
skripsi ini adalah sebagai berikut:
1. Mengestimasi model BOD dan COD sebagai parameter kualitas air sungai
Brantas di sekitar lokasi industri dengan pendekatan regresi nonparametrik
birespon pada data longitudinal berdasarkan estimator spline truncated
menggunakan aplikasi OSS-R dengan langkah-langkah sebagai berikut:
a. Membuat plot antara BOD dengan TSS dan COD dengan TSS.
b. Menginputkan data berpasangan (TSS, BOD, dan COD) yang
memenuhi persamaan (2.15).
c. Menguji korelasi antara variabel BOD dan COD dengan
menggunakan persamaan (2.10)
d. Menentukan parameter smoothing optimum dengan melakukan
estimasi tanpa pembobot W menggunakan metode full-search
berdasarkan kriteria GCV minimum seperti yang telah dijelaskan pada
subbab (2.8.3)
e. Menguji heteroskedastisitas pada error dengan menggunakan uji
Box’s M pada subbab (2.12)
f. Menentukan matriks pembobot W berdasarkan hasil uji heteroskedastisitas.
g. Menentukan parameter smoothing optimum dengan melibatkan
h. Mengestimasi data dengan menggunakan estimator weighted spline
truncated sehingga diperoleh data berpasangan untuk setiap subyek
pengamatan ke-i,
(
i=1, 2,...,s)
sebanyak ti pengamatan yangmemenuhi persamaan (2.15)
i. Menghitung nilai kriteria Goodness of Fit yaitu MSE dan R-square
berdasarkan persamaan (2.17) dan (2.20)
2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri
dengan pendekatan regresi nonparametrik birespon pada data longitudinal
berdasarkan estimator spline truncated.
a. Menganalisis hasil estimasi model BOD dan COD sebagai parameter
kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan
regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator spline truncated.
b. Menginterpretasi hasil estimasi model BOD dan COD sebagai parameter
kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan
regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator spline truncated dan membuat plot antara nilai estimasi dan
observasi BOD dengan TSS dan COD dengan TSS.
Berikut disajikan flowchart dari analisis model regresi nonparametrik
Tidak dapat digunakan analisis regresi
birespon
Selesai
Mulai
Input data
Input alfa
Uji korelasi antara dan
p-value ≤ alfa
Input n
• Matriks p, vektor jp. •
xbaru
C=1
B A
Ya
B A
Vektor MSE; vektor GCV;
dan
dan
Jumlah titik knot optimum untuk orde adalah
Membandingkan untuk kombinasi orde
C Ya
Tidak
C
Melakukan estimasi dengan menggunakan parameter
smoothing optimal yang telah diperoleh
Uji heteroskedastisitas pada nilai
p-value ≤ alfa
Menghitung
variansi-kovariansi dari dan
Menghitung
variansi-kovariansi dari dan
Mereplikasi setiap elemen dari matriks variansi-kovariansi sebanyak
Mereplikasi setiap elemen dari matriks variansi-kovariansi sebanyak
Mendefinisikan hasil dari suatu vektor
Menggabungkan hasil replikasi dalam suatu vektor
Mendefinisikan vektor replikasi sebagai matriks
D
D
Menggabungkan keempat matriks diagonal, dan menghitung inversnya
Menentukan parameter smoothing optimum dengan menyertakan pembobot W
Melakukan estimasi dengan dengan menggunakan parameter smoothing optimal yang telah diperoleh beserta
Melakukan nilai dan estimasi
Menghitung MSE dan
Membuat plot estimasi
BAB IV
HASIL DAN PEMBAHASAN
Bab ini berisi pembahasan hasil analisis untuk menjawab tujuan skripsi
yang meliputi estimasi model BOD dan COD dengan pendekatan regresi
nonparametrik birespon pada data longitudinal berdasarkan estimator spline
truncated serta analisis dan interpretasi model.
4.1 Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated
Data yang digunakan dalam estimasi model regresi nonparametrik birespon
pada data longitudinal berdasarkan estimator spline truncated adalah data hasil
pengamatan BOD, COD, dan TSS di titik-titik WS Brantas di sekitar lokasi
industri pada bulan April-Juni, Juli-September, dan Oktober-Desember tahun
2015. Variabel yang digunakan diantaranya BOD sebagai variabel respon 1, COD
sebagai variabel respon 2 dan TSS sebagai variabel prediktor. Data tersebut dapat
dilihat secara lengkap pada Lampiran 1
Gambaran awal tentang hubungan data BOD dengan TSS dan COD dengan
TSS dapat dilakukan dengan membuat plot yang dapat dilihat pada Gambar 4.1
Gambar 4.1 Plot Data Pengamatan BOD terhadap TSS
Gambar 4.2 Plot Data Pengamatan COD terhadap TSS
Pada Gambar 4.1 dan Gambar 4.2 dapat dilihat pola data BOD dan COD
terhadap TSS tidak beraturan dan pola data tidak dapat diasumsikan mendekati
suatu fungsi tertentu (linier, kuadratik, kubik, dsb).
BOD dan COD memiliki korelasi atau keeratan hubungan baik secara logika
maupun secara matematis yang ditunjukkan dengan uji korelasi pearson.
H0 : Tidak terdapat korelasi diantara BOD dan COD
(
ρ =0)
H1 : Terdapat korelasi diantara BOD dan COD
(
ρ≠0)
Dari hasil uji korelasi pearson yang terdapat pada Lampiran 3 diperoleh nilai
koefisien korelasi antara variabel BOD dan COD sebesar 0,601 dengan nilai
p-value 1,532×10-6. Nilai p-value tersebut kurang dari α bernilai 0,05 sehingga
diperoleh keputusan untuk menolak H0. Dengan demikian diperoleh kesimpulan
bahwa terdapat korelasi antara variabel BOD dan COD sehingga dapat diestimasi
dengan pendekatan regresi birespon.
Analisis data BOD dan COD dengan menggunakan program estimasi tanpa
pembobot W yang telah dibuat menggunakan OSS-R yang telah terlampir pada
Lampiran 2 diperoleh hasil yang ditampilkan dalam Tabel 4.1 berikut,
Tabel 4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum
pada Data BOD dan COD (Tanpa Pembobot)
Orde
Pada Tabel 4.1 dapat dilihat bahwa GCV minimum adalah 0,1840114 sehingga
parameter smoothing optimum yaitu orde respon 1 adalah 2, dan orde respon 2
Setelah diperoleh perameter smoothing optimum, selanjutnya dilakukan
estimasi dengan menggunakan parameter smoothing optimum tersebut sehingga
diperoleh nilai ˆε
untuk respon 1 dan respon 2. Pengujian heteroskedastisitas
variansi error perlu dilakukan untuk menentukan matriks pembobot W. Dalam
hal ini, uji heteroskedastisitas dilakukan dengan menggunakan uji Box’s M
dengan hipotesis sebagai berikut:
H0 : Σ = Σ = = Σ1 2 ... 18.
H1 : Minimal ada sepasang Σi yang tidak sama
(
i=1, 2,...,18)
Berdasarkan hasil uji Box’s M yang terdapat pada Lampiran 3 diperoleh nilai
p-value untuk variansi eror data BOD dan COD adalah 9,259×10-15. Nilai p-value
tersebut kurang dari α bernilai 0,05 sehingga diperoleh keputusan untuk menolah
H0. Dengan demikian diperoleh kesimpulan terdapat kasus heterokedastisitas pada
data BOD dan COD.
Pemilihan parameter smoothing optimum perlu dilakukan ulang dengan
disertai pembobot W karena terdapat kemugkinan bahwa parameter smoothing
optimum yang diperoleh akan berbeda antara sebelum dan setelah ada matriks
pembobot W. Berdasarkan analisis data BOD dan COD dengan menggunakan
program estimasi yang menyertakan pembobot W yang terlampir pada Lampiran
2, diperoleh parameter smoothing dengan menggunakan kombinasi orde dan titik
knot yang terdapat pada Lampiran 3. Pemilihan parameter smoothing optimum
dengan menyertakan matriks pembobot W untuk data BOD dan COD
Tabel 4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum
pada Data BOD dan COD (Dengan Pembobot)
Orde
dari Tabel 4.2 dapat dilihat bahwa nilai GCV sebelum dan setelah disertakan
pembobot berbeda. Pada tabel tersebut dapat dilihat bahwa nilai GCV minimum
adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1
adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135;
0,022433; 0,04995; 0,1096; 0,26.
4.2 Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Weighted Spline Truncated
Berdasarkan Tabel 4.1 dan Tabel 4.2, diperoleh estimasi model BOD adalah
( )1
(
)
(
)
(
)
sehingga persamaan (4.1) dapat diuraikan menjadi fungsi potongan sebagai
berikut:
0, 024 1, 251 ; untuk 0,04995 0,1096 0, 082 2, 44 ; untuk 0,1096 0, 26
nilai TSS kurang dari 0,04995 gr/l, yaitu setiap kenaikan nilai TSS 1 gr/l, maka
kenaikkan BOD sebesar 2,466 gr/l. Sedangkan perubahan nilai BOD terendah di
18 titik sungai tersebut adalah ketika nilai TSS kurang dari 0,01135 gr/l, yaitu
setiap kenaikkan nilai TSS 1 gr/l, maka nilai BOD mengalami penurunan sebesar
0.215 gr/l. Selain itu, dari persamaan (4.2) dapat diketahu estimasi nilai BOD di
18 titik sungai tersebut pada nilai TSS tertentu. Misalkan nilai TSS 0,3 gr/l,
dengan menggunakan persamaan (4.2) pada interval nilai x≥0, 26 dapat
diketahui nilai estimasi BOD yaitu sebesar 0,562 gr/l.
Berdasarkan Tabel 4.2, estimasi model BOD adalah:
( )2 2
(
)
2(
)
2ˆ 0, 034 5, 004 326,922 372, 022 0, 01135 266,964 0, 022433
(
)
2 0, 26 untuk 0, 26sehingga persamaan (4.3) dapat diuraikan menjadi fungsi potongan sebagai
berikut: 0, 082 13,56 698,944 ; untuk 0,01135 0, 022433 0, 216 25,538 965,908 ; untuk 0,022433 0, 04995 ˆ
0,971 55, 768 1268,511 ; untuk 0,04995 0,1096 1, 732 69, 664 13
31,965 ; untuk 0,1096 0, 26 3,182 80,816 1353, 412 ; untuk 0, 26
x x
Berdasarkan persamaan (4.4), untuk menduga nilai COD misalkan ketika nilai
TSS 0,01 gr/l dengan menggunakan persamaan (4.4) pada interval nilaix<0, 011
dapat diketahui nilai estimasi COD yaitu sebesar 0,016 gr/l. Berdasarkan
persamaan (4.2) dan persamaan (4.4) dan dengan melihat nilai rata-rata TSS pada
setiap titik pengamatan WS Brantas di sekitar lokasi industri maka diperoleh
model BOD dan COD untuk setiap titik pengamatan tersebut yang disajikan
dalam Tabel 4.3 sebagai berikut,
Tabel 4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di
Sekitar Lokasi Industri
No. Nama Industri Model Estimasi
BOD Model Estimasi COD
1 Dinas Pemotongan
Hewan Malang −0, 082 2, 44+ x
2
1, 732 69, 664− x+1331,965x
No. Nama Industri Model Estimasi
BOD Model Estimasi COD
3 PT. Eka Mas
Fortuna −0, 013 1, 418+ x
2
0, 082 13,56− x+698,944x
4 Peternakan Babi
Sempulur −0, 082 2, 44+ x
2
1, 732 69, 664− x+1331,965x
5 Peternakan Babi
Delta −0, 082 2, 44+ x
2
1, 732 69, 664− x+1331,965x
6 CV. Sartimbul −0, 082 2, 44+ x 2
1, 732 69, 664− x+1331,965x
7 Peternakan Babi
Hanjoyo 0, 487 0, 25+ x
dari Tabel 4.3 dapat dilihat bahwa titik pengamatan yang mempunyai nilai BOD
dilihat dari model BOD dan COD berturut-turut adalah 0, 00597 0, 215− x dan
2
0, 034 5, 004− x+326,922x , hal ini berarti nilai TSS pada titik pengamatan di
WS Brantas di sekitar lokasi PT Pindad terletak pada interval x<0, 01135,
sedangkan nilai BOD dan COD tertinggi adalah pada titik pengamatan di sekitar
lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo yang dapat dilihat dari
model BOD dan COD berturut-turut adalah 0, 487 0, 25+ x dan
2
3,182 80,816− x+1353, 412x , hal ini berarti nilai TSS pada titik pengamatan di
WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo
terletak pada interval x≥0, 26.
Dari persamaan (4.2) dan persamaan (4.4) diperoleh nilai MSE sebesar 0,143 dan
R-Square sebesar 86,14%. Plot antara hasil observasi dan estimasi BOD terhadap
TSS ditunjukkan pada Gambar 4.3 sebagai berikut,
Pada Gambar 4.3 di atas menujukkan bentuk kurva estimasi dan plot observasi
BOD terhadap TSS. Dalam Gambar 4.3 tersebut dapat dilihat perubahan bentuk
kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai
titik knot, ketika nilai TDS kurang dari 0,01135 sampai nilai TDS kurang dari
0,26 kurva mengalami kenaikan yang sangat tinggi yaitu dengan rata-rata nilai
kemiringan kurva 1,87 dan ketika nilai TDS 0,26 dan selebihnya perubahan nilai
kenaikan kurva konstan. Sedangakan untuk plot antara hasil estimasi dan
observasi COD terhadap TSS ditunjukkan pada Gambar 4.4 sebagai berikut,
Gambar 4.4 Plot Observasi dan Estimasi Data COD terhadap TSS
Pada Gambar 4.4 di atas menujukkan bentuk kurva estimasi dan plot observasi
COD terhadap TSS. Dalam Gambar 4.4 tersebut dapat dilihat perubahan bentuk
kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai
titik knot. Perubahan kurva sangat tinggi kecuali ketika nilai TDS diantara 0,26