MODEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPUTUSAN DENGAN
ADANYA KEPTIDAKPASTIAN
TESIS
Oleh
LAYLA ANGRIA S 157021031/MT
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2017
MODEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPUTUSAN DENGAN
ADANYA KEPTIDAKPASTIAN
T E S I S
Diajukan Sebagai Salah Satu Syarat
untuk Memperoleh Gelar Magister Sains dalam Program Studi Magister Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Sumatera Utara
Oleh
LAYLA ANGRIA S 157021031/MT
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2017
Telah diuji pada
Tanggal : 22 Mei 2017
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Muhammad Zarlis Anggota : 1. Prof. Dr. Tulus, M.Si
2. Dr. Sutarman, M.Sc
3. Prof. Dr. Opim Salim S, M.Sc
PERNYATAAN
MODEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPUTUSAN DENGAN ADANYA KETIDAKPASTIAN
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya sendiri, kecuali be- berapa kutipan dan ringkasan yang masing-masing dituliskan sumbernya
Medan, 22 Mei 2017 Penulis,
Layla Angria S
ABSTRAK
Maraknya isu-isu pengambilan keputusan dengan adanya ketidakpastian telah menjadi perbincangan yang sangat hangat dalam operation re- search. Banyak model-model yang disajikan untuk membantu membuat keputusan dengan adanya ketidakpastian tersebut. Perkembangan terki- ni dalam ilmu komputasi khususnyaa pada mesin belajar sangat mengem- bangkan data empiris. Bidang yang termasuk dalam pendekatan baru yaitu data-driven modeling (DDM), model ini berdasarkan pada data antara variabel sistem (variabel input, internal dan output).
Kata kunci : Data driven, Ketidakpastian, Pengambilan keputusan.
ii
ABSTRACT
The rise of the issues with the uncertainty of decision making has become a very warm conversation in operation research. Many models are presented to help make decisions in the presence of uncertainty.
Recent developments in the science of computing, especially in machine learning is to develop empirical data. Fields are included in the new approach is data-driven modeling (DDM), this model is based on data between system variables (variables input, internal and output).
Keyword : Data driven, Uncertainty, Decision making
KATA PENGANTAR
Puji syukur kehadiran Allah SWT karena atas rahmat, nikmat dan hidayah-Nya penulis dapat menyelesaikan Tesis ini dengan berjudul MO- DEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPU- TUSAN DENGAN ADANYA KETIDAKPASTIAN untuk memenuhi sebagai persyaratan mendapatkan gelar magister sains dalam program studi magister matematika pada Fakultas Matematika dan Ilmu Penge- tahuan Alam Universitas Sumatera Utara dengan berbagai hambatan yang dialami.Penulis menyadari bahwa terselesainya penulisan tesis ini tidak lepas dari bantuan berbagai pihak. Oleh karena itu, melalui ke- sempatan ini penulis mengucapkan terima kasih kepada:
Prof. Dr. Runtung Sitepu, SH., Mhum selaku rektor Universitas Suma- tera Utara.
Dr. Kerista Sebayang, M.S, selaku Dekan Fakultas Matematika dan ilmu Pengetahuan Alam Universitas Sumatera Utara yang telah memberikan kesempatan penulis untuk menempuh pendidikan di Universitas Suma- tera Utara.
Bapak Prof. Saib Suwilo, M.Sc selaku Ketua Program Studi Magister Matematika FMIPA Universitas Sumatera Utara dan juga selaku pem- banding dalam penyelesaian tesis ini.
Bapak Dr. Sawaluddin, MIT selaku Sekretaris Program Studi Magister Matematika FMIPA USU.
Bapak Prof. Dr. Muhammad Zarlis selaku pembimbing 1 tesis ini.
Bapak Prof. Dr. Tulus M.Si selaku pembimbing 2 tesis ini.
Bapak/Ibu Dosen Program Studi Magister Matematika FMIPA USU yang telah membekali ilmu pengetahuan kepada penulis selama perkuli- ahan hingga selesai.
iv
Ibu Misiani, S.Si selaku Staf Administrasi Program Studi Magister Ma- tematika FMIPA USU yang telah memberikan pelayanan administrasi selama mengikuti pendidikan.
Secara khusus dan istimewa penulis sampaikan terima kasih dan sayang yang mendalamkepada ibunda tersayang SUWARTI dan ayahan- da MANAN SIRAIT serta adik-adikku tersayang Sri Kumala Sari Sir- ait, Annisa Hidayati Sirait, Rahwani Sucita Sirait yang senantiasa mem- berikan dukungan dan doa kepada penulis selama menyelesaikan pen- didikan di Universitas Sumatera Utara. Tidak lupa pula penulis ucap- kan terimakasih kepada sahabat-sahabat Mahasiswa program studi Mag- ister Matematika FMIPA USU tahun 2014 yang telah menjadi sahabat sekaligus keluarga yang selalu membantu penulis selama menyelesaikan pendidikan di Universitas Sumatera Utara ini.
Penulis hanya dapat berdoa semoga kebaikan semua pihak yang ter- libat dalampembuatan tesis ini mendapatkan balasan dari Allah SWT yang berlipat ganda. Akhirnya penulis berharap semoga ini dapat bermafaat bagi penulis dan para pembaca.
Medan, Mei 2017 Penulis,
Layla Angria S
RIWAYAT HIDUP
Layla Angria S adalah anak pertama dari 4 bersaudara dari pasangan Manan Sirait dan Suwarti, dilahirkan di Huta Padang pada tanggal 16 April 1993. Menamatkan Sekolah Dasar (SD) di SDN 091524 pada tahun 2005. Sekolah Menengah Pertama (SMP) di SMP Negeri 2 Rantau Utara pada tahun 2008. Dan Sekolah Menengah Atas (SMA) di SMA Negeri 2 Rantau Utara pada tahun 2011. Tahun 2011, penulis memasuki Univer- sitas Muhammadiyah Sumatera Utara (UMSU) pada Fakultas Keguruan Ilmu Pendidikan Program Studi Pendidikan Matematika dan lulus tahun 2015. Semenjak tamat penulis bekerja sebagai Guru Matematika di SMA Negeri Medan hingga sekarang dan mengajar dibimbingan belajar cutie jalan mandala by pass sampai sekarang. Tahun 2015 penulis mengikuti Program Studi Magister Matematika di Universitas Sumatera Utara. Se- lama kurun waktu 2 tahun belajar di Pascasarjana USU, Penulis banyak mendapatkan pengalaman belajar yang sangat berharga. Berkat doa dan dukungan keluarga, akhirnya penulis dapat menyelesaikan pendidikan S- 2 pada Program Studi Magister Matematika Universitas Sumatera Utara di tahun 2017, dan memperoleh gelar Magister Sains Matematika (M.Si).
vi
DAFTAR ISI
Halaman
PERNYATAAN i
ABSTRAK ii
ABSTRACT iii
KATA PENGANTAR iv
RIWAYAT HIDUP vi
DAFTAR ISI vii
DAFTAR TABEL ix
DAFTAR GAMBAR x
BAB 1 PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Perumusan Masalah 3
1.3 Tujuan Penelitian 4
1.4 Manfaat Penelitian 4
BAB 2 TINJAUAN PUSTAKA 5
2.1 Pengambilan Keputusan 5
2.2 Pengambilan Keputusan dengan Adanya Ketidakpastian 6
2.3 Model Data-driven 8
2.3.1 Data 8
2.3.2 Model data-driven 10
2.4 Latar Belakang Teori 10
2.4.1 Regresi dan masalah klasifikasi 10
2.4.2 Analisis regresi 12
2.4.3 Analisis klasifikasi 12
2.5 Model Klasik Data-driven 13
2.6 Jenis Optimasi 16
2.7 Model Program Linear 17
BAB 3 METODOLOGI PENELITIAN 20
3.1 Menyiapkan Data dan Memilih Model 20
3.1.1 Kasus skalar 21
3.1.2 Bentuk pada model: linear/nonlinear dan sto-
kastik 22
3.2 Mengidentifikasi Model dan Parameter 23
3.3 Kriteria Pemilihan Model 24
3.4 Analisis Statistika 26
BAB 4 PEMBAHASAN DAN HASIL 27
4.1 Pemilihan Model 27
4.1.1 Perbandingan pada model linear yang berbeda 27
4.1.2 Nonlinear banding linear 30
4.2 Nilai Eigen 31
BAB 5 KESIMPULAN DAN SARAN 32
5.1 Kesimpulan 32
5.2 Saran 32
DAFTAR PUSTAKA 33
viii
DAFTAR TABEL
Nomor Judul Halaman
2.1 Teknik pengambilan keputusan 6
2.2 Data model program linear 19
4.1 Nilai NRMSE untu model M1, M2, dan M3 30
DAFTAR GAMBAR
Nomor Judul Halaman
2.1 Flowchart model data-driven 16
4.1 Hasil uji model M1, M2, dan M3 29 4.2 HHasil mengkompare antara model N M1 dan N M2 serta
model linear M3 31
x
BAB 1 PENDAHULUAN
1.1 Latar Belakang
Salah satu hal penting dalam suatu kehidupan yaitu adanya su- atu keputusan yang diciptakan oleh pembuat keputusan. Sederhananya adalah dalam kehidupan sehari-hari sering melakukan pengambilan kepu- tusan berdasarkan hal-hal yang mendukungnya. Pengambilan keputusan dilakukan berdasarkan informasi yang tersedia. Informasi yang diperoleh biasanya berupa data.
Mohanty et al., (2013) Secara umum data bisa didefinisikan menjadi 3 karakteristik penting yaitu: komposisi, konteks, dan kondisi. Kompo- sisi mengacu pada struktur data: apa sumbernya, apa tipe datanya, apa sifat dari data (sebagian besar data statik atau data real time streaming) dan sebagainya. Konteks mengacu kepada bagaimana data dihasilkan, apa peristiwa yang terkait dengan data, bagaimana sensitivitas data dan lain-lain. Kondisi mengacu pada keadaan data dan apakah data itu da- pat digunakan untuk analisis atau perlu pembersihan lebih lanjut dan pengayaan.
Tetapi dalam kenyataannya, Bertsimas dan Thiele (2006) mengatakan bahwa informasi atau data yang tersedia tidaklah lengkap dan strate- gi berdasarkan pada input yang salah mungkin tidak dapat dikerjakan dengan mudah, atau memberikan hasil yang buruk ketika diimplemen- tasikan. Sehingga akan mempengaruhi pengambilan keputusan.
Bunn (1984) Pengambilan keputusan adalah suatu aktivitas yang ada dimana-mana yang melekat pada suatu individu, kelompok sosial, maupun kelompok organisasi. Dalam dunia perindustrian pengambilan keputusan merupakan hal yang sangat penting misalnya dalam memu-
2
tuskan berapa permintaan konsumen terhadap suatu produk, masalah transportasi, sumber daya air dan banyak lagi.
3
Masalah yang sangat kompleks pada pengambilan keputusan adalah adanya ketidakpastian. Ketidakpastian merupakan suatu kondisi dimana tidak mengetahui hasil yang diharapkan di masa mendatang dikarenakan tidak mengetahui besarnya probabilitas dari suatu peristiwa yang dihara- pkan. Adanya ketidakpastian, akan menyebabkan penulis menghadapi risiko di masa depan. Risiko merupakan seberapa besar kemungkinan timbulnya suatu peristiwa yang sifatnya acak, setelah mengetahui prob- abilitasnya.
Bertsimas dan Thiele (2006) Teori pengambilan keputusan dengan adanya ketidakpastian telah menjadi hal penting beberapa tahun ini karena selera konsumen yang berubah-ubah, inovasi teknologi, dan pen- gurangan siklus produk yang mengurangi jumlah informasi yang tersedia dan membuatnya lebih cepat kuno. Dalam matematik informasi yang tidak lengkap akan mengancam relevansi yang diperoleh oleh komputer.
Oleh karena itu, dengan adanya ketidakpastian parameter yang mem- pengaruhi keputusan tersebut penulis harus menggunakan model yang sesuai untuk menentukan keputusan apa yang akan penulis peroleh dan mengurangi resiko yang akan ditimbulkan. Model yang akan dibahas dalam masalah ini adalah model data-driven. Khadr dan Elshemy (2016) mengemukakan bahwa model data-driven yaitu model yang berdasarkan pada data, dimana sebuah model dibangun pada basis yang menghu- bungkan antara beberapa sistem variabel seperti variabel input, internal dan output dengan hanya anggapan terbatas tentang sistem.
1.2 Perumusan Masalah
Bertsimas dan Thiele (2006) Pengambilan keputusan dengan ada- nya ketidakpastian telah diperkenalkan sejak tahun 1950 oleh Dantzig, Charnes dan Cooper. Kemudian menjadi topik yang sering dibicarakan dalam reseach operation dengan menggunakan banyak model. Salah sat- unya menggunakan model data driven. Model ini telah banyak dibicarakan
4
sehingga dalam penilitianini model data-driven dikembangkan untuk ma- salah pengambilan keputusan dengan adanya ketidakpastian.
1.3 Tujuan Penelitian
Adapun tujuan dari penelitian ini adalah mengembangkan model data-driven untuk masalah pengambilan keputusan dengan adanya keti- dakpastian.
1.4 Manfaat Penelitian
Penelitian ini diharapkan dapat bermanfaat pada berbagai masalah yang berhubungan dengan model data-driven untuk masalah pengambi- lan keputusan dengan adanya ketidakpastian.
BAB 2
TINJAUAN PUSTAKA
2.1 Pengambilan Keputusan
Pengambilan keputusan adalah aktivitas yang melekat pada indi- vidu, organisasi dan sosial. Ackoff dan Emery (1972) dalam buku applied decision analysis telah mendeskripsikan pengambilan keputusan seper- ti sebuah karakteristik sistem tertentu. Dalam konteks pengelolaan, Simon (1960) telah menyatakan bahwa pengambilan keputusan terdiri dari 3 prinsip yaitu: menemukan peristiwa untuk membuat keputusan, menemukan jalan yang mungkin pada aksi, dan memilih diantara jalan tersebut.
Supranto (2009) Secara umum ada 4 kategori pengambilan keputu- san yaitu:
1. Keputusan dalam keadaan ada kepastian (certainty) 2. Keputusan dalam keadaan ada resiko (risk)
3. Keputusan dalam keadaan adanya ketidakpastian (uncertainty) 4. Keputusan dalam keadaan ada konflik (conflict)
Secara keseluruhan teknik-teknik yang dapat dipergunakan untuk pengambilan keputusan yang berbeda-beda dapat dilihat sebagai berikut:
6
Tabel 2.1 Teknik pengambilan keputusan
No. Situasi Keputusan Pemecahan Teknil
1. Ada kepastian Deterministik 1. Linear programming 2. Model transportasi 3. Model penugasan 4. Model inventori 5. Model antrian 6. Model network
2. Ada resiko Probabilistik 1. Model keputusan pro-
babilistik
2. Model inventori proba- bilistik
3. Model antrian probabi- listik
3. Tidak ada kepastian Tak diketahui Analisis keputusan dalam ketidakpastian 4. Ada konflik Tergantung tindakan lawan Teori permainan (game
theory)
2.2 Pengambilan Keputusan dengan Adanya Ketidakpastian
Raiffa dan Schalaifer (1961) Pengambilan keputusan dengan ada- nya ketidakpastian adalah arena utama dalam kinerja metodologi anal- isis keputusan. Memang, fungsi utama dari analisis keputusan, seperti yang awalnya dikembangkan adalah untuk membantu evaluasi pembu- atan keputusan untuk pilihan yang hasil akhirnya tidak diketahui secara pasti.
Three rivers district council (2008) Ada empat pendekatan terhadap pengambilan keputusan dalam kondisi ketidakpastian yaitu :
1. Kriteria keputusan Laplace
(a) Pendekatan ini mengumpamakan bahwa setiap situasi punya peluang yang sama untuk terjadi
(b) Cara pengambilan keputusan: Hitung nilai harapan setiap strate- gi dan pilih strategi dengan nilai Tertinggi : kalau berhubungan dengan masalah profit.
7
Terendah : kalau berhubungan dengan masalah cost 2. Kriteria keputusan Wald
(a) Ini adalah kriteria yang paling konservatif, karena berpijak pa- da prinsip melakukan yang terbaik dalam kondisi/situasi ter- buruk yg mungkin terjadi
(b) Tindakan/keputusan terbaik adalah : Minimax : untuk masalah cost/loss Maximin : untuk masalah profit/gain 3. Kriteria keputusan Hurwicz
(a) Kriteria ini punya jangkauan sikap dari yang paling optimis hingga yang paling pesimis
(b) Dengan mengambil α sebagai derajat/indeks. Jika tidak ada
”feeling” yang kuat pada seseorang pengambil keputusan, maka α =1/2 merupakan pilihan yang paling masuk akal (reasonable).
4. Kriteria keputusan Savage
Kriteria Savage menetapkan bahwa pengambilan keputusan mungkin mengalami penyesalan. Setelah keputusan yang diambil dan terny- ata situasi lain yang terjadi. Pasti menyesal mengapa tidak menen- tukan strategi yang lama.
Bertsimas dan Thiele (2006) ketidakpastian dapat mengambil 2 bentuk berikut yaitu:
8
i) Kesalahan estimasi untuk parameter tetap tapi nilai tidak dike- tahui dan,
ii) Stokastik pada variabel acak. Untuk menyajikan kerangka ro- bust pada matematik yang telah ditulis oleh Bertsimas dan Sim dan menghitung masalah program linear:
min c0x s.t Ax ≥ b,
x ∈ X
2.3 Model Data-driven 2.3.1 Data
Three rivers district council (2008) Istilah data, informasi dan penge- tahuan sering digunakan secara bergantian dan didefinisikan sebagai berikut:
1. Data
Data adalah angka, kata-kata atau gambar yang belum diatur atau dianalisis untuk menjawab pertanyaan tertentu.
2. Informasi
Dihasilkan melalui pengolahan, memanipulasi dan mengatur data yang untuk menjawab pertanyaan, menambah pengetahuan pener- ima.
3. Pengetahuan
Melibatkan menafsirkan informasi yang diterima, menambahkan rel- evansi dan konteks untuk memperjelas wawasan informasi tersebut.
9
Karakteristik data:
1. Akurasi
Data harus cukup akurat untuk tujuan penggunaan dan harus digam- barkan hanya sekali, meskipun mungkin memiliki beberapa kegu- naan. Data harus digambarkan pada titik aktivitas.
2. Validitas
Data harus dicatat dan digunakan sesuai dengan persyaratan yang relevan, termasuk aplikasi yang benar dari setiap aturan atau defin- isi. Ini akan memastikan konsistensi antara periode dengan kelom- pok serupa, mengukur apa yang dimaksudkan untuk menjadi uku- ran.
3. Reliabilitas
Data harus mencerminkan proses pengumpulan data yang stabil dan konsisten diseluruh tempat pengumpulan dan dari waktu kewaktu.
Kinerja harus mencerminkan perubahan nyata dari variasi dalam pendekatan pengumpulan data atau metode.
4. Aktual
Data harus digambarkan secepat mungkin setelah kegiatan dan harus tersedia dalam jangka waktu yang wajar. Data harus tersedia de- ngan cepat dan sering untuk mendukung kebutuhan kebutuhan in- formasi dan mempengaruhi layanan atau keputusan
5. Relevan
Data harus relevan dengan tujuan yang akan digunakan, ini memer- lukan penelaahan bersyarat untuk mencerminkan perubahan kebu- tuhan.
6. Lengkap
10
Data harus cukup akurat untuk tujuan penggunaan, meskipun mungkin memiliki beberapa kegunaan. Data harus menggambarkan titik ak- tivitas.
2.3.2 Model data-driven
Solomatine et al., (2008) model data driven adalah berdasarkan analisis pada data tentang sebuah sistem yang spesifik. Konsep utama model data driven adalah untuk menemukan hubungan antara sistem variabel state (input dan output) tanpa informasi yang lengkap pada suatu sistem.
Model data-driven adalah bidang hidroinformatic yang mengalami perkembangan sangat cepat. Meng et al., (2013) mengemukakan Mo- del simulasi data-driven sebagai salah satu yang dirancang yang berlaku untuk sistem dengan struktur yang sama. Dibandingkan dengan pemod- elan yang khas, model data-driven menjamin biaya pembangunan yang rendah dan waktu penggunaan serta pemeliharaan perangkat lunak in- dependen dari pengembangan model.
Perkembangan terkini dalam ilmu komputasi khusunya dalam mesin pembelajaran (mechine learning) telah mengembangkan pemodelan em- piris. Bidang penelitian baru disebut model data-driven (DDM). Khadr et al., (2016) mengemukakan data driven modeling (DDM) adalah anal- isis data yang berdasarkan pada suatu sistem, khususnya menemukan hubungan antara sistem variabel keadaan (input, internal dan output).
2.4 Latar Belakang Teori
2.4.1 Regresi dan masalah klasifikasi
Secara umum ada dua daerah yang akan dilihat dimana teknik anal- isis memerlukan model atau simulasi pada penomena yang terjadi (anal- isis regresi), dan identifikaksi atau pengkategorian pada kejadian yang
11
terjadi atau pola (analisis klasifikasi). Dua daerah ini memiliki karakter- istik unik dengan istilah untuk mencapai objektivitas, sumber data, dan implementasi setelah kalibrasi, membutuhkan pendekatan yang sesuai untuk kesuksesan pengembangan model.
12
2.4.2 Analisis regresi
Analisis regresi meliputi teknik atau logaritma yang digunakan un- tuk pemetaan atau penghubungan beberapa variabel diantara keduanya.
Fokusnya adalah mengembangkan hubungan antara satu atau beberapa variabel dependen (output) dengan satu atau lebih variabel indepen- den (input). Hubungan ini dalam algoritma machine learning adalah mirip bentuknya dengan apa yang dilihat dalam model klasik seperti lin- ear atau persamaan polinomial, ARMA, ARIMA, regresi kuantil. Oleh karena itu bentuk umum untuk analisis regresi adalah pemetaan input dan output yang disajikan dalam bentuk matematika.
2.4.3 Analisis klasifikasi
Analisis identifikasi terkait dengan pengkategorian atau pelabelan kelompok nilai variabel yang diberikan kedalam daftar kelompok yang telah ditentukan sebelumnya. Ada 2 tipe analisis klasifikasi yaitu, perta- ma menggunakan kelompok kategori yang telah ditentukan sebelumnya, kedua dimana algoritma diminta untuk menemukan sejumlah kelompok atau label yang mungkin terjadi dalam data.
Identifikasi sekelompok variabel kedalam kategori atau kelas terten- tu biasanya ditentukan oleh pengukuran kedekatan nilai dengan pusat kelompok tertentu untuk masing-masing kategori/label.Analisis klasi- fikasi sering digunakan untuk menentukan kategori atau level antara data, perubahan karakteristik data statistik yang masuk, mendeteksi ke- salahan data data.
He mengemukakan tujuan model data-driven adalah mengekstrak dan mengenal pola dalam data, menafsirkan atau menjelaskan penga- matan, uji validitas hipotesis. Mencari ruang hipotesis. Hal yang harus dilakukan pada pemodelan data driven adalah
1. Klasifikasi: penempatan kelas untuk jalur input data;
13
2. Asosiasi: dimana hubungan antara variabel karakteristik adalah un- tuk diidentifikasi dalam prediksi berikutnya;
3. Regresi: memprediksi nilai real yang terkait dengan titik input data, 4) mengelompokkan: mengelompokkan data dengan kelompok yang sama yang akan ditentukan.
Solomatine dan Ostfeld (2008) salah satu pengaplikasian model data- driven adalah model statistik (regresi linear, autoregressive moving aver- age (ARMA) dan autoregressive integrated moving average (ARIMA)) dan model mechine learning (ML).
Alat yang biasanya digunakan dalam model data-driven adalah dalam bidang statistik yaitu: regresi linear, regresi nonlinear, regresi logis- tic, probit regresi. Dalam ilmu komputasi teknik yang biasa digunakan adalah decision tree, artificial neural network (ANN), Nearest Neigh- bours, support vektor machine, association rule learning.
2.5 Model Klasik Data-driven
Model klasik data-driven seperti regresi linear. Untuk linear atau persamaan polinomial, ARIMA dan ARMA.
a. Regresi polinomial
Regresi polinomial digunakan untuk menentukan fungsi polinomial yang paling sesuai dengan kumpulan titik data (Xn, Yn) yang dike- tahui. Fungsi pendekatan:
Y = β0+ β1X + β2X2 + ε (2.1)
Kurva digambarkan oleh kurva lengkung kuadratik.
Y = β0+ β1X + β2X2+ . . . + βkXk + ε (2.2) Ditaksir dengan menggunakan metode least square.
14
Algoritma regresi polinomial:
1. Tentukan n titik data yang diketahui dalam xi, yi untuk i = 1, 2, 3, . . . , n;
2. Hitung nilai-nilai yang berhubungan dengan jumlah data;
3. Hitung nilai koefisien;
4. Tampilkan fungsi polinomial;
5. Tampilkan hasil xn, yn dari fungsi polinomial tersebut.
b. ARMA
Luthkepohl (2005) time series pada dasarnya merupakan data pe- ngukuran yang diambil secara kronologis dalam kurun waktu ter- tentu. ARMA merupakan teknik peramalan time series. Sadeq (2008) Model ARMA bisa dipecah menjadi mode AR (Autoregres- sive) dan model MA (Moving Average).
yt= b0+ b1yt−1+ b2yt−2+ . . . + bnyt−n+ εt (2.3) Model MA (Moving Average)
yt= a0+ a1εt−1+ a2εt−2+ . . . + anεt−n+ εt (2.4) dimana:
yt : Merupakan time series
yt−1, yt−2, . . . , yt−n : Merupakan time series sebelumnya et−1, et−2, . . . , et−n, et : Merupakan residual
a0, a1, a2, . . . , an : Merupakan konstanta dan koefisien model MA b0, b1, b2, . . . , bn : Merupakan konstanta dan koefisien model RA
Salah satu teknik yang digunakan pada ilmu komputasi adalah teknik jaringan saraf atau neural network. Khadr dan Elshemy (2016) menge- mukakan Jaringan saraf saraf adalah model yang terinspirasi secara biol- ogis, yang berdasarkan pada jaringan otak manusia. Model neural net- work dikembangkan dengan melatih jaringan untuk mewakili hubungan
15
dan proses yang terdapat dalam data. Pendekatan umum dalam model data-driven:
16
Gambar 2.1 Flowchart model data-driven
2.6 Jenis Optimasi
Ada berbagai jenis optimasi yang sudah berkembang, antara lain pemrograman linear dan pemrograman non linear.
1. Program linear Program linear menyelesaikan kasus pada fungsi tujuan dan fungsi kendala yang bersifat linear, yaitu pangkat dari variabelnya adalah
(a) Bentuk umum model program linear adalah:
max / min Z = Xn
j=1
cjxj
kendala:
Xn j=1
aijxj ≤ I ≥ bi untuk i = 1, 2, 3, . . . , m
xj ≥ 0 untuk j = 1, 2, 3, . . . , n
Untuk menyelesaikan program linear, dapat digunakan metode grafik, yaitu mentransformasikan formulasi ke dalam sebuah grafik. Tetapi metode ini hanya efektif untuk formulasi dengan banyak variabel dua. Untuk formulasi dengan variabel lebih dari dua, dapat digu- nakan metode simpleks. Metode grafik dan simpleks digunakan pada program linear dengan variabelnya dapat bernilai desimal.
17
Tetapi dalam perkembangannya, ada program linear di mana vari- abelnya harus bernilai bilangan bulat atau integer yang dikenal de- ngan ILP (Integer Linear Programming) dan juga ada pula variabel yang bernilai 0 atau 1 yang dikenal dengan nama BILP (Binary Integer Linear Programming) dan ada pula program linear yang berupakan campuran ILP dan BILP yaitu MILP (Mixed Integer Linear Programming).
2. Program non linear Program non linear merupakan pemrograman dengan fungsi tujuannya saja atau bersama dengan fungsi kendala berbentuk non linear yaitu pangkat dari variabelnya lebih dari satu.
Program non linear dapat mempunyai kendala maupun tidak mem- punyai kendala. Untuk penyelesaiannya dapat digunakan metode Lagrangian atau Kuhn-Tucker.
2.7 Model Program Linear
Program linear merupakan suatu model umum yang dapat digu- nakan dalam pemecahan masalah pengalokasian sumber-sumber yang terbatas secara optimal. Model program linear merupakan bentuk dan susunan dalam menyajikan masalah-masalah yang akan dipecahkan de- ngan teknik program linear.
Dalam model program linear dikenal 2 (dua) macam fungsi, yaitu fungsi tujuan (Objective Function) dan fungsi batasan (constraint func- tion). Fungsi tujuan adalah fungsi yang menggambarkan tujuan/sasaran di dalam permasalahan program linear yang berkaitan dengan pengat- uran secara optimal sumberdaya-sumberdaya, untuk memperoleh keun- tungan maksimal atau biaya minimal. Nilai yang akan dioptimalkan dinyatakan sebagai Z. Fungsi Batasan merupakan bentuk penyajian se- cara matematis batasan-batasan kapasitas yang tersedia yang akan di- alokasikan secara optimal ke berbagai kegiatan.
18
Bentuk umum persamaan model program linear adalah sebagai berikut:
Fungsi tujuan: Maksimumkan Z = C1X1+ C2X2+ C3X3+ . . . + CnXn
Batasan-batasan:
a11X1+ a12X2+ a13X3+ . . . + a1nXn ≤ b1
a21X1+ a22X2+ a23X3+ . . . + a2nXn ≤ b2
am1X1+ am2X2 + am3X3 + . . . + amnXn ≤ bm
dan
X1 ≥ 0, X2 ≥ 0, . . . , Xn≥ 0
Adapun simbol-simbol dalam model program linear adalah sebagai berikut:
m = Macam batasan sumber atau fasilitas yang tersedia
n = Macam kegiatan yang menggunakan sumber atau fasilitas tersebut i = Nomor setiap macam sumber atau fasilitas yang tersedia (i = 1, 2, . . . , m) j = Nomor setiap macam kegiatan yang menggunakan sumber atau fasilitas
yang tersedia (j = 1, 2, . . . , n)
Xj = Tingkat kegiatan ke, j. (j = 1, 2, . . . , n)
aij = Banyaknya sumber i yang diperlukan untuk menghasilkan setiap unit keluaran (output) kegiatan j (i = 1, 2, . . . , m, dan j = 1, 2, . . . , n)
bi = Banyaknya sumber (fasilitas) yang tersedia untuk dialokasikan ke setiap unit kegiatan (I = 1, 2, . . . , n)
Z = Nilai yang dioptimalkan (maksimum atau minimum)
Cj = Kenaikan nilai Z apabila ada pertambahan tingkat kegiatan (xj) dengan satu satuan (unit); atau merupakan sumbangan setiap satuan keluaran kegiatan j terhadap nilai Z
Berikut ini adalah tabel data untuk model program linear:
19
Tabel 2.2 Data model program linear Pemakaian sumber per unit
Sumber kegiatan kegiatan(keluaran) Kapasitas sumber
1 2 3 . . . n
1 a11 a21 a31 . . . a1n b1
2 a21 a22 a23 . . . a2n b2
3 a31 a32 a33 . . . a3n b3
... ... ... ... ... ...
M am1 am2 am3 . . . amn bmn
∆Z pertambahan tiap unit c1 c2 c3 . . . cn
Tingkat kegiatan X1 X2 X3 . . . Xn
BAB 3
METODOLOGI PENELITIAN
Solomatine dan Ostfeld (2008) model data-driven telah diaplikasikan dalam sistem sumber daya air, dan hidrologi kurva penilaian, metode hidrograph, model statistika meliputi regresi linear, autoregressive mov- ing average (ARMA), autoregressive moving average (ARIMA) dan mo- del machine learning (ML). Machine learning.
Proses dalam model data-driven dengan adanya ketidakpastian yaitu dengan:
1. Menyiapkan data: memperoleh data / pengecekan data / pember- sihan data;
2. Pilih yang paling utama: jika kamu mempunyai data yang sangat besar;
3. Menentukan asumsi: berdasarkan pada pengetahuan daerah asal;
4. Mengembangkan model: berdasarkan pada asumsi;
5. Menentukan fungsi kerugian seperti: mean square error antara out- put model dan data real;
6. Menggunakan algoritma: untuk meminimize kerugian berdasarkan pada data;
7. Menguji model: menggunakan pengujian data.
3.1 Menyiapkan Data dan Memilih Model
Pertama pendekatan intuisi adalah untuk menggabungkan ketidak- pastian dengan formulasi deterministik seperti masalah program linear dimana tidak terdapat random (acak).
20
21
3.1.1 Kasus skalar
Dimulai dari kasus yang sederhana dimana pembuat keputusan harus menentukan berapa banyak item yang akan dikirim setiap periode pada sebuah toko. (Dalam matematika, state pada sistem dapat dideskrip- sikan sebagai variabel skalar, secara khusus jumlah persediaan). Gu- nakan notasi berikut ini:
xt : Persediaan awal pada periode waktu t
ut : Jumlah yang dikirim pada awal periode waktu t wt : Permintaan yang terjadi selama periode waktu t
Permintaan dari hari kehari, dan pesanan dibuat pada awal periode waktu tiba diakhir periode yang sama. Oleh karena itu dinamik pada sistem dapat dideskripsikan sebagai persamaan linear:
Xt+1 = xt+ ut− wt (3.1)
Yang menghasilkan rumus bentuk tertutup:
Xt+1= x0+ (ut− wt) (3.2)
Biaya yang dikeluarkan pada setiap periode waktu memiliki dua komponen:
1. Biaya pemesanan linear dalam jumlah yang dipesan, dengan c unit harga pesanan (Bertsimas dan Thiele juga mempertimbangkan ka- sus pada biaya tetap dibebankan setiap kali pesanan dibuat);
2. Biaya persediaan, dengan h , masing-masing s, biaya unit peme- sanan per item diadakan dalam persediaan setiap akhir periode.
Pembuat keputusan meminimalkan total biaya dalam jangka wak- tu panjang T , memiliki perkiraan jangkauan [ ¯wt− ˆwt, ¯wt+ ˆwt], berpusat
22
didugaan nominal ˆwt, untuk permintaan pada setiap periode waktu t, de- ngan t = 0, . . . , T 1. Jika ketidakpastiaan tidak ada, masalah yang dihadapi oleh pembuat keputusan dapat dirumuskan sebagai masalah program lin- ear:
min cXT −1
t=0 ut+XT −1
t=0 yt
s.t yt> h
x0+Xt
T =0(uT − wT)
∀t
yt> s
x0+Xt
T =0(uT − wT)
∀t
ut> 0, ∀t
(3.3)
Dalam Optimalitas, yt = biaya persediaan dihitung pada akhir periode waktu t seperti max(hxt+1, −sxt+1). Solusi optimal untuk masalah diatas adalah tidak ada pemesanan jika persediaan cukup pada awal periode t untuk memenuhi permintaan ¯wt, dan pemesanan item selesai, seperti
¯ wt− xt.
3.1.2 Bentuk pada model: linear/nonlinear dan stokastik
Sebuah bentuk umum dari persamaan diferensial nonlinear dengan koefisien dalam bentuk fungsi polinomial telah dipertimbangkan. Awal- nya dua istilah stokastik dimasukkan untuk mewakili pengiriman suara dalam persamaan sistem. Pengukuran suara ditambahkan karena keti- dakpastian dalam data yang diukur, dan suara dinamis dihitung un- tuk setiap sifat tersembunyi lainnya yang tidak ditangkap oleh model.
Dideskripsikan dengan model berikut:
dn
dnxt+Xn−1
i=0 fi−1(xt) di
dtixt+ f0(xt) = ηt (3.4)
yt = xt+ εt (3.5)
Persamaan (3.4) - (3.5) adalah persamaan yang mengalami perubahan, dimana:
xt : Sebuah fungsi t yang dideskripsikan secara dinamik yt : Time series yang diukur
23
ηt : Suara sistem εt : Pengukuran suara
Setiap suara dimodelkan sebagai distribusi gauss. white noise dengan rata-rata nol dan intensitas (varians) Iη dan Iε, masing-masing fi−1(xt)i = 0, 1, . . . , n − 1) adalah fungsi polinomial xt. Urutan dari orde nol pada xt didefinisikan menjadi xt itu sendiri. f0(xt) didefinisikan sebagai −θo
untuk kenyamanan. Urutan persamaan sistem n diputuskan bersama dengan parameter yang tidak diketahui dari fungsi fi+1(xt). Kondisi awal n diperlukan untuk mendapatkan solusi bentuk tertutup.
Model Mn merupakan persamaan (3.4) dan (3.5) mencakup berbagai pola dinamik tergantung pada urutan sistem n.
3.2 Mengidentifikasi Model dan Parameter
Untuk time series, model nonlinier dan linier stokastik dinamik telah dikembangkan menggunakan pendekatan variasi Bayesian untuk kedua model dan identifikasi parameter. Kedua bentuk dan parameter dari model telah diidentifikasi. Variasi Bayesian memberikan laporan untuk kedua jenis hubungan stokastik: ukuran suara dan suara sistem.
Mulai dari urutan pertama M1(n = 1 pada persamaan. (3.4)), sam- pai model Mndipasang data memenuhi kriteria. Algoritma variasi bayesian dimodifikasi pada data untuk menghitung probabilitas p(yt|M ) (di mana M adalah M1, M2, . . . , Mn) time series yt diberikan model yang berbeda M , sehingga model dengan nilai tertinggi p(yt|M ) bisa dipilih untuk time series tertentu.
Untuk masing-masing calon model, nilai pada probabilitas p(yt|M ), yang juga disebut sebagai bukti Model, telah mendekati iterasi mengop- timalkan state dari sistem dan model parameter sampai nilai maksimum lokal dari p(yt|M ) tercapai. Prosedur ini tertanam ke algoritma variasi
24
optimasi Bayesian. Secara singkat, untuk menyimpulkan beberapa ele- men dari model hierarkis, yaitu sistem state, parameter (terkait dengan istilah deterministik dalam persamaan), dan hyperparameters (terkait dengan persyaratan stochastic) setiap elemen dioptimalkan satu persatu sementara sisa elemen terus tetap.
Ada dua langkah dalam prosedur optimasi ini. Pertama, dengan asumsi elemen (parameter dan state) adalah keadaan yang bebas satu sama lain, distribusi gabungan dapat difaktorisasi menjadi partisi-partisi bebas dari setiap distribusi elemen, yang dikenal sebagai pendekatan mean-field, yaitu distribusi gabungan dari semua elemen yang telah mendekati hasil pada distribusi elemen (Beal, 2003).
Kedua, distribusi setiap parameter/state didekatkan dengan dua peristiwa pertama (mean dan varians) dikenal sebagai pendekatan Laplace (Beal, 2003). pendekatan Mean-field dan pendekatan Laplace digunakan untuk pembaharuan setiap iterasi pada parameter dan state dengan men- erapkan variasi kalkulus. Logaritma dari p(yt|M ) dikenal sebagai ’energy bebas’ F (θ, yt), istilah yang dipinjam dari fisika statistik (Danuzeau et al., 2009) Energi bebas dimaksimalkan dan antara kriteria lainnya (root mean square error dinormalisasi).
Pendekatan bayes tidak hanya memberikan nilai yang paling mungkin dari parameter tetapi juga menyebabkan ketidakpastian dalam param- eter. Informasi sebelumnya mengenai parameter juga diperhitungkan.
Informasi dalam nilai parameter tidak tersedia, ole karena itu nilai rata- rata dari parameter sebelumnya ditetapkan ke nol. Algoritma yang mungkin untuk mencari daerah yang relatif luas untuk parameter yang optimal, semua varian ditetapkan menjadi 104. Kondisi awal semua di- modelkan sebagai distribusi Gaussian.
3.3 Kriteria Pemilihan Model
25
Empat kriteria yang diterapkan untuk mengidentifikasi model ter- baik Energi bebas F telah dimaksimalkan dengan menyetel parameter- parameter sistem dengan cara iterasi untuk setiap model. Catatan bah- wa membuat keputusan berdasarkan perbandingan energi bebas dari dua model dengan urutan yang berbeda bisa menjadi masalah karena penalti berat pada model yang kompleks dalam metode Bayesian seperti yang dijelaskan dalam (Beal, 2003).
1. Meningkatkan urutan sistem dengan satu tidak hanya akan me- ningkatkan derajat kebebasan dalam ruang parameter, tetapi ju- ga meningkatkan dimensi dari sistem state. Hal ini menyebabkan penurunan dramatis dalam energi bebas, yang bisa menjadi per- intah (atau beberapa perintah) lebih besar dari perbedaan energi bebas antara model urutan yang sama. Oleh karena itu, kriteria en- ergi bebas hanya digunakan untuk membandingkan model urutan yang sama. Untuk model dengan perintah yang berbeda, 2 kriteria seperti di bawah ini dapatdigunakan.
2. Normalkan Root Mean Squared Error (NRMSE) digunakan untuk membandingkan model dengan perintah yang berbeda untuk seti- ap time series. Parameter disimpulkan θi diterapkan kembali ke persamaan sistem untuk menghasilkan time series tanpa stochastic, yaitu solusi deterministik. Perhatikan bahwa karena parameter- parameter yang tlah diidentifikasi dalam bentuk distribusi normal, yang paling mungkin (rata-rata) nilai parameter yang terpasang ke dalam persamaan sistem. Root Mean Squared Error (RMSE) an- tara pengukuran time series yt dan disimpulkan deterministik time series yt dapat dihitung sebagai berikut:
RM SE =
rPn
t=1(ˆyt− yt)2
n (3.6)
3. Bentuk umum. Karena seluruh tujuan adalah untuk menemukan
26
model yang mampu menangkap pola umum di semua time series, model yang hanya bisa menjelaskan beberapa time series diabaikan.
4. Stabilitas sistem. Model harus memiliki steady stabil state unik, yang menyatakan bahwa kekurangan respon sistem dengan waktu.
Ini telah diperiksa melalui perhitungan dari bagian real dari yang sesuai nilai eigen yang harus negatif bagi stabilitas.
3.4 Analisis Statistika
Hipotesis nol tidak ada perbedaan antara kelompok kepentingan di- uji pada tingkat signifikansi 5%, dan hasilnya disajikan sebagai p-values.
Analisis statistik dari perbedaan NRMSE antara dua model dilakukan dengan menggunakan one sample t-test, yang menilai normalitas da- ta rata-rata nol dan varian tidak diketahui pada tingkat signifikan 5%.
Hasilnya disajikan sebagai p-values.
BAB 4
PEMBAHASAN DAN HASIL
Penelitian ini merupakan kajian literatur dari berbagai macam sumber yang telah diperoleh sesuai dengan bahan yang diperlukan
4.1 Pemilihan Model
4.1.1 Perbandingan pada model linear yang berbeda
Model linier dengan sistem yang berbeda. Persamaan (1) di Bagian 3.1.2 berubah menjadi diferensial linear dimana fi−1(xt) adalah tetap, dengan parameter tetap θi(i = 0, 1, . . . , n−1) dimana fn(xt) = θn, . . . , f2(xt) = θ2, f1(xt) = θ1.f0(xt) didefinfikan sebagai −θ0 untuk convenience.
Sebuah model linear dianggap pertama, dan itu tidak menunjukkan kinerja yang baik. Kemudian model linear dengansistem yang lebih ting- gi diselidiki. Pada bagian ini, disajikan hasil dari sistem dan identifikasi parameter dengan membandingkan solusi untuk linear pertama, kedua dan ketiga persamaan dinamik sebagai berikut:
Model 1 (M1) : dxt
dt + θ1− θ0 = 0 (4.1)
Model 2 (M2) : d2xt
dt2 + θ1
dxt
dt + θ1x1− θ0 = 0 (4.2) Model 3 (M3) : d3xt
dt3 + θ3
d2xt
d2t + θ2
dxt
dt + θ1x1− θ0 = 0 (4.3) Jika persamaan urutan ketiga belum berhasil, prosedur akan terus dilanjutkan untuk memperhitungkan nonlinier (disajikan dalam Bagian 4.1.2) pertama dan kemudian meningkatkan urutan sistem sampai solusi terbaik ditemukan.
Awalnya tidak hanya pengukuran suara εt (seperti dalam persamaan (4.2)) tetapi juga sistem suara ηt (seperti dalam Persamaan (4.1)) terma-
28
suk dalam model. Ditemukan bahwa untuk semua time series, model tan- pa sistem suara memiliki energi bebas yang lebih besar dibandingkan de- ngan sajian matematika yang mengandung kedua jenis stochastik. Man- faat Peningkatan - diperoleh dengan menggunakan model yang lebih kompleks dengan sistem suara tidak melebihi pinalti dengan menam- bahkan dua derajat kebebasan dalam ruang parameter. Oleh karena itu, keluarkan sistem suara dari model dan ini tercermin di sisi kanan nol dari pers (4.1) - (4.3).
Data time-series untuk model pada persamaan (4.1 4.3) ditun- jukkan dalam gambar 4.1. Hasil pada model M1M3 dalam gambar a dan c menunjukkan model terbaik dari kandidat model M3. Model M1 gagal mendeskripsikan dinamik kedua time-series sebagai indikasi dari nilai NRMSE dalam tabel 4.1: NRMSE = 0,272 dan NRMSE = 0,090. M2
berhasil mendeskripsikan kedua time-series tetapi gagal menggambarkan osilasi pada hari ke 30 yang terlihat dalam nilai NRMSE pada tabel 4.1 yaitu 0,053 dan 0,096. M3 3 berhasil menunjukkan dengan nilai NRMSE terkecil yaitu 0,014 dan 0,053. Berikut adalah gambar hasil model time series.
29
Gambar 4.1 Hasil uji model M1, M2, dan M3
30
Tabel 4.1 Nilai NRMSE untu model M1, M2, dan M3
NRMSE
M1 M2 M3
(a) 0.272 0.053 0.014 (b) 0.083 0.085 0.013 (c) 0.090 0.096 0.053 (d) 0.088 0.071 0.073
4.1.2 Nonlinear banding linear
Nonlinier diperkenalkan ke model urutan kedua dalam bentuk koe- fisien nonlinier polinomial f1(xt) atau f2(xt) dalam persamaan (4.1) meng- gunakan pendekatan. Diakui bahwa penjelasan linear jauh lebih baik dari nonlinear jika ini tidak meningkatkan jumlah parameter yang tidak diketahui secara dramatis. Konsekuensinya, jumlah maksimal parame- ter yang tidak diketahui dalam urutan model nonlinear yang kedua tetap sebanding dengan jumlah parameter dari ketiga urutan persamaan lin- ear. Dalam kondisi ini, dua model nonlinear yang telah dipertimbangkan:
Model N M1 dengan nonlinearitas dengan istilah (f1(xt) = k1(xt)+θ1, f2(xt) = k2(xt) + θ2) dan model N M2 dengan non-linear di (f1(xt) = θ1, f2(xt) = k2xt+ θ2). persamaan sistem yang sesuai adalah sebagai berikut:
N M1 : d2xt
dt2 + θ2
dxt
dt + (k1xt+ θ1)xt− θ0 = 0 (4.4) N M1 : d2xt
dt2 + (k2xt+ θ2)dxt
dt + θ1xt− θ0 = 0 (4.5) Pada gambar 4.1 bagian c menggunakan model nonlinear N M1 dan N M2 akan ditunjukkan pada gambar 4.2. Pada gambar 4.2 N M1 dan N M2
menunjukkan dinamik time-series . Kriteria NRMSE ditampilkan untuk model differensial. Nilai NRMSE untuk N M1 adalah 0.080 dan untuk N M2 adalah 0.067. lebih besar dari pada untuk M3. Terlihat bahwa N M2
bukan solusi terbaik. Oleh karena itu, model M3 keluar dari N M1 dan N M2 dan dipilih sebagai model akhir.
31
Gambar 4.2 HHasil mengkompare antara model N M1 dan N M2 serta model linear M3
4.2 Nilai Eigen
Persamaan 4.3 dalam urutan ketiga dapat diubah menjadi model ruang state linear dalam bentuk:
˙ xt
¨ xt
...xt
!
=
0 1 0
0 0 1
−θ1 −θ2 −θ3
! x˙t
¨ xt
...xt
! +
0 0 θ0
!
(4.6)
Solusi dari Persamaan (4.6) didefinisikan oleh nilai eigen λ1, λ2, λ3 dari matriks 3 × 3 eigen vektor yang sesuai dan tiga kondisi awal. Jumlah dari nilai eigen mendefinisikan perbedaan dari vektor field (volume fase V(t)) dalam ruang state:
V(t) = V0e(λ1,λ2,λ3)= V0eRt (4.7) dimana R dapat diartikan sebagai tingkat disipasi. Untuk semua seri waktu dalam kelompok, tingkat disipasi kurang dari nol, yang berarti bahwa volume fase menyusut.
BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Dalam suatu himpunan data yang unik pada time series yang terse- dia, sebuah model matematika dalam bentuk persamaan diferensial telah dibangun untuk meggambarkan bentuk dinamik. Ketiga urutan model linear terpilih sebagai keberhasilan yang digambarkan secara umum pada bentuk dinamik. Model ini terbukti bermanfaat dalam pengelompokan antara dua hal berbeda.
Optimasi data-driven yang memasukkan data historis langsung ke model pemrograman matematika, misalnya melalui pedoman eksplisit untuk membangun ketidakpastian.
5.2 Saran
Dalam pengambilan keputusan dengan adanya ketidakpastian, sebaiknya kita harus mampu mengklasifikasikan data yang diperoleh agar terban- gun model yang sesuai sehingga tidak menimbulkan resiko yang terlalu besar. Data yang diperoleh juga harus sesuai dengan tujuan yang in- gin dicapai oleh pembuat kebutuhan, sehingga dalam pembuatan model tidak terjadi error yang besar.
32
DAFTAR PUSTAKA
Ackoff, R. C., dan Emery, F. E. (1972). On purposeful system. Aldine- Atherton. Chicago
Beal, M J. (2003). Varitional Algorithms for Approximate Bayesian in- ference (Ph.D. Thesis), The Gatsby Computational Neuroscience Unit. University College London
Bertsimas, D., dan Thiele, A. (2006) A Robust Optimization Approach to Inventory Theory. Operation Research. 54(1):150-168
Bertsimas, D., dan Thiele, A. (2006). Robust and data-driven optimiza- tion: modern decision making under uncertainty. Cambridge Bertsimas., dan Sim, M. (2004). The Price of Robustness. Operation
Research. 52(1):35-53
Bunn, W, D. (1984). Applied decision analysis. USA
Daunizeau, J., Friston, K J., dan Kiebel, S J. (2009). Variasional bayesian identification and prediction of stochastic nonlinear dynamic causal models. Phys. D: Nonlinear Phenomena. 238(21):2089-2118
Elshemy, M., dan Khadr, M. (2017). Data-driven modeling for water quality prediction case study: the drains system associated with manzala lake, egypt. Engineering Journal. 8(4):549-557
Femandes, B., Street, A., Valladao, D., dan Fernandes, C. (2016). An adaptive robust portofolio optimization model with loss constraints based on data-driven polihedral uncertainty sets. Operation Re- search. 255(3):961-970
Huang, B., dan Kadali, R. (2008). Dynamic modeling, predictive con- trol and performance monitoring: data-driven modeling subspace approach. London
Meng, C., Nageshwaraniyer, S S., Maghsoudi, A., Son, Y J., dan Dessureault, S. (2013). Data-driven modeling and simulation frame- work for material handling systems in coal mines. Computer and Industrial Engineering. 64(3): 766-779
Mohanty, S., Jagadeesh, M., dan Srivatsa, H. (2013). Big data impera- tives. India
Simon, H A. (1957). Models of man. New York
Solomatine, D P., dan Ostfeld, A. (2008). A Data-driven Modelling:
Some Past Experience and New Approaches. Journal of Hydroin- formatics. 10(1):3-22
Supranto. (2009). Teknik Pengambilan Keputusan. Rineka Cipta. Jakar- ta
Three rivers district council. (2008). Data Quality Strategi. Inggris
34
R., dan Khovanova, N. (2017). A new data-driven model for post- trasplant antibody dynamics in high risk kidney transplantation.
Mathematical Biosciences. 284:3-11