MODEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPUTUSAN DENGAN ADANYA KEPTIDAKPASTIAN

(1)

MODEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPUTUSAN DENGAN

ADANYA KEPTIDAKPASTIAN

TESIS

Oleh

LAYLA ANGRIA S 157021031/MT

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

MEDAN 2017

(2)

MODEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPUTUSAN DENGAN

ADANYA KEPTIDAKPASTIAN

T E S I S

Diajukan Sebagai Salah Satu Syarat

untuk Memperoleh Gelar Magister Sains dalam Program Studi Magister Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Sumatera Utara

Oleh

LAYLA ANGRIA S 157021031/MT

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

MEDAN 2017

(3)

(4)

Telah diuji pada

Tanggal : 22 Mei 2017

PANITIA PENGUJI TESIS

Ketua : Prof. Dr. Muhammad Zarlis Anggota : 1. Prof. Dr. Tulus, M.Si

2. Dr. Sutarman, M.Sc

3. Prof. Dr. Opim Salim S, M.Sc

(5)

PERNYATAAN

MODEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPUTUSAN DENGAN ADANYA KETIDAKPASTIAN

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya sendiri, kecuali be- berapa kutipan dan ringkasan yang masing-masing dituliskan sumbernya

Medan, 22 Mei 2017 Penulis,

Layla Angria S

(6)

ABSTRAK

Maraknya isu-isu pengambilan keputusan dengan adanya ketidakpastian telah menjadi perbincangan yang sangat hangat dalam operation re- search. Banyak model-model yang disajikan untuk membantu membuat keputusan dengan adanya ketidakpastian tersebut. Perkembangan terki- ni dalam ilmu komputasi khususnyaa pada mesin belajar sangat mengem- bangkan data empiris. Bidang yang termasuk dalam pendekatan baru yaitu data-driven modeling (DDM), model ini berdasarkan pada data antara variabel sistem (variabel input, internal dan output).

Kata kunci : Data driven, Ketidakpastian, Pengambilan keputusan.

ii

(7)

ABSTRACT

The rise of the issues with the uncertainty of decision making has become a very warm conversation in operation research. Many models are presented to help make decisions in the presence of uncertainty.

Recent developments in the science of computing, especially in machine learning is to develop empirical data. Fields are included in the new approach is data-driven modeling (DDM), this model is based on data between system variables (variables input, internal and output).

Keyword : Data driven, Uncertainty, Decision making

(8)

KATA PENGANTAR

Puji syukur kehadiran Allah SWT karena atas rahmat, nikmat dan hidayah-Nya penulis dapat menyelesaikan Tesis ini dengan berjudul MO- DEL DATA-DRIVEN UNTUK MASALAH PENGAMBILAN KEPU- TUSAN DENGAN ADANYA KETIDAKPASTIAN untuk memenuhi sebagai persyaratan mendapatkan gelar magister sains dalam program studi magister matematika pada Fakultas Matematika dan Ilmu Penge- tahuan Alam Universitas Sumatera Utara dengan berbagai hambatan yang dialami.Penulis menyadari bahwa terselesainya penulisan tesis ini tidak lepas dari bantuan berbagai pihak. Oleh karena itu, melalui ke- sempatan ini penulis mengucapkan terima kasih kepada:

Prof. Dr. Runtung Sitepu, SH., Mhum selaku rektor Universitas Suma- tera Utara.

Dr. Kerista Sebayang, M.S, selaku Dekan Fakultas Matematika dan ilmu Pengetahuan Alam Universitas Sumatera Utara yang telah memberikan kesempatan penulis untuk menempuh pendidikan di Universitas Suma- tera Utara.

Bapak Prof. Saib Suwilo, M.Sc selaku Ketua Program Studi Magister Matematika FMIPA Universitas Sumatera Utara dan juga selaku pem- banding dalam penyelesaian tesis ini.

Bapak Dr. Sawaluddin, MIT selaku Sekretaris Program Studi Magister Matematika FMIPA USU.

Bapak Prof. Dr. Muhammad Zarlis selaku pembimbing 1 tesis ini.

Bapak Prof. Dr. Tulus M.Si selaku pembimbing 2 tesis ini.

Bapak/Ibu Dosen Program Studi Magister Matematika FMIPA USU yang telah membekali ilmu pengetahuan kepada penulis selama perkuli- ahan hingga selesai.

iv

(9)

Ibu Misiani, S.Si selaku Staf Administrasi Program Studi Magister Ma- tematika FMIPA USU yang telah memberikan pelayanan administrasi selama mengikuti pendidikan.

Secara khusus dan istimewa penulis sampaikan terima kasih dan sayang yang mendalamkepada ibunda tersayang SUWARTI dan ayahan- da MANAN SIRAIT serta adik-adikku tersayang Sri Kumala Sari Sir- ait, Annisa Hidayati Sirait, Rahwani Sucita Sirait yang senantiasa mem- berikan dukungan dan doa kepada penulis selama menyelesaikan pen- didikan di Universitas Sumatera Utara. Tidak lupa pula penulis ucap- kan terimakasih kepada sahabat-sahabat Mahasiswa program studi Mag- ister Matematika FMIPA USU tahun 2014 yang telah menjadi sahabat sekaligus keluarga yang selalu membantu penulis selama menyelesaikan pendidikan di Universitas Sumatera Utara ini.

Penulis hanya dapat berdoa semoga kebaikan semua pihak yang ter- libat dalampembuatan tesis ini mendapatkan balasan dari Allah SWT yang berlipat ganda. Akhirnya penulis berharap semoga ini dapat bermafaat bagi penulis dan para pembaca.

Medan, Mei 2017 Penulis,

Layla Angria S

(10)

RIWAYAT HIDUP

Layla Angria S adalah anak pertama dari 4 bersaudara dari pasangan Manan Sirait dan Suwarti, dilahirkan di Huta Padang pada tanggal 16 April 1993. Menamatkan Sekolah Dasar (SD) di SDN 091524 pada tahun 2005. Sekolah Menengah Pertama (SMP) di SMP Negeri 2 Rantau Utara pada tahun 2008. Dan Sekolah Menengah Atas (SMA) di SMA Negeri 2 Rantau Utara pada tahun 2011. Tahun 2011, penulis memasuki Univer- sitas Muhammadiyah Sumatera Utara (UMSU) pada Fakultas Keguruan Ilmu Pendidikan Program Studi Pendidikan Matematika dan lulus tahun 2015. Semenjak tamat penulis bekerja sebagai Guru Matematika di SMA Negeri Medan hingga sekarang dan mengajar dibimbingan belajar cutie jalan mandala by pass sampai sekarang. Tahun 2015 penulis mengikuti Program Studi Magister Matematika di Universitas Sumatera Utara. Se- lama kurun waktu 2 tahun belajar di Pascasarjana USU, Penulis banyak mendapatkan pengalaman belajar yang sangat berharga. Berkat doa dan dukungan keluarga, akhirnya penulis dapat menyelesaikan pendidikan S- 2 pada Program Studi Magister Matematika Universitas Sumatera Utara di tahun 2017, dan memperoleh gelar Magister Sains Matematika (M.Si).

vi

(11)

DAFTAR ISI

Halaman

PERNYATAAN i

ABSTRAK ii

ABSTRACT iii

KATA PENGANTAR iv

RIWAYAT HIDUP vi

DAFTAR ISI vii

DAFTAR TABEL ix

DAFTAR GAMBAR x

BAB 1 PENDAHULUAN 1

1.1 Latar Belakang 1

1.2 Perumusan Masalah 3

1.3 Tujuan Penelitian 4

1.4 Manfaat Penelitian 4

BAB 2 TINJAUAN PUSTAKA 5

2.1 Pengambilan Keputusan 5

2.2 Pengambilan Keputusan dengan Adanya Ketidakpastian 6

2.3 Model Data-driven 8

2.3.1 Data 8

2.3.2 Model data-driven 10

2.4 Latar Belakang Teori 10

2.4.1 Regresi dan masalah klasifikasi 10

2.4.2 Analisis regresi 12

(12)

2.4.3 Analisis klasifikasi 12

2.5 Model Klasik Data-driven 13

2.6 Jenis Optimasi 16

2.7 Model Program Linear 17

BAB 3 METODOLOGI PENELITIAN 20

3.1 Menyiapkan Data dan Memilih Model 20

3.1.1 Kasus skalar 21

3.1.2 Bentuk pada model: linear/nonlinear dan sto-

kastik 22

3.2 Mengidentifikasi Model dan Parameter 23

3.3 Kriteria Pemilihan Model 24

3.4 Analisis Statistika 26

BAB 4 PEMBAHASAN DAN HASIL 27

4.1 Pemilihan Model 27

4.1.1 Perbandingan pada model linear yang berbeda 27

4.1.2 Nonlinear banding linear 30

4.2 Nilai Eigen 31

BAB 5 KESIMPULAN DAN SARAN 32

5.1 Kesimpulan 32

5.2 Saran 32

DAFTAR PUSTAKA 33

viii

(13)

DAFTAR TABEL

Nomor Judul Halaman

2.1 Teknik pengambilan keputusan 6

2.2 Data model program linear 19

4.1 Nilai NRMSE untu model M1, M2, dan M3 30

(14)

DAFTAR GAMBAR

Nomor Judul Halaman

2.1 Flowchart model data-driven 16

4.1 Hasil uji model M1, M2, dan M3 29 4.2 HHasil mengkompare antara model N M1 dan N M2 serta

model linear M3 31

x

(15)

BAB 1 PENDAHULUAN

1.1 Latar Belakang

Salah satu hal penting dalam suatu kehidupan yaitu adanya su- atu keputusan yang diciptakan oleh pembuat keputusan. Sederhananya adalah dalam kehidupan sehari-hari sering melakukan pengambilan kepu- tusan berdasarkan hal-hal yang mendukungnya. Pengambilan keputusan dilakukan berdasarkan informasi yang tersedia. Informasi yang diperoleh biasanya berupa data.

Mohanty et al., (2013) Secara umum data bisa didefinisikan menjadi 3 karakteristik penting yaitu: komposisi, konteks, dan kondisi. Kompo- sisi mengacu pada struktur data: apa sumbernya, apa tipe datanya, apa sifat dari data (sebagian besar data statik atau data real time streaming) dan sebagainya. Konteks mengacu kepada bagaimana data dihasilkan, apa peristiwa yang terkait dengan data, bagaimana sensitivitas data dan lain-lain. Kondisi mengacu pada keadaan data dan apakah data itu da- pat digunakan untuk analisis atau perlu pembersihan lebih lanjut dan pengayaan.

Tetapi dalam kenyataannya, Bertsimas dan Thiele (2006) mengatakan bahwa informasi atau data yang tersedia tidaklah lengkap dan strate- gi berdasarkan pada input yang salah mungkin tidak dapat dikerjakan dengan mudah, atau memberikan hasil yang buruk ketika diimplemen- tasikan. Sehingga akan mempengaruhi pengambilan keputusan.

Bunn (1984) Pengambilan keputusan adalah suatu aktivitas yang ada dimana-mana yang melekat pada suatu individu, kelompok sosial, maupun kelompok organisasi. Dalam dunia perindustrian pengambilan keputusan merupakan hal yang sangat penting misalnya dalam memu-

(16)

2

tuskan berapa permintaan konsumen terhadap suatu produk, masalah transportasi, sumber daya air dan banyak lagi.

(17)

3

Masalah yang sangat kompleks pada pengambilan keputusan adalah adanya ketidakpastian. Ketidakpastian merupakan suatu kondisi dimana tidak mengetahui hasil yang diharapkan di masa mendatang dikarenakan tidak mengetahui besarnya probabilitas dari suatu peristiwa yang dihara- pkan. Adanya ketidakpastian, akan menyebabkan penulis menghadapi risiko di masa depan. Risiko merupakan seberapa besar kemungkinan timbulnya suatu peristiwa yang sifatnya acak, setelah mengetahui prob- abilitasnya.

Bertsimas dan Thiele (2006) Teori pengambilan keputusan dengan adanya ketidakpastian telah menjadi hal penting beberapa tahun ini karena selera konsumen yang berubah-ubah, inovasi teknologi, dan pen- gurangan siklus produk yang mengurangi jumlah informasi yang tersedia dan membuatnya lebih cepat kuno. Dalam matematik informasi yang tidak lengkap akan mengancam relevansi yang diperoleh oleh komputer.

Oleh karena itu, dengan adanya ketidakpastian parameter yang mem- pengaruhi keputusan tersebut penulis harus menggunakan model yang sesuai untuk menentukan keputusan apa yang akan penulis peroleh dan mengurangi resiko yang akan ditimbulkan. Model yang akan dibahas dalam masalah ini adalah model data-driven. Khadr dan Elshemy (2016) mengemukakan bahwa model data-driven yaitu model yang berdasarkan pada data, dimana sebuah model dibangun pada basis yang menghu- bungkan antara beberapa sistem variabel seperti variabel input, internal dan output dengan hanya anggapan terbatas tentang sistem.

1.2 Perumusan Masalah

Bertsimas dan Thiele (2006) Pengambilan keputusan dengan ada- nya ketidakpastian telah diperkenalkan sejak tahun 1950 oleh Dantzig, Charnes dan Cooper. Kemudian menjadi topik yang sering dibicarakan dalam reseach operation dengan menggunakan banyak model. Salah sat- unya menggunakan model data driven. Model ini telah banyak dibicarakan

(18)

4

sehingga dalam penilitianini model data-driven dikembangkan untuk ma- salah pengambilan keputusan dengan adanya ketidakpastian.

1.3 Tujuan Penelitian

Adapun tujuan dari penelitian ini adalah mengembangkan model data-driven untuk masalah pengambilan keputusan dengan adanya keti- dakpastian.

1.4 Manfaat Penelitian

Penelitian ini diharapkan dapat bermanfaat pada berbagai masalah yang berhubungan dengan model data-driven untuk masalah pengambi- lan keputusan dengan adanya ketidakpastian.

(19)

BAB 2

TINJAUAN PUSTAKA

2.1 Pengambilan Keputusan

Pengambilan keputusan adalah aktivitas yang melekat pada indi- vidu, organisasi dan sosial. Ackoff dan Emery (1972) dalam buku applied decision analysis telah mendeskripsikan pengambilan keputusan seper- ti sebuah karakteristik sistem tertentu. Dalam konteks pengelolaan, Simon (1960) telah menyatakan bahwa pengambilan keputusan terdiri dari 3 prinsip yaitu: menemukan peristiwa untuk membuat keputusan, menemukan jalan yang mungkin pada aksi, dan memilih diantara jalan tersebut.

Supranto (2009) Secara umum ada 4 kategori pengambilan keputu- san yaitu:

1. Keputusan dalam keadaan ada kepastian (certainty) 2. Keputusan dalam keadaan ada resiko (risk)

3. Keputusan dalam keadaan adanya ketidakpastian (uncertainty) 4. Keputusan dalam keadaan ada konflik (conflict)

Secara keseluruhan teknik-teknik yang dapat dipergunakan untuk pengambilan keputusan yang berbeda-beda dapat dilihat sebagai berikut:

(20)

6

Tabel 2.1 Teknik pengambilan keputusan

No. Situasi Keputusan Pemecahan Teknil

1. Ada kepastian Deterministik 1. Linear programming 2. Model transportasi 3. Model penugasan 4. Model inventori 5. Model antrian 6. Model network

2. Ada resiko Probabilistik 1. Model keputusan pro-

babilistik

2. Model inventori probabilistik

3. Model antrian probabilistik

3. Tidak ada kepastian Tak diketahui Analisis keputusan dalam ketidakpastian 4. Ada konflik Tergantung tindakan lawan Teori permainan (game

theory)

2.2 Pengambilan Keputusan dengan Adanya Ketidakpastian

Raiffa dan Schalaifer (1961) Pengambilan keputusan dengan ada- nya ketidakpastian adalah arena utama dalam kinerja metodologi anal- isis keputusan. Memang, fungsi utama dari analisis keputusan, seperti yang awalnya dikembangkan adalah untuk membantu evaluasi pembu- atan keputusan untuk pilihan yang hasil akhirnya tidak diketahui secara pasti.

Three rivers district council (2008) Ada empat pendekatan terhadap pengambilan keputusan dalam kondisi ketidakpastian yaitu :

1. Kriteria keputusan Laplace

(a) Pendekatan ini mengumpamakan bahwa setiap situasi punya peluang yang sama untuk terjadi

(b) Cara pengambilan keputusan: Hitung nilai harapan setiap strate- gi dan pilih strategi dengan nilai Tertinggi : kalau berhubungan dengan masalah profit.

(21)

7

Terendah : kalau berhubungan dengan masalah cost 2. Kriteria keputusan Wald

(a) Ini adalah kriteria yang paling konservatif, karena berpijak pa- da prinsip melakukan yang terbaik dalam kondisi/situasi ter- buruk yg mungkin terjadi

(b) Tindakan/keputusan terbaik adalah : Minimax : untuk masalah cost/loss Maximin : untuk masalah profit/gain 3. Kriteria keputusan Hurwicz

(a) Kriteria ini punya jangkauan sikap dari yang paling optimis hingga yang paling pesimis

(b) Dengan mengambil α sebagai derajat/indeks. Jika tidak ada

”feeling” yang kuat pada seseorang pengambil keputusan, maka α =¹/2 merupakan pilihan yang paling masuk akal (reasonable).

4. Kriteria keputusan Savage

Kriteria Savage menetapkan bahwa pengambilan keputusan mungkin mengalami penyesalan. Setelah keputusan yang diambil dan terny- ata situasi lain yang terjadi. Pasti menyesal mengapa tidak menen- tukan strategi yang lama.

Bertsimas dan Thiele (2006) ketidakpastian dapat mengambil 2 bentuk berikut yaitu:

(22)

8

i) Kesalahan estimasi untuk parameter tetap tapi nilai tidak dike- tahui dan,

ii) Stokastik pada variabel acak. Untuk menyajikan kerangka ro- bust pada matematik yang telah ditulis oleh Bertsimas dan Sim dan menghitung masalah program linear:

min c⁰x s.t Ax ≥ b,

x ∈ X

2.3 Model Data-driven 2.3.1 Data

Three rivers district council (2008) Istilah data, informasi dan penge- tahuan sering digunakan secara bergantian dan didefinisikan sebagai berikut:

1. Data

Data adalah angka, kata-kata atau gambar yang belum diatur atau dianalisis untuk menjawab pertanyaan tertentu.

2. Informasi

Dihasilkan melalui pengolahan, memanipulasi dan mengatur data yang untuk menjawab pertanyaan, menambah pengetahuan pener- ima.

3. Pengetahuan

Melibatkan menafsirkan informasi yang diterima, menambahkan rel- evansi dan konteks untuk memperjelas wawasan informasi tersebut.

(23)

9

Karakteristik data:

1. Akurasi

Data harus cukup akurat untuk tujuan penggunaan dan harus digam- barkan hanya sekali, meskipun mungkin memiliki beberapa kegu- naan. Data harus digambarkan pada titik aktivitas.

2. Validitas

Data harus dicatat dan digunakan sesuai dengan persyaratan yang relevan, termasuk aplikasi yang benar dari setiap aturan atau defin- isi. Ini akan memastikan konsistensi antara periode dengan kelom- pok serupa, mengukur apa yang dimaksudkan untuk menjadi uku- ran.

3. Reliabilitas

Data harus mencerminkan proses pengumpulan data yang stabil dan konsisten diseluruh tempat pengumpulan dan dari waktu kewaktu.

Kinerja harus mencerminkan perubahan nyata dari variasi dalam pendekatan pengumpulan data atau metode.

4. Aktual

Data harus digambarkan secepat mungkin setelah kegiatan dan harus tersedia dalam jangka waktu yang wajar. Data harus tersedia de- ngan cepat dan sering untuk mendukung kebutuhan kebutuhan in- formasi dan mempengaruhi layanan atau keputusan

5. Relevan

Data harus relevan dengan tujuan yang akan digunakan, ini memer- lukan penelaahan bersyarat untuk mencerminkan perubahan kebu- tuhan.

6. Lengkap

(24)

10

Data harus cukup akurat untuk tujuan penggunaan, meskipun mungkin memiliki beberapa kegunaan. Data harus menggambarkan titik ak- tivitas.

2.3.2 Model data-driven

Solomatine et al., (2008) model data driven adalah berdasarkan analisis pada data tentang sebuah sistem yang spesifik. Konsep utama model data driven adalah untuk menemukan hubungan antara sistem variabel state (input dan output) tanpa informasi yang lengkap pada suatu sistem.

Model data-driven adalah bidang hidroinformatic yang mengalami perkembangan sangat cepat. Meng et al., (2013) mengemukakan Mo- del simulasi data-driven sebagai salah satu yang dirancang yang berlaku untuk sistem dengan struktur yang sama. Dibandingkan dengan pemod- elan yang khas, model data-driven menjamin biaya pembangunan yang rendah dan waktu penggunaan serta pemeliharaan perangkat lunak in- dependen dari pengembangan model.

Perkembangan terkini dalam ilmu komputasi khusunya dalam mesin pembelajaran (mechine learning) telah mengembangkan pemodelan em- piris. Bidang penelitian baru disebut model data-driven (DDM). Khadr et al., (2016) mengemukakan data driven modeling (DDM) adalah anal- isis data yang berdasarkan pada suatu sistem, khususnya menemukan hubungan antara sistem variabel keadaan (input, internal dan output).

2.4 Latar Belakang Teori

2.4.1 Regresi dan masalah klasifikasi

Secara umum ada dua daerah yang akan dilihat dimana teknik anal- isis memerlukan model atau simulasi pada penomena yang terjadi (anal- isis regresi), dan identifikaksi atau pengkategorian pada kejadian yang

(25)

11

terjadi atau pola (analisis klasifikasi). Dua daerah ini memiliki karakter- istik unik dengan istilah untuk mencapai objektivitas, sumber data, dan implementasi setelah kalibrasi, membutuhkan pendekatan yang sesuai untuk kesuksesan pengembangan model.

(26)

12

2.4.2 Analisis regresi

Analisis regresi meliputi teknik atau logaritma yang digunakan un- tuk pemetaan atau penghubungan beberapa variabel diantara keduanya.

Fokusnya adalah mengembangkan hubungan antara satu atau beberapa variabel dependen (output) dengan satu atau lebih variabel indepen- den (input). Hubungan ini dalam algoritma machine learning adalah mirip bentuknya dengan apa yang dilihat dalam model klasik seperti lin- ear atau persamaan polinomial, ARMA, ARIMA, regresi kuantil. Oleh karena itu bentuk umum untuk analisis regresi adalah pemetaan input dan output yang disajikan dalam bentuk matematika.

2.4.3 Analisis klasifikasi

Analisis identifikasi terkait dengan pengkategorian atau pelabelan kelompok nilai variabel yang diberikan kedalam daftar kelompok yang telah ditentukan sebelumnya. Ada 2 tipe analisis klasifikasi yaitu, perta- ma menggunakan kelompok kategori yang telah ditentukan sebelumnya, kedua dimana algoritma diminta untuk menemukan sejumlah kelompok atau label yang mungkin terjadi dalam data.

Identifikasi sekelompok variabel kedalam kategori atau kelas terten- tu biasanya ditentukan oleh pengukuran kedekatan nilai dengan pusat kelompok tertentu untuk masing-masing kategori/label.Analisis klasi- fikasi sering digunakan untuk menentukan kategori atau level antara data, perubahan karakteristik data statistik yang masuk, mendeteksi ke- salahan data data.

He mengemukakan tujuan model data-driven adalah mengekstrak dan mengenal pola dalam data, menafsirkan atau menjelaskan penga- matan, uji validitas hipotesis. Mencari ruang hipotesis. Hal yang harus dilakukan pada pemodelan data driven adalah

1. Klasifikasi: penempatan kelas untuk jalur input data;

(27)

13

2. Asosiasi: dimana hubungan antara variabel karakteristik adalah un- tuk diidentifikasi dalam prediksi berikutnya;

3. Regresi: memprediksi nilai real yang terkait dengan titik input data, 4) mengelompokkan: mengelompokkan data dengan kelompok yang sama yang akan ditentukan.

Solomatine dan Ostfeld (2008) salah satu pengaplikasian model data- driven adalah model statistik (regresi linear, autoregressive moving aver- age (ARMA) dan autoregressive integrated moving average (ARIMA)) dan model mechine learning (ML).

Alat yang biasanya digunakan dalam model data-driven adalah dalam bidang statistik yaitu: regresi linear, regresi nonlinear, regresi logis- tic, probit regresi. Dalam ilmu komputasi teknik yang biasa digunakan adalah decision tree, artificial neural network (ANN), Nearest Neigh- bours, support vektor machine, association rule learning.

2.5 Model Klasik Data-driven

Model klasik data-driven seperti regresi linear. Untuk linear atau persamaan polinomial, ARIMA dan ARMA.

a. Regresi polinomial

Regresi polinomial digunakan untuk menentukan fungsi polinomial yang paling sesuai dengan kumpulan titik data (Xn, Yn) yang dike- tahui. Fungsi pendekatan:

Y = β0+ β1X + β2X² + ε (2.1)

Kurva digambarkan oleh kurva lengkung kuadratik.

Y = β0+ β1X + β2X²+ . . . + βkX^k + ε (2.2) Ditaksir dengan menggunakan metode least square.

(28)

14

Algoritma regresi polinomial:

1. Tentukan n titik data yang diketahui dalam xi, yi untuk i = 1, 2, 3, . . . , n;

2. Hitung nilai-nilai yang berhubungan dengan jumlah data;

3. Hitung nilai koefisien;

4. Tampilkan fungsi polinomial;

5. Tampilkan hasil xn, yn dari fungsi polinomial tersebut.

b. ARMA

Luthkepohl (2005) time series pada dasarnya merupakan data pe- ngukuran yang diambil secara kronologis dalam kurun waktu ter- tentu. ARMA merupakan teknik peramalan time series. Sadeq (2008) Model ARMA bisa dipecah menjadi mode AR (Autoregres- sive) dan model MA (Moving Average).

yt= b0+ b1yt−1+ b2yt−2+ . . . + bnyt−n+ εt (2.3) Model MA (Moving Average)

yt= a0+ a1εt−1+ a2εt−2+ . . . + anεt−n+ εt (2.4) dimana:

yt : Merupakan time series

yt−1, yt−2, . . . , yt−n : Merupakan time series sebelumnya et−1, et−2, . . . , et−n, et : Merupakan residual

a0, a1, a2, . . . , an : Merupakan konstanta dan koefisien model MA b0, b1, b2, . . . , bn : Merupakan konstanta dan koefisien model RA

Salah satu teknik yang digunakan pada ilmu komputasi adalah teknik jaringan saraf atau neural network. Khadr dan Elshemy (2016) menge- mukakan Jaringan saraf saraf adalah model yang terinspirasi secara biol- ogis, yang berdasarkan pada jaringan otak manusia. Model neural net- work dikembangkan dengan melatih jaringan untuk mewakili hubungan

(29)

15

dan proses yang terdapat dalam data. Pendekatan umum dalam model data-driven:

(30)

16

Gambar 2.1 Flowchart model data-driven

2.6 Jenis Optimasi

Ada berbagai jenis optimasi yang sudah berkembang, antara lain pemrograman linear dan pemrograman non linear.

1. Program linear Program linear menyelesaikan kasus pada fungsi tujuan dan fungsi kendala yang bersifat linear, yaitu pangkat dari variabelnya adalah

(a) Bentuk umum model program linear adalah:

max / min Z = Xn

j=1

cjxj

kendala:

Xn j=1

aijxj ≤ I ≥ bi untuk i = 1, 2, 3, . . . , m

xj ≥ 0 untuk j = 1, 2, 3, . . . , n

Untuk menyelesaikan program linear, dapat digunakan metode grafik, yaitu mentransformasikan formulasi ke dalam sebuah grafik. Tetapi metode ini hanya efektif untuk formulasi dengan banyak variabel dua. Untuk formulasi dengan variabel lebih dari dua, dapat digu- nakan metode simpleks. Metode grafik dan simpleks digunakan pada program linear dengan variabelnya dapat bernilai desimal.

(31)

17

Tetapi dalam perkembangannya, ada program linear di mana vari- abelnya harus bernilai bilangan bulat atau integer yang dikenal de- ngan ILP (Integer Linear Programming) dan juga ada pula variabel yang bernilai 0 atau 1 yang dikenal dengan nama BILP (Binary Integer Linear Programming) dan ada pula program linear yang berupakan campuran ILP dan BILP yaitu MILP (Mixed Integer Linear Programming).

2. Program non linear Program non linear merupakan pemrograman dengan fungsi tujuannya saja atau bersama dengan fungsi kendala berbentuk non linear yaitu pangkat dari variabelnya lebih dari satu.

Program non linear dapat mempunyai kendala maupun tidak mem- punyai kendala. Untuk penyelesaiannya dapat digunakan metode Lagrangian atau Kuhn-Tucker.

2.7 Model Program Linear

Program linear merupakan suatu model umum yang dapat digu- nakan dalam pemecahan masalah pengalokasian sumber-sumber yang terbatas secara optimal. Model program linear merupakan bentuk dan susunan dalam menyajikan masalah-masalah yang akan dipecahkan de- ngan teknik program linear.

Dalam model program linear dikenal 2 (dua) macam fungsi, yaitu fungsi tujuan (Objective Function) dan fungsi batasan (constraint func- tion). Fungsi tujuan adalah fungsi yang menggambarkan tujuan/sasaran di dalam permasalahan program linear yang berkaitan dengan pengat- uran secara optimal sumberdaya-sumberdaya, untuk memperoleh keun- tungan maksimal atau biaya minimal. Nilai yang akan dioptimalkan dinyatakan sebagai Z. Fungsi Batasan merupakan bentuk penyajian se- cara matematis batasan-batasan kapasitas yang tersedia yang akan di- alokasikan secara optimal ke berbagai kegiatan.

(32)

18

Bentuk umum persamaan model program linear adalah sebagai berikut:

Fungsi tujuan: Maksimumkan Z = C1X1+ C2X2+ C3X3+ . . . + CnXn

Batasan-batasan:

a11X1+ a12X2+ a13X3+ . . . + a1nXn ≤ b1

a21X1+ a22X2+ a23X3+ . . . + a2nXn ≤ b2

am1X1+ am2X2 + am3X3 + . . . + amnXn ≤ bm

dan

X1 ≥ 0, X2 ≥ 0, . . . , Xn≥ 0

Adapun simbol-simbol dalam model program linear adalah sebagai berikut:

m = Macam batasan sumber atau fasilitas yang tersedia

n = Macam kegiatan yang menggunakan sumber atau fasilitas tersebut i = Nomor setiap macam sumber atau fasilitas yang tersedia (i = 1, 2, . . . , m) j = Nomor setiap macam kegiatan yang menggunakan sumber atau fasilitas

yang tersedia (j = 1, 2, . . . , n)

Xj = Tingkat kegiatan ke, j. (j = 1, 2, . . . , n)

aij = Banyaknya sumber i yang diperlukan untuk menghasilkan setiap unit keluaran (output) kegiatan j (i = 1, 2, . . . , m, dan j = 1, 2, . . . , n)

bi = Banyaknya sumber (fasilitas) yang tersedia untuk dialokasikan ke setiap unit kegiatan (I = 1, 2, . . . , n)

Z = Nilai yang dioptimalkan (maksimum atau minimum)

Cj = Kenaikan nilai Z apabila ada pertambahan tingkat kegiatan (xj) dengan satu satuan (unit); atau merupakan sumbangan setiap satuan keluaran kegiatan j terhadap nilai Z

Berikut ini adalah tabel data untuk model program linear:

(33)

19

Tabel 2.2 Data model program linear Pemakaian sumber per unit

Sumber kegiatan kegiatan(keluaran) Kapasitas sumber

1 2 3 . . . n

1 a11 a21 a31 . . . a1n b1

2 a₂₁ a₂₂ a₂₃ . . . a_2n b₂

3 a31 a32 a33 . . . a3n b3

... ... ... ... ... ...

M a_m1 a_m2 a_m3 . . . a_mn b_mn

∆Z pertambahan tiap unit c1 c2 c3 . . . cn

Tingkat kegiatan X1 X2 X3 . . . Xn

(34)

BAB 3

METODOLOGI PENELITIAN

Solomatine dan Ostfeld (2008) model data-driven telah diaplikasikan dalam sistem sumber daya air, dan hidrologi kurva penilaian, metode hidrograph, model statistika meliputi regresi linear, autoregressive mov- ing average (ARMA), autoregressive moving average (ARIMA) dan mo- del machine learning (ML). Machine learning.

Proses dalam model data-driven dengan adanya ketidakpastian yaitu dengan:

1. Menyiapkan data: memperoleh data / pengecekan data / pember- sihan data;

2. Pilih yang paling utama: jika kamu mempunyai data yang sangat besar;

3. Menentukan asumsi: berdasarkan pada pengetahuan daerah asal;

4. Mengembangkan model: berdasarkan pada asumsi;

5. Menentukan fungsi kerugian seperti: mean square error antara out- put model dan data real;

6. Menggunakan algoritma: untuk meminimize kerugian berdasarkan pada data;

7. Menguji model: menggunakan pengujian data.

3.1 Menyiapkan Data dan Memilih Model

Pertama pendekatan intuisi adalah untuk menggabungkan ketidak- pastian dengan formulasi deterministik seperti masalah program linear dimana tidak terdapat random (acak).

20

(35)

21

3.1.1 Kasus skalar

Dimulai dari kasus yang sederhana dimana pembuat keputusan harus menentukan berapa banyak item yang akan dikirim setiap periode pada sebuah toko. (Dalam matematika, state pada sistem dapat dideskrip- sikan sebagai variabel skalar, secara khusus jumlah persediaan). Gu- nakan notasi berikut ini:

xt : Persediaan awal pada periode waktu t

ut : Jumlah yang dikirim pada awal periode waktu t wt : Permintaan yang terjadi selama periode waktu t

Permintaan dari hari kehari, dan pesanan dibuat pada awal periode waktu tiba diakhir periode yang sama. Oleh karena itu dinamik pada sistem dapat dideskripsikan sebagai persamaan linear:

Xt+1 = xt+ ut− wt (3.1)

Yang menghasilkan rumus bentuk tertutup:

Xt+1= x0+ (ut− wt) (3.2)

Biaya yang dikeluarkan pada setiap periode waktu memiliki dua komponen:

1. Biaya pemesanan linear dalam jumlah yang dipesan, dengan c unit harga pesanan (Bertsimas dan Thiele juga mempertimbangkan ka- sus pada biaya tetap dibebankan setiap kali pesanan dibuat);

2. Biaya persediaan, dengan h , masing-masing s, biaya unit peme- sanan per item diadakan dalam persediaan setiap akhir periode.

Pembuat keputusan meminimalkan total biaya dalam jangka wak- tu panjang T , memiliki perkiraan jangkauan [ ¯wt− ˆwt, ¯wt+ ˆwt], berpusat

(36)

22

didugaan nominal ˆwt, untuk permintaan pada setiap periode waktu t, de- ngan t = 0, . . . , T 1. Jika ketidakpastiaan tidak ada, masalah yang dihadapi oleh pembuat keputusan dapat dirumuskan sebagai masalah program lin- ear:

min cX^{T −1}

t=0 ut+X^{T −1}

t=0 yt

s.t yt> h

x0+X^t

T =0(uT − wT)

∀t

yt> s

x0+X^t

T =0(uT − wT)

∀t

ut> 0, ∀t

(3.3)

Dalam Optimalitas, yt = biaya persediaan dihitung pada akhir periode waktu t seperti max(hxt+1, −sxt+1). Solusi optimal untuk masalah diatas adalah tidak ada pemesanan jika persediaan cukup pada awal periode t untuk memenuhi permintaan ¯wt, dan pemesanan item selesai, seperti

¯ wt− xt.

3.1.2 Bentuk pada model: linear/nonlinear dan stokastik

Sebuah bentuk umum dari persamaan diferensial nonlinear dengan koefisien dalam bentuk fungsi polinomial telah dipertimbangkan. Awal- nya dua istilah stokastik dimasukkan untuk mewakili pengiriman suara dalam persamaan sistem. Pengukuran suara ditambahkan karena keti- dakpastian dalam data yang diukur, dan suara dinamis dihitung un- tuk setiap sifat tersembunyi lainnya yang tidak ditangkap oleh model.

Dideskripsikan dengan model berikut:

dⁿ

dⁿxt+Xⁿ⁻¹

i=0 fi−1(xt) dⁱ

dtⁱxt+ f0(xt) = ηt (3.4)

yt = xt+ εt (3.5)

Persamaan (3.4) - (3.5) adalah persamaan yang mengalami perubahan, dimana:

xt : Sebuah fungsi t yang dideskripsikan secara dinamik yt : Time series yang diukur

(37)

23

ηt : Suara sistem εt : Pengukuran suara

Setiap suara dimodelkan sebagai distribusi gauss. white noise dengan rata-rata nol dan intensitas (varians) Iη dan Iε, masing-masing fi−1(xt)i = 0, 1, . . . , n − 1) adalah fungsi polinomial xt. Urutan dari orde nol pada xt didefinisikan menjadi xt itu sendiri. f0(xt) didefinisikan sebagai −θo

untuk kenyamanan. Urutan persamaan sistem n diputuskan bersama dengan parameter yang tidak diketahui dari fungsi fi+1(xt). Kondisi awal n diperlukan untuk mendapatkan solusi bentuk tertutup.

Model Mn merupakan persamaan (3.4) dan (3.5) mencakup berbagai pola dinamik tergantung pada urutan sistem n.

3.2 Mengidentifikasi Model dan Parameter

Untuk time series, model nonlinier dan linier stokastik dinamik telah dikembangkan menggunakan pendekatan variasi Bayesian untuk kedua model dan identifikasi parameter. Kedua bentuk dan parameter dari model telah diidentifikasi. Variasi Bayesian memberikan laporan untuk kedua jenis hubungan stokastik: ukuran suara dan suara sistem.

Mulai dari urutan pertama M1(n = 1 pada persamaan. (3.4)), sam- pai model Mndipasang data memenuhi kriteria. Algoritma variasi bayesian dimodifikasi pada data untuk menghitung probabilitas p(yt|M ) (di mana M adalah M1, M2, . . . , Mn) time series yt diberikan model yang berbeda M , sehingga model dengan nilai tertinggi p(yt|M ) bisa dipilih untuk time series tertentu.

Untuk masing-masing calon model, nilai pada probabilitas p(yt|M ), yang juga disebut sebagai bukti Model, telah mendekati iterasi mengop- timalkan state dari sistem dan model parameter sampai nilai maksimum lokal dari p(yt|M ) tercapai. Prosedur ini tertanam ke algoritma variasi

(38)

24

optimasi Bayesian. Secara singkat, untuk menyimpulkan beberapa ele- men dari model hierarkis, yaitu sistem state, parameter (terkait dengan istilah deterministik dalam persamaan), dan hyperparameters (terkait dengan persyaratan stochastic) setiap elemen dioptimalkan satu persatu sementara sisa elemen terus tetap.

Ada dua langkah dalam prosedur optimasi ini. Pertama, dengan asumsi elemen (parameter dan state) adalah keadaan yang bebas satu sama lain, distribusi gabungan dapat difaktorisasi menjadi partisi-partisi bebas dari setiap distribusi elemen, yang dikenal sebagai pendekatan mean-field, yaitu distribusi gabungan dari semua elemen yang telah mendekati hasil pada distribusi elemen (Beal, 2003).

Kedua, distribusi setiap parameter/state didekatkan dengan dua peristiwa pertama (mean dan varians) dikenal sebagai pendekatan Laplace (Beal, 2003). pendekatan Mean-field dan pendekatan Laplace digunakan untuk pembaharuan setiap iterasi pada parameter dan state dengan men- erapkan variasi kalkulus. Logaritma dari p(yt|M ) dikenal sebagai ’energy bebas’ F (θ, yt), istilah yang dipinjam dari fisika statistik (Danuzeau et al., 2009) Energi bebas dimaksimalkan dan antara kriteria lainnya (root mean square error dinormalisasi).

Pendekatan bayes tidak hanya memberikan nilai yang paling mungkin dari parameter tetapi juga menyebabkan ketidakpastian dalam param- eter. Informasi sebelumnya mengenai parameter juga diperhitungkan.

Informasi dalam nilai parameter tidak tersedia, ole karena itu nilai rata- rata dari parameter sebelumnya ditetapkan ke nol. Algoritma yang mungkin untuk mencari daerah yang relatif luas untuk parameter yang optimal, semua varian ditetapkan menjadi 10⁴. Kondisi awal semua di- modelkan sebagai distribusi Gaussian.

3.3 Kriteria Pemilihan Model

(39)

25

Empat kriteria yang diterapkan untuk mengidentifikasi model ter- baik Energi bebas F telah dimaksimalkan dengan menyetel parameter- parameter sistem dengan cara iterasi untuk setiap model. Catatan bah- wa membuat keputusan berdasarkan perbandingan energi bebas dari dua model dengan urutan yang berbeda bisa menjadi masalah karena penalti berat pada model yang kompleks dalam metode Bayesian seperti yang dijelaskan dalam (Beal, 2003).

1. Meningkatkan urutan sistem dengan satu tidak hanya akan me- ningkatkan derajat kebebasan dalam ruang parameter, tetapi ju- ga meningkatkan dimensi dari sistem state. Hal ini menyebabkan penurunan dramatis dalam energi bebas, yang bisa menjadi per- intah (atau beberapa perintah) lebih besar dari perbedaan energi bebas antara model urutan yang sama. Oleh karena itu, kriteria en- ergi bebas hanya digunakan untuk membandingkan model urutan yang sama. Untuk model dengan perintah yang berbeda, 2 kriteria seperti di bawah ini dapatdigunakan.

2. Normalkan Root Mean Squared Error (NRMSE) digunakan untuk membandingkan model dengan perintah yang berbeda untuk seti- ap time series. Parameter disimpulkan θi diterapkan kembali ke persamaan sistem untuk menghasilkan time series tanpa stochastic, yaitu solusi deterministik. Perhatikan bahwa karena parameter- parameter yang tlah diidentifikasi dalam bentuk distribusi normal, yang paling mungkin (rata-rata) nilai parameter yang terpasang ke dalam persamaan sistem. Root Mean Squared Error (RMSE) an- tara pengukuran time series yt dan disimpulkan deterministik time series yt dapat dihitung sebagai berikut:

RM SE =

rPn

t=1(ˆyt− yt)²

n (3.6)

3. Bentuk umum. Karena seluruh tujuan adalah untuk menemukan

(40)

26

model yang mampu menangkap pola umum di semua time series, model yang hanya bisa menjelaskan beberapa time series diabaikan.

4. Stabilitas sistem. Model harus memiliki steady stabil state unik, yang menyatakan bahwa kekurangan respon sistem dengan waktu.

Ini telah diperiksa melalui perhitungan dari bagian real dari yang sesuai nilai eigen yang harus negatif bagi stabilitas.

3.4 Analisis Statistika

Hipotesis nol tidak ada perbedaan antara kelompok kepentingan di- uji pada tingkat signifikansi 5%, dan hasilnya disajikan sebagai p-values.

Analisis statistik dari perbedaan NRMSE antara dua model dilakukan dengan menggunakan one sample t-test, yang menilai normalitas da- ta rata-rata nol dan varian tidak diketahui pada tingkat signifikan 5%.

Hasilnya disajikan sebagai p-values.

(41)

BAB 4

PEMBAHASAN DAN HASIL

Penelitian ini merupakan kajian literatur dari berbagai macam sumber yang telah diperoleh sesuai dengan bahan yang diperlukan

4.1 Pemilihan Model

4.1.1 Perbandingan pada model linear yang berbeda

Model linier dengan sistem yang berbeda. Persamaan (1) di Bagian 3.1.2 berubah menjadi diferensial linear dimana fi−1(xt) adalah tetap, dengan parameter tetap θi(i = 0, 1, . . . , n−1) dimana fn(xt) = θn, . . . , f2(xt) = θ2, f1(xt) = θ1.f0(xt) didefinfikan sebagai −θ0 untuk convenience.

Sebuah model linear dianggap pertama, dan itu tidak menunjukkan kinerja yang baik. Kemudian model linear dengansistem yang lebih ting- gi diselidiki. Pada bagian ini, disajikan hasil dari sistem dan identifikasi parameter dengan membandingkan solusi untuk linear pertama, kedua dan ketiga persamaan dinamik sebagai berikut:

Model 1 (M1) : dxt

dt + θ1− θ0 = 0 (4.1)

Model 2 (M2) : d²xt

dt² + θ1

dxt

dt + θ1x1− θ0 = 0 (4.2) Model 3 (M3) : d³xt

dt³ + θ3

d²xt

d²t + θ2

dxt

dt + θ1x1− θ0 = 0 (4.3) Jika persamaan urutan ketiga belum berhasil, prosedur akan terus dilanjutkan untuk memperhitungkan nonlinier (disajikan dalam Bagian 4.1.2) pertama dan kemudian meningkatkan urutan sistem sampai solusi terbaik ditemukan.

Awalnya tidak hanya pengukuran suara εt (seperti dalam persamaan (4.2)) tetapi juga sistem suara ηt (seperti dalam Persamaan (4.1)) terma-

(42)

28

suk dalam model. Ditemukan bahwa untuk semua time series, model tan- pa sistem suara memiliki energi bebas yang lebih besar dibandingkan de- ngan sajian matematika yang mengandung kedua jenis stochastik. Man- faat Peningkatan - diperoleh dengan menggunakan model yang lebih kompleks dengan sistem suara tidak melebihi pinalti dengan menam- bahkan dua derajat kebebasan dalam ruang parameter. Oleh karena itu, keluarkan sistem suara dari model dan ini tercermin di sisi kanan nol dari pers (4.1) - (4.3).

Data time-series untuk model pada persamaan (4.1 4.3) ditun- jukkan dalam gambar 4.1. Hasil pada model M1M3 dalam gambar a dan c menunjukkan model terbaik dari kandidat model M3. Model M1 gagal mendeskripsikan dinamik kedua time-series sebagai indikasi dari nilai NRMSE dalam tabel 4.1: NRMSE = 0,272 dan NRMSE = 0,090. M2

berhasil mendeskripsikan kedua time-series tetapi gagal menggambarkan osilasi pada hari ke 30 yang terlihat dalam nilai NRMSE pada tabel 4.1 yaitu 0,053 dan 0,096. M3 3 berhasil menunjukkan dengan nilai NRMSE terkecil yaitu 0,014 dan 0,053. Berikut adalah gambar hasil model time series.

(43)

29

Gambar 4.1 Hasil uji model M1, M2, dan M3

(44)

30

Tabel 4.1 Nilai NRMSE untu model M1, M2, dan M3

NRMSE

M₁ M₂ M₃

(a) 0.272 0.053 0.014 (b) 0.083 0.085 0.013 (c) 0.090 0.096 0.053 (d) 0.088 0.071 0.073

4.1.2 Nonlinear banding linear

Nonlinier diperkenalkan ke model urutan kedua dalam bentuk koe- fisien nonlinier polinomial f1(xt) atau f2(xt) dalam persamaan (4.1) meng- gunakan pendekatan. Diakui bahwa penjelasan linear jauh lebih baik dari nonlinear jika ini tidak meningkatkan jumlah parameter yang tidak diketahui secara dramatis. Konsekuensinya, jumlah maksimal parame- ter yang tidak diketahui dalam urutan model nonlinear yang kedua tetap sebanding dengan jumlah parameter dari ketiga urutan persamaan lin- ear. Dalam kondisi ini, dua model nonlinear yang telah dipertimbangkan:

Model N M1 dengan nonlinearitas dengan istilah (f1(xt) = k1(xt)+θ1, f2(xt) = k2(xt) + θ2) dan model N M2 dengan non-linear di (f1(xt) = θ1, f2(xt) = k2xt+ θ2). persamaan sistem yang sesuai adalah sebagai berikut:

N M1 : d²xt

dt² + θ2

dxt

dt + (k1xt+ θ1)xt− θ0 = 0 (4.4) N M1 : d²xt

dt² + (k2xt+ θ2)dxt

dt + θ1xt− θ0 = 0 (4.5) Pada gambar 4.1 bagian c menggunakan model nonlinear N M1 dan N M2 akan ditunjukkan pada gambar 4.2. Pada gambar 4.2 N M1 dan N M2

menunjukkan dinamik time-series . Kriteria NRMSE ditampilkan untuk model differensial. Nilai NRMSE untuk N M1 adalah 0.080 dan untuk N M2 adalah 0.067. lebih besar dari pada untuk M3. Terlihat bahwa N M2

bukan solusi terbaik. Oleh karena itu, model M3 keluar dari N M1 dan N M2 dan dipilih sebagai model akhir.

(45)

31

Gambar 4.2 HHasil mengkompare antara model N M1 dan N M2 serta model linear M3

4.2 Nilai Eigen

Persamaan 4.3 dalam urutan ketiga dapat diubah menjadi model ruang state linear dalam bentuk:

˙ xt

¨ xt

...xt

!

=

0 1 0

0 0 1

−θ1 −θ2 −θ3

! x˙t

¨ xt

...xt

! +

0 0 θ0

!

(4.6)

Solusi dari Persamaan (4.6) didefinisikan oleh nilai eigen λ1, λ2, λ3 dari matriks 3 × 3 eigen vektor yang sesuai dan tiga kondisi awal. Jumlah dari nilai eigen mendefinisikan perbedaan dari vektor field (volume fase V(t)) dalam ruang state:

V(t) = V0e^(λ¹^,λ²^,λ³⁾= V0e^Rt (4.7) dimana R dapat diartikan sebagai tingkat disipasi. Untuk semua seri waktu dalam kelompok, tingkat disipasi kurang dari nol, yang berarti bahwa volume fase menyusut.

(46)

BAB 5

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Dalam suatu himpunan data yang unik pada time series yang terse- dia, sebuah model matematika dalam bentuk persamaan diferensial telah dibangun untuk meggambarkan bentuk dinamik. Ketiga urutan model linear terpilih sebagai keberhasilan yang digambarkan secara umum pada bentuk dinamik. Model ini terbukti bermanfaat dalam pengelompokan antara dua hal berbeda.

Optimasi data-driven yang memasukkan data historis langsung ke model pemrograman matematika, misalnya melalui pedoman eksplisit untuk membangun ketidakpastian.

5.2 Saran

Dalam pengambilan keputusan dengan adanya ketidakpastian, sebaiknya kita harus mampu mengklasifikasikan data yang diperoleh agar terban- gun model yang sesuai sehingga tidak menimbulkan resiko yang terlalu besar. Data yang diperoleh juga harus sesuai dengan tujuan yang in- gin dicapai oleh pembuat kebutuhan, sehingga dalam pembuatan model tidak terjadi error yang besar.

32

(47)

DAFTAR PUSTAKA

Ackoff, R. C., dan Emery, F. E. (1972). On purposeful system. Aldine- Atherton. Chicago

Beal, M J. (2003). Varitional Algorithms for Approximate Bayesian in- ference (Ph.D. Thesis), The Gatsby Computational Neuroscience Unit. University College London

Bertsimas, D., dan Thiele, A. (2006) A Robust Optimization Approach to Inventory Theory. Operation Research. 54(1):150-168

Bertsimas, D., dan Thiele, A. (2006). Robust and data-driven optimiza- tion: modern decision making under uncertainty. Cambridge Bertsimas., dan Sim, M. (2004). The Price of Robustness. Operation

Research. 52(1):35-53

Bunn, W, D. (1984). Applied decision analysis. USA

Daunizeau, J., Friston, K J., dan Kiebel, S J. (2009). Variasional bayesian identification and prediction of stochastic nonlinear dynamic causal models. Phys. D: Nonlinear Phenomena. 238(21):2089-2118

Elshemy, M., dan Khadr, M. (2017). Data-driven modeling for water quality prediction case study: the drains system associated with manzala lake, egypt. Engineering Journal. 8(4):549-557

Femandes, B., Street, A., Valladao, D., dan Fernandes, C. (2016). An adaptive robust portofolio optimization model with loss constraints based on data-driven polihedral uncertainty sets. Operation Re- search. 255(3):961-970

Huang, B., dan Kadali, R. (2008). Dynamic modeling, predictive con- trol and performance monitoring: data-driven modeling subspace approach. London

Meng, C., Nageshwaraniyer, S S., Maghsoudi, A., Son, Y J., dan Dessureault, S. (2013). Data-driven modeling and simulation frame- work for material handling systems in coal mines. Computer and Industrial Engineering. 64(3): 766-779

Mohanty, S., Jagadeesh, M., dan Srivatsa, H. (2013). Big data impera- tives. India

Simon, H A. (1957). Models of man. New York

Solomatine, D P., dan Ostfeld, A. (2008). A Data-driven Modelling:

Some Past Experience and New Approaches. Journal of Hydroin- formatics. 10(1):3-22

Supranto. (2009). Teknik Pengambilan Keputusan. Rineka Cipta. Jakar- ta

Three rivers district council. (2008). Data Quality Strategi. Inggris

(48)

34

R., dan Khovanova, N. (2017). A new data-driven model for post- trasplant antibody dynamics in high risk kidney transplantation.

Mathematical Biosciences. 284:3-11