• Tidak ada hasil yang ditemukan

Application of Discrete Hidden Markov Model to Credit Card Fraud Detection

N/A
N/A
Protected

Academic year: 2017

Membagikan "Application of Discrete Hidden Markov Model to Credit Card Fraud Detection"

Copied!
56
0
0

Teks penuh

(1)

APLIKASI MODEL HIDDEN MARKOV DISKRET UNTUK

MENDETEKSI PENYALAHGUNAAN KARTU KREDIT

PUTRI UTARI

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

ABSTRAK

PUTRI UTARI. Aplikasi Model Hidden Markov Diskret untuk Mendeteksi Penyalahgunaan Kartu Kredit. Dibimbing oleh BERLIAN SETIAWATY dan NGAKAN KOMANG KUTHA ARDANA.

Saat ini penggunaan kartu kredit sudah semakin meningkat. Hal tersebut menyebabkan penyalahgunaan terhadap kartu kredit juga meningkat. Jika rincian transaksi kartu kredit merupakan proses observasi dan penyebab besarnya transaksi tidak diamati secara langsung dan diasumsikan membentuk suatu rantai Markov, maka pasangan dari proses observasi dan penyebabnya dapat dimodelkan dengan model Hidden Markov.

Model Hidden Markov dicirikan oleh parameter-parameternya yaitu matriks peluang state transisi, matriks peluang dari proses observasi, dan vektor peluang state awal. Penduga parameter dalam karya ilmiah ini diestimasi dengan menggunakan algoritme Rabiner yang meliputi algoritme forward-backward, algoritme Viterbi, dan algoritme Baum-Welch.

Model Hidden Markov diskret diaplikasikan pada data transaksi suatu kartu kredit untuk mendeteksi penyalahgunaan terhadap kartu kredit. Proses deteksi kartu kredit dilakukan dengan menghitung peluang observasi untuk setiap transaksi baru. Jika perbandingan selisih dari peluang observasi transaksi baru dengan transaksi sebelumnya lebih besar atau sama dengan nilai ambang batas maka transaksi baru tersebut terdeteksi sebagai penyalahgunaan.

Untuk mempermudah mencari penduga parameter model Hidden Markov diskret, dibuat suatu program komputasi dengan menggunakan Mathematica 7.0. Dari hasil yang diperoleh, model Hidden Markov diskret dapat memodelkan transaksi kartu kredit dengan cukup baik. Akurasi yang diperoleh dari hasil deteksi mencapai 77%.

(3)

ABSTRACT

PUTRI UTARI. Application of Discrete Hidden Markov Model to Credit Card Fraud Detection. Supervised by BERLIAN SETIAWATY and NGAKAN KOMANG KUTHA ARDANA.

Today the use of credit cards has increased which causes the increase of credit card fraud. If credit card transactions are observation process and the cause of magnitude transaction is assumed to form a Markov chain, then credit card transactions can be modeled by the Hidden Markov model.

The Hidden Markov model is characterized by its parameters which are state transition probability matrix, observation symbol probability matrix, and initial state probability vector. Parameters of model are estimated using Rabiner algorithm that consists of forward-backward algorithm, Viterbi algorithm, and Baum-Welch algorithm.

The discrete Hidden Markov model is applied to data transactions of a credit card to detect the fraud of credit card. Detection process of credit card is done by counting probability of observation for each new transaction. If the ratio of difference of the new transaction observation probability with previous transaction is greater than or equal to the threshold value then the new transaction is detected as fraud.

The estimation of parameters are implemented on computational program by using Mathematica version 7.0. From the results obtained, it can be shown that discrete Hidden Markov model can model credit card transactions quite well. The accuracy of detection is 77%.

(4)

APLIKASI MODEL HIDDEN MARKOV DISKRET UNTUK

MENDETEKSI PENYALAHGUNAAN KARTU KREDIT

PUTRI UTARI

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar

Sarjana Sains pada

Departemen Matematika

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(5)

Judul Skripsi : Aplikasi Model Hidden Markov Diskret untuk Mendeteksi Penyalahgunaan Kartu Kredit

Nama : Putri Utari

NIM : G54080058

Menyetujui Pembimbing I

Dr. Berlian Setiawaty, MS. NIP. 19650505 198903 2 004

Pembimbing II

Ir. Ngakan Komang Kutha Ardana, M.Sc. NIP. 19640823 198903 1 001

Tanggal Lulus : ... Mengetahui

Ketua Departemen Matematika

(6)

PRAKATA

Puji syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Penyusunan karya ilmiah ini tidak terlepas dari dukungan dan bantuan dari berbagai pihak. Pada kesempatan kali ini, penulis juga ingin mengucapkan terima kasih yang sebesar-besarnya kepada:

1. Bapak dan Ibu tersayang, terima kasih atas kasih sayang, didikan, nasihat, semangat serta doa yang tiada henti-hentinya buat penulis.

2. Dr. Berlian Setiawaty, MS. selaku dosen pembimbing I dan Ir. N. K. Kutha Ardhana, M.Sc. selaku pembimbing II. Terima kasih atas waktu, ilmu yang diberikan dan kesabarannya dalam membimbing penulis.

3. Dr. Ir. I Wayan Mangku, M.Sc. selaku dosen penguji. Terima kasih atas waktu dan ilmu yang sangat bermanfaat bagi penulis.

4. Kakakku tersayang (Wisnu Mahadi), nenekku tersayang, terima kasih atas doa, semangat dan dukungan yang diberikan kepada penulis.

5. Semua dosen Departemen Matematika, terima kasih atas ilmu yang diberikan.

6. Seluruh staf pegawai Departemen Matematika, terima kasih atas bantuannya dalam memperlancar administrasi akademik bagi penulis.

7. Tante Ria, Om Iman, Tante Nita, Om Son, Tante Wiwik, dan Tante Euis. Terima kasih atas doa, semangat dan dukungan yang diberikan kepada penulis.

8. Sepupu-sepupuku tersayang: Mas Heru, Mba Lita, Rahma, Hana, Raja, Dimas, Dinda, Dara, Fahrezi, Fahira. Terima kasih atas doa, semangat, dan dukungan yang diberikan kepada penulis.

9. Guru-guru SMAN 2 Tangerang, SMPN 5 Tangerang, SDN 3 Poris Gaga, dan TK Islam Al-Fathir. Berkat jasa-jasa kalian penulis bisa seperti ini.

10. Teman-teman Matematika angkatan 45: Fitriyah, Nurul, Fuka, Maya, Dewi, Ana, Yunda, Tia, Mega, Fina, Haryanto, Hendri, Izzudin, Wulan, Vivi, Isna, Fenny, Hardono, Tiwi, Fikri, Ade, dan lainnya. Terima kasih atas doa, semangat, dan dukungan yang diberikan kepada penulis. 11. Kakak-kakak Matematika angkatan 44.

12. Adik-adik Matematika angkatan 46.

13. Kakak-kakak kost Pondok Sabrina: Mba Ummu, Mba Khusnul, Mba Noja, Mba Chemmy, Mba Devi, Mba Anif. Terima kasih atas doa dan semangat yang diberikan kepada penulis. Penulis menyadari tulisan ini masih memiliki kekurangan dan jauh dari kesempurnaan. Oleh karena itu dibutuhkan kritik dan saran yang membangun dari pembaca.

Semoga karya ilmiah ini bermanfaat bagi kita semua, bagi dunia ilmu pengetahuan khususnya Matematika.

Bogor, Desember 2012

(7)

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta pada tanggal 9 November 1990 sebagai anak kedua dari dua bersaudara, anak dari Murjono dan Yuliastuti.

Pada tahun 1996 penulis menyelesaikan pendidikan di TK Islam Al Fathir Tangerang. Pada tahun 2002 penulis menyelesaikan pendidikan di SD Negeri Poris Gaga 3 Tangerang. Kemudian penulis melanjutkan pendidikan di SMP Negeri 5 Tangerang pada tahun yang sama. Pada tahun 2008 penulis menyelesaikan pendidikan di SMA Negeri 2 Tangerang. Pada tahun 2008 penulis diterima di Institut Pertanian Bogor (IPB) melalui jalur Ujian Seleksi Masuk IPB (USMI) departemen Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam.

(8)

DAFTAR ISI

Halaman

DAFTAR GAMBAR ... viii

DAFTAR TABEL ... viii

DAFTAR LAMPIRAN ... viii

I. PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Tujuan ... 1

1.3 Sistematika Penulisan ... 1

II. LANDASAN TEORI ... 2

2.1 Pengantar Teori Peluang ... 2

2.2 Rantai Markov ... 3

2.3 Algoritme Expectation Maximization (EM) ... 4

III. MODEL HIDDEN MARKOV DISKRET ... 5

3.1 Algoritme Rabiner ... 5

3.1.1 Algoritme Forward-Backward ... 5

3.1.2Algoritme Viterbi ... 6

3.1.3 Algoritme Baum-Welch ... 6

3.2 Algoritme K-Means Clustering ... 7

IV. APLIKASI DETEKSI PENYALAHGUNAAN KARTU KREDIT ... 8

4.1 Data Input Transaksi Kartu Kredit ... 8

4.2 Pemodelan Transaksi Kartu Kredit ... 8

4.3 Proses Deteksi Kartu Kredit ... 9

4.4 Hasil Komputasi ... 10

4.4.1 Hasil Ketepatan Dugaan Barisan Observasi ... 10

4.4.2 Hasil Deteksi ... 10

V. SIMPULAN DAN SARAN ... 12

5.1 Simpulan ... 12

5.2 Saran ... 12

(9)

viii DAFTAR GAMBAR

Halaman

1 Grafik persentase untuk setiap profil pengeluaran ... 8

2 Proses deteksi penyalahgunaan kartu kredit ... 9

3 Grafik persentase ketepatan dugaan barisan observasi ... 10

4 Grafik nilai True Positive dan False Positive untuk dan ... 11

DAFTAR TABEL Halaman 1 Tabel persentase ketepatan dugaan barisan observasi ... 10

2 Tabel akurasi deteksi untuk dan ... 11

DAFTAR LAMPIRAN Halaman 1 Data transaksi kartu kredit ... 15

2 Hasil deteksi penyalahgunaan kartu kredit untuk dan ... 18

3 Program untuk mencari parameter dengan menggunakan Mathematica 7.0 ... 20

4 Output nilai parameter awal dan parameter duga ... 30

(10)

I. PENDAHULUAN

1.1 Latar Belakang

Dalam kehidupan sehari-hari terdapat banyak kejadian yang dapat dimodelkan dengan suatu proses stokastik. Setiap kejadian itu terkait erat dengan penyebab kejadiannya. Jika penyebab kejadian tersebut tidak diamati secara langsung dan membentuk rantai Markov, maka pasangan kejadian dan penyebabnya dapat dimodelkan dengan model Hidden Markov. (Hidden Markov Model, HMM)

Karakteristik dari model Hidden Markov dicirikan oleh parameter-parameternya yaitu sebaran state awal, matriks transisi dari rantai Markov, dan sebaran peluang dari proses observasi. Parameter-parameter tersebut dapat diduga dengan menggunakan algoritme Rabiner (Rabiner 1989) yang meliputi algoritme forward-backward, algoritme Viterbi, dan algoritme Baum-Welch.

Model Hidden Markov juga dapat memodelkan beberapa aplikasi dengan baik. Contohnya pada Kajian Model Hidden Markov Diskret dengan Algoritme Rabiner dan Aplikasinya pada DNA (Wijayanti 2010). Dalam karya ilmiah ini akan dibahas aplikasi model Hidden Markov untuk mendeteksi penyalahgunaan kartu kredit yang diambil dari jurnal berjudul Credit Card Fraud Detection Using Hidden Markov Model (Srivastava et al. 2008).

Kemajuan teknologi saat ini telah jauh meningkat. Hal tersebut dapat dilihat dari meningkatnya penggunaan kartu kredit secara dramatis. Saat ini kartu kredit telah banyak digunakan oleh masyarakat dalam proses pembayaran untuk suatu pembelian baik secara online maupun tidak online.

Dengan meningkatnya penggunaan kartu kredit di seluruh dunia, maka ada peluang bagi seseorang untuk melakukan penyalahgunaan kartu kredit. Hal tersebut menyebabkan penyalahgunaan terhadap kartu kredit juga meningkat. Jika rincian transaksi kartu kredit merupakan proses observasi dan penyebab besarnya transaksi kartu kredit tersebut diasumsikan membentuk rantai Markov, maka pasangan dari proses observasi dan penyebabnya dapat dimodelkan dengan model Hidden Markov. Oleh karena itu, model Hidden Markov dapat digunakan untuk mendeteksi penyalahgunaan terhadap kartu kredit.

Dengan menggunakan data rincian transaksi suatu kartu kredit, maka dapat

diduga parameter modelnya. Algoritme K-Means clustering digunakan untuk menentukan kelompok (cluster) dari data transaksi kartu kredit. Selanjutnya, dengan algoritme forward-backward akan ditentukan nilai peluang munculnya proses observasi. Kemudian dengan algoritme Viterbi akan dipilih hidden state yang memaksimumkan peluang bersama (joint probability) dari hidden state dan proses observasi. Akhirnya dengan algoritme Baum-Welch akan diperoleh nilai dugaan parameter model hidden Markov sedemikian sehingga dapat dengan baik mendeskripsikan rangkaian proses observasi yang terjadi (Wijayanti 2010). Kemudian dilanjutkan dengan proses deteksi penyalahgunaan kartu kredit dengan menghitung peluang observasi untuk setiap transaksi baru. Jika perbandingan selisih peluang observasi transaksi baru dengan peluang observasi transaksi sebelumnya lebih besar atau sama dengan nilai ambang batas, maka transaksi baru tersebut terdeteksi sebagai transaksi penyalahgunaan.

Dalam perkembangan lebih lanjut, dibuat suatu program komputasi untuk menyelesaikan masalah model Hidden Markov. Software yang digunakan adalah Mathematica 7.0. Dalam karya ilmiah ini, program tersebut digunakan untuk membantu dalam penyelesaian masalah deteksi penyalahgunaan kartu kredit.

1.2 Tujuan

Tujuan karya ilmiah ini adalah:

1. Mempelajari model Hidden Markov diskret dan pendugaan parameternya. 2. Mengimplementasikan model Hidden

Markov diskret untuk mendeteksi penyalahgunaan terhadap kartu kredit. 1.3 Sistematika Penulisan

(11)

II. LANDASAN TEORI

Dalam bab ini dijelaskan beberapa definisi serta teorema yang digunakan dalam pembahasan selanjutnya.

2.1 Pengantar Teori Peluang Definisi 2.1.1 (Percobaan Acak)

Dalam suatu percobaan seringkali dilakukan pengulangan yang biasanya dilakukan dalam kondisi yang sama. Semua kemungkinan hasil yang akan muncul dapat diketahui, namun hasil pada percobaan berikutnya tidak dapat diketahui dengan tepat. Percobaan semacam ini, yang dapat diulang dalam kondisi yang sama, disebut percobaan acak.

(Ross 1996) Definisi 2.1.2 (Ruang Contoh dan Kejadian)

Himpunan dari semua kemungkinan hasil dari suatu percobaan acak disebut ruang contoh, di notasikan dengan Suatu kejadian A adalah himpunan bagian dari

(Ghahramani 2005) Definisi 2.1.3 ( Medan- )

adalah suatu himpunan yang anggotanya terdiri atas himpunan bagian dari

yang memenuhi kondisi berikut:

1. , contoh . Ukuran peluang adalah suatu fungsi

yang memenuhi:

1.

2. Jika adalah himpunan yang saling lepas yaitu untuk setiap pasangan maka

Pasangan disebut ruang peluang. (Ghahramani 2005) Definisi 2.1.5 (Kejadian Saling Bebas) Kejadian dan dikatakan saling bebas jika

Secara umum, himpunan kejadian dikatakan saling bebas jika

untuk setiap himpunan bagian berhingga dari .

(Grimmet dan Stirzaker 2001)

Definisi 2.1.6 (Peluang Bersyarat)

Misalkan adalah ruang peluang dan Definisi 2.1.7 (Peubah Acak Diskret) Misalkan adalah ruang contoh, adalah

dari dan adalah himpunan berhingga. Suatu fungsi disebut peubah acak diskret jika memenuhi sifat

berlaku .

(Ghahramani 2005) Definisi 2.1.8 (Fungsi Kerapatan Peluang) Misalkan adalah ruang peluang dan

adalah himpunan berhingga. Fungsi kerapatan peluang dari peubah acak diskret adalah fungsi didefinisikan

oleh .

(Grimmet dan Stirzaker 2001) Definisi 2.1.9 (Fungsi Kerapatan Peluang Bersama Dua Peubah Acak Diskret) Misalkan adalah ruang peluang dan

adalah himpunan berhingga. Fungsi kerapatan peluang dari peubah acak diskret

dan adalah fungsi didefinisikan oleh

(Grimmet dan Stirzaker 2001) Definisi 2.1.10 (Fungsi Kerapatan Peluang Bersyarat)

Jika dan merupakan peubah acak diskret, maka fungsi kerapatan peluang bersyarat dari jika diberikan terdefinisi untuk setiap sedemikian sehingga 0

adalah .

(12)

Definisi 2.1.11 (Fungsi Kerapatan Marginal)

Misalkan adalah fungsi kerapatan peluang bersama dari peubah acak diskret dan Misalkan adalah himpunan nilai yang mungkin dari , dan adalah himpunan nilai yang mungkin dari . Selanjutnya fungsi

dan

masing-masing disebut fungsi kerapatan marginal dari dan .

(Ghahramani 2005) Definisi 2.1.12 (Bebas Stokastik Identik) Misalkan adalah peubah acak yang memiliki fungsi kepekatan yang sama yaitu sehingga

dan fungsi kepekatan bersamanya adalah

Peubah acak disebut bebas stokastik identik.

(Hogg et al. 2005) Definisi 2.1.13 (Nilai Harapan Peubah Acak Diskret)

Jika adalah peubah acak diskret dengan fungsi kerapatan peluang

maka nilai harapan dari adalah

(Ghahramani 2005) 2.2 Rantai Markov

Definisi 2.2.1 (Ruang State)

Misalkan adalah himpunan nilai dari barisan peubah acak, maka disebut ruangstate.

(Grimmet dan Stirzaker 2001) Definisi 2.2.2 (Proses Stokastik)

Proses Stokastik yang terdefinisi pada ruang peluang adalah suatu

untuk semua kemungkinan nilai dari (Grimmet dan Stirzaker 2001) Definisi 2.2.4 (Matriks Transisi)

Misalkan adalah rantai Markov dengan ruang state yang berukuran Matriks transisi berukuran adalah matriks dari peluang transisi

untuk

(Grimmet dan Stirzaker 2001) Definisi 2.2.5 (Rantai Markov Homogen) Rantai Markov dengan ruang state disebut homogen jika

(Grimmet dan Stirzaker 2001) Definisi 2.2.6 (Peluang Transisi

) disebut terakses (accessible) dari

ditulis jika ada minimal sebuah bilangan

(Ross 1996) Definisi 2.2.8 (Berkomunikasi)

Dua state dari rantai Markov

disebut berkomunikasi (communicate), ditulis , jika state dapat diakses dari state dan state dapat diakses dari .

(Ross 1996) Definisi 2.2.9 (Kelas State)

(13)

Definisi 2.2.10 (Tak Tereduksi)

Suatu rantai Markov disebut tak tereduksi (irreducible) jika hanya terdapat satu kelas state, yaitu jika semua state-nya berkomunikasi satu dengan yang lainnya.

(Ross 1996) Definisi 2.2.11 (Berulang)

State dari suatu rantai Markov disebut berulang (recurrent) jika

(Ross 1996) Definisi 2.2.12 (Periode, Periodik, dan Aperiodik) positive recurrent disebut null recurrent.

(Ross 1996) Definisi 2.2.14 (Ergodic)

Rantai Markov yang positive recurrent dan aperiodik disebut ergodic.

(Ross 1996) Definisi 2.2.15 (Nilai Harapan Rantai Markov Homogen)

Misalkan adalah rantai Markov yang ergodic dengan ruang state berukuran dan misalkan merupakan matriks peluang transisi dan

maka nilai harapan dari dinotasikan dengan memenuhi

dan

(Ross 1996)

Definisi 2.2.16 (Himpunan Konveks dan Fungsi Konveks)

Misalkan adalah himpunan vektor. disebut sebagai himpunan konveks jika untuk semua terdapat sehingga Misalkan merupakan fungsi dengan peubah

yang terdefinisi pada himpunan konveks .

Definisi 2.3.1 (Fungsi Likelihood)

Misalkan adalah himpunan ukuran peluang yang terdefinisi pada dan kontinu absolut terhadap . Misalkan

. Fungsi Likelihood yang digunakan untuk menghitung penduga parameter berdasarkan informasi adalah

(Elliott et al. 1995) Definisi 2.3.2 (Penduga Maksimum

Likelihood)

Penduga Maksimum Likelihood (MLE) didefinisikan oleh

(Elliott et al. 1995) Definisi 2.3.3 (Algoritme EM)

Umumnya MLE sulit dihitung secara langsung, oleh karena itu diperlukan suatu metode pendugaan berulang, yakni algoritme Expectation Maximization (EM). Langkah-langkah dalam metode tersebut adalah: 1. Set nilai awal parameter dengan .

Menurut Teorema Ketaksamaan Jensen, barisan yang dibangkitkan

memberikan nilai fungsi likelihood yang tak turun yaitu:

Bentuk disebut pseudo-log-likelihood bersyarat.

(14)

III. MODEL HIDDEN MARKOV DISKRET

Pada bab ini dibahas model Hidden Markov beserta karakteristiknya. Model ini terdiri atas pasangan merupakan penyebab kejadian yang tidak diamati secara langsung dan merupakan rantai Markov. Sedangkan adalah proses observasinya

Karakteristik model Hidden Markov dapat dicirikan sebagai berikut:

1) adalah jumlah state rantai Markov yang tersembunyi dalam model. Ruang state yang ditunjukkan yaitu . 2) adalah jumlah simbol observasi yang

berbeda. Ruang state yang ditunjukkan

yaitu .

3) Matriks peluang state transisi , dimana

4) Matriks peluang dari proses observasi , dimana

5) Vektor peluang state awal dimana

3.1 Algoritme Rabiner

Algoritme Rabiner terdiri atas algoritme forward-backward, algoritme Viterbi, dan algoritme Baum-Welch (Rabiner 1989). 3.1.1 Algoritme Forward-Backward

Dari ciri-ciri di atas, diperoleh karakteristik model Hidden Markov berupa parameter . Barisan observasi dapat diperoleh dari banyaknya barisan state yang mungkin terjadi. Salah satu barisannya seperti dimana adalah state awal. Peluang observasi yang dihasilkan dari state ini yaitu:

(1)

Bukti :

dan dapat diperluas menjadi,

(2) Bukti :

.

Peluang dari barisan state yaitu:

(3) Bukti :

(15)

(4)

Maka dengan demikian, peluang dari barisan observasi model Hidden Markov ditentukan oleh yang dapat ditulis sebagai berikut:

(5) Bukti :

Algoritme forward-backward digunakan untuk menentukan peluang munculnya barisan observasi untuk suatu

tertentu, yaitu

Pada algoritme ini didefinisikan peubah forward, yaitu peluang bersama observasi dan berada pada state di waktu , jika diberikan model yaitu:

(6) Prosedur algoritme forward adalah sebagai berikut:

1. Diberikan nilai awal untuk

(7)

2. Dengan cara induksi akan diperoleh

(8)

3. Sehingga diperoleh

(9) Pada algoritme ini juga didefinisikan peubah backward,

(10) yaitu peluang barisan observasi parsial dan berada pada state di waktu jika diberikan model Prosedur algoritme backward adalah sebagai berikut: 1. Diberikan nilai awal untuk

(11) 2. Dengan cara induksi akan diperoleh

(12)

(Bukti lihat Wijayanti 2010) 3.1.2 Algoritme Viterbi

(16)

Didefinisikan sebagai berikut:

(13)

Barisan yang menghasilkan ditunjukkan oleh

(14) Prosedur algoritme Viterbi adalah sebagai berikut:

1. Diberikan nilai awal untuk

(15)

. (16)

2. Dengan cara rekursif akan diperoleh

(17) untuk

3. Sehingga diperoleh

(18) Kemudian dilakukan penelusuran balik barisan state optimal.

Untuk

(19) (Bukti lihat Wijayanti 2010)

3.1.3 Algoritme Baum-Welch

Algoritme Baum-Welch digunakan untuk menentukan parameter dugaan model Hidden Markov. Pada masalah ini akan dimaksimumkan nilai peluang observasi untuk memperoleh nilai parameter model Hidden Markov yang dapat dengan baik mendeskripsikan rangkaian observasi yang

terjadi. Prosedur algoritme Baum-Welch adalah sebagai berikut.

Didefinisikan yaitu peluang state pada waktu r, dan state j pada waktu , jika diberikan model dan rangkaian pengamatan.

Didefinisikan yaitu peluang berada di state i pada waktu r, jika diberikan rangkaian pengamatan

1,…, dan model .

Dengan algoritme Expectation Maximization (EM) akan diperoleh yang memaksimumkan nilai peluang observasi Langkah-langkah algoritme EM sebagai berikut:

1. Diketahui sebuah penduga 2. Hitung nilai fungsi Baum-Welch 3. Tentukan

4. Jika kriteria penghentian dipenuhi, maka keluar. Jika tidak terpenuhi, maka , dan ulangi terus langkah 2.

Dengan menggunakan metode Lagrange, dapat diperoleh formula re-estimasi parameter model Hidden Markov, yaitu: digunakan untuk menentukan kelompok (cluster). Pengelompokan dilakukan dengan

(17)

IV. APLIKASI DETEKSI PENYALAHGUNAAN KARTU KREDIT

Pada bab ini dibahas aplikasi deteksi penyalahgunaan kartu kredit. Berikut ini terlebih dahulu dijelaskan mengenai data input yang digunakan sebagai data observasi pada model.

4.1 Data Input Transaksi Kartu Kredit Dalam karya ilmiah ini, data yang digunakan merupakan data transaksi kartu kredit seseorang dari tanggal 17 Agustus 2011 sampai dengan 17 Februari 2012. Ada sebanyak 185 data observasi yang digunakan dalam kasus deteksi penyalahgunaan kartu kredit. Data tersebut dibagi menjadi 2 yaitu data untuk pelatihan sebanyak 150 data yang merupakan data transaksi asli dan data untuk pendeteksian sebanyak 35 data yang merupakan data campuran dari data transaksi asli dan data transaksi penyalahgunaan.

Penyalahgunaan terhadap kartu kredit ada dua jenis, yaitu penyalahgunaan legal dan penyalahgunaan ilegal. Penyalahgunaan legal adalah penggunaan kartu kredit yang dilakukan oleh orang terdekat atau yang sudah dikenal oleh pemegang kartu kredit atas izin pemegang kartu kredit. Sedangkan penyalahgunaan ilegal adalah penggunaan kartu kredit yang dilakukan oleh orang yang tidak dikenal oleh pemegang kartu kredit tanpa izin dari pemegang kartu kredit. Dalam karya ilmiah ini, data penyalahgunaan yang digunakan merupakan data penyalahgunaan legal karena kartu kredit telah digunakan oleh salah satu keluarga dari pemegang kartu kredit.

Data tersebut kemudian dikelompokkan menjadi 3 kelompok profil pengeluaran dengan menggunakan algoritme K-Means clustering, yaitu

dan tinggi

Dalam komputasi, data input diubah menjadi rendah = 1, sedang = 2, dan tinggi = 3. Data input dapat dilihat pada Lampiran 1. Persentase jumlah data transaksi untuk setiap profil pengeluaran pemegang kartu dapat dilihat pada Gambar 1.

Gambar 1 Grafik persentase untuk setiap profil pengeluaran.

4.2 Pemodelan Transaksi Kartu Kredit Saat ini kemajuan teknologi sudah jauh meningkat. Hal tersebut dapat terlihat dari penggunaan kartu kredit yang juga meningkat. Dengan meningkatnya penggunaan kartu kredit, maka peluang bagi seseorang untuk melakukan penyalahgunaan kartu kredit juga semakin tinggi. Besar pengeluaran kartu kredit seseorang terjadi karena beberapa penyebab antara lain adanya discount pada suatu pusat perbelanjaan sehingga pemegang kartu kredit ingin banyak berbelanja sehingga menyebabkan pegeluarannya menjadi tinggi. Selain itu suasana hati pemegang kartu kredit juga dapat menyebabkan keinginan untuk banyak berbelanja sehingga pengeluarannya pun menjadi tinggi. Jenis barang pembelian juga bisa menjadi penyebab dari besarnya pengeluaran kartu kredit, misalnya apabila pemegang kartu kredit ingin membelanjakan barang-barang seperti elektronik atau perhiasan, maka pengeluaran kartu kredit akan tinggi juga.

Penyebab kejadian besarnya pengeluaran kartu kredit seseorang diasumsikan bersifat Markov. Artinya meskipun di waktu yang lalu pernah terjadi banyak kejadian yang mempengaruhi besarnya pengeluaran kartu kredit seseorang tetapi penyebab pengeluaran kartu kredit seseorang saat ini cukup dipengaruhi oleh penyebab kejadian saat itu saja.

(18)

penyebab terjadinya besar pengeluaran transaksi kartu kredit.

4.3 Proses Deteksi Kartu Kredit

Proses pertama merupakan proses pelatihan untuk membangun model Hidden Markov. Kemudian proses selanjutnya merupakan proses pendeteksian transaksi kartu kredit. Setelah mendapatkan parameter model Hidden Markov, kemudian dilanjutkan dengan proses deteksi penyalahgunaan kartu kredit dengan menghitung peluang dari observasi. Misal barisan observasi sampai waktu maka peluang observasi menjadi

Misal merupakan observasi baru dari transaksi yang baru pada waktu , maka peluang observasi menjadi

Kemudian didefinisikan .

Jika berarti barisan baru yang diterima oleh model Hidden Markov mempunyai peluang yang rendah, maka itu bisa menjadi suatu penyalahgunaan. Transaksi baru yang ditambahkan diperkirakan sebagai penyalahgunaan jika persentase peluangnya di atas nilai ambang batas, yaitu

Nilai ambang batas adalah nilai batas deteksi transaksi yang berbahaya (penyalahgunaan) yang dipertimbangkan secara empiris (Srivastava et al. 2008). Jika berbahaya, maka tidak ditambahkan dalam barisan observasi. Jika sebaliknya, maka akan ditambahkan dalam barisan secara permanen. Kemudian barisan baru akan digunakan sebagai barisan dasar untuk menentukan validitas transaksi berikutnya. Proses deteksi penyalahgunaan kartu kredit dapat dilihat pada Gambar 2.

Proses Pelatihan Proses Deteksi Transaksi

Gambar 2 Proses deteksi penyalahgunaan kartu kredit. Data Transaksi Buat cluster

(19)

4.4 Hasil Komputasi

4.4.1 Hasil Ketepatan Dugaan Barisan Observasi

Berikut adalah hasil persentase ketepatan dugaan yang lebih besar dari 60% dengan menggunakan software Mathematica 7.0. Tabel 1 Persentase ketepatan dugaan barisan observasi

Frekuensi Rendah Sedang Tinggi Barisan

Observasi

Gambar 3 Grafik ketepatan dugaan barisan observasi. Tabel persentase ketepatan di atas

menunjukkan bahwa persentase ketepatan dugaan barisan observasi mencapai lebih dari 80%. Dari tabel tersebut dapat dilihat untuk persentase ketepatan barisan observasi mencapai 98.00%. Ini merupakan ketepatan dugaan yang terbaik untuk hasil yang diperoleh. Parameter-parameter model Hidden Markov dapat dilihat pada lampiran.

4.4.2 Hasil Deteksi

Setelah mendapatkan tiga parameter model Hidden Markov dengan nilai yang berbeda-beda dan ketepatan dugaan barisan observasi yang mencapai lebih dari 80%, maka selanjutnya akan dilakukan proses deteksi dengan mencari peluang observasi

untuk setiap transaksi baru yang merupakan transaksi campuran antara transaksi asli dan transaksi yang disalahgunakan oleh orang lain.

(20)

menggunakan standar metrik True Positive (TP), False Positive (FP) dan metrik akurasi untuk mengukur keefektipan sistem.

True Positive (TP) merepresentasikan sebagian data transaksi penyalahgunaan yang benar-benar terdeteksi sebagai penyalahgunaan. Sedangkan False Positive

(FP) merepresentasikan sebagian data transaksi asli diduga sebagai transaksi penyalahgunaan. Akurasi merepresentasikan sebagian total banyaknya transaksi (transaksi asli dan transaksi penyalahgunaan) yang terdeteksi dengan benar.

Hasil deteksi dapat dilihat pada grafik berikut:

Gambar 4 Grafik Nilai True Positive dan False Positive untuk dan . Dari hasil deteksi di atas dapat dilihat

untuk dan dengan nilai ambang batas dari 10% sampai dengan 90%, nilai TP (True Positive) mencapai 33% yang artinya peluang data transaksi penyalahgunaan yang benar-benar terdeteksi sebagai penyalahgunaan sebesar 33%.

(21)

V. SIMPULAN DAN SARAN

5.1 Simpulan

Dari pembahasan dapat ditarik simpulan: 1. Transaksi kartu kredit dapat dikaji dengan

menggunakan model Hidden Markov diskret.

2. Dari data transaksi kartu kredit yang tersedia dapat dimodelkan dengan model Hidden Markov diskret dengan cukup baik. Hal ini dapat ditunjukkan dengan persentase ketepatan dari dugaan barisan observasi yang lebih dari 80%.

3. Hasil deteksi penyalahgunaan kartu kredit yang diperoleh untuk dan dengan nilai ambang batas dari 10% sampai dengan 90% yaitu nilai TP (True Positive) mencapai 33% dan akurasi mencapai 77%.

5.2 Saran

1. Hasil dalam karya ilmiah ini masih belum sempurna karena data yang digunakan data yang digunakan merupakan data penyalahgunaan legal yang jumlahnya terbatas, sehingga dimungkinkan untuk melakukan penelitian kembali dengan menggunakan data penyalahgunaan ilegal. 2. Program yang digunakan untuk

(22)

DAFTAR PUSTAKA

Elliot RJ, Aggoun L, Moore JB. 1995. Hidden Markov Models Estimation and Control. Springer Verlag. New York.

Ghahramani S. 2005. Fundamental of Probability. Ed. ke-2. Prentice Hall. New Jersey.

Grimmet GR, Stirzaker DR. 2001. Probability and Random Processes. Ed. ke-3. Clarendon Press. Oxford.

Hogg RV, Craig AT, McKean JW. 2005. Introduction to Mathematical Statistics. Ed. ke-6. Prentice Hall. Englewood Cliffs. New Jersey.

Osborne MJ. 1997. Concave and Convex Function of Many Variables.

(http://www.economics.about.com/Convex .htm).

Rabiner LR. 1989. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Proc. IEEE, Vol 77 No.2, pg.257-286.

Ross SM. 1996. Stochastic Processes. Ed. ke-2. John Wiley & Sons. New York

Srivastava A, Kundu A, Sural S, Majumdar AK. 2008. Credit Card Fraud Detection Using Hidden Markov Model. Proc. IEEE, Vol 5 No.1, pg.37-48.

(23)
(24)
(25)
(26)

167 30-01-2012 0 1 168 31-01-2012 195700 1

169 01-02-2012 0 1

170 02-02-2012 1007500 3

171 03-02-2012 0 1

172 04-02-2012 0 1

173 05-02-2012 0 1

174 06-02-2012 184000 1 175 07-02-2012 28700 1

176 08-02-2012 0 1

177 09-02-2012 404000 2 178 10-02-2012 589575 2

179 11-02-2012 0 1

180 12-02-2012 0 1

181 13-02-2012 0 1

182 14-02-2012 0 1

183 15-02-2012 125000 1 184 16-02-2012 425158 2

185 17-02-2012 0 1

(27)

Lampiran 2. Tabel hasil deteksi transaksi kartu kredit untuk dan

No. Peluang Observasi

Perbandingan selisih peluang observasi

(

Terdeteksi berbahaya 1 1.86899×10-24

2 1.24589×10-22 -1.22720×10-22 3 1.18287×10-21 -1.05828×10-21

4 1.18287×10-21 1.11787×10-32 9.45048×10-12

5 1.08105×10-22 1.07476×10-21 0.90861 Terdeteksi 6 1.19905×10-22 -1.17999×10-23

7 1.20033×10-22 -1.27989×10-25

8 1.20007×10-22 2.61840×10-26 0.00022 9 1.08201×10-22 1.18053×10-23 0.09837 10 1.08200×10-22 8.43529×10-28 7.79592×10-6 11 1.08201×10-22 -1.59704×10-28

12 9.88870×10-24 9.83119×10-23 0.90861 Terdeteksi 13 1.09681×10-23 -1.07944×10-24

14 9.94152×10-25 9.97399×10-24 0.90936 Terdeteksi 15 1.10290×10-24 -1.08751×10-25

16 1.10256×10-24 3.42894×10-28 0.00031 17 1.10912×10-24 -6.55584×10-27

18 1.07940×10-24 2.97121×10-26 0.02679 19 1.26906×10-24 -1.89657×10-25

20 1.21296×10-23 -1.08606×10-23

21 1.18021×10-23 3.27509×10-25 0.02700

22 2.46774×10-25 1.15554×10-23 0.97909 Terdeteksi 23 2.59863×10-24 -2.35186×10-24

24 2.60289×10-24 -4.26386×10-27

25 2.60210×10-24 7.94996×10-28 0.00031 26 2.60224×10-24 -1.42295×10-28

27 2.60222×10-24 2.39374×10-29 9.19875×10-6 28 2.60222×10-24 -3.75252×10-30

29 2.37823×10-25 2.36440×10-24 0.90861 Terdeteksi 30 2.63782×10-25 -2.59589×10-26

31 2.64064×10-25 -2.81572×10-28

32 2.64006×10-25 5.76035×10-29 0.00022 33 2.64017×10-25 -1.11888×10-29

34 2.64015×10-25 2.05492×10-30 7.78327×10-6 35 2.64015×10-25 -3.57271×10-31

(28)

No. Peluang Observasi

Perbandingan selisih peluang observasi

(

Terdeteksi berbahaya 1 8.06664×10-25

2 6.24452×10-23 -6.16386×10-23 3 5.63868×10-22 -5.01423×10-22 4 5.63868×10-22 -7.08149×10-29

5 3.09336×10-23 5.32935×10-22 0.94514 Terdeteksi 6 3.29730×10-23 -2.03940×10-24

7 3.27482×10-23 2.24761×10-25 0.00682 8 3.26724×10-23 7.58214×10-26 0.00232 9 3.06281×10-23 2.04426×10-24 0.06257 10 3.06214×10-23 6.73031×10-27 0.00022 11 3.06220×10-23 -6.28028×10-28

12 1.68120×10-24 2.89408×10-23 0.94510 Terdeteksi 13 1.79375×10-24 -1.12548×10-25

14 1.09646×10-25 1.68410×10-24 0.93887 Terdeteksi 15 1.17890×10-25 -8.24304×10-27

16 1.19632×10-25 -1.74207×10-27 17 1.28356×10-25 -8.72436×10-27 18 1.55113×10-25 -2.67570×10-26 19 2.42120×10-25 -8.70074×10-26 20 2.31251×10-24 -2.07039×10-24 21 2.76860×10-24 -4.56093×10-25

22 4.69934×10-26 2.72161×10-24 0.98303 Terdeteksi 23 4.52317×10-25 -4.05323×10-25

24 4.22473×10-25 2.98437×10-26 0.06598 25 4.21846×10-25 6.26328×10-28 0.00148 26 4.21641×10-25 2.04979×10-28 0.00049 27 4.21573×10-25 6.80476×10-29 0.00016 28 4.21551×10-25 2.25108×10-29 0.00005

29 2.31327×10-26 3.98418×10-25 0.94513 Terdeteksi 30 2.46578×10-26 -1.52507×10-27

31 2.44893×10-26 1.68467×10-28 0.00683 32 2.44322×10-26 5.70784×10-29 0.00233 33 2.44135×10-26 1.87566×10-29 0.00077 34 2.44072×10-26 6.22138×10-30 0.00025 35 2.44052×10-26 2.05803×10-30 0.00008

36 1.33946×10-27 2.30657×10-26 0.94512 Terdeteksi

(29)

Lampiran 3. Program untuk mencari parameter menggunakan Mathematica 7.0 Untuk dengan batas Seedrandom .

Data Input Transaksi Kartu Kredit

data3, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 2, 1, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 3,

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

1, 2, 2, 1, 1, 1, 2, 1, 1, 1, 1, 1, 2, 1, 1, 2, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1;

n2;n adalah ruang state untuk memodelkan transaksi kartu kredit

z030 000;SeedRandom untuk mencatat nilai awal yang dibangkitkan

secara acak

Program Membangkitkan Nilai Awal Parameter HMM

Menentukan nilai awal A, B, yang dibangkitkan secara acak dan dicatat

dengan SeedRandom

transAn_:Blocka,b,c,aRandomReal0, 1,n,n; bPlusa;

cTransposea b;

transBn_:Blocka,b,c,aRandomReal0, 1,3,n; bPlusa;

cTransposea b;

phiAn_:Blocka,b,c,aRandomReal0, 1,n, 1; bPlusa;

cTransposea b;

HasilAkhir;

Forn2, n3,frek0;PresBar ;zSeedRan;

Forzz0,z40 000,

SeedRandomz;

AtransAn;

BtransBn;

phiphiAn;

ALGORITME FORWARD

Hitung alpha peluang observasi untuk r1 sampai dengan R

tBTransposeB;

bor_:TransposetBdata1,r;

alpha1Transposephibo1;

AlphaNestListTransposeTranspose1.Abo21,21&,

alpha1, 1, LengthTransposedata1;

alphaRAlphaLengthTransposedata1, 1;

PeluangObservasiSumalphaRi,i,n;

ALGORITME VITERBI

betaNestListA.1bo2,21&,

(30)

DeltaNestListTableMax1TransposeAi,i,nbo21,

21&,alpha1, 1, LengthTransposedata1;

deltaRDeltaLengthTransposedata, 1;

PeluangStateMaksMaxdeltaR;

BSTTablePositionDeltai, 1, MaxDeltai, 1,

i, LengthTransposedata;

BarisanStateTerbaikTableBSTi, 11,i, LengthTransposedata;

BarisanObservasiDuga

TableRandomChoiceBBarisanStateTerbaiki1, 2, 3, 1,

i, LengthBarisanStateTerbaik Flatten;

bandingFlattendata,BarisanObservasiDuga Transpose;

JmldtL_:Countbanding,L, _;

JmldtdgR_,P_:Countbanding,R,P;

PresTepatdgK_:JmldtdgK,K JmldtK100N;

PresTepatdg1PresTepatdg1;

PresTepatdg2PresTepatdg2;

PresTepatdg3PresTepatdg3;

PresTepDgBarSumJmldtdgi,i,i, 3  LengthTransposedata 100  N;

IfPresTepatdg160 &&PresTepatdg260 &&PresTepatdg360,

frekfrek1;PresBarAppendPresBar,PresTepDgBar;

zSeedRanAppendzSeedRan,z;

Printz,PresTepatdg1,PresTepatdg2,PresTepatdg3,PresTepDgBar, 0;

z;

Printn; Printfrek; PrintMaxPresBar;

PrintzSeedRanPositionPresBar, MaxPresBar  Flatten;

Hasil

n,frek,MaxPresBar,

zSeedRanPositionPresBar, MaxPresBar  Flatten Flatten;

HasilAkhirAppendHasilAkhir, Hasil;

n;

PrintHasilAkhir;

Pendugaan Parameter Dengan Algoritme BaumWelch

THATransposeHasilAkhir;

XTHA1;

YTHA2;

ZTHA3;

MTHA4;

(31)

Program Pembangkit Matriks Peluang

transAn_:Blocka,b,c,aRandomReal0, 1,n,n; bPlusa;

cTransposea b;

transBn_:Blocka,b,c,aRandomReal0, 1,3, n; bPlusa;

cTransposea b;

phiAn_:Blocka, b,c,aRandomReal0, 1,n, 1; bPlusa;

cTransposea b;

SeedRandomz;

AtransAn;

BtransBn;

phiphiAn;

tBTransposeB;

bor_:TransposetBdata1,r;

alpha1Transposephibo1;

AlphaNestListTransposeTranspose1.Abo21,21&,

alpha1, 1, LengthTransposedata1;

alphaRAlphaLengthTransposedata1, 1;

betaNestListA.1bo2,21&,

ConstantArray1,n, LengthTransposedata, LengthTransposedata1;

albetbTableAlphai, 1betaLengthTransposedatai, 1boi1,

i, LengthTransposedata1;

EpsiTableTableFlattenalbetbjAi,i,n,

j, LengthTransposedata1;

SumEpsiTableSumEpsili,j,i,n,j,n,

l, LengthTransposedata1;

EpsilonTableEpsii SumEpsii,i, LengthTransposedata1;

GamaTableTotalEpsiloni,j,i, LengthTransposedata1,j,n;

SumEpsilonTableSumEpsiloni,jl,i, LengthTransposedata1,

j,n,l,n;

SumGamaTableSumGamai,j,i, LengthTransposedata1,j,n;

AdugaanTableSumEpsiloni,j SumGamai,i,n,j,n N;

phidugaanListGama1 N;

databedugDeleteFlattendata, LengthFlattendata;

Bedug

Transpose

TableSumGamaPositiondatabedug, 1i, 2,j,

i, LengthPositiondatabedug, 1,j,n,

TableSumGamaPositiondatabedug, 2i, 2,j,

i, LengthPositiondatabedug, 2,j,n,

TableSumGamaPositiondatabedug, 3i, 2,j,

i, LengthPositiondatabedug, 3,j,n;

(32)

Untuk dengan batas Seedrandom .

Program Output Nilai Dugaan Parameter

Print

Grid

"N",n,

"Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi

Maksimal",z,"Ketepatan Dugaan Barisan Observasi",

Zi

Grid"Nilai Awal",

"A", "", MatrixFormA,

"B", "", MatrixFormB,

"phi", "", MatrixFormphi

Grid"Nilai Dugaan",

"A", "", MatrixFormAdugaan,

"B", "", MatrixFormBdugaan,

"phi", "", MatrixFormphidugaan;

i

;

Data Input Transaksi Kartu Kredit

data3, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 2, 1, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 3,

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

1, 2, 2, 1, 1, 1, 2, 1, 1, 1, 1, 1, 2, 1, 1, 2, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1;

n4;n adalah ruang state untuk memodelkan transaksi kartu kredit

z03000;SeedRandom untuk mencatat nilai awal yang dibangkitkan

secara acak

Program Membangkitkan Nilai Awal Parameter HMM

Menentukan nilai awal A, B, yang dibangkitkan secara acak dan dicatat

dengan SeedRandom

transAn_:Blocka,b,c,aRandomReal0, 1,n,n; bPlusa;

cTransposea b;

transBn_:Blocka,b,c,aRandomReal0, 1,3, n; bPlusa;

cTransposea b;

phiAn_:Blocka, b,c,aRandomReal0, 1,n, 1; bPlusa;

cTransposea b;

(33)

Forn4, n5,frek0;PresBar ;zSeedRan;

Forzz0,z10 000,

SeedRandomz;

AtransAn;

BtransBn;

phiphiAn;

ALGORITME FORWARD

Hitung alpha peluang observasi untuk r1 sampai dengan R

tBTransposeB;

bor_:TransposetBdata1,r;

alpha1Transposephibo1;

AlphaNestListTransposeTranspose1.Abo21,21&,

alpha1, 1, LengthTransposedata1;

alphaRAlphaLengthTransposedata1, 1;

PeluangObservasiSumalphaRi,i,n;

ALGORITME VITERBI

betaNestListA.1bo2,21&,

ConstantArray1,n, LengthTransposedata, LengthTransposedata1;

Delta

NestListTableMax1TransposeAi,i,nbo21,

21&,alpha1, 1, LengthTransposedata1;

deltaRDeltaLengthTransposedata, 1;

PeluangStateMaksMaxdeltaR;

BSTTablePositionDeltai, 1, MaxDeltai, 1,

i, LengthTransposedata;

BarisanStateTerbaikTableBSTi, 11,i, LengthTransposedata;

BarisanObservasiDuga

TableRandomChoiceBBarisanStateTerbaiki1, 2, 3, 1,

i, LengthBarisanStateTerbaik Flatten;

bandingFlattendata,BarisanObservasiDuga Transpose;

JmldtL_:Countbanding,L, _;

JmldtdgR_,P_:Countbanding,R,P;

PresTepatdgK_:JmldtdgK,K JmldtK100N;

PresTepatdg1PresTepatdg1;

PresTepatdg2PresTepatdg2;

PresTepatdg3PresTepatdg3;

PresTepDgBarSumJmldtdgi,i,i, 3  LengthTransposedata 100 N; IfPresTepatdg160 &&PresTepatdg260 &&PresTepatdg360,

frekfrek1;PresBarAppendPresBar,PresTepDgBar;

zSeedRanAppendzSeedRan,z;

Printz,PresTepatdg1,PresTepatdg2,PresTepatdg3,PresTepDgBar, 0;

z;

Printn; Printfrek; PrintMaxPresBar;

(34)

Hasil

n,frek,MaxPresBar,

zSeedRanPositionPresBar, MaxPresBar  Flatten Flatten;

HasilAkhirAppendHasilAkhir, Hasil;

n;

PrintHasilAkhir;

Pendugaan Parameter Dengan Algoritme BaumWelch

THATransposeHasilAkhir;

XTHA1;

YTHA2;

ZTHA3;

MTHA4;

Fori1,i3, nXi;zMi;

Program Pembangkit Matriks Peluang

transAn_:Blocka, b,c,aRandomReal0, 1,n,n; bPlusa;

cTransposea b;

transBn_:Blocka, b,c,aRandomReal0, 1,3,n; bPlusa;

cTransposea b;

phiAn_:Blocka, b,c,aRandomReal0, 1,n, 1;bPlusa;

cTransposea b;

SeedRandomz;

AtransAn;

BtransBn;

phiphiAn;

tBTransposeB;

bor_:TransposetBdata1,r;

alpha1Transposephibo1;

AlphaNestListTransposeTranspose1.Abo21,21&,

alpha1, 1, LengthTransposedata1;

alphaRAlphaLengthTransposedata1, 1;

betaNestListA.1bo2,21&,

ConstantArray1, n, LengthTransposedata, LengthTransposedata1;

albetbTableAlphai, 1betaLengthTransposedatai, 1boi1,

i, LengthTransposedata1;

EpsiTableTableFlattenalbetbjAi,i, n,

j, LengthTransposedata1;

SumEpsiTableSumEpsili,j,i, n,j, n,

l, LengthTransposedata1;

EpsilonTableEpsii SumEpsii,i, LengthTransposedata1;

GamaTableTotalEpsiloni,j,i, LengthTransposedata1,j, n;

SumEpsilonTableSumEpsiloni,jl,i, LengthTransposedata1,

(35)

Untuk dengan batas Seedrandom .

SumGamaTableSumGamai,j,i, LengthTransposedata1,j, n;

AdugaanTableSumEpsiloni,j SumGamai,i, n,j, n N;

phidugaanListGama1 N;

databedugDeleteFlattendata, LengthFlattendata;

Bedug

Transpose

TableSumGamaPositiondatabedug, 1i, 2,j,

i, LengthPositiondatabedug, 1,j, n,

TableSumGamaPositiondatabedug, 2i, 2,j,

i, LengthPositiondatabedug, 2,j, n,

TableSumGamaPositiondatabedug, 3i, 2,j,

i, LengthPositiondatabedug, 3,j, n;

BdugaanTableBedugi,j SumGamai,i, n,j, 3 N;

Program Output Nilai Dugaan Parameter

Print

Grid

"N", n,

"Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi

Maksimal",z,"Ketepatan Dugaan Barisan Observasi",

Zi

Grid"Nilai Awal",

"A", "", MatrixFormA,

"B", "", MatrixFormB,

"phi", "", MatrixFormphi

Grid"Nilai Dugaan",

"A", "", MatrixFormAdugaan,

"B", "", MatrixFormBdugaan,

"phi", "", MatrixFormphidugaan;

i ;

Data Input Transaksi Kartu Kredit

data3, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 2, 1, 1, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 3, 1, 1,

1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,

1, 1, 1, 2, 1, 1, 1, 1, 1, 2, 1, 1, 2, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1,

1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1;

n6;n adalah ruang state untuk memodelkan transaksi kartu kredit

z010 000;SeedRandom untuk mencatat nilai awal yang dibangkitkan

(36)

Program Membangkitkan Nilai Awal Parameter HMM

Menentukan nilai awal A, B, yang dibangkitkan secara acak dan dicatat

dengan SeedRandom

transAn_:Blocka, b,c,aRandomReal0, 1,n,n;bPlusa;

cTransposea b;

transBn_:Blocka, b,c,aRandomReal0, 1,3,n; bPlusa;

cTransposea b;

phiAn_:Blocka, b,c,aRandomReal0, 1,n, 1;bPlusa;

cTransposea b;

HasilAkhir;

Forn6, n6,frek0;PresBar ;zSeedRan;

Forzz0,z20 000,

SeedRandomz;

AtransAn;

BtransBn;

phiphiAn;

ALGORITME FORWARD

Hitung alpha peluang observasi untuk r1 sampai dengan R

tBTransposeB;

bor_:TransposetBdata1,r;

alpha1Transposephibo1;

AlphaNestListTransposeTranspose1.Abo21,21&,

alpha1, 1, LengthTransposedata1;

alphaRAlphaLengthTransposedata1, 1;

PeluangObservasi SumalphaRi,i,n;

ALGORITME VITERBI

betaNestListA.1bo2,21&,

ConstantArray1,n, LengthTransposedata, LengthTransposedata1;

Delta

NestListTableMax1TransposeAi,i,nbo21,

21&,alpha1, 1, LengthTransposedata1;

deltaRDeltaLengthTransposedata, 1;

PeluangStateMaks MaxdeltaR;

BSTTablePositionDeltai, 1, MaxDeltai, 1,

i, LengthTransposedata;

BarisanStateTerbaikTableBSTi, 11,i, LengthTransposedata;

BarisanObservasiDuga

TableRandomChoiceBBarisanStateTerbaiki1, 2, 3, 1,

i, LengthBarisanStateTerbaik Flatten;

bandingFlattendata,BarisanObservasiDuga Transpose;

JmldtL_:Countbanding,L, _;

(37)

PresTepatdgK_:JmldtdgK,K JmldtK100N;

PresTepatdg1PresTepatdg1;

PresTepatdg2PresTepatdg2;

PresTepatdg3PresTepatdg3;

PresTepDgBarSumJmldtdgi,i,i, 3  LengthTransposedata 100 N; IfPresTepatdg160 &&PresTepatdg260 &&PresTepatdg360,

frekfrek1;PresBarAppendPresBar,PresTepDgBar;

zSeedRanAppendzSeedRan,z;

Printz,PresTepatdg1,PresTepatdg2,PresTepatdg3,PresTepDgBar, 0;

z;

Printn; Printfrek; PrintMaxPresBar;

PrintzSeedRanPositionPresBar, MaxPresBar  Flatten;

Hasil

n,frek,MaxPresBar,

zSeedRanPositionPresBar, MaxPresBar  Flatten Flatten;

HasilAkhirAppendHasilAkhir, Hasil;

n;

PrintHasilAkhir;

Pendugaan Parameter Dengan Algoritme BaumWelch

THATransposeHasilAkhir;

XTHA1;

YTHA2;

ZTHA3;

MTHA4;

Fori1,i1,nXi;zMi;

Program Pembangkit Matriks Peluang

transAn_:Blocka, b,c,aRandomReal0, 1,n,n; bPlusa;

cTransposea b;

transBn_:Blocka, b,c,aRandomReal0, 1,3,n; bPlusa;

cTransposea b;

phiAn_:Blocka, b,c,aRandomReal0, 1,n, 1;bPlusa;

cTransposea b;

SeedRandomz;

AtransAn;

BtransBn;

phiphiAn;

tBTransposeB;

bor_:TransposetBdata1,r;

alpha1Transposephibo1;

AlphaNestListTransposeTranspose1.Abo21,21&,

alpha1, 1, LengthTransposedata1;

(38)

betaNestListA.1bo2,21&,

ConstantArray1,n, LengthTransposedata, LengthTransposedata1;

albetbTableAlphai, 1betaLengthTransposedatai, 1boi1,

i, LengthTransposedata1;

EpsiTableTableFlattenalbetbjAi,i,n,

j, LengthTransposedata1;

SumEpsiTableSumEpsili,j,i,n,j,n,

l, LengthTransposedata1;

EpsilonTableEpsii SumEpsii,i, LengthTransposedata1;

GamaTableTotalEpsiloni,j,i, LengthTransposedata1,j,n;

SumEpsilonTableSumEpsiloni,jl,i, LengthTransposedata1,

j,n,l,n;

SumGamaTableSumGamai,j,i, LengthTransposedata1,j,n;

AdugaanTableSumEpsiloni,j SumGamai,i,n,j,n N;

phidugaanListGama1 N;

databedugDeleteFlattendata, LengthFlattendata;

Bedug

Transpose

TableSumGamaPositiondatabedug, 1i, 2,j,

i, LengthPositiondatabedug, 1,j,n,

TableSumGamaPositiondatabedug, 2i, 2,j,

i, LengthPositiondatabedug, 2,j,n,

TableSumGamaPositiondatabedug, 3i, 2,j,

i, LengthPositiondatabedug, 3,j,n;

BdugaanTableBedugi,j SumGamai,i,n,j, 3 N;

Program Output Nilai Dugaan Parameter

Print

Grid

"N",n,

"Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi

Maksimal",z,"Ketepatan Dugaan Barisan Observasi",

Zi

Grid"Nilai Awal",

"A", "", MatrixFormA,

"B", "", MatrixFormB,

"phi", "", MatrixFormphi

Grid"Nilai Dugaan",

"A", "", MatrixFormAdugaan,

"B", "", MatrixFormBdugaan,

"phi", "", MatrixFormphidugaan;

(39)

Lampiran 4. Output nilai parameter awal dan parameter duga

N 2

Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi Maksimal 31 653 Ketepatan Dugaan Barisan Observasi 85.3333

Nilai Awal

A  0.39331 0.60669 0.403884 0.596116

B 0.564087 0.391925 0.0439879 0.847429 0.0782065 0.0743648 phi 0.0192293 0.980771

Nilai Dugaan

A 0.231007 0.768993 0.238936 0.761064

B 0.900029 0.0865064 0.0134647 0.898624 0.0879956 0.0133807 phi 0.503985 0.496015

N 3

Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi Maksimal 31 231 Ketepatan Dugaan Barisan Observasi 92.6667

Nilai Awal

A

0.138727 0.56445 0.296823 0.511885 0.329679 0.158436 0.340517 0.376118 0.283366

B

0.952675 0.0165709 0.0307538 0.129403 0.675667 0.19493 0.358725 0.174008 0.467267 phi 0.12018 0.310284 0.569535

Nilai Dugaan

A

0.414649 0.353072 0.232279 0.82249 0.110859 0.0666509 0.690118 0.159525 0.150357

B

(40)

N 4 Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi Maksimal 7053

Ketepatan Dugaan Barisan Observasi 93.3333

Nilai Awal phi 0.319199 0.232895 0.0698628 0.378043

Nilai Dugaan phi 0.248186 0.156038 0.373259 0.222516

N 5

Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi Maksimal 3157 Ketepatan Dugaan Barisan Observasi 96.

Nilai Awal

phi 0.262975 0.305094 0.175311 0.246236 0.010384

Nilai Dugaan

(41)

N 6 Seed Random yang mempunyai Ketepatan Dugaan Barisan Observasi Maksimal 18 854

Ketepatan Dugaan Barisan Observasi 98.

Nilai Awal

A

0.14544 0.106327 0.283051 0.239758 0.130804 0.0946192 0.157999 0.0793258 0.319338 0.136935 0.147378 0.159025 0.154031 0.248953 0.101834 0.0674307 0.240047 0.187705 0.23784 0.0846836 0.0274142 0.298484 0.273154 0.078425 0.071521 0.195624 0.231019 0.156598 0.208749 0.136489 0.156938 0.28523 0.11371 0.0549448 0.380211 0.0089663

B

0.00134162 0.117761 0.880898 0.426909 0.256665 0.316426 0.375343 0.604857 0.0198 0.963948 0.0253693 0.0106826 0.0286946 0.753613 0.217692

0.380068 0.274274 0.345658

phi 0.259436 0.055281 0.173323 0.230043 0.0632001 0.218717

Nilai Dugaan

A

0.00261408 0.0602434 0.125473 0.771455 0.0140175 0.0261975 0.00411701 0.0651592 0.205224 0.63877 0.0228969 0.063832 0.00572443 0.291659 0.0933397 0.448626 0.0531906 0.10746 0.00397361 0.0445998 0.011296 0.892737 0.0272096 0.0201837 0.00165109 0.142362 0.131534 0.647183 0.0287328 0.048538 0.00648661 0.371637 0.115915 0.406555 0.0936978 0.00570886

B

0.921725 0.0702043 0.00807064 0.882474 0.105034 0.0124917 0.845064 0.129125 0.0258102 0.950961 0.0399153 0.00912395 0.892153 0.0956748 0.0121723 0.820026 0.153669 0.0263052

Gambar

Gambar 1 Grafik persentase untuk setiap  profil pengeluaran.
Gambar 2 Proses deteksi penyalahgunaan kartu kredit.
Gambar 3 Grafik ketepatan dugaan barisan observasi.
Gambar 4 Grafik Nilai True Positive dan False Positive untuk  dan .
+6

Referensi

Dokumen terkait

[r]

Apabila ditinjau dari kemaknaan peningkatan pengetahuan dalam penelitian ini, dapat dinyatakan bahwa materi pendidikan kesehatan reproduksi yang perlu ada

Positif artinya apabila nilai pelanggan, citra merek dan kualitas pelayanan yang ada dari KA kelas ekonomi Tawang Jaya semakin baik maka kepuasan pelanggan juga akan

Dengan menggunakan rumus diatas yang berbasiskan metode earned value, maka didapatkan hasil perhitungan dari nilai sisa waktu konstruksi dan prediksi durasi akhir

2 Lakukan salah satu dari yang berikut: 23 Menggunakan Windows a Pada saat dokumen terbuka, klik File Print (Cetak).. c Dari menu drop-down Paper Size (Ukuran Kertas) pada tab

Hasil penelitian KPRI Urip Bahagia tahun 2016 - 2018 menunjukkan kategori cukup sehat dengan memperoleh nilai rata-rata 69,65 dengan rincian: (1) aspek

Untuk itu pada hari Selasa, 10 Desember 2013 bertempat di Kementerian Perdagangan RI telah diselenggarakan acara Pengukuhan Eksportir Bersertifikat (EB) dalam Skema Sertifikasi

Karya Ilmiah skripsi yang berjudul “ Peningkatan Aktivitas dan Hasil Belajar IPA Pokok Bahasan Gaya dengan Model Pembelajaran Berbasis Masalah pada Siswa Kelas IV SD Negeri 2