Financial Fraud Detection using
Social Network Analysis
Andry Alamsyah1,2, Budi Rahardjo2, Kuspriyanto2
1Sekolah Manajemen Telekomunikasi dan Media, Institut Manajemen Telkom 2Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung
Abstrak
Salah satu ancaman besar terhadap suatu perusahaan adalah kejahatan penyelewengan keuangan / financial fraud. Terdapat beberapa aktivitas yang termasuk ke dalam kategori kejahatan ini yaitu: corruption, asset misappropriation dan fraudulent statements. Pencegahan bisa dilakukan dengan hanya mengawasi aktor aktor tertentu di dalam jaringan perusahaan yang mempunyai nilai centrality yang besar. Jika kejahatan sudah dilakukan, maka tantangan yang dihadapi adalah bagaimana mendeteksi aliran hasil kejahatan menggunakan metode penelusuran ego-centric network dan community detection. Metoda metoda yang disebutkan diatas merupakan bagian dari metodologi Social Network Analysis (SNA), yang memodelkan hubungan antar manusia di dalam jaringan sosial. SNA menyediakan metrik metrik untuk kuantifikasi hubungan hubungan tersebut. Dalam paper ini akan dijelaskan kemungkinan skenario financial fraud dan bagaimana menggunakan metrik di dalam metodologi SNA untuk pencegahan dan penelusuran financial fraud berdasarkan topologi jaringan.
Kata Kunci : financial fraud, social network analysis, graph theory, community detection, centrality, ego-centric
I. PENDAHULUAN
Financial fraud adalah salah satu jenis kejahatan yang dilakukan karyawan internal dalam suatu perusahaan, dan pada umumnya dilakukan oleh mereka yang mempunyai kekuasaan / posisi strategis atau dilakukan secara kolektif antar beberapa orang dalam satu kelompok dengan kekuasaan yang cenderung merata [1]. Posisi strategis merupakan hal yang mendominasi seorang karyawan untuk menyalahgunakan wewenang untuk kepentingan pribadi atau kelompoknya [2]. Interaksi antar karyawan dengan lingkungannya kita modelkan menjadi suatu model jaringan berdasarkan hubungan atau interaksi antar mereka.
Pada paper ini, kami membahas bagaimana mencegah terjadinya financial fraud dan mendeteksi aliran hasil kejahatan berdasarkan perilaku individu dan kelompok
menggunakan metrik dan metodologi Social Network Analysis (SNA), baik yang bersifat khusus seperti tie-strenght, reciprocal, transitivity atau yang umum seperti centrality dan community detection [3]. Sejauh pengamatan kami, paper kami ini yang pertama kali menjabarkan ide deteksi financial fraud menggunakan pendekatan topologi / struktur jaringan SNA.
Uniform Occupational Fraud Classification System yang diterbitkan oleh Association of Certified Fraud Examiners (ACFE) mendefinisikan kejahatan financial fraud dan membaginya menjadi tiga klasifikasi aktivitas utama yaitu : corruption, asset misappropriation dan fraudulent statements seperti pada gambar 1. Paper ini tidak membahas detail masing masing aktivitas tersebut, karena ide penelitian ini di fokuskan pada pola aktivitas kejahatan dan pertukaran informasi antar aktor dan pendukungnya. Ketiga aktivitas diatas bisa dilakukan oleh individu dengan dukungan orang lain. Dukungan
tersebut hanya bisa terjadi jika ada hubungan antar dua individu tersebut kuat, yang di representasikan sebagai tie-strenght [4]
gambar 1. diagram peta kategori financial fraud, sumber
http://www.acfe.com
Permasalahan umum pada riset yang berkenaan dengan kejahatan financial fraud adalah ketersediaan dataset. Hal ini terjadi karena sifat umum perusahaan yang sedang mengalami masalah financial fraud cenderung tidak menerbitkan kondisi keuangan yang sesungguhnya karena khawatir akan merugikan kepercayaan pelanggan dan harga saham. Satu satunya dataset terbesar dan komprehensif berkenaan dengan kasus korupsi adalah dataset email dari perusahaan Enron, yang merupakan dataset ukuran besar. Untuk keperluan riset ini, kami melakukan proses pembersihan / kategorisasi data tersebut, dan proses tersebut masih berlangsung sampai saat paper ini dibuat. Untuk mensimulasikan skenario ide paper ini, kami menggunakan dataset ego-network dari facebook yang kami peroleh dari Stanford Large-Network Dataset Collection (SNAP).
gambar 2.a reciprocity 4/7, 4 relasi timbal balik dari keseluruhan total 7 relasi. 2.b transitivity A mempunyai berteman dengan B dan C, maka
besar kemungkinan B berteman dengan C
II. SOCIALNETWORKANALYSISDAN SKENARIO
SNA memodelkan hubungan antar individu pada suatu jaringan sosial tertentu. Pada SNA individu direpresentasikan sebagai titik / node dan hubungan antar individu direpresentasikan sebagai garis / edge. SNA dikembangkan dari teori graph di matematika, dan merupakan bagian dari network science [3], yang tujuan utamanya adalah untuk memahami dan merepresentasikan perilaku dari jaringan yang ada di dunia nyata. Pengamatan struktur jaringan model pada SNA bisa dipakai sebagai dasar untuk mendeteksi anomali yang mungkin terjadi pada jaringan dimana financial fraud terjadi. Aplikasi metrik SNA untuk financial fraud secara singkat bisa dilihat pada tabel 1. Berikut ini beberapa ukuran yang dipakai pada penelitian ini.
ll.1 Tie Strenght, Reciprocity dan Transitivity
Tie Strenght atau kekuatan hubungan menggambarkan seberapa kuat hubungan antar dua individu. Suatu hubungan yang pertemanan yang kuat bisa dilihat dari frekuensi komunikasi antar dua individu. Hubungan pertemanan yang dekat memfasilitasi transfer pengetahuan dan cenderung mempunyai motivasi tinggi untuk saling membantu [6]. Tie Strenght pada umumnya direpresentasikan sebagai bobot (weight) garis pada model SNA
Reciprocity adalah hubungan interaksi timbal balik antar aktor yang sering ditemukan pada suatu komunitas. Reciprocity merupakan faktor penting untuk koordinasi suatu proyek, berkolaborasi, dan pengembangan jalur komunikasi yang efektif. Suatu jaringan yang kaya dengan komunikasi reciprocal memungkinkan individu didalamnya untuk saling melakukan klarifikasi, memperpanjang, dan menyempurnakan ide. Reciprocity juga mengurangi ketidakpastian antar individu dengan mengutamakan tingkat kepercayaan dan solidaritas [7]. Dalam skala yang lebih luas reciprocity juga berguna untuk koordinasi grup / kelompok / komunitas dalam suatu jaringan. Banyak jaringan sosial dunia nyata mempunyai karakteristik yang didominasi oleh komunikasi reciprocal.
Transitivity adalah kecenderungan dua individu yang mana keduanya terhubung / berteman dengan orang ketiga, sehingga kedua individu pertama tersebut juga berteman [3]. Jika satu individu menyarankan hubungan antar alternya, maka tingkat kohesi grup (Group Cohesion) mereka akan meningkat. Kohesi suatu grup akan dibahas lebih mendalam perannya pada pembahasan mengenai Community Detection. Gambar 2 memberikan ilustrasi dan penjelasan singkat mengenai transitivity dan reciprocity.
II.2 Ego-centric Network
Ego-centric network adalah analisa jaringan yang berfokus kepada sifat dari satu individu (ego) berdasarkan analisa dari beberapa node yang menjadi tetangganya (alter) [5]. Dengan kata lain ego-centric network digunakan untuk memahami perilaku individu dalam satu jaringan. Hubungan level-1 dari suatu ego-centric network, merupakan hubungan yang terkuat, dimana individu mengetahu bagaimana kondisi alter mereka, demikian juga para alter saling mengetahui kondisi individu yang berhubungan langsung dengannya. Individu akan lebih sulit memahami hubungan dengan level yang lebih jauh dan kekuatan pertukaran informasi serta pengaruh akan menjadi berkurang. Marsden [8] menyatakan bahwa hubungan ego-centric network dibawah 2 level disebut sebagai sphere of influence, yang artinya batas pengaruh langsung dari satu ego network.
II.3 Centrality dan Community Detection
Centrality adalah ukuran untuk menentukan siapakah aktor utama di dalam suatu network yang mempunyai peran yang central terhadap semua individu di dalam satu jaringan [3]. Terdapat beberapa jenis centrality, beberapa yang terpenting adalah centrality dalam hal jumlah koneksi ke individu lainnya di dalam jaringan, centrality dalam hal lokasi di dalam suatu jaringan relatif terhadap semua individu lainnya, centrality posisi individu terhadap komunitas yang ada didalam suatu jaringan, dan juga ranking centrality.
Community Detection adalah suatu metode untuk mendeteksi keberadaan komunitas di dalam suatu jaringan. Sifat alami dari jejaring sosial adalah multi-layer / multi-dimensional [9], dimana jenis hubungan antar dua individu mungkin bukan satu satunya jenis hubungan yang ada. Dengan melakukan ekstraksi
hubungan yang ada dalam pada jaringan sosial, kita mungkin bisa memperoleh lebih dari satu jenis hubungan, hal ini juga berarti kita mempunyai banyak model SNA dalam satu jaringan yang sama. Deteksi komunitas bersifat subyektif, selama ini kita diberikan rambu rambu bagaimana menentukan komunitas, akan tetapi keputusan terakhir kembali ke model yang sesuai dengan kebutuhan kita.
Komunitas ditentukan oleh beberapa ukuran, diantaranya adalah group cohesion, yaitu bagaimana suatu grup bisa terus bertahan, jika kohesi bagus maka grup tersebut akan terus bersama, sebaliknya jika kohesi tidak bagus / kurang kuat maka grup tersebut akan terpecah. Kekuatan suatu grup ditentukan oleh kekuatan reciprocity dan transitivity anggota di dalamnya. Ukuran lain dari komunitas adalah clustering coefficient yang mengukur peluang dua individidu berada pada grup yang sama. Ukuran terakhir adalah modularity, yaitu ukuran kekuatan pembagian suatu jaringan menjadi satu atau beberapa komunitas. Semakin besar nilai modularity artinya semakin kuat hubungan node dengan lingkungannya dan membentuk dense network . Dense network akan membentuk komunitas, sedangkan lawannya sparse network akan menjadi penghubung antar komunitas atau tidak terhubung sama sekali. Dari berbagai metrik yang tersedia pada SNA untuk pengukuran terhadap jaringan, ide utama pendeteksian berdasarkan tiga hal berikut
1. frekuensi komunikasi antar individu,
2. banyaknya komunikasi dua arah antar individu (reciprocal)
3. struktur atau kohesi dari komunitas yang ada di dalam jaringan tersebut.
Ide kami berdasarkan dari asumsi bahwa pada jaringan financial fraud terdapat irregularities atau ketidaknormalan dibandingkan dengan jaringan normal. Kondisi tidak normal bisa diterjemahkan sebagai kondisi dimana frekuensi komunikasi yang lebih tinggi dari biasanya, alur komunikasi yang reciprocal atau simetris antar aktor. Perubahan frekuensi komunikasi menjadi lebih tinggi dan reciprocal merupakan akibat perubahan struktur jaringan karena pelaku kejahatan melakukan koordinasi secara intensif.
Pada kasus financial fraud, posisi posisi central dalam suatu jaringan patut diawasi karena berpotensi kuat untuk
mempengaruhi individu lainnya. Selain itu posisi central mempunyai kecenderungan untuk memanipulasi lingkungannya karena mempunyai pengetahuan yang luas tentang bagaimana sistem perusahaan bekerja. Ada dua kemungkinan skenario yang berhubungan dengan posisi central, yaitu yang pertama seseorang yang mempunyai posisi central bekerja sendiri dalam melakukan kejahatan, yang kedua adalah beberapa orang pada posisi central melakukan kejahatan secara kolektif dan saling melindungi. Kejahatan kolektif bisa dideteksi dari metrik community detection yang berfungsi untuk melihat berapa banyak grup yang ada didalam jaringan, sehingga memudahkan kita mengawasi jaringan dengan mengecilkan jumlah individi yang harus dicurigai. Secara umum pencegahan financial fraud bisa dilakukan dengan bantuan metrik centrality dan community detection.
Jika kejahatan financial fraud telah terjadi, kita bisa menggunakan pengukuran ego-centric network untuk melacak aliran hasil kejahatan atau diseminasi informasi dari pelaku yang ke alter ego-centric network pelaku tersebut. Probabilitas terbesar adalah alter langsung dari pelaku atau mereka yang ada pada level-1 ego-centric network.
Tabel 1. Peran metrik SNA pada deteksi financial fraud
Metrik SNA Fungsi
Tie Strenght Mengukur kekuatan hubungan antar karyawan
Reciprocity Mengukur rasio banyaknya hubungan timbal balik antar karyawan dalam suatu perusahaan
Transitivity Mengukur kecenderungan terbentuknya hubungan baru antar dua karyawan yang terhubung dengan satu karyawan yang sama Ego-centric
Network
Mengukur sifat atau properti jaringan dimulai dari satu karyawan tertentu yang kita curigai sebagai pelaku
Centrality Mengukur karywan yang mempunyai peran central dalam satu perusahaan
Community Detection
Mendeteksi kelompok karyawan, baik jumlah dan karakteristiknya dalam satu perusahaan
III. SIMULASI
Simulasi pada paper ini menggunakan dataset anonim facebook undirected network sebanyak 333 individu (node) dan 2509 hubungan (edge). Dataset
divisualisasikan pada gambar 3. Degree average adalah sebesar 15,129 dan maksimum degree adalah 77. Node dengan degree diatas 60 sebanyak 11 node (3.3%) dan edges sebanyak 54 (2.14%). Urutan node dengan degree diatas 60 dapat dilihat pada pada tabel 2.
Tabel 2. Degree node lebih besar dari 60, dengan informasi nilai BC = Betweeness Centrality, CC = Closeness Centrality dan EC =
Eigenvector Centrality Node Degree BC CC EC 56 77 0.002 1 1 67 75 0.002 1 0.997 271 72 0.002 1 0.977 322 71 0 0.909 0.82 25 68 0.002 1 0.789 26 67 0.002 1 0.938 252 64 0.002 1 0.892 277 64 0.002 1 0.826 21 64 0.002 1 0.817 122 62 0.002 1 0.836 119 61 0 0.909 0.691
gambar 3. visualisasi dataset menggunakan algoritma Fruchterman-Reingold (atas) dan Force Atlas (bawah) pada Gephi. Degree
Untuk penelurusan kejahatan dengan analisa ego-centric network, kami menggunakan node 56 sebagai dasar node ego dengan alasan node tersebut adalah node dengan degree terbesar dan nilai centrality (BC, CC dan EC) terbesar (tabel 2). Kami asumsikan node 56 adalah aktor yang mempunyai peran penting dan kemungkinan merupakan pelaku kejahatan. Asumsi kami juga berdasarkan perhitungan bahwa jika pelaku adalah node lain maka skala kerugian tidak akan sebesar node 56. Analisa ego-centric network level 1 dan 2 dari node 56 bisa dilihat pada gambar 4. Untuk level 1 terdapat 78 (23,42%) node dan 1074 (41,56%) edge. Untuk level 2 terdapat 192 (57,66%) node dan 1952 (77,49%) edge.
gambar 4. ego-centric level-1 (atas) dan level-2 (bawah) dari node 56
Dengan simulasi ego-centric network, kita mendapatkan hasil bahwa kita hanya perlu memeriksa sebesar 23,42%-57,66% dari keseluruhan karyawan yang kemungkinan terlibat kerjasama atau menerima aliran dana dari financial fraud. Persentase diatas adalah adalah persentase maksimum yang bisa kita peroleh (worst-case), untuk node yang lain maka persentase yang diperoleh akan lebih kecil.
Pencegahan financial fraud menggunakan pendekatan topologi jaringan SNA berdasarkan skenario di bab ll, adalah dengan menentukan dan menemukan komunitas komunitas yang ada pada suatu perusahaan. Komunitas terbentuk dari tie-strenght, reciprocity, transitivity, group cohesion. Dari simulasi kita berhasil menemukan 13 komunitas (gambar 4.) dengan persentase komposisi banyaknya node yang ada didalam komunitas tersebut seperti tercantum pada tabel 3 berikut ini.
Tabel 3. komunitas, persentase dan node dengan degree terbesar pada komunitas. Komunitas Persentase (%) Node dengan Degree Terbesar (a) Degree Node (a) 2 31,23 56 77 7 13,51 312 25 3 12,61 175 16 1 12,31 271 72 0 10,21 53 30 4 8,11 119 61 5 3,9 320 20 8 3 275 9 10 2,4 89 7 9 0,9 179 2 12 0,6 233 1 11 0,6 282 1 6 0,6 33 1
Node dengan degree terbesar pada tabel 2, mayoritas menjadi anggota komunitas 2, kecuali node 271 yang menjadi anggota komunitas 1. Hasil ini sudah bisa diduga, karena node dengan degree besar cenderung terhubung dengan node dengan degree besar lainnya. Komunitas 2 sering disebut sebagai giant component [4], karena mendominasi jaringan dan konektifitas yang antar anggota yang sangat kuat. Dengan terdeteksinya komunitas dalam jaringan dan node yang dominan di masing masing komunitas, kita pada akhirnya memperoleh lingkup pengawasan yang lebih kecil dan fokus. Dalam hal dataset diatas kita hanya perlu melakukan pengawasan ketat terhadap komunitas 1 & 2,
karena mempunyai node yang masuk ke dalam 10 besar node dengan degree terbesar (tabel 2.)
Pendekatan komunitas ini juga bisa dipakai untuk mendeteksi aliran kejahatan dengan menggunakan algoritma sebagai berikut
1. Memilih beberapa komunitas yang mempunyai node yang masuk ke dalam daftar node dengan degree terbesar.
2. Analisa ego-centric network pada komunitas di langkah 1, dengan node ego adalah node dengan degree terbesar
gambar 4. 13 komunitas pada dataset facebook dikelompokkan berdasarkan warna
IV. KESIMPULANDANSARAN
Metode yang kami tawarkan bertujuan untuk memperkecil ruang pencarian dan pencegahan kejahatan financial fraud. Metode ini membantu usaha usaha penyelidikan seperti proses audit dan digital forensics. Ide kami berdasar kepada asumsi bahwa struktur jaringan berubah drastis dengan adanya aktivitas kejahatan. Asumsi ini pada kenyatannya justru bisa terjadi sebaliknya dimana jaringan akan menjadi lebih “diam” atau berkurang interaksi dan frekuensi komunikasi karena adanya usaha untuk menjaga kerahasiaan.
Saran untuk penelitian selanjutnya adalah membangun model yang bisa mengakomodasi beberapa skenario / pattern pada topologi jaringan. Sedangkan untuk perbaikan paper ini, bisa dilakukan dengan menambahkan eksperimen menggunakan dataset kasus financial fraud sebenarnya, sehingga meningkatkan validitas metode.
DAFTAR PUSTAKA
[1] A. Barr, D. Serra. 2006. Culture and Corruption. Global Poverty Research Group. University of Oxford
[2] Takacs, P. Csapodi, K. Gyorgy-Takacs. 2011. Corruption as Deviant Social Attitude. Journal of Public Finance Quarterly No. 56 vol.1. num. 27-43. P.
[3] Newman, M.E.J. 2011. Network: An Introduction. Oxford University Press
[4] Waserman, S., Faust K. 1994. Social Network Analysis: Methods and Application. New York: Cambridge University Press
[5] Moustafa, W.E, Deshpande, A, Getoor, L. Ego-centric Graph Pattern Census. 2012. IEEE 28th
International Conference on Data Engineering [6] Gravonetter, M. The Strenght of Weak Ties.
1973. The American Journal of Sociology, 78: 1360 – 1380
[7] Molm, L., Schaeffer, D., Collet, J. 2007. The Value of Reciprocity. Social Psychology Quaterly, 70: 199-217
[8] Marsden, P. 2002. Egocentric and Sociocentric Measures of Network Centrality. Social Networks, 24: 407-422
[9] S. Fortunato. 2010. Community Detection in Graph. Physics Report 486:75-174