1 IMPLEMENTASI ALGORITMA C4.5 PADA PEMILIHAN SAHAM
MANUFAKTUR DI BURSA EFEK INDONESIA
Febriyanno Suryana, S.Kom, MM, M.Kom
Universitas Putra Indonesia YPTK Padang Telp : (0751) 72427, Fax : (0751) 71913
Email : [email protected]
Abstrak - Penelitian ini bertujuan untuk : 1). Mengindentifikasi atribut-atribut yang akan memprediksi return positif atau negatif pada pemilihan saham perusahaan manufaktur, 2). Membuat model pada pemilihan saham perusahaan manufaktur, 3). Menghasilkan model berupa rules (pengetahuan) dan menguji model yang terbentuk. Manfaat yang di harapkan dari penelitian ini adalah : 1). Agar dapat dijadikan alat evaluasi untuk menilai apakah faktor fundamental perusahaan dengan algoritma C4.5 dapat mempengaruhi keputusan perusahaan. 2). Sebagai acuan dan pertimbangan dalam memprediksi keputusan yang berhubungan dengan keputusan investasi. Sampel dalam penelitian ini adalah perusahaan manufaktur di Bursa Efek Indonesia dari tahun 2008 – 2009 dengan jumlah sampel sebanyak 9 perusahaan. Jenis data yang digunakan adalah data sekunder yang bersumber dari ICMD (Indonesian Capital Market Directory) pada Bursa Efek Indonesia. Variabel yang digunakan adalah 3 variabel predictor dan 1 variabel target. Variabel predictor meliputi ; Price Earning Ratio, Price to Book Value dan Net Profit Margin sementara variable target adalah return saham. Metode Penelitian menggunakan teknik decision tree dengan algoritma C4.5 dan pengolahan data menggunakan software Rapidminer 5.3. Hasil penelitian mengatakan bahwa sampel yang sesuai kriteria berjumlah 8 perusahaan, sementara dari 4 variabel predictor yang menjadi akar adalah variabel Net Profit Margin dan menghasilkan 10 rules sebagai hasil dari pengolahan data.
Keywords : Decision Tree, Algoritma C4.5, Return Saham.
PENDAHULUAN
Perekonomian sebuah negara bisa dikatakan baik bila investasi yang dilakukan di negara tersebut berkembang dari waktu ke waktu. Salah satu bentuk dari investasi tersebut adalah investasi di pasar modal yang dalam hal ini adalah saham.
Bursa Efek Indonesia sebagai tempat dilakukannya transaksi jual beli saham menawarkan banyak pilihan dalam memilih saham
2 dihadapi dari setiap investasi yang
dilakukannya.
Terbitnya data laporan keuangan perusahaan sebagai bagian dari faktor fundamental perusahaan setiap tahunnya, tentu sangat ditunggu-tunggu oleh investor karena laporan keuangan merupakan salah satu bahan analisis dalam mempertimbangkan keputusan investasi. Jumlah data yang terakumulasi setiap waktunya tersebut pada akhirnya tentu melahirkan gunungan dan tumpukan data yang sangat banyak.
Namun seiring dengan perkembangan teknologi dan informasi dalam pengolahan data dewasa ini sudah dikenal bidang ilmu yang menjawab permasalahan tersebut yaitu Data mining. Data mining atau sering disebut knowledge discovery in database (KDD) adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam data ukuran besar. Menurut Pramudiono (2006) data mining merupakan serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual (Kusrini dan Luthfi, 2009).
Kemampuan data mining dalam menghasilkan pola berupa pengetahuan (rule), menarik perhatian berbagai kalangan, diantaranya adalah kalangan pasar modal. Data mining dengan teknik klasifikasi decision tree digunakan sebagai acuan bagi investor dalam memprediksi keputusan investasi, karena teknik tersebut dapat membedakan dengan jelas
karakteristik suatu data. Bagi investor yang melakukan investasi jangka panjang, faktor fundamental perusahaan merupakan faktor utama dalam melakukan analisis investasinya, hal ini dikarenakan kebanyakan investor lebih bersifat risk avoider daripada risk taker.
Berdasarkan uraian ringkas latar belakang diatas, penulis tertarik untuk melakukan penelitian dengan menggunakan salah satu teknik data mining yakni klasifikasi pada pohon keputusan (decision tree) menggunakan algoritma C4.5. Tujuannya agar dapat membentuk sebuah model dan menguji model tersebut, sehingga pengetahuan yang diperoleh dari model tersebut dapat digunakan sebagai prediksi dan acuan dalam memilih saham. Sementara data yang digunakan adalah data perusahaan manufaktur. Dipilihnya saham-saham industri tersebut karena jumlah perusahaan sektor tersebut menunjukkan populasi terbesar di Bursa Efek Indonesia (Arista, dkk. 2012). Perumusan Masalah
Berdasarkan latar belakang yang dikemukakan diatas, maka dapat dirumuskan pertanyaan yang akan dijawab dalam penelitian ini, yaitu :
1. Bagaimana faktor fundamental perusahaan / kinerja keuangan perusahaan memprediksi return positif atau negatif bagi
investor ?
3 LANDASAN TEORI
Data Mining
Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Menurut Pramudiono (2007) Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Wirdasari, 2011 dan Calam, 2011).
Menurut Han J dan Kamber, M (2006) Data mining merupakan penggalian atau “penambangan” pengetahuan dari sejumlah besar data. Data mining merupakan bagian dari proses Knowledge Discovery
from Data (KDD). Penemuan
pengetahuan sebagai suatu proses memiliki urutan sebagai berikut :
1. Data Cleaning
Untuk menghilangkan noise dan data yang tidak konsisten. 2. Data Integration
Dimana beberapa sumber data dapat dikombinasikan.
3. Data Selection
Dimana data yang relevan dengan penelitian yang diambil. 4. Data Transformation
Dimana data diubah dan dikonsolidasikan kedalam bentuk yang sesuai untuk
pertambangan dengan
melakukan operasi ringkasan atau agregasi.
5. Data Mining
Proses essensial dimana metode cerdas yang diterapkan dalam rangka untuk mengekstrak pola data.
6. Pattern Evaluation
Untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan.
7. Knowledge Presentation
Dimana visualisasi dan teknik representasi pengetahuan digunakan untuk menyajikan pengetahuan kepada pengguna.
Gambar 1. Langkah – langkah dalam menemukan pengetahuan.
Decision Tree
Decision tree merupakan suatu pendekatan yang sangat popular dan praktis dalam machine learning untuk menyelesaikan permasalahan klasifikasi. Pada decision tree terdapat 3 jenis node, yaitu :
a. Root Node, merupakan node paling atas, pada node ini tidak ada input dan bisa tidak mempunyai output atau mempunyai output lebih dari satu.
b. Internal Node, merupakan node percabangan, pada node ini hanya terdapat satu input dan mempunyai output minimal. c. Leaf Node atau terminal node,
4 Konsep Decision tree adalah
mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule).
Algoritma C4.5
Algoritma C4.5 merupakan struktur pohon dimana terdapat simpul yang mendeskripsikan atribut–atribut, dimana setiap cabang menggambarkan hasil dari atribut yang diuji dan setiap daun menggambarkan kelas. Algoritma C4.5 secara rekursif mengunjungi setiap simpul keputusan, memilih pembagian yang optimal sampai tidak bisa dibagi lagi. Algoritma C4.5 menggunakan konsep
information gain atau entropy
reduction untuk memilih pembagian yang optimal (Han, 2006).
Return Saham
Tujuan investor berinvestasi adalah memaksimalkan return, tanpa melupakan faktor resiko investasi yang harus dihadapinya. Return merupakan salah satu faktor yang memotivasi investor berinvestasi dan juga merupakan imbalan atas keberanian investor menanggung resiko atas investasi yang dilakukannya (Tandelilin, 2010). Analisis Fundamental
Fundamental analysis (analisis fundamental) merupakan analisis mengenai ekonomi, industri, dan perusahaan yang menentukan nilai saham perusahaan. Analisis fundamental memfokuskan pada statistik laporan keuangan perusahaan untuk menentukan harga saham dinilai secara tepat. Sebenarnya, dalam menganalisis nilai suatu saham akan lengkap jika
menggabungkan analisis
fundamental dan analisis teknikal. Kebanyakan informasi fundamental memfokuskan pada statistik ekonomi, industri, dan perusahaan.
KERANGKA KERJA
Model kerangka kerja untuk pemecahan masalah yang akan digunakan dalam penelitian ini dapat dilihat pada gambar 2.
Gambar 2. Kerangka Kerja Penelitian
ANALISA DAN HASIL
5 naik, sementara return ”negatif”
berarti investor berpeluang untuk menjual sahamnya atau tidak membeli saham baru karena prediksi harga saham akan turun yang mengidentifikasikan return juga akan turun.
Data fundamental perusahaan yang diambil adalah data keuangan perusahaan manufaktur sektor industri barang konsumsi dengan bidang usaha makanan dan minuman tahun 2008-2009 yang bersifat data panel yaitu gabungan dari data time series dengan data cross section. Hal ini bertujuan karena analisis fundamental lebih bersifat analisis jangka panjang (long term period). Pemilihan Variabel
Data fundamental perusahaan yang dijadikan kriteria adalah sebagai berikut:
1. Price Earning Ratio (PER) 2. Price to Book Value (PBV) 3. Net Profit Margin (NPM)
Dari data-data tersebut, yang diambil sebagai variabel keputusannya adalah return yang bernilai “positif” atau “negatif”. Sedangkan yang diambil sebagai variabel penentu dalam pembentukan pohon keputusan adalah PER, PBV, NPM.
PER diperoleh dengan rumus :
Saham Lembar per
Laba arg H
PriceEarningRatio a Pasar Saham
PBV diperoleh dengan rumus :
Saham Buku Nilai arg H
Priceto BookValue a Pasar Saham
NPM diperoleh dengan rumus : Penjualan Total
arg
Profit M in LabaBersih
Net
Return diperoleh dengan rumus : 1) -n ( Saham Harga
) 1 ( arg
) ( arg
Return H aSaham n H aSaham n
Penerapan Data Mining
Data penelitian selanjutnya akan diproses dengan konsep data mining sesuai dengan tahapan dari proses Knowledge Discovery in Database (KDD) yang bertujuan untuk mengambil data dan membangun pola menggunakan algoritma C4.5.
Berikut adalah gambar langkah-langkah data mining yang akan dilakukan untuk mendapatkan pengetahuan (rule) :
Gambar 3. Langkah-langkah Data Mining
6 Tabel 1. Data Keuangan Hasil
Cleaning
Perhitungan Algoritma C4.5 Perhitungan algoritma C4.5 dilakukan setelah diperoleh hasil transformasi data yang dihasilkan dari data selection dan data cleaning, Secara umum algortima C4.5 membangun pohon keputusan adalah sebagai berikut:
1. Perhitungan Entropy dan Gain, dengan rumus ;
Keterangan:
S : Himpunan kasus n : jumlah partisi S
Pi : proporsi dari Si terhadap S
2. Pemilihan Gain tertinggi sebagai akar ( Node ), dengan rumus ;
Keterangan:
S : Himpunan kasus
A : atribut
n : jumlah partisi atribut A |Si| : jumlah kasus pada partisi ke-i
|S| : jumlah kasus pada S
3. Ulangi proses perhitungan
Entropy dan Gain untuk
mencari cabang sampai semua kasus pada cabang memiliki kelas yang sama yaitu pada saat semua variabel telah menjadi bagian dari pohon keputusan atau masing –masing variabel telah memiliki daun atau keputusan.
4. Membuat Rule berdasarkan pohon keputusan.
Dari perhitungan diperoleh hasil berupa decision tree seperti gambar berikut ;
Gambar 4. Pohon Keputusan Hasil Perhitungan C4.5
Berdasarkan pohon keputusan terakhir yang terbentuk pada gambar 4 di atas, maka pengetahuan atau rule yang terbentuk adalah sebagai berikut ;
7 2. If NPM dengan klasifikasi = 1
and PBV dengan klasifikasi = 1 and PER dengan klasifikasi = 1 Then return = negatif.
3. If NPM dengan klasifikasi = 1 and PBV dengan klasifikasi = 1 and PER dengan klasifikasi = 2 Then return = negatif.
4. If NPM dengan klasifikasi = 1 and PBV dengan klasifikasi = 1 and PER dengan klasifikasi = 3 Then return = negatif.
5. If NPM dengan klasifikasi = 2 and PER dengan klasifikasi = 2 Then return = positif
6. If NPM dengan klasifikasi = 2 and PER dengan klasifikasi = 3 Then return = negatif
7. If NPM dengan klasifikasi = 3 Then return = positif
8. If NPM dengan klasifikasi = 4 and PER dengan klasifikasi = 1 Then return = negatif
9. If NPM dengan klasifikasi = 4 and PER dengan klasifikasi = 2 Then return = positif
10. If NPM dengan klasifikasi = 4 and PER dengan klasifikasi = 3 Then return = positif.
IMPLEMENTASI DAN PENGUJIAN
Implementasi dilakukan untuk melihat hasil data mining dengan menggunakan bantuan tools. Implementasi yang akan dilakukan adalah implementasi data mining untuk menganalisa return yang dihasilkan dari perhitungan nilai setiap atribut kondisi dengan menggunakan bantuan tools Rapidminer 5.3. Pemilihan Rapidminer 5.3 dalam proses data
mining karena Rapidminer 5.3
mampu menghasilkan sebuah pohon
keputusan dengan menggunakan algoritma decision tree.
Berikut adalah data keuangan hasil transformasi yang akan diuji menggunakan tools Rapidminer 5.3 ;
Tabel 2. Data Keuangan Hasil Transformasi
Hasil perhitungan dengan tools Rapidminer 5.3 adalah seperti pada gambar berikut ;
Gambar 5. Tampilan Pohon Keputusan (Decision Tree)
Dari hasil perhitungan dengan tools Rapidminer 5.3 maka akan dilakukan pengujian dengan membandingkan hasil perhitungan manual dengan menggunakan tools Rapidminer 5.3.
8 terbentuk persis sama dan akurat
100% dari perhitungan manual. KESIMPULAN
1. Teknik klasifikasi decision tree dengan algoritma C4.5 dimana
menggunakan faktor
fundamental perusahaan sebagai atribut kondisi dapat digunakan untuk memprediksi return positif atau negatif bagi investor. 2. Pemilihan variabel (atribut kondisi dan atribut keputusan) yang akan digunakan dalam menentukan sebuah klasifikasi sangat mempengaruhi rule atau knowledge karena pola yang dihasilkan merupakan pemetaan dari nilai-nilai atribut yang dipilih (PER, PBV dan NPM). 3. Rule yang dihasilkan berasal dari
nilai atribut pada periode waktu tertentu (2008-2009) dan belum tentu tepat digunakan pada periode waktu lainnya.
4. Algoritma C4.5 dianggap sebagai algoritma yang sangat membantu dalam melakukan klasifikasi data karena karakteristik data yang diklasifikasi dapat diperoleh dengan jelas, baik dalam bentuk struktur pohon keputusan (decision tree) maupun dalam aturan rule If – Then sehingga memudahkan pengguna dalam melakukan penggalian informasi terhadap data yang digunakan.
DAFTAR PUSTAKA
Arista, Desy., Astohar. (2012). Analisis faktor-faktor yang mempengaruhi return saham. Jurnal Ilmu Manajemen dan
Akuntansi Terapan, Vol 3, No 1.
Han, Jiawei., Kamber, Micheline. (2006). Data Mining concepts and techniques. San Fransisco : Published Morgan Kaufmann. Kusrini, Luthfi. (2009). Algoritma
Data Mining. Yogyakarta : Penerbit Andi Offset.
Tandelilin, E (2010). Portofolio dan Investasi, teori dan aplikasi. Yogyakarta : Penerbit Kanisius.