• Tidak ada hasil yang ditemukan

BAB III METODOLOGI PE ELITIA

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB III METODOLOGI PE ELITIA"

Copied!
16
0
0

Teks penuh

(1)

24

BAB III

METODOLOGI PEELITIA

Metodologi yang digunakan dalam penelitian ini merujuk pada proses Knowledge Discovery in Database (KDD). KDD merupakan nama lain dari Data Mining yang biasa digunakan dalam jurnal ilmiah. Langkah-langkah yang terdapat dalam proses KDD dijelaskan dalam gambar 3.1.

Gambar 3.1 Proses Knowledge Discovery in Database [Sumber: Sheng 2002]

Proses KDD pada Gambar 3.1 terdiri dari lima tahap, yaitu:

1. Selection; merupakan tahap awal dimana database administrator (DBA) bekerjasama dengan domain expert untuk menyeleksi data yang dibutuhkan menjadi target data.

(2)

25

2. Cleaning & Preprocessing; pada tahap ini, DBA bekerjasama dengan data mining expert untuk membersihkan target data menjadi preprocessed data. 3. Transformation; sekali lagi, DBA bekerjasama dengan data mining expert

untuk men-transform preprocessed data menjadi transformed data yang siap untuk dianalisis.

4. Data Mining; pada tahap ini, data mining expert menganalisis data untuk menemukan pola yang terdapat di dalamnya.

5. Interpretation & Evaluation; pada tahap terakhir, domain expert menerjemahkan dan mengevaluasi pola yang terdapat di dalam data sehingga diperoleh knowledge.

Bab ini menjelaskan implementasi proses KDD pada penelitian. Dimulai dengan menjelaskan model penelitian yang digunakan. Kemudian, penjelasan tentang tahap ke-1 sampai ke-3 proses KDD yang mencakup data penelitian, mulai dari sumber data sampai menjadi data yang siap untuk dianalisis. Implementasi tahap ke-4 dan ke-5 proses KDD dijelaskan secara lengkap dalam bab selanjutnya.

1.10 Selection

Selection merupakan tahap awal dimana database administrator (DBA) bekerjasama dengan domain expert untuk menyeleksi data yang dibutuhkan menjadi target data. Data yang dipilih terkait dengan model penelitian yang digunakan. Penelitian ini menggunakan Model Broda sebagai model penelitiannya. Model Broda terdiri dari 4 variabel, yaitu: terms-of-trade, nilai tukar riil, indeks harga konsumen, dan produk domestik bruto riil.

(3)

26

Model dalam penelitian ini menggunakan model penelitian Broda sebagai dasarnya. Broda meneliti peranan sistem nilai tukar dalam merespon dampak penurunan harga komoditi ekspor sebesar 10% terhadap PDB riil di 75 negara sedang berkembang. Broda mengklasifikasikan negara-negara sedang berkembang berdasarkan sistem nilai tukar yang diterapkan di masing-masing negara. Penelitian Broda menyimpulkan bahwa PDB riil negara-negara sedang berkembang yang menggunakan sistem nilai tukar mengambang tidak terpengaruh secara signifikan (hanya sebesar 0,2%) terhadap penurunan harga komoditi ekspor. Namun, hal sebaliknya terjadi pada negara-negara sedang berkembang yang menggunakan sistem nilai tukar tetap di mana PDB riil negara-negara tersebut mengalami penurunan sebesar 2% setelah terjadinya penurunan harga komoditi ekspor [Broda 2003].

Model penelitian Broda yang terdiri dari empat variabel (Terms-of-Trade, nilai tukar riil, indeks harga konsumen, dan produk domestik bruto riil) diadaptasi sedemikian rupa sehingga menjadi sistem persamaan sebagai berikut:

dimana:

TOT : terms of trade

RER : nilai tukar riil (real exchange rate)

CPI : indeks harga konsumen (consumer price index)

RGDP : produk domestik bruto riil (real gross domestic product) ε : error terms TOTt 1 -t 14 1 -t 13 1 -t 12 1 -t 11 t 14 t 13 t 12 10

t a -a RER -a CPI -a RGDP α TOT α RER α CPI α RGDP ε

TOT = + + + + + RERt 1 -t 24 1 -t 23 1 -t 22 1 -t 21 t 24 t 23 t 21 20

t a -a TOT -a CPI -a RGDP α TOT α RER α CPI α RGDP ε

RER = + + + + + CPIt 1 -t 34 1 -t 33 1 -t 32 1 -t 31 t 34 t 32 t 31 30

t a -a TOT -a RER -a RGDP α TOT α RER α CPI α RGDP ε

CPI = + + + + + RGDPt 1 -t 44 1 -t 43 1 -t 42 1 -t 41 t 43 t 42 t 41 40

t a -a TOT -a RER -a CPI α TOT α RER α CPI α RGDP ε

(4)

27

sistem persamaan VAR di atas, dengan menggunakan aljabar matriks, dapat ditulis sebagai berikut:

atau

dengan asumsi bahwa A selalu mempunyai invers, maka dengan mengalikan -1

A

pada persamaan di atas sehingga diperoleh:

atau

dengan mendefinisikan notasi bi0 merupakan elemen i dari vektor B0, bij

merupakan elemen yang mewakili baris i dan kolom j matriks B1, dan eit merupakan elemen i vektor et, maka persamaan tersebut dapat ditulis kembali sebagai berikut:

{

1

4 2

4

4

4 3

4

4

1

42

43

1

2

3

3

2

1

4

4

4

3

4

4

4

2

1

t t t t t 1 -t 1 0 t ε RGDP CPI RER TOT x -1 t -1 t -1 t -1 t Γ 22 21 14 13 12 11 Γ 40 30 20 10 x A

ε

ε

ε

ε

RGDP

CPI

RER

TOT

α

α

α

α

α

α

α

α

α

α

α

α

α

α

α

α

a

a

a

a

RGDP

CPI

RER

TOT

a

a

a

a

a

a

a

a

a

a

a

a

+

+

=

1

1

1

1

44 43 42 41 34 33 32 31 24 23 43 42 41 34 32 31 24 23 21 14 13 12 t 1 -t 1 0 t Γ Γ x ε Ax = + + t 1 -t 1 0 t B B x e x = + +

{ {

{ {

t 1 -t 1 0 t e t -1 x 1 -t B -1 B -1 x t 1 -1

ε

A

x

A

A

x

A

A

=

Γ

0

+

Γ

1

+

3

2

1

3

2

1

(5)

28

Sistem persamaan VAR inilah yang akan digunakan sebagai model penelitian. Fokus pembentukan sistem persamaan VAR selanjutnya terletak pada koefisien dan parameter masing-masing variabel serta penentuan lag optimal (lag 1 dalam sistem persamaan di atas hanya berfungsi untuk menunjukkan adanya hubungan auto-regressive dan tidak menunjukkan bahwa lag 1 merupakan lag optimal sistem persamaan VAR) [Pyndick & Rubinfeld 1998].

1.11 Cleaning & Preprocessing

Pada tahap cleaning dan preprocessing ini, DBA bekerjasama dengan data mining expert untuk membersihkan target data menjadi preprocessed data.

Data yang digunakan dalam penelitian adalah data kwartalan dari kwartal pertama tahun 1999 sampai dengan kwartal ke-4 tahun 2007. Periode ini dipilih karena sudah tergolong stabil setelah krisis ekonomi tahun 1997 – 1998. Data tersebut diperoleh, baik mentah maupun olahan, dari buletin-buletin statistik terbitan Biro Pusat Statistik (BPS) dan International Financial Statistic (IFS) terbitan International Monetary Fund (IMF).

TOTt 1 -t 14 1 -t 13 1 -t 12 1 -t 11 10

t b b TOT b RER b CPI α RGDP ε

TOT = + + + + + RERt 1 -t 24 1 -t 23 1 -t 22 1 -t 21 20

t b b TOT b RER b CPI b RGDP ε

RER = + + + + + CPIt 1 -t 34 1 -t 33 1 -t 32 1 -t 31 30

t b b TOT b RER b CPI b RGDP ε

CPI = + + + + + RGDPt 1 -t 44 1 -t 43 1 -t 42 1 -t 41 40

t b b TOT b RER b CPI b RGDP ε

(6)

29

Data variabel TOT menggunakan data olahan dari Buletin Perdagangan Luar Negeri (Ekspor dan Impor) berbagai terbitan BPS, yang dapat diakses melalui http://www.bps.go.id, dengan menggunakan rumus [Salvatore 1998]:

dimana:

N : terms-of-trade

PX : indeks harga komoditi ekspor

PM : indeks harga komoditi impor

Buletin Perdagangan Luar Negeri (Ekspor dan Impor) terbitan BPS tidak menyediakan data indeks harga komoditi ekspor (PX) dan indeks harga komoditi

impor (PM). Buletin statistik tersebut menyediakan total nilai ekspor (VX), total

nilai impor (VM), total volume ekspor (QX), dan total volume impor (QM).

Penghitungan indeks harga komoditi ekspor dihitung dengan menggunakan rumus:

dimana:

PX : indeks harga komoditi ekspor

VX : total nilai komoditi ekspor

QX : total volume komoditi ekspor

100 × = M X P P 5 X X X Q V P =

(7)

30

Sementara penghitungan indeks harga komoditi impor dihitung dengan menggunakan rumus:

dimana:

PM : indeks harga komoditi impor

VM : total nilai komoditi impor

QM : total volume komoditi impor

Data variabel RER berasal dari International Financial Statistic (IFS) terbitan International Monetary Fund (IMF) yang dapat di-download melalui http://imfstatistics.org/imf dan diolah dengan menggunakan rumus:

dimana:

RER : Nilai Tukar Riil (Real Exchange Rate)

WPIUSA : Indeks Harga Perdagangan Besar (Wholesales Price

Index) Amerika

WPIINA : Indeks Harga Perdagangan Besar (Wholesales Price

Index) Indonesia

NER : Nilai Tukar Nominal (;ominal Exchange Rate)

Selain RER, data CPI juga dapat di-download melalui website yang sama, perbedaannya adalah data CPI sudah tersedia sehingga tidak perlu diolah lagi.

5ER WPI WPI RER I5A USA × = M M M Q V P =

(8)

31

Seperti data variabel RER, data variabel RGDP juga diolah dari IFS terbitan IMF dengan menggunakan rumus:

dimana:

RGDP : Produk Domestik Bruto Riil (Real Gross Domestic Product) NGDP : Produk Domestik Bruto Nominal (;ominal Gross Domestic

Product)

GDP Deflator : Deflator Produk Domestik Bruto

1.12 Transformation

Pada tahap ketiga, Transformation, DBA bekerjasama dengan data mining expert untuk men-transform preprocessed data menjadi transformed data yang siap untuk dianalisis. Tahapan penelitian selanjutnya adalah memastikan data penelitian berada dalam kondisi stasioner. Data time-series berada dalam kondisi stasioner jika rata-rata dan auto-kovarians data tersebut tidak dipengaruhi oleh waktu. Uji stasioneritas data berguna untuk mencegah terjadinya regresi palsu (spurious regression). Cara yang paling mudah untuk melihat stasioneritas data time-series adalah dengan melihat pergerakan data tersebut. Jika terlihat adanya trend dalam pergerakan data seiring berjalannya waktu, maka dapat diduga bahwa data tersebut tidak stasioner (nonstationary). Jika pada tingkat level data masih tidak stasioner, maka data harus di-transform ke tingkat difference.

100 × = Deflator GDP 5GDP RGDP

(9)

32

Gambar 3.2 sampai 3.5 memperlihatkan pergerakan data keempat variabel (TOT, RER, CPI, dan RGDP) selama periode kwartal pertama tahun 1999 sampai kwartal ke-4 tahun 2007.

Gambar 3.2 Grafik Pergerakan Data TOT Periode 1999.1 – 2007.4

[Sumber: diolah dari Buletin Statistik Perdagangan Luar Negeri (Ekspor dan Impor) BPS]

Pergerakan data TOT dalam Gambar 3.2 menunjukkan adanya fluktuasi sepanjang periode tahun 1999 sampai dengan tahun 2007. Walaupun sempat turun drastis pada pertengahan tahun 2000, TOT kembali naik dan cenderung menurun sejak pertengahan tahun 2002 sampai tahun 2007.

(10)

33

Gambar 3.3 Grafik Pergerakan Data RER Periode 1999.1 – 2007.4 [Sumber: diolah dari International Financial Statistics IMF]

Pergerakan data RER, seperti dapat dilihat dalam gambar 3.3, menunjukkan adanya depresiasi pada tahun 2001. Depresiasi adalah melemahnya nilai tukar mata uang suatu negara terhadap mata uang negara lain. Sebaliknya, jika nilai tukar mata uang suatu negara menguat terhadap mata uang negara lain, maka dikenal dengan istilah apresiasi. Pergerakan data RER setelah tahun 2001 cenderung stabil sampai tahun 2005 yang diikuti dengan apresiasi sampai tahun 2007. Apresiasi ini diduga disebabkan oleh menurunnya pertumbuhan di Amerika Serikat.

(11)

34

Gambar 3.4 Grafik Pergerakan Data CPI Periode 1999.1 – 2007.4 [Sumber: diolah dari International Financial Statistics IMF]

Trend meningkat juga terjadi pada variabel CPI. Gambar 3.4 menunjukkan terjadinya kecenderungan ini selama periode kwartal pertama tahun 1999 sampai kwartal ke-4 tahun 2007. Peningkatan CPI, atau Indeks Harga Konsumen (IHK), biasa dikenal dengan istilah inflasi. Sebaliknya, penurunan CPI dikenal dengan istilah deflasi. Peningkatan CPI paling signifikan terjadi pada tahun 2005 yang terjadi karena adanya dua kali peningkatan harga BBM dalam kurun waktu setahun.

(12)

35

Gambar 3.5 Grafik Pergerakan Data RGDP Periode 1999.1 – 2007.4 [Sumber: diolah dari International Financial Statistics IMF]

Tidak berbeda dengan data variabel RER dan CPI, kecenderungan peningkatan juga ditemui pada data variabel RGDP. Gambar 3.5 yang terlihat berundak-undak menunjukkan adanya pola musiman yang mencapai puncak pada kwartal ke-3 setiap tahunnya.

Kesimpulan yang dapat diambil dari grafik 3.2 – 3.5 adalah ditemukan adanya trend meningkat pada data variabel CPI dan RGDP. Data variabel TOT dan RER juga menunjukkan masih adanya trend dalam pergerakan datanya yang fluktuatif. Oleh karena itu, dapat diduga bahwa pergerakan data beberapa variabel masih bersifat non-stasioner.

Uji stasioneritas data dengan cara melihat ada tidaknya trend seperti di atas tidak dapat dijadikan sebagai patokan karena bersifat subyektif. Cara lain yang dapat dilakukan dan menghasilkan kesimpulan yang dapat dipercaya adalah dengan melakukan unit root test. Uji ini akan melihat ada tidaknya unit root yang merupakan indikasi kestasioneran data time-series.

Uji kestasioneran data dalam penelitian ini menggunakan uji Phillips-Perron (PP). Tabel 3.1 memperlihatkan hasil uji PP terhadap keempat variabel

(13)

36

pada tingkat level dengan mengikutsertakan trend dan intercept dalam pengujian. Hasil uji ini menyimpulkan bahwa data keempat variabel bersifat non-stasioner.

Oleh karena data masih bersifat non-stasioner pada tingkat level, maka tahap berikutnya adalah melakukan uji PP pada tingkat 1st difference dengan hanya mengikut sertakan intercept dalam pengujian. Uji ini hanya menyertakan intercept dalam pengujian karena trend sudah hilang akibat proses diferensiasi. Hasil yang diperoleh, seperti terlihat pada tabel 3.2, menyimpulkan bahwa data keempat variabel sudah bersifat stasioner dengan tingkat keyakinan di atas 99%. Jadi, tahapan data mining dalam proses KDD dapat dilakukan pada tingkat 1st difference.

(14)

37 K ete ra n g an H0 : ad a u n it ro o t H1 : tid ak a d a u n it ro o t T id ak S ig n if ik an p ad a se m u a tin g k at α tid ak d ap at m en o la k H 0 , ad a u n it ro o t, d ata n o n -s ta sio n er T id ak S ig n if ik an p ad a se m u a tin g k at α tid ak d ap at m en o la k H 0 , ad a u n it ro o t, d ata n o n -s ta sio n er T id ak S ig n if ik an p ad a se m u a tin g k at α tid ak d ap at m en o la k H 0 , ad a u n it ro o t, d ata n o n -s ta sio n er T id ak S ig n if ik an p ad a α = 1 % tid ak d ap at m en o la k H 0 , ad a u n it ro o t, d ata n o n -s ta sio n er K ete ra n g an H0 : ad a u n it ro o t H1 : tid ak a d a u n it ro o t S ig n if ik an p ad a se m u a tin g k at α H0 d ito la k , tid ak a d a u n it ro o t, d ata s ta sio n er S ig n if ik an p ad a se m u a tin g k at α H0 d ito la k , tid ak a d a u n it ro o t, d ata s ta sio n er S ig n if ik an p ad a se m u a tin g k at α H0 d ito la k , tid ak a d a u n it ro o t, d ata s ta sio n er S ig n if ik an p ad a se m u a tin g k at α H0 d ito la k , tid ak a d a u n it ro o t, d ata s ta sio n er 1 0 % -3 .2 0 4 6 9 9 -3 .2 0 4 6 9 9 -3 .2 0 4 6 9 9 -3 .2 0 4 6 9 9 1 0 % -2 .6 1 4 3 0 0 -2 .6 1 4 3 0 0 -2 .6 1 4 3 0 0 -2 .6 1 4 3 0 0 5 % -3 .5 4 4 2 8 4 -3 .5 4 4 2 8 4 -3 .5 4 4 2 8 4 -3 .5 4 4 2 8 4 5 % -2 .9 5 1 1 2 5 -2 .9 5 1 1 2 5 -2 .9 5 1 1 2 5 -2 .9 5 1 1 2 5 T es t C ritic a l V a lu es 1 % -4 .2 4 3 6 4 4 -4 .2 4 3 6 4 4 -4 .2 4 3 6 4 4 -4 .2 4 3 6 4 4 T es t C ritic a l V a lu es 1 % -3 .6 3 9 4 0 7 -3 .6 3 9 4 0 7 -3 .6 3 9 4 0 7 -3 .6 3 9 4 0 7 A D F T es t S ta ti stic L ev el -2 .8 5 2 6 8 1 -2 .4 8 8 7 8 7 -2 .6 2 9 2 7 7 -3 .9 3 3 8 8 5 P P T es t S ta ti stic 1 st D iffe re n ce -6 .6 8 9 9 2 6 -6 .3 0 4 6 6 3 -4 .8 7 9 8 6 5 -1 1 .5 8 4 2 6 T a b el 3 .1 Ph il li p s-Pe ro n Te st p ad a t in g k a t le ve l V ar ia b el T O T R E R IH K R G D P [s u m b er : L am p ir an 2 ] T a b el 3 .2 Ph il li p s-Pe rr o n Te st p a d a t in g k a t 1 st d if fe re n ce V ar ia b el T O T R E R IH K R G D P [s u m b er : L am p ir an 2 ]

(15)

38

1.13 Data Mining

Tahapan proses Knowledge Discovery in Database (KDD) selanjutnya adalah data mining. Penelitian ini menggunakan dua metode berbasiskan ilmu statistika dan ekonometrika. Metode tersebut adalah Vector Auto Regression (VAR) yang ditemukan oleh Christopher Sims dan General-to-Specific (GetS) Modelling yang ditemukan oleh David F. Hendry.

Tahapan data mining dalam proses KDD menggunakan VAR akan berfokus pada penentuan lag optimal yang masih stabil. Stabilitas sistem persamaan VAR dapat dilihat dari nilai inverse root karakteristik AR polinomialnya. Suatu sistem persamaan VAR tergolong stabil jika seluruh roots-nya memiliki modulus lebih kecil dari satu dan semuaroots-nya terletak dalam unit circle. Penentuan lag optimal akan menggunakan kriteria informasi yang tersedia, seperti: Likelihood Ratio (LR), Final Prediction Error (FPE), Akaike Information Criterion (AIC), Schwarz Information Criterion (SIC), dan Hannan-Quinn Information Criterion (HQ). Jika kriteria-kriteria tersebut hanya mengacu pada sebuah lag sebagai pilihan, maka lag tersebut adalah lag optimal. Namun, jika menghasilkan beberapa lag sebagai pilihan, maka lag optimal akan dipilih dari sistem persamaan VAR yang memiliki nilai adjusted R2 paling tinggi pada variabel-variabel utama dalam sistem persamaan.

Penelitian ini juga menggunakan GetS Modelling sebagai metode data mining. GetS Modelling dipilih karena diduga lebih baik daripada VAR dalam memprediksi. VAR memiliki kecenderungan menggeneralisir lag pada sistem persamaan yang terbentuk. Pada GetS, suatu persamaan akan dianalisis secara khusus. Sehingga, persamaan tersebut diperkenankan memiliki lag yang tidak

(16)

39

sama. Namun demikian, persamaan yang diperoleh melalui GetS Modelling tetap memenuhi aturan-aturan yang terdapat dalam ilmu statistika dan ekonometrika.

Data mining menggunakan Vector Auto Regression (VAR) dan General-to-Specific (GetS) Modelling akan dibahas lebih dalam pada bab selanjutnya.

Gambar

Gambar 3.1 Proses Knowledge Discovery in Database  [Sumber: Sheng 2002]
Gambar 3.2 sampai 3.5 memperlihatkan pergerakan data keempat variabel  (TOT, RER, CPI, dan RGDP) selama periode kwartal pertama tahun 1999 sampai  kwartal ke-4 tahun 2007
Gambar 3.3 Grafik Pergerakan Data RER Periode 1999.1 – 2007.4  [Sumber: diolah dari International Financial Statistics IMF]
Gambar 3.4 Grafik Pergerakan Data CPI Periode 1999.1 – 2007.4  [Sumber: diolah dari International Financial Statistics IMF]
+3

Referensi

Dokumen terkait

The result of this research showed that financial knowledge and education level have unsignifficant effect on the behavior of family financial management meanwhile financial

Kalau dia melayani anggota lebih baik maka anggota juga akan melayani umat atau orang yang harus dilayani dengan lebih baik pula.. Dalam konteks kongregasi itu berarti

Tujuan yang ingin dicapai dalam penelitian ini adalah untuk merancang media pembelajaran pengenalan flora dan fauna menggunakan action script 2.0.. Hasil penelitian

Apabila Pegawai Pencatat Perkawinan yang mewilayahi tempat tinggal suami atau istri berbeda dengan Pegawai Pencatat Perkawinan tempat perkawinan mereka

ADAM SYAFIQ

Analisa data dilakukan secara univariat dan bivariat, dimana analisa dilakukan untuk mengetahui gambaran gaya kepemimpinan seorang Kepala Puskesmas dalam menjalankan

Konsep harta benda perkawinan menurut Kitab Undang-Undang Hukum Perdata adalah persatuan harta, sebagaimana terdapat dalam pasal 119 yang berbunyi “mulai saat

Penelitian ini bertujuan untuk meneliti bagaimana cara perusahaan mengidentifikasi niche market, menentukan faktor yang penting untuk kesuksesan niche market, dan