BAB 3
METODOLOGI PENELITIAN
3.1 Umum
Sistem Peramal Cerdas Perilaku Kosumen adalah sebuah sistem yang bekerja
untuk meramal jenis barang apa yang sebenarnya akan dibeli atau dibutuhkan oleh
konsumen. Sehingga di dalam perancangannya diperlukan suatu metode yang tepat
berdasarkan data yang digunakan untuk mendapatkan hasil peramalan yang lebih
mendekati kondisi yang sebenarnya. Untuk mendapatkan metode yang lebih tepat
sebagai peramal perlu dilakukan analisis terhadap metode yang digunakan. Dalam
penelitian ini, metode yang dianalisis adalah metode regresi kuadratik dengan
tahapan-tahapan sebagai berikut:
1. Menentukan data yang digunakan pada Sistem Peramal Cerdas Perilaku
Konsumen
2. Menetapkan parameter pengukuran yang digunakan untuk menganalisis
kedekatan hasil peramalan terhadap nilai referensinya.
3. Menentukan metode yang digunakan untuk peramalan di dalam penelitian
4. Menentukan persamaan model peramalan terhadap metode yang digunakan
5. Menghitung besarnya nilai hasil peramalan dengan menggunakan
persamaan model yang telah ditentukan berdasarkan metode yang
digunakan dengan bantuan Program Excel.
6. Melakukan pengukuran nilai hasil peramalan dengan menggunakan
parameter pengukuran yang telah ditetapkan
7. Membandingkan hasil pengukuran nilai peramalan dari metode yang
dipilih terhadap hasil pengukuran nilai peramalan dari metode-metode lain
yang telah diteliti sebelumnya.
Secara keseluruhan, metodologi penelitian yang dilakukan untuk peningkatan
kinerja Sistem Peramal Cerdas Perilaku Konsumen ini dapat dilihat pada Gambar 3.1.
Dari diagram alir pada Gambar 3.1 terlihat bahwa di awal proses penelitian, data yang
diambil dari U.S. Bureau of Labour Statistics (BLS) Consumer Price Index (CPI) [9]
harus dinormalisasi terlebih dahulu agar data yang akan diolah tidak terlalu menyebar
namun tidak mengurangi bobotnya terhadap data yang lainnya. Dimana data sampel
masukan yang dipilih adalah berupa data indeks best customer dan biggest customer
untuk masing-masing jenis demografi dari beberapa sub kategori produk telepon.
Proses selanjutnya adalah dengan memodelkan data masukkan tersebut ke dalam
bentuk model regresi kuadratik sehingga diperoleh model persamaan peramal untuk
perilaku konsumen. Persamaan model tersebut kemudian digunakan untuk
mendapatkan data output peramalan terhadap masing-masing data masukan berupa
indeks best customer dan biggest customer untuk setiap jenis demografi dari beberapa
Untuk mengukur tingkat keakuratan hasil peramalan, digunakanlah data indeks
average spending untuk setiap jenis demografi dari beberapa sub kategori produk
telepon sebagai pembanding terhadap data hasil peramalan tersebut. Parameter ukur
yang digunakan untuk melihat tingkat keakuratan hasil peramalan tersebut adalah
MSE (Mean of Square Error) dan R2 (Rsquare). Selanjutnya, untuk melihat tingkat
keberhasilan penelitian ini, peneliti membandingkan nilai MSE dan R2 yang diperoleh
pada penelitian ini yang menggunakan metode regresi kuadratik terhadap hasil MSE
dan R2 atas penggunaan metode lain yang pernah dilakukan oleh peneliti sebelumnya.
3.2 Metode Pengumpulan Data
Pada penelitian ini, data yang digunakan adalah data survei pasar yang sudah
diperoleh dari U.S. Bureau of Labour Statistics (BLS).Data surveipasar adalah satuan
konsumen yang dikategorikan dalam berbagai demografi berdasarkan pembelanjaan
konsumen atas berbagai produk [9].
3.3 Pemilihan Parameter Pengukuran
Di dalam pelaksanaan penelitian ini, peneliti mengamati nilai kedekatan hasil
peramalan dengan nilai referensi dari hasil penggunaan metode quadratic regression
(regresi kuadratik) dengan menggunakan bantuan Program Excel.
Nilai kedekatan hasil peramalan dengan nilai referensi dari penggunaan metode
quadratic regression (regresi kuadratik) yang akan digunakan sebagai pemroses
menggunakan parameter pengukuran MSE (Mean of Square Error)dan R2 (Rsquare).
MSE mengukur rata-rata pangkat dua dari kesalahan. Kesalahan adalah suatu nilai
yang diperoleh dari perbedaan nilai referensi dengan nilai yang diramal. Persamaan
MSE adalah seperti yang terlihat pada Persamaan (3.1).
Dimana y adalah nilai referensi, ypredict adalah nilai peramalan dan n adalah jumlah
data.
Di dalam regresi, R2 adalah suatu variabel statistikal yang mengukur bagaimana
garis regresi memperkirakan data point yang riil. Nilai R2 = 1 menunjukkan garis
regresi sangat sesuai dengan data [8]. Rumus untuk menghitung R2 ditunjukkan pada
Persamaan (3.2).
Dimana y adalah nilai referensi, ypredict adalah nilai peramalan dan n adalah jumlah
data.
3.4 Penggunaan Metode Regresi Kuadratik
Metode regresi kuadratik adalah merupaka metode yang dianalisis pada
penelitian ini. Metode ini digunakan sebagai unit pemrosesan tahap awal pada Sistem
digunakan pada Sistem Peramal Cerdas Perilaku Konsumen yang sebelumnya. Sistem
Peramal Cerdas Perilaku Konsumen yang diusulkan dapat dilihat pada Gambar 3.2.
Dengan penggunaan metode ini diharapkan dapat meningkatkan kinerja Sistem
Peramal Cerdas Perilaku Konsumen yang sebelumnya.
Sebagaimana pada Gambar 3.2, Sistem Peramal Cerdas Perilaku Konsumen
yang diusulkan menggunakan dua tahap pemrosesan, yaitu: pada pemrosesan awal
menggunakan metode regresi kuadratik dan pada pemrosesan tahap berikutnya
menggunakan Ordinal Structure Fuzzy Model (OSFM).
Gambar 3.2. Diagram blok Sistem Peramal Cerdas Perilaku Konsumen
yang diusulkan
Masukan untuk Sistem Peramal Cerdas Perilaku Konsumen berupa data
demografi yang dipilih. Keluaran dari tingkat pemrosesan awal adalah berupa data
indeks dari sub produk yang paling disukai oleh konsumen.
Pada tahap pemrosesan berikutnya, data keluaran dari masing-masing jenis
demografi dari unti pemroses tahap awal dijadikan sebagai masukan untuk unit
Ordinal Structure Fuzzy Model (OSFM). Keluaran dari tahap pemrosesan ini yang
juga merupakan hasil akhir dari Sistem Peramal Cerdas Perilaku Konsumen adalah
berupa perioritas produk atau produk yang paling tepat untuk memenuhi kebutuhan
BAB 4
HASIL PEMBAHASAN DAN ANALISA DATA
4.1 Penentuan Persamaan Peramal Perilaku Konsumen
Pada tesis ini, penulis mengambil contoh data kategori produk telepon yang
bersumber dari U.S. Bureau of Labour Statistics (BLS) Consumer Price Index (CPI)
[9] sebagaimana pada Lampiran-1 untuk proses simulasi peramalan. Data tersebut
memiliki 4 tipe sub kategori produk, yaitu : cellular phone service (tipe-1), phone
cards (tipe-2), residential telephone service and pay phones (tipe-3) dan telephones,
answering machines, and accessories (tipe-4) untuk 6 jenis demografi. Dimana untuk
jenis demografi umur (age) memiliki 7 variasi, pendapatan (income) memiliki 7
variasi, tipe keluarga (type of household) memiliki 8 variasi, ras (race) memiliki 4
variasi, daerah tempat tinggal (region) memiliki 4 variasi dan latar belakang
pendidikan (education) memiliki 7 variasi. Sehingga total variasi data untuk
masing-masing data best customer dan biggest customer berjumlah 148 variasi data yang
terdiri dari 28 variasi data untuk jenis demografi umur (age), 28 variasi data untuk
jenis demografi pendapatan (income), 32 variasi data untuk jenis demografi tipe
keluarga (type of household), 16 variasi data untuk jenis demografi ras (race), 16
variasi data untuk jenis demografi daerah tempat tinggal (region), 28 variasi data
Data kemudian dinormalisasi untuk kebutuhan pengolahan sehingga diperoleh
tabel data kategori produk telepon seperti pada Lampiran-2. Dari data pada
Lampiran-2 diperoleh data best customer (x1), biggest customer (x2) dan average
spending (Y) seperti pada Tabel 4.1 yang kemudian digunakan untuk penentuan
persamaan peramalan pada tesis ini.
Tabel 4.1 Data demografi umur (age) untuk kategori produk telepon
Dimana:
1. Product id adalah sub produk pada kategori produk, seperti: 267 adalah
cellular phone service, 268 adalah phone card, 269 adalah residential
telephone service and pay phones dan 270 adalah telephones, answering
machines, and accessories.
2. Data type adalah variasi demografi, seperti: 1=age, 2=income,
3=household type, 4=race, 5=region dan 6=education.
3. Data type id adalah variasi masing-masing, seperti: variasi demografi
umur (age) adalah 1=Under age 25, 2=Age 25-34, 3=Age 35-44, 4=Age
45-54, 5= Age 55-64, 6=Age 65-74 dan 7=Age 75 and older.
Dengan menggunakan Persamaan (2.20) dari data pada Tabel 4.1 maka diperoleh
persamaan seperti pada Persamaan (4.1).
Dengan menggunakan metode eliminasi Gauss, maka diperoleh penyelesaian dari
Persamaan (4.1) adalah a0 = -0.4850, a1 = 11.1391, a2 = -6.0605, a3 = 21.4419,
a4 = -7.3597 dan a5= -0.8287. Dengan cara yang sama dan menggunakan bantuan
Program Matlab, maka diperoleh koefisien persamaan model untuk 6 jenis demografi
seperti pada Tabel 4.2.
Tabel 4.2 Nilai koefisien persamaan model untuk 6 jenis demografi
Dengan mensubstitusikan data pada Tabel 4.2 ke dalam Persamaan (2.16) maka
diperoleh persamaan peramal untuk 6 jenis demografi yang kemudian digunakan
untuk unit permosesan awal pada Sistem Peramal Cerdas Perilaku Konsumen seperti
pada Persamaan (4.2).
Dimana y1 adalah persamaan peramal untuk jenis demografi umur (age), y2 adalah
persamaan peramal untuk jenis demografi penghasilan (income), y3 adalah persamaan
peramal untuk jenis demografi tipe keluarga (type of house hold), y4 adalah
persamaan peramal untuk jenis demografi ras (race), y5 adalah persamaan peramal
untuk jenis demografi daerah tempat tinggal (region) dan y6 adalah persamaan
peramal untuk jenis demografi latar belakang pendidikan (education).
4.2 Eksperimen dan Hasil
Eksperimen ini dikembangkan berdasarkan data survei pasar dari U.S. Bureau
of Labour Statistics (BLS)[9]. Data survei pasar adalah unit atau set konsumen yang
terkelompokkan dalam variasi demografi yang berdasarkan pembelanjaannya pada
suatu produk. Pada eksperimen ini dianalisa data survei pasar dari U.S. Bureau of
Labour Statistics (BLS)[9], khususnya data jenis demografi umur (age) yang tertera
pada Tabel 4.1.
Berdasarkan data yang diberikan dari Tabel 4.1, diperoleh kurva korelasi data
average spending (Y) terhadap quadratic regression trendline average spending (Y)
seperti pada Gambar 4.1.
Berdasarkan Gambar 4.1 terlihat adanya korelasi secara kuadratik antara data
average spending (Yo) terhadap quadratic regression trendline average spending (Y).
Oleh karena itu pada eksperimen ini peneliti menggunakan metode regresi kuadratik
yang merupakan bagian dari multiple regressionuntuk mendapatkan ketepatan dalam
peramalan perilaku konsumen.
Gambar 4.1 Korelasi data average spending (Yo) terhadap quadratic
4.2.1 Simulasi Eksperimen
Untuk menentukan metode yang lebih mendekati ketepatan dalam meramal
tipe produk yang paling disukai untuk dibeli oleh konsumen berdasarkan latar
belakang demografinya, langkah awal yang harus diketahui adalah korelasi diantara
data input dan output referensi seperti pada Gambar 4.1.
Di dalam unit pemrosesan awal pada Sistem Peramal Cerdas Perilaku
Konsumen seperti pada Gambar 3.2, data best customer dan biggest customer
digunakan sebagai data input dan average spending digunakan sebagai data output
referensi. Data average spending digunakan sebagai data output referensi karena data
average spending dapat digunakan untuk menentukan potensi pasar dari produk atau
pelayanan di suatu area. Proses berikutnya adalah menghitung nilai output sebagai
suatu hasil peramalan untuk metode yang digunakan, dalam hal ini adalah metode
regresi kuadratik. Dan proses yang terakhir adalah menghitung selisih yang terjadi
antara data output referensi dengan data output hasil peramalan dengan
menggunakan parameter pengukuran MSE ( Mean of Square Error) dan R2 (R Square).
Data output peramalan yang memiliki nilai MSE terkecil dan R2 terbesar dijadikan
sebagai masukan untuk unit pemrosesan berikutnya dalam meramal perilaku
konsumen sebagaimana pada Gambar 3.2.
4.2.2 Hasil dan Diskusi
Dengan mensubstitusikan data best customer (x1) dan biggest customer (x2)
kategori produk telepon untuk masing-masing jenis demografi pada Persamaan (4.2)
diperoleh hasil peramalan seperti pada Tabel 4.3.
Tabel 4.3 Output hasil peramalan dengan metode regresi kuadratik untuk jenis demografi umur (age) pada kategori produk telepon
No Product
1. Product id adalah sub produk pada kategori produk, seperti : 267 adalah
telephone service and pay phones dan 270 adalah telephones, answering
machines, and accessories.
2. Data type adalah variasi demografi, seperti : 1=age, 2=income, 3= type of
household, 4=race, 5=region dan 6=education.
3. Data type id adalah variasi masing-masing, seperti: variasi demografi
umur (age) adalah 1=Under age 25, 2=Age 25-34, 3=Age 35-44, 4=Age
45-54, 5= Age 55-64, 6=Age 65-74 dan 7=Age 75 and older.
4. Category id adalah kategori produk, dimana 17 adalah kategori produk
telepon.
5. Ypredict quadratic adalah data output hasil peramalan dengan metode regresi
kuadratik.
Dimana output hasil peramalan untuk masing-masing jenis demografi pada kategori
produk telepon dapat dilihat pada Lampiran-3.
Untuk melihat kurva hasil peramalan menggunakan metode regresi kuadratik
berdasarkan Tabel 4.3 dapat dilihat pada Gambar 4.2.
Sedangkan untuk melihat perbandingan hasil peramalan (Ypredict quadratic) dengan
output referensi yang dalam penelitian ini adalah average spending (Yo) berdasarkan
Gambar 4.2 Kurva hasil peramalan dengan metode regresi kuadratik
Untuk menghitung nilai parameter pengukuran seperti MSE dan R2 dari data
kategori produk telepon pada masing-masing jenis demografi, dilakukan dengan
mensubstitusikan data output referensi (Yo) dan output hasil peramalan yang
menggunakan metode regresi kuadratik (Ypredict quadratic) sebagaimana pada Lampiran-3
ke dalam Persamaan (3.1) dan Persamaan (3.2) sehingga diperoleh data seperti pada
Tabel 4.4. Hasil perhitungan selengkapnya dapat dilihat pada Lampiran-4.
Nilai MSE dan R2 hasil peramalan dengan metode regresi kuadratik pada Tabel
4.4 jika dibandingkan dengan nilai MSE dan R2 dengan metode-metode yang
digunakan oleh peneliti sebelumnya, seperti: fuzzy logic [2], regresi linier dan
kuadratik murni [1] sebagaimana pada Tabel 4.5 dan Gambar 4.3 terlihat bahwa nilai
MSE dan R2 hasil peramalan dengan menggunakan metode regresi kuadratik memiliki
nilai MSE terkecil dan R2 terbesar.
Tabel 4.4 Nilai MSE dan R2 untuk masing-masing jenis demografi pada kategori produk telepon dengan metode regresi kuadratik
No Jenis Demografi Regresi Kuadratik
MSE R2
1 Age 0.03964 0.34200
Hal ini mengindikasikan bahwa peramalan dengan menggunakan metode
regresi kuadratik lebih mendekati nilai output referensi dibandingkan dengan
menggunakan metode-metode yang digunakan oleh peneliti sebelumnya.
Tabel 4.5 Perbandingan nilai MSE dan R2 untuk penggunaan metode regresi linier, regresi kuadratik, regresi murni kuadratik dan fuzzy logic
No Demographic
types
Regression Fuzzy
Logic
Linear Quadratic Purequadratic
MSE R2 MSE R2 MSE R2 MSE
1 Age 0.05620 0.06719 0.03964 0.34200 0.04047 0.32831 0.07447
2 Income 0.07510 0.06656 0.06067 0.24590 0.06113 0.24021 0.09593 3 Type HH 0.06863 0.13615 0.05012 0.36916 0.05404 0.31980 0.09290 4 Race 0.05743 0.04192 0.04293 0.28389 0.04338 0.27640 0.13761 5 Region 0.05749 0.00463 0.04032 0.30194 0.04032 0.30192 0.07834 6 Education 0.06544 0.00634 0.05336 0.18981 0.05368 0.18488 0.08027
Average 0.06338 0.05380 0.04784 0.28878 0.04884 0.27525 0.09325
BAB 5
PENUTUP
5.1 Kesimpulan
Dari hasil eksperimen ini maka dapat disimpulkan bahwa:
1. Nilai MSE dan R2 yang diperoleh dengan menggunakan metode regresi
kuadratik untuk masing-masing jenis demografi adalah: untuk jenis
demografi (1) umur (age) diperoleh MSE = 0.03964 dan R2 = 0.34200,
untuk jenis demografi (2) penghasilan (income) diperoleh MSE = 0.06067
dan R2 = 0.24590, untuk jenis demografi (3) tipe keluarga (type of
household) diperoleh MSE = 0.05012 dan R2 = 0.36916, untuk jenis
demografi (4) ras (race) diperoleh MSE = 0.04293 dan R2 = 0.28389,
untuk jenis demografi (5) daerah tempat tinggal (region) diperoleh MSE =
0.04032 dan R2 = 0.30194 dan untuk jenis demografi (6) latar belakang
pendidikan (education) diperoleh MSE = 0.05336 dan R2 = 0.18981.
2. Hasil peramalan menggunakan metode regresi kuadratik memiliki nilai
MSE terkecil dan R2 terbesar jika dibandingkan dengan nilai MSE dan R2
dari hasil peramalan dengan menggunakan metode fuzzy logic, regresi
3. Peramalan perilaku konsumen dengan menggunakan metode regresi
kuadratik lebih mendekati nilai output referensi dibandingkan dengan
menggunakan metode-metode yang digunakan oleh peneliti sebelumnya,
seperti: fuzzy logic, regresi linier dan regresi kuadratik murni.
5.2 Saran
Dari hasil penelitian ini, penulis menyarankan perlunya dilanjutkan penelitian
ini dengan melakukan pengukuran kinerja pada output Sistem Peramal Cerdas
Perilaku Konsumen, khususnya untuk penggunaan metode regresi kuadratik dan