BAB II
TINJAUAN PUSTAKA
2.1 State of The Art
Penelitian tentang pengenalan telapak tangan telah banyak yang melakukan penelitian. Tahun 2005 (1)Chen,Jian-Sheng; (2)Moon,Yui-Sheng; (3)Yeung,Hoi-Wo dengan jurnal berjudul ”Palmprint Authentication using Time
Series” meneliti telapak tangan dengan menggunakan metode Time Series.
Pengembangan yang dilakukan mengkombinasikan metode time series dengan representasi Simbolic Agregate Approximation (SAX) dan pencocokan Minimum
Distance (MINDIST) dengan tingkat akurasi 98,7%.
Tahun 2007, Penelitian verifikasi menggunakan garis-garis telapak tangan diteliti oleh I Ketut Gede Darma Putra dengan metode deteksi garis dan operasi blok. Jurnal ini juga memperkenalkan titik momen dua tahap dalam menentukan ROI square. Hasil pengujian menunjukkan sistem ini mampu memberikan unjuk kerja tinggi yaitu sekitar 97%.
Penelitian dengan “Palmprint Verification with Moments” dilakukan oleh (1)Ying-Han Pang; (2)Andrew T.B.J; (3)David N.C.L ekstraksi fitur menggunakan metode Three Orthogonal Moment dengan tingkat akurasi 95,75%.
Tahun 2010, Penelitian dengan judul “Palm Print Verification System” oleh D.B.L.Bong, R.N dan A. Joseph dengan metode Charge Coupled Device
(CCD) nilai EER dari sistem ini 15% tingkat akurasi yang diperoleh 87,4%.
Pengembangan yang dilakukan pada penelitian ini metode yang digunakan adalah metode time series dengan pendekatan polar sebagai ekstraksi fitur. Proses ROI (Region of Interest) menggunakan metode titik moment dua tahap. Proses verifikasi dilakukan dengan mencocokan representasi fitur telapak tangan menggunakan metode Normalized Euclidean Distance. Keputusan diambil berdasarkan suatu nilai ambang (treshlod) yang didapat melalui pengujian.
2.2 Biometrik
Biometrik berasal dari bahasa Yunani yaitu, bios artinya “hidup” dan metron berarti “ukuran”. Biometrik berarti mengukur karakteristik pembeda (distinguishing traits) pada badan atau perilaku seseorang yang digunakan untuk melakukan pengenalan secara otomatis terhadap identitas orang tersebut. Pengertian pengenalan secara otomatis pada definisi biometrik diatas adalah dengan menggunakan teknologi (computer), pengenalan terhadap identitas seseorang dapat dilakukan secara waktu nyata (realtime), tidak membutuhkan waktu berjam-jam atau berhari-hari untuk proses pengenalan.
Sistem biometrik memberikan pengakuan individu yang didasarkan pada beberapa jenis fitur atau karakteristik yang dimiliki oleh individu. Sistem biometrik bekerja dengan terlebih dahulu menangkap fitur, seperti rekaman suara sinyal digital untuk pengenalan suara, atau mengambil gambar warna digital untuk pengenalan wajah dan iris mata. Sampel ini kemudian berubah dengan menggunakan beberapa jenis fungsi matematika menjadi sebuah template biometrik. Template biometrik akan memberikan normalisasi, efisiensi dan sangat diskriminatif merepresentasi fitur tersebut, yang kemudian membandingkan dengan template lain untuk menentukan identitas. Kebanyakan sistem biometrik menggunakan dua model operasi. Pertama adalah modul pendaftaran untuk menambahkan template ke dalam database, dan yang kedua adalah identifikasi, dimana sebuah template dibuat untuk perbandinagn individu dan kemudian di cari dalam database.
Secara umum terdapat dua model sistem biometrik, yaitu sistem verifikasi (verification sistem) dan sistem identifikasi (identification sistem). Sistem verifikasi bertujuan untuk menerima atau menolak identitas yang diklaim oleh seseorang. Pengguna membuat klaim “positif” terhadap suatu identitas. Diperlukan pencocokan “satu ke satu” dari sample yang diberikan terhadap acuan (template) yang terdaftar atas identitas yang diklaim tersebut. Sistem verifikasi biasanya menjawab pertanyaan “apakah identitas saya sama dengan identitas yang saya klaim?”. Sistem identifikasi bertujuan untuk memecahkan identitas seseorang. Pengguna dapat “tidak memberi klaim atau memberi klaim implicit
negative” untuk identitas terdaftar. Diperlukan pencocokan “satu ke banyak”,
yaitu pencarian ke seluruh database identitas terdaftar. Sistem identifikasi biasanya menjawab pertanyaan “identitas siapakah ini”?
2.2.1 Jenis-jenis Biometrika
Terdapat banyak karakteristik biometrik yang ada dan digunakan dalam berbagai aplikasi. Setiap jenis biometrik memiliki kelebihan dan kekurangannya masing-masing, sehingga untuk penggunaannya disesuaikan dengan kebutuhan. Biometrik tidak ada yang dapat memenuhi kebutuhan semua aplikasi secara efektif, dengan kata lain tidak ada biometrik yang ”optimal”. Pemilihan penerapan biometrik ditentukan berdasarkan penggunaan aplikasi dan sifat-sifat yang dimiliki oleh suatu karakteristik.
Gambar 2.1: Contoh karakterisetik biometrik: a) DNA, b) telinga, c) wajah, d) thermogram wajah, e) thermogram tangan, f) urat nadi tangan, g) sidik jari, h) cara berjalan, geometri tangan, j)
Berikut ini adalah penjelasan singkat mengenai beberapa jenis biometrik yang umum digunakan:
a. DNA: Deoxyribose Nucleic Acid merupakan kode yang unik untuk setiap individu, kecuali untuk kembar identik memiliki pola DNA yang sama. DNA saat ini digunakan untuk aplikasi forensik untuk mengidentifikasi seseorang. Salah satu kelemahan utama biometrik dengan DNA adalah masalah real-time, karena untuk mengenali seseorang melalui DNA harus melalui metode kimia tertentu.
b. Telinga: Bentuk dan struktur daun telinga setiap orang berbeda-beda. Pendekatan dari pengenalan daun telinga ini adalah jarak dari lekukanlekukan pada daun telinga. Namun, karakteristik pada telinga dianggap kurang mewakili identitas seseorang.
c. Wajah: Pengenalan wajah merupakan metode yang cukup efektif, dan gambar wajah merupakan karakteristik biometrik paling umum yang digunakan untuk mengenali seseorang. Pendekatan yang paling banyak digunakan dalam face recognition ini didasarkan pada (i) lokasi dan bentuk bagian wajah, seperti mata, alis, hidung, bibir, dan dagu, serta hubungan ruangnya. atau (ii) analisis secara keseluruhan dari gambar wajah yang mewakili suatu wajah yang merupakan kombinasi dari beberapa bentuk wajah. Kelemahannya adalah pengambilan gambar dari sudut yang berbeda dan kondisi pencahayaannya.
d. Infrared thermogram wajah, tangan, urat nadi tangan: Pola panas yang teradiasi dari tubuh manusia merupakan karakteristik individual yang dapat ditangkap dengan kamera infra merah. Teknologi ini dapat digunakan untuk pengenalan secara tersembunyi. Sistem thermogram tidak memerlukan kontak fisik dan tidak dapat terganggu, namun pengambilan gambar sulit dilakukan pada lingkungan yang tidak terkontrol, di mana ada benda lain di sekitar tubuh yang mengeluarkan panas. Teknologi lain yang berhubungan adalah untuk mengenali struktur urat nadi pada punggung tangan.
e. Sidik Jari: Sidik jari merupakan metode yang paling banyak digunakan selama berabad-abad untuk identifikasi, dan keakuratannya telah ditunjukkan sangat tinggi. Sidik jari merupakan pola sudut dan lekukan pada permukaan ujung jari, yang pembentukannya terjadi pada tujuh bulan pertama perkembangan janin. Sidik jari akan berbeda pada setiap orang, bahkan pada kembar identik. Salah satu masalah pada sistem pengenalan sidik jari adalah dibutuhkannya sumber daya komputasi yang besar, terutama jika digunakan untuk identifikasi. Sidik jari juga diperkirakan akan menjadi tidak dapat digunakan untuk beberapa orang karena factor genetik, penuaan, lingkungan, atau alasan pekerjaan. Sebagai contoh, buruh kasar akan mempunyai banyak bekas luka pada sidik jarinya yang akan terus berubah.
f. Cara berjalan: Cara berjalan merupakan suatu biometrik spatio-temporal yang kompleks. Cara berjalan tidak terlalu berbeda antar individu, namun cukup membedakan untuk verifikasi pada aplikasi yang membutuhkan keamanan tingkat rendah. Cara berjalan merupakan biometrik kebiasaan g. Geometri tangan dan jari: Sistem pengenalan geometri tangan didasarkan
pada ukuran tangan manusia, yaitu bentuk, ukuran telapak tangan, dan panjang serta lebar jari-jari tangan. Tekniknya sederhana, relative mudah digunakan, dan tidak mahal. Faktor lingkungan tidak berpengaruh buruk pada sistem ini. Namun, geometri tangan tidak terlalu berbeda satu sama lain dan dapat berubah dalam masa pertumbuhan.
h. Iris: Iris adalah daerah anular pada mata yang diapit oleh pupil dan sclera (daerah putih mata) pada kedua sisinya. Textur visual dari iris terbentuk pada masa perkembangan janin dan menjadi stabil selama umur dua tahun pertama. Tekstur iris yang kompleks sangat membedakan satu sama lain dan berguna untuk pengenalan individual. Ketepatan dan kecepatan sistem pengenalan iris sangat meyakinkan dan memungkinkan untuk sistem identifikasi skala besar. Sistem ini juga sulit dipalsukan karena sangat sulit untuk mengubah tekstur iris melalui operasi. Meskipun demikian, sistem
pengenalan iris pada awalnya cukup rumit dan mahal. Namun, sistem yang baru sudah menjadi semakin praktis dan lebih efektif.
i. Telapak tangan: Telapak tangan manusia juga memiliki pola sudut dan lekukan seperti sidik jari. Daerah telapak tangan lebih besar dari jari sehingga diharapkan dapat lebih unik dari sidik jari. Namun, karena scanner untuk telapak tangan perlu area lebih luas, sistemnya menjadi lebih besar dan lebih mahal daripada sensor sidik jari.
j. Retina: Retina memiliki struktur yang kompleks dan memiliki karakteristik yang berbeda untuk setiap individu dan setiap mata. Dikatakan bahwa sistem ini merupakan sistem biometrik yang paling aman karena tidak mudah untuk mengubah atau menggandakan jaringan retina.
k. Tanda Tangan: Cara seseorang membuat tanda tangan dianggap suatu ciri yang individual. Meskipun tanda tangan membutuhkan kontak dengan alat tulis dan usaha dari user, namun tanda tangan sudah menjadi metode verifikasi yang diakui di mana-mana. Namun, tanda tangan dapat berubah sewaktu-waktu dan mudah untuk dipalsukan.
l. Suara: Suara merupakan kombinasi dari biometrik fisik dan kebiasaan. Ciri suara seseorang didasarkan pada bentuk dan ukuran organ yang digunakan untuk pembuatan suara. Kebiasaan berbicara seseorang berubah seiring dengan usia, keadaan medis, keadaan emosional, dsb. Suara kurang unik dan tidak dapat digunakan untuk identifikasi skala besar. Kelemahan lain dari sistem ini adalah sensitif terhadap banyak faktor seperti suara gangguan dari luar.
Setiap jenis biometrik memiliki kelebihan dan kekurangannya masing-masing. Perbandingan setiap jenis biometrik ditinjau dari berbagai aspek dapat dilihat pada Tabel 2.1.
Tabel 2.1 Perbandingan berbagai teknologi biometrik. H, M, L menyatakan High (Tinggi), Medium (Sedang), dan Low (Rendah)
Biometric identifier U ni ver sa li ty D ist ine ti v ene s Per m ane n ec e C ol le ct abi li ty Per fo rm anc e A cc ept abi li ty C ir cu m ve nt ion DNA H H H L H L L Ear M M H M M H M Face H L M H L H H Facial thermogram H H L H M H L Fingerprint M H H M H M M Gait M L L H L H M Hand Geometry M M M H M M M Hand vein M M M M M M L Iris H H H M H L L Keystroke L L L M L M M Odor H H H L L M L Palmprint M H H M H M M Retina H H M L H L L Signature L L L H L H H Voice M L L M L H H 2.2.2 Multimodal Biometrik
Sistem biometrik pada umumnya memiliki empat buah komponen penting, yaitu:
1. komponen sensor yang mengambil suatu karakteristik ke dalam bentuk data biometrik;
2. komponen pengekstraksi karakteristik yang memroses data untuk mengambil suatu set ciri-ciri yang merupakan representasi yang utuh dari karakteristik tersebut;
3. komponen pembanding yang memiliki pengklasifikasi untuk membandingkan set ciri-ciri dengan template yang ada pada database sampai didapatkan hasil yang cocok
4. komponen pengambil keputusan yang menggunakan hasil pencocokan untuk menentukan suatu identitas atau memvalidasi identitas yang diminta.
Sistem multimodal biometric, penggabungan sistem informasi yang dilakukan dapat terjadi pada komponen-komponen yang disebutkan di atas. Jadi terdapat tiga tingkat penggabungan untuk sistem multimodal biometric, yaitu:
1. Penggabungan dalam tingkat pengambilan data: Data yang diambil dari setiap jenis biometric digunakan untuk menghitung suatu vektor dari cirri-ciri yang ada. Jika data yang diambil dari salah satu biometrik independen atau tidak bergantung pada data dari biometrik yang lain, maka memungkinkan untuk menggabungkannya menjadi satu vektor baru. Ciri-ciri dari vektor yang baru memiliki tingkat dimensi yang lebih tinggi dan mewakili identitas seseorang dalam aspek yang berbeda.
2. Penggabungan dalam tingkat pencocokan data: Setiap pembanding biometrik memberikan nilai kesamaan yang memperkirakan kecocokan antara vector ciri-ciri input dengan template yang ada di database. Nilai-nilai ini dapat dikombinasikan untuk menunjukkan ketepatan dari identitas yang diminta.
3. Penggabungan dalam pengambilan keputusan: Setiap sistem biometrik mengambil keputusan identifikasinya masing-masing berdasarkan ciri-cirinya masing-masing. Dengan suatu skema ’pemungutan suara’ maka dapat diambil keputusan akhir.
b c a features features Class Label Feature extraction module Biometric snapshot Matching module System database Decision module Fusion Module Biometric snapshot Feature extraction module Class Label Confidence Or rank values Confidence Or rank values Feature extraction module System database Biometric snapshot Decision module Fusion Module Biometric snapshot Feature extraction module Matching module Matching module Class Label Abstract Label(s) Abstract Label(s) Fusion Module Matching module System database Biometric snapshot Decision module Feature extraction module Decision module Biometric snapshot Feature extraction module Matching module
Gambar 2.2: Beberapa tingkat penggabungan yang berbeda untuk sistem multimodal biometric: a) Penggabungan dalam tingkat pengambilan data; b) Penggabungan dalam tingkat pencocokan
data; c) Penggabungan dalam tingkat pengambilan keputusan.
Sistem biometrik yang menggabungkan informasi pada tahap awal pemrosesan dianggap lebih efektif daripada sistem yang melakukan penggabungan pada tahap akhir. Karena set data memiliki informasi yang lebih luar tentang biometrik input dibandingkan dengan nilai pencocokan atau keputusan output, penggabungan pada tingkat pengambilan data diharapkan untuk dapat menghasilkan pengenalan yang lebih baik. Meskipun demikian, penggabungan pada tingkat ini sulit untuk diterapkan karena set data dari jenis biometric yang berbeda kemungkinan tidak kompatibel dan kebanyakan sistem
biometric komersial saat ini tidak menyediakan akses ke data mentah mengenai suatu karakteristik yang digunakan dalam produknya. Sementara itu, penggabungan dalam tingkat pengambilan keputusan dianggap sulit karena adanya keterbatasan informasi. Jadi, penggabungan dalam tingkat pencocokan pada umumnya lebih banyak dipilih, karena relatif mudah untuk diakses dan lebih mudah dalam penggabungan nilai-nilai kecocokan yang dihasilkan dari setiap jenis biometrik.
Gambar 2.3 Berbagai kemungkinan dalam sistem multimodal biometric
Tergantung pada jumlah karakteristik, sensor, dan set data yang digunakan, ada beberapa jenis penggabungan yang mungkin dilakukan dalam sistem multimodal biometric.
1. Multiple sensors: Beberapa sensor sekaligus mengambil karakteristik biometric yang sama dan informasi yang diperoleh digabungkan. Misalnya, terdapat sensor berdasarkan optik, solid-state, dan ultrasound untuk mengenali sidik jari.
2. Multiple biometrics: Beberapa karakteristik biometrik seperti sidik jari dan wajah digabungkan. Sistem ini akan memiliki lebih dari satu sensor dengan setiap sensor mengambil karakteristik biometrik yang berbeda. Pada sistem verifikasi, metode ini biasa digunakan untuk meningkatkan akurasi sistem, sedangkan dalam sistem identifikasi digunakan untuk meningkatkan kecepatan dengan skema kombinasi yang tepat.
3. Multiple units of the same biometric: Sidik jari dari dua atau lebih jari seseorang dapat digabungkan, atau penggabungan gambar dari kedua iris yang dimiliki seseorang.
4. Multiple snapshots of the same biometric: Berbagai kondisi dari biometric yang sama dapat digunakan untuk input. Misalnya pengambilan sidik jari yang sama dengan cetakan yang berbeda, atau pengambilan beberapa sampel suara.
Multiple representations and matching algorithms for the same biometric:
Penggabungan beberapa jenis pendekatan untuk mengambil dan mencocokkan karakteristik biometrik.
2.2.3 Telapak Tangan
Telapak tangan menjadi menarik untuk dikembangkan sebagai biometrika karena memiliki ciri yang lebih banyak dibanding sidik jari dan geometri tangan. Permukaan area telapak tangan yang lebih luas dibandingkan sidik jari diharapkan dapat menghasilkan cirri yang memiliki kemampuan membedakan yang lebih handal.
Ciri yang dimiliki biometrika telapak tangan adalah sebagai berikut: a. Ciri geometri (geometry features)
Ciri ini menyangkut bentuk bentuk geometri telapak tangan, seperti panjang, lebar dan luas area telapak tangan. Ciri geometri jumlahnya sedikit, mudah diperoleh dan mudah pula dipalsukan dengan membuat model suatu tangan. Ciri ini juga tidak dimungkinkan digunakan pada sistem verifikasi dan identifikasi.
b. Ciri garis-garis utama (principal-line features)
Garis-garis utama dapat digunakan untuk membedakan antara satu orang dengan orang lain karena garis-garis ini unik, stabil, dan sedikit mengalami perubahan dalam suatu kurun waktu yang cukup lama. Sebagai ukuran basisdata acuan yang cukup besar, sanagt sulit untuk mendapatkan tingkat pengenalan tinggi dengan hanya menggunakan garis-garis ini karena kemiripan dengan garis-garis utama telapak tangan orang yang berbeda. c. Ciri garis-garis kusut (wrinkles features)
Telapak tangan banyak mengandung garis kusut yang sifatnya berbeda dengan garis utama. Garis-garis ini lebih tipis dan tidak beraturan. Garis-garis ini mampu menghasilkan cirri yang lebih rinci.
d. Ciri titik delta (delta-point features)
Titik ini unik dan bersifat stabil, namun sulit untuk memperoleh ciri ini dari citra telapak tangan beresolusi rendah.
e. Ciri minusi (Minutiae features)
Minusi merupakan pola bukit dan lembah pada permukaan telapak tangan seperti padak sidik jari. Ciri minusi hanya dapat diperoleh pada citra telapak tangan yang beresolusi tinggi dan membutuhkan komputasi yang tinggi.
2.3 Time Series
Analisis time series atau deret berkala pertama kali diperkenalkan oleh George E. P. Box dan Gwilym M. Jenkins pada tahun 1905. Time series merupakan sekumpulan data yang dicatat dalam satu periode waktu. Pengamatan yang diamati diperoleh pada interval waktu yang sama, misalnya harian, mingguan, bulanan, tahunan dan sebagainya. Kumpulan pengamatan dari time
series dinyatakan sebagai variabel yang dinotasikan sebagai Y. Pengamatan data
tersebut diamati dalam waktu t, yaitu t1, t2 …ti. Sehingga variabel pengamatan data pada waktu t dinotasikan dengan Yt.
Metode ini sering digunakan untuk melakukan peramalan. Peramalan atau
forecasting adalah suatu kegiatan memperkirakan apa yang akan terjadi pada
penting dalam perencanaan serta pengambilan keputusan. Jika waktu tenggang nol atau sangat kecil, maka perencanaan tidak diperlukan, namun jika waktu tenggang panjang dan hasil peristiwa akhir bergantung pada faktor-faktor yang dapat diketahui, maka perencanaan memegang peranan penting.
Hal pertama yang dilakukan dalam analisis time series adalah membuat grafik time series. Menurut Hanke dan Wichern (2005: 58) terdapat empat tipe umum pola data pada time series, yaitu:
1. Horisontal
Pola data ini terjadi apabila nilai data berfluktuasi di sekitar nilai rata-rata. (data observasi tidak mengalami perubahan dari waktu ke waktu (konstan))
Gambar 2.4 Contoh tipe data Horizontal
2. Trend (data observasi cenderung bergerak naik atau turun dalam jangka waktu yang panjang). Merepresentasikan suatu perubahan dari waktu ke waktu (cenderung naik atau turun). Tren biasanya merupakan hasil perubahan dalam populasi/penduduk, faktor demografi, teknologi, dan atau minat konsumen.
3. Musiman (perubahan data observasi tergantung musim, baik bulan, triwulana, kuartalan atau semester).
Gambar 2.6 Contoh tipe data Musiman
4. Siklis (ketika fluktuasi naik dan turun dalam periode dan frekuensi yang stabil dalam jangka waktu yang lama). Merepresentasikan rangkaian titik-titik dengan pola siklis (pergerakan secara siklis/naik-turun) di atas atau di bawah garis tren dalam kurung waktu satu tahun.
Gambar 2.7 Contoh tipe data Siklis
Analisis data deret waktu pada dasarnya digunakan untuk melakukan analisis data yang mempertimbangkan pengaruh waktu. Data yang dikumpulkan secara periodik berdasarkan urutan waktu, bisa dalam jam, hari, minggu, bulan, kuartal dan tahun, bisa dilakukan analisis menggunakan metode analisis data deret waktu. Analisis data deret waktu tidak hanya bisa dilakukan untuk satu variabel (Univariate) tetapi juga bisa untuk banyak variabel (Multivariate). Selain itu pada analisis data deret waktu bisa dilakukan peramalan data beberapa periode ke
depan yang sangat membantu dalam menyusun perencanaan ke depan. Teknik peramalan time series :
1. Statistik
Akurasi tinggi apabila perilaku data time series tidak terlalu kompleks dan kondisi awal (asumsiasumsi) terpenuhi dengan baik yaitu :
a. Data harus stasioner, bila tidak stasioner harus distasionerkan b. Sesuai fungsi ACF (Auto Correlation Function) dan
c. PACF (Partial Auto Correlation Function)
Ada beberapa jenis dari teknik peramalan time series secara statistik : a. Metode Pemulusan (Smoothing)
Metode pemulusan dapat dilakukan dengan dua pendekatan yakni : 1) Metode Perataan (Average)
a) Single Moving Average (SMA)
Moving average pada suatu periode merupakan peramalan untuk satu
periode ke depan dari periode rata – rata tersebut. Persoalan yang timbul dalam penggunaan metode ini adalah dalam menentukan nilai t (periode perata-rataan). Semakin besar nilai t maka peramalan yang dihasilkan akan semakin menjauhi pola data. Secara matematis, rumus fungsi peramalan metode ini adalah :
𝐹𝑡+1 =𝑋𝑡−𝑁+1+..+𝑋𝑡+1+𝑋𝑡
𝑁 ...(2.1) dimana :
XI = data pengamatan periode i
N = jumlah deret waktu yang digunakan Ft+1 = nilai peramalan periode t+1 b) Linier Moving Average (LMA)
Dasar dari metode ini adalah penggunaan moving average kedua untuk memperoleh penyesuaian bentuk pola trend. Metode Linier
moving Average adalah :
1. Hitung “single moving average” dari data dengan periode perata-rataan tertentu; hasilnya di notasikan dengan St’.
2. Setelah semua single Average dihitung, hitung moving average kedua yaitu moving average dari St’ dengan periode peratarataan yang sama. Hasilnya dinotasikan dengan St’’.
3. Hitung komponen at dengan rumus :
𝐴𝑡 = 𝑆𝑡′+ (𝑆𝑡′− 𝑆𝑡′′)...(2.2) 4. Hitung komponen trend bt dengan rumus :
𝑏𝑡 = 2 𝑁−1(𝑆𝑡
′− 𝑆𝑡′′)...(2.3) 5. Peramalan untuk periode kedepan setelah t adalah sebagai berikut :
𝐹𝑡 + 𝑚 = 𝑎𝑡 + 𝑏𝑡. 𝑚...(2.4)
c) Double Moving Average
Notasi yang diberikan adalah MA ( M x N), artinya M – periode MA dan N – periode MA.
d) Weigthed Moving Average
Data pada periode tertentu diberi bobot, semakin dekat dengan saat sekarang semakin besar bobotnya. Bobot ditentukan berdasarkan pengalaman. Rumusnya adalah sebagai berikut :
𝐹𝑡 = 𝑤1𝐴𝑡−1+ 𝑤2𝐴𝑡−2+ ⋯ + 𝑤𝑛𝐴𝑡−𝑛 ...(2.5) dimana :
w1 = bobot yang diberikan pada periode t – 1 w2 = bobot yang diberikan pada periode t – 2 wn = bobot yang diberikan pada periode t – n n = jumlah periode
b. Metode Pemulusan Eksponensial (Exponential Smoothing). 1) Single Exponential Smoothing
Pengertian dasar dari metode ini adalah nilai ramalan pada periode t+1 merupakan nilai aktual pada periode t ditambah dengan penyesuaian yang berasal dari kesalahan nilai ramalan yang terjadi pada periode t tersebut.
2) Double Exponential Smoothing (DES), yang terbagi atas : a) Satu parameter (Brown’s Linear Method)
Merupakan metode yang hampir sama dengan metode linear moving
average, disesuaikan dengan menambahkan satu parameter.
b) Dua Parameter (Holt’s Method)
Merupakan metode DES untuk time series dengan trend linier. 3) Exponential Smoothing dengan musiman
Pola permintaan musiman dipengaruhi karakteristik data masa lalu, antara lain natal dan tahun baru, lebaran, awal tahun ajaran sekolah, dsb. Terdapat dua kemungkinan dari pengaruh musiman. Pertama dapat bersifat addictive, yaitu mengabaikan laju penjualan setiap minggu selama bulan desember, hanya dikatakan penjualan selama bulan desember meningkat 200 unit. Kedua , pengaruh musiman bersifat multiplicative, laju penjualan setiap minggu selama bulan desember meningkat dua kali lipat.
Kasus dari metode tersebut, tujuannya adalah memanfaatkan data masa lalu untuk mengembangkan sistem peramalan pada periode mendatang. Pada metode pemulusuan eksponensial, pada dasarnya data masa lalu dimuluskan dengan cara melakukan pembotan menurun secara eksponensial terhadap nilai pengamatan yang lebih tua. Atau nilai yang lebih baru diberikan bobot yang relatif lebih besar dibanding nilai pengamatan yang lebih lama. Beberapa jenis analisis data deret waktu yang masuk pada katagori pemulusan eksponensial, diantaranya :
1. pemulusan eksponensial tunggal
2. pemulusan eksponensia tunggal (pendekatan adaptif) 3. pemulusan eksponensial ganda (metode Brown) 4. metode pemulusan eksponensial ganda (metode Holt) 5. pemulusan eksponensial tripel (metode Winter)
Pada metode pemulusan eksponensial ini, sudah mempertimbangkan pengaruh acak, trend dan musiman pada data masa lalu yang akan dimuluskan. Seperti halnya pada metode rataan bergerak, metode pemulusan eksponensial juga dapat digunakan untuk meramal data beberapa periode ke depan.
c. Model ARIMA (Autoregressive Integrated Moving Average)
Seperti halnya pada metode analisis sebelumnya, model ARIMA dapat digunakan untuk analisis data deret waktu dan peramalan data. Pada model ARIMA diperlukan penetapan karakteristik data deret berkala seperti stasioner, musiman dan sebagainya, yang memerlukan suatu pendekatan sistematis, dan akhirnya akan menolong untuk mendapatkan gambaran yang jelas mengenai model-model dasar yang akan ditangani. Hal utama yang mencirikan dari model ARIMA dalam rangkan analisis data deret waktu dibandingkan metode pemulusan adalah perlunya pemeriksaan keacakan data dengan melihat koefisien autokorelasinya. Model ARIMA juga bisa digunakan untuk mengatasi masalah sifat keacakan, trend, musiman bahkan sifat siklis data data deret waktu yang dianalisis. Bentuk fungsi dari metode ini dapat berupa :
a. Konstan b. Linier c. Kuadratis d. Eksponensial e. Siklis
d. Analisis Deret Berkala Multivariate
Model ARIMA digunakan untuk analisis data deret waktu pada katagori data berkala tunggal, atau sering dikatagorikan model-model univariate. Untuk data-data dengan katagori deret berkala berganda (multiple), tidak bisa dilakukan analisis menggunakan model ARIMA, oleh karena itu diperlukan model-model multivariate. Model-model yang masuk kelompok
multivariate analisisnya lebih rumit dibandingkan dengan model-model univariate. Pada model multivariate sendiri bisa dalam bentuk analisis data
bivariat (yaitu, hanya data dua deret berkala) dan dalam bentuk data multivariate (yaitu, data terdiri lebih dari dua deret berkala). Model-model
multivariate diantaranya:
1. model fungsi transfer
3. Fourier Analysis 4. analisis Spectral
5. Vector Time series Models. 2. Kecerdasan Buatan
a. Dapat mempelajari perilaku data tanpa asumsi-asumsi tertentu.
b. Lebih akurat untuk data non stasioner (index saham, beban listrik dll). c. Kemungkinan terjebak pada local optimum
Ada beberapa jenis dari teknik peramalan time series secara kecerdasan buatan diantaranya : a. Neural Network b. Algoritma Genetika c. Simulated Annealing d. Genetic Programming e. Klasifikasi f. Hybrid
Tujuan analisis time series yaitu menjelaskan mekanisme tertentu, meramalkan suatu nilai di masa depan dan mengoptimalkan sistem kendal. Tahap-tahap analisis time series adalah :
1. Identifikasi Model, dilakukan dengan membuat plot time series
2. Taksiran Model, dapat dilakukan dengan metode least squared atau Maksimum
Likelihood (MLE) 3. Diagnostik Model
2.4 Spiral Archimedes
Spiral adalah kurva yang berasal dari titik pusat, semakin jauh terhadap titik pusat karena berputar di sekitar titik tersebut.
Spiral Archimedes juga dikenal sebagai spiral arimatika. Spiral Archimedes
menentukan kedudukan titik-titik sesuai dengan lokasi dari waktu ke waktu, titik-titik tersebut bergerak menjauhi titik pusat dengan kecepatan konstan
sepanjang garis yang berputar dengan kecepatan sudut konstan. Ekivalen dalam koordinat polar (r, 𝜃) dapat dijelaskan pada persamaan berikut.
𝑟 = 𝑎 + 𝑏𝜃...(2.6) dimana bilangan real a dan b dengan mengubah parameter akan mengubah bentuk spiral.
Gambar 2.8 Spiral Archimedes
2.5 Pencocokan
Metrika pencocokan digunakan untuk menentukan tingkat kesamaan (similarity degree) dan ketidaksamaan (dissimilarity degree) dua vector ciri. Tingkat kesamaan berupa suatu skor dan berdasarkan skor tersebut dua vektor akan dikatakan mirip atau tidak. Pada sistem biometrika, skor tersebut digunakan untuk mengenali atau mengkalsifikasi suatu vector cirri apakah sah atau tidak sah, dengan membandingkannya dengan suatu nilai ambang (threshold value). Beberapoa metrika untuk mencocokan dua vector ciri, diantaranya:
2.5.1 Euclidean Distance
Jarak Euclidean adalah metrika yang paling sering digunakan untuk menghitung kesamaan 2 vektor. Jarak Euclidean menghitung akar dari kuadrat 2 vektor (root of square differences between 2 vectors). Semakin kecil skor d(i,j) maka semakin mirip kedua vector fitur yang dicocokan. Sebaliknya semakin besar skor, maka semakin berbeda kedua vector ciri.
Rumus dari jarak Euclidean : 𝑑𝑖𝑗 = √∑𝑛 (𝑥𝑖𝑘− 𝑥𝑗𝑘 )2
Normalized Euclidean Distenace adalah metrika yang sederhana untuk
menghitung kesamaan dua vektor ciri u dan v, dengan persamaan sebagai berikut. 𝑑̅(𝑢, 𝑣) = (∑ (𝑢̅𝑖 𝑖 − 𝑣̅𝑖)2) 1 2...(2.8) dengan 𝑢̅𝑖 = 𝑢𝑖 ‖𝑢‖ 𝑣𝑖 = 𝑣𝑖 ‖𝑣‖
||v|| disebut norm dari v yang dinyatakan sebagai ‖𝑣‖ = [∑ 𝑣12
𝑖 ]...(2.9) Semakin kecil skor 𝑑̅(𝑢, 𝑣) maka semakin mirip kedua vektor fitur yang dicocokan, sebaliknya semakin besar skor 𝑑̅(𝑢, 𝑣) maka semakin berbeda kedua vektor ciri.
2.5.2 City Block Distance
City block distance menghitung nilai perbedaan absolute dari 2 vektor
(absolute differences between 2 vectors) Rumus dari jarak City Block :
𝑑𝑖𝑗 = ∑𝑛𝑘=1|𝑥𝑖𝑘 − 𝑥𝑗𝑘|...(2.10)
2.5.3 Chebyshew Distance
Chebyshev Distance juga disebut maximum value distance, yang
memeriksa sebuah magnitudo absolute perbedaan 2 vektor, dari masing-masing nilai perbedaan akan dipilih nilai paling besar untuk dijadikan jarak chebyshev. Rumus dari jarak Chebyshev :
𝑑𝑖𝑗 = 𝑚𝑎𝑥𝑘| 𝑥𝑖𝑘− 𝑥𝑗𝑘|...(2.11)
2.5.4 Minskowski Distance
Jarak Minkowski dengan ordo 𝜏 ini menggeneralisasikan beberapa metrika sebelumnya, dimana 𝜏 = 1 dinyatakan sebagai jarak City Block dan 𝜏 = 2 dinyatakan dengan jarak Euclidean. Jarak Chebyshev merupakan kasus khusus dari jarak Minkowski dengan 𝜏 = ∞ (tak terhingga)
𝑑𝑖𝑗 = 𝜏√∑𝑛
𝑘=1 (𝑥𝑖𝑘− 𝑥𝑗𝑘 )𝜏...(2.12)
2.5.5 Canberra Distance
Jarak Canberra membagi absolute selisih 2 nilai dengan jumlah dari absolute 2 niai tersebut. Hasil dari setiap dua nilai yang dicocokan lalu dijumlahkan untuk mendapatkan jarak Canberra.
Rumus : 𝑑𝑖𝑗 = ∑ | 𝑥𝑖𝑘−𝑥𝑗𝑘| | 𝑥𝑖𝑘+ 𝑥𝑗𝑘| 𝑛 𝑘=1 ...(2.13) 2.5.6 Sorensen Distance
Jarak Sorensen adalah metode normalisasi yang banyak digunakan dalam ilmu tumbuh-tumbuhan, ekologi, dan ilmu tumbuhan.Jarak Sorensen mempunyai property jika nilai yang dibandingkan positif, nilai-nilainya akan berada diantara 0 dan 1. Jarak Sorensen dirumuskan dengan jumlah dari absolute pengurangan dibagi jumlah 2 nilai yang dibandingkan.
Rumus jarak Sorensen : 𝑑𝑖𝑗 = ∑ | 𝑥𝑖𝑘−𝑥𝑗𝑘|
𝑛 𝑘=1
∑𝑛𝑘=1| 𝑥𝑖𝑘+ 𝑥𝑗𝑘|...(2.14)
2.5.7 Angular Distance
Separasi Angular mewakili sudut cosinus di antara dua vector. Separasi angular lebih menghitung kesamaan dibanding ketidaksamaan atau jarak. Jadi nilai dari separasi angular yang semakin tinggi akan menunjukan kesamaan dari 2 vektor yang semakin tinggi. Rentang nilainya adalah -1 hingga 1. Serupa dengan cosines.
Rumus separasi angular : 𝑠𝑖𝑗 = ∑𝑛𝑘=1𝑥𝑖𝑘.𝑥𝑗𝑘 [ ∑𝑛𝑘=1𝑥𝑖𝑘2 .∑𝑛𝑘=1𝑥𝑗𝑘2 ] 1 2 ...(2.15) 2.5.8 Correlation Distance
Koefisien korelasi adalah standarisasi separasi angular dengan pengurangan nilai koordinat dengan nilai mean. Nilainya di antara -1 dan +1. Serupa denan separasi angular, koefisien korelasi menghitung nilai kesamaan dibanding ketidaksamaan. Jadi semakin tinggi nilainya menuntukan bahwa kedua vector semakin mirip.
Rumus : 𝑠𝑖𝑗 = ∑𝑛𝑘=1(𝑥𝑖𝑘− 𝑥𝑖).(𝑥𝑗𝑘− 𝑥𝑗) [ ∑𝑛𝑘=1 (𝑥𝑖𝑘2− 𝑥𝑖)2 .∑𝑛𝑘=1(𝑥𝑗𝑘− 𝑥𝑗)2] 1 2 ...(2.16) 2.5.9 Hamming Distance
Teori pengkodean, urutan 0 dan 1 dinamakan word. Jika dua word memiliki panjang sama, kita dapat menghitung jumlah di mana posisi word berbeda. Jumlah digit yang berlainan disebut jarak Hamming.
Rumus jarak Hamming :
𝑑𝑖𝑗 = 𝑞 + 𝑟...(2.17) dimana : q adalah jumlah dari variable dengan nilai 1 untuk vector A dan 0 untuk vector B dan r = jumlah dari variable dengan nilai 0 untuk vector A dan 1 untuk vector B.
2.5.10 Dinamic Time Warping (DTW)
Dynamic time Warping adalah metode untuk menghitung jarak antara duda
data time series. Keunggulan DTW dari metode jarak yang lain adalah mampu menghitung jarak dari dua vector data dengan panjang berbeda.
Jarak DTW di antara dua vector dihitung dari jalur pembengkokan optimal (optimal warping path) dari kedua vector tersebut. Ilustrasi pencocokan dengan DTW ditunjukan pada gambar di bawah ini :
(a) (b)
Gambar 2.9 Pencocokan sequence (a) alignment asli dari 2 sequence (b) alignment dengan DTW Teknik yang digunakan untuk menghitung DTW, salah satu yang paling handal adalah metode pemrograman dinamis. Jarak DTW dapat dihitung dengan rumus :
𝛾(𝑚, 𝑛) = 𝑑𝑏𝑎𝑠𝑒(𝑢𝑗, 𝑣𝑗) + min[𝛾(𝑖 − 1, 𝑗), 𝛾(𝑖 − 1, 𝑗 − 1), 𝛾(𝑖, 𝑗 − 1)]...(2.19) 𝛾(0,0) = 0, 𝛾(0, ∞) = 0, 𝛾(∞, 0) = ∞ ...(2.20) Nilai kolom (i, j ) terlihat sebagai nilai penjumlahan jalur pembengkokan dari kolom (1,1) hingga (i, j). Kolom dengan nilai 𝛾(𝑖, 𝑗)(1 ≤ 𝑖 < 𝑚, 1 ≤ 𝑗 ≤ 𝑛) dinamakan matrik jarak terjumlahkan. Berikut adalah contoh matrik jarak terjumlahkan :
Table 2.2 Ilustrasi matriks jarak terjumlahkan (commulative distance matrix) dengan 2 vektor U={2,5,2,5,3} dan V={0,3,6,0,6,1} 0 3 6 0 6 1 2 4 5 21 25 41 42 5 29 8 6 31 26 42 2 33 9 22 10 26 27 5 58 13 10 35 11 27 3 67 13 19 19 20 15
2.6 Pengukuran Unjuk Kerja Sistem
Kesalahan pada sistem biometrika dapat terjadi karena dua data biometrika milik orang yang sama tidak selalu mutlak sama. Pengaruh ketidak sempurnaan saat akuisisi data, usia, pekerjaan, derau, kondisi kesehatan, dan lain sebagainya adalah faktor-faktor yang mempengaruhi mengapa dua biometrika yang berasal dari orang yang sama tidak selalu mutlak sama. Sistem tradisional (seperti password dan PIN), selalu dapat memberikan jawaban absolut ya atau tidakterhadap pertanyaan apakah PIN yang diverifikasi sama dengan PIN yang diklaim. Sistem biometrika tidak dapat memberikan jawaban absolut seperti itu.
Citra telapak tangan yang didapat dari orang yang sama pada saat yang berbeda tidaklah selalu mutlak sama, demikian juga biometrika lainnya. Sistem biometrika hanya dapat memberikan jawaban seberapa besar tingkat kemiripan dua biometrika yang diuji atau seberapa besar probabilitas dua biometrika yang diuji berasal dari orang yang sama. Beberapa jenis kesalahan yang dijadikan tolak ukur dalam pengukuran unjuk kerja sistem biometrika adalah decision error rate,
2.6.1 Rasio Kesalahan Keputusan
Unjuk kerja suatu sistem biometrika seringkali dinyatakan dengan rasio kesalahan keputusan (decision error rate), yaitu rasio kesalahan penerimaan (false
acceptance rate) dan rasio kesalahan penolakan (false rejection rate)
False Acceptance Rate (FAR) menyatakan bagian transaksi dengan klaim
salah terhadap identitas (yang terdaftar di sistem) ataupun non-identitas (yang tidak terdaftar di sistem) yang diterima sistem, sedangkan False Rejection Rate (FRR) menyatakan bagian transaksi dengan klaim benar terhadap identitas (terdaftar di sistem) ataupun non-identitas (tidak terdaftar di sistem) yang ditolak sistem.
2.6.2 Rasio Kesalahan Pencocokan
Rasio kesalahan pencocokan (matching error rate) menyatakan probabilitas terjadinya kesalahan pencocokan pada sistem. Terdapat 2 jenis rasio kesalahan pencocokan, yaitu rasio kesalahan kecocokan (false match rate) dan rasio kesalahan ketidakcocokan (false non match rate).
False Match Rate (FMR) menyatakan probabilitas sampel dari pengguna
cocok dengan acuan yang diambil secara acak milik pengguna yang berbeda.
False match rate disebut juga false positive. Rasio kesalahan kecocokan dihitung
dengan rumus :
𝐹𝑀𝑅 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑘𝑒𝑠𝑎𝑙𝑎ℎ𝑎𝑛 𝑐𝑜𝑐𝑜𝑘
𝐽𝑢𝑚𝑙𝑎ℎ 𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑝𝑒𝑛𝑐𝑜𝑐𝑜𝑘𝑎𝑛 𝑥 100%...(2.21)
False Non Match Rate (FNMR) menyatakan probabilitas sampel dari
pengguna tidak cocok dengan acuan lain yang diberikan pengguna yang sama.
False non match rate disebut juga false negative. Rasio kesalahan ketidakcocokan
dihitung dengan rumus :
𝐹𝑁𝑀𝑅 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝐾𝑒𝑠𝑎𝑙𝑎ℎ𝑎𝑛 𝑇𝑖𝑑𝑎𝑘 𝐶𝑜𝑐𝑜𝑘
𝐽𝑢𝑚𝑙𝑎ℎ 𝐾𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑝𝑟𝑜𝑠𝑒𝑠 𝑝𝑒𝑛𝑐𝑜𝑐𝑜𝑘𝑎𝑛 𝑥 100%...(2.22) FMR seringkali disamakan dengan FAR, dan FNMR disamakan dengan FRR. FMR dan FNMR pada umumnya tidak sama dengan FAR dan FRR. FMR dan FNMR diperhitungkan dari jumlah perbandingan (pencocokan) yang dilakukan, sedangkan FAR dan FRR diperhitungkan dari keseluruhan transaksi.
2.6.3 Grafik Receiver Operation Characteristics (ROC)
Grafik karakteristik operasi penerima (ROC) adalah grafik yang digunakan untuk menunjukan unjuk kerja suatu sistem biometrika. ROC memiliki 3 jenis model grafik seperti ditunjukan pada Gambar 2.10.
Gambar 2.10 (a), sumbu x menyatakan nilai ambang dan sumbu y menyatakan FAR/FRR atau FMR/FMNR. Gambar 2.10 (b), sumbu x menyatakan FRR (FNMR) dan sumbu y menyatakan FAR (FMR), sedangkan pada Gambar 2.10 (c) sumbu x menyatakan FAR (FMR) dan sumbu y menyatakan GAR (Genuine Acceptance Rate). Salah satu dari ketiga grafik tersebut dapat digunakan untuk mewakili untuk kerja suatu sistem biometrika.
(a)
(c)
Gambar 2.10 (a), (b), (c) Model grafik ROC
GAR menyatakan tingkat kesuksesan pengenalan suatu sistem biometrika (bukan tingkat kesalahan) dan dapat dinyatakan sebagai :
GAR = 1 – FRR, atau GAR = 1 – FNMR
Menghitung GAR berarti menghitung seberapa besar sistem sukses mengenali pengguna secara benar.
2.7 C Sharp (C#)
C# merupakan sebuah bahasa pemrograman berorientasi objek yang dikembangkan oleh Microsoft sebagai bagian dari inisiatif kerangka .NET
Framework. Bahasa pemrograman ini dibuat berbasiskan bahasa C++ yang telah
dipengaruhi oleh aspek-aspek ataupun fitur bahasa yang terdapat pada bahasa-bahasa pemrograman lainnya seperti Java, Delphi, Visual Basic, dan lain-lain) dengan beberapa penyederhanaan. Menurut standar ECMA-334 C# Language
Specification, nama C# terdiri atas sebuah huruf Latin C (U+0043) yang diikuti
oleh tanda pagar yang menandakan angka # (U+0023). Tanda pagar # yang digunakan memang bukan tanda kres dalam seni musik (U+266F), dan tanda pagar # (U+0023) tersebut digunakan karena karakter kres dalam seni musik tidak terdapat di dalam keyboard
2.8 MySQL
MySQL adalah suatu perangkat lunak database relasi (Relational
Database Management System atau RDBMS), seperti halnya ORACLE,
Postgresql, MS SQL, dan sebagainya. MySQL AB menyebut produknya sebagai
bahwa di platform Web, dan baik untuk kategori open source maupun umum, MySQL adalah database yang paling banyak dipakai. Menurut perusahaan pengembangnya, MySQL telah terpasang di sekitar tiga juta komputer. Puluhan hingga ratusan ribu situs mengandalkan MySQL bekerja siang malam memompa data bagi para pengunjungnya.
2.8.1 Fitur MySQL
Seri 3.22 MySQL mulai diadopsi banyak orang dan meningkat populasi penggunanya, maka di seri 3.23 dan 4.0-lah terjadi banyak peningkatan dari sisi teknologi. Ini tidak terlepas dari tuntutan pemakai yang semakin mengandalkan MySQL, namun membutuhkan fitur-fitur yang lebih banyak lagi.
Seri 3.23. Di seri 3.23 MySQL menambahkan tiga jenis tabel baru: pertama MyISAM, yang sampai sekarang menjadi tipe tabel default; kedua BerkeleyDB, yang pertama kali menambahkan kemampuan transaksi pada MySQL; dan ketiga InnoDB, primadona baru yang potensial.
Seri 4.x. Di seri yang baru berjalan hingga 4.0 tahap alfa ini, pengembang MySQL berjanji akan menjadikan MySQL satu derajat lebih tinggi lagi. Fitur-fitur yang sejak dulu diminta akan diwujudkan, seperti subselect (di 4.1), union (4.0), foreign key constraint (4.0 atau 4.1—meski InnoDB sudah menyediakan ini di 3.23.x), stored procedure (4.1), view (4.2), cursor (4.1 atau 4.2), trigger (4.1). MySQL AB tetap berdedikasi mengembangkan dan memperbaiki MySQL, serta mempertahankan MySQL sebagai database open source terpopuler.
2.8.2 Keunggulan MySQL
Penyebab utama MySQL begitu popular di kalangan Web adalah karena ia memang cocok bekerja di lingkungan tersebut. Pertama, MySQL tersedia di berbagai platform Linux dan berbagai varian Unix. Sesuatu yang tidak dimiliki
Access, misalnya padahal Access amat popular di platform Windows. Banyak server Web berbasiskan Unix, ini menjadikan Access otomatis tidak dapat dipakai
karena ia pun tidak memiliki kemampuan client-server/networking.
Kedua, fitur-fitur yang dimiliki MySQL memang yang biasanya banyak dibutuhkan dalam aplikasi Web. Misalnya, klausa LIMIT SQL-nya, praktis untuk melakukan paging. Atau jenis indeks field FULLTEXT, untuk full text searching.
Kekayaaan fungsi-fungsi builtinnya, mulai dari memformat dan memanipulasi tanggal, mengolah string, regex, enkripsi dan hashing. Yang terakhir misalnya, praktis untuk melakukan penyimpanan password anggota situs.
Ketiga, MySQL memiliki overhead koneksi yang rendah. Soal kecepatan melakukan transaksi atau kinerja di kondisi load tinggi mungkin bisa diperdebatkan dengan berbagai benchmark berbeda, tapi kalau soal yang satu ini MySQL-lah juaranya. Karakteristik ini membuat MySQL cocok bekerja dengan aplikasi CGI, di mana disetiap request skrip akan melakukan koneksi, mengirimkan satu atau lebih perintah SQL, lalu memutuskan koneksi lagi. Cobalah melakukan hal ini dengan Interbase atau bahkan Oracle. Maka dengan load beberapa request per detik saja server Web/database mungkin akan segera menyerah karena tidak bisa mengimbangi beban ini.