Identifikasi lagu Menggunakan Algoritma K-Nearest Neighbours- Cosine Similarity (KNNCS).

(1)

(2)

PROCEEDING

SEMINAR NASIONAL

TEKNOLOGI INFORMASI DAN APLIKASINYA

2012

“Aplikasi Teknologi Informasi dalam Menunjang

Pelestarian Budaya Nasional dan Pengembangan Sektor

Pariwisata”

Bali, 9 Oktober 2011

Diselenggarakan Oleh :

Program Studi Teknik Informatika

Jurusan Ilmu Komputer

Universitas Udayana

(3)

KATA PENGANTAR

Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa, atas terselesainya

penyususnan

Proceeding

SNATIA 2012 ini. Buku ini memuat naskah hasil penelitian dari

berbagai bidang kajian yang telah di

review

oleh pakar dibidangnya dan telah

dipresentasikan dalam acara Seminar SNATIA 2012 pada tanggal 9 Oktober 2012 di

Universitas Udayana kampus Bukit Jimbaran, Badung, Bali.

Kegiatan SNATIA 2012 merupakan yang pertama kali diadakan, dan akan menjadi

agenda tahunan Program Studi Teknik Informatika, Jurusan Ilmu Komputer, Universitas

Udayana. SNATIA 2012 mengambil tema “Aplikasi Teknologi Informasi dalam

Menunjang Pelestarian Budaya Nasional dan Pengembangan Sektor Pariwisata”, dengan

pembicara utama seminar yang terdiri dari pakar peneliti dibidang teknologi informasi,

pembicara dari praktisi pariwisata Bali, dan pembicara dari Dinas Kebudayaan Propinsi

Bali.

Meskipun kegiatan seminar dan pendokumentasian naskah dalam

proceeding

ini telah

dipersiapkan dengan baik, namun kami menyadari masih banyak kekurangannya. Untuk

itu panitia mohon maaf yang sebesar-besarnya, dan juga mengucapkan terimakasih atas

kepercayaan dan kerjasamanya dalam kegiatan ini. Kritik dan saran perbaikan sangat

diharapkan untuk penyempurnaan di masa mendatang, yang dapat dikirimkan melalui

e-mail snatia@cs.unud.ac.id.

Kepada semua pihak yang terlibat, baik langsung maupun tidak langsung dalam

penyelenggaraan seminar, dan penyusunan

proceeding

SNATIA 2012, panitia

mengucapkan terima kasih.

Denpasar, 9 Oktober 2012

Panitia SNATIA 2012

Ketua Pelaksana

(4)

DAFTAR ISI

Kata Pengantar

Daftar Isi

Analisis Dan Implementasi Algoritma Learning Vector Quantization (Lvq) Dalam Pengenalan Ekspresi Wajah

Kadek Dian Trisnadewi, I Wayan Santiyasa, I Made Widiartha ... 1

Analisis Kualitas Voip Pada Jaringan Yang Menggunakan Active Queue Management Random Early Detection (Red)

I Dewa Made Bayu Atmaja Darmawan ... 6

Analisis Sistem Firewall Pada Jaringan Komputer Menggunakan Iptables Untuk Meningkatkan Keamanan Jaringan ( Studi Kasus : Jaringan Komputer Jurusan Matematika Fakultas Mipa Universitas Udayana)

I Wayan Supriana, I Wayan Santiyasa, Cokorda Rai Adi Pramartha ... 13

Ekstraksi Tepi Dengan Menggunakan Fuzzy Spatial Filtering Dan Slicing Intensity

I Gede Aris Gunadi, Retantyo Wardoyo ... 22

Evaluasi Cluster Menggunakan Metode Prototype-Based Cohesion And Separation Dan Silhouette Coefficient Pada Implementasi Algoritma Som

Gusti Ayu Vida Mastrika Giri, Kadek Cahya Dewi ... 29

Group Decision Support System Dengan Menggunakan Metode Analytical Hierarchy Process (Ahp) Dan Borda Dalam Penentuan Lokasi Bank Dan Pimpinan Cabang Yang Tepat

Desak Made Dwi Utami Putra ... 34

Identifikasi Lagu Menggunakan Algoritma K-Nearestneighbours – Cosine Similarity(KNNCS)

I Gede Suta Lascarya Astawa, Agus Muliantara, Kadek Cahya Dewi... 42

Kompresi Citra Fraktal Dengan Algoritma Genetika Adaptif

Putu Indah Ciptayani1, Zulfahmi Indra2 ... 46

Mobile Information System Untuk Mengidentifikasidefisiensi Unsur Hara Pada Daun

Asti Dwi Irfianti, Endang Sulistyaningsih ... 51

Model Rekayasa Perangkat Lunak Berbasis Komponen (Component-Based Software Engineering)

Herri Setiawan, Edi Winarko... 57

Model Sistem Pendukung Keputusan Kelompok Dengan Metode Multiplicative Exponent Weighting

Muhammad Syaukani, Sri Hartati ... 65

Optimasi Distribusi Pupuk Bersubsidi Dengan Menggunakan Algoritma Genetika (Studi Kasus: Kab. Jombang Jawa Timur)

(5)

2012

Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya

Jurusan Ilmu Komputer, FMIPA, Universitas Udayana 42

IDENTIFIKASI LAGU MENGGUNAKAN ALGORITMA

K-NEARESTNEIGHBOURS – COSINE SIMILARITY_(KNNCS)

I GedeSutaLascaryaAstawa, AgusMuliantara, KadekCahyaDewi

Program StudiTeknikInformatika, JurusanIlmuKomputer, FMIPA, UniversitasUdayana Email :suta.lascarya@gmail.com , muliantara@gmail.com, cahya.amchy@gmail.com

ABSTRAK

Jumlah musik yang bertipe data *.mp3 kian hari kian bertambah, sehinggasering ditemukan suatu file dengan nama yang tidak sesuai dengan judul aslinya. Hal ini membuat para pendengar music memerlukan suatu aplikasi yang dapat memberikan informasi dari suatu file *.mp3 tentang judul atau artis dari file tersebut.

Penelitian ini akan membuat suatu aplikasi yang nantinya berfungsi untuk memberikan informasi dari suatu file *.mp3 yang di-upload oleh user. Aplikasi ini diberi namaMusic Information by Computer Science (MICS) Identifications dan aplikasi ini akan dibangun dengan berbasis web. Proses identifikasi lagu akan menggunakan 5 fitur dari suatu lagu yaitu, key, mode, tempo, energy, danloudness. Data *.mp3 yang diunggah oleh user akan dicari nilai kemiripan audio terhadap data lagu yang tersimpan di dalamdatabase.

Dataset dari penelitian ini berjumlah 280 lagu dari 14 genre berbedadan tentunyamemiliki fitur-fitur musik yang berbeda juga.Data sampel berjumlah 196 dan sisanya sebanyak 84 digunakan sebagai data uji. Data sampel memiliki bit rate 64kbit/s, dan data uji terdiri dari bit rate 32 kbit/s, 48 kbit/s,dan 56kbit/s. Variabel penelitian dari penilitian ini adalah nilai K dan nilai threshold pada Cosine Similarity. Hasil penelitian yang memiliki akurasi terbesar ada pada bit rate 32kbit/s dengan threshold 0.999, sedangkan untuk nilai K tidak berpengaruh. Karena dengan nilai K berbeda pun, hasil akurasi yang didapatkan sama pada setiap pengujian dengan threshold dan bit rate tertentu.

Kata Kunci :fiturlagu, K-Nearest Neighbours, Cosine Similarity, Echo Nest, akurasi

ABSTRACT

From day to day, any kind of music data with *.mp3 type is growing up in the quantity and as a consequences there is often be found a file which the title is not match with the real title of that file should be. This condition make a music listeners need an application in order can give them an information about the title and also the artist from the *.mp3 file they have.

This research is going to make an application which have a function to give an information from a *.mp3 file that has been uploaded by user. This application name is Music Information by Computer Science (MICS) Identifications and will be built up on web base. The identification process of the song will using 5 features from the song itself including key, mode, tempo, energy, and also loudness. The uploaded *mp3 data from the user will being looked for the audio similarity according to songs data which is already in the database.

The dataset from this research is account for 280 songs from 14 different genre and certainly has a different feature of music too. Sample data is about 196 and the rest of the 84 data will be used as a test data. The samples data has a 64kbit/s bit rate while the test data has a 32 kbit/s bit rate, 48kbit/s bit rate and 56kbit/s bit rate. The variable from this research are the K value and threshold in Cosine Similarity. The result of this research which have the biggest accuration will be in the 32kbit/s bit rate with 0,999 threshold while the K value will not have any influence. Because even with the different K value, the accurate result that obtained will be the same in every test with any threshold and any bit rate.

Keyword : song feature, K-Nearest Neighbours, Cosine Similarity, Echo Nest, accuration

1. PENDAHULUAN

Musik adalah suatu susunan nada yang memiliki tempo tertentu dan harmonisasi di setiap nadanya. Musik itu sendiri memiliki fungsi yang berbeda-beda dalam penggunaannya. Beberapa jenis music ada yang digunakan dalam acara kebudayaan, dilain sisi music juga bias digunakan sebagai bahan terapi untuk kesehatan. Dewasa ini music atau lagu telah memiliki beragam jenis genre berdasarkan perkembangannya dari tahun ketahun. Jumlah lagu pun bias dikatakan tidak terbatas sedangkan kemampuan otak manusia untuk mengingat informasi tentang suatu lagu terbatas.

(6)

ModifiedK-Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya

2012

43 _{Jurusan Ilmu Komputer, FMIPA, Universitas Udayana}

Nearest Neighbours(KNN) menggunakan Cosine Similarity. Data sampel yang dalam penelitian ini adalah 280 lagu yang diambil dari database Echo Nest dan telah diekstraksi melalui website tersebut. Fitur lagu yang akan digunakan dalam penelitian ini adalah key, mode, tempo, loudness, dan energy.

2.MATERIDANMETODE 2.1 FiturMusik

Pada identifikasi music dalam penelitian ini, music diidentifikasi dengan menggunakan beberapa fitur yaitu energi, key, loudness, mode, dan tempo.

Fitur Nilai

Energi 0.0 < energy < 1.0 Key 0 < key < 11

Loudness -100.0 < loudness < 100.0(dB) Mode 0 - 1

Tempo 0.0 < tempo < 500.0 (BPM)

Gambar1.FiturMusik

Energi dari suatu lagu adalah suatu fitur lagu yang merepresentasikan suatu tingkat dari kemampuan suatu lagu untuk meningkatkan emosi dari pendengarnya. Fitur key adalah nada dasar yang diperkirakan dari suatu lagu. Analisis Key dari suatu lagu didasarkan pada nada tonic triad serta penggunaan akord mayor atau

minor.

Loudness merupakan tingkat kenyaringan yang dari suatu lagu dengan satuan decibels (DB). Loudness juga merupakan suatu nilai yang menyatakan kualitas dari suatu lagu. Mode adalah nilai akord secara umum dengan nilai ‘1’ untuk mayor dan nilai ‘0’ untuk minor.Dan fitur yang terakhir digunakana dalah tempo. Tempo adalah kecepatan rata-rata lagu dengan nilai Beats per Minutes (BPM)(Yu Yao Chang, 2005).

2.2 Pengumpulan Dataset

Untuk dataset, didapatkan dari mengunggah 280 file mp3 kewebsite Echo Nest untuk mendapatkan fitur-fitur dari mp3 tersebut. Untuk mendapatkan hasil analisadari file MP3 yang diunggah digunakan cURL PHP dengan format data yang dhasilkan dari ekstraksi adalah berupa Json File danXML File. Echo Nest adalah adalah suatu perusahaan musik yang menyediakan web service tentang musik. Ribuan aplikasi berbasis music dibangun dalam Echo Nest Platform. Echo Nest menyediakan API Key yang bias digunakan untuk mendapatkan data dari web Echo Nest secara gratis (Echo Nest, 2011). API Key adalah kode unik sepanjang12digityangdikeluarkanolehEchoNestuntuksetiappenggunaEchoNest.

2.3 Cosine Similarity

Cosine similarity merupakan salah satu metode similarity yang memperhitungkan jarak dan sudut antar data uji dengan data sampel. Perhitungan pada cosine similarity didasarkan pada vector dot product dan jarak dari data uji ke data sampel (Tan, Steinbach, & Kumar, 2006). Untuk menentukan nilai similarity dalam cosine similarity dapat dicari dengan persamaan

2.4 Min Max Normalization

Perbedaan rentang data yang ada pada dataset, bias menyebabkan proses identifikasi memiliki akurasi yang lebih rendah. Karena bias menyebabkan satu dimensi data tidak mempengaruhi nilai distance

atau similarity pada suatu identifikasi. Min Max Normalization didapatkan dari perhitungan nilai minimum dan maksimum dari suatu fitur data, atau dapat dilihat pada persamaan

Dengan nilai f adalah nilai fitur sebelum dinormalisasi, fmin adalah rentang nilai terkecil untukf, dan nilai fmax

adalah rentang nilai terbesar untukf (Dhaliwal & Sandhu, 2011). 2.5 K-Nearest Neighbours

Konsep dasar algoritma KNN adalah mencari jarak terdekat antara data yang dievaluasi dengan K tetangga (neighbours) terdekatnya dalam data uji (Eka, 2011). Secara umum algoritma KNN bisadilihat sebagai berikut.(Dewi, 2008)

1. Menentukan nilai parameter K (jumlahtetanggaterdekat).

(7)

2012

Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya

Jurusan Ilmu Komputer, FMIPA, Universitas Udayana 44

3. Mengurutkan data berdasarkan jarak dari yang terkecil hingga yang terbesar. 4. Klasifikasi data baru dari hasil perhitungan dengan memberikan label kelas tiap data.

Jarak untuk setiap data uji dengan data sampel dihitung dengan rumus jarakEuclideanseperti pada persamaan.

Beberapa kelebihan dari algoritma KNN ini adalah sebagai berikut. 1. Handal dalam uji data yang memiliki tingkat noise yang tinggi.

2. Efektif jika data yang diuji dalam jumlah besar. 3. Algoritma secara umum mudah untuk dimengerti.

2.6. CONCEPTMAP

Concept maps adalah diagram yang menggambarkan bagaimana konsep system akan bekerja secara menyeluruh. Konsep digambarkan dengan bentukoval dan dihubungkan antara satu konsep dengan konsep lainnya(Ellis, 2010). Untukconcept map MICS (Identification) digambarkan pada gambar 3.1.

Gambar2.ConceptMapMICSIDentification 3.HASIL

Hasil evaluasi system dilakukan dengan menghitung akurasi dari sistem yang dibuat dengan menggunakan confusion matrix.Tabel confusion matrix dapat dilihat sebagai berikut.

Tabel 1. Confusion Matrix

Positif Negatif True TP TN False FP FN

Dengan :

x TP adalah jumlah lagu benar yang teridentifikasi benar

x TN adalah jumlah lagu benar yang teridentifikasi salah

x FP adalah jumlah lagu salah yang teridentifikasi benar

x FN adalah jumlah lagu salah yang teridentifikasi salah

Persamaan untuk mendapatkan nilai akurasi, precision, danrecall dapat dilihat sebagai berikut. Akurasi = ;Precision = ; Recall =

Pengujian dari MICS Identification dilakukan sebanyak 27 kali dengan data hasil uji pada table 4.2

Dapat dilihat pada table 2, bahwa akurasi dengan nilai tertinggi didapatkan pada pengujian dengan data uji

(8)

Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya

2012

45 _{Jurusan Ilmu Komputer, FMIPA, Universitas Udayana}

Tabel 2 HasilUjiSistem

No. DataUji NilaiK Threshold TP FP FN TN Akurasi Precision Recall

1 32 5 0.997 56 2 25 1 0.68 0.96 0.69

2 32 5 0.998 56 2 25 1 0.68 0.96 0.69

3 32 5 0.999 55 1 25 3 0.69 0.98 0.68

4 32 7 0.997 56 2 25 1 0.68 0.96 0.69

5 32 7 0.998 56 2 25 1 0.68 0.96 0.69

6 32 7 0.999 55 1 25 3 0.69 0.98 0.68

7 32 10 0.997 56 2 25 1 0.68 0.96 0.69

8 32 10 0.998 56 2 25 1 0.68 0.96 0.69

9 32 10 0.999 55 1 25 3 0.69 0.98 0.68

10 48 5 0.997 52 5 26 1 0.63 0.91 0.67

11 48 5 0.998 52 5 26 1 0.63 0.91 0.67

12 48 5 0.999 51 4 26 3 0.64 0.92 0.66

13 48 7 0.997 52 5 26 1 0.63 0.91 0.67

14 48 7 0.998 52 5 26 1 0.63 0.91 0.67

15 48 7 0.999 51 4 26 3 0.64 0.92 0.66

16 48 10 0.997 52 5 26 1 0.63 0.91 0.67

17 48 10 0.998 52 5 26 1 0.63 0.91 0.66

18 48 10 0.999 51 4 26 3 0.64 0.92 0.66

19 56 5 0.997 55 4 24 1 0.67 0.93 0.67

20 56 5 0.998 55 4 24 1 0.67 0.93 0.67

21 56 5 0.999 54 3 24 3 0.68 0.94 0.69

22 56 7 0.997 55 4 24 1 0.67 0.93 0.69

23 56 7 0.998 55 4 24 1 0.67 0.93 0.69

24 56 7 0.999 54 3 24 3 0.68 0.94 0.69

25 56 10 0.997 55 4 24 1 0.67 0.93 0.69

26 56 10 0.998 55 4 24 1 0.67 0.93 0.69

27 56 10 0.999 54 3 24 3 0.68 0.94 0.69

nilai K yang digunakan adalah 7 agar rekomendasi lagu tidak terlalu banyak ataupun terlalu sedikit. Nilai akurasi tertinggi adalah 0.69 dengan precision dari nilai akurasi tertinggi adalah 0.98 dan nilai recall adalah

0.68.

4. SIMPULAN

Simpulan yang dari penelitian yang dilakukan adalah sebagai berikut:

1. Algoritma K-Nearest Neighbour-Cosine Similarity (KNNCS) dapat digunakan untuk mengidentifikasi lagu dengan menggunakan 5 fitur yaitu key, mode, loudness, energy, dan tempo.

2. Nilai K pada algoritma KNNCS tidak mempengaruhi tingkat akurasi dari sistem MICS Identification.

3. Akurasi tertinggi didapat pada saat pengujian dengan menggunakan lagu 32kbit/s, threshold 0.999, dan nilai K yang bervariasi dengan nilai akurasi 0.69, precision 0.98, dan recall 0.68.

DAFTAR PUSTAKA

[1] Anan, Y. (2011). MUSIC GENRE CLASSIFICATION USING SIMILARITY FUNCTIONS . [2] Chang, Y.-Y. (2005). Music Tempo (Speed) Classification .

[3] Corporation, T. E. (2011). http://the.echonest.com. Retrieved from Echo Nest Developer.

[4] Dewi, K. C. (2008). MUSIC RECOMMENDATION BASED ON AUDIO SIMILARITY USING K-NEAREST NEIGHBOR.

[5] Dhaliwal, D. S., & Sandhu, P. S. (2011). Enhanced K-Nearest Neighbor Algorithm . [6] Ellis, D. (2010). Becoming a Master Student. Boston: Cengange Learning.

[7] Kadyanan, I. G. (2010). Perolehan Citra Berbass Konten Pada Aplikasi Pengnderaan Jarak Jauh . [8] Kuswardani, V. (n.d.). Visualisasi PCM 8 Bit Menggunakan Pemrograman JAVA .

[9] Mandel, M. I. (2005). SONG-LEVEL FEATURES AND SUPPORT VECTOR MACHINES FOR MUSIC CLASSIFICATION

[10] Mart'Õn, R. (2009). Melodic Track Identification in MIDI Files Considering its Imbalanced Context . [11] Nenzén, H. (2011). Choice of threshold alters projections of species range shifts under climate . [12] P´erez-Sancho, C. (2008). Genre Classification of Music by Tonal Harmony .

[13] Rauber, A. (2008). RHYME AND STYLE FEATURES FOR MUSICAL GENRE CLASSIFICATION BY SONG LYRICS.