9
BAB II. Landasan Teori
2.1 TwitterSebagaiMedia Promosi
Twitter adalah salah satu layanan jejaring sosial dan mikroblog yang dimiliki oleh Twitter, Inc. Dikatakan mikroblog karena situs ini memungkinkan penggunanya untuk mengirim dan membaca pesan seperti blog pada umumnya tetapi dibatasi dengan 140 karakter yang dikenal dengan sebutan kicauan (tweet) (Smith, 2013) .
Di Indonesia sendiri, menurut (Kominfo, 2014)twitter merupakan salah satu jejaring sosial yang populer setelah Facebook, menempati peringkat 5 di dunia dan nomor 1 di Asia dengan total pengguna mencapai 19,5 juta.
Popularitas jejaring sosial saat ini, disebabkan karena pengguna internet mengalami pertumbuhan yang sangat signifikan dibeberapa tahun terakhir serta dari survey APJII (2012) diketahui bahwa pengguna internet di indonesia lebih sering mengakses jejaring sosial media (87,8%).
Dengan melihat banyaknya pengguna di sosial media seperti twitter, tentu saja mendorong perusahaan atau pelaku bisnis untuk menjadikan sosial media sebagai tempat mempromosi produk dan jasa mereka.
2.2 Engagement Followers di Twitter
The International Association for Measurement( AMEC, 2013)mendefinisikan engagement adalah “to occupy or attractsomeone’s interest or attention; involve someone ina conversation or discussion.” yaitu menarik
seseorang menjadi tertarik atau mendapat perhatiannya dan mengajak orang tersebut terlibat dalam suatu pembicaraan atau diskusi. Sedangkan menurut McManaway, Engagementfollowers adalah membuat pengikut kita memberikan respon kepada tweetyang disampaikan dan re-tweet pesan kita, sehingga akan membantu tweetkita untuk dapat reachatau menjangkau akun twitter lainnya diluar followers.
Untuk mengetahui seberapa besar engagementfollowersyang ada saat ini, tentunya dibutuhkan suatu rumus pengukuran. Dalam penulisan ini, rumus yang akan digunakan diambil dari socialbakers. Socialbakers adalah website yang mengembangkan alat yang inovatif untuk perusahaan dalam memaksimalkan efektivitas promosi di beberapa jejaring sosial media yang salah satunya twitter. Dari 2008 sampai sekarang, konsumennya telah mencapai 75 negara di dunia.
Persamaan 2.1 merupakan rumus yang digunakan oleh socialbakers dalam melakukan pengukuran untuk menentukan engagementrateSocialbakers (2013).
tweet engagement rate 100 (2.1)
Nantinya dengan menggunakan rumus ini, akan diketahui berapa besar persentase engagementyang dihasilkan dari tweetsetiap harinya.Untuk mendapatkan hasil yang optimal dari sini, maka kita perlu menganalisa bagaimana engagement itu terjadi dancara untuk meningkatkannya.
2.3 Data Mining
Menurut Vercellis (2009, p. 77) istilah Data Mining merujuk pada kesuluruhan proses yang terdiri dari pengumpulan dan analisis data, pengembangan model pembelajaran induktif dan adopsi praktek pengambilan
keputusan serta konsekuensi dari tindakan berdasarkan pengetahuan yang diperoleh. Sedangkan menurutHan, Kamber, & Pei (2011) menjelaskan bahwa Data Mining merupakan pemilihan atau mencari pengetahuan dari jumlah data yang banyak. Bisa disimpulkan bahwa Data Miningadalah proses penganalisa dari data yang banyak dan menemukan suatu jawaban untuk dijadikan informasi yang berguna dalam mengambil keputusan.
Fungsi dari data mining, secara umum dijelaskan oleh MacLennan, Tang, & Crivat (2009), sebagai berikut :
1. Classification
Fungsi dari Classification adalah untuk mengklasifikasikan suatu target class ke dalam kategori yang dipilih (lihat Gambar 2.1).
Gambar 2.1Classification - Decision Tree (MacLennan, Tang, & Crivat, 2009)
2. Clustering
Fungsi dari Clusteringadalah untuk mencari pengelompokan atribut ke dalam segmentasi-segmentasi berdasarkan similaritas(lihat Gambar 2.2).
3. Assoc Fungs item s ada(lih 4. Regre Fungs regres ada. iation si dari assoc set, berdasar hat Gambar ession si dari regr ssion adalah Gam (MacLennan iationadalah rkan jumlah 2.3). Gambar 2 (MacLennan ression ham h bertujuan u bar 2.2Cluster n, Tang, & Cr h untuk men h item yang 2.3Product Ass n, Tang, & Cr mpir mirip untuk menc ring rivat, 2009) cari keterkai muncul dan sociation rivat, 2009) dengan kla cari prediksi itan antara a n rule assoc asifikasi. Fu dari suatu atribut atau cition yang ungsi dari pola yang
5. Forec Fungs berdas 2.4). 6. Seque Fungs rangka casting si dari forec sarkan trend ence Analysis si dari sequ aian kejadian castingadalah dyang telah Gamb (MacLennan s uence analy n(lihat Gam Gambar 2.5W (MacLennan h untuk per h terjadi di bar 2.4Time Se n, Tang, & Cr ysisadalah u mbar 2.5). Web Navigatio n, Tang, & Cr ramalan wak waktu sebe eries rivat, 2009) untuk menc on Sequence rivat, 2009) ktu yang ak elumnya(liha cari pola u kan datang at Gambar urutan dari
7. Deviation Analysis
Fungsi dari devation analysis adalah untuk mencari kejadian langka yang sangat berbeda dari keadaan normal (kejadian abnormal).
2.4 Naive Bayes
Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes.Menurut L.Olson & Dursun (2008, hal. 102) bahwaNaive bayes untuk setiap kelas keputusan, menghitung probabilitas dengan syarat bahwa kelas keputusan dianggap benar, dengan kumpulan obyek informasi. Algoritma ini mengasumsikan bahwa atribut dari obyek adalah independen.
Dalam pengertian sederhana, Naive Bayesmengasumsikan bahwa ada atau tidaknya suatu fitur tertentu dari suatu kelas tidak berhubungan dengan ada atau tidaknya fitur lainnya inilah yang disebut independen (naif). Sebagai contoh, buah mungkin dianggap apel jika merah, bulat, dan berdiameter sekitar 4 inchi. Bahkan jika fitur ini bergantung satu sama lain atau atas keberadaan fitur lain,. DenganNaive Bayesdianggap bahwa seluruh sifat-sifat berkontribusi independenatau tidak tergantung dengan satu sama lain untuk mendapatkan probabilitas bahwa buah ini dapat dianggap apel.
Menurut XHEMALI, HINDE, & STONE (2009), dalam jurnal “Naïve Bayes vs. Decision Trees vs. Neural Networks in theClassification of Training Web
Pages” dika dibandingka didapatkan d Dari beb “Twitter Tr Agrawal, & and Opinio cukup baikd 2.4.1 M Suatu mo petunjuk at data. Denga 2.2. Dimana merepresent untuk mela atakan bahw an model k dari peneliti Tabel 2.1Perb ( berapa penel rending Top & Choudhary n Mining” ( dalam melak Model Prob odel probab au kondisi an menggun variabel C tasikan karak akukanklasif wa Naive Ba klasifikasi l an yang dila bandingan Ak (XHEMALI, H litian dengan pic Classific y, 2011) dan
(Pak & Paro kukan klasifi babilitasNaiv ilitas dalam untuk mene nakan teorem merepresen kteristik – k fikasi. Dari ayes memilik lainnya.Tabe akukan. kurasi Naive B HINDE, & ST n mengguna cation” (Lee n “Twitter as oubek, 2010 kasi. ve Bayes m melakukan entukan kela ma bayes, da ntasikan ke karakteristik i rumus (2 ki tingkat ak el 2.1 men Bayes dengan M TONE, 2009) akan jejaring e, Palsetia, s a Corpus f 0) juga mem klasifikasi as yang sesu apat ditulisk elas, sement sebagai petu 2.1) menjel kurasi yang nunjukkan h Metode Lain g sosial twit Narayanan, for Sentimen mberikan aku memerlukan uai dari sua kan dengan P taravariabel unjuk yang d laskan bahw lebih baik hasil yang tter seperti , Patwary, nt Analysis urasi yang n sejumlah atu sample Persamaan (2.2) F1 ... Fn dibutuhkan wapeluang
masuknya sampel dengan karakteristik tertentudalam kelas C (posterior) adalah peluang munculnya kelasC (prior), dikali dengan peluang kemunculan karakteristik – karakteristiksampel pada kelas C (likelihood), dibagi dengan peluang kemunculankarakteristik-karakteristik sampel secara global (evidence). Secara sederhana dapat pula ditulissebagai berikut:
posterior (2.3)
Nilai evidence selalu tetap untuk setiap kelas pada satusampel. Nilai dari Posterior tersebut yang nantinya akandibandingkan dengan nilai-nilai Posterior kelas lainnyauntuk menentukan ke kelas apa suatu sampel akandiklasifikasikan.
Untuk penjabaran lebih lanjut dari rumus Bayes, maka dilakukan penjabaran p(C|F1,..,Fn) dengan menggunakan aturan perkalian, sebagai berikut :
| , … , = , … , | = | , … , | , = | | , , … , | , , = | | , | , , , … , | , , , = | | , | , , … | , , , , … , (2.4)
Dapat diketahui bahwa hasil penjambaran tersebut menyebabkan semakin banyak dan semakin kompleksnyadari faktor-faktor syarat yang mempengaruhi nilai probabilitas,sehingga hampir mustahil untuk dianalisa satu-persatu.Akibatnya, perhitungan tersebut menjadi sulit untukdilakukan.
Di sinilah digunakan asumsi independensi yang sangattinggi (naïf), bahwa masing-masing petunjuk (F1, F2 ... Fn)saling bebas (independen) satu sama lain.
Dengan asumsitersebut, maka berlaku suatu kesamaan sebagai berikut:
(2.5)
Untuk fitur Fi adalah kondisi independen terhadap setiap fitur lainnya Fj, maka
untuk j≠i sehingga :
, | (2.6)
Dari persamaan di atas dapat disimpulkan bahwa asumsiindependensi naïf tersebut membuat syarat peluangmenjadi sederhana, sehingga perhitungan menjadimungkin untuk dilakukan.
Selanjutnya, penjabaran dari p(C|F1,...,Fn) dapat disederhanakan menjadi
sepertiberikut:
| , … , ∏ | (2.7)
Dimana Z (bukti) adalah faktor skala tergantung hanya pada F1,…,Fn , yaitu,
sebuah konstanta jika nilai dari variabel fitur diketahui.
2.4.2 Klasifikasi Menggunakan Model ProbabilitasNaive Bayes
Dengan persamaan teorema Naive Bayes yang kita dapatkan dari pembahasan sebelumnya maka akan dikembangkan ke dalam pengambilan keputusan untuk menentukan sebuah kelas dari suatu sampel yang akan diuji.
Penentuan kelas yang cocok bagi suatu sampeldilakukan dengan cara membandingkan nilai Posterioruntuk masing-masing kelas, dan mengambil kelas
dengannilai Posterior yang tinggi. Secara matematis klasifikasidirumuskan sebagai berikut:
argmax ∏ | (2.8)
Dimana c merupakan variabel kelas yang tergabung dalam suatu himpunan kelas c. Perlu menjadi perhatian bahwa metode Naive Bayes Classifierdapat digunakan bila sebelumnya telah tersedia data yang dijadikan acuan untuk melakukan klasifikasi.
Sebagai contoh, terdapat dua kelompok merek baju (X dan Y), dimana terdapat 3 petunjuk yang digunakanmisalnya warna baju, bahan baju dan ukuran baju.Sementara itu, terdapat pula 6 data seperti di bawah ini:
Tabel 2.2Contoh Data Untuk Klasifikasi Naive Bayes
Warna Bahan Ukuran Jenis
Putih Katun M X Hitam Katun M X Putih Wool S Y Hitam Katun S Y Hitam Wool M Y Hitam Wool S X
Bila ada sampel baju hitam, bahan wool, dan ukuran M untuk diketahui jenis dari baju tersebut maka dengan menggunakan metode ini, sebelumnya harus dicari terlebih dahulu Posterior X dan Y untuk sampel tersebut:
• P(X) = 3/6 = 0.5 sedangkan P(Y) = 3/6 = 0.5
• P(Hitam|X) = 2/3 = 0.66 sedangkan P(Hitam|Y)=1/3=0.33 • P(Wool|X)=1/3=0.33 sedangkan P(Wool|Y)=2/3=0.66
• P(M|X)=2/3=0.66 sedangkan P(M|Y)=1/3=0.33 • Posterior X = P(X) P(Hitam|X) P(Wool|X) P(M|X)
= 0.5 x 0.66 x 0.33 x 0.66 = 0.072 sedangkan,
Posterior Y = P(Y) P(Hitam|Y) P(Wool|Y) P(M|Y) = 0.5 x 0.33 x 0.66 x 0.33 = 0.034
Maka bisa diambil kesimpulan, karena PosteriorX >PosteriorY sehingga sampel dari baju tersebut dikelompokkan dalam baju bermerek X.
2.4.3 Naive Bayes ClassifierUntuk Klasifikasi Dokumen.
Untuk melakukan klasifikasi terhadapa dokumen sedikit berbeda dengan yang dilakukan dengan contoh sebelumnya. Bila sebelumnya dalam contoh diatas kita mengklasifikasikannya dengan menggunakan karakteristik fisik seperti warna, bahan, dan ukuran tetapi pada klasifikasi dokumen kita tidak akan ditemukan karakteristik tersebut karena pada umumnya suatu dokumen terdiri dari data – data literal (tulisan). Karena hal itu maka diperlukan asumsi – asumsi mengenai karakteristik yang ditinjau agar metoda Naive BayesClassifierdapat digunakan dalam klasifikasi dokumen.
Asumsi yang diambil dalam pengklasifikasian dokumenini adalah dokumen dipandang sebagai kumpulan kata-katayang saling bebas (independen) dan proses klasifikasidokumen dilakukan dengan pengecekan kata-kata yangmenyusun informasi di dalam dokumen tersebut.Penentuan kelas dari dokumen sampel dilakukan dengancara menghitung besarnya peluang kata-kata padadokumen suatu kelas yang muncul pada dokumen sampelyang dianalisis.
Jadi, kata-kata dalam dokumen (wi)berlaku seperti petunjuk-petunjuk yang telah dijelaskansebelumnya (Fi), dan gabungan dari kata-kata tersebutmenghasilkan suatu dokumen (D). Probabilitas sebuahkelas mengandung suatu dokumen merupakan produk dariprobabilitas kata-kata dari dokumen tersebut yangterdapat pada kelas. Dengan kata lain:
| ∏ | (2.9)
Dengan persamaan dari teoremaNaive Bayes untuk mengklasifikasikan suatu dokumen, sebagai berikut :
| |